【Java】字符串列表List<String>数字、字母、汉字混合排序(按中国人使用习惯排序)

2023-05-16

一、概要


本方法根据中国人使用习惯实现了:

总体按照按数字、字母、汉字升序;

数字之间按数值大小升序排序;
字母之间按ascii升序排序;
汉字之间按拼音升序排序。

二、方法入口

    /**
	 * 根据中国人使用习惯进行排序(Windows风格)
	 *
	 * @param list List
	 * @return 排序后的List
	 */
	public static List<String> sortByChinese(List<String> list) {
		if (list == null || list.size() < 2) {
            return list;
        }
        list.sort(new ChineseComparator());
        return list;
	}

三、比较器实现

import java.io.Serializable;
import java.text.Collator;
import java.util.ArrayList;
import java.util.Comparator;
import java.util.List;
import java.util.Locale;

/**
 * 按照Windows排序风格,对给定的数字、字母、汉字字符串进行排序
 *
 * @author ZhenhengXie
 * @created 2023-2-26 16:00:00
 */
public class ChineseComparator implements Comparator<String>, Serializable {

    private static final long serialVersionUID = 1L;

    // 数字类型
    private static final Integer TYPE_NUMBER = 0;

    // 字符类型(非数字)
    private static final Integer TYPE_CHARACTER = 1;

    /**
     * 构造
     */
    public ChineseComparator() {
    }

    @Override
    public int compare(String o1, String o2) {
        // 把字符串拆分成字符数组
        String[] o1Chars = o1.split("");
        String[] o2Chars = o2.split("");

        // 根据字符数组生成带分类的字符列表
        // List<Object>的第一位为该字符的类型(TYPE_NUMBER, TYPE_CHARACTER)
        // List<Object>的第二位为该字符的内容(一位数字, 一位非数字, 多位数字)
        List<List<Object>> o1CharList = getCharList(o1Chars);
        List<List<Object>> o2CharList = getCharList(o2Chars);

        // 统一CharList的长度
        int max = Math.max(o1CharList.size(), o2CharList.size());
        while (o1CharList.size() < max) {
            o1CharList.add(new ArrayList<>());
        }
        while (o2CharList.size() < max) {
            o2CharList.add(new ArrayList<>());
        }

        // 开始比较
        int compare = 0;
        for (int i = 0; i < max; i++) {
            List<Object> o1list = o1CharList.get(i);
            List<Object> o2list = o2CharList.get(i);

            // CharList短的,排在前面
            if (o1list.size() == 0) {
                compare = -1;
                break;
            }
            if (o2list.size() == 0) {
                compare = 1;
                break;
            }

            // 先比较类型
            Integer o1Type = (Integer) o1list.get(0);
            Integer o2Type = (Integer) o2list.get(0);
            int typeCompare = Integer.compare(o1Type, o2Type);
            if (typeCompare != 0) {
                // 类型不同,则数字在前,非数字在后
                compare = typeCompare;
                break;
            } else {
                // 类型相同,则比较内容
                if (TYPE_NUMBER.equals(o1Type)) {
                    // 比较数字
                    int o1Content = Integer.parseInt(o1list.get(1).toString());
                    int o2Content = Integer.parseInt(o2list.get(1).toString());
                    compare = Integer.compare(o1Content, o2Content);
                } else if (TYPE_CHARACTER.equals(o1Type)) {
                    // 比较非数字
                    String o1Content = (String) o1list.get(1);
                    String o2Content = (String) o2list.get(1);
                    compare = Collator.getInstance(Locale.CHINESE).compare(o1Content, o2Content);
                }
                // 如果不相等,则退出比较
                if (compare != 0) {
                    break;
                }
            }
        }
        return compare;
    }

    /**
     * 根据字符数组生成带分类的字符列表
     *
     * @param chars 字符数组
     * @return 带分类的字符列表,List<Object>的第一位为该字符的类型(TYPE_NUMBER, TYPE_CHARACTER),第二位为该字符的内容
     */
    private List<List<Object>> getCharList(String[] chars) {
        List<List<Object>> charList = new ArrayList<>();
        List<Object> list;
        for (int i = 0; i < chars.length; i++) {
            char c = (chars[i].toCharArray())[0];
            list = new ArrayList<>();
            // 是否为数字
            if (((int) c >= '0' && (int) c <= '9')) {
                StringBuilder str = new StringBuilder();
                // 下一位是否为数字,如果为数字则组成多位数
                do {
                    str.append(c);
                    if (i + 1 < chars.length) {
                        c = (chars[++i].toCharArray())[0];
                    } else {
                        break;
                    }
                } while ((int) c >= '0' && (int) c <= '9');
                if (!(i + 1 == chars.length) || !(((int) c >= '0' && (int) c <= '9'))) {
                    i--;
                }
                list.add(TYPE_NUMBER);
                list.add(str.toString());
            } else {
                list.add(TYPE_CHARACTER);
                list.add(String.valueOf(c));
            }
            charList.add(list);
        }
        return charList;
    }

}

四、实现效果

public static void main(String[] args) {

        List<String> list = new ArrayList<String>() {{
            add("1排序");
            add("10排序");
            add("1000000000排序");
            add("2排序");
            add("排1序");
            add("排10序");
            add("排2序");
            add("排序1");
            add("排序10");
            add("排序2");
            add("a排序");
            add("c排序");
            add("b排序");
            add("排a序");
            add("排c序");
            add("排b序");
            add("排序a");
            add("排序c");
            add("排序b");
            add("比bi");
            add("被bei");
            add("把ba");
        }};

        list = listUtil.sortByChinese(list);

        for (String str : list) {
            System.out.println(str);
        }
        /*
          1排序
          2排序
          10排序
          1000000000排序
          a排序
          b排序
          c排序
          把ba
          被bei
          比bi
          排1序
          排2序
          排10序
          排a序
          排b序
          排c序
          排序1
          排序2
          排序10
          排序a
          排序b
          排序c
         */
    }
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【Java】字符串列表List<String>数字、字母、汉字混合排序(按中国人使用习惯排序) 的相关文章

随机推荐

  • vi/vim 编辑、搜索、查找、定位

    介绍vi vim 相关命令 xff0c 主要涉及 xff1a 编辑 搜索 查找 定位 分为两个章节 xff0c 即常用命令 及 键盘图 一 vi vim常用命令 set nu 显示行号 gg 跳转到文件开头 向后搜索 向前搜索 n 查找下一
  • 算法:排序算法之桶排序

    一 排序算法系列目录说明 冒泡排序 xff08 Bubble Sort xff09 插入排序 xff08 Insertion Sort xff09 希尔排序 xff08 Shell Sort xff09 选择排序 xff08 Selecti
  • ubuntu22.04安装wechat微信

    Ubuntu16 04完美安装微信 xff08 ukylin优麒麟系统版微信WeChat xff09 Kair94的博客 CSDN博客 麒麟系统微信
  • 排序算法

    转载整理自7 sevens大佬 xff0c 本文仅供本人学习使用 xff0c 请勿用作其他用途 xff0c 如有所需 xff0c 请联系大佬本人 xff01 xff01 xff01 原文链接合集附在本文底部 一 排序算法系列目录说明 冒泡排
  • HTTPS 的安全通信机制

    一 基础知识 SSL xff1a 一般情况下 xff0c 网站使用的都是明文方式传输数据 xff0c 但是在涉及到一些隐私信息时 xff08 如银行交易 xff09 xff0c 这个时候网站就会跳转到 SSL xff0c SSl的功能就是提
  • HTTP报文头解析(图文)

    一 通用头部字段 xff08 General Header Fields xff09 该字段在请求头和响应头都会使用到 xff0c 下方是常用的通用头部字段 xff1a 1 Cache Control 用来操作缓存的工作机制 xff0c 下
  • socket的TIME_WAIT状态的原因及解决办法和避免的办法

    一查看现在time wait的数量及浅析 netstat an grep TIME WAIT wc l 发现系统存在大量TIME WAIT状态的连接 xff0c 通过调整内核参数解决 xff0c 在 etc sysctl conf中加入 n
  • 数据库常见索引解析(B树,B-树,B+树,B*树,位图索引,Hash索引)

    B树 即二叉搜索树 xff1a 1 所有非叶子结点至多拥有两个儿子 xff08 Left和Right xff09 xff1b 2 所有结点存储一个关键字 xff1b 3 非叶子结点的左指针指向小于其关键字的子树 xff0c 右指针指向大于其
  • 在一棵IPv4地址树中彻底理解IP路由表的各种查找过程

    1 IPv4地址空间树 IPv4的整个地址空间可以构成一棵完美的二叉树 xff0c 因为它完全占满了整个4G的地址空间 这棵树如下所示 xff1a 需要指明的是 xff0c 完全画出这幅图是不可能的 xff0c 如果一个节点的直径小到1mm
  • 常用编码方式说明

    各种语言需要交流 xff0c 经过翻译是必要的 xff0c 那又如何来翻译呢 xff1f 在计算机中提供了多种翻译方式 xff0c 常见的有 ASCII ISO 88591 GB23112 GBK UTF 8 UTF 8 UTF 16等 它
  • 报文头格式以及常用协议端口

    IP协议是TCP IP协议族的动力 xff0c 它为上层协议提供无状态 无连接 不可靠的服务 优点 xff1a 简单 xff0c 高效 无状态指 xff1a IP通信双方不同步传输数据的状态信息 xff0c 所有的IP数据报的传输都是独立的
  • iOS中NSThread子线程需要建立NSAutoreleasePool

    今天做iOS开发时碰到一个问题 xff1a 在主线程打开一个大约400多K的文件读取数据时 xff0c 界面明显有停顿感 xff0c 于是尝试用NSThread建立子线程来负责读取文件数据 却发现子线程的运行速度奇慢无比 xff0c 刚开始
  • 报数游戏3

    题目描述 xff1a xfeff xfeff 一种报数游戏是从1开始连续报数 xff0c 如果报到7的倍数 xff08 7 xff0c 14 xff0c 21 xff0c 28 xff09 或者包含数字7的数 xff08 7 xff0c 1
  • c++ 关于流的重要帖子聚集

    1 关于clear 带参数版本 的2个例子 C 43 43 ios clear 用法及代码示例 纯净天空 2 关于unget的一个例子 unget C 43 43 标准库 开发文档 文江博客 3 关于peek的一个例子 C 43 43 中的
  • Mac无法访问Windows共享文件解决办法

    先按照网上教程 xff0c 在Windows下允许远程 xff0c 然后设置文件夹共享出来 xff0c 再在Mac上通过smb登录 xff0c 输入用户名和密码窗口总是抖动 xff0c 一直连接不上 xff0c 此时用另一台同一局域网的Wi
  • 虚拟机VMware安装ArchLinux及配置过程_详细202002_001#

    1 安装前准备工作 安装手册地址 xff1a https wiki archlinux org index php Installation guide版本为archlinux 2020 02 01 x86 64 isoVMware安装 x
  • VSCode C++环境配置

    VSCode C C 43 43 Windows 环境配置 第一次写博客 xff0c 编程小白 xff0c 码龄不足一年 xff0c 望大家批评改正 废话 许多像我一样的初级码农 xff0c 最开始接触的编程语言可能是C语言 xff0c 学
  • 服务器离线安装GitLab

    服务器离线安装GitLab并还原迁移的数据 1 下载gitlab的离线安装包 xff0c 默认el6 我下载的是el7 xff0c 以下简称el7 rpm 最好不要有openssh的rpm文件 2 登录服务器 xff0c 新建一个文件夹 s
  • leetcode刷题B部分

    目录 文章目录 目录50 Pow x n xff08 回到目录 目录 xff09 54 螺旋矩阵 59 xff08 回到目录 目录 xff09 58 最后一个单词的长度 xff08 回到目录 目录 xff09 59 螺旋矩阵 II 54 x
  • 【Java】字符串列表List<String>数字、字母、汉字混合排序(按中国人使用习惯排序)

    一 概要 本方法根据中国人使用习惯实现了 xff1a 总体按照按数字 字母 汉字升序 xff1b 数字之间按数值大小升序排序 xff1b 字母之间按ascii升序排序 xff1b 汉字之间按拼音升序排序 二 方法入口 span class