Java反转字符串和相关字符编码问题

2023-11-07

反转字符串一直被当作是简单问题，大家的思想主要就是利用遍历，首尾交换字符实现字符串的反转。例如下面的代码，就可以简单实现反转。

1 public String reverse( char [] value){
2 for ( int i = (value.length - 1 ) >> 1 ; i >= 0 ; i -- ){
3 char temp = value[i];
4 value[i] = value[value.length - 1 - i];
5 value[value.length - 1 - i] = temp;
6 }
7 return new String(value);
8 }
9
10

这样的代码，在算法方面是没有任何问题的。但是今天在查看StringBuffer源代码的时候发现，其中reverse方法的源代码写的很精妙。源代码如下：

1 public AbstractStringBuilder reverse() {
2 boolean hasSurrogate = false ;
3 int n = count - 1 ;
4 for ( int j = (n - 1 ) >> 1 ; j >= 0 ; -- j) {
5 char temp = value[j];
6 char temp2 = value[n - j];
7 if ( ! hasSurrogate) {
8 hasSurrogate = (temp >= Character.MIN_SURROGATE && temp <= Character.MAX_SURROGATE)
9 || (temp2 >= Character.MIN_SURROGATE && temp2 <= Character.MAX_SURROGATE);
10 }
11 value[j] = temp2;
12 value[n - j] = temp;
13 }
14 if (hasSurrogate) {
15 // Reverse back all valid surrogate pairs
16 for ( int i = 0 ; i < count - 1 ; i ++ ) {
17 char c2 = value[i];
18 if (Character.isLowSurrogate(c2)) {
19 char c1 = value[i + 1 ];
20 if (Character.isHighSurrogate(c1)) {
21 value[i ++ ] = c1;
22 value[i] = c2;
23 }
24 }
25 }
26 }
27 return this ;
28 }
29

这个方法是定义在StringBuffer的父类AbstractStringBuilder中的，所以该方法的返回值是AbstractStringBuilder，在子类中调用的方式如下：

1 public synchronized StringBuffer reverse() {
2 super .reverse();
3 return this ;
4 }

从方法的内容来看，源代码中的基本思路是一致的，同样采用遍历一半字符串，然后将每个字符与其对应的字符进行交换。但是有不同之处，就是要判断每个字符是否在Character.MIN_SURROGATE(\ud800)和Character.MAX_SURROGATE(\udfff)之间。如果发现整个字符串中含有这种情况，则再次从头至尾遍历一次，同时判断value[i]是否满足Character.isLowSurrogate()，如果满足的情况下，继续判断value[i+1]是否满足Character.isHighSurrogate()，如果也满足这种情况，则将第i位和第i+1位的字符互换。可能有的人会疑惑，为什么要这么做，因为Java中的字符已经采用Unicode代码，每个字符可以放下一个汉字。为什么还要这么做？

一个完整的 Unicode 字符叫代码点CodePoint，而一个 Java char 叫代码单元 code unit。String 对象以UTF-16保存 Unicode 字符，需要用2个字符表示一个超大字符集的汉字，这这种表示方式称之为 Surrogate，第一个字符叫 Surrogate High，第二个就是 Surrogate Low。具体需要注意的事宜如下：

判断一个char是否是Surrogate区的字符，用Character的 isHighSurrogate()/isLowSurrogate()方法即可判断。从两个Surrogate High/Low 字符，返回一个完整的 Unicode CodePoint 用 Character.toCodePoint()/codePointAt()方法。
一个Code Point，可能需要一个也可能需要两个char表示，因此不能直接使用 CharSequence.length()方法直接返回一个字符串到底有多少个汉字，而需要用String.codePointCount()/Character.codePointCount()。
要定位字符串中的第N个字符，不能直接将N作为偏移量，而需要从字符串头部依次遍历得到，需要用String/Character.offsetByCodePoints() 方法。
从字符串的当前字符，找到上一个字符，也不能直接用offset-- 实现，而需要用 String.codePointBefore()/Character.codePointBefore()，或用 String/Character.offsetByCodePoints()
从当前字符，找下一个字符，不能直接用 offset++实现，需要判断当前 CodePoint的长度后，再计算得到，或用String/Character.offsetByCodePoints()。

关于字符详细说明，请查看http://www.cnblogs.com/wanlipeng/archive/2011/01/27/1946435.html

转载于:https://www.cnblogs.com/wanlipeng/archive/2011/01/27/1946441.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

Java反转字符串和相关字符编码问题的相关文章

无法在 Android 10 中创建目录

我无法在 android 10 中创建目录它可以在 android Oreo 之前的设备上运行我尝试了两种创建文件夹的方法 Using File mkdir File f new File Environment getExternal
无法解析类型为 xxx 的任何 bean；限定符：[@javax.enterprise.inject.Any()]

我有一个 LoginProvider 接口 public interface LoginProvider boolean login String username String password 以及两种不同的实现 public clas
Spring安全“记住我”cookie在第一个请求中不可用

我无法在登录请求后检索 Spring 记住我 cookie 但它在对受保护页面的下一个请求中工作正常谁能告诉我怎样才能立即得到它我在登录请求中设置了记住我的 cookie 但在 Spring 重定向回原始受保护的 url 后无法检索它
Android 自定义视图不能以正确的方式处理透明度/alpha

我正在绘制自定义视图在此视图中我使用两个不同的绘画和路径对象在画布上绘画我基本上是在绘制两个重叠的形状添加 Alpha 后视图中重叠的部分比图像的其余部分更暗这是不希望的但我不知道如何解决它这是我的代码片段用于展示我如何在
如何让spring为JdbcMetadataStore创建相应的schema？

我想使用此处描述的 jdbc 元数据存储 https docs spring io spring integration docs 5 2 0 BUILD SNAPSHOT reference html jdbc html jdbc met
如何在android中设置多个闹钟，在这种情况下最后一个闹钟会覆盖以前的闹钟

我正在开发一个Android应用程序用户可以在其中设置提醒时间但我在以下代码中遇到一个问题即最后一个警报会覆盖之前的所有警报 MainActivity java public void setreminders DatabaseHan
在java中实现你自己的阻塞队列

我知道这个问题之前已经被问过并回答过很多次了但我只是无法根据互联网上找到的示例找出窍门例如this http tutorials jenkov com java concurrency blocking queues html or t
如何获取 WebElement 的父级[重复]

这个问题在这里已经有答案了我试过了 private WebElement getParent final WebElement webElement return webElement findElement By xpath 但我得到
Java 8 中函数式接口的使用

这是来自的后续问题Java 8 中的双冒号运算符 https stackoverflow com questions 20001427 double colon operator in java 8其中 Java 允许您使用以下方式引用
Spring Security OAuth2简单配置

我有一个简单的项目需要以下简单的配置我有一个密码 grant type 这意味着我可以提交用户名密码用户在登录表单中输入并在成功时获得 access token 有了该 access token 我就可以请求 API 并获取用户
如何在 Eclipse Java 动态 Web 项目中使用 .properties 文件？

我正在 Eclipse 中开发动态 Web 项目我创建了一个 properties 文件来存储数据库详细信息用户名密码等我通过右键单击项目和 New gt File 添加它我使用了Java util包Properties类但它不
解析输入，除了 System.in.read() 之外不使用任何东西

我很难找到具体的细节System in read 有效也许有人可以帮助我似乎扫描仪会更好但我不允许使用它我被分配了一个任务我应该以 Boolean Operator Boolean 的形式读取控制台用户输入例如T F 或 T T
如何通过 Inno Setup for NetBeans 使用自定义 .iss 文件

我将 Inno Setup 5 与 NetBeans 8 一起使用并且我已经能够创建一个安装程序来安装该应用程序C users username local appname 但是我希望将其安装在C Programfiles 我如何在 Ne
无法捕获 Spring Batch 的 ItemWriter 中的异常

我正在编写一个 Spring Batch 流程来将数据集从一个系统迁移到另一个系统在这种情况下这就像使用RowMapper实现在传递给查询之前从查询构建对象ItemWriter The ItemWriter称为save我的 DAO 上的
Linux 上有关 getBounds() 和 setBounds() 的 bug_id=4806603 的解决方法？

在 Linux 平台上 Frame getBounds 和 Frame setBounds 的工作方式不一致这在 2003 年就已经有报道了请参见此处 http bugs java com bugdatabase view bug do
解决错误javax.mail.AuthenticationFailedException

我不熟悉java中发送邮件的这个功能我在发送电子邮件重置密码时遇到错误希望你能给我一个解决方案下面是我的代码 public synchronized static boolean sendMailAdvance String emai
Java：拆箱整数时出现空指针异常？

此代码导致空指针异常我不知道为什么 private void setSiblings PhylogenyTree node Color color throws InvalidCellNumberException PhylogenyTr
Android - 9 补丁

我正在尝试使用 9 块图片创建一个新的微调器背景我尝试了很多方法来获得完美的图像但都失败了 s Here is my 9 patch 当我用Draw 9 patch模拟时内容看起来不错但是带有箭头的部分没有显示或者当它显示时这部
Java &= 运算符应用 & 或 && 吗？

Assuming boolean a false 我想知道是否这样做 a b 相当于 a a b logical AND a is false hence b is not evaluated 或者另一方面这意味着 a a b Bitwi
嵌入式 Jetty - 以编程方式添加基于表单的身份验证

有没有一种方法可以按如下方式以编程方式添加基于表单的身份验证我用的是我自己的LdapLoginModule 最初我使用基本身份验证并且工作正常但现在我想在登录页面上进行更多控制例如显示徽标等有没有好的样品我正在使用嵌入式 jett

随机推荐

Matrikon OPC 模拟器使用教程

一 OPC协议 OPC通信技术因其帮助大量的使用不同通信协议的下层现场设备的数据得以与上位机的应用程序进行交互的作用成为了一种工业通信领域中一套广为流行的方案它使得硬件供应商和软件开发商都可以专注于做自己的工作只要双方都能提供OPC接
Python NLTK 自然语言处理入门与例程

Python NLTK 自然语言处理入门与例程在这篇文章中我们将基于 Python 讨论自然语言处理 NLP 本教程将会使用 Python NLTK 库 NLTK 是一个当下流行的用于自然语言处理的 Python 库那么 NLP 到
jupyter notebook参数化运行python

Updates 2019 8 14 19 53 吃饭前用这个方法实战了一下吃完回来一看好像不太行跑完一组参数之后到跑下一组参数时好像没有释放之占用的 GPU 于是 notebook 上的结果后面好几条都报错说 cuda out of
Linux系统Squid代理添加用户、密码认证

安装了Squid后会有一些不明的流量和CPU占用95 以上估计是因为没加密码被扫描到端口后被滥用我们给Squid代理添加用户密码认证 1 密码用apache2自带的NCSA 先做个密码档然后设为任何人可读 sudo touch e
make all、make clean、make install 等命令的来源

在命令行输入make命令后会查找当前目录下的Makefile文件来执行一切都是自动运行的有时候Makefile中有多个程序需要编译这时可以使用 make all 来编译所有的程序当然也可以使用 make 程序名来单独编译某一个文
C - Coprime 2（质因数）

C Coprime 2https vjudge csgrandeur cn problem AtCoder abc215 d1 先把a数组元素里面每个元素的因数求出来再把他们的倍数标记剩下的1到M没标记的数就是答案 include
一般试卷的纸张大小是多少_【教学研究】标准化试卷是如何编制出来的？

作为教师日常教学工作中经常需要编制试卷一般我们可以用Word来编制各类试卷对于标准化试卷来说有很多样式是统一的在Word中本文以Word2003为例我们可以按以下步骤进行设置一试卷页面设置标准化试卷一般都采用8K纸张横
octave下实现积分/求解微分方程

我电脑是AMD的不是Intel的所以matlab很多功能用不了矩阵乘法都用不了虚拟机也没工夫折腾找了octave来替代首先安装 symbolic包要求已安装好Python3的SymPy库 pkg install forge sy
MongoDB4.x创建数据库帐号,启用密码认证,启用外部ip访问,创建数据库,创建集合.

创建数据库 use company 这样就创建了一个名称为company的数据库但如果不创建集合表的话则不保存创建集合 db createCollection employ salary 创建了一个employ salary表创建
WPF的MVVM框架Stylet开发文档 14.6 StyletIoC 模块

14 6 StyletIoC 模块任何具有合理复杂性的应用程序都将包含大量 IoC 容器配置有大量接口与实现的显式绑定指定单例和其他完全必要的配置默认方法是将所有这些配置放在您的引导加载程序中这是有道理的所有配置都在一个地方
ModuleNotFoundError: No module named ‘tensorflow.contrib‘ 关于TensorFlow2中没有contrib包的解决办法

在学习中文实体识别的过程中参考很多以前的ltsm crf代码以及谷歌的开源bert代码过程中都遇到了该问题简单查阅可得这是因为TensorFlow2版本中删除了contrib包所导致的问题其中有部分大佬给出的解决办法是降低版本但
PHP 短信验证码验证（短信宝）

注册的短信验证控制器 public function save Request request echo 11 die phone input last time Cache store redis gt get register tim
nvdiffrec在Windows上的配置及使用

nvdiffrec是NVIDIA研究院开源的项目源代码地址 https github com NVlabs nvdiffrec 论文为 Extracting Triangular 3D Models Materials and Light
c++ 赋值运算符函数

题目如下为类型CMyString 的声明请为该类型添加赋值运算符 class CMyString public CMyString char pData nullptr CMyString const CMyString str CMy
ubuntu上安装android studio出现adb 无法识别设备的问题

ubuntu上安装android studio出现adb 无法识别某些设备的问题出现的都是 m OptiPlex 7040 etc udev rules d adb devices List of devices attached no
在Windows域控制器里新建用户，添加可以远程桌面访问的权限

在Windows域控制器里新建用户添加可以远程桌面访问的权限系统Windows server2003 开始管理工具 active directory用户和计算机新建用户登录到要远程的计算机 DOS窗口输入gpedit进去到本地组策
使用 Filebeat 监听日志文件

Filebeat是一个日志文件托运工具在你的服务器上安装客户端后 filebeat 会监控日志目录或者指定的日志文件追踪读取这些文件追踪文件的变化不停的读并且转发这些信息到elasticsearch 或者 logstarsh re
VS2015 + CUDA10 编译 OpenCV2.4.13 之 OpenCV编译文件修改

因为CUDA10貌似不支持OpenCV2 所以需要对OpenCV2的文件进行修改主要参考https blog csdn net u014613745 article details 78310916 请注意本篇博客需要结合上面的链接中的
支持KEIL5! KeilFDfix_新0xFD汉字补丁(冠铭同学版)

发布支持KEIL5 KeilFDfix 新0xFD汉字补丁冠铭同学版说明将本软件放至KEIL的编译器 C51 EXE及A51 EXE 所在文件夹例如 C KEIL V5 C51 BIN 按开始即可自动打补丁将0x 80 FB
Java反转字符串和相关字符编码问题

反转字符串一直被当作是简单问题大家的思想主要就是利用遍历首尾交换字符实现字符串的反转例如下面的代码就可以简单实现反转 1 public String reverse char value 2 for int i value leng

Java反转字符串和相关字符编码问题

Java反转字符串和相关字符编码问题 的相关文章

随机推荐

热门标签

Java反转字符串和相关字符编码问题的相关文章