编码问题

2023-11-18

编码
 字符-->字节数组

 解码
 字节数组-->字符

//编码
String str = "你好";
byte[] bus = str.getBytes("UTF-8");


//解码
String str1 = new String(bus,"UTF-8");
System.out.println(str1);


//如果用错码表
String str2 = new String(bus,"iso8859-1");
byte[] bus1 = str2.getBytes("iso8859-1");//获取源码 如果这里是UTF-8会不成功,因为UTF-8解码时会改变源码,如果解不出来会被17 -65 -67代替,而不是?
String str3 = new String(bus1,"UTF-8");
System.out.println(str3);


//"联通问题" 联通的GBK编码与UTF-8的编码冲突,记事本默认用了UTF-8解码,所以解析不出来。


练习:

/*在java中,字符串“abcd”与字符串“ab你好”的长度是一样的,都是四个字符。
 * 但对应的字节数不同,一个汉字占两个字节。
 * 定义一个方法,按照最大的字节数来取字串。
 * 如:对于“ab你好”,如果取三个字节,那么字串就是ab与“你”字的半个。
 * 那么半个就要舍弃。如果去四个字节就是“ab你”,取五个字节还是“ab你”
 * 


 * 思路:
 * 因为代表汉字的字节为负数,又因为一个汉字两个字节。从后向前一次进行判断字符串的字节数是否为负数,并定义变量记录负数的个数,如果为偶数,则不舍弃,如果为      奇数则舍弃。
 * GBK编码表中有的汉字为一个负,一个正,下面方法同样适用。
 * 
 * */

(伪代码)
public static String  subStringByByte(String str,int len ) throws IOException { //len 表示最大字节数
byte[] bus = str.getBytes("gbk");
int count = 0;
for(int x = len-1;x>0;x--){
if(bus[x]<0){
count++;
}
else
break;

}
if(count%2==0)
return new String(bus,0,len,"gbk");
else
return new String(bus,0,len-1,"gbk");
/*如果为UTF-8
if(count%3==0)
return new String(bus,0,len,"gbk");
else if(count%3==1)
return new String(bus,0,len-1,"gbk");
else if(count&3==2)
return new String(bus,0,len-2,"gbk");
*/
}

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

编码问题 的相关文章

随机推荐

  • QT 中文版信息提示框

    引言 在QT设计UI程序过程中 整套系统都是中文版本 然而信息提示默认只有中文 难免有点小纠结 这里针对QMessageBox稍微做了一点点改进 使其支持完美的中文提示框 调用方式非常简单 只需要将QMessageBox调用地方 改为QSh
  • 专家PID

    专家PID 专家控制 专家控制是模拟人类专家控制的方式 它具有大量的专门知识和经验 和专家控制一样不需要知道对象的模型的情况下 对系统进行控制 专家控制的基本结构 和人类专家控制一样 知识库越是丰富 推理机越是精确 控制效果也就越好 不同的
  • 数据结构C++ 栈Stack求值算法

    来自邓俊辉老师的数据结构 C 版 第95页 readNumber函数 可读整数和小数 注意 下列代码是直接用C 内部写好的stack实现的 而不是书中给出的stack模板 发现更简洁的readNumber函数 float readNumbe
  • 使用Vue解决跨域问题

    如果你是一个Web前端工程师 那么跨域这个问题肯定是绕不开的 1 创建 vue config js 设置 devServer 属性 module exports devServer webpack dev server配置 host loc
  • ECS共享型s6和ECS突发性能型t6的区别选择哪个好?

    WP建站 一个专注于wordpress学习的 关注他 2 人赞同了该文章 这两个类型的阿里云ecs服务器的话 一般在这两个中二选一的话我们建议优先选择ECS共享型s6 我们简单的来说说他们的一些区别和特点吧 首先我们要知道的是他们都是独立的
  • 线性代数-----行列式的性质

    行列式的性质 设 D a 11
  • cosmos测试网络结点搭建完整流程

    第一步 下载golang并安装 配置环境变量 wget https dl google com go go1 13 8 linux amd64 tar gz tar C usr local xzf go VERSION OS ARCH ta
  • CSDN周赛66期图文题解 - 路灯亮度 & 池塘水量

    本期非编程题考察更多是对原书的阅读理解 可能还是因为自己理解不够 翻了半天书 还是错了两道 失之我命 不多废话 本期编程题比较符合我的胃口 有陷阱 有技巧 窃以为是最近不少期里比较有意思的中等难度的题目了 美中不足的是两道题都没有给出数据范
  • 读写权限详解

    本篇博客主要通过三个问题来理清C C 中的读写权限问题 const变量可以赋值给非const引用吗 const变量的地址可以赋值给非const指针吗 const普通变量可以给非const普通变量赋值吗 在此之前 我们得先明白读写权限的一个基
  • 利用原始socket简单实现FTP的客户端和服务器端程序

    1 设计目的 本设计旨在利用原始socket简单实现FTP File Transfer Protocol 文件传输协议 的客户端和服务器端程序 能够实现get put pwd dir cd等基本交互命令 2 具体要求 用socket 编程接
  • C# 去掉图片多余白色部分

  • AOI的实际应用

    使用AOI检测LED固晶焊线的支架产品 产品结构 使用远心光学镜头 高分辨率 高景深 低畸变以及独有的平行光设计等 被测元件清晰成像 且无斜视 保证不良检出 1 缺陷检测原理 通过模板匹配法 这是一种基本的识别方法 研究某一特定对象物的图案
  • Selenium启动Chrome时配置选项

    Selenium操作浏览器是不加载任何配置的 网上找了半天 关于Firefox加载配置的多点 Chrome资料很少 下面是关于加载Chrome配置的方法 一 加载所有Chrome配置 用Chrome地址栏输入chrome version 查
  • 数组转换成List集合

    对于给定的如下数组 如何转换成List集合 String array a b c 参考stackoverflow总结如下几种写法 1 使用原生方式 拆分数组 添加到List List
  • 傻瓜式操作 之 git分支(合代码--拉代码)

    刚刚入职的我 差点把人家分支给搞坏 呜呜呜太刺激了叭 之前学到 git 的相关知识的时候 都有一种恐惧心理 所以每次往 master 上面合代码的时候都让大佬帮我操作 前几天一位好心人给我了一套 git 的流程 现在玩分支简直是如鱼得水 哈
  • 一个无敌删除的命令,所有的流氓软件及顽固程序等都可以轻松的删除

    教你一个无敌删除的命令 所有的流氓软件及顽固程序等都可以轻松的删除 方法非常的简单 桌面右键 新建 文本文档 双击桌面的这个新建的文本文档 把下面的命令复制后粘贴进去 写入下列命令 DEL F A Q 1 RD S Q 1 文件 另存为 统
  • 一次安装Python插件mysqlclient受到的启发

    首先 我也是Python的初学者 环境是ubuntu22 04 pycharm 都安装好了以后 我打开了一个原来编辑过的项目 在新环境中提示没有安装mysqlclient 于是我就pip install mysqlclient 就有了以下的
  • 线性数据结构(线性表、链表、栈、队列、散列表)

    作者 disappearedgod 文章出处 http blog csdn net disappearedgod article details 23805707 时间 2014 4 16 线性表 基本概念 线性结构是最常用 最简单的一种数
  • 人脑神经网络计算法+机器

    人工神经网络编辑 人工神经网络 Artificial Neural Networks ANN 系统是 20 世纪 40 年代后出现的 它是由众多的神经元可调的连接权值连接而成 具有大规模并行处理 分布式信息存储 良好的自组织自学习能力等特点
  • 编码问题

    编码 字符 gt 字节数组 解码 字节数组 gt 字符 编码 String str 你好 byte bus str getBytes UTF 8 解码 String str1 new String bus UTF 8 System out