1705_Python处理中文经验与实践

2023-05-16

全部学习汇总： GreyZhang/python_basic: My learning notes about python. (github.com)

曾经在很长的一段时间内，Python处理中文的时候真是把我难坏了。总觉得使用Python处理中文或者是unicode那真叫一个愁！网络上找来的各种教程看来看去看不明白，网络上搜出来的各种代码试来试去试不出来。可现实中的汉字处理却是多的实在是不可避免。最初我自己的解决方案是遇到需要处理汉字的情况立马转战Perl或者MATLAB，在Perl以及MATLAB的世界中一切还不算是那么困难。

其实，我需要处理的汉字就是那么几种情况，说起来也没有什么难以概述的。大致的工作不外乎如下：

1，把汉字写入到文件里

2，把文件中的汉字读取出来

相信上面两个实现了一切基本上就没有困难了，毕竟在解析器里输出一个汉字还是简单的。

下面也不解释什么unicode了，没有什么高大上，也说不上什么精深。我自己处理这些只能是经验谈。

实践1：把汉字写入到文件

代码：

#!/usr/bin/python

# -*- coding: cp936 -*-

fid = open('t1.txt','w')

fid.write('中文\n')

fid.close()

执行上面的代码，在当前的目录中会生成一个文件名为“t1.txt”的文件，里面的信息自然是“中文”。

总结相应的注意点：第一，加上# -*- coding: cp936 -*-指明编码；第二，中文的字符串按照一般的字符串格式来写不能够写成u'****'的形式。
实践2：把t2.txt中的文字读出来屏显，文件中的文字为“中华人民共和国”

代码：

#!/usr/bin/python

# -*- coding: cp936 -*-

fid = open('t2.txt','r')

text = fid.read()

fid.close()

print text

print type(text)

执行上面的代码，结果显示如下：

>>>

中华人民共和国

个人的实践经验：第二行不是必须的。但是处理这种信息的时候加上也没有什么影响。而中文从文件中读取出来的数据类型也是一个普通的字符串。

再附加两个Excel表格处理的例子：

实践3：电子表格的写入

代码：

#!/usr/bin/python

# -*- coding: cp936 -*-

from xlwt import Workbook

book = Workbook()

sheet = book.add_sheet('test')

for num in range(10):

sheet.write(num,0,num)

sheet.write(num,1,(u"测试" + str(num)))

book.save('t3.xls')

在生成的电子表格中写入了10行2列，第一列是0-10数字，第二列是测试+行号的汉字与数字组合。编码要点：第一，代码的第二行必须；第二，汉字必须写成u"***"的形式。

实践4：读取实践3中的Excel并且屏显。

代码：

#!/usr/bin/python

# -*- coding: cp936 -*-

from xlrd import open_workbook

book = open_workbook('t3.xls')

sheet = book.sheet_by_index(0)

print "sheet name is: ",sheet.name

for num in range(sheet.nrows):

print "Line ",num + 1," : ",sheet.cell(num,0).value,' ',

print sheet.cell(num,1).value

代码执行的结果如下：

sheet name is: test

Line 1 : 0.0 测试0

Line 2 : 1.0 测试1

Line 3 : 2.0 测试2

Line 4 : 3.0 测试3

Line 5 : 4.0 测试4

Line 6 : 5.0 测试5

Line 7 : 6.0 测试6

Line 8 : 7.0 测试7

Line 9 : 8.0 测试8

Line 10 : 9.0 测试9

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

1705_Python处理中文经验与实践的相关文章

Centos6.5下进行PHP版本升级

统计插件 WP Statistics 要求PHP5 4以上 xff0c 可本机PHP为5 3 3 xff0c 无奈只有对服务器PHP进行升级 xff0c 遂写下本文 Step1 xff1a 查看安装服务器当前安装版本 php V Step2
一段日子的结束，也是一段日子的开始

一个朋友说的 xff0c 一段日子的结束 xff0c 也是另一段日子的开始也正是我现在的状态 xff0c 我结束了一段往事 xff0c 也因此开始了一段日子 xff0c 曾经的曾经已离我远去昨天和好朋友聊天到很晚 xff0c 谈了很多
岁月静好

不是说马年会马上转运的 xff0c 是不是蛇年的时候前半年太幸福了 xff0c 用了太多的好人品 xff0c 各种奖学金 xff0c 各种申请中标 xff0c 各种荣誉 xff0c 然后我要还了小猴子说我开始会依赖人了 xff0c 哈哈
STM32 中重定向printf 和 scanf

uart c 如果使用 pragma import use no semihosting 则在MDK中不勾选use Microlib 当前代码直接重定向没使用 pragma import use no semihosting 故需要选择us
Ubuntu环境下Pixhawk原生固件PX4的编译

Ubuntu下Pixhawk原生固件PX4的编译这个问题困扰了两天时间 xff0c 可能是博主脑力不够 xff0c 主要是环境搭建不起来 xff0c 主要原因应该是路径的原因 xff0c 最后在大师傅的帮助下还好成功将路径搭建好 xff0c
远程连接虚拟机的Network error: Connection timed out问题

MobaXterm远程连接虚拟机的Network error Connection timed out问题我使用的是MobaXterm远程连接我使用VMware创建的虚拟机更新一下 xff1a 如果出现这种问题 xff0c 极大可能是服
springboot项目接入天猫精灵

springboot项目接入天猫精灵最近工作需要使用到天猫精灵的语音功能 xff0c 大体是通过呼叫对应的调用词实现携带参数 xff0c 然后调用我项目中的接口 xff0c 以实现对应的业务所以在此简单的记录下使用过程实际上 xf
Lesson 9.2&9.3&9.4 黑箱：不可解释的深层神经网络&探索多层神经网络：层vsh（z）

二黑箱 xff1a 深层神经网络的不可解释性首先从结构上来看 xff0c 多层神经网络比单层神经网络多出了中间层中间层常常被称为隐藏层 xff08 hidden layer xff09 xff0c 理论上来说可以有无限层 xff0c
UnicodeEncodeError: 'gbk' codec can't encode character ...

使用Python写文件的时候 xff0c 或者将网络数据流写入到本地文件的时候 xff0c 大部分情况下会遇到 xff1a UnicodeEncodeError 39 gbk 39 codec can 39 t encode charact
一文简单了解并构建DockerFile

GreatSQL社区原创内容未经授权不得随意使用 xff0c 转载请联系小编并注明来源 GreatSQL是MySQL的国产分支版本 xff0c 使用上与MySQL一致作者 xff1a 蟹黄瓜子文章来源 xff1a GreatSQL社区投稿
头文件中定义和声明的问题

头文件中定义和声明的问题 1 头文件中不可以放变量的定义 xff01 一般头文件中只是放变量的声明 xff0c 因为头文件要被其他文件包含 include xff0c 如果把定义放在头文件的话 xff0c 就不能避免多次定义变量 C 43
Apache中更改PHP版本型号

如何对服务器PHP版本进行升级 xff0c 详看我另外一篇博文 xff0c 这篇文章我们将讲述如何在Apache中更改PHP版本型号 Step1 xff1a 查看Apache用的PHP什么版本新建一个文档 xff0c 命名为info ph
简述AGV通信接口标准-VDA5050

引言德国汽车工业协会德语 xff1a Verband der Automobilindustrie e V 简称VDA xff0c 通过其 34 VDA 5050 34 接口 xff0c 早在2019年起 xff0c 不同制造商的车辆
C语言结束输入（两种方法）

方法1 xff1a 输入数据 while getchar 61 39 n 39 scanf 34 d 34 amp Data data i 43 43 61 Data 方法2 xff1a for i 61 0 i lt 100 amp am
OpenCV（项目）车牌识别3 -- 模板匹配

目录一基础理论 1 思想 2 大致过程二详细过程 1 首先需要模板库 2 得到模板 3 原图限定大小 4 模板匹配 5 匹配所有子文件夹 xff0c 保存最佳得分 xff08 最匹配项 xff09 三大致过程 xff08 细分类
PMP项目管理中的重要角色

PMP及PMBOK有个大问题 xff0c 就是没有统一的角色职责及流程 xff0c 考试也是随意性很强 xff0c 这给考生带来很多困扰一个管理体系 xff0c 首先是人员分工安排比如 xff1a PRINCE2 xff0c 明确的组织
书房再次升级啦～～

国庆长假 xff0c 在家里面一顿折腾 xff0c 墙全部重新粉刷 xff0c 书房卧室客厅三种不同颜色书房的颜色是当时在装饰城的展厅里面偷偷扣的墙皮 xff0c 在多乐士店色卡里面对出来的 xff0c 哈哈 ps 这篇日志的照片是用
基于K近邻法的手写数字图像识别

数字图像处理课程论文题目 xff1a 数字图像识别摘要模式识别 PatternRecognition 是一项借助计算机 xff0c 就人类对外部世界某一特定环境中的客体过程和现象的识别功能 xff08 包括视觉听觉触觉判断等
Ubuntu 16.04升级内核到20.04

一首先需要从16 04 18 04 sudo mv etc apt sources list sudo mv etc apt sources list d list 1 改变源 xff08 粘贴下面这一段到终端并运行 xff09 cat
互斥和二进制信号量的使用

1 二进制信号量 semBCreate SEM Q FIFO SEM Q PRIORITY SEM EMPTY SEM FULL 有两个作用 xff1a xff08 1 xff09 任务间的互斥 xff0d xff0d 同一个任务获取和释放

随机推荐

【C++】关于以下划线开头的变量名

系统头文件里将宏名变量名内部函数名用 34 34 开头就是为了避免与用户用的名字冲突因为当你 xff03 include 系统头文件时 xff0c 这些文件里的名字都有了定义 xff0c 如果与你用的名字冲突 xff0c 就可能
1689_MATLAB处理Excel文件提升篇

全部学习汇总 xff1a GreyZhang g matlab MATLAB once used to be my daily tool After many years when I go back and read my old lea
1690_Python中的复数数据类型

全部学习汇总 xff1a GreyZhang python basic My learning notes about python github com 之前总结的知识中设计的数据类型有整形浮点字符串等 xff0c 这些类型表示的都是
linux 命令终端提示符显示-bash-4.1#

昨晚对服务器自带Python升级后 xff0c 终端就不是以前root 64 主机 43 路径的显示方式了查了很多资料 xff0c 有人说是root目录下 bash profile和 bash两个文件缺失 xff0c 但我的这两个文件是存
1691_python学习笔记之week3_递归

全部学习汇总 xff1a GreyZhang python basic My learning notes about python github com 最初接触递归的时候觉得这个有点不好理解 xff0c 怎么能够有这种思维方式 xff1
1692_Git版本控制管理 21-40

全部学习汇总 xff1a GreyZhang toolbox 常用的工具使用查询 xff0c 非教程 xff0c 仅作为自我参考 xff01 github com 我曾经多次在工作中接触软件版本管理 xff0c 接触过多个公司的软件版本管理
1693_Python处理Excel学习小结 21-41

全部学习汇总 xff1a GreyZhang python basic My learning notes about python github com 说起来这是我来到北京之后开始接触的第一个新技术 xff0c 我对此痴迷 xff0c
1694_week1_MIT使用Python编程学习手记1

全部学习汇总 xff1a GreyZhang python basic My learning notes about python github com 首先说明一下 xff0c 这部分信息的整理只是我个人的理解由于自己的知识功底以及英
1695_week2_算法与函数（MIT使用Python编程学习手记）

全部学习汇总 xff1a GreyZhang python basic My learning notes about python github com 首先说明一下 xff0c 这部分信息的整理只是我个人的理解由于自己的知识功底以及英
1696_C语言中变量默认初始化初值探究测试

全部学习汇总 xff1a GreyZhang c basic little bits of c github com 欢迎路过的YUAN类朋友相互沟通交流 xff0c 也欢迎各位随时指点指正以下是我的联系方式 xff1a 微信 xff1a
1697_python编程_assertions and exceptions

全部学习汇总 xff1a GreyZhang python basic My learning notes about python github com 这部分主要关于程序中的异常类型以及处理方式 exception 常见的异常类型 ex
1698_python编程_测试与debug

全部学习汇总 xff1a GreyZhang python basic My learning notes about python github com 学习了一下这一周的课程 xff0c 讲的主要是测试以及Bug调试方面的东西在之前我
1699_simulink代码生成配置初级方案

全部学习汇总 xff1a GreyZhang g matlab MATLAB once used to be my daily tool After many years when I go back and read my old lea
1700_VIM代码自动补齐配置

全部学习汇总 xff1a GreyZhang editors skills Summary for some common editor skills I used github com 欢迎路过的YUAN类同胞相互交流 xff0c 指点指
Python2 备份网站目录并上传百度网盘

最近用WordPress建了个个人博客 xff0c 本着数据无价的原则编写了本脚本对数据库和网址目录进行备份并上传到百度网盘里话不多说 xff0c 下面就该Python脚本的程序依赖代码说明及使用方法进行叙述一程序依赖 1 安装Py
1701_week5_效率与搜索

全部学习汇总 xff1a GreyZhang python basic My learning notes about python github com 这一周的课程很早就学完了 xff0c 碰上自己昼夜加班周末不休的时段一直也没有整理学
1702_week6_面向对象编程

全部学习汇总 xff1a GreyZhang python basic My learning notes about python github com 放一下自己的联系方式 xff0c 软件爱好者欢迎交流邮箱 xff1a greyzh
1703_LibreOffice常用功能使用体验

全部学习汇总 xff1a GreyZhang windows skills some skills when using windows system github com 首先需要说明的是我不是一个重度Office用户 xff0c 甚至算
1704_Linux与Windows使用体验对比

全部学习汇总 xff1a GitHub GreyZhang little bits of linux My notes on the trip of learning linux 我在我的微博上发过几次对比两个操作系统使用体验的微博 xff
1705_Python处理中文经验与实践

全部学习汇总 xff1a GreyZhang python basic My learning notes about python github com 曾经在很长的一段时间内 xff0c Python处理中文的时候真是把我难坏了总觉得

1705_Python处理中文经验与实践

1705_Python处理中文经验与实践 的相关文章

随机推荐

热门标签

1705_Python处理中文经验与实践的相关文章