Python稳基修炼的经典案例12（计算机二级、初学者必会的字符文件处理）

2023-05-16

文章目录

- - - 1、统计文件中出现的所有中文字符及标点符号的数量
    - 2、统计文本中出现引号的字符占文本总字符的比例
    - 3、统计出现次数最多的8个词语

1、统计文件中出现的所有中文字符及标点符号的数量

题：统计文件中出现的所有中文字符及标点符号的数量，字符与数量用冒号隔开
如，“命：1024”

fi = open("a.txt", 'r', encoding='gbk')
fo = open("b.txt", 'w', encoding='gbk')
txt = fi.read()
d = {}
for c in txt:
    d[c] = d.get(c, 0)+1  # 利用get创建键值对，同时变化值的大小
    #del d['']  # 删除空格
    #del d['\n']  # 删除换行
ls = []
for key in d:  # 遍历所有键，追加到列表中
    ls.append("{}:{}".format(key, d[key]))
fo.write(','.join(ls))  # 用逗号分隔每组 键及数量
fi.close()
fo.close()

在这里插入图片描述

2、统计文本中出现引号的字符占文本总字符的比例

题：统计文本中出现引号的字符占文本总字符的比例，如，“命：20%”，提示：比例=字符数/文本长度

fi = open("a.txt", 'r', encoding='gbk')
txt = fi.read()
con = 0
flag = False
for c in txt:
    if c == '“':  # 前引号，变True开启加1操作
        flag = True
    if c == '”':  # 遇到后引号，就关闭加1操作
        flag = False
    if flag:
        con += 1
print("占总字符比例：{:.0%}。".format(con/len(txt)))   # 比例不带小数
fi.close()

这里面的a.txt便是上文中的那个a.txt

3、统计出现次数最多的8个词语

题：统计文本文件中出现的中文词及其对应的次数，并输出出现次数最多的8个词语

import jieba
fi = open("a.txt", 'r', encoding='gbk')
txt = fi.read()   # 获得文本对象
fi.close()
ls = jieba.lcut(txt)  # 获取分词
dic = {}
for w in ls:  # 遍历所有分词，同时添加键与值，并统计次数
    dic[w] = dic.get(w,0) + 1
rst = []  # 存放次数最多的前8个次的列表
for i in range(8):  # 8次遍历整个字典，每次都找出次数最多的那个词，放入mxj中
    mx = 0  # 次数最多的值
    mxj = 0  # 次数最多的键
    for j in dic:
        if dic[j] > mx:
            mx = dic[j]  # 获得此轮值
            mxj = j  # 获得此轮键
    rst.append(mxj)  # 追加键名到列表中
    del dic[mxj]
print("，".join(rst))

若要打印每个词对应的次数，则可以加入：

for key in dic:
    rst.append("{}:{}".format(key, dic[key]))
print("，".join(rst))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python稳基修炼的经典案例12（计算机二级、初学者必会的字符文件处理）的相关文章

Python之数据分析（动画效果、animation模块、气泡动画）

文章目录 1 动画效果2 原理分析3 动画源码本篇文章其实与数据分析没有太大关系 xff0c 因为是涉及到数据分析的数据可视化方面的内容 xff0c 因此也必须要学习主要内容是如何制作一个气泡动画效果 xff0c 当然也是使用matpl
Python之数据分析（生成动态图像、示波器效果）

文章目录 1 效果展示2 动画分析3 案例源码 1 效果展示动态更新波形图 xff1a 静态图 xff1a 2 动画分析这是一个使用了生成器的动画效果 xff0c 生成器里面会不断生成新的值 xff0c 然后放到更新函数里面在指定的in
Python之数据分析（Numpy中读取与保存数据文件、将数据文件制成K线图）

文章目录一读取与保存文件二将数据文件制成K线图一读取与保存文件 1 读取文件格式 numpy loadtxt 文件名 delimiter 61 分割符 usecols 61 选择列 unpack 61 是否解包 True Fals
使用Laravel提交POST请求出现The page has expired due to inactivity错误

使用Laravel提交POST请求出现The page has expired due to inactivity Please refresh and try again 问题提交POST请求 xff0c 出现如下错误 xff1a Th
Python之数据分析（算数平均值、加权平均值、最大值与最小值）

文章目录一算数平均值二加权平均值三最大值与最小值一算数平均值 1 平均值的作用平均数是表示一组数据集中趋势的量数它是反映数据集中趋势的一项指标一组数据少则几十 xff0c 多则上千 xff0c 甚至于过百万 xff0c 由
Python之数据分析（中位数、波动范围、极差、离差、方差、标准差）

文章目录一中位数二波动范围与极差三离差方差与标准差一中位数 1 中位数将多个样本按照大小顺序排列 xff0c 居于中间位置的元素为中位数 2 经典求法 1 xff09 A xff1a 样本集 2 xff09 L xff1a
Python之数据分析（规范数据生成器Faker，学习、数据分析、开发测试专用）

文章目录写在前面一生成数据写入csv文件中二基础信息三邮箱信息四地理信息五数字信息六时间信息七网络基础信息八浏览器信息九文本与文本加密信息写在前面无论是在我们学习数据分析之际 xff0c 还是在实际的开发测试过程中
Python之数据分析（星期均值、星期汇总、Numpy的take与where方法、apply_along_axis函数）

文章目录一处理星期数据二 apply along axis函数的用法三星期汇总案例一处理星期数据 1 datetime对象的weekday 方法该方法将会用0到6这七个数字表示周一到周日 2 计算周一到周五数据平均值的三种方法
Python之数据分析（卷积运算、移动均线、布林带）

文章目录一卷积运算二移动均线的绘制三布林带绘制本篇依然是数据分析里数据可视化方面的内容 xff0c 主要内容有一维卷积完全卷积有效卷积移动均线的绘制布林带的绘制一卷积运算 1 关于卷积这里说到的卷积计算 xff0c
Python之数据分析（numpy线性模型、线性预测、线性拟合）

文章目录一线性预测二线性拟合线性模型分为两种 xff1a 线性预测和线性拟合 xff0c 这两种都可以起到预测走势和数据点的作用 xff0c 当然 xff0c 预测是存在一定误差的 xff0c 因此这种预测图像仅供参考一线性预测
小白打基础一定要吃透的11类 Python 内置函数

内置函数就是python给你提供的拿来直接用的函数 xff0c 比如print xff0c input等截止到python版本3 6 2 python一共提供了68个内置函数本人在复习过程中将其整理了出来 xff0c 做成了思维导图的
Python之数据分析（numpy裁剪、压缩、累乘，样本相关性曲线的绘制）

文章目录一裁剪压缩累乘二样本相关性曲线一裁剪压缩累乘 1 裁剪概念 xff1a 指的是削掉波峰或波谷这类型的 xff0c 将调用数组中小于min的元素设置为min xff0c 大于max的元素设置为max用法 xff1a
Python之数据分析（numpy中的多项式拟合）

1 多项式拟合的概念用一个无穷级数表示一个可微函数 xff0c 任何可微的函数 xff0c 总可以用一个N次多项式来近似 xff0c 而比N次幂更高阶的部分可以作为无穷小量而被忽略不计 f x 61 p0x n 43 p1x n 1 43
Python之数据分析（案例：净额成交量、矢量化、数据曲线平滑）

文章目录一净额成交量二标量函数矢量化三数据曲线平滑一净额成交量 1 案例分析符号数组a 10 20 30 40 50 用法 xff1a numpy sign a 结果是 1 1 1 1 1 净额成交量 xff1a 简称OBV
日志logback配置: 解决 logback.xml 配置不起作用的问题

解决 logback xml 配置不起作用的问题 Logback 是一个 Java 领域的日志框架今天在学习使用 logback 日志框架时 xff0c 配置 logback test xml 一直不起作用特此记录一下使用 logba
Python之数据分析（Numpy中的除法和取余、三角函数、ufunc对象的位运算）

文章目录一四种除法二取余运算三斐波那契数的四种求法四坐标变化的三角函数五 ufunc对象位运算一四种除法 1 真除 xff1a 结果完全保留 xff0c 小数部分也保留 1 xff09 numpy true divide 2
Python之数据分析（Numpy的子模块：线性代数模块linalg、傅里叶变换模块fft）

文章目录一线性代数模块 xff08 linalg xff09 1 矩阵的逆2 矩阵的线性解3 特征值与特征向量4 奇异值分解与广义逆矩阵二傅里叶变换模块 xff08 fft xff09 一线性代数模块 xff08 linalg x
Python之数据分析（Numpy的矩阵相关操作、ufunc泛化函数对象）

文章目录一矩阵相关操作二 ufunc统一泛化函数一矩阵相关操作 1 三种构造矩阵的方法 np matrix 二维容器 copy 61 True 一参为可被解释为矩阵的二维容器 xff0c 比如二维数组二维列表 xff1b 二参为c
Python之数据分析（random模块的正确用法）

文章目录一二项分布 xff1a numpy random binomial n p size 二超几何分布 xff1a numpy random hypergeometric ngood nbad nsample size 三正态分
Python之数据分析（间接联合排序、所有最值相关函数、有序插入、定积分、插值器对象）

文章目录一间接联合排序二所有最值相关方法三有序插入四定积分五插值器对象一间接联合排序 1 间接联合排序 xff1a 获取排序样本的下标后来排序0 1 2 3 4 5 6 7 8 原始序列 xff1a 8 2 3 1 7 4

随机推荐

Python之数据分析（finance金融计算模块）

文章目录一绘制K线图二金融计算器之终值现值净现值三金融计算器之内部收益率每期支付要还的期数年利率四金融计算器练习代码一绘制K线图 1 导入库 xff1a import mpl finance as mf 2 调用 m
必须掌握的Python技巧（一）

文章目录 1 重复元素判定2 字符元素组成是否相同的判定3 查看变量的内存占用4 查看字符串占用的字节数5 打印某个字符串n次 xff0c 不需要循环6 切割列表的元素 xff0c 分成指定元素个数 n 的若干个列表7 压缩 xff1a 去
必须掌握的Python技巧（二）

文章目录 1 统计元音的个数 xff0c 在字符串中找aeiou xff08 正则 xff09 2 首字母大小写 xff1a 切片的方法3 展开列表4 求列表的差5 通过函数取差6 链式函数调用 xff1a 在一行代码内调用多个函数7 检查
必须掌握的Python技巧（三）

文章目录 1 合并两个字典2 将两个列表转化为字典 xff08 zip方法 xff09 3 枚举法遍历字典的索引与值4 Try可以加else xff1a 如果没有引起异常 xff0c 就会执行else语句5 根据元素出现频率取最常见的元素6
Python稳基修炼的经典案例1（计算机二级、初学者必须掌握的例题）

文章目录 1 猜字母程序2 两个正六边形绘制3 用jieba库将段落进行分词操作 1 猜字母程序一个猜字母的程序程序随机给出26个小写字母中的一个 xff1b 答题者输入猜测的字母若输入的不是26个小写字母之一 xff1b 让用户重新
Lumen/Laravel 5.4 使用网易邮箱 SMTP 发送邮件

Lumen Laravel 5 4 使用网易邮箱 SMTP 发送邮件获取网易邮箱的服务器和授权码登录网易邮箱 http mail 163 com 获取服务器地址 xff1a 点击设置 gt POP3 SMTP IMAP 服务器地址 s
Python稳基修炼的经典案例2（计算机二级、初学者必须掌握的例题）

文章目录 1 输入年份输出月份2 正向与逆向打印乘法口诀表3 将段落用分割以呈现诗歌形式4 将段落按照行翻转 1 输入年份输出月份主要就是导入calendar模块 xff0c 这个模块是专门用来处理日历相关问题的 span class t
Python稳基修炼的经典案例3（计算机二级、初学者必须掌握的例题）

文章目录 1 地板除 xff08 整除 xff09 xff1a 总是向下取整或减12 去除首尾的空格3 绘制四瓣花型4 对数的计算 xff08 math模块 xff09 5 凯撒加密 1 地板除 xff08 整除 xff09 xff1a 总
Python稳基修炼的经典案例4（计算机二级、初学者必须掌握的例题）

文章目录 1 将列表中重复元素删除2 自己写一个翻转函数3 绘制边长200 xff0c 黄底黑边的五角星4 规定小数点个数5 二进制八进制与十六进制6 黄底黑边圆形 xff0c 半径50 1 将列表中重复元素删除其实很容易想得到 xff
Python稳基修炼的经典案例5（计算机二级、初学者必须掌握的例题）

文章目录 1 统计中文词数量2 绘制边长为200的太阳花3 去除列表中的素数 xff0c 并统计剩下的元素个数4 统计文章的英文字符数 1 统计中文词数量使用jieba库进行操作 xff0c 就可以得到中文分词注意 xff1a 中文词并
Python稳基修炼的经典案例6（计算机二级、初学者必须掌握的例题）

文章目录 1 画一个正方形 xff08 200像素边长 xff09 2 保存学生成绩 xff0c 并求最大最小平均分3 提取传感器编号为earpa001的所有数据 xff0c 行尾无空格 xff0c 无空行 1 画一个正方形 xff08
Python稳基修炼的经典案例7（计算机二级、初学者必须掌握的例题）

文章目录 1 右对齐 xff0c 30个字符 xff0c 用 64 符号填充2 正五边形的绘制3 统计各专业学生数量4 绘制边长为100的三角形 1 右对齐 xff0c 30个字符 xff0c 用 64 符号填充 n span class
Python稳基修炼的经典案例8（计算机二级、初学者必须掌握的例题）

文章目录 1 分割与合并练习 xff08 split join xff09 2 字符串填充练习3 使用 turtle库绘制螺旋状的正方形 1 分割与合并练习 xff08 split join xff09 题目 xff1a 输入一个字符串
Python内置库修炼——turtle绘图库指令大全

文章目录一设置画布大小二画笔的属性三画笔控制命令四画笔运动命令五全局控制命令六其他命令七弧形绘制一设置画布大小 1 screensize turtle screensize canvwidth 61 None canvh
Python稳基修炼的经典案例9（计算机二级、初学者必会turtle库例题）

文章目录 1 绘制粉底红边的心型图形2 绘制红黄色五角星3 绘制正方形螺旋线4 绘制简单城市剪影效果 1 绘制粉底红边的心型图形 span class token keyword from span turtle span class to
Python稳基修炼的经典案例10（计算机二级、初学者必会turtle库例题）

文章目录 1 绘制同心圆2 绘制叠加等边三角形3 绘制八角星型4 绘制树形图 1 绘制同心圆 span class token keyword import span turtle span class token keyword as s
SQL查询语句中的 limit 与 offset 的区别

SQL查询语句中的 limit 与 offset 的区别 xff1a limit y 分句表示读取 y 条数据 limit x y 分句表示跳过 x 条数据 xff0c 读取 y 条数据 limit y offset x 分句表示跳过
使用EL表达式中forEac标签时出现错误：org.apache.JasperException:An exception occurred processing...

问题截图 xff1a 问题解决 xff1a EL表达式只能从域对象中获取值 xff0c forEach标签中应为 items 61 34 users 34 初学时遇到问题时应该仔细阅读报错信息找到关键的报错语句 xff0c 比如截图中红线
Python稳基修炼的经典案例11（计算机二级、初学者必会输入输出训练）

文章目录 1 输入正整数N 计算1到N之间所有奇数的平方和 xff0c 不含N2 判断N是否为质数3 持续从用户获得数据 xff0c 直到输入回车键 xff0c 打印所有输入的和4 不允许输入数字5 只允许输入数字6 只允许输入浮点数7 产
Python稳基修炼的经典案例12（计算机二级、初学者必会的字符文件处理）

文章目录 1 统计文件中出现的所有中文字符及标点符号的数量2 统计文本中出现引号的字符占文本总字符的比例3 统计出现次数最多的8个词语 1 统计文件中出现的所有中文字符及标点符号的数量题 xff1a 统计文件中出现的所有中文字符及标点符号

Python稳基修炼的经典案例12（计算机二级、初学者必会的字符文件处理）

文章目录

1、统计文件中出现的所有中文字符及标点符号的数量

2、统计文本中出现引号的字符占文本总字符的比例

3、统计出现次数最多的8个词语

Python稳基修炼的经典案例12（计算机二级、初学者必会的字符文件处理） 的相关文章

随机推荐

热门标签

Python稳基修炼的经典案例12（计算机二级、初学者必会的字符文件处理）的相关文章