Python算法计算csv中特定单词的出现次数

2023-11-22

我刚刚开始学习Python。 我很好奇什么是计算 CSV 文件中特定单词出现次数的有效方法,而不是简单地使用 for 循环逐行遍历并读取。

更具体地说,假设我有一个 CSV 文件,其中包含两列“姓名”和“成绩”,包含数百万条记录。

如何计算“Grade”下“A”的出现次数?

Python 代码示例将不胜感激!


基本示例,使用csv and collections.Counter(Python 2.7+) 来自标准 Python 库:

import csv
import collections

grades = collections.Counter()
with open('file.csv') as input_file:
    for row in csv.reader(input_file, delimiter=';'):
        grades[row[1]] += 1

print 'Number of A grades: %s' % grades['A']
print grades.most_common()

输出(对于小数据集):

Number of A grades: 2055
[('A', 2055), ('B', 2034), ('D', 1995), ('E', 1977), ('C', 1939)]
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python算法计算csv中特定单词的出现次数 的相关文章