.value_counts() 给出截断的结果

2024-04-12

我有一个 Excel 文件,其中有一列包含多个单词。我正在尝试计算每个单词出现的频率。 所以如果我有一个清单

Labels 
a
a 
b
b
c
c
c

输出应该是

c : 3
b : 2
a : 2

我正在使用以下代码片段

import pandas as pd
train = pd.read_csv("ani2.csv")
A = train['Labels'].value_counts()
f = open("ani3.csv",'a')
f.write(str(A))
f.close()

该数据集大约有 53000 个值,我获得的输出被截断了。我获得的输出就是这种格式。

z : 1700
y : 1500
x : 1000
...
c : 3
b : 2
a : 2

由于某种原因,中间的值丢失了,我得到的只是三个点。


你正在路过str(A)

只要打电话to_csv on A:

A = train['Labels'].value_counts()
A.to_csv("ani3.csv",mode='a')

当你这样做的时候str(A)您正在将输出(将受到 pandas 显示选项的影响)转换为字符串表示形式,这就是您得到的原因....

你可以在这里看到效果:

In [34]:
df = pd.DataFrame(np.random.randn(100,1), columns=['a'])
str(df['a'].value_counts())

Out[34]:
'-1.115774    1\n-0.196748    1\n-0.193616    1\n-0.197265    1\n 0.745611    1\n 0.766238    1\n-0.263205    1\n 0.542410    1\n-1.930702    1\n-0.913680    1\n 1.150879    1\n 0.213193    1\n-1.245947    1\n-2.610836    1\n 1.482863    1\n 0.430732    1\n-1.290851    1\n-0.962350    1\n-0.160461    1\n 1.895585    1\n 0.923683    1\n-1.206336    1\n 0.454317    1\n 0.293499    1\n-1.289761    1\n-0.191499    1\n 1.311149    1\n 0.380678    1\n 0.964312    1\n-0.703558    1\n            ..\n-0.384447    1\n 0.172968    1\n-0.221997    1\n 0.133441    1\n-0.343758    1\n-0.897193    1\n-0.525859    1\n-0.226437    1\n-0.552760    1\n-1.991686    1\n 0.517877    1\n 0.659020    1\n 1.680185    1\n 0.155123    1\n-0.788438    1\n-1.364535    1\n 0.034736    1\n 0.494853    1\n 1.113248    1\n-1.449296    1\n 1.123138    1\n-0.747243    1\n-0.429054    1\n-0.567881    1\n-0.476616    1\n-2.630239    1\n 0.084506    1\n 1.250732    1\n 0.071242    1\n-0.432580    1\nName: a, dtype: int64'
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

.value_counts() 给出截断的结果 的相关文章

随机推荐

  • 如何在c中将日期时间转换为unix时间戳?

    场景是 我使用 libexif 获取格式为 YYYY MM DD HH MM SS 的日期时间 为了最大限度地减少节省成本 我想将日期时间转换为unix时间戳或类似的值 只需要64位或32位 c 有什么明确的方法吗 你可以尝试组合使用str
  • .net core PGP加密解密

    上遇到错误void Encryption public void Encryption region PGP Encryption PgpEncryptionKeys encryptionKeys new PgpEncryptionKeys
  • 如何以人类可读的方式打开 Java .class 文件?

    我试图弄清楚 Java applet 类文件在幕后的作用 用记事本或文本板打开它只会显示一堆官样文章 有什么方法可以将其恢复为可读的格式 以便我可以尝试弄清楚它在做什么 环境 安装了 VS 2008 的 Windows jd gui htt
  • FFMPEG - 以特定时间间隔在视频上叠加多个视频

    我想以指定的时间间隔将多个视频叠加在单个视频上 尝试过不同的解决方案 但它不会像我一样工作 我使用下面的命令将视频叠加在视频上 String cmdWorking3 new String i yourRealPath i gifVideoF
  • 自动链接属性与实际链接不同的文本(setAutoLinkMask)

    例如 TextView tv TextView this findViewById R id tv tv setAutoLinkMask Linkify ALL tv setText visit website http www googl
  • 在 IIS7 上将多个域指向一个网站

    这与 SEO 没有任何关系 请不要发布任何有关 SEO 排名的内容 因为它不是这里的一个因素 我有2个网址 old websitename com 和 new websitename com 我需要在一定的时间内支持这两个 url 而不是在
  • 通过Python中的selenium驱动程序将图像导入谷歌表单

    我正在尝试将图像导入谷歌表单 我无法通过 xpath 将密钥传递给元素 看来这是一个隐藏的元素 我尝试执行脚本来取消隐藏它 但没有成功 也尝试过这个解决方案 如何使用 Selenium WebDriver python 访问隐藏的文件上传字
  • C++ 中的 Stringstream 解析单词和数字字符串

    我有这样的字符串 123加43次7 其中数字后面跟着字典中的单词 我知道我可以使用以下命令提取 int numbers gt gt 操作员 StringStream gt gt number 我可以拿到号码 然而 Stream 中仍然有该号
  • 将 JFrame 方向设置为从右到左!

    为了从右到左对齐我的 JFrame 我使用 setComponentOrientation ComponentOrientation RIGHT TO LEFT 但这仅当我使用 JFrame 的以下样式 装饰 时才有效 public cla
  • 如何使用 JaCoCo 忽略内部/嵌套类?

    我试图忽略一些生成的类 并且这些类被很好地忽略 但是 如果这些类具有内部类 则尽管父类被排除 但这些类仍然会被包含在内 这是我的配置
  • Asp.Net 3.5 路由到 Web 服务?

    我一直在寻找一种路线http www example com WebService asmx http www example com WebService asmx to http www example com service http
  • PhoneGap支持普通网络吗?

    phoneGap是否支持普通网页 如果支持的话我可以给我一个可以浏览的链接吗 thanks sri 当然 它可以加载到您现有的 UIWebView 实例中 或者加载到 ChildBrowser 中plugin http github com
  • 在 vim 中全局追加到具有匹配术语的行

    我确信这很容易 我只是缺少一两个字符 我需要在文件中搜索特定术语 当找到它时 我需要在该行添加一些内容 我想对比赛的每一行都这样做 要执行一次 我可以这样做 Thing to find s Stuff to append 简单的 如果我的
  • Java SSLHandshakeException:没有共同的密码套件

    我正在尝试使用 Java SSLSockets 将安全性应用于简单的聊天应用程序 我创建了一个自签名 CA 并用它签署了两个证书 全部使用 RSA 密钥 一个用于服务器 一个用于客户端 之后 我将证书导入到服务器的密钥库和客户端的另一个密钥
  • OS X 下 JRE 8 的 /lib/security 文件夹在哪里? [复制]

    这个问题在这里已经有答案了 我正在 OS X 下从 Java JRE 8 搜索文件夹 lib security 在 Windows 下 fodler 位于 java 安装目录的子文件夹 lib security 中 例如 C Program
  • ObservationCollection 使用 MVVM 架构在 PCL 内的 ViewModel 中实现 ISupportIncrementalLoading 以支持 WinRT 和 WP8/WinPRT

    我的 ViewModel 位于 PCL 内 因为我正在并行开发 Windows 8 1 和 Windows Phone 应用程序 我的 ViewModel 中有一个作为 ObservableCollection 的内容列表 我在 Windo
  • 深入学习 C# 表达式树的最佳资源是什么?

    当我第一次输入这个问题时 我这样做是为了找到重复的问题 我确信一定有人已经问过这个问题 我的计划是关注那些重复的链接 而不是发布这个问题 但据我所知 这个问题以前没有被问过 它没有出现在 相关问题 列表中 您找到了哪些用于深入了解 C 表达
  • Git 文件超出了符号链接范围

    我遇到了一个问题 Git 认为文件超出了符号链接的范围 因此无法对其进行版本控制 但它似乎是一个真实的文件 root r1 h stat f conf core site xml File conf core site xml ID 5c7
  • AQL 构建域对象不返回结果

    我遇到了一个问题 即使用 AQL 时无法返回对构建域对象进行的任何查询 当我进行以下卷曲时 curl X GET H X JFrog Art Api myArtifactroyKey H Cache Control no cache htt
  • .value_counts() 给出截断的结果

    我有一个 Excel 文件 其中有一列包含多个单词 我正在尝试计算每个单词出现的频率 所以如果我有一个清单 Labels a a b b c c c 输出应该是 c 3 b 2 a 2 我正在使用以下代码片段 import pandas a