.value_counts() 给出截断的结果

2024-04-12

我有一个 Excel 文件，其中有一列包含多个单词。我正在尝试计算每个单词出现的频率。所以如果我有一个清单

Labels 
a
a 
b
b
c
c
c

输出应该是

c : 3
b : 2
a : 2

我正在使用以下代码片段

import pandas as pd
train = pd.read_csv("ani2.csv")
A = train['Labels'].value_counts()
f = open("ani3.csv",'a')
f.write(str(A))
f.close()

该数据集大约有 53000 个值，我获得的输出被截断了。我获得的输出就是这种格式。

z : 1700
y : 1500
x : 1000
...
c : 3
b : 2
a : 2

由于某种原因，中间的值丢失了，我得到的只是三个点。

你正在路过str(A)

只要打电话to_csv on A:

A = train['Labels'].value_counts()
A.to_csv("ani3.csv",mode='a')

当你这样做的时候str(A)您正在将输出（将受到 pandas 显示选项的影响）转换为字符串表示形式，这就是您得到的原因....

你可以在这里看到效果：

In [34]:
df = pd.DataFrame(np.random.randn(100,1), columns=['a'])
str(df['a'].value_counts())

Out[34]:
'-1.115774    1\n-0.196748    1\n-0.193616    1\n-0.197265    1\n 0.745611    1\n 0.766238    1\n-0.263205    1\n 0.542410    1\n-1.930702    1\n-0.913680    1\n 1.150879    1\n 0.213193    1\n-1.245947    1\n-2.610836    1\n 1.482863    1\n 0.430732    1\n-1.290851    1\n-0.962350    1\n-0.160461    1\n 1.895585    1\n 0.923683    1\n-1.206336    1\n 0.454317    1\n 0.293499    1\n-1.289761    1\n-0.191499    1\n 1.311149    1\n 0.380678    1\n 0.964312    1\n-0.703558    1\n            ..\n-0.384447    1\n 0.172968    1\n-0.221997    1\n 0.133441    1\n-0.343758    1\n-0.897193    1\n-0.525859    1\n-0.226437    1\n-0.552760    1\n-1.991686    1\n 0.517877    1\n 0.659020    1\n 1.680185    1\n 0.155123    1\n-0.788438    1\n-1.364535    1\n 0.034736    1\n 0.494853    1\n 1.113248    1\n-1.449296    1\n 1.123138    1\n-0.747243    1\n-0.429054    1\n-0.567881    1\n-0.476616    1\n-2.630239    1\n 0.084506    1\n 1.250732    1\n 0.071242    1\n-0.432580    1\nName: a, dtype: int64'

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

.value_counts() 给出截断的结果的相关文章

numpy python 中的“AttributeError：'matrix'对象没有属性'strftime'”错误

我有一个维度为 72000 1 的矩阵该矩阵涉及时间戳我想使用 strftime 如下所示 strftime d m y 为了得到像这样的输出 11 03 02 我有这样一个矩阵 M np matrix timestamps 我使用了
在 python 3 中使用子进程

我使用 subprocess 模块在 python 3 中运行 shell 命令这是我的代码 import subprocess filename somename py in practical i m using a real fil
cv2.drawContours() - 取消填充字符内的圆圈（Python，OpenCV）

根据 Silencer的建议我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
Python 使用 Gstreamer 访问 USB 麦克风时遇到问题，以便在 Raspberry Pi 上使用 Pocketsphinx 执行语音识别

所以Python的表现就好像它根本听不到我的麦克风发出的任何声音问题就在这里我有一个Python 2 7 假设使用的脚本Gstreamer通过以下方式访问我的麦克风并为我进行语音识别口袋狮身人面像我在用着脉冲音频我的设备是树莓派我的
如何在Python中高效地添加稀疏矩阵

我想知道如何在Python中有效地添加稀疏矩阵我有一个程序可以将大任务分解为子任务并将它们分配到多个 CPU 上每个子任务都会产生一个结果一个 scipy 稀疏矩阵格式为 lil matrix 稀疏矩阵尺寸为 100000x50
根据 Pandas 中的列表对多列进行排序

感谢有关如何根据 pandas 中的倍数列表对给定多列进行排序的任何提示如下所示 import pandas as pd sort a a d e sort b s1 s3 s6 sort c t1 t2 t3 df pd DataFra
如何使用正则表达式在 pandas 数据框中选择一行以及包含特定子字符串的行后面的固定行数

Problem 我有一个 pandas 数据框我试图从中提取特定行我感兴趣的行是包含日期的行以及紧随日期行之后的行重要的是我想将信息从日期后面的行移动到包含日期的行中的新列通过这样做我将在同一行上获得一个人的信息需要明确
如何使用 javascript/jquery/AJAX 调用 Django REST API？

我想使用 Javascript jQuery AJAX 在前端调用 Django Rest API 请求方法是 POST 但当我看到 API 调用它的调用 OPTIONS 方法时所以我开始了解access control allow o
Pandas：如何将数据框插入 Clickhouse

我正在尝试将 Pandas 数据框插入 Clickhouse 这是我的代码 import pandas import sqlalchemy as sa uri clickhouse default localhost default ch
如何使用 Bokeh 动态隐藏字形和图例项

我正在尝试在散景中实现复选框其中每个复选框应显示隐藏与其关联的行我知道可以通过图例来实现这一点但我希望这种效果同时在两个图中发生此外图例也应该更新在下面的示例中出现了复选框但不执行任何操作我显然不明白如何更新用作源的数据
如何从 JSON 响应重定向？

所以我尝试使用 Flask 和 Javascript 上传器 Dropzone 上传文件并在上传完成后重定向文件上传正常但在烧瓶中使用传统的重定向 return redirect http somesite com 不执行任何操作页面
如何在 Django 中使用基于类的视图创建注册视图？

当我开始使用 Django 时我几乎使用 FBV 基于函数的视图来处理所有事情包括注册新用户但当我更深入地研究项目时我意识到基于类的视图通常更适合大型项目因为它们更干净且可维护但这并不是说 FBV 不是无论如何我将整个项目
如何在 Azure 数据工厂 - Databricks 中使用 continuation_token 获取 ADF Pipeline 运行详细信息的下一页？

我在用 adf client pipeline runs query by factory resourceGroupName 工厂名称过滤器参数的方法azure mgmt datafactory DataFactoryManageme
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
Python：我不明白 sum() 的完整用法

当然我明白你使用 sum 与几个数字然后它总结所有但我正在查看它的文档我发现了这一点 sum iterable start 第二个参数 start 的作用是什么这太尴尬了但我似乎无法通过谷歌找到任何示例并且对于尝试学习该语言的
Werkzeug 中的线程和本地代理。用法

首先我想确保我正确理解了功能的分配分配本地代理功能以通过线程内的模块包共享变量对象我对吗其次用法对我来说仍然不清楚也许是因为我误解了作业我用烧瓶如果我有两个或更多模块 A B 我想将对象C从模块A导入到模块B 但我
Python对象初始化性能

我只是做了一些快速的性能测试我注意到一般情况下初始化列表比显式初始化列表慢大约四到六倍这些可能是错误的术语我不确定这里的行话例如 gt gt gt import timeit gt gt gt print timeit timeit
附加两个具有相同列、不同顺序的数据框

我有两个熊猫数据框 noclickDF DataFrame 0 123 321 0 1543 432 columns click id location clickDF DataFrame 1 123 421 1 1543 436 colu
Python问题：打开和关闭文件返回语法错误

大家好我发现了这个有用的 python 脚本它允许我从网站获取一些天气数据我将创建一个文件和其中的数据集有些东西不起作用它返回此错误 File
操作错误：(sqlite3.OperationalError) SQL 变量太多，同时将 SQL 与数据帧一起使用

我有一个熊猫数据框如下所示 activity User Id 0 VIEWED MOVIE 158d292ec18a49 1 VIEWED MOVIE 158d292ec18a49 2 VIEWED MOVIE 158d292ec18a4

随机推荐

如何在c中将日期时间转换为unix时间戳？

场景是我使用 libexif 获取格式为 YYYY MM DD HH MM SS 的日期时间为了最大限度地减少节省成本我想将日期时间转换为unix时间戳或类似的值只需要64位或32位 c 有什么明确的方法吗你可以尝试组合使用str
.net core PGP加密解密

上遇到错误void Encryption public void Encryption region PGP Encryption PgpEncryptionKeys encryptionKeys new PgpEncryptionKeys
如何以人类可读的方式打开 Java .class 文件？

我试图弄清楚 Java applet 类文件在幕后的作用用记事本或文本板打开它只会显示一堆官样文章有什么方法可以将其恢复为可读的格式以便我可以尝试弄清楚它在做什么环境安装了 VS 2008 的 Windows jd gui htt
FFMPEG - 以特定时间间隔在视频上叠加多个视频

我想以指定的时间间隔将多个视频叠加在单个视频上尝试过不同的解决方案但它不会像我一样工作我使用下面的命令将视频叠加在视频上 String cmdWorking3 new String i yourRealPath i gifVideoF
自动链接属性与实际链接不同的文本（setAutoLinkMask）

例如 TextView tv TextView this findViewById R id tv tv setAutoLinkMask Linkify ALL tv setText visit website http www googl
在 IIS7 上将多个域指向一个网站

这与 SEO 没有任何关系请不要发布任何有关 SEO 排名的内容因为它不是这里的一个因素我有2个网址 old websitename com 和 new websitename com 我需要在一定的时间内支持这两个 url 而不是在
通过Python中的selenium驱动程序将图像导入谷歌表单

我正在尝试将图像导入谷歌表单我无法通过 xpath 将密钥传递给元素看来这是一个隐藏的元素我尝试执行脚本来取消隐藏它但没有成功也尝试过这个解决方案如何使用 Selenium WebDriver python 访问隐藏的文件上传字
C++ 中的 Stringstream 解析单词和数字字符串

我有这样的字符串 123加43次7 其中数字后面跟着字典中的单词我知道我可以使用以下命令提取 int numbers gt gt 操作员 StringStream gt gt number 我可以拿到号码然而 Stream 中仍然有该号
将 JFrame 方向设置为从右到左！

为了从右到左对齐我的 JFrame 我使用 setComponentOrientation ComponentOrientation RIGHT TO LEFT 但这仅当我使用 JFrame 的以下样式装饰时才有效 public cla
如何使用 JaCoCo 忽略内部/嵌套类？

我试图忽略一些生成的类并且这些类被很好地忽略但是如果这些类具有内部类则尽管父类被排除但这些类仍然会被包含在内这是我的配置
Asp.Net 3.5 路由到 Web 服务？

我一直在寻找一种路线http www example com WebService asmx http www example com WebService asmx to http www example com service http
PhoneGap支持普通网络吗？

phoneGap是否支持普通网页如果支持的话我可以给我一个可以浏览的链接吗 thanks sri 当然它可以加载到您现有的 UIWebView 实例中或者加载到 ChildBrowser 中plugin http github com
在 vim 中全局追加到具有匹配术语的行

我确信这很容易我只是缺少一两个字符我需要在文件中搜索特定术语当找到它时我需要在该行添加一些内容我想对比赛的每一行都这样做要执行一次我可以这样做 Thing to find s Stuff to append 简单的如果我的
Java SSLHandshakeException：没有共同的密码套件

我正在尝试使用 Java SSLSockets 将安全性应用于简单的聊天应用程序我创建了一个自签名 CA 并用它签署了两个证书全部使用 RSA 密钥一个用于服务器一个用于客户端之后我将证书导入到服务器的密钥库和客户端的另一个密钥
OS X 下 JRE 8 的 /lib/security 文件夹在哪里？ [复制]

这个问题在这里已经有答案了我正在 OS X 下从 Java JRE 8 搜索文件夹 lib security 在 Windows 下 fodler 位于 java 安装目录的子文件夹 lib security 中例如 C Program
ObservationCollection 使用 MVVM 架构在 PCL 内的 ViewModel 中实现 ISupportIncrementalLoading 以支持 WinRT 和 WP8/WinPRT

我的 ViewModel 位于 PCL 内因为我正在并行开发 Windows 8 1 和 Windows Phone 应用程序我的 ViewModel 中有一个作为 ObservableCollection 的内容列表我在 Windo
深入学习 C# 表达式树的最佳资源是什么？

当我第一次输入这个问题时我这样做是为了找到重复的问题我确信一定有人已经问过这个问题我的计划是关注那些重复的链接而不是发布这个问题但据我所知这个问题以前没有被问过它没有出现在相关问题列表中您找到了哪些用于深入了解 C 表达
Git 文件超出了符号链接范围

我遇到了一个问题 Git 认为文件超出了符号链接的范围因此无法对其进行版本控制但它似乎是一个真实的文件 root r1 h stat f conf core site xml File conf core site xml ID 5c7
AQL 构建域对象不返回结果

我遇到了一个问题即使用 AQL 时无法返回对构建域对象进行的任何查询当我进行以下卷曲时 curl X GET H X JFrog Art Api myArtifactroyKey H Cache Control no cache htt
.value_counts() 给出截断的结果

我有一个 Excel 文件其中有一列包含多个单词我正在尝试计算每个单词出现的频率所以如果我有一个清单 Labels a a b b c c c 输出应该是 c 3 b 2 a 2 我正在使用以下代码片段 import pandas a

.value_counts() 给出截断的结果

.value_counts() 给出截断的结果 的相关文章

随机推荐

热门标签

.value_counts() 给出截断的结果的相关文章