Pandas Dataframe 到带分隔符的字符串

2023-11-30

我想将数据框转换为字符串。这个话题如何将 pandas 数据框行转换为逗号分隔的字符串接近我想要的。此解决方案的唯一问题：我有一列“国家”，其中包含带有分隔符的字符串（例如，使用此解决方案，数据框正在转换为字符串，但我将“美国”变为“美国，州”）所以目前我只有以下代码：

df = df.to_string(index=False).split('\n')
df = [','.join(ele.split()) for ele in df]
df = '\r\n'.join(df)
df = df.encode('utf8')

但对于像这样的数据框：

data = [['United States', 10, 12], ['United Kingdom', 15, 25], ['France', 14, 18]] 
df = pd.DataFrame(data, columns = ['Country', 'Number1', 'Number2'])

我会有

b'Country,Number1,Number2\r\nUnited,States,10,12\r\n,United,Kingdom,15,25\r\nFrance,14,18'

代替：

b'Country,Number1,Number2\r\nUnited States,10,12\r\n,United Kingdom,15,25\r\nFrance,14,18'

目前我已经解决了很多问题：

df= df.replace('United,States', 'United States')

但这并不是一个很好的解决方案，因为每次有空间的新国家出现时，我都必须更新脚本

（最终目标是将 dataframe 转换为 utf-8 中的字符串，以便计算它的 md5 ，而不使用 df.to_csv() 并计算创建的文件的 md5 ，如果你有比这个技巧更好的方法，它也可以帮我）谢谢！

data = [['United States', 10, 12], ['United Kingdom', 15, 25], ['France', 14, 18]]
df = pd.DataFrame(data, columns = ['Country', 'Number1', 'Number2'])

df = df.to_csv(header=None, index=False).strip('\n').split('\n')
df_string = '\r\n'.join(df)  # <= this is the string that you can use with md5
df_bytes = df_string.encode('utf8')  # <= this is bytes object to write the file
print(df_bytes)

Use df_string for md5 and df_bytes写入文件。

df_bytes包含这个：

b'United States,10,12\r\nUnited Kingdom,15,25\r\nFrance,14,18'

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pandas Dataframe 到带分隔符的字符串的相关文章

ctypes 错误：libdc1394 错误：无法初始化 libdc1394

我正在尝试将程序编译为共享库我可以使用 ctypes 在 Python 代码中使用该库使用以下命令该库可以正常编译 g shared Wl soname mylib O3 o mylib so fPIC files pkg config
NumPy linalg.eig

我有这个烦人的问题但我还没有弄清楚我有一个矩阵我想找到特征向量所以我写 val vec np linalg eig mymatrix 然后我得到了 vec 我的问题是当我小组中的其他人对相同的矩阵 mymatrix 做同样的事情时
从 Python 下载/安装 Windows 更新

我正在编写一个脚本来自动安装 Windows 更新我可以将其部署在多台计算机上这样我就不必担心手动更新它们我想用 Python 编写这个但找不到任何关于如何完成此操作的信息我需要知道如何搜索更新下载更新并从 python 脚本安
从sklearn PCA获取特征值和向量

如何获取 PCA 应用程序的特征值和特征向量 from sklearn decomposition import PCA clf PCA 0 98 whiten True converse 98 variance X train clf f
ImportError：运行 jupyter Notebook 时没有名为 IPython.paths 的模块？

我通过以下方式安装了 jupyter usr local opt python bin python2 7 m pip install jupyter 这将安装 ipython 版本 4 1 2 但是当我运行 jupyter Notebo
如何在VIM中设置文件的正确路径？

每当我击中 pwd在 vim 中命令总是返回路径C Windows system32 即使我在桌面上的 Python 文件中所以每当我跑步时 python 命令返回 python can t open file Users myname
小部件之间的自定义信号

尝试将信号从一个 gtk EventBox 子级发送到另一个在 init HeadMode 第 75 行上出现错误类型错误未知信号名称消息发送 why usr bin env python coding utf8 import p
Python中列表中两个连续元素的平均值

我有一个偶数个浮点数的列表 2 34 3 45 4 56 1 23 2 34 7 89 我的任务是计算 1 和 2 个元素 3 和 4 5 和 6 等元素的平均值在 Python 中执行此操作的快捷方法是什么 data 2 34 3 45
如何使用 javascript/jquery/AJAX 调用 Django REST API？

我想使用 Javascript jQuery AJAX 在前端调用 Django Rest API 请求方法是 POST 但当我看到 API 调用它的调用 OPTIONS 方法时所以我开始了解access control allow o
CNTK 抱怨 LSTM 中的动态轴

我正在尝试在 CNTK 中实现 LSTM 使用 Python 来对序列进行分类 Input 特征是固定长度的数字序列时间序列标签是 one hot 值的向量 Network input input variable input dim
对使用 importlib.util 导入的对象进行酸洗

我在使用Python的pickle时遇到了一个问题我需要通过将文件路径提供给 importlib util 来加载一些 Python 模块如下所示 import importlib util spec importlib util sp
如何从 JSON 响应重定向？

所以我尝试使用 Flask 和 Javascript 上传器 Dropzone 上传文件并在上传完成后重定向文件上传正常但在烧瓶中使用传统的重定向 return redirect http somesite com 不执行任何操作页面
如何在Python中按AaB而不是ABa顺序对字符串进行排序

我正在尝试对字符串进行排序为 punnetsquare 制作基因型我目前的实现是 unsorted genotype ABaB sorted genotype sorted list unsorted genotype sorted s
Python Pandas：如何对组中的所有项目进行分组并为其分配 id？

我有 df domain orgid csyunshu com 108299 dshu com 108299 bbbdshu com 108299 cwakwakmrg com 121303 ckonkatsunet com 121303
Python：我不明白 sum() 的完整用法

当然我明白你使用 sum 与几个数字然后它总结所有但我正在查看它的文档我发现了这一点 sum iterable start 第二个参数 start 的作用是什么这太尴尬了但我似乎无法通过谷歌找到任何示例并且对于尝试学习该语言的
从列表python的单个列表中删除子列表

我已经经历过从列表列表中删除子列表 https stackoverflow com questions 47209786 removing sublists from a list of lists 但当我为我的数据集扩展它时它不适用于我
导入错误：无法导入名称“时间戳”

我使用以下代码在 python 3 6 3 中成功安装了 ggplot conda install c conda forge ggplot 但是当我使用下面的代码将其导入笔记本时出现错误 from ggplot import Impor
bs4 `next_sibling` VS `find_next_sibling`

我在使用时遇到困难next sibling 并且类似地与next element 如果用作属性我不会得到任何返回但如果用作find next sibling or find next 然后就可以了来自doc https www cru
操作错误：(sqlite3.OperationalError) SQL 变量太多，同时将 SQL 与数据帧一起使用

我有一个熊猫数据框如下所示 activity User Id 0 VIEWED MOVIE 158d292ec18a49 1 VIEWED MOVIE 158d292ec18a49 2 VIEWED MOVIE 158d292ec18a4
通过 Web 界面执行 python 单元测试

是否可以通过 Web 界面执行单元测试如果可以如何执行 EDIT 现在我想要结果对于测试我希望它们是自动化的可能每次我对代码进行更改时抱歉我忘了说得更清楚 EDIT 这个答案此时已经过时了 Use Jenkins https j

随机推荐

如何使用 Selenium 和 Python 查找与用户输入相关的元素？

以下是 HTML 结构 div class list div p class code 12345 p p class name abc p div div p class code 23456 p p class name bcd p d
openmp 在我的 mac 上以单线程运行

我正在尝试在 Mac 上使用 openmp 并行化程序但我无法使其成为多线程我尝试从源代码在 svn co 之后构建 llvm clang openmp 3 7 1 作为有记录的我也尝试过使用llvm 项目提供的 clang 和
将 WSDL 转换为其各自的 HTTP 绑定

我只是尝试根据 WSDL 提供的数据将 WSDl 转换为许多不同的 HTTP 请求我读过很多类似的问题但没有一个真正提供答案有人说用SOAPUI 我熟悉这个应用程序并使用它但我需要自己从 WSDL 创建这些 HTTP 请求有人说要
JSON 字符串中的反斜杠

我不熟悉这种格式 d Table pCol 12345 fCol jeff lCol Smith dId 1111111 tDate Date 1153033200000 0700 我在用着牛顿软件序列化我从 ASP Net Web 服务返
原子操作、std::atomic<> 和写入顺序

GCC 编译如下 include
返回指向对象的指针的函数调用是纯右值吗？

让我们想象一下这个函数 C get C c int offset return c offset 我想知道对此函数的调用是否被评估为纯右值 C array c 3 C c2 get array c 2 Is get array c 2 右值
我如何使用 com.itunes.plist 找到 itunes 媒体文件夹位置

我需要通过 com itunes plist 访问在 iTunes Preferences Advanced 中设置的 itunes 媒体文件夹位置请帮我 Thanks 媒体文件夹的位置存储在 alis 11345 音乐文件夹位置键下
C++ 类成员初始化顺序

我知道在一个class成员按照列出的顺序进行初始化这是否适用于将变量分组为public and privateETC 我的困惑是我无法弄清楚是否存在诸如private成员按照之前列出的顺序进行初始化public成员无论私有变量在类声明中
Deadline_timers 的非阻塞 boost io_service

阅读 boost asio deadline timer 的文档后似乎 io service run 和处理程序方法是在同一线程上调用的在后台线程上运行 io service 对象时是否有任何方法可以在一个线程上创建计时器为了好玩和
拉链常见问题

给定任何容器类型我们都可以形成以元素为中心的 Zipper 并且知道该结构是 Comonad 最近对此进行了精彩的详细探讨另一个堆栈溢出问题对于以下类型 data Bin a Branch Bin a a Bin a Leaf a de
通过 FetchContent 安装 protobuf 时如何使用 cmake 命令 protobuf_generate？

我正在使用 gRPC 编写客户端服务器要生成客户端服务器 protobuf 代码我需要运行 cmake 命令protobuf generate 如果我事先安装了 protobuf 我就可以访问该命令protobuf generate
Silverlight 4 和 Windows Phone 7 的 Bing 地图控件中的交互式图层

使用 Bing 地图控件时我的应用程序会添加一个叠加层在其上将位置标记绘制为椭圆形每个椭圆都连接到一个 Tap 处理程序该处理程序在 WP7 模拟器中按预期工作遗憾的是 HTC 硬件上的情况似乎并非如此地图本身似乎获取了所有输入
如何将 PHP 字符串传递到 Javascript 函数调用中？ [复制]

这个问题在这里已经有答案了可能的重复将 PHP 字符串传递给 Javascript 变量并转义换行符所以本质上我试图从 PHP 页面传递一个字符串作为 javascript 函数的参数 PHP 包含在脚本所在的页面中但它们位于两
带有行号的 pandas 堆栈

我有一个 Pandas DataFrame 示例 A B C D 0 0 441040 0 235533 0 899417 1 960367 1 0 701764 2 343389 1 293865 0 556737 2 0 511988
何时使用 L.TileLayer 与 L.tileLayer

我刚刚使用 Leaflet 为网站构建地图并注意到要添加平铺层至少可以使用两种方法 L TileLayer and L tileLayer 其名称仅因单个字符的大小写而异然而虽然这两种方法返回的对象都可以添加到由L map 返回的对象
PHP - CodeIgniter - 为 foreach() 提供的参数无效

我尝试使用 CodeIgniter 编写一个网站但 PHP 遇到问题我确信它是如此简单并且不会错但我不知道 bug 只是 CodeIgniter 的新手
Spring异常时事务回滚

我正在学习Spring 并且在Spring中的事务处理方面遇到了一些麻烦这是我的代码 Transactional rollbackFor Exception class public void createGroupStudent Stu
如何使用 purrr map 函数执行逐行 prop.tests 并将结果添加到数据帧？

我正在尝试解决 R 中的以下问题我有一个包含两个变量成功次数和总试验次数的数据框 A tibble 4 x 2 Success N
如何将国家/地区拨号代码放入 intlTelInput 中的括号中

我在我的网站上使用 intlTelInput 如何使用括号分隔拨号代码对于前这个插件的默认输出是 1202someNumber 我需要 1 202someNum 基于此处的文档表格 https github com jackocnr i
Pandas Dataframe 到带分隔符的字符串

我想将数据框转换为字符串这个话题如何将 pandas 数据框行转换为逗号分隔的字符串接近我想要的此解决方案的唯一问题我有一列国家其中包含带有分隔符的字符串例如使用此解决方案数据框正在转换为字符串但我将美国变为美国州

Pandas Dataframe 到带分隔符的字符串

Pandas Dataframe 到带分隔符的字符串 的相关文章

随机推荐

热门标签

Pandas Dataframe 到带分隔符的字符串的相关文章