pandas：使用不带引号的文字选项卡编写制表符分隔的数据框

2023-11-25

我必须为遗传学软件重新格式化数据，该软件需要将每一列分成两列，例如0-> G G; 1-> A G; 2 -> A A;。输出文件应该以制表符分隔。我正在尝试在 pandas 中做到这一点：

import csv
import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randint(0,3, size = (10,5)), 
                  columns=[ chr(c) for c in range(97, 97+5) ])

def fake_alleles(x):
    if x==0:
        return "A\tA"
    if x==1:
        return "A\tG"
    if x==2:
        return "G\tG"

plinkpast6 = df.applymap(fake_alleles)
plinkpast6.to_csv("test.ped", sep="\t", quoting=csv.QUOTE_NONE)

这给了我一个错误Error: need to escape, but no escapechar set。还有其他方法可以做到吗pandas?

sep="\t"正在尝试获取数据帧行的每个元素并插入"\t"之间。问题是有"\t"在元素中，它令人困惑。它想让你逃离那些"\t"存在于元素中，而你却没有。我怀疑您希望最终输出为 6 列。

尝试这个：

import csv
import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randint(0,3, size = (10,20)))

def fake_alleles(x):
    if x==0:
        return "A\tA"
    if x==1:
        return "A\tG"
    if x==2:
        return "G\tG"

plinkpast6 = df.iloc[:,:3].applymap(fake_alleles)
plinkpast6 = plinkpast6.stack().str.split('\t', expand=True).unstack()
plinkpast6.to_csv("test.ped", sep="\t", quoting=csv.QUOTE_NONE)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

NumPy

DataFrame

pandas：使用不带引号的文字选项卡编写制表符分隔的数据框的相关文章

Tensorflow 可变图像输入大小（自动编码器、放大......）

Edit WARNING不建议使用不同图像大小的图像因为张量需要具有相同的大小才能实现并行化我一直在寻找解决方案了解如何使用不同大小的图像作为神经网络的输入 Numpy 第一个想法是使用numpy 然而由于每个图像的大小不同我无法
python - 是否可以扩展 xml-rpc 可以序列化的事物集？

我看到几个问题询问如何发送numpy ndarray通过 xml rpc 调用这不能开箱即用因为正如 xml rpc 中所述docs https docs python org 2 library xmlrpclib html 有一组固
在python中将文本文件解析为列表

我对 Python 完全陌生我正在尝试读取包含单词和数字组合的 txt 文件我可以很好地读取 txt 文件但我正在努力将字符串转换为我可以使用的格式 import matplotlib pyplot as plt import num
即使使用 .loc[row_indexer,col_indexer] = value 时也会设置 WithCopyWarning

这是我的代码中得到的行之一SettingWithCopyWarning value1 Total Population value1 Total Population replace to replace value 4 然后我将其更改为
可以在 TensorFlow 中使用排名相关作为成本函数吗？

我正在处理偶尔充满异常值的极其嘈杂的数据因此我主要依靠相关性来衡量我的神经网络的准确性是否可以明确使用诸如等级相关性斯皮尔曼相关系数之类的东西作为我的成本函数到目前为止我主要依赖 MSE 作为相关性的代理我现在面临三个主要障碍
Paramiko - 使用私钥连接 - 不是有效的 OPENSSH 私钥/公钥文件

我正在尝试找到解决方案但无法理解我做错了什么在我的 Linux 服务器上我运行了以下命令 ssh keygen t rsa 这产生了一个id rsa and id rsa pub file 然后我将它们复制到本地并尝试运行以下代码 s
Pandas重置索引未生效[重复]

这个问题在这里已经有答案了我不确定我在哪里误入歧途但我似乎无法重置数据帧上的索引当我跑步时test head 我得到以下输出正如您所看到的数据帧是一个切片因此索引超出范围我想做的是重置该数据帧的索引所以我跑test rese
带图像的简单 GUI [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我试图在简单的 GUI 上显示一些卡
为什么 Python 中的“pip install”会引发语法错误？

我正在尝试使用 pip 安装软件包我试着跑pip install从Python shell 但我得到了SyntaxError 为什么我会收到此错误如何使用 pip 安装软件包 gt gt gt pip install selenium
Python igraph：从图中删除顶点

我正在使用安然电子邮件数据集并尝试删除没有 enron com 的电子邮件地址即我只想拥有安然电子邮件当我尝试删除那些没有 enron com 的地址时一些电子邮件由于某些原因被跳过下面显示了一个小图其中顶点是电子邮件地址这是
创建一个类似于 Tkinter 的表

我希望创建类似于 Tkinter 中的表格的东西但它不一定是这样的例如我想创建标题 Name1 Name2 Value 并在每个标题下面有几个空白行然后我希望稍后用我计算的值或名称的字符串值填充这些行因此是标签对于 Name2
更改 pandas 中多个日期时间列的时区信息

有没有一种简单的方法可以将数据帧中的所有时间戳列转换为本地任何时区不是逐列进行吗您可以有选择地将转换应用于所有日期时间列首先选择它们select dtypes https pandas pydata org pandas docs
如何使用Python的super()来更新父值？

我对继承很陌生之前所有关于继承和 Python 的 super 函数的讨论都有点超出我的理解我当前使用以下代码来更新父对象的值 usr bin env python test py class Master object mydata
为什么实现 __iter__ 的对象不被识别为可迭代的？

假设您使用包装对象 class IterOrNotIter def init self self f open tmp toto txt def getattr self item try return self getattribute
Scipy 稀疏 Cumsum

假设我有一个scipy sparse csr matrix代表下面的值 0 0 1 2 0 3 0 4 1 0 0 2 0 3 4 0 我想就地计算非零值的累积和这会将数组更改为 0 0 1 3 0 6 0 10 1 0 0 3 0 6
为什么我们应该在 def __init__(self, n) -> None: 中使用 -> ？

我们为什么要使用 gt in def init self n gt None 我读了以下摘录来自 PEP 484 https www python org dev peps pep 0484 the meaning of annotatio
全局变量是 None 而不是实例 - Python

我正在处理Python 中的全局变量代码应该可以正常工作但是有一个问题我必须使用全局变量作为类的实例Back 当我运行应用程序时它说 back is None 这应该不是真的因为第二行setup 功能 back Back Back
如何在sphinx中启用数学？

我在用sphinx http sphinx pocoo org index html与pngmath http sphinx pocoo org ext math html module sphinx ext pngmath扩展来记录我的代
异步和协程与任务队列

我一直在阅读有关 python 3 中的 asyncio 模块的内容以及更广泛地了解 python 中的协程的内容但我不明白是什么让 asyncio 成为如此出色的工具我的感觉是你可以用协程做的所有事情通过使用基于多处理模块例如
来自 django 教程 was_published_recently.admin_order_field = 'pub_date'

From Django 教程 https www jetbrains com help pycharm 2017 1 creating and running your first django project html d28041e21

随机推荐

谷歌浏览器和火狐浏览器缓存 DNS 记录多长时间

多长时间Firefox and Chrome cache DNS记录在自己的浏览器中DNS缓存他们尊重吗TTL 我认为它是重复的Firefox 使 DNS 缓存失效它有两个配置值Firefox network dnsCacheExp
HTML 源代码中锚点之间的新线会在浏览器中创建空白空间 [重复]

这个问题在这里已经有答案了可能的重复如何消除内联元素之间的空格的可见性我通常将源代码格式化为易于人类阅读据我所知浏览器会删除任何 n t来自源的字符因此它们不会进入渲染的 html 今天我构建了一个菜单在渲染的 html 中的
fopen无法打开文件的原因是什么

我有以下代码我试图打开一个文本文件 char frd 32 word list txt FILE rd fopen frd rb if rd std cout lt lt Coudn t open file t lt
阻止来源为“http://localhost:8084”的框架访问跨源框架

我正在尝试打印由 jspdf 生成并加载到 iframe 上的 pdf 但收到以下错误消息 DOMException 阻止了具有原点的框架 http 本地主机 8084 从访问跨源框架这是我的代码 function open var pd
单元测试帮助。如何测试控制台的消息输出？

我是单元测试的新手如何检查控制台输出我有 namespace XXShapes public abstract class XXShape public virtual void DrawXXShape Console WriteLin
在 try catch 中使用 Throwable 和 Exception 之间的区别[重复]

这个问题在这里已经有答案了有时我看到 try catch Throwable e 有时 try catch Exception e 有什么不同通过捕捉Throwable它包括子类化的东西Error 通常您不应该这样做除非在线程的最
用于条件绑定的 swift 2 初始值设定项必须具有可选类型，而不是“UIImage”

更新我的 xcode 以运行 swift 2 后它给了我这两个我很难解决的错误 Error 1无法为 String AnyObject 类型的值添加下标索引类型为 String Code let image UIImage editin
这些频段过去是靠肉眼判断的，那么如何以编程方式来判断呢？

操作员过去常常检查频谱了解位置和width每个峰值并判断该谱图所属的部分在新的方式中图像由相机捕获到屏幕上并且每个带的宽度必须以编程方式计算旧系统分光镜 gt 人眼新系统分光镜 gt 相机 gt 程序有什么好的方法可以计算
按索引列表拆分字符串

我想按索引列表拆分字符串其中拆分段以一个索引开始并在下一个索引之前结束 Example s long string that I want to split up indices 0 5 12 17 parts s index for
二叉树问题。检查相似形状

嗨我被困在这样做不知道该怎么做如果我有两个二叉树我如何检查它们是否具有相同的形状只要树结构相等节点中的数据并不重要关于如何解决这个问题有什么想法吗您可以通过递归轻松地做到这一点下面的代码之所以有效是因为当且仅当两个非空树
Scala - 新与对象扩展

使用 new 运算符定义对象与通过扩展类定义独立对象有什么区别更具体地说给定类型class GenericType 有什么区别val a new GenericType and object a extends GenericType
从 Linux shell 中的“ftp”命令获取退出状态代码

我需要从命令行程序检索退出状态代码不用担心我用了但对于 ftp 即使它没有连接它也会打开 ftp shell 所以我无法理解连接尚未发生尝试这段代码来理解 bin sh ftp 1234567 OUT if OUT eq 0 th
在 UI 测试我的 SwiftUI 应用程序时如何访问 VStack

我有一个VStack代码依赖于 onTapGesture方法像这样的东西 VStack if imageShow Image image1 else Image image2 onTapGesture imageShow toggle 我
FCM 与 AWS SNS

我在用AWS我的 android 项目的资源我计划为我的项目添加推送通知服务AWS SNS 没有什么问题让我很困扰我没有发现任何与这些相关的问题除了一两个但解释不清楚的问题 1 Does AWS支持FCM SNS与一起工作GCM 但
C# 从数据库中的表填充组合框

我有一个名为的组合框combobox1 我想用它来填充它id作为价值和Name作为显示名称我搜索并阅读了一些教程发现此代码可在表单加载事件中使用但它不会填充列表我看到一个空的下拉菜单对我错在哪里有什么想法吗在我的数据库类中我有
使用 angular2 在同一路由器出口中加载多个组件

我的 angular2 应用程序的根组件有以下模板
如何在 JavaScript 中更改鼠标悬停时字母的颜色

这是我的代码 document ready function var letters p text for var letter of letters letter wrap span class x span x hover color
Flyway 找不到类路径：db/migrations

我现在刚刚在 Intellij 中启动了一个新项目使用 Spring Boot 版本 2 1 3 和 Flyway 5 2 4 以及 Java 11 尝试启动我的项目后我得到 Caused by org springframework
LibGDX：过滤缩放的TextureRegion

我有几个具有不同状态的不同纹理的对象所以我使用TextureAtlas用TexturePacker制作并调整大小TextureRegion我需要它的地方我必须调整大小因为我不仅要尝试支持 720p 和 1080p 而且我的一些对象是
pandas：使用不带引号的文字选项卡编写制表符分隔的数据框

我必须为遗传学软件重新格式化数据该软件需要将每一列分成两列例如0 gt G G 1 gt A G 2 gt A A 输出文件应该以制表符分隔我正在尝试在 pandas 中做到这一点 import csv import pandas a

pandas：使用不带引号的文字选项卡编写制表符分隔的数据框

pandas：使用不带引号的文字选项卡编写制表符分隔的数据框 的相关文章

随机推荐

热门标签

pandas：使用不带引号的文字选项卡编写制表符分隔的数据框的相关文章