使用 pd.read_clipboard 复制多索引数据帧？

2024-03-15

Given a 像这样的数据框 https://stackoverflow.com/questions/17921010/how-to-query-multiindex-index-columns-values-in-pandas:

          C
A   B      
1.1 111  20
    222  31
3.3 222  24
    333  65
5.5 333  22
6.6 777  74

我如何在使用中阅读它pd.read_clipboard？我试过这个：

df = pd.read_clipboard(index_col=[0, 1])

但它会抛出一个错误：

ParserError: Error tokenizing data. C error: Expected 2 fields in line 3, saw 3

我怎样才能解决这个问题？

UPDATE:现在它解析剪贴板 - 即不需要事先保存它

def read_clipboard_mi(index_names_row=None, **kwargs):
    encoding = kwargs.pop('encoding', 'utf-8')

    # only utf-8 is valid for passed value because that's what clipboard
    # supports
    if encoding is not None and encoding.lower().replace('-', '') != 'utf8':
        raise NotImplementedError(
            'reading from clipboard only supports utf-8 encoding')

    from pandas import compat, read_fwf
    from pandas.io.clipboard import clipboard_get
    from pandas.io.common import StringIO
    data = clipboard_get()

    # try to decode (if needed on PY3)
    # Strange. linux py33 doesn't complain, win py33 does
    if compat.PY3:
        try:
            text = compat.bytes_to_str(
                text, encoding=(kwargs.get('encoding') or
                                get_option('display.encoding'))
            )
        except:
            pass

    index_names = None
    if index_names_row:
        if isinstance(index_names_row, int):
            index_names = data.splitlines()[index_names_row].split()
            skiprows = [index_names_row]
            kwargs.update({'skiprows': skiprows})
        else:
            raise Exception('[index_names_row] must be of [int] data type')

    df = read_fwf(StringIO(data), **kwargs)
    unnamed_cols = df.columns[df.columns.str.contains(r'Unnamed:')].tolist()

    if index_names:
        idx_cols = df.columns[range(len(index_names))].tolist()
    elif unnamed_cols:
        idx_cols = df.columns[range(len(unnamed_cols))].tolist()
        index_names = [None] * len(idx_cols)

    df[idx_cols] = df[idx_cols].ffill()
    df = df.set_index(idx_cols).rename_axis(index_names)

    return df

测试没有索引名称的多索引 DF：

In [231]: read_clipboard_mi()
Out[231]:
          C
1.1 111  20
    222  31
3.3 222  24
    333  65
5.5 333  22
6.6 777  74

使用索引名称测试多索引 DF：

In [232]: read_clipboard_mi(index_names_row=1)
Out[232]:
          C
A   B
1.1 111  20
    222  31
3.3 222  24
    333  65
5.5 333  22
6.6 777  74

NOTE:

还没有经过充分测试
它不支持多级列
参见第 1 点；-)

NOTE2:请随意使用此代码或创建Pandas github 上的拉取请求 https://github.com/pandas-dev/pandas/pulls

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

clipboard

使用 pd.read_clipboard 复制多索引数据帧？的相关文章

Django 和 VirtualEnv 开发/部署最佳实践

只是好奇人们如何结合 virtualenv 部署 Django 项目更具体地说如何使生产虚拟环境与开发计算机正确同步我使用 git 进行 scm 但 git 存储库中没有 virtualenv 我应该这样做还是最好使用 pip fr
在 Matplotlib 中选择标记大小

我正在 matplotlib 中用方形标记绘制散点图如下所示我想实现这样的目标这意味着我必须调整标记大小和图形大小比例以使标记之间没有空白每个索引单元还应该有一个标记 x and y都是整数所以如果y从 60 到 100 应该
Python Ctypes：将返回的 C 数组转换为 python 列表，无需 numpy

我正在使用 Python Ctypes 来访问一些 C 库我连接到的函数之一返回const double 它实际上是一个双精度数组当我在Python中得到结果时如何将该数组转换为Python列表 C函数的签名 const double
如何使用Python中的or-tools解决累积旅行商问题？

累积旅行商问题 CTSP 的目标是最小化到达客户的时间总和而不是总旅行时间这与最小化总旅行时间不同例如如果一个人拥有无限的车辆车辆与位置数量相同并且目标是最大限度地减少到达位置的总时间则可以为每个位置发送一辆车因为这是满足所
Python 中的参数命名约定

对于形式参数密切相关的函数例如 def add two numbers n1 n2 return n1 n2 def multiply two numbers n1 n2 return n1 n2 如上所示为两个函数中的参数指定相同的名
Python：并行修改数组的简单方法

这个问题可能听起来很简单但作为 Python 并行化的新手我肯定会遇到困难我处理了 OpenMP for C 中的并行化问题这要容易得多我需要做的是并行修改矩阵的条目就是这样问题是我无法使用简单的 joblib 库来做到这一
Python 删除额外的特殊 unicode 字符

我正在 python 中处理一些文本它内部已经采用 unicode 格式但我想删除一些特殊字符并用更标准的版本替换它们我目前有一条看起来像这样的线路但它变得越来越复杂我发现它最终会带来更多麻烦 tmp infile lower r
TensorFlow 运算符重载

有什么区别 tf add x y and x y 在 TensorFlow 中当您使用以下命令构建图表时您的计算图表会有什么不同代替tf add 更一般地说有或者其他张量超载的操作如果至少有一个x or y is a tf Te
优化 Django Queryset for 循环

如何优化以下查询集 link goal for link in self child links all 我想摆脱 for 循环并只访问数据库一次我有以下代码 class Goal models Model name models Cha
ModuleNotFoundError：没有名为“pandas.io.formats.csvs”的模块

我正在尝试创建一个简单的 csv dataframe to csv psv file name encoding utf 8 header True sep doublequote True quoting csv QUOTE ALL in
在循环中动态添加方法时的范围问题

我有一个 API 用于分析我的锻炼数据我抓取的数据跑卫 http runkeeper com 的网站我的主类是一个子类pandas DataFrame 它基本上是表格数据的容器它支持按列名索引返回列值的数组我想根据数据中存在的
在 Django 视图中访问其他项目中的模型导致“表不存在”错误

基地项目结构 baseproject baseapp models py class BaseModel models Model 其他项目结构 project app views py urls py 项目 app views py im
Tensorflow“feed_dict”：对键值对使用相同的符号得到“TypeError：无法将 feed_dict 键解释为张量”

我正在使用构建线性回归的 Tensorflow 示例我的代码如下 import numpy as np import tensorflow as tf train X np asarray 3 3 4 4 5 5 6 71 6 93 4
如何使用包含 \n 的 .txt 创建一维列表？

我想读取一个文本文件并将文件的每个元素放入一个列表中而不是为文件中的每一行都有一个单独的列表例如如果文件是你好我的名字 Is Joe 我希望列表是你好我的名字是 Joe 而不是你好我的名字是乔这是我到目前为止所拥有的 d
如何在lxml，Python中将<转换为<？

有一个xml文件
TypeError: 'module' 对象不可调用错误 driver=webdriver("C:\\Python34\\Lib\\site-packages\\selenium\\webdriver\\chromedriver.exe")

我在 Pycharm 中遇到类似错误 Traceback most recent call last File C PycharmProjects DemoPyth PythonPack1 Prg1 py line 3 in
Python代码检测OS X El Capitan中的暗模式以更改状态栏菜单图标

我有目标 C 代码来检测暗模式以更改状态栏 NSDistributedNotificationCenter defaultCenter addObserver self selector selector darkModeChanged n
Python Flask 不更新图像[重复]

这个问题在这里已经有答案了这里有一些关于图像的 Flask 问题但没有一个能解决我的问题我有一个应用程序可以创建图像保存它然后显示它一次它应该多次执行此操作每次更改图像时它应该加载新图像它不是它只显示与其显示的文件名关
类型错误：“生成器”对象没有属性“__getitem__”

我编写了一个应该返回字典的生成函数但是当我尝试打印字段时出现以下错误 print row2 SearchDate TypeError generator object has no attribute getitem 这是我的代码 fro
使用和不使用 SciPy 计算 k 组合的数量

我对这个函数感到困惑combSciPy 的 http docs scipy org doc scipy 0 14 0 reference generated scipy misc comb html看起来比简单的 Python 实现要慢这

随机推荐

对关联数组的关联数组执行 foreach

假设我有这样的设置 var whatever new Array whatever a new Array whatever a a test1 whatever a b test2 whatever b new Array whateve
使用状态变量作为 SwiftUI 中函数的输入

我有两个文本字段用于更改两个 State 变量即startingMileage 和endingMileage 的值以及一个步进器用于更改名为fuelAdded 的第三个 State 变量的值我正在尝试使用用户的输入并进行计算来计算
圆角后可成形图像视图上的黑色边缘

After rounding the edges on my shapeable image view I still get black edges around the rounded edges 这是我的 xml
如何使画布轮廓成为透明 png 以实现悬停发光

是否可以自动为图像提供发光效果例如使用画布 jsfiddle http jsfiddle net LAS8L 88 canvas 标签必须省略透明并使其具有外发光
如何在流畅的nhibernate中将复合主键映射到外国？

我有以下表格 table A FOO PK CLIENT PK table B BAR PK CLIENT PK FK FOO FK PK gt 主键 FK gt 外键 A 和 B 之间存在一对多关系我不能简单地这样做 class AMa
Flutter - 自定义按钮点击区域

我正在构建一个 Flutter 应用程序其中屏幕的很大一部分将被圆形按钮占据我已经尝试了几种不同的方法来创建圆形按钮但我总是遇到同样的问题可点击区域实际上不是圆形的而是矩形的这是一个使用以下方法获得的示例FloatingAct
按任意键对元组列表进行排序

order w x a z object a object x object z object a object w 如何根据 order 提供的键列表按第二个元素对上面的元组列表进行排序 2013 年 11 月 18 日更新我发现了一个
将值加载到 Selectize.js 中

Problem 我有一个文本输入我选择它作为标签它可以很好地查询远程数据我可以使用它搜索甚至创建新项目并且一切正常使用选择 var select authorsearch selectize valueField AuthorId
使用 JavaScript 切换 CSS 类 - 错误

我正在尝试制作一个脚本当用户单击具有 burger nav img 类的图像时它会在另一个元素中切换 open 类我的代码是 HTML
Swing - 使用 getComponent() 更新所有 JButton

我正在制作一个井字棋游戏其中每个棋盘都由一个 JButton 代表当有人单击该按钮时文本将更改为 X 或 O 我正在编写一个重置函数它将所有按钮中的文本重置为我正在使用 getComponents 方法访问数组中的所有按钮我只是
为 GridView 的 PagerTemplate 动态生成页面链接按钮

从 MSDN 页面获取PagerTemplate of the GridView控制强调我的通常按钮控制添加到寻呼机模板中以执行寻呼操作当单击 CommandName 属性设置为 Page 的按钮控件时 GridView 控件将执行
是否可以在不使用 ApplicationContextAware 的情况下检索具有原型范围的 Spring bean

使用Spring 3 1 如果我想检索具有原型范围的 bean 即我每次都想要该类的不同实例是否可以在不使用 ApplicationContextaware 类的情况下检索该 bean 这就是我目前的做法 Component Qualif
ModuleNotFoundError：没有名为“建模”的模块

我对深度学习和 python 非常陌生我正在尝试重新创建该项目https github com Nagakiran1 Extending Google BERT as Question and Answering model and Ch
能否阻止单个应用程序的 Microsoft 错误报告？

我们有一个非托管 C 应用程序它利用第 3 方 API 来读取 CAD 文件对于某些损坏的 CAD 文件第 3 方库崩溃并导致我们的 EXE 崩溃因此我们的主应用程序是一个单独的 EXE 这样它就不会受到崩溃的影响然而我们最终
使用 java POI 插入表时 Open Office writer 崩溃

我正在尝试使用 open office 使用 apache poi 以 docx 格式插入表但是每次打开文件时文件都会崩溃 XWPFDocument document new XWPFDocument FileOutputStream o
单击浏览器的后退按钮时重定向到特定页面

这是一个有点菜鸟的问题但事实就是这样我有一个网站用户只能通过下一页和后退按钮从一个页面导航到另一个页面即有一个用户必须遵循的向导向导的一部分包含不同的页面一部分包含相同的页面但具有更改的 div 但从用户体验来看它是不同的页面
Stream_Copy_To_Stream() 的替代方案 php

我现在正在开发一个文件共享网站遇到了一个小问题我正在使用上传脚本 uploadify 它工作得很好但如果用户想要我希望上传的文件被加密现在我有可以执行此操作的工作代码如下所示但我的服务器只有 1GB 或内存并且使用strea
如何在 WooCommerce 3+ 中进行调试

我正在使用本教程为 Woocommerce 创建自定义运输方法https docs woocommerce com document shipping method api https docs woocommerce com docume
如何“重置”给定 HTML 元素的样式？

我正在开发一个可嵌入的 javascript 它将 HTML 元素插入未知页面我无法控制要插入 HTML 的页面的样式表问题是我插入的 HTML 会被页面错误地风格化我想防止这种情况发生确保我插入的元素是最不冗长和或资源密集的ex
使用 pd.read_clipboard 复制多索引数据帧？

Given a 像这样的数据框 https stackoverflow com questions 17921010 how to query multiindex index columns values in pandas C A B

使用 pd.read_clipboard 复制多索引数据帧？

使用 pd.read_clipboard 复制多索引数据帧？ 的相关文章

随机推荐

热门标签

使用 pd.read_clipboard 复制多索引数据帧？的相关文章