连接 pandas 数据框中的元组列表

2023-12-11

我想加入数据框中的元组列表。 我尝试了几种在数据框中执行此操作的方法joinlambda

import pandas as pd
from nltk import word_tokenize, pos_tag, pos_tag_sents

data = {'Categories': ['animal','plant','object'],
    'Type': ['tree','dog','rock'],
        'Comment': ['The NYC tree is very big', 'NY The cat from the UK is small',
                    'The rock was found in LA.']}
def posTag(data):
    data = pd.DataFrame(data)
    comments = data['Comment'].tolist()
    taggedComments = pos_tag_sents(map(word_tokenize,comments))
    data['taggedComment'] = taggedComments
    print data['taggedComment']
    data['taggedComment'].apply(lambda x: (' '.join(x)))
    return data
taggedData = posTag(data)
print data

其他一些方法tuple我尝试过的加入有:

(' '.join(['_'.join(x) for x in data['taggedComment']]))
 [''.join(x) for x in data['taggedComment']]
 ['_'.join(str(x)) for x in data['taggedComment']]

无论我做什么,我都会遇到同样的错误。

TypeError: sequence item 0: expected string, tuple found

对于每个列表,我想要的回应

[('A', 'B'),  ('B', 'C'),  ('C', 'B')]

在数据框中到 outPutFile

'A_B B_C C_B'

关于出了什么问题有什么建议吗?


您可以使用双list comprehension并将输出分配给列后面:

所以而不是:

data['taggedComment'].apply(lambda x: (' '.join(x)))

在你的中使用以下内容posTag(data) method:

data['taggedComment'] = [' '.join(['_'.join(y) for y in x]) for x in data['taggedComment']] 


taggedData = posTag(data)
print (taggedData)
  Categories                          Comment  Type  \
0     animal         The NYC tree is very big  tree   
1      plant  NY The cat from the UK is small   dog   
2     object        The rock was found in LA.  rock   

                                       taggedComment  
0       The_DT NYC_NNP tree_NN is_VBZ very_RB big_JJ  
1  NY_NNP The_DT cat_NN from_IN the_DT UK_NNP is_...  
2  The_DT rock_NN was_VBD found_VBN in_IN LA_NNP ._. 

全部一起:

def posTag(data):
    data  = pd.DataFrame(data)
    comments = data['Comment'].tolist()
    print (pos_tag_sents(map(word_tokenize, comments)))

    taggedComments =  pos_tag_sents(map(word_tokenize,  comments))
    data['taggedComment'] = [' '.join(['_'.join(y) for y in x]) for x in taggedComments]
    return data

taggedData = posTag(data)
print (taggedData)

  Categories                          Comment  Type  \
0     animal         The NYC tree is very big  tree   
1      plant  NY The cat from the UK is small   dog   
2     object        The rock was found in LA.  rock   

                                       taggedComment  
0       The_DT NYC_NNP tree_NN is_VBZ very_RB big_JJ  
1  NY_NNP The_DT cat_NN from_IN the_DT UK_NNP is_...  
2  The_DT rock_NN was_VBD found_VBN in_IN LA_NNP ._.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

连接 pandas 数据框中的元组列表 的相关文章

随机推荐

  • 在 RCP 应用程序中添加包资源管理器会导致丢失一些图标

    在我的 eclispe rcp 应用程序中 我添加了一个包资源管理器 添加了 org eclipse jdt ui 当我使用 rcp app 时 当我通过 新建项目向导 创建一个新项目以添加 常规项目 时 该项目已正确创建 但包资源管理器视
  • 文档写入给出了奇怪的输出

    我正在编写一个脚本来检测 jQuery 如果它不存在 则插入 Google CDN 版本和本地后备 不要问为什么 这不是我的想法 问题是当我尝试执行文档时 write 我得到一个奇怪的输出 document write
  • git word-diff-regex 可以处理多行更改吗?

    考虑一个像这样的简单文件 承诺 foo Edited bar 现在 当我跑步时git diff word diff regex a z 它给了我 foo bar 所以 这表明这个词foo已被替换为bar 请注意 分号未标记为已更改 没关系
  • 无法解析:com.android.support:design-v7:27.1.1

    我使用的是Android Studio 3 1 3 Gradle 构建同步失败 我使用了以下方法 但没有用 如果有任何解决方案请告诉我 maven url https maven google com 使重启和缓存无效 multiDexEn
  • 如何在 Android 中的 Facebook 页面墙上发帖?

    您好 我想发布任何消息或链接到 Facebook 页面 我尝试过的是这个 void postInfo try Bundle parameters new Bundle parameters putString message message
  • 使用 angularjs 从服务器下载文件

    我正在寻找一种方法来让用户选择服务器上存在的文件并使用 angularjs 下载它 我发现这段代码不起作用 所以有人有一种正确的方法吗 var content file content var blob new Blob content t
  • PowerShell - 如何使用 $_.Key 作为 $object 属性?

    我有一个像这样的哈希表 hash One One Two Two Three Three 这样做是行不通的 hash getEnumerator foreach object Key Value 然而这句话 hash getEnumerat
  • 使用 gnu clisp 运行 shell 命令

    我正在尝试为 clisp 创建一个 系统 命令 其工作原理如下 setq result system pwd now result is equal to my path here 我有这样的事情 defun system cmd ext
  • json 序列化器 NullValueHandling 不使用 datamember 属性

    在我的 Web api 项目中 现在我正在跳过 null 值 因此 返回 json 会忽略 null 值并打印属性 在 Global asax 文件中 manage the null in the response var json Glo
  • 为Windows窗体中禁用的控件注册MouseEnter/MouseLeave事件?

    我想为禁用的按钮注册 MouseEnter MouseLeave 事件 尽管它确实适用于已启用的按钮 但它不起作用 Enable Disable controls on form load EnableDisableControls Loa
  • C# 中长时间运行任务的进度条

    我的应用程序运行一些可能需要很长时间的数据库查询 在执行这些查询时 我的应用程序似乎冻结了 并且看起来应用程序已停止工作 我需要使用进度条来避免这个问题 但我不确定如何预测查询执行所需的时间 运行查询的代码如下 private void C
  • MySQL加载数据文件-加速?

    有时 我必须为一个项目重新导入数据 从而将大约360万行读取到MySQL表中 目前是InnoDB 但我实际上并不局限于这个引擎 加载数据到文件 已被证明是最快的解决方案 但它有一个权衡 在没有密钥的情况下导入时 导入本身大约需要 45 秒
  • Laravel Controller 不存在,尽管它明显存在

    我收到的错误是控制器不存在 即使我知道它存在 这是代码 路线 php Route get mdpay template array uses gt templateController index templateController bl
  • Angular http get,从 spring mvc 服务器下载文件

    我正在使用 apache commons IOUtils 复制方法将文件从服务器发送到 angularjs 这是我的控制器 RequestMapping value download method RequestMethod GET pub
  • 如何将兰伯特圆锥等角光栅投影更改为纬度 R

    我有一个从 netcdf 获得的栅格 该栅格位于 兰伯特圆锥等角投影 library meteoForecast wrf temporary lt getRaster temp day Sys Date frames complete re
  • 静态下拉到动态下拉 Coldfusion

    我是堆栈溢出的新手 我需要创建一个静态下拉列表 然后根据在静态下拉列表中选择的值创建动态下拉列表 只是 Coldfusion 和 html 没有其他花哨的东西 因此 从第一个下拉菜单中 用户可以选择 颜色 身份证 官员 学校 然后点击 继续
  • 在android中的gridview中拖放图像

    我正在开发一个示例 Android 应用程序来了解 Android 中的拖放操作 在应用程序启动时 我在网格视图上显示一些图像 现在我需要一次将一张图像拖到另一张图像的位置 将一个图像放到另一个图像上后 图像应该交换位置 我怎样才能实现它
  • 如何使所有 Core Data 对象继承自我的类而不是 NSManagedObject?

    我创建了自己的类 我希望使用 Core Data 而不是NSManagedObject interface MyManagedObject NSManagedObject id delegate 我不能使用类别 因为它声明了一个 ivar
  • 捕获组和间隔量词在 sed 正则表达式中不起作用

    在 Linux 中我可以运行命令 sed r s 2 0 1 2 filename 但是 当在 UNIX 中运行时 我不能这样做 r所以我尝试了 sed s 2 0 1 2 filename 我收到以下错误 sed command garb
  • 连接 pandas 数据框中的元组列表

    我想加入数据框中的元组列表 我尝试了几种在数据框中执行此操作的方法join与lambda import pandas as pd from nltk import word tokenize pos tag pos tag sents da