python 从 tsv 文件链接一个列表

2023-12-15

我有这个 tsv 文件，其中包含一些链接路径，每个链接由“;”分隔我想用：

在下面的示例中，我们可以看到文件中的文本是分开的我只想通读最后一列，这是一条以“14th”开头的路径

6a3701d319fc3754    1297740409  166    14th_century;15th_century;16th_century;Pacific_Ocean;Atlantic_Ocean;Accra;Africa;Atlantic_slave_trade;African_slave_trade    NULL
3824310e536af032    1344753412  88     14th_century;Europe;Africa;Atlantic_slave_trade;African_slave_trade  3
415612e93584d30e    1349298640  138    14th_century;Niger;Nigeria;British_Empire;Slavery;Africa;Atlantic_slave_trade;African_slave_trade

我想以某种方式将路径分成这样的链：

['14th_century', 'Niger', 'Nigeria'....]

我如何读取文件并删除前 3 列，这样我只得到最后一列？

UPDATE:

我现在已经尝试过这个：

import re
with open('test.tsv') as f:
    lines = f.readlines()
for line in lines[22:len(lines)]:
    re.sub(r"^\s+", " ", line, flags = re.MULTILINE)
    e_line = line.split(' ')
    real_line = e_line[0]
    print real_line.split(';')

但问题是它不删除前 3 列？

如果第一个之间的分隔符只是一个空格而不是一系列空格或制表符，您可以这样做

with open('file_name') as f:
    lines = f.readlines()
for line in lines:
    e_line = line.split(' ')
    real_line = e_line[3]
    print real_line.split(';')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

line

chain

csv

python 从 tsv 文件链接一个列表的相关文章

在Python中从大文件中搜索单词列表

我是新蟒蛇我有一个单词列表和一个非常大的文件我想删除文件中包含单词列表中的单词的行单词列表按排序给出并且可以在初始化期间输入我正在努力寻找解决这个问题的最佳方法我现在正在进行线性搜索这花费了太多时间有什么建议么您可以使用i
使用 Django 将文件异步上传到 Amazon S3

我使用此文件存储引擎在上传文件时将文件存储到 Amazon S3 http code welldev org django storages wiki Home http code welldev org django storages w
无法在 selenium 和 requests 之间传递 cookie，以便使用后者进行抓取

我用 python 结合 selenium 编写了一个脚本来登录网站然后从driver to requests这样我就可以继续使用requests进行进一步的活动 I used item soup select one div class
Matplotlib：如何有效地将大量线段着色为独立渐变

Python 绘图库如何有效地将大量线段着色为独立渐变已经阅读this https stackoverflow com questions 8500700 how to plot a gradient color line in ma
SVG线宽问题

我开始了我的svg学习我想用svg线做一些技巧吧但有件事我不明白我为每个技能创建 2 行一行是空的另一行是知识百分比问题是前两行的高度是我给出的笔画宽度的一半其他线都有很好的高度这是一个 jsbin http jsbin
如何过滤 Pandas GroupBy 对象并获取 GroupBy 对象？

当对 Pandas groupby 操作的结果执行过滤时它返回一个数据帧但假设我想执行进一步的分组计算我必须再次调用 groupby 这似乎有点绕有更惯用的方法吗 EDIT 为了说明我在说什么我们无耻地从 Pandas 文档中窃取
在Python上获取字典的前x个元素

我是Python的新手所以我尝试用Python获取字典的前50个元素我有一本字典它按值降序排列 k 0 l 0 for k in len dict d l 1 if l lt 51 print dict 举个小例子 dict d m
如何使用scrapy检查网站是否支持http、htts和www前缀

我正在使用 scrapy 来检查某些网站是否工作正常当我使用http example com https example com or http www example com 当我创建 scrapy 请求时它工作正常例如在我的pa
python 中的 <> 运算符有什么作用？

我刚刚遇到这个here http www feedparser org feedparser py 总是这样使用 if string1 find string2 lt gt 1 pass 什么是 lt gt 运算符这样做为什么不使用通常的
Python Anaconda：如何测试更新的库是否与我现有的代码兼容？

我在 Windows 7 机器上使用 Python 2 7 Anaconda 安装进行数据分析和科学计算当新的库发布时例如新版本的 pandas patsy 等您建议我如何测试新版本与现有代码的兼容性是否可以在同一台机器上安装两个
运行 Python 单元测试，以便成功时不打印任何内容，失败时仅打印 AssertionError()

我有一个标准单元测试格式的测试模块 class my test unittest TestCase def test 1 self tests def test 2 self tests etc 我的公司有一个专有的测试工具它将作为命令行
使用 for 循环创建一系列元组

我已经搜索过但找不到答案尽管我确信它已经存在了我对 python 很陌生但我以前用其他语言做过这种事情我正在以行形式读取数据文件我想将每行数据存储在它自己的元组中以便在 for 循环之外访问 tup i inLine wher
两个不同长度的数据帧的列之间的余弦相似度？

我在 df1 中有文本列在 df2 中有文本列 df2 的长度将与 df1 的长度不同我想计算 df1 text 中每个条目与 df2 text 中每个条目的余弦相似度并为每场比赛给出分数输入样本 df1 mahesh suresh
查找 Pandas DF 行中的最短日期并创建新列

我有一个包含多个日期的表有些日期将为 NaN 我需要找到最旧的日期所以一行可能有 DATE MODIFIED WITHDRAWN DATE SOLD DATE STATUS DATE 等因此对于每一行一个或多个字段中都会有一个日期
如何指示 urwid 列表框的项目数多于当前显示的项目数？

有没有办法向用户显示 urwid 列表框在显示部分上方下方有其他项目我正在考虑类似滚动条的东西它可以显示条目的数量或者列表框顶部底部的单独栏如果这个行为无法实现有哪些方法可以实现这个通知在我的研究过程中我发现这个问题 ht
使用 PIL 在 Tkinter 中显示动画 GIF

我正在尝试制作一个程序来使用 Tkinter 显示动画 GIF 这是我最初使用的代码 from future import division Just because division doesn t work right in 2 7 4
无法通过 Python 子进程进行 SSH

我需要通过堡垒 ssh 进入机器因此该命令相当长 ssh i
如何在亚马逊 EC2 上调试 python 网站？

我是网络开发新手这可能是一个愚蠢的问题但我找不到可以帮助我的确切答案或教程我工作的公司的网站用 python django 构建托管在亚马逊 EC2 上我想知道从哪里开始调试这个生产站点并检查存储在那里的日志和数据库我有帐户信
AWS Lambda 不读取环境变量

我正在编写一个 python 脚本来查询 Qualys API 中的漏洞元数据我在 AWS 中将其作为 lambda 函数执行我已经在控制台中设置了环境变量但是当我执行函数时出现以下错误 module initialization
minizinc python 安装

我通过 anaconda 提示符在 python 上安装了 minizinc 就像其他软件包一样 pip install minizinc 该软件包表示已成功安装我可以导入该模块但是我正在遵循基本示例https minizinc py

随机推荐

R - 传单限制 - 传单地图支持多少个标记？

Data 我有一个包含 35 000 个纬度经度位置的数据框这些地点已绘制在交互式传单地图上情况我想通过 Markdown 文档在线发布地图问题当我将地图导出为 html 页面或以 markdown 格式时地图为 Laggy
Apache FOP 可以用于将任意 HTML 转换为 PDF 吗？

我尝试使用 Apache FOP 将 HTML 转换为 PDF HTML gt XHTML gt XSL FO gt PDF 我使用 Antenna House 中的 xhtml2fo xsl 进行 xhtml gt XSL FO 转换它
检测Delphi FMX ListBox何时滚动到底部？

我需要检测用户何时向下滚动到 ListBox 的底部以便我可以获取接下来的 25 个项目以在 listBox 中显示有什么提示吗好的让我们分解一下首先我们去滚动到项目在 FMX ListBox 单元中 procedure TCus
Win32：API 调用以列出服务器上的可用网络共享？

假设我可以访问 IP 1 2 3 4 的 SMB 服务器我如何确定可用共享的列表当我输入 UNC 路径 1 2 3 4 时 Windows 资源管理器可以执行此操作但命令提示符 dir 1 2 3 4 失败我尝试了通常的 FindF
Javascript JSON.stringify 无法正确处理原型？

我一直在初始化我的可重用类如下所示构造函数通常是复制构造函数 function Foo Foo prototype a 1 Foo prototype b 2 Foo prototype c var obj new Foo obj c
如何检测 php 中被阻止的地址

所以这是我的问题我们正在尝试在我们的网站上设置 facebook like 和 twitter 推文按钮但当 facebook 和 twitter 在计算机上被阻止时它会导致浏览器变得无响应所以我想做的是检测 Facebook 或
适用于 Android、iOS 和 Flash 的 WebSocket 库 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案有人可以提供一个在 Android iOS iPhone iPad 和 Flash 不是 Flex 中实现 WebSocket 的示例吗我找到了一
用于使用已知模式解析字符串中的值的 sscanf 的 Java 等效项是什么？

所以我有 C 背景最初是 C 语言尽管我已经有近 5 年没有使用过该语言了我正在尝试从 Java 中的字符串中解析一些值在 C 中我会使用 sscanf 在Java中人们告诉我使用Scanner或StringTokenizer
git：为什么我可以签出我删除的提交？

我有一个包含三个提交的分支 mybranch a gt b gt c 我将其推送到远程仓库然后我决定我不想保留提交b and c 所以按照描述删除它们here git reset hard HEAD 1 git reset hard HE
Python：“import X as X”（其中 X 相同）有什么意义？

In aiohttp我发现很多说法import X as X 为什么要这样做文件的链接我不知道答案但链接源文件的历史记录透露了它构造from SOMEWHERE import X as X 与相同的X 需要消除警告mypy stri
如何将我的“分离头”提交返回到主服务器[重复]

这个问题在这里已经有答案了看起来几天前我创建了一个名为detached HEAD并一直致力于此我的正常流程是承诺master然后将其推至origin 但我无法推动detached HEAD 我的下一站搞砸了我我选择了git check
在 WPF 中限制“Auto”和“1*”的行高

我有一个 WPF 应用程序其布局由顶层的 3 行组成Grid 我希望中间行用完它需要的空间它需要的最大空间是有限的但取决于窗口的宽度底行应用完剩余空间棘手的部分是顶行它的大小可能会根据切换大部分内容的可见性的按钮而变化我希望它
在添加包含第一个对象的对象时，如何防止 EF 插入数据库中已存在的对象？

这是不言自明的我有一个包含另一个类的类我们称它们为主题和课堂 public class Subject public Classroom Class get set 我使用的是无状态外观这意味着我的 DbContext 在恢复对象后立
SED：匹配同一行上的 2 个模式

您好我想使用 sed 删除一行如果它与同一行中的 2 个正则表达式匹配 EG 该行以开头以结尾注释下面的脚本将完成大部分工作 sed e d e d 文件名该脚本将删除所有以开头并以结尾的行我希望它仅在满足两个条件而不
当应用程序位于前台时如何处理 Firebase 通知

我已将 Firebase Cloud Messaging 与我的应用程序集成当我从 Firebase 控制台发送通知时如果应用程序处于后台或未打开我会成功收到通知否则如果应用程序位于前台或打开我没有收到它感谢所有建议当应用程
C 中数组初始化中的方括号是什么意思？

static uint8 t togglecode 256 0x3A CAPSLOCK 0x45 NUMLOCK 0x46 SCROLLLOCK 是什么意思 0x3A 这里我只学到了像这样的陈述int a 2 1 2 这意味着初始化n 数
模拟器上的越狱应用程序？

我正在 Xcode 上为越狱的 iPhone 开发应用程序我使用的是 Xcode 4 2 我的 iPhone 操作系统是 iOS6 我无法将我的iPhone与XCode连接进行测试因为XCode 4 2不支持iOS6 每次当我编译代码并
在 Python 中使用空格有什么陷阱吗？

目前我在 Python 中从未遇到过空格问题尽管我只在两个项目中使用过它而且我是唯一的程序员对于学习 Python 的人来说 Python 中的空格和缩进有哪些潜在的陷阱在某些编辑器中一行用空格缩进而下一行用制表符缩进这可能
如何根据动态字段对 solr 结果进行排序

我需要根据动态字段对结果进行排序我怎样才能做到这一点当我对其中一些动态属性的最小值进行排序时它没有给出正确的结果因为我的查询就像 sort min A 160018 A chandigarh1 一些文档同时具有这两个字段A 1600
python 从 tsv 文件链接一个列表

我有这个 tsv 文件其中包含一些链接路径每个链接由分隔我想用在下面的示例中我们可以看到文件中的文本是分开的我只想通读最后一列这是一条以 14th 开头的路径 6a3701d319fc3754 1297740409 166 1

python 从 tsv 文件链接一个列表

python 从 tsv 文件链接一个列表 的相关文章

随机推荐

热门标签

python 从 tsv 文件链接一个列表的相关文章