将一个文件的内容以换行符分隔附加到另一个文件

2024-01-01

我想，我正在尝试复制cat以与平台无关的方式使用 Linux shell 的功能，这样我就可以获取两个文本文件并按以下方式合并它们的内容：

file_1 包含：

42 bottles of beer on the wall

file_2 包含：

Beer is clearly the answer

合并文件应包含：

42 bottles of beer on the wall  
Beer is clearly the answer

然而，我读过的大多数技术最终都会产生：

42 bottles of beer on the wallBeer is clearly the answer

另一个问题是，我想要使用的实际文件是非常大的文本文件（FASTA 格式的蛋白质序列文件），因此我认为大多数逐行读取的方法效率低下。因此，我一直在尝试使用解决方案shutil，如下：

def concatenate_fasta(file1, file2, newfile):
    destination = open(newfile,'wb')
    shutil.copyfileobj(open(file1,'rb'), destination)
    destination.write('\n...\n')
    shutil.copyfileobj(open(file2,'rb'), destination)
    destination.close()

然而，这会产生与之前相同的问题，除了中间有“...”之外。显然，换行符被忽略，但我不知道如何正确管理它。

非常感激任何的帮助。

EDIT:

我尝试了 Martijn 的建议，但是line_sep返回值是None，当函数尝试将其写入输出文件时，它会引发错误。我现在已经通过os.linesep提到的不太理想的方法如下：

with open(newfile,'wb') as destination:
    with open(file_1,'rb') as source:
        shutil.copyfileobj(source, destination)
    destination.write(os.linesep*2)
    with open(file_2,'rb') as source:
        shutil.copyfileobj(source, destination)
    destination.close()

这为我提供了所需的功能，但我仍然对为什么（看似更优雅的）解决方案失败感到有点困惑。

您已以二进制模式打开文件，因此不会发生换行转换。不同的平台使用不同的行结尾，如果您使用的是 Windows\n is not enough.

最简单的方法是写os.linesep http://docs.python.org/2/library/os.html#os.linesep here:

destination.write(os.linesep + '...' + os.linesep)

但是这个could违反文件中使用的实际换行约定。

更好的方法是以文本模式打开文本文件，读取一两行，然后检查file.newlines属性 http://docs.python.org/2/library/stdtypes.html#file.newlines查看该文件的约定是什么：

def concatenate_fasta(file_1, file_2, newfile):
    with open(file_1, 'r') as source:
        next(source, None)  # try and read a line
        line_sep = source.newlines
        if isinstance(line_sep, tuple):
            # mixed newlines, lets just pick the first one
            line_sep = line_sep[0]

    with open(newfile,'wb') as destination
        with open(file_1,'rb') as source:
            shutil.copyfileobj(source, destination)
        destination.write(line_sep + '...' + line_sep)

        with open(file_2,'rb') as source:
            shutil.copyfileobj(source, destination)

您可能想测试file_2同样，如果使用的换行符约定与第一个文件不匹配，可能会引发异常。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python27

concatenation

fasta

shutil

将一个文件的内容以换行符分隔附加到另一个文件的相关文章

对 Python DataFrame 进行子集化

我正在从 R 过渡到 Python 我刚刚开始使用 Pandas 我有一个可以很好地子集化的 R 代码 k1 lt subset data Product p id Month lt mn Year yr select c Time Pro
Python - 包和设置文件

我有一个 python 包需要从我的项目目录中提取设置这是我的项目当前的结构 Project bin mypackage package files Project myproject project files start py se
如何在 pygame 中聚焦光线或如何仅绘制窗口的某些圆形部分？

对于这一点如果您熟悉它请想想超级马里奥制造2 中嘘关卡中的黑暗模式我试图在角色周围创建一个圆形聚光灯这也将使圆圈范围内的任何内容都可见例如部分站在地板上敌人或场景中的任何其他物体我的计划是首先绘制圆圈聚光灯然后绘制场景
地图与星图的性能？

我试图对两个序列进行纯Python 没有外部依赖逐元素比较我的第一个解决方案是 list map operator eq seq1 seq2 然后我发现starmap函数来自itertools 这看起来和我很相似但事实证明在最坏的情
Pygame 玩家精灵没有出现

我一直在为学校计算机课做这个项目但无法让玩家精灵出现有人可以帮忙吗当我运行主游戏循环时除了玩家精灵之外所有内容都正确显示它应该由于箭头输入而在屏幕上移动并受到重力的影响当我删除图像并仅使用对象类和矩形时该代码也有效 impo
如何更改条形图上的 y 轴限制？

我有一个df 我从中索引了europe n我绘制了一个条形图 europe n r 5 c 45 looks like this df Country string df Population numeric 变量 plt bar df C
WTForms 中的小数字段舍入

我有一个包含价格小数字段的表单如下所示 from flask ext wtf import Form import wtforms from wtforms validators import DataRequired from deci
将列表传递给 PyCrypto 中的 AES 密钥生成器

我尝试使用 Pycrypto 生成 AES 密钥但收到以下错误类型错误列表不支持缓冲区接口对于以下声明 aescipher AES new mykey AES MODE ECB mykey 属于类型list并包含 18854347
更改Python pylab玫瑰/极坐标图中图例标题的字体大小

我正在尝试更改玫瑰图或极地图上现有图例标题的字体大小大部分代码是由不在的其他人编写的我已经添加 ax legend title legend title setp l get title fontsize 8 添加标题 legend
Python变量赋值问题

a b 0 1 while b lt 50 print b a b b a b 输出 1 2 4 8 16 32 wheras a b 0 1 while b lt 50 print b a b b a b 输出正确的斐波那契数列 1 1
在 Windows 上将 NumPy 与 BLAS 链接

我正在尝试在 Windows 系统上安装 Theano 并且需要安装 BLAS 和 LAPACK 我的 System32 文件夹中有这些的 dll 文件当我运行 numpy config来自 Anaconda 的 show 库的路径正确显
Python 函数可能会引发哪些异常？ [复制]

这个问题在这里已经有答案了 Python 中有什么方法可以确定内置函数可能引发哪些异常例如文档 http docs python org lib built in funcs html http docs python org li
如何抑制 pyinstaller 生成的可执行文件窗口中的所有警告

我已经使用 pyinstaller 从 python 文件生成了可执行文件该程序按其应有的方式工作但在我想隐藏的窗口中出现了一条警告消息当 python 文件在 IDE 中运行时以下行会抑制所有警告消息 warnings filte
Cython：为什么 size_t 比 int 快？

更改某些 Cython 变量的类型int输入size t可以显着减少某些功能的时间 30 但我不明白为什么例如 cimport numpy as cnp import numpy as np def sum int cnp int64 t
监控单个文件

我需要监控使用watchdog http pythonhosted org watchdog index html 单个文件而不是整个目录避免监视整个目录的最佳方法是什么我想this http pythonhosted org wa
import numpy 和 import numpy as np 之间的区别

我明白如果可能的话应该使用 import numpy as np 这有助于避免由于命名空间引起的任何冲突但我注意到虽然下面的命令有效 import numpy f2py as myf2py 以下不 import numpy as np
收到的标签值 1 超出了 [0, 1) 的有效范围 - Python、Keras

我正在使用具有张量流背景的 keras 开发一个简单的 cnn 分类器 def cnnKeras training data training labels test data test labels n dim print Initiat
避免在列表理解中计算相同的表达式两次[重复]

这个问题在这里已经有答案了我在列表理解中使用一个函数和一个 if 函数 new list f x for x in old list if f x 0 令我恼火的是这个表达f x 在每个循环中计算两次有没有办法以更清洁的方式做到这一点
sklearn 中带有词袋和附加情感特征的文本分类器

我正在尝试构建一个分类器除了词袋之外还使用情绪或主题 LDA 结果等特征我有一个包含文本和标签的 pandas DataFrame 并且想添加情感值 5 到 5 之间的数字和 LDA 分析结果带有句子主题的字符串我有一个工作词
Networkx 中 Louvain 分区的可视化

请帮助我更改 Louvain 聚类算法结果的可视化我从网站上获取了代码https github com taynaud python louvain https github com taynaud python louvain我可以重写

随机推荐

从 python 中的 while 循环内部返回值

我不知道这是一个简单的问题还是不可能的问题或什么但我找不到任何内容所以我想我会问它当循环仍在运行时是否可以从 while 循环返回值基本上我想要做的是让向量在 while 循环内不断更新但能够在询问时返回值而不停止 while
带有自定义标头的 Ajax 请求发送到启用了 CORS 的 Web API 服务器

我正在尝试正确设置 Web API Web 服务以使用 CORS 但最近运气不佳我有一个来自移动应用程序的 html 页面使用 ajax 请求来获取一些数据 Webservices GetUserLevel function var u
如何使用跨列通过列索引而不是列名来改变多个列？

基于这个问题 R dplyr 对列索引进行变异 https stackoverflow com questions 43137868 r dplyr mutate on column index dplyr 如何使用 mutate 按列索引
Win7 中的 Python 3.4.0 无法安装 NumPy

我查看了之前的相关帖子评论者说你为什么不使用 Windows 安装程序所以我按照链接下载了https pypi python org packages 3 4 n numpy numpy 1 8 1 cp34 cp34m macosx
为 Windows Mobile 编译时找不到引用的程序集

我决定使用tessnet2 http www pixel technology com freeware tessnet2 我的 Windows Mobile 6 项目的库不幸的是当我尝试编译它时它抛出一个错误 tessnet2 Te
如何根据列的变化值对记录进行分组/排名？

我有下表按 ID 年份 DESC 排序 Id Year Valid 1 2011 1 1 2010 1 1 2009 0 1 2002 1 4 2013 1 4 2012 1 4 2011 1 etc 我想要的是一个额外的排名字段例如 I
将 google play 服务添加到项目后无法运行项目

我正在制作一个需要谷歌地图的Android应用程序我在 Eclipse 中创建了一个新项目并在 Android 手机上编译它它工作了但是当我将 google play services lib 导入到我的工作区并在我的项目中添加对它的
如何添加监听多个按钮的动作监听器

我试图找出我对动作监听器做错了什么我正在遵循多个教程但当我尝试使用操作侦听器时 netbeans 和 eclipse 给了我错误下面是一个简单的程序我试图让一个按钮在其中工作我究竟做错了什么 import java awt eve
使用 Jinja 循环项目，每 5 个项目后添加 div

Problem 我有 100 个高尔夫球场的列表我希望插入一个 div 其中每五个球场后包含一个广告图像我该怎么做呢更新 1 content html 修订后的最新版本我已经更新了我的原始代码片段因为 leovp 的建议在下面编
如何仅倾斜/倾斜 div 的底部

我一直在尝试在 div 的底部添加倾斜倾斜我取得了一些成功正如您在下面的 JSFiddle 中看到的那样我成功地应用了倾斜但这并不完全是我想要的 https jsfiddle net hcow6kjr https jsfiddle
OAuthException：(#12) v2.0 及更高版本已弃用事件管理 API

当我通过离线发布将事件发布到我的墙上时我陷入了此错误OAuthException 12 events management API is deprecated for versions v2 0 and higher 您无法再使用 Gra
Scala 字节的十六进制文字

包含 A F 数字的十六进制文字默认转换为 int 当我试图用以下方法声明一个 Int 时0x它正在正确创建 val a Int 0x34 val b Int 0xFF 但是当我尝试声明一个字节时0x第二行未编译 val a Byte 0x
为什么浏览器在这里低效地发出 2 个请求？

我注意到 ajax 和图像加载有些奇怪假设页面上有一张图像并且 ajax 请求相同的图像人们会猜测 ajax 请求会命中浏览器缓存或者它至少应该只发出一个请求生成的图像将发送到页面和想要的脚本读取处理图像令人惊讶的是我发现即
Hibernate Criteria API - 访问连接属性

我有一个非常复杂的标准我用它来检索排序和分页服务器端数据我摘录了以下内容 create criteria over a bunch of tables Criteria testCriteria getSession createCr
Google 应用引擎禁用请求日志记录

我正在寻找一种方法来过滤掉请求日志垃圾邮件以便我可以更轻松地看到警告或错误这似乎在本地有效 loggers django handlers console level WARNING 但GAE失败根据这个问题 https stacko
错误：将“char*”分配给“char [20]”时类型不兼容

我是这个 C 环境的新手并且我的构造函数遇到了困难这是我的代码 class Student char name 20 long number public Student char nm 20 long val name nm numb
无法在 Airflow UI 中编辑 Spark_default

我正在尝试使用以下存储库运行 Airflow 和 Spark 的容器化应用程序 https github com cordon thiago airflow spark https github com cordon thiago airf
sys.exit 对于多线程到底有什么作用？

我对 python 中的 sys exit 感到非常困惑在python 文档 https docs python org 2 library sys html 它说退出Python 这是否意味着当sys exit 在python程序中调
什么是浏览器二进制管理器如何将其用于 Selenium

我最近知道使用 WebDriver Binaries 管理器是自动化项目中的一个很好的实践但不确定这是什么以及如何使用也做了一些谷歌搜索并得到了很多关于如何管理二进制文件的帖子但没有说明为什么使用因此如果有人能够指导它及其好处
将一个文件的内容以换行符分隔附加到另一个文件

我想我正在尝试复制cat以与平台无关的方式使用 Linux shell 的功能这样我就可以获取两个文本文件并按以下方式合并它们的内容 file 1 包含 42 bottles of beer on the wall file 2 包含

将一个文件的内容以换行符分隔附加到另一个文件

将一个文件的内容以换行符分隔附加到另一个文件 的相关文章

随机推荐

热门标签

将一个文件的内容以换行符分隔附加到另一个文件的相关文章