从unix中的内部列中删除csv文件中的新行字符

2024-04-18

输入数据示例::

cat test.csv
234,aa,bb,cc,30,dd

22,cc,

ff,dd,

40,gg

pxy,aa,,cc,

40

,dd

所需输出::

cat test_new.csv
234,aa,bb,cc,30,dd

22,cc,ff,dd,40,gg

pxy,aa,,cc,40,dd

我尝试了各种awk and sed命令，似乎没有任何效果。

eg:: awk 'NR == 1{ printf $0; next } { printf "%s%s", (/^[0-9]+,/? ORS : ""), $0 } END{ print "" }'

Above awk只查找带有 "," 的数字字符，但是如果数字出现在带有换行符的列中，这将创建额外的行。

输入文件包含 Control M 字符，我已经使用 dos2unix 删除了该字符

关于“输入文件包含 Control M 字符，我已经使用 dos2unix 删除了” - 这可能会让您的生活变得更加困难。一行中的“换行符”很可能只是LFs 而记录结尾是CRLF所以通过删除CR我们不能再简单地设置 awkRS to CRLF然后删除任何LFs 仍保留在记录中。

如果您的文件是从 Excel 导出的，正如您在问题下的评论中所说，那么无论字段是否被引用，它都会使用CRLF在每条记录的末尾，以及LF单独在每个字段中，如果你不运行的话，看起来像这样dos2unix on it:

$ cat -v test.csv
234,aa,bb,cc,30,dd^M
22,cc,
ff,dd,
40,gg^M
pxy,aa,,cc,
40
,dd^M

然后使用任何 awk：

$ awk -v ORS= '{sub(/\r$/,"\n")} 1' test.csv
234,aa,bb,cc,30,dd
22,cc,ff,dd,40,gg
pxy,aa,,cc,40,dd

或者，如果您愿意，可以使用 GNU awk 进行多字符 RS：

$ awk -v RS='\r\n' '{gsub(/\n/,"")} 1' test.csv
234,aa,bb,cc,30,dd
22,cc,ff,dd,40,gg
pxy,aa,,cc,40,dd

有关使用 awk 解析 CSV 的更多信息，请参阅使用 awk 有效解析 CSV 的最可靠方法是什么？ https://stackoverflow.com/questions/45420535/whats-the-most-robust-way-to-efficiently-parse-csv-using-awk.

关于你的原始脚本 - 永远不要使用printf $0，始终使用printf "%s", $0相反，因为前者会失败$0包含任何 printf 格式字符，例如%s:

$ echo 'a%sb' | awk '{printf "%s", $0}'
a%sb$

$ echo 'a%sb' | awk '{printf $0}'
awk: cmd. line:1: (FILENAME=- FNR=1) fatal: not enough arguments to satisfy format string
        `a%sb'
          ^ ran out for this one
$

这适用于使用printf对所有输入数据。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从unix中的内部列中删除csv文件中的新行字符的相关文章

使用按钮从 Django 项目根下载文件

So this is the webpage I m creating atm with Django 1 8 希望用户能够将数据导出为 csv 当用户在框中写下 Reddit 子版块名称按下获取数据按钮会发生什么它创建了一个
Web 本地应用程序 Apache：运行 shell 脚本

我开发了一个 shell 脚本我想用它创建一个 UI 我决定使用带有本地服务器的 Web 界面因为我对 HTML PHP 的了解很少比 QT 或 Java 的了解更多我只是希望我的 html 可以在我的计算机上运行 shell 脚本
在 Shiny 的压缩文件夹中下载多个 csv 文件

有人可以指出我如何使这个下载 zip 功能在 server R 中工作吗当我运行这个时我收到以下错误 1 var folders 00 1dk1r000h01000cxqpysvccm005p87 T Rtmps3T6Ua write
bash 或 sh 中的“=”和“==”运算符有什么区别

我意识到和运算符都可以在 if 语句中使用例如 var some string if var some string then doing something fi if var some string then doing some
模拟用户输入以使用不同参数多次调用脚本

我必须使用提供的脚本该脚本在脚本运行时接受用户输入而不是参数我无法解决这个问题脚本的一个例子是 bin bash echo param one read one doSomething echo param two read two
如何在 UNIX / Linux 操作系统下使用 sed 替换带有换行符 (\n) 的模式？

我有一个 txt 文件其中包含 Some random text here This file has multiple lines Should be one line I use sed q N s n sl g t q file1
将 csv 写入谷歌云存储

我试图了解如何将多行 csv 文件写入谷歌云存储我只是没有遵循文档 https googlecloudplatform github io google cloud python stable storage blobs html hig
快速 shell 命令删除文本文件中的停用词

我有一个 2GB 的文本文件我正在尝试从此文件中删除经常出现的英语停用词我有 stopwords txt 包含这样的 a an the for and I 使用 shell 命令例如 tr sed 或 awk 执行此操作的快速方法是什
如何替换带引号的多单词字符串作为参数？

我正在尝试替换包含多个带引号的单词的字符串变量作为命令的参数因此给出以下示例脚本请注意 shebang 中的 x 这会导致输出被记录到 stderr bin bash x myArg hello world echo string i
如何使用 awk 或 sed 将“[1.0 - 4.0]”等字符串替换为数值？

我有一个 CSV 文件正在通过一组 awk sed 命令进行管道传输 CSV 文件中的某些行如下所示 10368 Verizon DSL DSL NY NORTHEAST 5 4 1 1 3 0 0 384 0 768 其中第 8 列和第
shell 脚本无法将命令行输出保存到变量中

我正在尝试执行 shell 命令然后使用 shell 脚本将输出保存到变量中所以我使用这样的反引号 out ls l print out 该代码工作正常我可以将它用于任何其他 shell 命令但是当我尝试执行 python vers
Scala 和 Spark：Windows 上的 Dataframe.write._

有人设法使用 Spark 写入文件尤其是 CSV 吗数据框 http spark apache org docs latest api scala index html org apache spark sql Dataset在 Win
如何使用 cron 作业运行 python 文件

您好我创建了一个 python 文件例如file example py 该文件将输出 sensex 值假设该文件在linux系统上的路径为 Desktop downloads file example py 我通常会运行该文件pyth
subprocess.Popen args 参数的最大长度是多少？

我在用Popen http docs python org library subprocess html using the subprocess modulesubprocess 模块中的函数来执行命令行工具 subprocess Po
当我通过 shell 脚本创建 .txt 文件时，为什么文件名末尾出现问号？ [复制]

这个问题在这里已经有答案了我正在编写一个 shell 脚本我应该在其中创建 1 个文本文件当我这样做时文件名末尾出现一个问号是什么原因我正在 bash 脚本中尝试以下方法 1 grep ERROR a1 gt text txt
如何在 Bash 中为数组赋值？

我正在尝试从文本文件中读取值列表你好 txt 并将它们存储在一个数组中 counter 0 cat hello txt while read line do Unix Array counter line let counter coun
从 django 返回带有 BOM 的 UTF-8 编码的 csv

我正在尝试输出一个用户可以用 Excel 打开的 CSV 文件我已经用 UTF 8 编码了所有字符串但是当我用 Excel 打开文件时我看到了乱码只有在将文件转换为带 BOM 的 UTF 8 在 Windows 上使用 notepa
什么是 POSIX 合规性以及它对我有何影响？

我不断看到这个问题出现每次我查找它时我都无法很好地解释它是什么或它对我意味着什么什么是 POSIX 合规性假设我的程序仅在兼容 POSIX 的机器上运行这对我作为程序员来说有何简化甚至吗 POSIX http pubs open
如何从 C 函数创建 shell 命令

想知道如何获取一组 C 函数并将它们转换为 shell bash 命令假设我有一组简单的 C 函数 int fn1 some C code for function 1 int fn2 some C code for function 2
子 shell 何时继承其父 shell 环境？

什么情况下将shell的环境传递给子shell 子 shell 始终从父 shell 获取所有变量 man bash将描述所有使用子shell的情况主要是 command command command and command 所谓环境只

随机推荐

ServiceBus RetryExponential 属性含义

我很难理解与 QueueClients 结合使用的 RetryExponential 类我也假设 SubscriptionClients 属性已列出here http msdn microsoft com en us library wi
Grails：当我向 message.properties 添加新属性时出现 Native2ascii 错误

当我在运行时向 grails 应用程序中的 message properties 文件添加新属性时出现了一个奇怪的错误当我通过命令行重新启动应用程序或重新启动STS时此错误消失我使用的是 2 0 1 版本直到一周前我还能够在运行
向 WooCommerce 单一产品页面添加多个选项卡

我正在尝试向 WooCommerce 添加三个自定义选项卡我有下面的代码其中两个显示但由于某种原因属性描述选项卡没有显示在页面上不仅数量定价选项卡不显示其描述我尝试将代码的不同部分移动到不同的位置并且检查了代码是否有错误或
如何使用 ggplot 显示多个显示分布的箱线图

我正在尝试获取这样的图表来显示每个年龄组的箱线图分布 But instead my plot looks like this 如何显示箱线图而不是点为什么我的 Y 轴不是数字 My data looks like this 这是我正在尝试
DPI 意识真的需要吗？

我正在学习如何使用 GDI GDI 绘制 GUI 我发现了这个http msdn microsoft com en us library windows desktop dd756596 v vs 85 aspx step 2 declar
如何删除系统命名空间中的 kubernetes pod（和其他资源）

我错误地在系统命名空间 kube system 中添加了一个 pod 然后我无法删除这个 Pod 它似乎还创建了一个副本集每次删除这些项目时都会重新创建它们似乎找不到删除属于系统命名空间 kube system 的 Pod 或副本集的
连接关闭且应用程序终止后，BLE 堆栈反复重新连接到外设

我有一个应用程序它打开与 BLE 设备的短暂连接执行一些特征读取和写入然后断开并关闭连接应用程序使用 autoReconnect false 并且设备未配对或绑定我看到 Android 的一些非常奇怪的行为它似乎反复且意外地重新
从用户控件内部将选项卡添加到选项卡控件

如何从选项卡本身包含的另一个用户控件将选项卡添加到一个用户控件中存在的选项卡控件我可以在不将 tabcontrol 作为构造函数中的参数传递的情况下也许通过某种静态全局方法来完成此操作吗我试过了 public static Obse
Android的ARGB_8888位图内部格式总是RGBA吗？

我正在尝试创建一个Bitmap在 Android 中使用Bitmap Config ARGB 8888在我从外部源收到字节后据我所知在 a 中设置原始字节的最快方法Bitmap 不使用JNI 是通过使用copyPixelsFromBuf
无法使用 Java 删除文件夹

我试图删除一个只有文件但没有子文件夹的文件夹但没有成功 Code File rowFolder new File folderPath String files rowFolder list for String file files F
pkg-config 无法在 ffmpeg 构建上找到库（linux）

我正在尝试在 ubuntu 上为 android 构建 ffmpeg I ve cross compiled all the dependencies I need for my configuration I ve set up the
.NET6 中具有优先级队列的 Parallel.ForEach

我正在尝试奔跑Parallel ForEach on my Priority Queue但我收到以下错误严重性代码说明项目文件行抑制状态错误 CS0411 无法从用法推断方法 Parallel ForEach OrderablePa
如何在地图视图中隐藏“当前位置”标注

点击代表用户位置的脉动蓝色圆圈会弹出当前位置标注有办法抑制吗更新用户位置后您可以更改注释视图上的一个属性 void mapView MKMapView mapView didUpdateUserLocation MKUserLoc
创建新用户时 ActiveModel::ForbiddenAttributesError

我在 Ruby 中有这个模型但它抛出了一个ActiveModel ForbiddenAttributesError class User lt ActiveRecord Base attr accessor password valida
如何创建嵌套 GridView 来编辑 EF Code First 关系？

我有一个经典的父子关系我想使用它来进行 CRUDasp GridView控制对父级进行 CRUD 很容易但挑战在于嵌套一个asp GridView在一个asp GridView这能够对儿童关系产生作用为了使问题变得更容易我构建了一
从 Eclipse 返回已删除的项目

我有严重的问题我已经从 Eclipse 中删除了 Java 项目并且 CVS 上没有新的修订版有没有机会归还那个项目或者我是najebao Eclipse 管理文件和项目 http www cs umd edu class winte
为什么我在 MVC3 控制器内的模型中更新的值未在客户端上呈现？

我有一个控制器动作UpdateCustomer CustomerDto customer 返回一个PartialViewResult其模型也是CustomerDto HttpPost public PartialViewResult Upd
3D触摸/压力触摸实现

我们如何实现 3D touch 来检查用户是否点击UIView或用力触摸UIView 有没有办法做到这一点UIGestureRecognize或仅与UITouch 您无需指定的手势识别器即可完成此操作您不需要调整touchesEnded和
com.microsoft.sqlserver.jdbc.SQLServerException：与主机 localhost、端口 1433 的 TCP/IP 连接失败 [重复]

这个问题在这里已经有答案了我不断收到此错误我尝试了 Stack Overflow 如下中的一种解决方案但它对我不起作用连接到 SQL Server 时出现 SQL 异常 https stackoverflow com questi
从unix中的内部列中删除csv文件中的新行字符

输入数据示例 cat test csv 234 aa bb cc 30 dd 22 cc ff dd 40 gg pxy aa cc 40 dd 所需输出 cat test new csv 234 aa bb cc 30 dd 22 cc

从unix中的内部列中删除csv文件中的新行字符

从unix中的内部列中删除csv文件中的新行字符 的相关文章

随机推荐

热门标签

从unix中的内部列中删除csv文件中的新行字符的相关文章