如何将拒绝的行重定向到另一个文件？

2023-12-06

这是我的来源csv file

col1,col2,col3,col4,col5,col6
1,A,AA,X,Y,H
2,B,,,CC,D, -- reject this row because (CC)it should be in col3
3,E,FF,Y,L
4,G,,,XX,P,B -- reject this row because(XX) it should be in col3
5,P,Kk,,,D,M -- this is correct record since kk 2 letter digit is in col3
6,G,MM,,,,-- correct record since record MM is in col3

如何验证此 csv 文件？

这样我就能得到所有2信中column 3 [col3]

我按照这些步骤将源文件复制到另一个文件中（因为我不在源文件中进行操作），然后

我不知道如何将被拒绝的行放入另一个文件中，请有人帮助我！

Sub test()

    '///OPEN FILE and READ
    Set objFileToRead = CreateObject("Scripting.FileSystemObject").OpenTextFile("C:\coe.txt", 1)
    'Set objFileToWrite = CreateObject("Scripting.FileSystemObject").OpenTextFile("C:\copyme2.txt", 2)
    strFileText = objFileToRead.ReadAll()
    objFileToRead.Close


    ' ///PASTE
    Set objFSO = CreateObject("Scripting.FileSystemObject")
    Set objFileToWrite = objFSO.OpenTextFile("c:\cou.txt", 2)
    objFileToWrite.Write strFileText
    objFileToWrite.Close

End Sub

如果您是 VBScript 新手，您应该从一个计划（主任务、子任务、解决每个任务的想法）和一个框架 .vbs 开始编码，这样可以轻松地尝试用于解决（子任务）的方法。）任务。

在您的情况下，主要任务是“将源文件中的坏行过滤到目标文件”。如果您可以“读取源文件的行”、“识别出错误的行”并“将它们写入目标文件”，则此任务就可以解决。

读取文件行的默认方法是：

  Dim tsIn : Set tsIn = goFS.OpenTextFile("..\data\21755767.csv")
  Do Until tsIn.AtEndOfStream
     Dim sLine : sLine = tsIn.ReadLine()
  Loop
  tsIn.Close

“默认”的意思是：你必须有很好/具体的理由not选择这个习惯用法（例如：在短文件上使用 .ReadAll() 进行就地编辑或调试显示）或偏离它（例如：如果您的文件是 UTF，则不能依赖 .OpenTextFile 的默认参数-16 编码）。对于某些暴行 - 例如

  Do While Not tsIn.AtEndOfStream = "False"

没有任何借口。

将（某些）行写入另一个文件应该如下所示：

  Dim tsOut : Set tsOut = goFS.CreateTextFile("..\data\21755767-bads.csv")
  Dim tsIn  : Set tsIn  = goFS.OpenTextFile("..\data\21755767.csv")
  Do Until tsIn.AtEndOfStream
     Dim sLine : sLine = tsIn.ReadLine()
     If True Then
        tsOut.WriteLine sLine
     End If
  Loop
  tsIn.Close
  tsOut.Close

使用 .CreateTextFile(JustTheFileSpec) 而不是 .OpenTextFile(lots, of, other, args) 是标准情况下最简单/清晰/错误保存的方法：每次运行脚本的新（可能是空）目标文件。

如上所述，附加一个

  WScript.Echo  goFS.OpenTextFile("..\data\21755767-bads.csv").ReadAll()

显示没问题。

过滤器子任务的想法基于观察：

标题行包含正确数量的字段/逗号
有问题的行包含大量逗号

然后很容易将上述工作的结果合并为：

  Dim tsOut   : Set tsOut = goFS.CreateTextFile("..\data\21755767-bads.csv")
  Dim tsIn    : Set tsIn  = goFS.OpenTextFile("..\data\21755767.csv")
  Dim sLine   : sLine     = tsIn.ReadLine()
  Dim nUBSeps : nUBSeps   = UBound(Split(sLine, ","))
  Do Until tsIn.AtEndOfStream
     sLine = tsIn.ReadLine()
     If nUBSeps <> UBound(Split(sLine, ",")) Then
        tsOut.WriteLine sLine
     End If
  Loop
  tsIn.Close
  tsOut.Close

完整脚本：

Option Explicit ' (1)

Dim goFS : Set goFS = CreateObject("Scripting.FileSystemObject") ' (2)

WScript.Quit demoReadFile() ' (3)
WScript.Quit demoReadWriteFile()
WScript.Quit demoFilterBads()

Function demoReadFile() ' (4)
  demoReadFile = 0
  Dim tsIn : Set tsIn = goFS.OpenTextFile("..\data\21755767.csv")
  Do Until tsIn.AtEndOfStream
     Dim sLine : sLine = tsIn.ReadLine()
     WScript.Echo tsIn.Line - 1, sLine
  Loop
  tsIn.Close
End Function

Function demoReadWriteFile() ' (5)
  demoReadWriteFile = 0
  Dim tsOut : Set tsOut = goFS.CreateTextFile("..\data\21755767-bads.csv")
  Dim tsIn  : Set tsIn  = goFS.OpenTextFile("..\data\21755767.csv")
  Do Until tsIn.AtEndOfStream
     Dim sLine : sLine = tsIn.ReadLine()
     If True Then
        tsOut.WriteLine sLine
     End If
  Loop
  tsIn.Close
  tsOut.Close
  WScript.Echo  goFS.OpenTextFile("..\data\21755767-bads.csv").ReadAll()
End Function

Function demoFilterBads() ' (6)
  demoFilterBads = 0
  Dim tsOut   : Set tsOut = goFS.CreateTextFile("..\data\21755767-bads.csv")
  Dim tsIn    : Set tsIn  = goFS.OpenTextFile("..\data\21755767.csv")
  Dim sLine   : sLine     = tsIn.ReadLine()
  Dim nUBSeps : nUBSeps   = UBound(Split(sLine, ","))
  Do Until tsIn.AtEndOfStream
     sLine = tsIn.ReadLine()
     If nUBSeps <> UBound(Split(sLine, ",")) Then
        tsOut.WriteLine sLine
     End If
  Loop
  tsIn.Close
  tsOut.Close
  WScript.Echo  goFS.OpenTextFile("..\data\21755767-bads.csv").ReadAll()
End Function

示例输出：

演示ReadFile()

cscript 21755767.vbs
1 col1,col2,col3,col4,col5
2 1,A,AA,X,Y
3 2,B,,,CC,D
4 3,E,FF,Y,
5 4,G,,,XX,P

demoFilterBads()

cscript 21755767.vbs
2,B,,,CC,D
4,G,,,XX,P

这样的脚本可以从骨架/模板开始，例如：

Option Explicit ' (1)

Dim goFS : Set goFS = CreateObject("Scripting.FileSystemObject") ' (2)

WScript.Quit step00() ' (3)
WScript.Quit step01()

...

Function step00() ' (4)
  step00 = 0
  ...
End Function

所有脚本都应以“Option Explicit”开头，以防止变量名称拼写错误
如果您允许全局变量，那么 goFS 是一个不错的选择。如果没有，则仅创建一个 FSO 并将其传递给需要它的子/函数/方法。Never每次需要它的方法/属性时创建一个新的 FSO。
使用注释或重新排序来调用您当前使用的函数
“样本”功能；写很多来检查/阐述你的想法

更新评论：

添加实用函数：

Function qq(s) : qq = """" & s & """" : End Function

和一个实验/探索功能：

Function demoFilterSteps()
  demoFilterSteps = 0
  Dim sLine
  For Each sLine In Split("col1,col2,col3,col4,col5 1,A,AA,X,Y 2,B,,,CC,D")
      WScript.Echo 0, qq(sLine)
      Dim aParts  : aParts  = Split(sLine, ",")
      Dim nUBSeps : nUBSeps = UBound(aParts)
      WScript.Echo 1, nUBSeps, qq(Join(aParts, "-"))

      WScript.Echo
  Next
  nUBSeps = 4            ' correct
  sLine   = "2,B,,,CC,D" ' bad
  Dim sExpr : sExpr = "nUBSeps <> UBound(Split(sLine, "",""))"
  WScript.Echo 2, nUBSeps, qq(sLine), sExpr, CStr(Eval(sExpr))
End Function

output:

cscript 21755767.vbs
0 "col1,col2,col3,col4,col5"
1 4 "col1-col2-col3-col4-col5"

0 "1,A,AA,X,Y"
1 4 "1-A-AA-X-Y"

0 "2,B,,,CC,D"
1 5 "2-B---CC-D"

2 4 "2,B,,,CC,D" nUBSeps <> UBound(Split(sLine, ",")) True

To see

拆分标题行会导致 nUBSeps 为 4（5 个字段之间有 4 个分隔符）
一条好的线路也会导致 nUBSeps 为 4 - 这并不奇怪
坏线的 nUBSeps 不同 () 为 4；本样本中有 5 个
假设 nUBSeps 为 4（正确），则表达式nUBSeps <> UBound(Split(sLine, ","))当 sLine 持有坏行时，计算结果为 True - 因此该行应写入目标文件

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

csv

vbscript

如何将拒绝的行重定向到另一个文件？的相关文章

如何使用列表作为pandas数据框中的值？

我有一个数据框需要列的子集包含具有多个值的条目下面是一个带有运行时列的数据框其中包含程序在各种条件下的运行时 df condition a runtimes 1 1 5 2 condition b runtimes 0 5 0 7
写入抓取数据的 csv 文件时如何拆分项目名称

我有兴趣使用 R 从网上抓取的数据创建 csv 或类似的 Excel 兼容文件到目前为止我通过执行以下操作来存储数据 require textreadr spiegel lt read html http www spiegel de
如何在 Python 2.7 中编写 unicode csv

我想将数据写入文件其中 CSV 中的行应如下所示直接来自 Python 控制台 row xef xbb xbft 11651497 http kozbeszerzes ceu hu entity t 11651497 xml Szabo
如何使用 Window Script Host 查找活动（前台）窗口的窗口标题

我想使用 Window Script Host WSH 查找当前处于活动状态具有焦点的窗口的标题因为我希望 WSH 脚本仅在所需窗口处于活动状态时才发送键注意我无法使用替代方案即在调用 sendkeys 之前激活所需的窗口任何
将工作表保存为 CSV，且 Excel 公式完好无损

我完全使用 VBA for Excel 工作我的解决方案必须完全是程序化的而不是用户驱动的该解决方案的要求是用户启动一个宏来获取工作簿并将 8 个工作表保存到单独的 CSV 文件中保留公式并丢弃公式分辨率我有一系列工作表 sht
使用字符串数组在 Hive 表上加载 CSV 文件

我正在尝试将 CSV 文件插入 Hive 其中一个字段是 string 数组这是 CSV 文件 48 Snacks that Power Up Weight Loss Aidan B Prince Health Fitness Trave
当隐含 ID 列时，如何合并 csv 文件中的多个数据框？

我想将一堆数据框合并在一起因为如果您只处理一个数据框则许多操作似乎会更容易但如果我错了请纠正我目前我有一个像这样的数据框 ID var1 var2 A 2 2 B 4 5 Z 3 2 每个 ID 位于单行上并带有多个单个测量值
将查询结果作为 CSV 文件从 Docker PostgreSQL 容器导出到本地计算机

我不确定这是否可能或者我是否做错了什么因为我对 Docker 还很陌生基本上我想将 PostgreSQL docker 容器内的查询结果作为 csv 文件导出到本地计算机这就是我到目前为止所得到的首先我使用以下命令运行 Pos
用于读取csv写入数组的c++程序；然后操作并打印到文本文件中（已经用 matlab 编写）

我想知道是否有人可以帮助我我正在尝试构建一个程序从 csv 文件中读取大小未知的浮点数大数据块我已经在 MATLAB 中编写了此代码但想要编译和分发此代码因此转向 C 我只是在学习并尝试阅读本文以开始 7 5 19892 4 23
如何在 R 中编写 csv 文件，其中我的输入作为行写入文件？

这是一个非常简单的问题令我惊讶的是网上没有例子我有一个向量 vector lt c 1 1 1 1 1 我想将其写为 csv 作为一个简单的行 write csv vector file myfile csv row names FAL
从 VBS 运行同一目录中的批处理文件

我有一个 VBScript 应该运行 bat 或 vbs 文件但它不起作用它出现一个错误指出无法找到该文件无论我是否放入文件路径我认为这并不重要因为它位于同一目录中所以我的问题是如何从 VBScript 中启动 bat 文件
从多个 .csv 文件创建混淆矩阵

我有很多具有以下格式的 csv 文件 338 800 338 550 339 670 340 600 327 500 301 430 299 350 284 339 284 338 283 335 283 330 283 310 282 3
从 mvc web api httpresponse 生成 csv 并通过 angularjs 接收以供下载

我正在尝试从我的 Web api 生成一个 CSV 文件并通过 angularjs 接收该文件我有一个如下所示的 API 控制器 HttpPost public HttpResponseMessage GenerateCSV FieldP
用于读取类似 CSV 行的 Python 正则表达式

我想解析传入的类似 CSV 的数据行值用逗号分隔逗号周围可能有前导和尾随空格并且可以用或引用例如这是有效的行 data1 data2 data3 data4 data5 但这是格式错误的 data1 data2 da ta3
ADODB.Parameters 错误“800a0e7c”参数对象定义不正确。提供的信息不一致或不完整

我主要是一名 PHP 开发人员但我有一些旧的 ASP 我们以前的开发人员之一制作的它坏了我不知道如何修复它我们有一个程序将一些变量发送到侦听器页面该侦听器页面将该数据与 msSQL 数据库中的注册代码进行比较然后让程序知道注册代
写入 CSV 时，“\”、\x0A\x0D” 代码在 C# 中执行什么操作

谁能告诉我在以下条件下检查什么 if s IndexOfAny x0A x0D ToCharArray gt 1 它正在检查是否有引号 Comma 换行 x0A或回车 x0D在字符串中s x0A是转义的十六进制换行符相当于 n x0D是转
使用 FileSystemObject 读取和写入 csv 文件

是否可以使用 VBA 中的 FileSystemObject 读取和写入 csv 文件必然是基本语法如 Set objFSO CreateObject scripting filesystemobject create a csv fi
番石榴表到 CSV

我正在尝试将 Guava 表导出到 CSV 下面的代码有效但它跳过了我也想在输出中看到的第一列你能提出什么建议吗编辑显然使用values and keySet 单独工作 final RowSortedTable
Rails csv 格式的原始查询，通过控制器返回

我使用 Active Record 来获取我的故事然后生成 CSV 这是在 Rails Cast 中完成的标准方法但我有很多行需要几分钟我想如果我能让 posgresql 来做 csv 渲染那么我可以节省一些时间这是我现在所拥有
将 csv 中的选定列转换为字典

我有一个名为 archive 的 csv 文件它以读者身份打开我希望创建一个字典其值 k v 是由 row 0 row 2 row 7 对于 csv 文件中的每一行必须有一种简单直接的方法可以将此 csv 转换为字典其中k row

随机推荐

方法与类型中的另一个方法具有相同的擦除

为什么在同一个类中存在以下两个方法是不合法的 class Test void add Set
SSIS - 轮询文件文件夹和触发 ETL 包

需要建议请参阅下面的场景我们开发了1个ETL包可以一次处理5个文件通常需要1分钟我们预计早上也就是说早上 6 点到 7 点之间可以有近 100 个以上的文件进入 PROCESSING 文件夹我正在努力设计开发某种轮询机制
按下后退按钮时如何清除 Fragment 上的 ListView？

所有数据均来自该ListView由一个提供CursorAdapter 每当我按下后退按钮并return活动然后单击该活动以开始我的活动fragment 所有以前的数据仍然相互堆叠 1 创建接口BackPressedListener pub
Python：为什么不同的线程从一个生成器获取自己的一系列值？

我正在学习Python 中的多线程我想知道如何使用生成器向多个线程提供数据这是我写的 import threading data i for i in xrange 100 def generator for i in data yie
如何生成仅包含 1 和 0 的 14x10 矩阵的所有可能组合

我正在解决一个问题一个解决方案需要输入每个可能由 1 和 0 组成的 14x10 矩阵我如何生成这些矩阵以便我可以将每个可能的 14x10 矩阵输入到另一个函数中谢谢你 3 月 21 日添加看来我的帖子措辞不恰当对不起我想做的
MATLAB：复制数组的特定部分

我试图从矩阵中复制一些元素但不是整行也不是单个元素例如在以下矩阵中 a 1 2 3 4 5 6 7 8 9 0 我如何复制以下数据 b 1 3 5 即仅第 1 列中的第 1 3 行我知道您可以像这样删除整个列 b a 1 我很欣赏
如何解密或访问受保护的 Access 数据库？

我接手了一个旧的软件项目它使用 MS Access 数据库来存储数据但是数据库不会在 Access 中打开如下所示您没有使用 database mdb 对象所需的权限请让您的系统管理员或创建此对象的人员为您建立适当的权限但我不知
步骤定义检测仅在项目配置为 Cucumber 项目时有效。- 虚拟机

无法连接功能文件和步骤定义文件仅在 Win Server 2012R2 虚拟机中安装的 eclipse 中才会发生当您从 git 或直接从本地系统导入任何新的 Cucumber 项目时将会出现此错误因为你还没有将项目配置为cucum
Cassandra 3 Java 驱动程序构建动态查询

有没有办法通过给定参数构建动态查询 public List getData String title Date dateFrom Statement statement QueryBuilder select all from test d
SVN：我的存储库访问时出现 500 内部服务器错误

操作系统是Ubuntu服务器我使用 SVN 创建一个新的存储库如下所示 svnadmin create myrepo pre 1 6 compatible 第一次当我想访问我的新存储库时myrepo 使用TortoiseSVN工具我
减去两个字符

我刚刚开始汇编编程所以我是一个初学者为了练习我尝试用汇编语言重写基本的 libc NASM Intel 语法但我被困在strcmp功能 Compare two C style NUL terminated strings Input
如何在 iPhone 中使用 nsdocuments 目录进行下载

我有一个带有下载选项的iPhone应用程序并且我使用nsdocument目录路径进行下载但是下载后我如何才能访问iPhone中的文档路径我需要安装任何其他应用程序来访问文件吗如果是请告诉我该应用程序谢谢 NSDownloadsD
将原始电子邮件（带附件）发送给多个收件人

我目前正在使用 Python 2 7 并尝试使用 Boto SES 将带有附件确切地说是 CSV 的原始电子邮件发送到多个地址我可以发送普通电子邮件send email 但是当我尝试通过以下方式发送给多个人时我不断收到错误消息send
找出一个点属于哪个四面体元素

我有一个 3d 区域的四面体网格网格由扩展名为 node 和 ele 的两个文件定义其中包含与节点和元素相关的数据这是 tetgen 3d Delaunay 四面体化程序的输出文件的格式 node 文件的每一行包含节点编号以及该节点
使用“imager”包中的 load.image() 函数在 R 中加载多个图像

我想使用 imager 包中提供的 load image 函数加载多个图像但我收到一条错误消息找不到文件有人可以帮我解决这个问题吗我尝试加载列表中的图像并将此列表作为参数添加到 load image 函数中但它只能读取一个文件
Python/html- 将多个 html 合并为一个 [关闭]

很难说出这里问的是什么这个问题模棱两可含糊不清不完整过于宽泛或言辞激烈无法以目前的形式合理回答如需帮助澄清此问题以便重新打开访问帮助中心我写了一个 python 脚本来将文本文件转换为 html 文件但如果我不能把它们全部
当没有给出路径时，在java中将在哪里创建一个新文件？

在Java中 File f f new File myfile txt if f exists f createNewFile 执行上述代码时默认分配的是哪个路径而没有给出具体路径当前目录您可以通过调用以下命令获取 new File
如何使用 VLC 流式传输图像/文件？

所以我知道有很多 libVLC dll 的包装器但我只是不知道谁准备好做我需要做的事情我需要的很简单在我的 C 程序中我创建了一些位图每秒一次或两次我现在想使用 VLC 将位图作为视频以 VLC 可以提供的某种格式实时流式传
在 malloc 内存上使用 sizeof() [重复]

这个问题在这里已经有答案了可能的重复新手关于malloc和sizeof的问题我正在尝试将字符串读入程序中当我注意到字符串有时会被损坏时我尝试了以下代码 void mallocated malloc 100 printf sizeo
如何将拒绝的行重定向到另一个文件？

这是我的来源csv file col1 col2 col3 col4 col5 col6 1 A AA X Y H 2 B CC D reject this row because CC it should be in col3 3 E F

如何将拒绝的行重定向到另一个文件？

如何将拒绝的行重定向到另一个文件？ 的相关文章

随机推荐

热门标签

如何将拒绝的行重定向到另一个文件？的相关文章