CSV 写入需要唯一分隔符的文本字符串

2023-12-09

我用 python 编写了一个 HTML 解析器,用于提取数据,使其在 csv 文件中看起来像这样:

    itemA, itemB, itemC, Sentence that might contain commas, or colons: like this,\n

所以我使用了分隔符“:::::”,认为它不会在数据中被挖掘

    itemA, itemB, itemC, ::::: Sentence that might contain commas, or colons: like this,::::\n

这适用于数千行中的大多数,但是,显然是冒号:当我在 Calc 中导入 csv 时抵消了这一点。

我的问题是,在创建包含许多需要用某些分隔符分隔的句子变体的 csv 时,最好使用什么或唯一的分隔符?我是否正确理解分隔符,因为它们分隔了 CSV 中的值?


正如我在评论中非正式地建议的那样,唯一意味着您需要使用一些不会出现在数据中的字符 -chr(255)可能是一个不错的选择。例如:

Note:显示的代码适用于 Python 2.x — 请参阅 Python 3 版本的注释。

import csv

DELIMITER = chr(255)
data = ["itemA", "itemB", "itemC",
        "Sentence that might contain commas, colons: or even \"quotes\"."]

with open('data.csv', 'wb') as outfile:
    writer = csv.writer(outfile, delimiter=DELIMITER)
    writer.writerow(data)

with open('data.csv', 'rb') as infile:
    reader = csv.reader(infile, delimiter=DELIMITER)
    for row in reader:
        print row

Output:

['itemA', 'itemB', 'itemC', 'Sentence that might contain commas, colons: or even "quotes".']

如果您不使用csv模块,而不是手动写入和/或读取数据,那么它会像这样:

with open('data.csv', 'wb') as outfile:
    outfile.write(DELIMITER.join(data) + '\n')

with open('data.csv', 'rb') as infile:
    row = infile.readline().rstrip().split(DELIMITER)
    print row
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

CSV 写入需要唯一分隔符的文本字符串 的相关文章

  • 有没有一种方法可以将python对象直接存储在mongoDB中而不需要序列化它们

    我在某处读到过 您可以使用 BSON 将 python 对象 更具体地说是字典 作为二进制文件存储在 MongoDB 中 但是现在我找不到任何与此相关的文档 有人知道具体如何做到这一点吗 没有办法在不序列化的情况下将对象存储在文件 数据库
  • 如何在 Jupyter Notebook 中运行 Python 异步代码?

    我有一些 asyncio 代码在 Python 解释器 CPython 3 6 2 中运行良好 我现在想在具有 IPython 内核的 Jupyter 笔记本中运行它 我可以运行它 import asyncio asyncio get ev
  • 使用 Python 创建 MIDI

    本质上 我正在尝试从头开始创建 MIDI 并将它们放到网上 我对不同的语言持开放态度 但更喜欢使用Python 两种语言之一 如果这有什么区别的话 并且想知道我应该使用哪个库 提前致谢 看起来这就是您正在寻找的 适用于 Python 的简单
  • NumPy linalg.eig

    我有这个烦人的问题 但我还没有弄清楚 我有一个矩阵 我想找到特征向量 所以我写 val vec np linalg eig mymatrix 然后我得到了 vec 我的问题是 当我小组中的其他人对相同的矩阵 mymatrix 做同样的事情时
  • 从 Python 下载/安装 Windows 更新

    我正在编写一个脚本来自动安装 Windows 更新 我可以将其部署在多台计算机上 这样我就不必担心手动更新它们 我想用 Python 编写这个 但找不到任何关于如何完成此操作的信息 我需要知道如何搜索更新 下载更新并从 python 脚本安
  • “一旦获取切片就无法更新查询”。最佳实践?

    由于我的项目的性质 我发现自己不断地从查询集中取出切片 如下所示 Thread objects filter board requested board id order by updatedate 10 但这给我带来了实际对我选择的元素进
  • 如何在VIM中设置文件的正确路径?

    每当我击中 pwd在 vim 中命令总是返回路径C Windows system32 即使我在桌面上的 Python 文件中 所以每当我跑步时 python 命令返回 python can t open file Users myname
  • 更改 x 轴比例

    我使用 Matlab 创建了这个图 使用 matplotlib x 轴绘制大数字 例如 100000 200000 300000 我想要 1 2 3 和 10 5 之类的值来指示它实际上是 100000 200000 300000 有没有一
  • 编辑 Jupyter Notebook 时 VS Code 中缺少“在选择中查找”

    使用 Jupyter Notebook 时 VSCode 中缺少 在选择中查找 按钮 它会减慢开发速度 所以我想请问有人知道如何激活它吗 第一张图显示了在 python 文件中的搜索 替换 第二张图显示了笔记本电脑中缺少的按钮 Python
  • ValueError:不支持连续[重复]

    这个问题在这里已经有答案了 我正在使用 GridSearchCV 进行线性回归的交叉验证 不是分类器也不是逻辑回归 我还使用 StandardScaler 对 X 进行标准化 我的数据框有 17 个特征 X 和 5 个目标 y 观察 约11
  • 如何根据 HTTP 请求使用 Python 和 Flask 执行 shell 命令并流输出?

    下列的这个帖子 https stackoverflow com questions 15092961 how to continuously display python output in a webpage 我能够tail f网页的日志
  • Alembic:如何迁移模型中的自定义类型?

    My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
  • 如何在Python中按AaB而不是ABa顺序对字符串进行排序

    我正在尝试对字符串进行排序 为 punnetsquare 制作基因型 我目前的实现是 unsorted genotype ABaB sorted genotype sorted list unsorted genotype sorted s
  • 如何在 Azure 数据工厂 - Databricks 中使用 continuation_token 获取 ADF Pipeline 运行详细信息的下一页?

    我在用 adf client pipeline runs query by factory resourceGroupName 工厂名称 过滤器参数 的方法azure mgmt datafactory DataFactoryManageme
  • Werkzeug 中的线程和本地代理。用法

    首先 我想确保我正确理解了功能的分配 分配本地代理功能以通过线程内的模块 包 共享变量 对象 我对吗 其次 用法对我来说仍然不清楚 也许是因为我误解了作业 我用烧瓶 如果我有两个 或更多 模块 A B 我想将对象C从模块A导入到模块B 但我
  • 为什么我应该使用 WSGI?

    使用 mod python 一段时间了 我读了越来越多关于 WSGI 有多好的文章 但没有真正理解为什么 那么我为什么要切换到它呢 有什么好处 这很难吗 学习曲线值得吗 为了用 Python 开发复杂的 Web 应用程序 您可能会使用更全面
  • 在 Spyder 的变量资源管理器中查看局部变量

    我是 python 新手 正在使用 Spyder 的 IDE 我欣赏它的一项功能是它的变量资源管理器 然而 根据一些研究 我发现它只显示全局变量 我找到的解决方法是使用检查模块 import inspect local vars def m
  • 使用 pybtex 将 bibtex 转换为格式化的 HTML 参考书目,例如哈佛风格

    我正在使用 Django 并将 bibtex 存储在我的模型中 并且希望能够以格式化 HTML 字符串的形式向我的视图传递引用 使其看起来像哈佛引用样式 使用中描述的方法Pybtex 无法识别 bibtex 条目 https stackov
  • 使用 NLP 进行地址分割

    我目前正在开发一个项目 该项目应识别地址的每个部分 例如来自 str Jack London 121 Corvallis ARAD ap 1603 973130 输出应如下所示 street name Jack London no 121
  • Python对象初始化性能

    我只是做了一些快速的性能测试 我注意到一般情况下初始化列表比显式初始化列表慢大约四到六倍 这些可能是错误的术语 我不确定这里的行话 例如 gt gt gt import timeit gt gt gt print timeit timeit

随机推荐

  • NASM 一次打印一个字符

    为什么这个程序没有打印到屏幕上 我是否遗漏了 INT 80 命令中的某些内容 section bss section data hello db Hello World 0xa 10 is EOL section text global s
  • Android:如何在某些活动上隐藏 ActionBar

    我开发了一个简单的演示应用程序 其中包含启动屏幕 地图和一些常规屏幕 我的顶部有一个包含徽标的操作栏 在我的手机 Galaxy s1 I9000 V2 3 上一切看起来都很好 但是当我在 Galaxy s2 v4 上测试它时 操作栏也出现在
  • Unity 纸板方向横向颠倒

    您好 我有一个 Unity 应用程序 它使用 google Cardboard SDK 来启用立体视图 因此我将有一个支持 VR 的应用程序 我的应用程序运行得很好 但是 如果我将播放器设置方向设置为自动方向 并且只允许向左横向和向右横向
  • C 中一元加 (+) 运算符的用途是什么?

    在 C 语言中 这样写是合法的 int foo 4 然而 据我所知 一元加 in 4是一个空操作 是吗 您可以将其用作表达式具有算术类型的一种断言 define CHECK ARITHMETIC x x 如果出现以下情况 这将生成编译时错误
  • Django:在信号中获取 m2m 相关对象

    我有点想看到类似的问题 Django 从 post save 信号访问 ManyToMany 字段 但仍然没有看到如何获取更新的相关对象列表 例如 我有以下型号 class User models Model username models
  • 在我的 x64 笔记本电脑上将平台目标设置为 x86 会阻止某些 WPF 类型正确加载

    我有一台运行 Windows 7 64 位的 x64 计算机 自本周初以来 我的情况似乎很奇怪 如果我构建并运行一个平台目标设置为 x86 的 WPF 应用程序 则在尝试创建网格时遇到 MissingMethodException var
  • 为什么无论代码中的顺序如何,alert() 对话框都会首先显示?

    在下面的代码示例中 我希望 div 中的文本首先发生变化 但只有在我在警报对话框中单击 确定 后 文本才会更改 var x 0 function counter x document getElementById aDiv innerHTM
  • 处理屏幕方向 - Android

    我的应用程序中的屏幕方向出现问题 我在 res layout lan 文件夹中为横向模式创建了备用布局 问题发生在方向改变时 1 重新创建一个活动而不破坏旧的活动 2 由于我在应用程序中使用媒体播放器 因此在屏幕旋转时 mp3 同时在两个方
  • Apache:客户端被服务器配置拒绝

    我正进入 状态 2012 年 4 月 24 日星期二 12 12 55 错误 客户端 127 0 0 1 客户端被服务器配置拒绝 labs Projects Nebula bin 我的目录结构如下所示 我使用的是 Symfony 2 其他
  • 为什么自托管 gitlab 运行程序在克隆存储库并在自托管运行程序上执行作业时遇到问题

    我目前正在研究 GitLab 运行程序 以更好地了解它们在 CI CD 管道环境中的工作方式 我按照 GitLab 文档中的说明创建了一个自我管理的运行器 即我的个人 Windows 笔记本电脑 安装了 GitLab Runner 可执行文
  • 是否可以使用私有 API 在 iPhone 上运行后台进程?

    我不打算将应用程序发送到商店 而是进行有限分发 我在想 如果我可以使用私有 API 进行后台处理 那么我就可以加入 iphone 开发者企业计划 并在我的公司内分发一个在后台运行的应用程序 我想这个问题的延伸是 如果我是一名企业开发人员 有
  • 将数据库从 Postgres 迁移到 MySQL [关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 目前不接受答案 我已更改数据库PostgreSQL to mysql 但我不知道如何将数据从一个传输到另一个 有谁知道我可以从中复制 迁移数据库的任何命令Postg
  • 使用 GDI+ 调整图像大小

    我真的很想从这段代码中找出更多的性能 它不是大量使用的代码 但每次上传新图像时都会使用 并且每个图像使用 4 次 100px 200px 500px 700px 因此 当处理的图像超过 2 或 3 个时 服务器会变得有点忙 另外 我正在尝试
  • 如何从 displaytag 中的 struts2 复选框获取复选框值到操作类

    我正在研究struts2我正在使用的应用程序显示标签用于分页支持 现在我想要表中的每一行都有一个复选框 因为我正在这样做
  • Uml / 序列 / 包 / ... JavaScript 和 Electron 应用程序的图表替代方案?

    我的问题是是否可以绘制任何类型的图表来可视化 Electron JavaScript 应用程序 我需要不同的 uml 图的替代方案 比如类或包图 但由于 JS 是基于原型的 它不像 Java 或 C 我不知道我能做什么 我唯一能够制作的是序
  • 固定位置在 Chrome 中不起作用

    我正在创建这些叠加的上一个和下一个箭头 就像这个网站上的那样 http www usatoday com 我遇到的问题是在 Chrome 中 箭头不会保持固定 当我向下滚动页面时 箭头会随着页面上升 你再也看不到它们了 奇怪的是 在 Fir
  • 检测用户对 OpenGL 方块的触摸[重复]

    这个问题在这里已经有答案了 可能的重复 如何确定屏幕上 3D 空间中触摸的内容 我正在开发一个 Android 应用程序 我也在使用 OpenGL 图形 我在屏幕上画了一个正方形 我想让用户在触摸它时移动它 换句话说 当用户将手指放在方块上
  • 遍历 Excel 下拉列表/验证列表

    我有一个带有验证列表的单元格 该列表会根据其他设置而变化 是否可以在代码中迭代该单元格 是否也可以将该单元格设置为列表中的第 n 项 Example The drop down for E2 depends on what was sele
  • django - 用户注销后存储会话值

    使用 Djangologout当用户注销时 所有会话值都会被刷新 即使用户注销 我也有办法保留一些会话值吗 您可能希望使用 cookie 而不是 session 来实现此目的 views py login view After you ha
  • CSV 写入需要唯一分隔符的文本字符串

    我用 python 编写了一个 HTML 解析器 用于提取数据 使其在 csv 文件中看起来像这样 itemA itemB itemC Sentence that might contain commas or colons like th