在 shell 中将 ANSI 转换为 UTF-8

2024-04-27

我正在制作一个解析器（1 csv 到 3 csv）脚本，但遇到问题。我是法国人，所以用我的语言我有这样的字母：é è à ....

一位客户向我发送了一个 csv 文件，Linux 将其识别为“unknown-8bit”（我猜是 ansi）。

在我的脚本中，我正在编写 3 个新的 csv 文件。但 ViM 将它们创建为 ISO latin1，因为它接近条目中的内容，但我的é,è,à...坏了。我需要UTF-8。

所以我尝试将第一个 ANSI csv 转换为 UTF-8 ：

iconv -f "windows-1252" -t "UTF-8" import.csv -o import.csv

问题是它破坏了我的 CSV。现在它只占一排。但我的特殊字符没问题。有没有办法将 ANSI 转换为 UTF-8 并保留我的行？

将输出放入另一个文件中。不要覆盖旧的。

iconv -f "windows-1252" -t "UTF-8" import.csv -o new_import.csv

iconv读取和写入同一文件时失败。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

bash

shell

csv

UTF8

iconv

在 shell 中将 ANSI 转换为 UTF-8 的相关文章

$PATH 中 /usr/bin 和 /usr/local/bin 等的顺序

在我的 Mac 上我经常使用 bash 对于我的环境设置我添加了 usr bin and usr local bin into PATH就像我平常做的那样虽然我知道什么 usr bin and usr local bin关于我很好奇
想要运行命令列表，但能够在运行时编辑该列表

我有一个要运行的 bash 命令列表
Web 本地应用程序 Apache：运行 shell 脚本

我开发了一个 shell 脚本我想用它创建一个 UI 我决定使用带有本地服务器的 Web 界面因为我对 HTML PHP 的了解很少比 QT 或 Java 的了解更多我只是希望我的 html 可以在我的计算机上运行 shell 脚本
Mysql 选择 csv 字符串中的 where 字段

我想从一个表中进行选择其中的字段位于传递给存储过程的给定 csv 字符串中最快的方法是什么我应该将这些值插入临时表并加入其中吗或者有没有办法用一个语句来做到这一点 Thanks 做了一些搜索并找到了一个很好的答案使用MySql的字
是否可以让 SQL Server 将排序规则转换为 UTF-8 / UTF-16

在我正在处理的一个项目中我的数据存储在 SQL Server 中并具有排序规则Danish Norwegian CI AS 数据通过 FreeTDS 和 ODBC 输出到将数据作为 UTF 8 处理的 python 一些字符如和编
使用 \COPY 将带有 JSON 字段的 CSV 加载到 Postgres 中

我正在尝试使用 COPY 命令将 TSV 数据从文件加载到 Postgres 表中这是一个示例数据行 2017 11 22 23 00 00 id 123 class 101 level 3 这是我正在使用的 psql 命令 COPY b
将 csv 写入谷歌云存储

我试图了解如何将多行 csv 文件写入谷歌云存储我只是没有遵循文档 https googlecloudplatform github io google cloud python stable storage blobs html hig
在docker镜像中运行多个脚本

您好我想知道是否可以在 docker 容器启动时自动同时运行两个脚本第一个脚本必须运行客户端应用程序第二个脚本必须运行服务器应用程序作为后台 You can use CMD在你的Dockerfile https docs docker
当存在多个字段分隔符时使用 AWK 忽略字段内的逗号

我想像下面这样解析 CSV 记录awk or gawk 这些字段以逗号分隔但最后一个字段 6 很特殊因为它确实由子字段组成这些子字段由作为字段分隔符或者准确地说分隔这本身不是问题我可以使用awk F 设置替代字段分隔符但
将 word2vec 模型查询的结果保存在 csv 文件中？

我正在语料库上训练 word2vec 模型然后查询该模型这工作正常但我正在运行一个实验需要针对不同的条件调用模型保存每个条件的模型查询每个条件的模型然后将查询的输出保存到 csv 文件中例如进一步分析所有条件我研究了 ge
Bash：查找并连接文件

我有以下结构 home DIR1 file ab csv DIR2 file cd csv DIR3 file3 ef csv Where file csv包含多行浮点数每个 DIR 都有不同的浮点数我想抓取所有的内容file csv文
如何使用 cron 作业运行 python 文件

您好我创建了一个 python 文件例如file example py 该文件将输出 sensex 值假设该文件在linux系统上的路径为 Desktop downloads file example py 我通常会运行该文件pyth
json_encode() 非 utf-8 字符串？

所以我有一个字符串数组并且所有字符串都使用系统默认值ANSI编码并从 SQL 数据库中提取因此有 256 种不同的可能的字符字节值单字节编码有什么方法可以让我得到json encode 工作并显示这些字符而不必使用utf8 enco
UTF8 vs. UTF16 vs. char* vs. 什么？谁来给我解释一下这个烂摊子！

我已经设法忽略所有这些多字节字符的东西但现在我需要做一些 UI 工作我知道我在这方面的无知将会赶上我谁能用几段或更少的内容解释我需要知道什么以便我可以本地化我的应用程序我应该使用什么类型我同时使用 Net 和 C C 并且我需要
如何从脚本向 sudo 提供密码？

请注意这是在我的本地计算机上运行的来宾虚拟机 VBox 我不担心安全性我正在编写一个将在 Linux Ubuntu VM 上执行的脚本myuser用户该脚本将在下面创建一个非常大的目录树 etc myapp 目前我必须手动完成所有这些
Bash 中的 Shellshock 漏洞背后的行为是有记录的还是有意为之？

最近的一个漏洞 CVE 2014 6271 http web nvd nist gov view vuln detail vulnId CVE 2014 6271 如何Bash http en wikipedia org wiki Bash
当我通过 shell 脚本创建 .txt 文件时，为什么文件名末尾出现问号？ [复制]

这个问题在这里已经有答案了我正在编写一个 shell 脚本我应该在其中创建 1 个文本文件当我这样做时文件名末尾出现一个问号是什么原因我正在 bash 脚本中尝试以下方法 1 grep ERROR a1 gt text txt
Python UTF-8转换问题

在我的数据库中我存储了一些 UTF 8 字符例如名称字段中的通过 Django ORM 当我读到这个时我得到了类似的东西 gt gt gt p name u xce xb1 gt gt gt print p name 我本来希望
如何编写对 UTF-8 安全的代码？

我们有一组针对 ASCII 字符集开发的应用程序现在我们正尝试在冰岛安装它但遇到了冰岛字符被搞砸的问题我们正在解决我们的问题但我想知道是否有一个好的指南来编写专为 8 位字符设计的 C 代码并且在提供 UTF 8 数据时可
如何“grep”连续流？

可以用吗grep在连续的流中我的意思是有点tail f

随机推荐

根据 Excel 模板修改 Outlook 电子邮件的 HTMLBody

我正在尝试根据模板从 Excel VBA 修改 Outlook 电子邮件的 HTML 正文我的代码是 Sub Email Button Dim OutApp As Outlook Application Dim OutMail As Ou
Android 模拟器无法在 MAC 上运行

下载 Android Studio 后我一直在尝试使用 Android 模拟器我以前使用过旧的三星 S4 但需要与 Marshmallow 兼容的设备才能实现某些功能我看到的问题是模拟器不运行 Android 屏幕显示好像正在准备启
(python) matplotlib pyplot show() .. 是否阻塞？

我遇到了这个麻烦show 一遍又一遍我确信我做错了什么但不确定做我想做的事情的正确方法我认为我想要的是某种方法来阻塞主线程直到 GUI 线程中发生事件这样的事情第一次起作用 from matplotlib import py
Couchbase 网络错误 16，node.js 中套接字断言失败

我有以下 node js 脚本几天前运行良好但现在出现此错误 syd HP Notebook Desktop node db js connected to database Error Network error code 16 no
Android：onSensorChanged 的替代方案？当手机背面放在桌子上时（没有移动时）没有加速度计数据

所以我使用这段代码来获取加速度计数据当我在 DDMS 模式下检查打印语句正在打印的内容时我注意到当手机不动时没有打印任何内容 IE 它在桌上我认为原因是当手机不移动时不会调用 onSensorChanged 然后当手机再次开始移动时调
Java - TreeSet 和 hashCode()

我有一个简单的问题TreeSet http docs oracle com javase 8 docs api java util TreeSet html收藏品和hashCode http docs oracle com javase 8
Zsh 颜色部分制表符补全

是否可以在Zsh中对部分完成结果的已完成部分进行着色 Fish 默认执行此操作至少在 Gentoo 中如下图所示全尺寸图像 https i stack imgur com KaL1g png https i stack imgur c
OpenCV Python - 如何实现RANSAC来检测直线？

我正在尝试检测包含道路的图像上的线条使用高斯平滑和 Canny 边缘检测我在尝试实现 RANSAC 时遇到了困难我基本上不知道如何去做我可以获得一个粗略的想法或一个带有实现 RANSAC 的随机图像 foo png 的工作代码吗 N
Java 加载资源的首选方式

我想知道在Java中加载资源的最佳方法 this getClass getResource or getResourceAsStream Thread currentThread getContextClassLoader getResou
父元素的递归串联

我有一个看起来像这样的表 ID Name Parent 1 A NULL 2 B NULL 3 C 1 4 D 1 5 E 3 6 F 5 我想要一个视图返回这个 ID Name ParentNames 1 A 2 B 3 C A 4 D
使用正则表达式从字符串中提取日期和时间

我正在开发一个正则表达式它接受所有可能的日期和时间格式以从句子中提取它们这是我的正则表达式 31 0 13578 1 02 Jan Mar May Jul Aug Oct Dec 1 1 30 0 1 3 9 1 0 2 Jan Ma
在 SQL Azure 数据库中创建链接服务器[重复]

这个问题在这里已经有答案了我们使用两个用于跨数据库查询的数据库一个名为 azureDB1 另一个名为 azureDB2 这些数据库驻留在我的 Azure 云 SQL Server 上我们的场景是从 azureDB1 调用驻留在 azu
Java 语法

这段代码 List
使用 'with' 时 Laravel ownsTo 返回 null

我刚刚开始使用 Laravel 所以请原谅任何菜鸟我有一个User and Order模型中一个用户有多个订单 Inside User model public function orders this gt hasMany Order
通过 requests 模块发送 JSON 并使用 Bottle.py 和cherrypy 捕获它

我有一个服务器需要能够接受 JSON 然后处理它然后发回 JSON 我的服务器端的代码正在使用Bottle py 与cherrypy 所关注的路线如下 route tagTweets method POST def tagTweets r
System.Windows.Application.GetResourceStream 返回 null

如果我调试一个以 Catalog xaml 作为内容的 WPF 应用程序我无法获取它的资源流 GetResourceStream 返回 null var uri new Uri Assembly component Catalog xam
如何从 Flask 调用另一个 Web 服务 api

我在 Flask 服务器中使用重定向来调用另一个 Web 服务 api e g app route hello def hello return redirect http google com 网址逻辑上会更改为 google com 但
如何在 psql 中使用数组包含值子句进行选择

我有专栏arr这是类型array 我需要获取行在哪里arr列包含值s 这个查询 SELECT FROM table WHERE arr gt ARRAY s 给出错误错误运算符不存在字符变化 gt 文本为什么它不起作用附注我知道
只响应第一个 WM_KEYDOWN 通知？

Win32 应用程序如何仅响应第一个 WM KEYDOWN 通知 MSDN 文档声称第 30 位指定先前的按键状态如果在发送消息之前按键处于按下状态则该值为 1 如果按键处于按下状态则该值为 0 但在我的 WndProc 中第 3
在 shell 中将 ANSI 转换为 UTF-8

我正在制作一个解析器 1 csv 到 3 csv 脚本但遇到问题我是法国人所以用我的语言我有这样的字母一位客户向我发送了一个 csv 文件 Linux 将其识别为 unknown 8bit 我猜是 ansi 在我的脚本中我正在编写

在 shell 中将 ANSI 转换为 UTF-8

在 shell 中将 ANSI 转换为 UTF-8 的相关文章

随机推荐

热门标签