我们经常需要将数据文件发送给我们的一位客户,其中包含他/她需要翻译的数据库中的数据。大多数情况下,此导出为 CSV 或 XLS。
大多数时候,我们使用 phpmyadmin 创建 csv 转储,并获得包含翻译数据的 xls 文件。问题是,大多数时候数据是UTF8,当文件以xls形式返回时,每次我们再次将数据加载到mysql中时,我们都会遇到utf8问题,字符无法正确显示等......
我们已经仔细检查了 mysql 中从 my.cnf 到列字符集的所有内容,并且所有内容均已正确设置为 UTF8。
我的问题是not如何解决编码问题,因为这个问题已经解决了,但是我们将来如何最好地处理这种情况?我们应该提交什么导出格式?我们应该如何导入(只需mysql加载数据infile或我们自己的处理脚本)。对于如何处理这种情况,普遍的共识是什么?
如果可能的话,我们希望继续使用 Excel,因为这是几乎每个人(包括我们客户的翻译机构)都期望的格式。我们客户的易用性是这里最重要的因素,而不是每次都让我们因重大问题而超负荷。两全其美的 :)
我目前正在开发的应用程序还包括数据导入的功能。数据大部分采用utf-8编码。
我的方法是将导入的 CSV(或制表符分隔)(以任何编码)文件预处理为客户端脚本(Python)中正确的 utf-8 编码的临时 CSV 文件,并使用加载文件的内容加载数据文件 http://dev.mysql.com/doc/refman/5.1/en/load-data.html陈述。
文件的编码由控制字符集数据库 http://dev.mysql.com/doc/refman/5.1/en/server-system-variables.html#sysvar_character_set_database系统变量(该变量应在服务器级别设置)并且从 MySQL 5.1.17 开始可以被覆盖字符集LOAD DATA INFILE 子句。
唯一应该知道的是 MySQL 为每个字符存储最多 3 个字节,而不是 4 个(这对于东方语言来说可能是一个问题)。
要有效导出大量数据,您可以使用选择...进入概要文件陈述。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)