将外语从csv文件导入到Stata

2024-04-07

我正在使用Stata 12。我遇到了以下问题。我正在使用以下命令将一堆 .csv 文件导入到 Statainsheet命令。数据集可能包括俄语、克罗地亚语、土耳其语等。我认为它们是用“UTF-8”编码的。在 .csv 文件中,它们是正确的。我把它们导入Stata后,原来的字符串不正确,变成了奇怪的字符。你能帮我一下吗? Stat-Transfer 能解决这些问题吗?它支持.csv 格式吗?

For example, the original file is like: enter image description here

我的代码是这样的: 内表使用 name.csv, c n 保存名称.dta,替换

The result is like: enter image description here

而且我尝试在字体选项中调整脚本,但不起作用。


正如 @Nick Cox 之前评论的那样,问题在于 Stata 不支持 Unicode/UTF-8 编码。 不,StatTransfer 无法解决问题(请参阅这个解释 http://www.stattransfer.com/faq/encoding.html).

您可以使用在线解码器或 MS Word 来实现此目的。让我们首先使用一种语言来完成此操作,例如屏幕截图中的俄语。检查克罗地亚语、土耳其语和您拥有的其他语言的正确编码。

  1. 将 .csv 文件中的字符串变量另存为纯文本 (.txt),选择 UTF-8 编码选项。
  2. Encoding conversion:
    • 使用 @Dimitriy V. Masterov 建议的 iconv,或者
    • 使用在线工具,例如this http://www.gofunnow.com/convertutf8/convertutf8.php#.UmzdNRC4OQc:上传.txt文件,选择源编码为UTF-8,根据感兴趣的语言选择输出编码(对于俄语,必须是CP1251),单击“转换”按钮并保存输出文件,或者
    • 如果您有 MS Office,则也可以使用 MS Word 来达到相同的目的。右键单击.txt 文件,选择“打开方式...”,选择使用 MS Word 打开。在出现的窗口中,确认文件编码为“Unicode (UTF-8)”,打开,然后单击“另存为...”,另存为纯文本。在新出现的窗口中,选择“西里尔字母(Windows)”并标记“插入换行符”。节省。
  3. 检查你的新 .txt 文件 - 它仍然应该有一些奇怪的字符(如 ÌßÑÎÊÎÌÁÈÍÀÒ),但现在 Stata 可以正确显示它们。
  4. Copy-paste the new string variable in Stata Data Editor, right click on the variable, choose "Font...", and then string "Cyrillic". You should see correct names on the screen both in data editor and in the results window (even though the string itself is intact).
    example of the CP1251 encoding in Stata

根据您的操作系统,您可能需要首先安装所有适当的语言。
希望能帮助到你。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

将外语从csv文件导入到Stata 的相关文章

  • Python 正确解析 CSV

    我对 Python 很陌生 我想解析 csv 文件 以便它能够识别带引号的值 例如 1997年 福特 E350 超级豪华卡车 应该拆分为 1997 福特 E350 超级豪华卡车 and NOT 1997 福特 E350 超级 豪华卡车 如果
  • 哪些类型的语言允许以编程方式创建变量名称?

    这个问题纯粹出于求知欲 在相对频繁地浏览 Python 部分后 我看到了许多类似的问题this https stackoverflow com questions 1429814 how to programmatically set a
  • Google Apps 脚本 Gmail CSV 导入工作表错误

    我从各种谷歌搜索中拼凑了这段代码 如果电子邮件有特定标签 这些代码将提取电子邮件的 CSV 附件 function importCSVFromGmail gets first latest message with set label va
  • Wordpress 插件 - 调用未定义的函数 finfo_open() [重复]

    这个问题在这里已经有答案了 我正在尝试使用CSV Me http wordpress org plugins csv me 插件 以便让我们的客户将 csv 文件上传到数据库 当我尝试上传文件作为测试时 我收到以下错误消息 Fatal er
  • CSV 损坏,如何修复?

    我正在尝试解析 CSV 我想将它放入数据库或只是用 JavaScript 解析它 但由于语法损坏 任何一种方法都会失败 我的整个 CSV 文件在这里 https gist github com 1023560 https gist gith
  • pentaho 从不同的 csv 中相互划分 2 列

    在pentaho中 我有2个csv文件 我需要将列彼此分开并将结果写入新表中 1 csv No A B 1 10 14 2 8 20 2 csv No A B 1 2 7 2 4 10 输出应该是 输出 csv No A B 1 5 2 2
  • 如何删除除日期列之外所有行均为 NaN 的位置?

    我正在尝试从 csv 文件中删除 NaN 值 但我只想删除所有列均为空的行 下面附有我要删除的行的图片 文件链接 https filebin net ou93iqiinss02l0g https filebin net ou93iqiins
  • 如何在python中查找csv文档中的特定行

    我想要做的是读入 csv 文档并找到 SN 列 gt 20 中的所有值 然后创建一个仅包含 SN gt 20 行的新文件 我知道我需要做 阅读原始文件 打开一个新文件 迭代原始文件的行 我能够做的是找到 SN gt 20 的行 import
  • 在 Android 应用程序中读取 CSV 文件

    我正在开发一个概念验证应用程序 以便我可以在我正在制作的更大的应用程序中实现该功能 我对 Java 和 Android 开发有点陌生 但希望这个问题不会太简单或太复杂 基本上 我试图从 CSV 文件中读取字符串列表 并使其可用于在应用程序的
  • 将文本文件转换为逗号分隔的字符串

    我似乎没有找到与这个问题完全匹配的问题 我有一个文本文件 每行有一个文本标记 没有任何逗号 制表符或引号 我想根据文件内容创建一个逗号分隔的字符串 Input one two three Output one two three 我正在使用
  • 将 CSV 文件上传到 SQL 服务器

    上传大文件的最佳方式是什么csv使用 C 将数据文件导入 SQL Server 该文件包含大约 30 000 行和 25 列 首先 你不需要编程的东西 您可以使用 SQL 管理工具直接将 CSV 文件上传到 SQL 数据库 但是 如果您确实
  • 将多个文件读取到多个数据框中

    在d 文件夹中 我有很多Stata文件 例如data aa 1 dta data aa 2 dta data aa 3 dta data bb 1 dta data bb 2 dta data bb 3 dta data cc 1 dta
  • Mysql 选择 csv 字符串中的 where 字段

    我想从一个表中进行选择 其中的字段位于传递给存储过程的给定 csv 字符串中 最快的方法是什么 我应该将这些值插入临时表并加入其中吗 或者有没有办法用一个语句来做到这一点 Thanks 做了一些搜索并找到了一个很好的答案 使用MySql的字
  • LOAD DATA LOCAL INFILE 给出错误:此 MySQL 版本不允许使用命令

    我有一个调用 MySQL 的 PHP 脚本LOAD DATA INFILE从 CSV 文件加载数据 但是 在生产服务器上 我最终遇到了以下错误 用户访问被拒绝 使用密码 是 作为快速解决方法 我将命令更改为LOAD DATA LOCAL I
  • 将 word2vec 模型查询的结果保存在 csv 文件中?

    我正在语料库上训练 word2vec 模型 然后查询该模型 这工作正常 但我正在运行一个实验 需要针对不同的条件调用模型 保存每个条件的模型 查询每个条件的模型 然后将查询的输出保存到 csv 文件中 例如进一步分析所有条件 我研究了 ge
  • Bash:查找并连接文件

    我有以下结构 home DIR1 file ab csv DIR2 file cd csv DIR3 file3 ef csv Where file csv包含多行浮点数 每个 DIR 都有不同的浮点数 我想抓取所有的内容file csv文
  • 导入 csv 文件数据以填充 Prolog 知识库

    我有一个 csv 文件example csv其中包含两列 标题为 var1 和 var2 我想填充一个最初为空的 Prolog 知识库文件import pl具有重复的事实 而每一行example csv处理方式相同 fact A1 A2 f
  • 可以写入 csv 文件但不能追加

    string pathDesktop Environment GetFolderPath Environment SpecialFolder Desktop string filePath pathDesktop mycsvfile csv
  • 在谷歌云上训练神经网络时出现“无法获取路径的文件系统”错误

    我正在使用 Google Cloud 在云上训练神经网络 如下例所示 https cloud google com blog big data 2016 12 how to classify images with tensorflow u
  • 在 PHP 中将 CSV 写入不带括号的文件

    是否有本机函数或实体类 库用于将数组写入 CSV 文件中的一行而无需封装 fputcsv将默认为 如果没有为封装参数传入任何内容 谷歌让我失望了 返回一大堆有关的页面的结果 fputcsv PEAR 的库做的事情或多或少与fputcsv 工

随机推荐

  • 从现有虚拟机创建 docker 镜像

    我需要使用 CentOS 和 MySQL 创建 docker 基础镜像 但我已经有这样的虚拟机 没有docker 如何从现有的虚拟机创建基础 docker 镜像并在另一台带有 docker 的机器上使用它 虽然其他评论者正确地指出 将虚拟机
  • 如何获取 pandas .p​​lot(kind='kde') 的输出

    当我绘制我的 pandas 系列的密度分布时 我使用 plot kind kde 是否可以获得该图的输出值 如果是的话该怎么做 我需要绘制的值 plot kind kde https pandas pydata org docs refer
  • 确定选择哪个 JRadioButton 的最佳方法是什么?

    目前我正在以这种方式获取选定的按钮 但如果这是正确 最好的方法 我不会 也许有比这更简单或更面向对象的东西 private int getFilterType JRadioButton buttons for int i 0 n butto
  • 使用 Angular 将日期转换为东部时区

    我从服务器获取数据如下 2015 03 05T16 51 56 00 00 使用 Angular 我想将此日期 时间显示为东部时间日期 有没有办法用 Angular 指定不同的时区 我正在做类似的事情 myDate date medium
  • Android 持久内容观察者

    Android 中的内容观察者是否持久 如果我在活动中创建内容观察者 该观察者是否会继续运行 直到我删除该观察者 基本上 我正在创建一项短信服务 在接收和发送时 我将短信发布到网络服务 这样我就可以在没有手机的情况下检查我的消息 如果内容观
  • libAdIdAccess.a 位置?

    按照说明在 iOS 上将 IDFA 与 Google Analytics 结合使用 https developers google com analytics devguides collection ios v3 optional fea
  • Pandas groupby 多个字段然后 diff

    所以我的数据框看起来像这样 date site country score 0 2018 01 01 google us 100 1 2018 01 01 google ch 50 2 2018 01 02 google us 70 3 2
  • 如何使用 ConstraintLayout 让第一个 View 缩小以适应剩余空间?

    我有以下布局 注意Z位于下方Y 但限制在底部 之间有一个很好的间隙Y and Z 由多余的垂直空间提供 这是我的desired and actual当存在时的行为多余的垂直空间 但是 当显示键盘时 我用完了多余的垂直空间 期望的行为 没有多
  • 有没有办法*防止* ReSharper 并行运行程序集的单元测试?

    我在单元测试设置中看到一个选项 并行运行最多 1 2 个程序集 但将其设置为 1 似乎仍然并行执行单个程序集的测试 有没有办法完全禁用并行执行 这是 ReSharper 6 1 您可以尝试在此处查看堆栈溢出答案如何串行运行 NUnit 测试
  • 如何编写一个以可变参数函数作为参数的 Haskell 函数

    我正在尝试创建一个函数 该函数获取可变参数函数一个论点 i e func a gt gt a gt a 我怎样才能做到这一点 我读过关于多变量函数 https stackoverflow com questions 3467279 how
  • 使用 NLTK python 对使用示例数据或 Web 服务的句子进行情感分析?

    我正在着手一个用于情感分析的 NLP 项目 我已经成功安装了Python的NLTK 看起来是一个很棒的软件 但是 我无法理解如何使用它来完成我的任务 这是我的任务 我从一长条数据开始 假设来自他们的网络服务的数百条关于英国大选主题的推文 我
  • 当鼠标悬停在其中一个链接上时,CSS 会更改两个链接

    我有以下 html div div class section ul li class home li a href home class goto home Home a li li class about li a href about
  • 方法 Illuminate\Auth\RequestGuard::attempt 不存在

    我对 laravel 和 lumen 都是新手 我正在lumen 5 6中使用oauth2 0创建登录api 我已经安装了护照并生成了令牌 下面是我的登录控制器功能 它工作正常 它返回令牌 namespace App Http Contro
  • 如何在Android Studio中导入libstreaming?

    我是一名使用 Eclipse IDE 的老开发人员 现在我切换到 Android Studio 我想使用下面的教程 直播库 http www androidhive info 2014 06 android streaming live c
  • 如何只打开一个 fancybox 窗口(而不是 onclick)

    我正在触发 fancybox 打开onclick像这样 telefonosOtrosPaises fancybox type iframe href http es solmelia com nMenus jsp telefonosOtro
  • 使用 rust-cpython 从 Rust 并行运行 Python 代码

    我正在尝试使用 Rust 加速数据管道 该管道包含一些我不想修改的 Python 代码 因此我尝试使用 Rust 按原样运行它们rust cpython https docs rs cpython 0 4 1 cpython 和多线程 然而
  • 在 MVC5 中运行更新数据库时出错

    我有一个 MVC 5 应用程序 它的 MySQL 数据库托管在 Azure 中 它运行得很好 但是今天当我尝试输入 Update Database 并运行它时 我收到以下错误消息 System Runtime Serialization S
  • 如何在 Fossil 中闭合叶子

    The Fossil SCM 中的分支文档 http www fossil scm org index html doc tip www branching wiki表示如果叶子具有闭合标签 则该叶子被视为闭合 然而 当我进入 gt fos
  • 通过 jQuery Ajax 传递 PHP 数组

    我有一个 php 数组 toField explode ids Which looks something like 24 25 26 29 我想通过 jQuery AJAX 传递这个数组 如下所示
  • 将外语从csv文件导入到Stata

    我正在使用Stata 12 我遇到了以下问题 我正在使用以下命令将一堆 csv 文件导入到 Statainsheet命令 数据集可能包括俄语 克罗地亚语 土耳其语等 我认为它们是用 UTF 8 编码的 在 csv 文件中 它们是正确的 我把