我尝试编写一个应用程序来学习外文字符。例如,如果您想学习日语,那么您必须记住所有平假名、片假名和汉字字母。 (例如あ、い、か... = 平假名カ、サ、ケ... = 片假名本、学... = 汉字)。
例子:
一些用户正在尝试学习日语。所以他必须学习:
か = 卡
本 = hon,含义:基础/书/这个
而且他还必须学习发音。
我的第一个问题是是否有任何库或其他东西可以在.net 中轻松完成此操作?我还查看了 Microsoft IME,但我真的不知道如何在我的项目中使用它。
我也看了Unicode数据库,基本上是可以的。我还设法编写了一个将か转换为ka的项目。唯一缺少的是含义(例如本=basis/book/this),这些含义也是由 Unicode 数据库提供的。不幸的是,我在获取 UCD 数据的 .XML 文件中找不到它们。
当我在上面输入单词时,它起作用了UCD-网站 http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=%E6%9C%AC.
另一种方法是使用 CLDR-Library,它似乎也与 UCD 相关。不幸的是,我不知道应该使用这两者(UCD 或 CLDR)中的哪一个。
CLDR:http://cldr.unicode.org/ http://cldr.unicode.org/
我的问题是 UCD 是否是最好的方法以及我是否也可以使用 CLDR。
我真的不想使用普通列表,我只是自己输入所有字符。这会花费太多时间,尤其是对于所有汉字字母(超过 10,000 个)。
Thanks
编辑:我解决了它,我从 Unicode 字符数据库(UCD)中提取信息。您可以将整个数据库下载为 .XML 文件。我只需要学习如何处理它并找到正确的属性。
Google 和 Microsoft 都提供可调用的 API 来翻译文本。
例如http://www.microsoft.com/en-us/translator/translatorapi.aspx http://www.microsoft.com/en-us/translator/translatorapi.aspx
根据您选择的服务类型,可能需要支付少量费用。
他们还为翻译提供声音。
无需重新发明这个轮子。 :-)
如果这是一个 CodePage 类型的问题。
这个博客是一个有趣的起点http://www.joelonsoftware.com/articles/Unicode.html http://www.joelonsoftware.com/articles/Unicode.html
编辑:回应有关选项的评论。 Google 可以提供多种可能的翻译
eg for 本
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)