Unicode 基本多语言平面对于 CJK 使用者来说足够了吗?

2024-02-05

问题:“仅支持 Unicode BMP 是否足以使中文/日文/韩文母语人士能够以其母语使用应用程序?”

我现在最关心的是说日语的人,但我也对中国人的答案感兴趣。如果应用程序仅支持 BMP 上的字符 - 是否会导致该应用程序对于中文/日文用户不可用(即应用程序不允许数据输入/显示补充字符)?

我并不是在问 BMP 是否是任何类型的应用程序所需要的唯一东西(显然不是 - 特别是对于全世界的所有语言)。我要求 CJK 使用者在专业环境中使用一种现代的普通应用程序来处理一般的自由文本输入(包括姓名、地点等) - BMP 通常就足够了吗?

即使只支持 BMP 是不正确的 - 它会非常接近/“足够好”吗?应用程序中缺少补充字符是否只是偶尔造成的轻微不便?或者,例如,说日语的人会认为该应用程序完全损坏了吗?特别是考虑到他们总是能够通过用平假名/片假名拼出有问题的单词来解决这个问题?

对于没有后备选项的中文用户来说,缺少补充字符会被视为一个令人停止的问题吗?

我在这里考虑的是一般的专业背景——而不是社交或游戏的东西。举个例子,辅助平面上有很多表情符号 - 但我个人不会认为不支持 Unicode 表情符号字符的英文应用程序是“损坏的”,至少对于大多数专业用途来说是这样。

我现在正在处理的应用程序是用 Java 编写的,但我认为这个问题更普遍。知道答案也将帮助我(无论语言如何)更好地了解在字体支持方面我必须付出多少努力。


EDIT

澄清:通过“仅支持 BMP”——我希望应用程序能够优雅地处理补充字符。
不支持的字符(包括 BMP 代理代码块)的处理方式与大多数应用程序处理 ASCII 控制代码和其他不需要的字符的方式类似 - 过滤/禁止数据输入,并在必要时“处理”显示(过滤掉或替换为 unicode 替换字符)。


对于可能正在寻找实际问题的实际答案的人:提示此问题的应用程序现已投入生产,仅允许 BMP 中的字符(实际上是有限的子集)。

多个国际客户在生产中使用韩语 - 日语即将上线。中国正在计划中(我怀疑 BMP 是否足以满足这一要求,但我想我们会看到的)。

没关系 - 没有报告与不支持的字符相关的问题。

但这实际上只是轶事证据。仅仅因为我的客户对此感到满意,并不意味着您的客户也会如此。就上下文而言,该应用程序的客户是国际公司,数百名员工使用该应用程序处理数十万客户。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Unicode 基本多语言平面对于 CJK 使用者来说足够了吗? 的相关文章

  • 换行符 unicode 字符

    我想要一个可用于表示新行的 Unicode 字符 我以前见过它 但通过我尝试过的任何谷歌搜索都找不到它 它看起来像这样 lt 有几种可能性 选择也可能取决于字体 因为并非所有字体都适用于所有字体 并且其中一些具有相当不同的形状 并且有些在小
  • 使用 XSLT 转换 XML 并保留 Unicode 字符

    我的 XSLT 转换已经成功了几个月 直到我遇到带有 Unicode 字符 很可能是表情符号 的 XML 文件 我需要保留 Unicode 但 XSLT 正在将其转换为 HTML 实体 我认为将编码设置为 UTF 8 可以解决我的问题 但我
  • python print() 函数实际上是做什么的?

    我正在看这个question https stackoverflow com questions 1979171 how can i escape xff xfe to a readable string并开始想知道什么是print实际上确
  • 在 Python 中使用 glob.glob 和带有 unicode 文件名的正则表达式的独立于文件系统的方式

    我正在开发一个库 我想保持平台 文件系统和 Python2 x 3 x 的独立性 但是 我不知道如何以独立于平台 文件系统的方式全局查找文件并将文件名与正则表达式进行匹配 例如 在 Mac 上 使用 IPython Python 2 7 I
  • 如何让Python bs4在XML上正常工作?

    我正在尝试使用 Python 和 BeautifulSoup 4 bs4 将 Inkscape SVG 转换为某些专有软件的类似 XML 的格式 我似乎无法让 bs4 正确解析一个最小的示例 我需要解析器尊重自闭标签 处理 unicode
  • Pandas.read_csv() 列名称中带有特殊字符(重音符号)�

    我有一个csv包含一些带有列名称的数据的文件 时期 IAS brut IAS liss 发生率 哨兵 我对第三个有疑问 IAS liss 这是被误解的pd read csv 方法并返回为 那个角色是什么 因为它在我的烧瓶应用程序中生成错误
  • 是否可以在 Visual Studio 2010 项目中使用多个“字符集”?

    如您所知 在 Visual Studio 2010 c 中 我们有 noset unicode 和 MBCS 字符集 我们可以通过菜单或预处理器指令 如 define UNICODE 来设置它 我正在开发一个项目 它有一个使用 MBCS 字
  • 如何打印/存储非 ASCII 字符(unicode?)

    我正在阅读大量的音乐家档案 其中许多艺术家的名字中都有奇怪的字符 因为他们可能来自德国或其他一些具有非 ASCII 字符的国家 我希望能够将这些音乐家的名字存储在列表中并将它们打印到控制台 如何打印从文本文件读入的带有奇怪字符的字符串 让我
  • 带有 unicode 键的字典

    Python 中是否可以使用 Unicode 字符作为字典的键 我使用 Unicode 中的西里尔字母作为键 当尝试通过键获取值时 我得到以下回溯 Traceback most recent call last File baseCreat
  • 字符串中的换行符未写入文件

    我正在尝试编写一个程序来操作从文件中读取的 unicode 字符串 我想到了两种方法 一种方法是读取包含换行符的整个文件 执行几个正则表达式替换 然后将其写回另一个文件 另一种方法是读取包含换行符的整个文件 执行几个正则表达式替换 然后将其
  • Python - Map/Reduce - 如何在使用 DISCO 计数单词示例中读取 JSON 特定字段

    我正在按照 DISCO 示例来计算文件中的单词数 将单词数作为 Map Reduce 作业 http discoproject org doc disco start tutorial html 我对此工作没有任何问题 但是我想尝试从包含
  • 如何使用C来限制SubString、Limit? [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 第1节 include
  • 在R包/.Rd文件中搜索unicode字符

    如何在 R 包或特定文件中搜索特定的 unicode 字符 我使用的是 RStudio IDE 我正在尝试向 CRAN 提交包裹 所有检查均通过 但以下情况除外 W checking PDF version of manual 49 5s
  • 如何修复 Python 中损坏的 utf-8 编码?

    我的字符串是Ni m B T t Thi n s Nh t H nh 我想将其解码为Ni m B T t Thi n s Nh t H nh 我在那个网站上看到可以做到这一点http www enderminh com minh utf8
  • 如何编写对 UTF-8 安全的代码?

    我们有一组针对 ASCII 字符集开发的应用程序 现在 我们正尝试在冰岛安装它 但遇到了冰岛字符被搞砸的问题 我们正在解决我们的问题 但我想知道 是否有一个好的 指南 来编写专为 8 位字符设计的 C 代码 并且在提供 UTF 8 数据时可
  • 解析 HTTP 标头值:引用、RFC 5987、MIME 等

    让我困惑的是 HTTP 标头的解码values 示例标头 Some Header quoted string utf 8 en Weirdness 罐头value s被引用 a 的编码怎么样 本身 是 有效的引号字符 分号有什么意义 HTT
  • ASCIIEncoding.ASCII.GetBytes() 返回意外值

    这段 C 代码 string s u00C0 byte bytes ASCIIEncoding ASCII GetBytes s Trace WriteLine BitConverter ToString bytes 产生以下输出 3F 为
  • 如何在javascript中删除一组表情符号中的最后一个表情符号?

    假设我的字符串中有 3 个表情符号 字符串中没有任何空格或除表情符号之外的任何其他字符 如何删除javascript中最后一个表情符号 下面的答案不使用任何特殊的包并安全地删除最后一个表情符号 function safeEmojiBacks
  • 如何在 Java/Eclipse 中使用特殊字符

    如何在 Java Eclipse 中使用 显示 或 等字符 当我尝试直接使用它们时 例如在源代码中 Eclipse无法保存文件 我能做些什么 编辑 如何找到 unicode 转义序列 问题是您使用的字符无法以文件设置的编码 Cp1252 表
  • MySQL 将 ÅäÖ 视为 AAO?

    这两个查询给了我完全相同的结果 select from topics where name Harligt select from topics where name H rligt 这怎么可能 看起来mysql在搜索时会将 翻译成aao

随机推荐