我想知道如何you如果删除空格,会用英语(或其他西方语言)对字符串进行标记吗?
这个问题的灵感来源于村上小说《羊人》中的角色舞蹈 舞蹈 舞蹈 http://en.wikipedia.org/wiki/Dance_Dance_Dance'
在小说中,羊人被翻译成这样说:
“就像我们说的,我们会尽我们所能。尝试将你重新连接到你想要的东西,”羊人说。 “但是我们不能独自完成这件事。你也必须工作。”
因此,保留了一些标点符号,但不是全部。足以供人阅读,但有些随意。
为此构建解析器的策略是什么?常见的字母组合、音节计数、条件语法、前瞻/后瞻正则表达式等?
具体来说,就Python而言,你将如何构建一个(宽容的)翻译流程?不要求完整的答案,只是更多地询问你的思维过程将如何解决问题。
我以一种无聊的方式问这个问题,但我认为这个问题可能会得到一些有趣的(nlp/加密/频率/社交)答案。
谢谢!
大约八个月前,我实际上为工作做了类似的事情。我只是在哈希表中使用了英语单词词典(查找时间为 O(1))。我会逐个字母匹配整个单词。它运作良好,但存在许多含糊之处。 (asshit 可以是 ass hit 或 asshit)。要解决这些歧义,需要更复杂的语法分析。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)