如何根据常用语音中的使用频率随机生成字母?
任何伪代码都值得赞赏,但如果用 Java 实现就更棒了。否则,只需朝正确的方向戳一下就会有所帮助。
注意:我不需要生成使用频率 - 我确信我可以很容易地查找到它。
我假设您将频率存储为 0 到 1 之间的浮点数,总和为 1。
首先,您应该准备一个累积频率表,即该字母及其之前所有字母的频率之和。
为了简化,如果您从这个频率分布开始:
A 0.1
B 0.3
C 0.4
D 0.2
您的累积频率表将是:
A 0.1
B 0.4 (= 0.1 + 0.3)
C 0.8 (= 0.1 + 0.3 + 0.4)
D 1.0 (= 0.1 + 0.3 + 0.4 + 0.2)
现在生成一个 0 到 1 之间的随机数,并查看该数字在此列表中的位置。选择累积频率最小且大于随机数的字母。一些例子:
假设您随机选择 0.612。该值介于 0.4 和 0.8 之间,即介于 B 和 C 之间,因此您会选择 C。
如果你的随机数是 0.039,它在 0.1 之前,即在 A 之前,所以选择 A。
我希望这是有道理的,否则请随时要求澄清!
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)