Closed 。这个问题需要多问focused /help/closed-questions 。目前不接受答案。
我正在开发一个程序,需要根据给定的单词集创建一个语法正确的句子。在这里,我将向程序传递一个字符串列表的输入,我的输出应该是用这些单词和其他一些必要的单词组成的有意义的句子。例如。
Input: {'You' , 'House' , 'Beautiful'}
Output: 'Your house is beautiful' (or) 'you house is beautiful'
Input: {'Father' , 'Love' , 'Child'}
Output: 'The father loves the child'
如何使用 NLTK 和(或)机器学习来实现这一点?
关于我应该如何解决这个问题有什么建议吗?我已经准备好接受最疯狂的想法。谢谢! :)
在这种情况下,您可以应用n-gram模型 https://en.wikipedia.org/wiki/N-gram 。这个想法就是一句话
我非常喜欢NLP。
得到以下 3-gram:
<s> I like
I like NLP
like NLP very
NLP very much
very much </s>
然后你把它看作一个概率模型P(word3 | word1 word2)
.
所以你的工作将是:
获取大量 n 个单词的数据(例如我认为https://books.google.com/ngrams https://books.google.com/ngrams 有下载选项)
对于给定的一组单词,查找仅包含这些单词的所有 n 元语法
找出最有可能的组合。
请注意:
n 应至少为 3
n 越大,您就越有可能必须“back off https://en.wikipedia.org/wiki/Katz%27s_back-off_model “因为你没有数据(但 n 元语法可能存在并且有意义)
即使 n=5 也已经是非常多的数据了
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)