What is 条件随机场?
具体如何条件随机场识别结构化或非结构化文本中的人、组织或地点等专有名称?
例如:该产品由 StackOverFlow Inc. 订购。
条件随机场如何将 StackOverFlow Inc. 识别为一个组织?
CRF 是一种判别性批量标记模型,与最大熵马尔可夫模型属于同一系列。
完整的解释有书本那么长。
简短解释如下:
- 人类注释 200-500K 字的文本,标记实体。
- 人类选择一组他们希望指示实体的特征。例如大小写,或者该单词是否在训练集中带有标签。
- 训练过程会计算特征的所有出现次数。
- CRF 算法的核心内容是搜索符合计数的所有可能模型的空间,以找到一个相当好的模型。
- 在运行时,解码器(可能是维特比解码器)查看句子并决定为每个单词分配什么标签。
其中最难的部分是第 4 步中的特征选择和搜索算法。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)