使用斯坦福 NER 从文本文档中提取地址?

2024-02-25

我正在寻找斯坦福大学NER http://nlp.stanford.edu/software/CRF-NER.shtml并考虑使用 JAVA API 从文本文档中提取邮政地址。该文件可以是任何包含邮政地址部分的文件,例如水电费、电费。

所以我的想法是,

  1. 使用 LOCATION 和其他原始命名实体将邮政地址定义为命名实体。
  2. 定义分段和其他子流程。

我正在尝试找到一个相同的示例管道(需要哪些详细步骤),以前有人这样做过吗?欢迎提出建议。


需要明确的是:所有功劳都归功于 Raj Vardhan(和 John Bauer),他们在[java-nlp-用户] https://mailman.stanford.edu/pipermail/java-nlp-user/2014-February/005003.html邮件列表。

Raj Vardhan 写了关于“在句子中查找街道地址”的计划:

这是我想到的一个方法:

  1. 找出事件锚点造句
  2. 在中选择传出边缘语义图从该事件节点 具有诸如*“准备”*或之类的关系“准备”。
  3. 如果关系中的依赖值具有 POS 标记作为 NNP

a)从依赖值的节点中找到具有如下关系的出边 作为"nn"

b) 按出现顺序递增的顺序连接所有此类节点 句子。

c) 将结果值打印为事件发生的位置

这显然是基于某些假设,例如直接依赖 句子中的事件锚点和位置之间。

不确定这是否对您有帮助,但我想提一下以防万一。再次强调,任何功劳都应归功于 Raj Vardhan(和 John Bauer)。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用斯坦福 NER 从文本文档中提取地址? 的相关文章

随机推荐