我的用例涉及索引 Lucene 文档,然后在将来的多个场合添加指向此现有文档的术语,而无需为每个新术语删除并重新添加整个文档(因为性能,并且不保留原始术语)。
我确实知道文档无法真正更新。我的问题是why?
或者更准确地说,为什么不支持所有形式的更新(术语、存储字段)?
为什么无法添加另一个术语来指向现有文档 - 从技术上讲:所需要做的不仅仅是将现有文档 ID 放置在该术语的发布列表中。为什么这么难?是否存在一些不可改变的统计数据?
是否有任何解决方法可以支持我向现有文档添加术语(索引字段)的用例?
我确实知道文档无法真正更新。我的问题是为什么?
Gili,编辑文档将导致相关术语发布的更改,由于术语发布列表结构,这是有问题的。倒排列表被排序并按顺序存储在内存中。因此,要将文档添加到术语的发布列表中,您必须为其指定更高的级别doc id
这是通过删除整个文档并重新索引来完成的。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)