我需要为 Microsoft Search Server 2008 开发一个 IFilter,它执行长时间的计算来提取文本。从一个文件中提取文本可能需要 5 秒到 12 小时。我如何设计这样的 IFilter,以便守护进程不会在超时时重置它,并且其他 IFilter 在挂起时也可以在超时时重置?
12个小时,哇!
如果需要很长时间并且有很多文件,则最好的选择是创建一个预处理应用程序,该应用程序将提取文本并使其可供 iFilter 访问。
另一种选择是创建文档的 html 摘要并指示爬虫对这些摘要进行索引。如有必要,摘要页面是否可以轻松链接到文档本身。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)