将大数据从 Oracle DB 索引到弹性搜索集群有哪些选项?要求是将 3 亿条记录一次性索引到多个索引中,并且每天进行大约 100 万次更改的增量更新。
我尝试过 Elasticsearch 的 JDBC 插件河流/支线,两者似乎都在内部运行或需要本地运行的弹性搜索实例。请告诉我是否有更好的选择来将弹性搜索索引器作为独立作业运行(可能基于java)。任何建议都会非常有帮助。
谢谢。
我们使用 ES 作为报告数据库,当新记录写入 SQL 时,我们采取以下操作将它们放入 ES:
- 将主键写入队列(我们使用rabbitMQ)
- Rabbit(有时间的时候)拿起主键并查询关系数据库以获取所需的信息,然后将数据写入ES
这个过程非常有效,因为它可以处理新数据和旧数据。对于旧数据,只需编写一个快速脚本将 300M 主键写入 Rabbit 即可完成!
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)