搜索文件内容的几种方式

2023-05-16

搜索文件的几种方式:

一、提取文件, 插入数据库text,使用like 查询。

使用poi或PageOffice提取文件内容文字

缺点:只适合数据量不大的情况

二、提取文件, 插入数据库text,创建文件索引。

select * from 表名 where match(content) against('a');

缺点:索引的长度有限制。必须添加4条以上。中文支持不好(前后模糊查询查不到,要用空格分隔才行)。经常出现的不会索引,查不到。

三、使用搜索引擎Elasticsearch

安装插件: ik 分词器 使用ik_smart或ik_max_word

安装插件:ingest-attachment(8+版本不用安装)

定义pipline

转化成 Base64 编码

上传文件

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

搜索文件内容的几种方式 的相关文章

随机推荐