搜索文件的几种方式:
一、提取文件, 插入数据库text,使用like 查询。
使用poi或PageOffice提取文件内容文字
缺点:只适合数据量不大的情况
二、提取文件, 插入数据库text,创建文件索引。
select * from 表名 where match(content) against('a');
缺点:索引的长度有限制。必须添加4条以上。中文支持不好(前后模糊查询查不到,要用空格分隔才行)。经常出现的不会索引,查不到。
三、使用搜索引擎Elasticsearch
安装插件: ik 分词器 使用ik_smart或ik_max_word
安装插件:ingest-attachment(8+版本不用安装)
定义pipline
转化成 Base64 编码
上传文件
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)