elasticsearch基本查询(此处为2.x版本)

2023-11-06

public class JavaESQuery {
    
    private TransportClient client;
    
    @Before
    public void testBefore() {
        Settings settings = Settings.settingsBuilder().put("cluster.name", "wenbronk_escluster").build();
        client = TransportClient.builder().settings(settings).build()
                 .addTransportAddress(new InetSocketTransportAddress(new InetSocketAddress("192.168.50.37", 9300)));
        System.out.println("success to connect escluster");
    }

    /**
     * 使用get查询
     */
    @Test
    public void testGet() {
        GetRequestBuilder requestBuilder = client.prepareGet("twitter", "tweet", "1");
        GetResponse response = requestBuilder.execute().actionGet();
        GetResponse getResponse = requestBuilder.get();
        ListenableActionFuture<GetResponse> execute = requestBuilder.execute();
        System.out.println(response.getSourceAsString());
    }
    
    /**
     * 使用QueryBuilder
     * termQuery("key", obj) 完全匹配
     * termsQuery("key", obj1, obj2..)   一次匹配多个值
     * matchQuery("key", Obj) 单个匹配, field不支持通配符, 前缀具高级特性
     * multiMatchQuery("text", "field1", "field2"..);  匹配多个字段, field有通配符忒行
     * matchAllQuery();         匹配所有文件
     */
    @Test
    public void testQueryBuilder() {
//        QueryBuilder queryBuilder = QueryBuilders.termQuery("user", "kimchy");
      QueryBUilder queryBuilder = QueryBuilders.termQuery("user", "kimchy", "wenbronk", "vini");
QueryBuilders.termsQuery("user", new ArrayList<String>().add("kimchy")); // QueryBuilder queryBuilder = QueryBuilders.matchQuery("user", "kimchy"); // QueryBuilder queryBuilder = QueryBuilders.multiMatchQuery("kimchy", "user", "message", "gender"); QueryBuilder queryBuilder = QueryBuilders.matchAllQuery(); searchFunction(queryBuilder); } /** * 组合查询 * must(QueryBuilders) : AND * mustNot(QueryBuilders): NOT * should: : OR */ @Test public void testQueryBuilder2() { QueryBuilder queryBuilder = QueryBuilders.boolQuery() .must(QueryBuilders.termQuery("user", "kimchy")) .mustNot(QueryBuilders.termQuery("message", "nihao")) .should(QueryBuilders.termQuery("gender", "male")); searchFunction(queryBuilder); } /** * 只查询一个id的 * QueryBuilders.idsQuery(String...type).ids(Collection<String> ids) */ @Test public void testIdsQuery() { QueryBuilder queryBuilder = QueryBuilders.idsQuery().ids("1"); searchFunction(queryBuilder); } /** * 包裹查询, 高于设定分数, 不计算相关性 */ @Test public void testConstantScoreQuery() { QueryBuilder queryBuilder = QueryBuilders.constantScoreQuery(QueryBuilders.termQuery("name", "kimchy")).boost(2.0f); searchFunction(queryBuilder); // 过滤查询 // QueryBuilders.constantScoreQuery(FilterBuilders.termQuery("name", "kimchy")).boost(2.0f); } /** * disMax查询 * 对子查询的结果做union, score沿用子查询score的最大值, * 广泛用于muti-field查询 */ @Test public void testDisMaxQuery() { QueryBuilder queryBuilder = QueryBuilders.disMaxQuery() .add(QueryBuilders.termQuery("user", "kimch")) // 查询条件 .add(QueryBuilders.termQuery("message", "hello")) .boost(1.3f) .tieBreaker(0.7f); searchFunction(queryBuilder); } /** * 模糊查询 * 不能用通配符, 不知道干啥用 */ @Test public void testFuzzyQuery() { QueryBuilder queryBuilder = QueryBuilders.fuzzyQuery("user", "kimch"); searchFunction(queryBuilder); } /** * 父或子的文档查询 */ @Test public void testChildQuery() { QueryBuilder queryBuilder = QueryBuilders.hasChildQuery("sonDoc", QueryBuilders.termQuery("name", "vini")); searchFunction(queryBuilder); } /** * moreLikeThisQuery: 实现基于内容推荐, 支持实现一句话相似文章查询 * { "more_like_this" : { "fields" : ["title", "content"], // 要匹配的字段, 不填默认_all "like_text" : "text like this one", // 匹配的文本 } } percent_terms_to_match:匹配项(term)的百分比,默认是0.3 min_term_freq:一篇文档中一个词语至少出现次数,小于这个值的词将被忽略,默认是2 max_query_terms:一条查询语句中允许最多查询词语的个数,默认是25 stop_words:设置停止词,匹配时会忽略停止词 min_doc_freq:一个词语最少在多少篇文档中出现,小于这个值的词会将被忽略,默认是无限制 max_doc_freq:一个词语最多在多少篇文档中出现,大于这个值的词会将被忽略,默认是无限制 min_word_len:最小的词语长度,默认是0 max_word_len:最多的词语长度,默认无限制 boost_terms:设置词语权重,默认是1 boost:设置查询权重,默认是1 analyzer:设置使用的分词器,默认是使用该字段指定的分词器 */ @Test public void testMoreLikeThisQuery() { QueryBuilder queryBuilder = QueryBuilders.moreLikeThisQuery("user") .like("kimchy"); // .minTermFreq(1) //最少出现的次数 // .maxQueryTerms(12); // 最多允许查询的词语 searchFunction(queryBuilder); } /** * 前缀查询 */ @Test public void testPrefixQuery() { QueryBuilder queryBuilder = QueryBuilders.matchQuery("user", "kimchy"); searchFunction(queryBuilder); } /** * 查询解析查询字符串 */ @Test public void testQueryString() { QueryBuilder queryBuilder = QueryBuilders.queryStringQuery("+kimchy"); searchFunction(queryBuilder); } /** * 范围内查询 */ public void testRangeQuery() { QueryBuilder queryBuilder = QueryBuilders.rangeQuery("user") .from("kimchy") .to("wenbronk") .includeLower(true) // 包含上界 .includeUpper(true); // 包含下届 searchFunction(queryBuilder); } /** * 跨度查询 */ @Test public void testSpanQueries() { QueryBuilder queryBuilder1 = QueryBuilders.spanFirstQuery(QueryBuilders.spanTermQuery("name", "葫芦580娃"), 30000); // Max查询范围的结束位置 QueryBuilder queryBuilder2 = QueryBuilders.spanNearQuery() .clause(QueryBuilders.spanTermQuery("name", "葫芦580娃")) // Span Term Queries .clause(QueryBuilders.spanTermQuery("name", "葫芦3812娃")) .clause(QueryBuilders.spanTermQuery("name", "葫芦7139娃")) .slop(30000) // Slop factor .inOrder(false) .collectPayloads(false); // Span Not QueryBuilder queryBuilder3 = QueryBuilders.spanNotQuery() .include(QueryBuilders.spanTermQuery("name", "葫芦580娃")) .exclude(QueryBuilders.spanTermQuery("home", "山西省太原市2552街道")); // Span Or QueryBuilder queryBuilder4 = QueryBuilders.spanOrQuery() .clause(QueryBuilders.spanTermQuery("name", "葫芦580娃")) .clause(QueryBuilders.spanTermQuery("name", "葫芦3812娃")) .clause(QueryBuilders.spanTermQuery("name", "葫芦7139娃")); // Span Term QueryBuilder queryBuilder5 = QueryBuilders.spanTermQuery("name", "葫芦580娃"); } /** * 测试子查询 */ @Test public void testTopChildrenQuery() { QueryBuilders.hasChildQuery("tweet", QueryBuilders.termQuery("user", "kimchy")) .scoreMode("max"); } /** * 通配符查询, 支持 * * 匹配任何字符序列, 包括空 * 避免* 开始, 会检索大量内容造成效率缓慢 */ @Test public void testWildCardQuery() { QueryBuilder queryBuilder = QueryBuilders.wildcardQuery("user", "ki*hy"); searchFunction(queryBuilder); } /** * 嵌套查询, 内嵌文档查询 */ @Test public void testNestedQuery() { QueryBuilder queryBuilder = QueryBuilders.nestedQuery("location", QueryBuilders.boolQuery() .must(QueryBuilders.matchQuery("location.lat", 0.962590433140581)) .must(QueryBuilders.rangeQuery("location.lon").lt(36.0000).gt(0.000))) .scoreMode("total"); } /** * 测试索引查询 */ @Test public void testIndicesQueryBuilder () { QueryBuilder queryBuilder = QueryBuilders.indicesQuery( QueryBuilders.termQuery("user", "kimchy"), "index1", "index2") .noMatchQuery(QueryBuilders.termQuery("user", "kimchy")); } /** * 查询遍历抽取 * @param queryBuilder */ private void searchFunction(QueryBuilder queryBuilder) { SearchResponse response = client.prepareSearch("twitter") .setSearchType(SearchType.DFS_QUERY_THEN_FETCH) .setScroll(new TimeValue(60000)) .setQuery(queryBuilder) .setSize(100).execute().actionGet(); while(true) { response = client.prepareSearchScroll(response.getScrollId()) .setScroll(new TimeValue(60000)).execute().actionGet(); for (SearchHit hit : response.getHits()) { Iterator<Entry<String, Object>> iterator = hit.getSource().entrySet().iterator(); while(iterator.hasNext()) { Entry<String, Object> next = iterator.next(); System.out.println(next.getKey() + ": " + next.getValue()); if(response.getHits().hits().length == 0) { break; } } } break; } // testResponse(response); } /** * 对response结果的分析 * @param response */ public void testResponse(SearchResponse response) { // 命中的记录数 long totalHits = response.getHits().totalHits(); for (SearchHit searchHit : response.getHits()) { // 打分 float score = searchHit.getScore(); // 文章id int id = Integer.parseInt(searchHit.getSource().get("id").toString()); // title String title = searchHit.getSource().get("title").toString(); // 内容 String content = searchHit.getSource().get("content").toString(); // 文章更新时间 long updatetime = Long.parseLong(searchHit.getSource().get("updatetime").toString()); } } /** * 对结果设置高亮显示 */ public void testHighLighted() { /* 5.0 版本后的高亮设置 * client.#().#().highlighter(hBuilder).execute().actionGet(); HighlightBuilder hBuilder = new HighlightBuilder(); hBuilder.preTags("<h2>"); hBuilder.postTags("</h2>"); hBuilder.field("user"); // 设置高亮显示的字段 */ // 加入查询中 SearchResponse response = client.prepareSearch("blog") .setQuery(QueryBuilders.matchAllQuery()) .addHighlightedField("user") // 添加高亮的字段 .setHighlighterPreTags("<h1>") .setHighlighterPostTags("</h1>") .execute().actionGet(); // 遍历结果, 获取高亮片段 SearchHits searchHits = response.getHits(); for(SearchHit hit:searchHits){ System.out.println("String方式打印文档搜索内容:"); System.out.println(hit.getSourceAsString()); System.out.println("Map方式打印高亮内容"); System.out.println(hit.getHighlightFields()); System.out.println("遍历高亮集合,打印高亮片段:"); Text[] text = hit.getHighlightFields().get("title").getFragments(); for (Text str : text) { System.out.println(str.string()); } } } }

转载地址:https://www.cnblogs.com/wenbronk/p/6432990.html

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

elasticsearch基本查询(此处为2.x版本) 的相关文章

随机推荐

  • 大数据课程K2——Spark的RDD弹性分布式数据集

    文章作者邮箱 yugongshiye sina cn 地址 广东惠州 本章节目的 了解Spark的RDD结构 掌握Spark的RDD操作方法 掌握Spark的RDD常用变换方法 常用执行方法 一 Spark最核心的数据结构 RDD弹性分布式
  • asp.net实现验证码程序

    1 可以实现验证码的自动更新 2 验证码html代码 li class mjiao2 span 验 证 码 span li
  • 出现Uncaught ReferenceError: $ is not defined错误

    今天在写ajax请求的时候 出现了Uncaught ReferenceError is not defined报错 未定义是为什么呢 后来才知道 原因一 你未引用jquery库jquery min js文件 或者说路径错误 原因二 忽略了H
  • 脚本语言与编译语言的区别

    文章目录 一 语法差异 二 执行方式差异 三 应用领域差异 四 总结 一 语法差异 脚本语言 脚本语言通常使用解释器逐行执行 不需要事先编译 它的语法相对简单 易于学习和使用 常见的脚本语言有Python JavaScript和Ruby等
  • 机器学习笔记(4)— 多特征变量

    1 多特征变量 本文主要介绍多特征变量的梯度下降法和特征缩放内容 2 多特征 多变量 多特征变量的目标函数为 假设x0 1 则目标函数为 把特征量x看作是一个向量 把特征量的参数也看做一个向量 所以目标函数可以表示为 多特征量的目标函数 又
  • linux 下 npm安装依赖报:stack Error: `gyp` failed with exit code: 1

    解决办法 切换到当前项目下即可 gt rm rf node gyp gt npm install g node gyp gt rm rf 项目 node modules 再次 npm install即可
  • Matlab学习入门篇(五)—— 数据可视化

    文章目录 一 离散数据图 1 1散点图 1 2 条形图 二 线图 2 1 二维线图 2 2 三维参数化曲线绘图函数 三 曲面 体积和多边形 数据可视化是指运用 计算机图形学和 图像处理技术 将数据转化为图形或图像并在屏幕上显示出来 以进行交
  • 合成数据加速高质量数据供给,AIGC的救星来了!

    毫无疑问 人工智能发展离不开海量数据 但真实世界的数据是有限的 且数据获取 数据标注等面临诸多难题 数据成为AI行业的 掣肘 如何打破 半个月来 数据要素频繁获得政策部门发声 中国证监会科技监管局局长姚前日前发文建议重点发展基于AIGC技术
  • MYSQL常见的4种数据类型

    转自 微点阅读 https www weidianyuedu com 一 数据类型是什么 数据类型是指列 存储过程参数 表达式和局部变量的数据特征 它决定了数据的存储格式 代表了不同的信息类型 有一些数据是要存储为数字的 数字当中有些是要存
  • Rust- 迭代器

    In Rust an iterator is a pattern that allows you to perform some task on a sequence of items in turn An iterator is resp
  • springBoot整合kafka配置

    pom xml
  • Java中定义常量(Constant) 的几种方法

    Method One interface ConstantInterface String SUNDAY SUNDAY String MONDAY MONDAY String TUESDAY TUESDAY String WEDNESDAY
  • python 之 使用 for-in 循环遍历范围,元组,列表,字典

    语法格式 for 变量 in 范围 元素 集合等 for循环语法结构列如序列或迭代器作为其参数每次迭代其中一个元素 与while循环一样 支持break continue else语句 一般情况下 循环次数未知采用while循环 循环次数已
  • 硬件安全技术——芯片安全设计技术2

    硬件安全技术 芯片安全设计技术2 芯片安全设计技术2 一 常见的公钥密码算法 1 公钥密码概述 2 RSA密码算法 3 RSA算法描述 4 ECC椭圆曲线算法 二 常见的使用场景 1 非对称算法应用 2 常见应用1 网络认证 3 常见应用2
  • 关于oracle和mysql等服务不能开机自启的解决方法

    oracle服务设置自启动 开始菜单点重启服务是可以正常启动的 但点关机后再通过开关机键启动windows 服务无法正常启动 尝试了更改注册表 查看系统日志 修复ntdll dll文件 更换dll文件修改权限 重装系统等方式后 都无法解决
  • 【C语言初阶】 数组

    博客主页 小王又困了 系列专栏 C语言 人之为学 不日近则日退 感谢大家点赞 收藏 评论 目录 一 认识数组 二 一维数组的创建和初始化 1 数组的创建 2 数组的初始化 字符的初始化 3 数组的引用 4 数组在内存的存储 三 二维数组的创
  • 【Qt】QModbusDevice类

    1 概述 QModbusDevice类是Modbus类 QModbusServer和 QModbusClient的基类 Header include qmake QT serialbus Since Qt 5 8 Inherits QObj
  • 献给童鞋们python教程:Collections模块的Counter容器类使用

    本文来源于公众号 csdn2299 喜欢可以关注公众号 程序员学府 文章目录 1 collections模块 2 Counter类 2 1 创建 2 2 计数值的访问与缺失的键 2 3 计数器的更新 update和subtract 2 4
  • 爬取植物数据库:使用 Python 获取植物信息

    在这篇博客中 我们将学习如何使用 Python 编写一个网络爬虫 从植物数据库网站中获取植物信息 我们将使用 requests BeautifulSoup 和 pandas 库来实现这个功能 文章将包括以下内容 目录 1 爬虫的基本概念 2
  • elasticsearch基本查询(此处为2.x版本)

    public class JavaESQuery private TransportClient client Before public void testBefore Settings settings Settings setting