elasticsearch(一)

2023-05-16

倒排索引(又叫反向索引)

生活场景

  1. 背诵诗词
    普通索引是 key->诗歌名称; value -> 诗歌内容
    倒排索引是 key->诗歌内容里面的字 value -> 诗歌内容

索引压缩

索引量暴增:倒排索引一首诗歌或者一篇文章会产生很多倒排索引
索引value可以指向诗歌名,索引key还是指向诗歌内容里面的字。
多首诗可以形成索引矩阵

搜索引擎原理

根据一个内容搜索到要找的文章。
关键都是建立倒排索引。
百度、谷歌搜索基本都是网页爬虫+停顿词过滤等

停顿词

文章中没有意义的词,可以认为是停顿词,不需要建立索引

分词

文章内容 经过停顿词过滤的过程,就是分词。
经过分词之后获取到关键字,对关键字建立倒排索引

搜索引擎的过程

爬取内容 ——> 进行分词 ——> 建立反向索引(倒排索引)

简介

elasticsearch是由lucence基础上改造而来。lucence是一个库,可以建立倒排索引。但是只有懂搜索引擎原理的人才能用的好。elasticsearch对其进行了封装,通过restful api就可以进行操作,使用方便;elasticsearch实现了分布式。

专有名词

索引

此索引不是倒排索引,而是一个存放数据的地方,类似mysql中的一个数据库

类型

用来定义数据结构,类似mysql中的一张表

文档

类似mysql中的一行记录

内容存储

实例:比如一首诗,有诗题、作者、朝代、字数、诗内容等字段,那么首先,我们可以建立一个名叫 Poems 的索引,然后创建一个名叫 Poem 的类型,类型是通过 Mapping 来定义每个字段的类型。

Keyword 类型是不会分词的,直接根据字符串内容建立反向索引,Text 类型在存入 Elasticsearch
的时候,会先分词,然后根据分词后的内容建立反向索引。

Elasticsearch 把操作都封装成了 HTTP 的 API,我们只要给 Elasticsearch 发送 HTTP 请求就行。

比如使用 curl -XPUT ‘http://ip:port/poems’,就能建立一个名为 Poems 的索引,其他操作也是类似的。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

elasticsearch(一) 的相关文章

随机推荐

  • 速看!2022年11月编程语言排行榜出炉!第一名太牛啦

    速看 xff01 2022年11月编程语言排行榜出炉 xff01 第一名太牛啦 每月更新一次的Tiobe编程排行榜来啦 xff01 快跟着肉肉一起看看11月的新看点吧 一 榜单情况 这里只展示排名靠前的前15名 xff1a TOP 10编程
  • 2022年12月编程语言排行榜,最新数据来了!

    2022年迎来了最后一个月 xff0c 也就是说新的一年马上就要到了 xff01 在这一年中编程语言起起伏伏 xff0c 有的语言始终炙手可热 xff0c 而有的语言却逐渐 没落 日前 xff0c 全球知名TIOBE编程语言社区发布了12月
  • angular模板加载

    angular模板加载 ng template Angularjs作为mvc xff08 或者说mvvm 框架 xff0c 同样具备模板这一基本概念 NG加载模板的顺序为 内存加载 AJAX加载 如果排版乱掉 xff0c 请查阅 https
  • 【HIVE】(四)数据导入/导出

    学习搬运工 xff0c 笔记摘自 实验楼课程 一 实验介绍 实验内容 Hive 数据的导入导出EXPORT 命令导出数据表或分区 xff0c 与元数据一起输出到指定位置 又可以从这个输出位置移动到不同的Hadoop 或Hive 实例中 xf
  • MySQL中的自增主键用完了怎么办

    目录 一场面试引发的血案 引发的问题 解决方案 扩展 目前业内在线修改表结构的方案 使用mysql5 6 43 提供的在线修改功能 借助第三方工具 改从库表结构 xff0c 然后主从切换 专业版回答 一场面试引发的血案 面试官 34 用过m
  • redis面试连环炮

    目录 Redis 的通讯协议是什么 Redis 究竟有没有 ACID 事务 Redis 的乐观锁 Watch 是怎么实现的 Redis 是如何持久化的 Redis 在内存使用上是如何开源节流 Redis 是如何实现主从复制 Redis 是怎
  • 一个字符串展现多种字体、字号、字体大小(NSAttributedString)

    NSAttributedString叫做富文本 xff0c 是一种带有属性的字符串 xff0c 通过它可以轻松的在一个字符串中表现出多种字体 字号 字体大小等各不相同的风格 xff0c 还可以对段落进行格式化 以下是实现代码 xff1a U
  • mybatis源码浅析①

    创建SqlSessionFactory 读取配置文件 Class getResource String path 1 path不以 39 开头时 xff0c 默认是从此类所在的包下取资源 xff1b 2 path 以 39 开头时 xff0
  • linux日志查看技巧

    版权声明 xff1a 本文为博主原创文章 xff0c 遵循 CC 4 0 BY SA 版权协议 xff0c 转载请附上原文出处链接和本声明 本文链接 xff1a https blog csdn net zw235345721 article
  • Ubuntu杀手锏命令

    常用命令 Ubuntu GNOME快捷键 Ctrl 43 Alt 43 T xff08 打开GNOME终端窗口 xff09 Alt 43 F1 显示所有应用窗口 类似Windows中 Alt 43 Tab Alt 43 F2 运行程序快捷键
  • 线程之我见(一)

    目录 概念线程状态NEW xff08 初始状态 xff09 定义实例 RUNNABLE xff08 就绪 执行中状态 xff09 定义实例 BLOCKED xff08 阻塞状态 xff09 定义实例 概念 是操作系统能够进行运算调度的最小单
  • 深入分析java对象克隆

    目录 1 什么是 34 克隆 34 xff1f 2 浅克隆与深克隆3 实现克隆的方法 1 什么是 34 克隆 34 xff1f 由一个现有对象A xff0c 复制生成一个新的对象B的过程 B的初始值是由A对象确定的 拷贝对象返回的是一个新对
  • 经典书刊推荐

    剑指offer 大话设计模式 mysql必知必会 程序员面试金典 java并发编程实战 计算机操作系统第三版 计算机网络 深入理解java虚拟机 java编程思想 Java数据结构和算法中文第二版 Spring技术内幕 xff1a 深入解析
  • 深入理解java序列化和反序列化

    目录 1 定义2 方法3 自定义的序列化和反序列化策略4 为什么必须实现Serializable4 使用场景5 总结 1 定义 Java序列化是指把Java对象转换为字节序列的过程 xff1b Java反序列化是指把字节序列恢复为Java对
  • 秒杀系统之超买问题详解

    目录 1 场景2 方法3 总结 1 场景 假设现在库存只有一个商品了 xff0c 多线程下如何保证最后库存是0而不是负数 2 方法 MySQL中的排他锁 update goods set num span class token opera
  • java乐观锁之CAS原理解析

    目录 含义原理分析CPU原语CAS缺陷ABA问题循环时间长开销大只能对单个共享变量保证原子性操作 含义 CAS CompareAndSwap 即比较并替换 xff0c 实现并发算法时常用到的一种技术 CAS操作包含三个操作数 内存位置 预期
  • 常用词汇

    deutsch 发音 xff1a d t 含义 xff1a adj lt 德 gt 德国的 实例 You know Deutsch is so rational it emphases whole structure and logics
  • 什么是MybatisPlus

    简介 MybatisPlus是一个用来简化Mybatis的持久层框架 xff0c 与其具有类似作用的框架还有JPA tk mapper 特性 无侵入 xff1a 只做增强不做改变 xff0c 引入它不会对现有工程产生影响损耗小 xff1a
  • 策略模式

    简介 策略模式就是把各个平等的具体实现进行抽象 封装成为独立的算法类 xff0c 然后通过上下文和具体的算法类来进行交互 各个策略算法都是平等的 xff0c 地位是一样的 xff0c 正是由于各个算法的平等性 xff0c 所以它们才是可以相
  • elasticsearch(一)

    倒排索引 又叫反向索引 生活场景 背诵诗词 普通索引是 key gt 诗歌名称 xff1b value gt 诗歌内容 倒排索引是 key gt 诗歌内容里面的字 value gt 诗歌内容 索引压缩 索引量暴增 xff1a 倒排索引一首诗