Elasticsearch学习笔记

2023-11-06

第1章 Elasticsearch概述

01-开篇

结构化数据，非结构化数据，半结构化数据含义
结构化数据：结构化数据是按照预定义的模式和格式进行组织的数据。它通常以表格、关系数据库或者类似的数据存储形式存在，具有固定的字段和数据类型。结构化数据的特点是数据的组织结构明确，容易进行查询、分析和处理。常见的结构化数据包括电子表格数据、数据库记录等。
非结构化数据：非结构化数据是指没有明确结构和格式的数据。它不适合使用传统的表格或数据库来存储和组织，通常以文本、图像、音频、视频等形式存在。非结构化数据的特点是数据的组织形式不规则，难以直接进行处理和分析。常见的非结构化数据包括电子邮件、社交媒体帖子、图像和视频文件等。
半结构化数据是介于结构化数据和非结构化数据之间的一种数据类型。它具有一定的结构，但不像完全结构化数据那样严格遵循预定义的模式和格式。半结构化数据通常以文本文件、XML文档、JSON对象等形式存在，其中包含了一些标记或标签，用于标识数据的一部分。这些标记可以帮助解析和理解数据的含义，但并不限制数据的具体结构。半结构化数据的特点是灵活性和扩展性。它可以适应不同的数据模式和格式变化，而无需进行严格的数据模式定义。这使得半结构化数据在处理动态和变化的数据时具有优势，例如处理日志文件、社交媒体数据、传感器数据等。
区别：
数据组织形式：结构化数据按照预定义的模式和格式进行组织，而非结构化数据没有明确的结构和格式。
数据处理方式：结构化数据容易进行查询、分析和处理，而非结构化数据处理起来相对困难。
数据存储形式：结构化数据通常以表格、关系数据库等形式存储，而非结构化数据以文本、图像、音频、视频等形式存储。
数据分析能力：结构化数据可以进行复杂的数据分析，而非结构化数据的分析能力相对有限。
图解：
结构化数据
非结构化数据

半结构化数据

B站参考视频-01

02-技术选型

Elasticsearch 是什么

Elasticsearch是一个开源的分布式搜索和分析引擎，它基于Apache Lucene库构建而成。它被设计用于处理大规模的实时数据，并提供快速、可靠的搜索和分析功能。
Elasticsearch采用分布式架构，可以在多个节点上存储和处理数据。它使用倒排索引技术来加快搜索速度，同时支持全文搜索、结构化搜索和地理位置搜索等多种搜索方式。Elasticsearch还提供了强大的聚合功能，可以对数据进行统计、分组和计算等操作。
除了搜索功能，Elasticsearch还具备实时数据分析的能力。它可以对大规模数据进行复杂的数据分析和挖掘，支持各种类型的查询和聚合操作。同时，Elasticsearch还提供了可视化工具Kibana，用于展示和分析数据的可视化报表。
由于其高性能、可扩展性和丰富的功能，Elasticsearch被广泛应用于各种场景，包括企业搜索、日志分析、安全分析、电子商务等领域。它的简单易用的API接口和丰富的生态系统，使得开发者可以快速构建强大的搜索和分析应用。

全文搜索引擎

全文搜索引擎是一种用于检索文本内容的工具或软件。它可以通过对文本进行索引和搜索，帮助用户快速找到所需的信息。

全文搜索引擎的工作原理是将文本内容分解为单词或词组，并构建索引以加快搜索速度。当用户输入关键词进行搜索时，搜索引擎会在索引中查找匹配的内容，并返回相关的结果。

全文搜索引擎的优点包括：

快速检索：全文搜索引擎使用索引技术，可以快速定位到匹配的文本内容，提高搜索效率。
精确匹配：全文搜索引擎可以根据用户输入的关键词进行精确匹配，找到最相关的结果。
多种搜索方式：全文搜索引擎通常支持多种搜索方式，如全文搜索、模糊搜索、通配符搜索等，提供更灵活的搜索选项。
支持多种数据类型：全文搜索引擎可以处理不同类型的文本内容，包括文档、网页、日志、电子邮件等。
可扩展性：全文搜索引擎通常是分布式的，可以在多台服务器上进行部署，提供高可用性和扩展性。

全文搜索引擎的应用场景广泛，包括网页搜索、文档检索、日志分析、电子商务、社交媒体分析等。常见的全文搜索引擎包括Elasticsearch、Apache Solr、Lucene等。

一般传统数据库，全文检索都实现的很鸡肋，因为一般也没人用数据库存文本字段。进行全文检索需要扫描整个表，如果数据量大的话即使对 SQL 的语法优化，也收效甚微。建立了索引，但是维护起来也很麻烦，对于 insert 和 update 操作都会重新构建索引。基于以上原因可以分析得出，在一些生产环境中，使用常规的搜索方式，性能是非常差的：

搜索的数据对象是大量的非结构化的文本数据。

文件记录量达到数十万或数百万个甚至更多。

支持大量基于交互式文本的查询。

需求非常灵活的全文搜索查询。

对高度相关的搜索结果的有特殊需求，但是没有可用的关系数据库可以满足。

对不同记录类型、非文本数据操作或安全事务处理的需求相对较少的情况。为了解决结构化数据搜索和非结构化数据搜索性能问题，我们就需要专业，健壮，强大的全文搜索引擎。

03-教学大纲

第1章 Elasticsearch概述
第2章 Elasticsearch入门
第3章 Elasticsearch环境
第4章 Elasticsearch进阶
第5章 Elasticsearch集成
第6章 Elasticsearch优化
第7章 Elasticsearch面试题

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

学习

elasticsearch

笔记

Elasticsearch学习笔记的相关文章

Spark任务仅在一个执行器上运行

大家好首先我知道这个线程的存在 Spark 中的任务仅在一个执行器上运行 https stackoverflow com questions 53425983 task is running on only one executor in
Elasticsearch批量设置_id

当我使用 id 设置将文档添加到 elasticsearch 时我得到 Field id is a metadata field and cannot be added inside a document Use the index AP
ElasticSearch：对聚合键进行排序，不区分大小写，并保持键的大小写

我想从汽车中获得不同的制造值并且制造值应该不区分大小写地按升序排序我使用的是elasticsearch版本2 4 4 颜色和制作字段的映射 color type string fields keyword type string ind
将 Elasticsearch 结果导出到 CSV 文件

我正在尝试将使用以下查询找到的结果导出到桌面上的 CSV 中这是我第一次使用 Elasticsearch 和 cURL 所以我对如何做到这一点感到困惑 from elasticsearch import Elasticsearch es
在ElasticSearch中搜索没有时间的日期字段值

我的数据中有一个日期字段为 type date format dateOptionalTime 现在我的日期字段和值是 INITIAL EXTRACT DATE 2015 04 02T06 47 57 78 05 30 在搜索时我仅根据
为什么我在elasticsearch中需要“store”：“yes”？

我真的不明白为什么核心类型链接 http www elasticsearch org guide reference mapping core types 它在属性描述中说例如对于数字 store 设置为 yes 将实际字段存储在索引中
在elasticsearch中过滤facet

我有一个如下查询 query query query string query s q filter ids values list ids facets destination terms field destination en hot
如何在弹性搜索中生成多个布尔查询的查询

我想使用 spring 框架在 elasticsearch 中动态生成多个布尔运算的查询我在elasticsearch中的数据就像 masterID
全文搜索 DynamoDB

以下情况我正在为我的客户将元素存储在 DyanmoDb 中 HashKey 是元素 ID Range Key 是客户 ID 除了这些字段之外我还存储一个字符串数组 gt 标签例如 Pets House 和多行文本我想在我的应用程序中
从 App Engine 连接到 Kubernetes 引擎

我们希望使用应用程序引擎灵活的流程来更新位于 Google Kubernetes Engine 上的 ElasticSearch 索引我们需要通过 http s 地址连接到 ElasticSearch 推荐的方法是什么我们不想将集群暴露
如何在不更改设置的情况下不区分大小写排序

我的索引名称是 data new 下面是插入索引的代码 test id 1 name A professor Bill Cage accounting id 2 name AB professor Gregg Payne engineeri
ElasticSearch 定义自定义映射与默认“_doc”映射冲突

尝试创建自定义映射类型时会发生此问题为第一个插入弹性创建自定义映射后想要创建 doc映射类型和冲突就发生在这里第一步我创建一个映射 mappings properties field1 type keyword field2 type
在弹性搜索中使用 GET/POST 时的不同结果

我正在通过 Elastic Search Head 插件尝试弹性搜索当我通过 POST 提交查询时结果符合预期但是当我使用 GET 尝试相同的查询时我总是会返回索引中的所有值那么如何通过 GET 将查询传递到弹性搜索服务器以
ElasticCloud 的 ElasticSearch 身份验证错误？

我刚刚在 ElasticCloud 上设置了一个新的 ElasticSearch 集群我正在尝试遵循帮助文档 https cloud elastic co help 它说您可以按如下方式发布文档 curl https
Nest Elastic - 构建动态嵌套查询

我必须使用 Nest 查询嵌套对象但是查询是以动态方式构建的下面的代码演示了以静态方式对嵌套书籍进行查询 QueryContainer qry qry new QueryStringQuery DefaultField name D
如何使用ElasticSearch来实现社交搜索？

我正在尝试使用 ElasticSearch 创建具有社交功能的商业搜索我有一个企业目录用户可以通过不同的方式与这些企业进行交互通过查看它们检查它们等当用户搜索商家时我希望能够在结果顶部向他们显示他们的朋友与之互动过的商家或根据
如何修复从 React 对 Elasticsearch 进行 API 调用时的“混合内容：”错误

我正在使用 firebase 的 elasticsearch 的 bitnami 版本我发现它只能连接到http并不是https当我使用邮递员尝试时我的create react app已部署到 firebase 我得到Mixed Con
search_after 在弹性搜索中如何工作？

我一直在尝试在我们的应用程序中使用 Elasticsearch 但分页限制为 10k 对我们来说实际上是一个问题并且由于必须超时问题滚动 API 也不是推荐的选择我发现 Elasticsearch 有一个叫做 search after
Elasticsearch - 使用“标签”索引来发现给定字符串中的所有标签

我有一个 elasticsearch v2 x 集群其标签索引包含大约 5000 个标签 tagName tagID 给定一个字符串是否可以查询标签索引以获取在该字符串中找到的所有标签我不仅想要精确匹配而且还希望能够控制模糊匹配
即使禁用安全性，OAuth 令牌 API 也无法在 Elastic Search 中工作

我是 Elastic search 新手使用 Elastic search 版本 7 7 1 我想通过以下方式生成 OAuth 令牌弹性搜索文档 https www elastic co guide en elasticsearch re

随机推荐

element-table中当点击row的时候背景色发生

效果图当点击行的时候则背景添加颜色再次点击则颜色去掉 1 在el table标签中添加 row click和row style事件 row click tableClick row style isActive tableClick
Pyinstaller PyQt5 QFontDatabase: Cannot find font directory

在解决了上一篇的 no module named pyqt5 sip问题以后这是打包以后的第二个问题在ubuntu 执行源码的时候字体可以正常显示 python3 main py 但是通过pyinstaller打包以后就找不到字体了大
根据数字二进制下1的数目排序

LeetCode 根据数字二进制下1的数目排序给你一个整数数组 arr 请你将数组中的元素按照其二进制表示中数字 1 的数目升序排序如果存在多个数字二进制中 1 的数目相同则必须将它们按照数值大小升序排列请你返回排序后的数组示例
【Vivado使用误区与进阶】XDC约束技巧——时钟篇

Xilinx 的新一代设计套件Vivado中引入了全新的约束文件XDC 在很多规则和技巧上都跟上一代产品ISE中支持的UCF大不相同给使用者带来许多额外挑战 Xilinx工具专家告诉你其实用好XDC很容易只需掌握几点核心技巧并且时刻
第二十二讲：神州路由器OSPF单区域路由的配置

实验拓扑图如下所示设备端口 IP 子网掩码网关 Router A F0 0 172 16 1 1 255 255 255 0 无 F0 3 172 16 0 1 255 255 255 0 无 Router B F0 0 172 16
【MySQL笔记】MySQL数据库分库分表解读

目录一为什么要分库分表 1 IO瓶颈 2 CPU瓶颈二分库分表的拆分方法 1 垂直拆分 1 1 数据库垂直拆分 1 2表垂直拆分根据业务去拆分表如把user表拆分成user base表和user info表 use base负责
Android adb 输出指定app 错误日志

查看错误日志 adb logcat E 按照时间查看日志 adb logcat v time
VMware16安装Linux CentOS7完整教程（附国内镜像链接）

一准备工作 1 安装VMware Workstation Pro 16 1 百度网盘下载地址链接 https pan baidu com s 1jv0kQ26TLMt9MzofImRzgA pwd s0m1 提取码 s0m1 2 VMw
SLAM方法汇总

原文 http blog csdn net smartxxyx article details 53068855 目录 SLAM概述 SLAM一般处理流程包括track和map两部分所谓的track是用来估计相机的位姿也叫front e
在Windows远程桌面的不同会话之间，如何实现程序的互斥？

问题 1 场景一我是使用CreateMutex来实现限制只能运行程序的一个实例的由于程序是放在服务器上运行所以维护人员经常使用Windows的远程登录功能维护服务器我发现在远程桌面不同会话之间 CreateMutex是不起作用的即
Parallels desktop 安装 Centos7 root 默认密码

parallels desktop下载的centos7 默认用户名是parallels 密码是需要设置的软件没有自动设置密码必须大于8位并且无法进行su命令提示 Authentication failure 这个问题产生的原因是由于
Xcode登录apple id 提示 This action could not be completed

问题描述打开xcode 运行工程时 xcode提示输入公司开发者账号密码惊讶之前没出现过的按照要求输入密码但又提示账号过期或密码可能被修改但是网上登录苹果开发者密码又是正常的百度了下把xcode偏好设置里面的过期账号所有
动态规划之二维数组系列——01背包，不同的子序列

01背包问题题目描述小明有一个容量为 V 的背包这天他去商场购物商场一共有 N 件物品第 i 件物品的体积为 wi 价值为 vi 小明想知道在购买的物品总体积不超过 V 的情况下所能获得的最大价值为多少解题思路现假设 V 为
【深入理解C++】隐式构造与explicit

文章目录 1 隐式构造 1 1 情况一 1 2 情况二 1 3 情况三 2 explicit 1 隐式构造 C 中存在隐式构造的现象即在某些情况下会隐式调用单参数的构造函数 1 1 情况一 include
Latex语法学习02：文本悬挂缩进

目录 1 简单文本缩进案例 2 算法表格中的缩进案例 3 完整代码 1 简单文本缩进案例解决方案将要缩进的文本定义在minipage环境下勾股定理 begin minipage t linewidth 直角三角形的直角边的平方求和等于
C# WinForm控件美化扩展系列之ListView（2）

前面的一篇文章C WinForm控件美化扩展系列之ListView实现了隔行不同颜色和对列表头进行了美化但遗憾的是对列表的最后的不包含列头的部分没有进行重绘主要原因是上次没时间处理因为处理那一部分是比较困难的需要花不少时间今天总算
Spark MLlib 源码学习---朴素贝叶斯模型(Naive Bayes)

朴素贝叶斯是机器学习中比较常用的一种模型尤其在文本分类的问题上是比较常用的baseline 朴素贝叶斯本身训练速度快具有可并行化程度高可解释性好的优点但由于其对特征之间的独立性假设不是很符合某些需求场景因此在实际的使用过程中往往需
MySQL运维篇之Mycat分片规则

3 5 3 Mycat分片规则 3 5 3 1 范围分片根据指定的字段及其配置的范围与数据节点的对应情况来决定该数据属于哪一个分片示例可以通过修改autopartition long txt自定义分片范围注意范围分片针对于数字类
宋浩概率论与数理统计-第一章-笔记

概率论与数理统计引言 1 1 1 随机事件 1 1 2 样本空间与事件的集合表示 1 1 3 事件间的关系包含并和交积差互不相容事件对立事件完备事件组运算律事件的概率 1 2 1 概率的初等描述 1 2 2 古典概型
Elasticsearch学习笔记

第1章 Elasticsearch概述 01 开篇结构化数据非结构化数据半结构化数据含义结构化数据结构化数据是按照预定义的模式和格式进行组织的数据它通常以表格关系数据库或者类似的数据存储形式存在具有固定的字段和数据类型结构

Elasticsearch学习笔记

第1章 Elasticsearch概述

01-开篇

结构化数据，非结构化数据，半结构化数据含义

区别：

图解：

02-技术选型

Elasticsearch 是什么

全文搜索引擎

03-教学大纲

Elasticsearch学习笔记 的相关文章

随机推荐

热门标签

Elasticsearch学习笔记的相关文章