快速入门篇课程介绍
Elasticsearch,是目前行业中非常热门的一个技术。Elasticsearch是一种分布式的海量数据搜索与分析的技术,可以用于电商网站、门户网站、企业IT系统等各种场景下的搜索引擎,也可以用于对海量的数据进行近实时的数据分析。相较于Lucene来说,Elasticsearch天然的分布式特性,让其可以支持海量的、PB级的大数据搜索。相对于Spark Streaming、Storm等大数据实时计算引擎来说,Elasticsearch天生为分布式执行数据分析操作而生的架构,海量数据量级下的近实时(秒级)性能支持,以及无比强大的搜索和聚合分析的语法支持,让ES更加适合进行大数据场景下的数据分析应用。
课程大纲
第1章 核心知识篇-上半季
第1讲 课程介绍
第2讲 用大白话告诉你什么是Elasticsearch
第3讲 Elasticsearch的功能、适用场景以及特点介绍
第4讲 手工画图剖析Elasticsearch核心概念:NRT、索引、分片、副本等
第5讲 在windows上安装和启动Elasticseach
第6讲 快速入门案例实战之电商网站商品管理:集群健康检查,文档CRUD
第7讲 快速入门案例实战之电商网站商品管理:多种搜索方式
第8讲 快速入门案例实战之电商网站商品管理:嵌套聚合,下钻分析,聚合分析
第9讲 手工画图剖析Elasticsearch的基础分布式架构
第10讲 shard&replica机制再次梳理以及单node环境中创建index图解
第11讲 图解2个node环境下replica shard是如何分配的
第12讲 图解横向扩容过程,如何超出扩容极限,以及如何提升容错性
第13讲 图解Elasticsearch容错机制:master选举,replica容错,数据恢复
第14讲 初步解析document的核心元数据以及图解剖析index创建反例
第15讲 分布式文档系统-document id的手动指定与自动生成两种方式解析
第16讲 分布式文档系统-document的_source元数据以及定制返回结果解析
第17讲 分布式文档系统-document的全量替换、强制创建以及图解lazy delete机制
第18讲 分布式文档系统-深度图解剖析Elasticsearch并发冲突问题
第19讲 分布式文档系统-深度图解剖析悲观锁与乐观锁两种并发控制方案
第20讲 分布式文档系统-图解Elasticsearch内部如何基于_version进行乐观锁并发控制
第21讲 分布式文档系统-上机动手实战演练基于_version进行乐观锁并发控制
第22讲 分布式文档系统-上机动手实战演练基于external version进行乐观锁并发控制
第23讲 分布式文档系统-图解partial update实现原理以及动手实战演练
第24讲 分布式文档系统-上机动手实战演练基于groovy脚本进行partial update
第25讲 分布式文档系统-图解partial update乐观锁并发控制原理以及相关操作讲解
第26讲 分布式文档系统-上机动手实战演练mget批量查询api
第27讲 分布式文档系统_上机动手实战演练bulk批量增删改
第28讲 分布式文档系统_阶段性总结以及什么是distributed document store
第29讲 分布式文档系统_深度图解剖析document数据路由原理
第30讲 分布式文档系统_document增删改内部原理图解揭秘
第31讲 分布式文档系统_图解写一致性原理以及quorum机制深入剖析
第32讲 分布式文档系统_document查询内部原理图解揭秘
第33讲 分布式文档系统_bulk api的奇特json格式与底层性能优化关系大揭秘
第34讲 初识搜索引擎_search结果深入解析(search timeout机制揭秘)
第35讲 初识搜索引擎_multi-index&multi-type搜索模式解析以及搜索原理初步图解
第36讲 初识搜索引擎_分页搜索以及deep paging性能问题深度图解揭秘
第37讲 初识搜索引擎_快速掌握query string search语法以及_all metadata原理揭秘
第38讲 初识搜索引擎_用一个例子告诉你mapping到底是什么
第39讲 初识搜索引擎_精确匹配与全文搜索的对比分析
第40讲 初识搜索引擎_倒排索引核心原理快速揭秘
第41讲 初识搜索引擎_分词器的内部组成到底是什么,以及内置分词器的介绍
第42讲 初识搜索引擎_query string的分词以及mapping引入案例遗留问题的大揭秘
第43讲 初识搜索引擎_什么是mapping再次回炉透彻理解
第44讲 初识搜索引擎_mapping的核心数据类型以及dynamic mapping
第45讲 初识搜索引擎_手动建立和修改mapping以及定制string类型数据是否分词
第46讲 初识搜索引擎_mapping复杂数据类型以及object类型数据底层结构大揭秘
第47讲 初识搜索引擎_search api的基础语法介绍
第48讲 初识搜索引擎_快速上机动手实战Query DSL搜索语法
第49讲 初识搜索引擎_filter与query深入对比解密:相关度,性能
第50讲 初识搜索引擎_上机动手实战常用的各种query搜索语法
第51讲 初识搜索引擎_上机动手实战多搜索条件组合查询
第52讲 初识搜索引擎_上机动手实战如何定位不合法的搜索以及其原因
第53讲 初识搜素引擎_上机动手实战如何定制搜索结果的排序规则
第54讲 初识搜索引擎_解密如何将一个field索引两次来解决字符串排序问题
第55讲 初识搜索引擎_相关度评分TF&IDF算法独家解密
第56讲 初识搜索引擎_内核级知识点之doc value初步探秘
第57讲 初识搜索引擎_分布式搜索引擎内核解密之query phase
第58讲 初识搜索引擎_分布式搜索引擎内核解密之fetch phase
第59讲 初识搜索引擎_搜索相关参数梳理以及bouncing results问题解决方案
第60讲 初识搜索引擎_上机动手实战基于scoll技术滚动搜索大量数据
第61讲 索引管理_快速上机动手实战创建、修改以及删除索引
第62讲 索引管理_快速上机动手实战修改分词器以及定制自己的分词器
第63讲 索引管理_内核级知识点:深入探秘type底层数据结构
第64讲 索引管理_mapping root object深入剖析
第65讲 索引管理_定制化自己的dynamic mapping策略
第66讲 索引管理_复杂上机实验:基于scoll+bulk+索引别名实现零停机重建索引
第67讲 内核原理探秘_倒排索引组成结构以及其索引可变原因揭秘
第68讲 内核原理探秘_深度图解剖析document写入原理(buffer,segment,commit)
第69讲 内核原理探秘_优化写入流程实现NRT近实时(filesystem cache,refresh)
第70讲 内核原理探秘_继续优化写入流程实现durability可靠存储(translog,flush)
第71讲 内核原理探秘_最后优化写入流程实现海量磁盘文件合并(segment merge,optimize)
第72讲 Java API初步使用_员工管理案例:基于Java实现员工信息的增删改查
第73讲 Java API初步使用_员工管理案例:基于Java对员工信息进行复杂的搜索操作
第74讲 Java API初步使用_员工管理案例:基于Java对员工信息进行聚合分析