ES集群节点宕机导致shard unassigned解决方案

2023-11-06

ES集群概况:
1台master节点,4台data节点,9个shards
问题:
一台data节点宕机,导致5个分片处于unassigned状态,集群状态变为red,无法自动rerouting
解决步骤:
1.查看所有节点的日志信息,通过日志,我们发现master节点中出现了警告信息,通知宕机节点的磁盘利用率超过了90%,这也是导致节点宕机,集群出现unassigned的原因。
2.找到原因后,我们开始处理问题,因为es集群已经无法自动完成rerouting操作,所有当务之急是解决磁盘的问题,因为无法动态扩容,所以我们分配了新的大容量机器,将es数据所在目录整个迁移到了新的机器上,同时将原有机器IP绑定到新的机器上,启动新的机器。
3.这时问题任然没有完全解决,我们输入

curl 'http://ip:port/_nodes/process?pretty'

查看es集群中节点的具体信息
同时输入

curl -XGET http://ip:port/_cat/shards|grep UNASSIGNED

来查看处于未分配状态的信息,信息里面分别有索引,id等信息
4.接下来便是强制routing的过程了,通过如下命令便可以完成shard的重新路由分配

curl -XPOST 'ip:port/_cluster/reroute?retry_failed=5&pretty' -d '
{
    "commands" : [ {
        "allocate_stale_primary" : {
            "index" : "error_data",
            "shard" :5,
            "node" : "0Al0NdJZS2ClT6PiLCqGlg",
            "accept_data_loss" : true
        }
    }]
}'

上面的index为未分配的shard的索引,shard为分片id,node为分片的路由目的节点id,通过第一条命令可以查出,注意可能unassigned节点并不全部分布再宕机节点上,需要进行重路由分配,如果分片不在路由目的节点上,日志中会出现异常信息,找不到对应分片的索引文件,在异常信息中会出现分片的名称,这时,到各节点上查找分片信息,路由到对应的节点上。
所有问题解决后,重启es集群可以发现集群变为green状态。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

ES集群节点宕机导致shard unassigned解决方案 的相关文章

随机推荐

  • [数值分析拟合]Matlab三次样条插值拟合数据

    三次样条插值是一种运用极为广泛的工程插值算法 本文章编写的函数默认使用端点处的导数值代替给定的两端点的导数值使用三转角构造法进行插值 该函数也可传入端点导数数值进行分析 对数据进行方便而迅速的拟合 但是目前没有三弯矩构造法 一 三次样条插值
  • Qt信号槽——传递自定义数据类型

    Qt信号槽 传递自定义数据类型 Qt的信号槽机制支持传递int short double等C语言的基本类型的变量 也可以传递Qt自己的数据类型 但是在传递用户自己定义的数据类型 或其他数据类型是需要进行注册的 原因 当一个signal被放到
  • 解决python打包的exe程序运行报错闪退不留痕迹问题

    打了exe 运行的时候往往会因为找不到文件而报错闪退 此时根本不知道程序问题出在哪里 也因为程序执行太快而抓不到屏 最简单的方法如下 1 打开已打包好的exe文件目录 2 资源管理器输入cmd 运行命令行程序 3 命令行窗口内运行exe程序
  • JDBC与Mybitabs实习笔记

    JDBC与mybatis学习 JDBC的使用 1 导入依赖jar包 2 加载驱动类 3 创建连接对象 4 创建传输对象 SQL的执行器 将SQL语句传输给SQL服务器 5 执行SQL语句 6 关闭资源 1 导入依赖jar包 去mvnreoi
  • oracle存储过程----mybatis传入参数调用存储过程查询

    上一篇的链接是 oracle存储过程 异常的写法介绍 有这样的需求 比如共有表B1 B17 17张表 现在要求传入年度 行政区划 查询出所有符合条件的B1 B17的所有记录 当然 仅查询这些表中共同有的字段 因为这算是跨表查询了 一般我们写
  • vue基础入门

    1 vue简介 1 1 什么是vue 官方概念 Vue 读音 vju 类似于view 是一套用于构建用户界面的前端框架 1 2 vue 的特性 vue 框架的特性 主要体现在如下两方面 数据驱动视图 双向数据绑定 数据驱动视图 在使用了 v
  • 用 卡莱特A35播放盒子 在局域网内更新单行文本

    将播放盒和led正常连接之后 1 到官方网下载配套软件PlayerMaster 下载开发文档 2 使用配套软件 PlayerMaster 找到并查看目标设备的ip 3 在开发文档中找到 ColorlightRESTfulAPI V1 9 中
  • hive分桶表详解

    为什么要用分桶表 单个分区或者表中的数据量越来越大 当分区不能更细粒的划分数据时 所以会采用分桶技术将数据更细粒度的划分和管理 分区提供了一个隔离数据和优化查询的便利的方式 但是当分区的数量过多时 会产生过多的小分区 这样会给namenod
  • RedisTemplate集合使用说明-opsForList(二)

    1 leftPush K key V value 在变量左边添加元素值 Java代码 redisTemplate opsForList leftPush list a redisTemplate opsForList leftPush li
  • centos安装openssl

    安装环境 操作系统 CentOs6 3 OpenSSL Version openssl 1 0 0e tar gz 目前版本最新的SSL地址为http www openssl org source openssl 1 0 0e tar gz
  • IDEA Artifacts:Error during artifact deployment的问题:

    在本地启动tomact服务器的时候 总会出现这样的问题 我的这个项目的多工程 一个工程下面有好多依赖工程 首先确保项目是有这个蓝色图标 如果没有 如果没有在project strucure Modules 点击 导入module 然后下一步
  • 一句话木马、security_file_priv、into outfile、my.ini、sqli-labs-Less7

    sqli labs Less7闯关会用到一句话木马 http 127 0 0 1 Less 7 id 1 union select 1 2 into outfile C hackfiles sqli labs master Less 7 m
  • typec转usb不识别u盘_U盘插入电脑没反应?只需一招,教你轻松解决USB无法识别的问题!...

    说到U盘大家会想到什么呢 其实U盘作为我们日常生活中最为常用的USB设备 用处十分的多 除了日常的资料的存储 转移之外 它还可以作为系统重装的重要工具 是不是没想到它那么厉害呢 不过呢 意外的事情 说来就来 也没法挡住 U盘作为经常使用的工
  • java中json字符串移除指定属性

    java中json字符串移除指定属性 选择正确的jar包 刚开始下载了json lib 2 2 jdk15 jar包 但是程序报找不JSONObject JSONArray类 在网上找json移除属性时找不到对应的方法 网上头说使用json
  • 2020蓝桥杯模拟——长草

    1 题目描述 小明有一块空地 他将这块空地划分为 n 行 m 列的小块 每行和每列的长度都为 1 小明选了其中的一些小块空地 种上了草 其他小块仍然保持是空地 这些草长得很快 每个月 草都会向外长出一些 如果一个小块种了草 则它将向自己的上
  • win10远程连接win7连接不上去的处理办法 发布时间:2020-04-15

    win10远程连接win7连接不上去的处理办法 发布时间 2020 04 15 12 39发布者 系统城 lufang浏览数 1227 很多用户在使用win10远程桌面的时候 想要去连接win7系统的电脑 却发现自己电脑出现了连接不上的问题
  • Android Studio中的SDK Manager使用

    前言 网上的开源项目中使用的Build Tools的版本可能和自己本地的版本不一致 如果本地没有对应的版本 可能会出现编译报错的问题 关于项目的BuildTools的版本设置在build gradle中 便已报错如下图 解决BuildToo
  • php接入企业微信

    企业微信 现在来讲应该是一个很常见了的功能了 下面 我就以tp6来给大讲下接入企业微信的小demo吧 首先 在common php的公共方法里面写入下面两段代码 function sendRequest url 用curl请求获取acces
  • java图片验证码在服务器上返回乱码问题

    本机上没有问题 部署在阿里云服务器上都几个月了都没有问题 上传过一次代码后突然验证码就显示为看不懂的符号了 然而代码对此并没有影响的 打印生成的验证码 String word vcu produceNumAndChar length LOG
  • ES集群节点宕机导致shard unassigned解决方案

    ES集群概况 1台master节点 4台data节点 9个shards 问题 一台data节点宕机 导致5个分片处于unassigned状态 集群状态变为red 无法自动rerouting 解决步骤 1 查看所有节点的日志信息 通过日志 我