ceph学习(故障恢复)——mon全部故障,从osd中恢复集群

2023-10-26

   在生产环境中,ceph集群要求最少配置3个MON,一般情况下很少出现3个MON同时挂掉的情况,但是也不排除出现这种情况的可能,如果集群中的所有MON都损坏了,是不是集群数据就丢失了呢?能不能恢复集群?当然是可以的,ceph中国的一位开发者写了一个工具,来对损坏的MON的数据进行重构,这个工具已经集成到了新版的ceph中,官网上也提供了一个重构的脚本,但是这个脚本似乎有点问题,网上也有一些相关的帖子,但是不够清晰和全面,现在我就一步步的恢复一次,使所有功能都恢复正常。

一.环境准备

1.集群信息

测试环境:3台服务器,3个mon,6个osd,集群状态ok。

这是我的配置文件:

2.模拟mon挂掉(在每台mon上都需要执行)

2.1停止所有mon服务

systemctl stop ceph-mon.target

2.2删除所有mon配置文件(我在这里采用备份的方式)

mv /var/lib/ceph/mon/ceph-node1/ /var/lib/ceph/mon/ceph-node1.back
mv /var/lib/ceph/mon/ceph-node2/ /var/lib/ceph/mon/ceph-node2.back
mv /var/lib/ceph/mon/ceph-node3/ /var/lib/ceph/mon/ceph-node3.back

现在集群已经不可用了

二.收集mon信息

1.创建一个mon临时目录(在node3上执行命令)


                
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

ceph学习(故障恢复)——mon全部故障,从osd中恢复集群 的相关文章

  • ubuntu 22.04部署quincy版ceph

    ceph集群安装配置有多种方式 xff0c 下方cephadm方式是借助容器部署 cephadm从ceph的octopus版本开始支持 安装需要主机配置安装了容器和python 3 配置安排 xff1a ceph版本 xff1a quinc
  • Windows虚拟机通过libvirt使用CEPH RBD

    kvm虚拟机通过 libvirt 挂在 ceph rbd作为数据盘 一 首先确定我们的ceph环境是HEALTH OK span class token punctuation span root 64 cephmon ceph span
  • 【测试】 FIO:ceph/磁盘IO测试工具 fio(iodepth深度)

    目录 随看随用 NAS文件系统测试 块系统测试 FIO用法 FIO介绍 FIO 工具常用参数 xff1a FIO结果说明 I O 的重放 xff08 39 录 39 下实际工况的IO xff0c 用fio 39 重放 39 xff09 fi
  • k8s部署Ceph

    1 Helm部署 1 1 简介 为了将Ceph部署到K8S集群中 xff0c 可以利用ceph helm项目 目前此项目存在一些限制 xff1a public和cluster网络必须一样如果Storage的用户不是admin xff0c 你
  • CentOS8联网部署Ceph-Quincy集群

    文章目录 1 环境准备1 1 关闭selinux1 2 关闭防火墙1 3 配置免密1 4 设置yum源1 5 安装依赖1 6 设置时间同步1 7 安装docker 2 安装Ceph2 1 安装cephadm2 2 部署ceph集群2 3 集
  • k8s使用ceph rbd

    环境 节点 k8s角色 ceph 安装组件 192 168 122 120 k8s master ceph admin mon1 osd0 osd1 osd2 osd9 192 168 122 121 k8s slave1 ceph mon
  • Ubuntu22.04搭建ceph 集群

    Ceph是一个开源的 提供软件定义的 统一的分布式存储系统 设计初衷是提供较好的性能 可靠性和可扩展性 open source distributed reliable scalable unified 统一的 意味着一套存储系统同时提供块
  • PG概述及OSD对PG状态的影响

    前言 随着分布式存储的广泛应用 目前对PG的关注越来越多 本文基于ONStor分布式存储系统简要介绍一下PG的状态变化 重点说明OSD对PG状态的影响 一 Ceph分布式存储概述 Ceph是一个统一的分布式存储系统 设计初衷是提供较好的性能
  • cephadm快速部署指定版本ceph集群

    官方文档 https docs ceph com en pacific 1 虚拟机规划 主机名 IP 角色 ceph1 192 168 150 120 cephadm mon mgr osd ceph2 192 168 150 121 mo
  • ceph环境清理

    第一步 在 root ceph 目录下执行 第一个节点 ceph deploy purge ceph01 ceph02 ceph03 ceph04 ceph deploy purgedata ceph01 ceph02 ceph03 cep
  • 查询统计Ceph上的pg 总数

    本文中的命令的第一版来源于国外的一个博客 后面的版本为我自己修改的版本 查询的命令如下 ceph pg dump awk pg stat col 1 while col up col col 0 9a f 0 9a f match 0 0
  • ceph安装部署

    Ceph 简介 存储基础 单机存储设备 单机存储的问题 分布式存储的类型 分布式存储 软件定义的存储 SDS Ceph 架构 Ceph 核心组件 编辑 Pool中数据保存方式支持两种类型 OSD 存储后端 Ceph 数据的存储过程 Ceph
  • ceph集群部署

    一 ceph特点高性能 1 摒弃了传统的集中式存储元数据寻址的方案 采用CRUSH算法 数据分布均衡 并行度高 2 考虑了容灾域的隔离 能够实现各类负载的副本放置规则 例如跨机房 机架 感知等 3 能够支持上千个存储节点的规模 支持TB到P
  • ceph集群换盘

    一引言 某地项目运行两年后磁盘批量报错 利用smartctl检测发现出现大量扇区错误 但并未达到彻底无法读写程度 统计下来发现数量接近40块 考虑批次换盘 坏盘期间为了保证不影响业务 需拟定一个较好的方案 二 方案 在查阅一堆资料后 发现无
  • s3cmd put 时提示 ERROR: S3 error: 403 (QuotaExceeded)

    配置里的rgw配额是10000000写满 s3cmd put 时提示 ERROR S3 error 403 QuotaExceeded rgw bucket default quota max objects 值为 1 查看配额信息 rad
  • rdb map出錯rbd sysfs write failed

    創建了一個rbd鏡像 rbd create size 4096 docker test 然後 在Ceph client端將該rbd鏡像映射為本地設備時出錯 rbd map docker test name client admin rbd
  • cehp 维护(二)常见告警维护

    零 修订记录 序号 修订时间 修订内容 1 2021 11 18 新增 一 摘要 笨猪主要介绍ceph常见告警及维护方法或过程中遇到的问题 二 环境信息 2 1 ceph版本 cephadmin proceph01 ceph v ceph
  • Ceph 4 slow ops, oldest one blocked for 638 sec, mon.cephnode01 has slow ops

    因为实验用的是虚拟机的关系 晚上一般会挂起 第二天早上都能看到 4 slow ops oldest one blocked for 638 sec mon cephnode01 has slow ops的报错 虽然不影响使用 但看着有点难受
  • Ceph bluestore中的缓存管理

    从15年3月接触Ceph分布式存储系统 至今已经5年了 因为工作的需要 对Ceph的主要模块进行了较深入的学习 也在Ceph代码层面做了些许改进 以满足业务需要 我们主要使用M版本 最近得闲 将过往的一些学习心得 改进以及优化思路记录下了
  • 单节点集群(minikube)上的 rook ceph 中的 1 pg 规模过小运行状况警告

    我正在将 rook ceph 部署到 minikube 集群中 一切似乎都正常 我向虚拟机添加了 3 个未格式化的磁盘并已连接 我遇到的问题是 当我运行 ceph status 时 我收到一条健康温暖消息 告诉我 1 pg 尺寸不足 我到底

随机推荐

  • 软工实习日记1

    今天是软工实习的第一天 主要的任务有进行JDBC的相关测试 并且开始学习Spring框架的相关内容 由于我有一段时间没有接触Java相关内容了 所以先大致过了一遍关键点 找了下感觉 然后将JDBC连接测试完成 下面会给出部分关键步骤 JDB
  • c++11 可变参数模板类

    可变参数模板类 如元组 template
  • Java 华为真题-新学校选址

    需求 为了解新学期学生暴涨的问题 小乐村要建立所新学校 考虑到学生上学安全问题 需要所有学生家到学校的距离最短 假设学校和所有学生家都走在一条直线之上 请问学校建立在什么位置 能使得到学校到各个学生家的距离和最短 输入描述 第一行 整数n取
  • Python中的自增运算符

    Python中的自增运算符 1 引言 在许多编程语言中 自增运算符 用于将变量的值增加1 然而 在Python中 我们无法直接使用自增运算符来实现自增功能 本文将介绍Python中的自增运算符的替代方法 并提供示例代码来说明其使用方法 2
  • Deep Learning学习 之 CNN代码解析(MATLAB)

    MATLAB实现CNN一般会用到deepLearnToolbox master 但是根据Git上面的说明 现在已经停止更新了 而且有很多功能也不太能够支持 具体的请大家自习看一看Git中的README deepLearnToolbox ma
  • Neo4j数据建模优化:标签 VS 索引

    原文链接 http graphaware com neo4j 2015 01 16 neo4j graph model design labels versus indexed properties html 在设计Neoj图形化数据库的时
  • Docker daemon日志的位置

    Docker daemon日志的位置 根据系统不同各不相同 Ubuntu var log upstart docker log Boot2Docker var log docker log Debian GNU Linux var log
  • SeetaFaceEngine系列1:Face Detection编译和使用

    SeetaFace 根据GitHub上的介绍 就是一个开源的人脸检测 矫正和识别的开源库 是采用C 来编写的 并且是在CPU上执行的 没有用到GPU 但是可以用SSE或者OpenMP来加速 整个库分为三部分 SeetaFace Detect
  • Python Numpy 关于 linspace()函数 使用详解(全)

    目录 前言 1 函数讲解 2 实战讲解 前言 用plt画图的时候 偶尔会看到这个函数的出现 索性直接深入源码实战进行复现 主要功能 在线性区域中生成等间距的序列 原先在Numpy中可以用numpy arange 但对于浮点数会有精度丢失 因
  • web前端开发自学路线是怎样的?html+css+JavaScript的学习方法

    不废话 直接干货 学习前端的几个阶段 一阶段 html标签 html5新增标签 css样式 css3样式 媒体查询等 二阶段 JavaScript jQuery ajax 面向对象 http传输协议等 三阶段 canvas js高级应用 J
  • C++核心:函数提高(函数默认参数、函数占占位参数、函数重载)

    1 函数默认参数 在C 中 函数的形参列表中的形参是可以有默认值的 返回值类型 函数名 参数 默认值 int func int a int b 10 int c 10 return a b c 1 如果某个位置参数有默认值 那么从这个位置往
  • 数据显示为Ljava.lang.Object;@问题

    那是因为你从数据库读出数据后 存入到list集合上时 如果你没有指定要存入的数据的类型 系统会自动给你赋一个object类型 他是所以类的鼻祖 你取出数据要进行转型 转化成你自己想要的数据类型才能显示
  • pod install 报错 [!] Oh no, an error occurred.

    今天在写react native与原生Swift交互的demo时 新建了一个xcode工程SwiftRnApp执行pod install时报错 点开上面的链接 查看CocoaPods issues 说是要把xcodeproj的版本更新到 1
  • 制作立体图像实用软件:3DMasterKit 10.7 Crack

    3DMasterKit 软件专为创建具有逼真 3D 和运动效果的光栅图片而设计 翻转 动画 变形和缩放 打印机 广告工作室 摄影工作室和摄影师将发现 3DMasterKit 是一种有用且经济高效的解决方案 可将其业务扩展到新的维度 提高生成
  • 电脑知识大全菜鸟必备,学计算机零基础入门知识教程

    电脑在我们生活中的重要性不言而喻 如何保证自己的电脑流畅好用 对于很多用户来说是非常重要的 作为一个理科男和IT从业者 我很在意我的电脑 我会定期整理 保持系统绝对流畅好用 那么本文就分享几个保持电脑流畅好用的小技巧和习惯 希望对你有所帮助
  • jupyter python注释多行

    在jupyter notebook中批量注释多行代码 解除注释也是同样的操作 ctrl
  • 如何进行高效迅速的CodeReview

    背景 第一次参加CodeReview不知道该如何去做 也不知道为什么去做 后来参加多了 慢慢了解了CodeReview的意义 也同时发现CodeReview的效率问题 有时候会发现一个CodeReview时间很长 参与者会觉得煎熬和浪费时间
  • 在PADS中如何导出PCB封装库

    1 在 pads layout 下打开 PADS 文件 2 file library Create New Lib 建立一个自己的PCB DECAL 库 3 将 PCB 缩小到可以全部显示 pcb layout 4 按右键 选择 Selec
  • Frp某场景下实现多层代理

    注 由于传播 利用本文章所提供的信息而造成的任何直接或者间接的后果及损失 均由使用者本人负责 本文作者不为此承担任何责任 一旦造成后果请自行承担 目录 frp简介 部分配置参数说明 实验场景 实验场景 实验环境 实验步骤 第一层隧道 第二层
  • ceph学习(故障恢复)——mon全部故障,从osd中恢复集群

    在生产环境中 ceph集群要求最少配置3个MON 一般情况下很少出现3个MON同时挂掉的情况 但是也不排除出现这种情况的可能 如果集群中的所有MON都损坏了 是不是集群数据就丢失了呢 能不能恢复集群 当然是可以的 ceph中国的一位开发者写