Ceph:ceph修复osd为down的情况

2023-10-27

ceph修复osd为down的情况

今天巡检发现ceph集群有一个osds Down了
通过dashboard 查看:
ceph修复osd为down的情况:
在这里插入图片描述
点击查看详情
可以看到是哪个节点Osds Down 了
在这里插入图片描述
通过命令查看Osds状态
①、查看集群状态:

[root@ceph01 ~]# ceph -s
  cluster:
    id:     240a5732-02e5-11eb-8f5a-000c2945a4b1
    health: HEALTH_WARN
            Degraded data redundancy: 3972/11916 objects degraded (33.333%), 64 pgs degraded, 65 pgs undersized
            65 pgs not deep-scrubbed in time
            65 pgs not scrubbed in time

  services:
    mon: 3 daemons, quorum ceph01,ceph02,ceph03 (age 8d)
    mgr: ceph02.zopypt(active, since 10w), standbys: ceph03.ucynxg, ceph01.suwmox
    mds: cephfs:1 {0=cephfs.ceph02.axdsbo=up:active} 4 up:standby
    osd: 3 osds: 2 up (since 5w), 2 in (since 5w)

  data:
    pools:   3 pools, 65 pgs
    objects: 3.97k objects, 1.8 GiB
    usage:   6.0 GiB used, 2.0 TiB / 2.0 TiB avail
    pgs:     3972/11916 objects degraded (33.333%)
             64 active+undersized+degraded
             1  active+undersized

  io:
    client:   596 B/s wr, 0 op/s rd, 0 op/s wr

②、查看Osds树状态

[root@ceph01 ~]# ceph osd tree
ID  CLASS  WEIGHT   TYPE NAME             STATUS  REWEIGHT  PRI-AFF
-1         3.00000  root default
-3         1.00000      host sjyt-ceph01
 0    hdd  1.00000          osd.0           down         0  1.00000
-5         1.00000      host sjyt-ceph02
 1    hdd  1.00000          osd.1             up   1.00000  1.00000
-7         1.00000      host sjyt-ceph03
 2    hdd  1.00000          osd.2             up   1.00000  1.00000

解决过程:
另一种处理方式:

参考:ceph修复osd为down的情况

①、重启故障节点osd服务

[root@sjyt-ceph01 ~]# systemctl status ceph-240a5732-02e5-11eb-8f5a-000c2945a4b1@osd.0.service
● ceph-240a5732-02e5-11eb-8f5a-000c2945a4b1@osd.0.service - Ceph osd.0 for 240a5732-02e5-11eb-8f5a-000c2945a4b1
   Loaded: loaded (/etc/systemd/system/ceph-240a5732-02e5-11eb-8f5a-000c2945a4b1@.service; enabled; vendor preset: disabled)
   Active: inactive (dead) since Mon 2021-02-01 19:24:37 CST; 1 months 5 days ago
  Process: 320045 ExecStopPost=/bin/bash /var/lib/ceph/240a5732-02e5-11eb-8f5a-000c2945a4b1/osd.0/unit.poststop (code=exited, status=0/SUCCESS)
  Process: 320033 ExecStop=/bin/podman stop ceph-240a5732-02e5-11eb-8f5a-000c2945a4b1-osd.0 (code=exited, status=125)
  Process: 153844 ExecStart=/bin/bash /var/lib/ceph/240a5732-02e5-11eb-8f5a-000c2945a4b1/osd.0/unit.run (code=exited, status=0/SUCCESS)
  Process: 153833 ExecStartPre=/bin/podman rm ceph-240a5732-02e5-11eb-8f5a-000c2945a4b1-osd.0 (code=exited, status=1/FAILURE)
 Main PID: 153844 (code=exited, status=0/SUCCESS)

Warning: Journal has been rotated since unit was started. Log output is incomplete or unavailable.
[root@sjyt-ceph01 ~]# systemctl start ceph-240a5732-02e5-11eb-8f5a-000c2945a4b1@osd.0.service
[root@sjyt-ceph01 ~]# systemctl status ceph-240a5732-02e5-11eb-8f5a-000c2945a4b1@osd.0.service
● ceph-240a5732-02e5-11eb-8f5a-000c2945a4b1@osd.0.service - Ceph osd.0 for 240a5732-02e5-11eb-8f5a-000c2945a4b1
   Loaded: loaded (/etc/systemd/system/ceph-240a5732-02e5-11eb-8f5a-000c2945a4b1@.service; enabled; vendor preset: disabled)
   Active: active (running) since Tue 2021-03-09 10:19:07 CST; 1s ago
  Process: 320045 ExecStopPost=/bin/bash /var/lib/ceph/240a5732-02e5-11eb-8f5a-000c2945a4b1/osd.0/unit.poststop (code=exited, status=0/SUCCESS)
  Process: 320033 ExecStop=/bin/podman stop ceph-240a5732-02e5-11eb-8f5a-000c2945a4b1-osd.0 (code=exited, status=125)
  Process: 2770303 ExecStartPre=/bin/podman rm ceph-240a5732-02e5-11eb-8f5a-000c2945a4b1-osd.0 (code=exited, status=1/FAILURE)
 Main PID: 2770314 (bash)
    Tasks: 13 (limit: 23968)
   Memory: 31.2M
   CGroup: /system.slice/system-ceph\x2d240a5732\x2d02e5\x2d11eb\x2d8f5a\x2d000c2945a4b1.slice/ceph-240a5732-02e5-11eb-8f5a-000c2945a4b1@osd.0.service
           ���─2770314 /bin/bash /var/lib/ceph/240a5732-02e5-11eb-8f5a-000c2945a4b1/osd.0/unit.run
           └─2770413 /bin/podman run --rm --net=host --ipc=host --privileged --group-add=disk --name ceph-240a5732-02e5-11eb-8f5a-000c2945a4b1-osd.0 -e CONTAINER_IMAGE=docker.io/ceph/ceph:v15 -e NODE_NAME=sjyt

②、查看OSD状态

[root@sjyt-ceph01 ~]# ceph osd tree
ID  CLASS  WEIGHT   TYPE NAME             STATUS  REWEIGHT  PRI-AFF
-1         3.00000  root default
-3         1.00000      host sjyt-ceph01
 0    hdd  1.00000          osd.0             up   1.00000  1.00000
-5         1.00000      host sjyt-ceph02
 1    hdd  1.00000          osd.1             up   1.00000  1.00000
-7         1.00000      host sjyt-ceph03
 2    hdd  1.00000          osd.2             up   1.00000  1.00000

③、查看集群状态

[root@sjyt-ceph01 ~]# ceph -s
  cluster:
    id:     240a5732-02e5-11eb-8f5a-000c2945a4b1
    health: HEALTH_WARN
            Degraded data redundancy: 2654/11916 objects degraded (22.273%), 39 pgs degraded, 39 pgs undersized
            64 pgs not deep-scrubbed in time
            64 pgs not scrubbed in time

  services:
    mon: 3 daemons, quorum sjyt-ceph01,sjyt-ceph02,sjyt-ceph03 (age 8d)
    mgr: sjyt-ceph02.zopypt(active, since 10w), standbys: sjyt-ceph03.ucynxg, sjyt-ceph01.suwmox
    mds: cephfs:1 {0=cephfs.sjyt-ceph02.axdsbo=up:active} 4 up:standby
    osd: 3 osds: 3 up (since 8m), 3 in (since 8m); 39 remapped pgs

  data:
    pools:   3 pools, 65 pgs
    objects: 3.97k objects, 1.8 GiB
    usage:   9.4 GiB used, 3.0 TiB / 3.0 TiB avail
    pgs:     1.538% pgs not active
             2654/11916 objects degraded (22.273%)
             38 active+undersized+degraded+remapped+backfill_wait
             25 active+clean
             1  active+undersized+degraded+remapped+backfilling
             1  peering

  io:
    client:   1.5 KiB/s wr, 0 op/s rd, 0 op/s wr
    recovery: 2.7 MiB/s, 1 keys/s, 1 objects/s

Osds 恢复正常后,数据开始恢复到新的Osds节点上。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Ceph:ceph修复osd为down的情况 的相关文章

随机推荐

  • interface{}类型通过json.Unmarshal之后的类型

    一句话总结 所有JSON数值类型一律解析为float64类型 需手动转换 对于map类型需判断是否为nil再转换为所需类型 interface 类型在json Unmarshal时 会自动将JSON转换为对应的数据类型 JSON的boole
  • 三星打印机显示无法连接服务器,三星打印机不能打印,提示“无法识别的USB设备”解决办法...

    打印机安装在电脑中之后出现无法识别的USB设备问题了 对于这个问题我们从几个方向来给各位排查无法识别的USB设备问题的解决办法 如图1 无法识别的USB设备 如图2 如果您USB设备没有被电脑识别 如下图所示 在电脑设备管理器里面会出现一个
  • OTA: Optimal Transport Assignment for Object Detection 原理与代码解读

    paper OTA Optimal Transport Assignment for Object Detection code https github com Megvii BaseDetection OTA 背景 标签分配 Label
  • SpringCloud @FeignClient 参数详解

    SpringCloud FeignClient 参数详解 今天因为工作中遇到FeignClient一个奇葩的bug 后面仔细研究了 找出了原因 那么刚好对FeignClient 这个注解总结一下 1 先看 FeignClient 源码 源码
  • Java集合框架——List接口的使用

    学习Java的同学注意了 学习过程中遇到什么问题或者想获取学习资源的话 欢迎加入Java学习交流群 群号码 183993990 我们一起学Java List集合代表一个有序集合 集合中每个元素都有其对应的顺序索引 List集合允许使用重复元
  • JVM(二)--对象已死?和引用问题

    JVM 二 对象已死 和引用问题 写在前面 java内存运行时区域的各个部分 其中程序计数器 虚拟机栈和本地方法栈3个区域随线程而生 随线程而灭 栈中的栈帧随着方法的进入和退出而有条不紊地执行者出栈和入栈操作 每一个栈帧中分配多少内存基本上
  • Error creating bean with name 'enableRedisKeyspaceNotificationsInitializer'报错处理

    服务器关闭后又重启 在上面启动web应用日志打印报错 Error creating bean with name enableRedisKeyspaceNotificationsInitializer 在网上搜了一下 发现答案很多都是 sp
  • 电信测试网速测试在线软件,宽带测速在线测网速(中国电信宽带测速官网)

    家里宽带怎么测试网速 我家是两兆宽带 可速度好像只有512的 请教一下 1 首先利用360进行测速 打开360主界面 点击 宽带测试器 2 进入宽带测速器后 软件就会自动开始进行网速测试 为了不影响网速的测试 可能需要把系统上 您好 1Mb
  • 关于unity打包安卓apk详细步骤

    小白的经验之谈 如有不足 欢迎指出 第一步 如果想要让Unity可以打包Apk 你需要先下载一个JDK7以上 包括7 的版本 并且必须是64位 安装时请记住您的安装路径 下面是分享的JAVA的jdk 链接 https pan baidu c
  • “阿里爸爸”上新!《2023阿里Java性能调优手册(实战参考)》

    为什么要学Java性能调优 编辑切换为居中 添加图片注释 不超过 140 字 可选 现在去学性能调优还有用么 编辑切换为居中 添加图片注释 不超过 140 字 可选 编辑切换为居中 添加图片注释 不超过 140 字 可选 编辑切换为居中 添
  • 变量的获取与设置:echo、变量设置规则、unset

    变量的获取与设置 echo 变量设置规则 unset echo命令 使用echo命令可以获取变量 但是在获取变量时 前面必须加上 或使用 variable 方式 例如 输出PATH的内容 当一个变量名称尚未设置时 默认的内容是 空 的 另外
  • Java 中的 JDK 介绍

    Java 开发工具包 JDK 是一个跨平台的软件开发环境 它提供了开发基于 Java 的软件应用程序和小程序所需的工具和库的集合 它是Java中使用的核心包 与JVM Java虚拟机 和JRE Java运行时环境 一起 初学者经常对 JRE
  • vscode的sql开发插件

    vscode的sql开发插件 Better Comments Error Lens SQLTools MySQL MariaDB SQL Formatter VSCODE连接数据库 执行sql Better Comments 注释美化插件
  • 2018年计算机专业考研,2018年计算机专业考研大纲解析

    2017年暑期几十年不遇的高温炙烤着紧张复习的同学 早早发布的2018年计算机考研大纲给大家带来一丝秋的凉意 考研大纲从考试目的到考试形式 再到四门课程的每一个知识点都没有任何变化 这符合文都老师们预测 也是广大同学们的福音 暑期奋战没有浪
  • IOS消息推送之APNS

    转自 http blog csdn net jiajiayouba article details 39926017 一 背景概述 1 环境配置 APNS Apple Push Notification Service 本文对推送相关概念不
  • 光线追踪渲染实战(三):OpenGL 光线追踪,用 GPU 加速计算!

    项目代码仓库 GitHub https github com AKGWSB EzRT gitee https gitee com AKGWSB EzRT 目录 前言 0 前置知识 1 布置画布 2 三角形数据传送到 shader 3 在 s
  • SVN添加报错处理

    文章目录 SVN添加报错处理 svn E200009 svn E195023 SVN添加报错处理 svn E200009 svn warning W150002 Users dry Documents xxx xxx xcodeproj p
  • 新板子晶振不起振

    问题描述 1 新焊接的电路板晶振未成功起振 2 起振后晶振两端波形不一致 正常情况下8MHZ晶振两端对地波形都一样 波形规整 光滑无毛刺 如下图 晶振部分原理图如图 解决过程 先检查电路焊接情况 排除焊接问题 再给板子烧录程序 灌入程序后晶
  • Linux——会话、守护进程创建模型及代码实现

    会话 概念 多个进程组的集合 创建一个会话需要注意以下6点 调用进程不能是进程组组长 创建会话的创始人不能是进程组组长 该进程变成新会话首进程 session headler 该进程成为一个新进程组的组长进程 需有root权限 ubuntu
  • Ceph:ceph修复osd为down的情况

    ceph修复osd为down的情况 今天巡检发现ceph集群有一个osds Down了 通过dashboard 查看 ceph修复osd为down的情况 点击查看详情 可以看到是哪个节点Osds Down 了 通过命令查看Osds状态 查看