gsch和redirfs模块导致系统hang或者重启 。

2023-05-16

Trend Micro Deep Security Agent 与Gluster 文件系统不兼容导致夯机

modules "gsch and redirfs" causing frequent kernel panic --Trend Deep Security Agent(TrendMicro)

相关参考:
https://blog.csdn.net/vic_qxz/article/details/99852267

https://blog.csdn.net/vic_qxz/article/details/99852267

linux - I would like to unload kernel modules that show as busy - Unix & Linux Stack Exchange

gluster 常见故障处理

Gluster常见故障处理方法,根据官方Troubleshooting文档汇编而成,供大家解决Gluster问题参考,同时罗列了一些GlusterFS进阶话题HOWTO资源。欢迎各位同学补充,共同研究Gluster原理并分享应用经验。

Q1:Gluster需要占用哪些端口?

Gluster管理服务使用24007端口,Infiniband管理使用24008端口,每个brick进程占用一个端口。比如4个brick,使用24009-24012端口。Gluster内置NFS服务使用34865-34867端口。此外,portmapper使用111端口,同时打开TCP和UDP端口。


Q2:创建Gluster资源池出问题?

首先,检查nslookup是否可以正确解析DNS和IP。其次,确认没有使用/etc/hosts直接定义主机名。虽然理论上没有问题,但集群规模一大很多管理员就会犯低级错误,浪费大量时间。再者,验证Gluster服务所需的24007端口是否可以连接(比如telnet)?Gluster其他命令是否可以成功执行?如果不能,Gluster服务很有可能没有启动。


Q3:如何检查Gluster服务是否运行?

可以使用如下命令检查Gluster服务状态:

(1) service glusterd status

(2) systemctl status glusterd.service

(3) /etc/init.d/glusterd status


Q4:无法在server端挂载(mount)Gluster卷?

检查gluster卷信息,使用gluster volume info确认volume处于启动状态。运行命令“showmount -e <glusternode>“,确认可以输出volume相关信息。


Q5:无法在client端挂载(mount)Gluster卷?

检查网络连接是否正常,确认glusterd服务在所有节点上正常运行,确认所挂载volume处于启动状态。

Q6:升级Gluster后,客户端无法连接?

如果使用原生客户端访问,确认Gluster客户端和服务端软件版本一致。通常情况下,客户端需要重新挂载卷。

Q7: 运行“glusterpeer probe“,不同节点输出结果可能不一致?

这个通常不是问题。每个节点输出显示其他节点信息,并不包括当前节点;不管在何处运行命令,节点的UUID在所有节点上都是相同和唯一的;输出状态通常显示“Peer in Cluster (Connected)“,这个值应该和/var/lib/glusterd/glusterd.info匹配。

Q8:数据传输过程中意外杀掉gluster服务进程?

所有数据都不会丢失。Glusterd进程仅用于集群管理,比如集群节点扩展、创建新卷和修改旧卷,以及卷的启停和客户端mount时信息获取。杀掉gluster服务进程,仅仅是一些集群管理操作无法进行,并不会造成数据丢失或不可访问。

Q9:意外卸载gluster?

如果Gluster配置信息没有删除,重新安装相同版本gluster软件,然后重启服务即可。Gluster配置信息被删除,但数据仍保留的话,可以通过创建新卷,正确迁移数据,可以恢复gluster卷和数据。友情提示:配置信息要同步备份,执行删除、卸载等操作一定要谨慎。

Q10:无法通过NFS挂载卷?

这里使用Gluster内置NFS服务,确认系统内核NFS服务没有运行。再者,确认rpcbind或portmap服务处于正常运行中。内置NFS服务目前不支持NFS v4,对于新Linux发行版默认使用v4进行连接,mount时指定选项vers=3。

mount -t nfs -o vers=3 server2:/myglustervolume/gluster/mount/point

Q11:双节点复制卷,一个节点发生故障并完成修复,数据如何同步?

复制卷会自动进行数据同步和修复,这个在同步访问数据时触发,也可以手动触发。3.3以后版本,系统会启动一个服务自动进行自修复,无需人工干预,及时保持数据副本同步。

Q12:Gluster日志在系统什么位置?

新旧版本日志都位于/var/log/glusterfs

Q13:如何轮转(rotate)Gluster日志?

使用gluster命令操作:gluster volume logrotate myglustervolume

 Q14:Gluster配置文件在系统什么位置?

3.3以上版本位于/var/lib/glusterd,老版本位于/etc/glusterd/。

Q15:数据库运行在gluster卷上出现很多奇怪的错误和不一致性?

Gluster目前不支持类似数据库的结构化数据存储,尤其是大量事务处理和并发连接。建议不要使用Gluster运行数据库系统,但Gluster作为数据库备份是一个很不错的选择。

Q16:Gluster系统异常,重启服务后问题依旧。

很有可能是某些服务进程处于僵死状态,使用ps -ax | grep glu命令查看。如果发出shutdown命令后,一些进程仍然处于运行状态,使用killall -9gluster{,d,fs,fsd}杀掉进程,或者硬重启系统。

Q17:需要在每个节点都运行Gluster命令吗?

这个根据命令而定。一些命令只需要在Gluster集群中任意一个节点执行一次即可,比如“gluster volume create”,而例如“gluster peerstatus ”命令可以在每个节点独立多次执行。


Q18:如何快速检查所有节点状态?

Gluster工具可以指定选项 --remote-host在远程节点上执行命令,比如gluster --remote-host=server2 peer status。如果配置了CTDB,可以使用“onnode”在指定节点上执行命令。另外,还可以通过ssh-keygen和ssh-copy-id配置SSH无密码远程登录和执行命令。


Q19:Gluster导致网络、内核、文件系统等出现问题?

可能。但是,绝大多数情况下,Gluster或者软件都不会导致网络或存储等基础资源出现问题。如果发现由Gluster引起的问题,可以提交Bug和patch,并可以社区和邮件列表中讨论,以帮助改善Gluster系统。


Q20:为什么会发生传输端点(transportendpoint)没有连接?

在Gluster日志中看到这种错误消息很正常,表明Gluster由于一些原因无法通信。通常情况下,这是由于集群中某些存储或网络资源饱和引起的,如果这类错误消息大量重复报告,就需要解决问题。使用相关技术手段可以解决大部分的问题,另外有些情况可能由以下原因引起。

1、需要升级RAID/NIC驱动或fireware;

2、第三方备份系统在相同时间运行;

3、周期更新locate数据库包含了brick和网络文件系统;

4、过多rsync作业工作在gluster brick或mount点。

HOWTO资源列表:

1、GlusterFS on ZFS: http://www.gluster.org/community/documentation/index.php/GlusterOnZFS

2、CTDB Howto: http://www.gluster.org/community/documentation/index.php/CTDB

3、HA and Load Balancing with NFS and SMB: http://download.gluster.org/pub/gluster/glusterfs/doc/HA%20and%20Load%20Balancing%20for%20NFS%20and%20SMB.html

4、GlusterFS Cinder: http://www.gluster.org/community/documentation/index.php/GlusterFS_Cinder

5、Linux Kernel Tuning: http://www.gluster.org/community/documentation/index.php/Linux_Kernel_Tuning

6、Network Configuration Techniques: http://www.gluster.org/community/documentation/index.php/Network_Bonding

7、Using the Gluster Test Framework:http://www.gluster.org/community/documentation/index.php/Using_the_Gluster_Test_Framework

8、Gluster 3.4: Brick Restoration - Replace Crashed Server:http://gluster.org/community/documentation/index.php/Gluster_3.4:_Brick_Restoration_-_Replace_Crashed_Server
 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

gsch和redirfs模块导致系统hang或者重启 。 的相关文章

  • NVIDIA Jetson tx2各性能介绍及切换教程

    1 tx2简介 Jetson tx2 有6个CPU核心和一个GPU NVIDIA命令行工具Nvpmodel提供 xff15 种模式 xff0c 可以方便地让用户配置CPU状态 xff0c 以最大限度地提高不同场景下的性能和能耗 2 五种模式
  • Redis中(error):ERR unknown command ‘KEYS‘, with args beginning with:

    redis报错 ERR unknown command 39 KEYS 39 with args beginning with 1 这种情况是redis服务器不支持keys命令 2 5 0版本改为scan了 2 检查redis的yml配置信
  • 如何用手机控制stm32单片机,通过蓝牙模块

    电脑与单片机通信原理 我们用到的串口调试助手 xff0c 就是通过电脑上面的虚拟串口和单片机的串口进行通信从而来调试 在建立通信的过程中 xff0c 我们需要把电脑上虚拟串口的波特率 xff0c 数据位 xff0c 奇偶校验位 xff0c
  • Vm虚拟机Deepin安装教程---kalrry

    Vm虚拟机Deepin安装教程 kalrry 前言Deepin安装 已完成 前言 Win配置记录 Mac配置记录 Deepin安装 已完成 01 点击创建新的虚拟机 02 选择自定义 高级 点击下一步 N 03 点击下一步 N 04 选择稍
  • 国内外流行的JS游戏开发框架介绍---kalrry

    国内外流行的JS游戏开发框架介绍 kalrry 前言一 整理中ing二 当今国内外流行的游戏开发框架有哪些 三 每个框架的特点以及优缺点1 Three js优点 xff1a 缺点 xff1a 2 Phaser优点 xff1a 缺点 xff1
  • JavaScript库集合---kalrry---ing

    JavaScript库集合 kalrry ing 参考 序号JS库功能备注01web3 jsweb3 js 库是一系列模块的集合 xff0c 服务于以太坊生态系统的各个功能备用链接02Three js03Ramda04Lodash05Mom
  • CPU天梯图/显卡天梯图---kalrry

    CPU天梯图 显卡天梯图 kalrry 一 CPU天梯图二 显卡天梯图 一 CPU天梯图 CPU天梯图更注重综合性能 xff0c 只具有参考意义 二 显卡天梯图 以下显卡天梯图主要是根据传统光栅性能排名
  • Pixhawk飞控资料备忘---kalrry

    Pixhawk飞控资料备忘 kalrry 一 简介二 工具 资料1 Mission Planner2 PX4 需全局跳转 3 Pixhawk官网4 视频资源 三 开发入门四 待分类 一 简介 PX4飞控软件是来自苏黎世大学的PIXHAWK项
  • vue之动态注册并渲染组件---kalrry

    vue之动态注册并渲染组件 kalrry 简介 xff1a 目录结构一 普通方法二 方案二三 方案三四 方案四 简介 xff1a 目录结构 待完善补充 index vue dir 目录文件夹 comp1 vue comp2 vue 一 普通
  • SQL-常见的聚合函数有哪些?

    聚合函数 聚合函数对一组值执行计算并返回单一的值 求个数 记录数 项目数等 xff1a count count 的用法 span class token function COUNT span span class token punctu
  • Vue之v-model双向绑定原理---kalrry

    Vue之v model双向绑定原理 kalrry 一 简介二 表单实现双向绑定1 原理2 实现 三 组件上的双向绑定1 原理2 实现3 实例 一 简介 v model实现双向绑定的语法糖 xff0c 常用于表单与组件之间的数据双向绑定 二
  • Qt开发遇到的坑---kalrry

    Qt开发遇到的坑 kalrry 一 依赖引入坑二 Qt在Debug时报错1 编译器是 MSVC 还是 MinGW 2 编译器 32位 还是 64位 三 Qt 43 MSVC编译后中文乱码四 不能将const char 类型的值分配到cons
  • Sinutrain下载安装与开启OPC UA---kalrry

    Sinumerik下载安装与开启OPC UA kalrry 前言一 安装前准备二 Win7安装1 软件安装2 开启授权3 文件配置4 客户端连接 三 Win10 11安装四 启动后使用五 启动OPC UA 前言 本教程只适用于 Sinutr
  • Qt第三方QCustomPlot的使用---kalrry

    Qt第三方QCustomPlot的使用 kalrry 一 参考博客End 例子 一 参考博客 QCustomPlot中图例的相关设置QCustomPlot使用手册QCustomPlot中图例的相关设置QCustomPlot更改图例legen
  • 【物联网树莓派毕设01】树莓派4B快速实现VNC连接

    一 前言 最近准备开始做毕设了 xff0c 想着找个地方记录一下遇到的问题 xff0c 怎么解决的 xff0c 希望能够给有需要的人一些帮助 xff0c 有什么问题还请指正 这次毕设选题是基于物联网技术的酒店管理系统 xff0c 其实是基于
  • 不忘初心牢记使命文化励志标语墙贴——个性一百剪纸

    不忘初心牢记使命手工剪纸 个性一百定制服务中心 xff0c 可快速定制各类家居家具用品 工艺礼品 图案造型 xff0c 提供从构思到设计到制作一条龙服务 xff0c 您敢想我们敢做 不忘初心牢记使命绘画贴纸 我们不局限于某种商品 xff0c
  • 动态建模——UML活动图

    1 活动图 xff1a 展示了动作或活动的执行步骤及结果 2 作用 xff1a xff08 1 xff09 描述在用例描述时 xff0c 用例的实例是如何让执行动作 xff0c 改变对象状态的 xff08 2 xff09 可以清晰的展示出活
  • 华为交换机常用命令(一)

    历史命名查询 display history command 配置主机名 sys sysname xxx 状态信息查询 display version display users 进入接口模式并查看信息 int g0 0 1 dis thi
  • NoSQL之 Redis配置与优化

    NoSQL之 Redis配置与优化 关系数据库与非关系型数据库关系型数据库和非关系型数据库区别 Redis简介Redis 安装部署Redis 命令工具Redis 数据库常用命令 Redis 高可用Redis 持久化RDB 持久化AOF 持久

随机推荐

  • MQ-2烟雾浓度传感器(STM32F103)

    本实验是通过串口调试助手显示STM32F103C8T6采集到MQ 2传感器的电压值 一 概述 1 简介 MQ 2可用于家庭和工厂的气体泄漏监装置 xff0c 适宜于液化气 丁烷 丙烷 甲烷 酒精 烟雾等的探测 它的优点是灵敏度高 响应快 稳
  • Java-异常

    什么是异常 xff1f 异常是指程序运行时 xff0c 导致正常流程被中断的事件 异常分类 可查异常 xff1a CheckedException xff08 要么try catch住 要么往外抛 xff0c 谁调用 xff0c 谁处理 如
  • 51单片机学习篇-- --蜂鸣器的使用

    开篇先说一句废话 本旺名字叫萨摩耶 xff0c xff0c Please 叫我旺财 xff0c xff0c xff0c 哈哈 xff0c 招财进宝嘛 xff01 蜂鸣器是个啥 蜂鸣器一般分为两种 xff0c 一种是无源蜂鸣器 xff0c 一
  • 51单片机学习篇-- --基于51单片机的串口通信协议

    开篇先说一句废话 本旺名字叫萨摩耶 xff0c xff0c Please 叫我旺财 xff0c xff0c xff0c 哈哈 xff0c 招财进宝嘛 xff01 开篇 计算机按照下行数据通信协议 xff0c 串口发送数据 xff0c 地址为
  • 卸载rancher出现的问题

    卸载rancher出现如下报错 error unable to retrieve the complete list of server APIs custom metrics k8s io v1beta1 the server is cu
  • docker审计日志过大导致磁盘IO

    问题 xff1a 节点发生磁盘io 节点审计日志量较大 xff0c 由于操作系统内核缺陷 xff0c 会低概率出现io卡主 影响版本 xff1a v1 15 11 v 1 17 9 查看节点是否有问题 1 登录节点 2 如果有类似下图的回显
  • linux 环境命令随记

    sh steve bourne bash bourne again shell gpl centos和ubuntu 默认使用 csh c shell C语言风格 tcsh ksh xff1a korb shell aix默认shell zs
  • sed命令的使用

    sed命令 格式 sed 选项 脚本命令 文件名 选项 n 使用安静silent模式 在一般sed的用法中 xff0c 所有来自stdin的内容一般都会被列出到屏幕上 但如果加上 n参数后 xff0c 则只有经过sed特殊处理的那一行 或者
  • docker安装和info信息

    docker 容器的历史 xff1a 1 Chroot Jail 就是我们常见的 chroot 命令的用法 它在 1979 年的时候就出现了 xff0c 被认为是最早的容器化技术之一 它可以把一个进程的文件系统隔离起来 2 The Free
  • docker镜像管理

    docker镜像管理 镜像结构和原理 镜像就是创建容器的模版 xff0c 含有容器启动所需要的文件系统及所需要的内容 xff0c 因此镜像主要用于方便和快速创建启动容器 镜像结构 xff1a 一个典型的 Linux文件系统由 bootfs
  • 容器操作基础命令随记

    容器操作基础命令 命令周期 一次性启动容器docker run 一次性运行容器 xff0c 退出后立即删除 xff0c 用于测试 root 64 localhost docker run rm alpine cat etc issue We
  • SRE-Google运维解密随记-1

    雇佣系统管理员 sysadmin 运维复杂的计算机系统 xff0c 是行业内一直以来的普遍做法 这些系统管理员负责将现成的软件组件部署于生产环境中 xff0c 对外提供某种业务服务 系统管理员的主要工作在于应对系统中产生的各种需要人工干预的
  • SpringCloud-Netflix并没有闭源、Eureka1.X也没有闭源

    网上流行的说法 xff1a Netflix的Eureka 闭源了 xff08 不实 xff09 引起一些人的焦虑 恐慌 xff0c SpringCloud Netflix是不是就不能用了 xff0c 没人维护了 真相 xff1a 1 Spr
  • SRE-Google运维解密随记-2-服务目标质量

    服务质量指标 SLI 服务质量目标 SLO 服务质量协议 SLA 这三项分别是指该服务最重要的一些基础指标 这些指标的预期值 xff0c 以及当指标不符合预期时的应对计划 事先选择好合适的指标有助于在故障发生时帮助SRE进行更好地决策 xf
  • SRE-Google运维解密随记-3-分布式系统的监控

    监控的大部分通用的术语 xff1a 监控 monitoring 收集 处理 汇总 xff0c 并且显示关于某个系统的实时量化数据 xff0c 例如请求的数量和类型 xff0c 错误的数量和类型 xff0c 以及处理用时 xff0c 应用服务
  • SRE-Google运维解密随记-4

    自动化系统的演进 草率地进行自动化可能在解决问题的同时产生出其他问题 因此 xff0c 虽然我们认为在大多数情况下以软件为基础的自动化是优于手动操作的 xff0c 但是比 这两个选择更好的方案是一个不需要这些的系统设计一个自治的系统 或者换
  • linux下查看wwn号

    linux终端命令行中通过 cat sys class fc host host port name 命令查看wwn号即可 cat sys class fc host host port name
  • Linux系统权限集中管理项目案例实践

    目录 1 1 etc syduoers配置语法注意事项 1 2 etc sudoers配置文件别名知识 1 3 在 etc sudoers配置文件中 xff0c 别名和配置语法的对应关系表 1 4 利用别名配置授权实践案例 2 企业环境中用
  • 故障记录-磁盘性能下降导致节点触发迁移

    2023 03 11 11 28 52 012 ERROR 139673393420032 send ZMQ message to tcp 9765 failed 34 action 34 34 get pool status 34 34
  • gsch和redirfs模块导致系统hang或者重启 。

    Trend Micro Deep Security Agent 与Gluster 文件系统不兼容导致夯机 modules 34 gsch and redirfs 34 causing frequent kernel panic Trend