达梦8 DMDSC集群高可用验证手册

2023-11-07

    1. 阅读对象
  1. 架构管理人员、架构设计人员
  2. 项目需求分析、设计开发人员
  3. 数据架构师、DBA
  4. 开发人员
    1. 定义、缩写和分类

DM:DM8为达梦公司自研数据库。

DMDSC:DM Data Shared CLuster,简称DMDSC。共享存储数据库集群。手册中个别章节DMDSC专指DM DB。

DMCSS:DM集群同步服务(DM Cluster Synchronization Services)的简称,是DMDSC集群应用的基础,使用DMDSC集群或者DMASM集群都必须要配置DMCSS。

DMCSSM:是DM集群监视器(DM Cluster Synchronization Services Monitor)的简称。DMCSSM与DMCSS相互通信,获取并监控整个集群系统的状态信息。DMCSSM还提供了一系列的命令来管理、维护集群。一般建议将监视器放在独立的第三方机器上。

DMASM:达梦专用的分布式文件系统。支持多个节点同时访问、修改数据文件,并减少直接使用裸设备存在的诸多限制。它不是一个通用的文件系统,只能通过dmasmapi接口访问。

DCR:DM集群注册表(DM Clusterware Registry)的简称,用于存储、维护集群配置的详细信息,整个集群环境共享DCR配置信息。它必须存储在集群中所有节点都可以访问到的共享存储中,并且只支持裸设备。在一个集群环境中只能配置一个DCR磁盘。

Voting:表决磁盘(Voting Disk)记录了集群成员信息,DM集群通过Voting Disk进行心跳检测,确定集群中节点的状态,判断节点是否出现故障。它必须存储在集群中所有节点都可以访问到的共享存储中,并且只支持裸设备。在一个集群环境中只能配置一个表决磁盘。

MAL链路:MAL系统是达梦数据库基于TCP协议实现的一种内部通信机制,DMDSC集群中存在两套MAL系统,DMASM服务器之间配置一套MAL系统,dmserver服务器之间配置一套MAL系统。一旦MAL链路出现异常,DMCSS会进行裁定,并从集群中踢出一个节点,保证集群环境正常运行。

  1. DMDSC

#DMDCR_ASM_RESTART_INTERVAL =30  #CSS认定ASM故障重启的时间

#DMDCR_DB_RESTART_INTERVAL  =60  #CSS认定DSC故障重启的时间

    1. DMCSS控制节点核心进程被kill

用例编号

5_5

测试目的

在控制节点杀掉dmcss进程,对DMASM、DMDSC以及应用连接的影响

测试步骤

1. 通过CSSM识别CSS控制节点(CSS1/ASM1/CCDC0是控制节点)

2. 发起Jmeter压力

3. (root)# kill -9 <PID_of_dmcss>

测试预期

杀掉CSS控制节点会造成控制节点切换,不会造成应用停机。

测试结果

08:38:11,杀掉DMCSS控制节点CSS1核心进程(在主机节点2上)。

08:40:22,存活CSS节点监测到控制节点关闭,并设置EP CSS0为控制节点。CSS控制节点切换。

08:40:29,新控制节点CSS0设置EP CCDC1[1]为故障EP;同时设置EP ASM1[1]为故障EP。故障节点上的应用重新连接到存活节点。

08:40:32,设置EP ASM0[0]为控制节点。ASM控制节点切换。CCDC0本来就是控制节点,不需要切换。

08:46:11,手工启动CSS。

08:46:18,确认EP CSS0[0]为控制节点。

08:46:48,CSS1重启本地ASM实例,并设置EP ASM1[1]为故障重加入EP。

08:47:18,CSS1重启本地DB实例。

08:47:39,故障EP重新加入DSC结束,故障EP恢复结束。

08:47:42,完成故障处理。

测试结论

杀掉CSS控制节点会造成CSS/ASM控制节点切换,本地CSS/ASM/DB服务会被终止,但不会影响其他存活节点。没有造成应用Outage。被杀掉的CSS需要手工启动。

测试人员签字

测试审核员签字

    1. DMCSS控制节点核心进程hang

用例编号

5_6

测试目的

在控制节点hang住dmcss进程,对DMASM、DMDSC以及应用连接的影响

测试步骤

1. 通过CSSM识别CSS控制节点(CSS0\ASM0\CCDC0为控制节点)

2. 发起Jmeter压力

3. (root)# kill -19 <PID_of_dmcss>

4. Hang 20分钟

5.解除hang状态 (root)# kill -18 <PID_of_dmcss>

测试结果

09:21:57,CSS控制节点核心进程hang。

09:23:51,CSS存活节点监测到控制节点关闭,设置EP CSS1[1]为控制节点。CSS控制节点发生切换。

09:23:59,设置EP CCDC0[0]为故障EP,并设置EP CCDC1[1]为控制节点。

09:24:00,设置EP ASM0[0]为故障EP,设置EP ASM1[1]为控制节点。此时,故障节点上的应用重新连接到存活DB节点。

09:40:43,手工解除CSS0夯状态。

09:40:50,确认EP CSS1[1]为控制节点。

等待30分钟,未发现重启ASM0和CCDC0数据库服务。手工启动ASM和DB。

10:11:09,设置EP ASM0[0]为故障重加入EP。

10:11:36,设置EP CCDC0[0]为故障重加入EP。

10:11:41,设置EP CCDC0[0]为控制节点。

10:11:46,完成故障处理。

测试结论

CSS控制节点核心进程hang,会造成本地ASM/DB服务宕机,对其他节点服务没有影响。没有造成应用Outage。

Hang住的CSS进程需要手工解除hang状态,但ASM/DB不会自动重启,需要手工启动,这是与5.4场景的区别。

测试人员签字

测试审核员签字

  1. 高可用场景影响分析与说明
  1. 影响分析总结:

1. 不管是控制节点还是非控制节点,在数据库主机宕机时应用都会受到短暂影响,时长在60秒至270秒之间(参数可调,最低5秒)。如果本地归档未放在本地磁盘,文件系统只读不会对应用造成影响。

2. 数据库(DSC)核心进程异常崩溃(类似于Kill)或者夯住,一般都会造成对应用的影响,时长是60秒(参数可调,最低5秒)。

3. ASM核心进程异常通常不会造成应用停顿。一个例外是,在CSS/ASM/DB的控制节点分布在不同主机上时,“ASM非控制节点核心进程被Kill”会造成127秒的数据库不可用。该问题是DMDSC的一个缺陷,达梦厂商已确认并在修复中。

4. 停启DMCSS服务,以及CSS核心进程异常,都不会造成应用停顿。

综上,DMCSS和DMASM通常不会对应用造成影响。当出现数据库核心进程异常或者数据库主机宕机时,需要重点关注。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

达梦8 DMDSC集群高可用验证手册 的相关文章

  • 数据采集才是MES系统的核心内容

    一 数据采集在MES管理系统中的应用 1 设备数据采集 MES管理系统通过与生产设备的连接 可以实时采集设备运行状态 产量 质量等相关数据 这有助于企业及时掌握设备运行状况 优化设备资源配置 提高设备利用率 2 工艺数据采集 MES管理系统
  • Qt源码分析:Qt程序是怎么运行起来的?

    一 从 exec 谈起 一个标准的Qt gui程序 在启动时我们会coding如下几行简洁的代码 include widget h include
  • Linux 系统日志及其归档

    主要记录Linux 系统需要关注的日志文件 以及日志归档服务 rsyslogd 系统日志服务 rsyslogd 日志服务 rsyslogd reliable and extended syslogd 可靠 可扩展的系统日志服务 Rsyslo
  • 6 - 数据备份与恢复|innobackupex

    数据备份与恢复 innobackupex 数据备份与恢复 数据备份相关概念 物理备份与恢复 逻辑备份 推荐 使用binlog日志文件实现对数据的时时备份 使用日志 恢复数据
  • 智能时代:自然语言生成SQL与知识图谱问答实战

    语义解析 前言 语义解析的应用场景 总结概论 语义解析和大模型的关系 延伸阅读 前言 语义解析技术可以提高人机交互的效率和准确性 在自然语言处理 数据分析 智能客服 智能家居等领域都有广泛的应用前景 特别是在大数据时代 语义解析能够帮助企业
  • 【计算机毕业设计】北关村基本办公管理系统

    在如今社会上 关于信息上面的处理 没有任何一个企业或者个人会忽视 如何让信息急速传递 并且归档储存查询 采用之前的纸张记录模式已经不符合当前使用要求了 所以 对北关村基本办公信息管理的提升 也为了对北关村基本办公信息进行更好的维护 北关村基
  • 软件测试/测试开发/全日制/测试管理丨Redis内存数据库

    Redis是一种开源 内存中的数据结构存储系统 它提供了高性能 灵活性和丰富的数据结构 以下是Redis内存数据库的基本介绍 键值存储 Redis基于键值对的存储模型 其中每个键都与一个特定的值相关联 这种简单的数据模型使其易于使用和理解
  • 软件测试|SQLAlchemy环境安装与基础使用

    简介 SQLAlchemy 是一个强大的 Python 库 用于与关系型数据库进行交互 它提供了高度抽象的对象关系映射 ORM 工具 允许使用 Python 对象来操作数据库 而不必编写原生SQL查询 本文将介绍如何安装 SQLAlchem
  • 基于java的物业管理系统设计与实现

    基于java的物业管理系统设计与实现 I 引言 A 研究背景和动机 物业管理系统是指对物业进行管理和服务的系统 该系统需要具备对物业信息 人员信息 财务信息等进行管理的能力 基于Java的物业管理系统设计与实现的研究背景和动机主要体现在以下
  • 【计算机毕业设计】趵突泉景区的智慧导游小程序_5ztvv

    当今社会已经步入了科学技术进步和经济社会快速发展的新时期 国际信息和学术交流也不断加强 计算机技术对经济社会发展和人民生活改善的影响也日益突出 人类的生存和思考方式也产生了变化 传统趵突泉景区的智慧导游采取了人工的管理方法 但这种管理方法存
  • Kubernetes (十一) 存储——Secret配置管理

    一 简介 从文件创建 echo n admin gt username txt echo n westos gt password txt kubectl create secret generic db user pass from fi
  • 面试官问,如何在十亿级别用户中检查用户名是否存在?

    面试官问 如何在十亿级别用户中检查用户名是否存在 前言 不知道大家有没有留意过 在使用一些app注册的时候 提示你用户名已经被占用了 需要更换一个 这是如何实现的呢 你可能想这不是很简单吗 去数据库里查一下有没有不就行了吗 那么假如用户数量
  • 数据库 | 面试官:一次到底插入多少条数据合适啊?.....面试连环炮

    数据库 面试官 一次到底插入多少条数据合适啊 面试连环炮 数据库插入操作的基础知识 插入数据是数据库操作中的基础 但是 我们程序员将面临随之而来的问题 如何快速有效地插入数据 并保持数据库 性能 当你向数据库中插入数据时 这些数据直接存储到
  • ssh:connect to host github.com port 22: Connection timed out

    解决流程 1 将github的端口由22改为443 ssh T p 443 git ssh github com 2 接着输入yes进行确认 The authenticity of host ssh github com 443 192 1
  • 服务器VPS是什么意思?一文了解其含义与重要性

    在今天的数字时代 服务器扮演着至关重要的角色 它们是网站 应用程序和在线业务的基石 但是 你是否听说过VPS 本文将深入探讨什么是服务器VPS 以及为什么它在今天的互联网世界中如此重要 什么是服务器VPS 服务器的基本概念 在我们深入探讨V
  • 毕业设计:基于python人脸识别系统 LBPH算法 sqlite数据库 (源码)✅

    博主介绍 全网粉丝10W 前互联网大厂软件研发 集结硕博英豪成立工作室 专注于计算机相关专业 毕业设计 项目实战6年之久 选择我们就是选择放心 选择安心毕业 感兴趣的可以先收藏起来 点赞 关注不迷路 毕业设计 2023 2024年计算机毕业
  • 温室气体排放更敏感的模型(即更高的平衡气候敏感性(ECS))在数年到数十年时间尺度上也具有更高的温度变化(Python代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Python代码 数据
  • 每日变更的最佳实践

    在优维公司内部 我们采用发布单的方式进行每天的应用变更管理 这里给各位介绍优维的最佳实践 变更是需要多角色合作的 而且他是整体研发流程的一部分 在优维内部 我们坚持每日变更 打通开发环节到最终发布上线的全过程 在保证质量的前提下 尽可能提升
  • SAP ERP系统是什么?SAP好用吗?

    A公司是一家传统制造企业 公司曾先后使用过数个管理软件系统 但各部门使用的软件都是单独功能 导致企业日常管理中数据流与信息流相对独立 形成了 信息孤岛 随着公司近年业务规模的快速发展以及客户数量的迅速增加 企业原有的信息系统在销售预测及生产
  • 2023下半年软考「单独划线」合格标准公布

    中国计算机技术职业资格网发布了 关于2023年度下半年计算机软件资格考试单独划线地区合格标准的通告 2023下半年软考单独划线地区合格标准各科目均为42分 01 官方通告 关于2023年度下半年计算机软件资格考试单独划线地区合格标准的通告

随机推荐

  • 【YARN】(1)-- 整体架构、RM、NM、AM等基础组件快速理解

    一 Yarn的功能和整体架构 Apache Hadoop YARN Yet Another Resource Negotiator 另一种资源协调者 是一种新的 Hadoop 资源管理器 它是一个通用资源管理系统和调度平台 可为上层应用提供
  • 什么是自动化测试?如何开展自动化测试你需要知道这些点

    目录 前言 什么是自动化测 分层的自动化测试 我为什么要做自动化测试 什么项目适合做自动化测试 选择什么工具进行自动化测试 selenium 用前须知 selenium IDE selenium Grid selenium RC selen
  • 怎样用苹果手机播放html文件夹,无需转格式 如何用iPhone轻松爽看各种片

    iPhone 5问世后 瞬间就成为了大家追随的最热门产品之一 无论是最具创新还是最热门 每一款产品推出后总是会存在遗憾的 iPhone 5同样不例外 在大家眼中它可能有这样或那样的问题 但是在我看来 自带视频播放器仅支持指定苹果标准视频 不
  • uni-app根据经纬度逆解析详细地址

    uni app中的getLocation 方法可以获取到用户当前的地理位置 经纬度 速度 但是返回参数中的address在app中才会显示 小程序中不会显示 所以我们需要进行逆解析其地址 解析出它的地址信息 1 首先要在腾讯位置服务中 控制
  • 第三方登陆--接入谷歌和FaceBook

    一 第三方登陆流程 一 用户点击登录 前端会调用第三方的SDK 获取到对应的数据 一般会有token userId 二 前端拿到这些信息之后 回调自己后端服务端的接口 进行token校验 主要目的是后端得防止他人使用恶意手段 别的平台 或者
  • Ubuntu下安装LLVM/Clang

    关于LLVM和Clang 参考原文 https blog csdn net SiberiaBear article details 103111028 LLVM 起初的作者是 Chris Lattner 博硕期间研究关于编译器优化的东西 其
  • 区块链:盗版者的噩梦?

    传统版权保护是用文本或数据库来进行处理的 用纸张文本处理有诸多不便之处 如记录搜寻 纸质保存 文件遗失等 而使用普通数据库 虽然查询速度加快 但其中的数据是可以被篡改的 因此很难被视为有效的电子证据 数字资产难以确权 同时再加上如今极度便利
  • LLVM passes: MergeFunctions Pass

    目录 What is MergeFunctions Pass 概述 FnTree和Deferred 基本流程 相同函数搜索 函数哈希值比较 函数哈希值的计算 函数哈希值比较的使用 函数结构比较 FunctionNodeCmp 函数比较方法
  • leetcode分类刷题:队列(Queue)(二、优先队列解决TopK简单问题)

    1 优先队列好像一般都叫堆 以大顶堆为例 顶部第一个元素最大 底部最后一个元素最小 自顶向底是递减的 更准确的说是非递增的 对外只能访问顶部第一个元素 对应索引为0 和底部最后一个元素 对应索引为 1 在Python中 heapq默认维护小
  • 关于#include

    经常看人写 include
  • Failed to resolve packages 打开开源项目 VectorFieldExamples 失败

    unity3d打开开源项目问题 最近研究 keijiro大神的开源项目 VectorFieldExamples clone工程后打开总是提示如下错误 Failed to resolve packages Registry configura
  • 感谢CSDN平台记录了我6年的点点滴滴

    感谢CSDN平台记录了我6年的点点滴滴 我的新博客如下 博客园https www cnblogs com ztguang
  • MySQL REPLACE字符串函数简介

    MySQL为您提供了一个有用的字符串函数REPLACE 它允许您用新的字符串替换表的列中的字符串 REPLACE 函数的语法如下 REPLACE str old string new string SQL REPLACE 函数有三个参数 它
  • centos安装Anaconda并使用其安装pytorch

    下载并安装Anaconda wget no check certificate https mirrors tuna tsinghua edu cn anaconda archive Anaconda3 5 1 0 Linux x86 64
  • 操作系统内存管理及虚拟内存技术

    一 内存管理 操作系统的内存管理主要负责内存的分配与回收 malloc 函数 申请内存 free 函数 释放内存 另外地址转换也就是将逻辑地址转换成相应的物理地址等功能也是操作系统内存管理做的事情 1 常见的内存管理机制 1 1 连续分配管
  • 【Linux学习】06 信号

    提示 文章写完后 目录可以自动生成 如何生成可参考右边的帮助文档 文章目录 前言 一 信号的概念 二 Linux中信号 signal函数 1 种类 2 信号的实现机制 3 信号的处理 1 默认递送行为 2 忽略信号 3 捕捉信号并处理 具体
  • ArcGIS教程:模糊隶属

    摘要 根据指定的模糊化算法 将输入栅格转换为 0 到 1 数值范围以指示其对某一集合的隶属度 值 1 表示完全隶属于模糊集 而当值降为 0 时 则表示不是模糊集的成员 用法 此工具无法对分类数据进行度量 要将分类数据用于模糊叠加分析 需要执
  • Asp.net的GridView控件实现单元格可编辑

    最近做一个功能 考虑到用户使用方便 减少弹出页面 采用点 编辑 按钮无需弹出页面直接当前行的单元格内容就能编辑 进入页面显示如下图 点 编辑 按钮后显示如下图 编号为1的 星期 和 是否上班 均可编辑 编辑完成后 点 更新 保存 第一张图中
  • QT按钮被触发两次的问题

    QT自带翻译机制 规则强制指定 修改槽函数形式 QT自带翻译机制 如果用官方的写法on btn pressed 可以不用写connect函数 可以直接触发槽函数 如果此时用connect再次连接的话 就会导致on btn pressed 被
  • 达梦8 DMDSC集群高可用验证手册

    阅读对象 架构管理人员 架构设计人员 项目需求分析 设计开发人员 数据架构师 DBA 开发人员 定义 缩写和分类 DM DM8为达梦公司自研数据库 DMDSC DM Data Shared CLuster 简称DMDSC 共享存储数据库集群