oVirt 4.4.10三节点超融合集群安装配置及集群扩容(一)

2023-11-15

环境

oVrit版本: 4.4.10
oVirt image: https://mirrors.aliyun.com/ovirt/ovirt-4.4/iso/ovirt-node-ng-installer/4.4.10-2022030308/el8/ovirt-node-ng-installer-4.4.10-2022030308.el8.iso?spm=a2c6h.25603864.0.0.46c8a3e6ELIYzK
oVirt engine appliance: https://mirrors.aliyun.com/ovirt/ovirt-4.4/rpm/el8/x86_64/ovirt-engine-appliance-4.4-20220308105414.1.el8.x86_64.rpm?spm=a2c6h.25603864.0.0.3bfc4453NnSFms
virt-viewer: https://releases.pagure.org/virt-viewer/virt-viewer-x64-11.0-1.0.msi
virtio-win<windows磁盘驱动>: https://fedorapeople.org/groups/virt/virtio-win/direct-downloads/archive-virtio/virtio-win-0.1.229-1/

参考文档: https://www.cnovirt.com/archives/2739
交换机网口绑定请参考: https://blog.csdn.net/weixin_43667733/article/details/106363918

备注: 每个服务有2块硬盘,一块用于系统盘,一块用于glusterfs数据盘;生产环境建议系统盘做RAID 1, 两个固态硬盘做RAID 1用于GFS缓存,4块10K盘(15K SAS硬盘或SSD盘做RAID 10或RAID 5)做RAID 10;
网络环境建议最低两个1000M端口做绑定,有条件的可以上光口;注意需要先在oVirt engine管理页面做完端口绑定后再在交换机上配置物理接口端口绑定(LACP)

Node:
主机名: node100.com
IP: 192.168.5.100
子网掩码: 255.255.255.0
网关: 192.168.5.1

主机名: node101.com
IP: 192.168.5.101
子网掩码: 255.255.255.0
网关: 192.168.5.1

主机名: node102.com
IP: 192.168.5.102
子网掩码: 255.255.255.0
网关: 192.168.5.1

Engine<以虚拟机运行在node上>:
主机名: engine103.com
IP: 192.168.5.103
子网掩码: 255.255.255.0
网关: 192.168.5.1

操作步骤

  1. oVirt节点安装请参考https://www.cnovirt.com/archives/2739,注意不需要更新系统。
  2. 在3台node主机上设置hosts解析
[root@node100 yum.repos.d]# cat /etc/hosts
127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6

192.168.5.100 node100.com
192.168.5.101 node101.com
192.168.5.102 node102.com
192.168.5.103 engine103.com
  1. 将3个node节点上的/etc/yum.repos.d/文件备份到backup目录下
    备注: /etc/yum.repos.d目录下建议为空,否则后续安装gfs时容易报错或执行过程卡住
[root@node100 yum.repos.d]# cd /etc/yum.repos.d
[root@node100 yum.repos.d]# mkdir backup && mv *.repo backup
  1. 在其中一个node节点上设置到所有节点的ssh免密登录,此处在node100上操作
[root@node100 home]# ssh-keygen
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa):
Created directory '/root/.ssh'.
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
Your identification has been saved in /root/.ssh/id_rsa.
Your public key has been saved in /root/.ssh/id_rsa.pub.
The key fingerprint is:
SHA256:zblxgJtmcmXSzb1UJDZfW1H5QzUCLiXH6/Z+L3zJMvM root@node100.com
The key's randomart image is:
+---[RSA 3072]----+
|         ..+..++%|
|         o=+ o.B=|
|        o.=.+ +.o|
|         O.+ . o.|
|      . S * . . .|
|       =   *     |
|          o ... .|
|             =o+.|
|            ..*Eo|
+----[SHA256]-----+

将公钥复制到3个node节点上

[root@node100 home]# ssh-copy-id -i node100.com
/usr/bin/ssh-copy-id: INFO: Source of key(s) to be installed: "/root/.ssh/id_rsa.pub"
The authenticity of host 'node210.com (192.168.5.100)' can't be established.
ECDSA key fingerprint is SHA256:guijB0PYTD0GEWvjAe2cIcQsFrgPqyz/RA9dBK47G0Q.
Are you sure you want to continue connecting (yes/no/[fingerprint])? yes
/usr/bin/ssh-copy-id: INFO: attempting to log in with the new key(s), to filter out any that are already installed
/usr/bin/ssh-copy-id: INFO: 1 key(s) remain to be installed -- if you are prompted now it is to install the new keys
root@node100.com's password: 

Number of key(s) added: 1

Now try logging into the machine, with:   "ssh 'node100.com'"
and check to make sure that only the key(s) you wanted were added.

[root@node100 home]# ssh-copy-id -i node101.com
/usr/bin/ssh-copy-id: INFO: Source of key(s) to be installed: "/root/.ssh/id_rsa.pub"
The authenticity of host 'node211.com (192.168.5.101)' can't be established.
ECDSA key fingerprint is SHA256:+fF+ihZRIyOKRHRlxdp5W3Mjbv/GuOrhbL2Qx+TeY50.
Are you sure you want to continue connecting (yes/no/[fingerprint])? yes
/usr/bin/ssh-copy-id: INFO: attempting to log in with the new key(s), to filter out any that are already installed
/usr/bin/ssh-copy-id: INFO: 1 key(s) remain to be installed -- if you are prompted now it is to install the new keys
root@node101.com's password: 

Number of key(s) added: 1

Now try logging into the machine, with:   "ssh 'node101.com'"
and check to make sure that only the key(s) you wanted were added.

[root@node100 home]# ssh-copy-id -i node102.com
/usr/bin/ssh-copy-id: INFO: Source of key(s) to be installed: "/root/.ssh/id_rsa.pub"
The authenticity of host 'node212.com (192.168.5.102)' can't be established.
ECDSA key fingerprint is SHA256:zLUCpZoeljM6hDMZJkLXs+RSBlh9O1wZ/p3ThNNPRhE.
Are you sure you want to continue connecting (yes/no/[fingerprint])? yes
/usr/bin/ssh-copy-id: INFO: attempting to log in with the new key(s), to filter out any that are already installed
/usr/bin/ssh-copy-id: INFO: 1 key(s) remain to be installed -- if you are prompted now it is to install the new keys
root@node102.com's password: 

Number of key(s) added: 1

Now try logging into the machine, with:   "ssh 'node102.com'"
and check to make sure that only the key(s) you wanted were added.
  1. 下载ovirt-engine-appliance-4.4-20220308105414.1.el8.x86_64.rpm并安装
[root@node100 src]# pwd
/data/src
[root@node100 src]# ls
ovirt-engine-appliance-4.4-20220308105414.1.el8.x86_64.rpm
[root@node100 src]# rpm -ivh ovirt-engine-appliance-4.4-20220308105414.1.el8.x86_64.rpm
warning: ovirt-engine-appliance-4.4-20220308105414.1.el8.x86_64.rpm: Header V4 RSA/SHA256 Signature, key ID fe590cb7: NOKEY
Verifying...                          ################################# [100%]
Preparing...                          ################################# [100%]
Updating / installing...
   1:ovirt-engine-appliance-4.4-202203################################# [100%]

安装完成后,通过浏览器打开这台主机的Web控制台(即Cockpit),地址为:https://192.168.5.100:9090(注意IP地址替换成你实际环境的),使用root帐号登录,如下:
ovirt login
进入HostedEngine页面,点击“Hyperconverged”向导的“Start”按钮,开始部署过程,会先部署Gluster再部署HostedEngine,如下:
hosted engine
选择“Run Gluster Wizard”向导,如下:
winzard
选中“Use same hostname for Storage and Public Network”,表示为存储网和管理网使用同一个网络,因为测试环境只配置了一个网卡,然后下面分别输入Host1、Host2、Host3的域名,如下<此处根据实际情况填写,应该为node100.com, node101.com, node102.com>:
hosts
Packages这一步不用配置,直接下一步即可,如下:
packages
Volumes步骤保持默认,下一步,如下:
volumes
Bricks这一步中,Raid Type这里我们选择“JBOD”<即直通模式>,因为我们每台主机上的数据盘是单独的一块盘,如果实际环境中是多块盘做的Raid,那么就根据实际情况选择“Raid5或者Raid6”,Blacklist Gluster Devices这里默认选中即可,下面的Device Name注意要与你环境中的实际情况对应,这里默认是“/dev/sda”,和我们测试环境是对应的,sda是我们每台主机预留出来的一块用于部署Gluster的磁盘,后面的LV Size累加起来不能超过sda的实际大小,如果有SSD盘的话,可以使用下面的“Configuer LV Cache”配置缓存盘,本次测试环境中没有多余的SSD就不配置了,Device Name下的磁盘根据实际填写, LV Size按最小的磁盘总容量进行划分,如下:
devices
下面执行部署过程即可了,这里选中“Enable Debug Logging”,以方便部署失败时排查错误原因,如下:
注意 在执行安装前建议查看下3个节点上的/etc/lvm/lvm.conf,大概在390行左右将filter = [“a|^/dev/disk/by-id/lvm-pv-uuid-f91KVb-cmFk-41ty-JiUE-oB6I-Tbk1-J77Y1h$|”, “r|.*|”]注释了,如下所示:
filter
gfs wizard
部署成功如下所示,点击”Continue to Hosted Engine Deployment”继续部署HostedEngine:
在这里插入图片描述
6. hosted engine部署如下,并点击下一步
fine engine
7. 配置glusterfs并点击下一步
install gfs
8. 点击”Finish Deployment”完成engine部署
gfs2
gfs3
部署成功如下所示
finish gfs
通过SSH连接engine服务器设置主机解析

[root@engine103 ~]# cat /etc/hosts
127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
192.168.5.100 node100.com
192.168.5.101 node101.com
192.168.5.102 node102.com
192.168.5.103 engine103.com
  1. 在C:\Windows\System32\drivers\etc\hosts中添加engine主机名解析
192.168.5.100 node100.com
192.168.5.101 node101.com
192.168.5.102 node102.com
192.168.5.103 engine103.com
  1. 访问engine web管理页面,下载CA证书并导入为”受信任的根证书颁发机构”
    download ca
    点击”管理门户”
    mgr
    使用admin和部署engine过程设置的密码登录
    在这里插入图片描述
  2. 在”计算”->”主机”添加主机节点
    add host
    点击“新建”按钮,进入新建主机弹出窗,在“常规”标签页面,输入要添加的主机的名称、主机名和root密码,在“承载的引擎”标签页面,选择“部署”(注意这里一定要选,否则HostedEngine管理虚机无法实现迁移和高可用),如下:
    add host2
    add host3
    点确定时会弹出没有配置电源管理的提醒,这里先不配,直接点确定即可,生产环境中建议要配置电源管理,否则会影响高可用功能;使用同样的操作方法添加第三台主机;
    查看执行任务
    task
    add hosts3
    profile
  3. ssh连接node100查看hosted engine虚拟机状态
[root@node100 ~]# hosted-engine --vm-status


--== Host node100.com (id: 1) status ==--

Host ID                            : 1
Host timestamp                     : 93629
Score                              : 3400
Engine status                      : {"vm": "up", "health": "good", "detail": "Up"}
Hostname                           : node100.com
Local maintenance                  : False
stopped                            : False
crc32                              : 8a57c839
conf_on_shared_storage             : True
local_conf_timestamp               : 93629
Status up-to-date                  : True
Extra metadata (valid at timestamp):
    metadata_parse_version=1
    metadata_feature_version=1
    timestamp=93629 (Tue Mar 28 13:10:40 2023)
    host-id=1
    score=3400
    vm_conf_refresh_time=93629 (Tue Mar 28 13:10:40 2023)
    conf_on_shared_storage=True
    maintenance=False
    state=EngineUp
    stopped=False


--== Host node101.com (id: 2) status ==--

Host ID                            : 2
Host timestamp                     : 11987
Score                              : 3400
Engine status                      : {"vm": "down", "health": "bad", "detail": "unknown", "reason": "vm not running on this host"}
Hostname                           : node101.com
Local maintenance                  : False
stopped                            : False
crc32                              : 9a1bb88d
conf_on_shared_storage             : True
local_conf_timestamp               : 11987
Status up-to-date                  : True
Extra metadata (valid at timestamp):
    metadata_parse_version=1
    metadata_feature_version=1
    timestamp=11987 (Tue Mar 28 13:10:32 2023)
    host-id=2
    score=3400
    vm_conf_refresh_time=11987 (Tue Mar 28 13:10:32 2023)
    conf_on_shared_storage=True
    maintenance=False
    state=EngineDown
    stopped=False


--== Host node102.com (id: 3) status ==--

Host ID                            : 3
Host timestamp                     : 9503
Score                              : 3400
Engine status                      : {"vm": "down", "health": "bad", "detail": "unknown", "reason": "vm not running on this host"}
Hostname                           : node102.com
Local maintenance                  : False
stopped                            : False
crc32                              : 94bb3b22
conf_on_shared_storage             : True
local_conf_timestamp               : 9503
Status up-to-date                  : True
Extra metadata (valid at timestamp):
    metadata_parse_version=1
    metadata_feature_version=1
    timestamp=9503 (Tue Mar 28 13:10:34 2023)
    host-id=3
    score=3400
    vm_conf_refresh_time=9503 (Tue Mar 28 13:10:34 2023)
    conf_on_shared_storage=True
    maintenance=False
    state=EngineDown
    stopped=False

常见问题

  1. 在安装hosted engine过程中可能会报如下错误
    engine error
    解决方法:
    在PrepareVM过程中,到Get local VM IP这一步时,如下:
    getvmip
    迅速在host1主机上执行(注意最后的ip地址换成你环境中hosts1的ip):
[root@node100 ~]# ssh -L 0.0.0.0:5910:localhost:5900 192.168.5.100

需要提前安装virt-viewer,然后通过virt-viewer连接HostedEngine虚机,连接地址:vnc://192.168.0.210:5910,然后使用root帐号登录到系统中(密码为部署是所配置),将/etc/yum.repos.d/目录清空或者移动到其它目录下:
view

vnc

yum

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

oVirt 4.4.10三节点超融合集群安装配置及集群扩容(一) 的相关文章

  • Linux上启用kvm嵌套虚拟化功能

    kvm支持嵌套虚拟化 即可以在虚拟机中创建虚拟机 本文主要介绍如何在使用Intel处理器的CentOS7中开启KVM的嵌套虚拟化功能 kvm主要是通过内核模块来实现的 因此我们查看系统是否开启了kvm嵌套虚拟化 只需要 cat sys mo
  • Proxmox VE(PVE) 进行网卡直通

    文章目录 我的设备 介绍 添加CPU支持 开启iommu 查询网卡信息 Intel CPU AMD CPU 新增所需模块 添加PCI设备 命令模式添加 web页面模式添加 验证IOMMU有效 IOMMU中断重映射 查看中断重映射 启用中断重
  • 一名系统研究者的攀登之路-陈海波-

    陈海波 原复旦大学Pa ra lle l Proc e s s ing Institute实验室的牛人 在sosp EuroSys等世界最顶级会议上发表过论文的大牛人 不过 现在被上交软件学院给挖走了 哈哈 1 引言 写好计算机系统领域的研
  • 服务器物理机使用ESXI虚拟化并划分虚拟机

    前言 最近因为增加了一台物理机 所以需要对物理机进行虚拟化后划分虚拟机 下面主要来介绍物理机划分虚拟机的操作步骤 物理机虚拟化 1 下载VMware VMvisor Installer 6 0 0 update01 3029758 x86
  • vmware esxi 6.7 下载以及如何在虚拟机里实现显卡直通?

    为了让vmware支持显卡 找了好久esxi下载 版本太多了 都不知道要下哪个 找到别人贡献的百度链接 分析给大家 使用esxi也不行 esxi需要安装在裸机上 才能支持独显 不能直接安装在windows上 后来查资料使用 qemu kvm
  • qemu创建linux虚拟机(亲测有效,virt-manger方式)

    1 网桥的搭建 Bridge方式原理 Bridge方式即虚拟网桥的网络连接方式 是客户机和子网里面的机器能够互相通信 可以使虚拟机成为网络中具有独立IP的主机 桥接网络 也叫物理设备共享 被用作把一个物理设备复制到一台虚拟机 网桥多用作高级
  • 虚拟化技术基础汇总(特全,初学者值得一看)

    虚拟化意味着应用程序可以使用一个资源 而不必担心它驻留在哪里 技术接口是什么 它是如何实现的 它使用的平台以及它有多少可用 里克 F 范德兰斯 目录 一 什么是虚拟化 1 虚拟化概念 2 虚拟化的类型 服务器虚拟化 网络虚拟化 桌面虚拟化
  • Linux 桌面虚拟化技术 KVM

    KVM 是 Kernel based Virtual Machine 的简称 是一个开源的系统虚拟化模块 自Linux 2 6 20之后集成在Linux的各个主要发行版本中 它使用Linux自身的调度器进行管理 所以相对于Xen 其核心源码
  • 全/半虚拟化、硬件/软件辅助的全虚拟化之间的区别与联系

    全虚拟化 不需要对GuestOS操作系统软件的源代码做任何的修改 就可以运行在这样的VMM中 在全虚拟化的虚拟平台中 GuestOS并不知道自己是一台虚拟机 它会认为自己就是运行在计算机物理硬件设备上的HostOS 因为全虚拟化的VMM会将
  • ovirt-node和ovirt-engine相连遇到的问题解决办法

    1 Host 192 168 70 7 does not comply with the cluster Default emulated machines The Hosts emulated machines are
  • 虚拟化技术-KVM的安装及管理

    1 宿主机环境准备 KVM需要宿主机CPU必须支持虚拟化功能 因此如果是在vmware workstation上使用虚拟机做宿主机 那么必须要在虚拟机配置界面的处理器选项中开启虚拟机化功能 1 CPU开启虚拟化 硬件 处理器 2核 勾选虚拟
  • 云管平台 — vRealize Suite

    原文地址 https blogs vmware com china 2017 11 08 E4 BA 91 E7 AE A1 E5 B9 B3 E5 8F B0 vrealize suite vRealize Suite 是 vRealiz
  • 解决qemu虚拟机图形界面卡死问题

    1 基础环境 Virtio gpu双heads 4 9 0内核 xserver1 9 3 modesettings0 5 0驱动 2 问题描述 终端中打开大量文字内容 不停上下滑动 或cat大量内容的文件 操作过程中用户界面卡死 如下 3
  • Libvirt安装

    目录 建立在上一章的基础上 一 Libvirt安装与配置 1 修改 etc selinux config 文件 2 配置yum源为阿里源 3 清理yum源 4 重新生成新缓存 5 检查系统是否安装 libvirt qemu 6 检查kvm模
  • Windows Server 2019 会话远程桌面-快速部署(RemoteApp)

    目录 一 实验要求 二 搭建远程桌面服务RDS 三 需要软件安装 1 安装Firefox 浏览器 2 安装一款视频播放器 3 安装WPS office 套件 四 发布应用 1 发布Firefox 浏览器 2 发布一款视频播放器 3 发布WP
  • VMware虚拟化- 虚拟化与VMware的基础介绍

    1 什么是虚拟化 1 1 虚拟化概念 通俗的理解 如果你问 什么是虚拟化 我想大部分人的回答都会是 就是在一个操作系统中运行另一个操作系统 虽然这个答案也没错 但这并不是真正 虚拟化 的意义 只能说是虚拟化在硬件和操作系统之间的一个实践 事
  • [转]漫谈虚拟化-计算虚拟化中的 I/O 虚拟化

    如果你认为本系列文章对你有所帮助 请大家有钱的捧个钱场 点击此处赞助 赞助额0 1元起步 多少随意 声明 本文只用于个人学习交流 若不慎造成侵权 请及时联系我 立即予以改正 锋影 email 174176320 qq com 今天 咱们继续
  • vmware fusion个人版

    个人免费版虚拟机 不要访问中文网站 以下链接都是英文网站 如果之前将该网站的国家设置成中国 请将其设置回美国后再打开链接 首先注册VMware Fusion Player 账号 并激活 https my vmware com web vmw
  • Qemu-KVM基本工作原理分析

    1 理解KVM与Qemu的关系 我们都知道开源虚拟机KVM 并且知道它总是跟Qemu结合出现 那这两者之间有什么关系呢 首先 Qemu本身并不是KVM的一部分 而是一整套完整的虚拟化解决方案 它是纯软件实现的 包括处理器虚拟化 内存虚拟化以
  • Terraform 应用抛出错误“等待插件启动时超时”

    我在 terraform 应用期间遇到以下错误 Error timeout while waiting for plugin to start Debug LOG 2020 07 09T13 15 46 551 0400 DEBUG plu

随机推荐