在 IBM Cloud 上使用 Spectrum LSF 管理数据

2024-01-04

在 IBM Cloud 上使用 Spectrum LSF 管理数据

在云环境中处理 HPC 工作负载时,要解决的一个关键挑战是如何以最佳方式管理运行工作负载所需的数据,以及可能需要分析以进行进一步处理和决策的输出。 通过使用部署在 IBM Cloud®上的 IBM® Spectrum LSF 集群,您可以使用以下方法来管理数据。

使用 IBM Cloud 进行混合设置

如果您的安装正在使用 VPN 或直接链接将本地 Spectrum LSF 环境连接到 IBM Cloud上的 Spectrum LSF 集群, 您可以配置 LSF 多集群功能,并使用 Spectrum LSF Data Manager 组件将数据从本地登台到 IBM Cloud上的 Spectrum LSF 集群。

通过本地集群,数据通常驻留在安装到每个计算节点上的一个或多个文件系统上。 通常,您不需要考虑数据位置或位置 (某些工作负载确实受益于与文件管理器 “更接近” ,而 IBM Spectrum LSF 具有许多允许您考虑数据位置的功能)。

在混合设置中,工作可以在本地和云中运行,数据如何和何时移入和移出云很重要。 不幸的是,这并没有一个一刀切的解决方案,你的数据移动策略取决于多个因素:

  • 将工作负载发送到云的频率和数量-您是发送少量作业还是发送数千个作业?
  • 该数据的更改频率-数据集是静态的还是不断变化的?
  • 数据大小-需要移动多少?
  • 每个作业的数据唯一性-每个作业都需要唯一的数据输入,还是大部分作业都在复用或共享公共数据?
  • 工作负载的运行时-如果将数据获取到云所用的计算时间与时间的比率较低,那么在云上运行该工作负载可能成本效益不高

对于静态数据需求或具有少量增量更改的数据需求,通过使用 IBM Aspera之类的解决方案,在本地和云之间镜像数据集可能具有成本效益。 在创建集群并按调度或按作业进行再同步时,可以批量移动数据,以确保最新的更改可用。

对于具有唯一需求的作业,可以将数据需求指定为作业提交的一部分 (bsub -f) ,并在作业运行时将文件传输到计算节点,并在完成后将结果传输回计算节点。 在这种情况下,数据完全是瞬态的,在取消供应计算节点时将被擦除。

随着数据传输时间的增加,示例解决方案的效率会降低,因为在传输数据之前会供应计算节点,在取消供应节点之前会传输回结果。

LSF 的数据管理器组件通过独立于作业调度数据移动来解决此问题。 在供应任何节点之前,会将输入文件传输到云存储器,在取消供应节点之后,会将结果传输回云存储器。 Data Manager 还会取消重复传输,避免重复传输的文件与重复传输的文件相同。 在执行实验类型分析或回归的设计时,以及在大多数数据在数千个或数十万个作业之间通用的情况下运行验证时,这一点很重要。

为了进一步减少数据移动,还可以在云中进行预处理和后处理。 LSF 的 Application Center 提供了一个 Web 门户网站和 restful API ,它允许将作业直接提交到云集群,并在作业或云中的数据上启动远程可视化工具。 为支持常见输出格式的可视化而构建的 Application Center。 它还具有一个客户机组件,可用于将数据从笔记本电脑直接上载或下载到云集群。

通过云中的 IBM Spectrum LSF 集群部署的 NFS 实例可用作具有数据管理器配置的目标。 当数据在 NFS上可用时,它对 Spectrum LSF 集群的管理节点和工作程序节点可见。

IBM Cloud 上的独立集群

借助云上的专用或独立集群,您的数据将驻留在云中。 您可以使用 IBM Cloud Object Storage 将数据引入 IBM Cloud 帐户。 Object Storage 提供了一个廉价且可靠的选项来管理 IBM Cloud中的数据。 当数据在 Object Storage中可用时,可以将 Object Storage 存储区安装到管理节点上,或者将数据从 Object Storage 存储区复制到 NFS 实例,以使数据对 Spectrum LSF 集群的管理节点和工作程序节点可见。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 IBM Cloud 上使用 Spectrum LSF 管理数据 的相关文章

  • hp服务器 高性能计算,HP Gen8:为提升数据中心效率而生

    ZDNet至顶网服务器频道 5月21日 北京报道 文 孟庆 xff1a 距离惠普发布新一代Gen8服务器已经过去快两个月的时间了 对于HP ProLiant Gen8的很多新特性 xff0c 业界也在这期间展开了很多讨论和评测 前不久 xf
  • 高性能计算

    信息时代的硬件芯片和存储器价格以摩尔定律的形式下降 xff0c 可是现在处理的数据量也越来越大 我们先以cocoa编程为例 xff0c 然后再结合网格计算 云计算 xff0c 综合对最新的高性能计算技术作介绍 使用 runloop 在coc
  • 微软HPC解决方案概述与实作

    HPC解决方案是微软产品历史长河中的一个砂砾 xff0c 国内很少有人提及 xff0c 因此老王准备把这个砂砾擦擦 xff0c 为大家呈现出来 开始之前我们不妨先来看下HPC的概念 xff0c 前面我们花了将近50篇左右的文章 xff0c
  • Kubernets集群管理-升级 kubernetes 集群版本到v1.21.14

    Kubernets集群管理 kubernets集群升级 文章目录 Kubernets集群管理 kubernets集群升级前言一 检查kubernets各组件当前版本二 升级控制节点平面kubernets版本1 使用操作系统的包管理器找到最新
  • Intrinsics头文件与SIMD指令集、Visual Studio版本对应表

    Intrinsics头文件与SIMD指令集 Visual Studio版本对应表 File Intrinsics头文件 描述 指令集描述 VS Visual Studio版本号 VisualStudio Visual Studio版本名 F
  • openmpi编译安装

    概念原理 OpenMPI是一个免费的 开源的MPI实现 兼容MPI 1和MPI 2标准 OpenMPI由开源社区开发维护 支持大多数类型的HPC平台 并具有很高的性能 功能描述 OpenMPI借助TCP IP网络连接的多台计算机 以此分发数
  • LU分解算法(串行、并行)

    一 串行LU分解算法 详细见MIT线性代数 1 LU分解 矩阵分解 LU分解 分解形式 L 下三角矩阵 U 上三角矩阵 目的 提高计算效率 前提 1 矩阵A为方阵 2 矩阵可逆 满秩矩阵 3 消元过程中没有0主元出现 也就是消元过程中不能出
  • 阿里云E-HPC+i4p大内存实例,加速寻因生物单细胞数据分析效率

    寻因生物是一家专注于单细胞技术的生物科技企业 拥有自主研发的微孔芯片与油包水双技术单细胞捕获平台 致力于通过国产高通量单细胞全链条产品及服务 将单细胞技术普适化应用于临床及药物研发 助力相关疾病研究 单细胞测序技术呼唤更高计算性能 自单细胞
  • CUDA 计算线程索引的一般公式

    第一种方法 CUDA thread index int blockId blockIdx z gridDim x gridDim y blockIdx y gridDim x blockIdx x int threadId blockId
  • BLAS+BLACS+LAPACK+SCALAPACK安装

    最快的安装是用下面的scalapack installer 它将自动联网安装SCALAPACK以及所需要的BLAS BLACS LAPACK 下面是简短说明 INTRODUCTION The ScaLAPACK installer is a
  • 高性能计算(HPC)和智能计算理解

    1 现代终端设备一般都跟云端服务器相连 但只要可能 我们都希望计算可以在本地终端解决 这样做的好处是多方面的 既可以减小网络带宽的压力 又可以避免网络传输产生的时延 还可以让用户的数据更安全 现代终端设备一般用一个片上系统 SoC 做计算
  • 引用 LSF 作业数组中的作业索引

    我试图将作业数组中作业的索引作为参数传递给另一个 bash 脚本 numSims 3 numTreatments 6 uses numTreatments top rows of parameters csv maxFail 10 j 1
  • 在 IBM Cloud 上使用 Spectrum LSF 管理数据

    在 IBM Cloud 上使用 Spectrum LSF 管理数据 在云环境中处理 HPC 工作负载时 要解决的一个关键挑战是如何以最佳方式管理运行工作负载所需的数据 以及可能需要分析以进行进一步处理和决策的输出 通过使用部署在 IBM C
  • Slurm - 如何使用所有可用的 CPU 来执行独立任务?

    我的问题和这个问题类似 利用 SLURM 上的所有 CPU https stackoverflow com questions 57466957 make use of all cpus on slurm 长话短说 我想在尽可能多的节点上使
  • 如何检索 slurm 脚本的内容?

    我几天前提交了一份工作 现在仍在运行 但我忘记了内容script sh那天 还有script sh已被删除 您知道如何恢复该脚本的内容吗 在最新版本中 您可以使用以下命令检索您自己作业的作业脚本 scontrol write batch s
  • Java 中的 Infiniband

    众所周知 OFED的Socket Direct协议是已弃用 http en wikipedia org wiki Sockets Direct ProtocolOFED 的 3 x 版本根本不附带 SDP 因此 Java 的SDP http
  • OpenMP 和 C++11 多线程

    我目前正在从事一个混合高性能计算 HPC 和交互性的项目 因此 HPC 部分依赖于 OpenMP 主要是具有大量相同计算的 for 循环 但它包含在具有 GUI 和多线程的更大框架中 目前通过 c 11 线程实现 std thread an
  • 在不同架构的集群上应该指定哪个AVX和march?

    我目前正在尝试使用英特尔编译器编译用于 HPC 集群的软件 登录节点是我编译和准备计算的地方英特尔至强金牌 6148 https ark intel com content www us en ark products 120489 int
  • 大规模分布式系统中的日志文件

    我在网格和 HPC 领域做了很多工作 对于分布在数百 或在某些情况下数千 服务器上的系统 我们面临的最大挑战之一是分析日志文件 当前日志文件本地写入每个刀片上的磁盘 但我们也可以考虑使用 UDP Appender 等发布日志信息并集中收集
  • SunGridEngine、Condor、Torque 作为 PVM 的资源管理器

    有人知道哪个资源管理器适合 PVM 吗 或者我不应该使用 PVM 而是依赖 MPI 或其任何版本 例如 MPICH 2 还有其他更好的吗 使用 PVM 的主要原因是因为在我之前开始这个项目的人假设使用 PVM 然而 现在这个项目是我的了 他

随机推荐

  • CRM管理系统能提供哪些应用价值?CRM的功能

    牢固的客户关系是推动持续收入增长和盈利能力的关键 CRM管理系统则是完成这一目标的钥匙 预计到2024年 CRM在国内SaaS平台中的占比达到50 CRM解决方案存储了所有与客户相关的信息 并通过自动化工作流 全渠道沟通 销售流程管理等功能
  • 前端vue-puzzle-vcode验证码使用

    1 安装vue puzzle vcode npm i S vue puzzle vcode 2 实现代码
  • flannel和calico区别

    k8s网络模式 Flannel数据包在主机间转发是由backend实现的 目前已经支持UDP VxLAN host gw等多种模式 VxLAN 使用内核中的VxLAN模块进行封装报文 也是flannel推荐的方式 host gw虽然VXLA
  • wireshark抓包工具的使用

    专注于分享软件测试干货内容 欢迎点赞 收藏 留言 如有错误敬请指正 交流讨论 欢迎加入我们一起学习 资源分享 耗时200 小时精选的 软件测试 资料包 软件测试学习教程推荐 火遍全网的 软件测试 教程 前言 wireshark是非常流行的网
  • win8如何录制屏幕?实用教程分享

    录制屏幕已成为人们日常学习和工作中经常需要面对的问题 随着windows 8系统的普及 越来越多用户需要了解如何在这个平台上录制屏幕 可是win8如何录制屏幕呢 接下来 本文将介绍三种在win8系统上录制屏幕的方法 我们将对每种方法的操作步
  • zzz888

    8
  • 实实在在万事达!实在智能助力山东万事达集团加速数智化转型

    近日 杭州实在智能科技有限公司 以下简称 实在智能 与山东建筑钢市场 领头羊 山东万事达控股有限公司 以下简称 万事达集团 召开 RPA 机器人流程自动化 项目启动会 实在智能携手万事达集团 联合共建财务RPA一体化研发管理项目 以下简称
  • Java中的IO与NIO篇----第二篇

    系列文章目录 文章目录 系列文章目录 前言 一 阻塞 IO 模型 二 非阻塞 IO 模型 三 多路复用 IO 模型 前言 前些天发现了一个巨牛的人工智能学习网站 通俗易懂 风趣幽默 忍不住分享一下给大家 点击跳转到网站 这篇文章男女通用 看
  • iPhone强制恢复出厂设置,记好这2种方法!

    随着智能手机的广泛普及 如今有越来越多的人开始使用iPhone手机 但是 在使用的过程中 我们可能会遇到各种问题 比如程序崩溃 软件故障 系统运行缓慢等等 此时 恢复出厂设置成为了一种解决问题的有效方法 本文将为大家提供两种iphone强制
  • 人工智能未来发展前景怎么样?

    人工智能的未来发展前景怎么样 人工智能的未来发展前景非常广阔 有以下几个方面的发展趋势和前景 1 人工智能的未来发展前景 应用领域扩展 人工智能将在各个领域得到广泛应用 包括医疗保健 金融 交通 制造业 农业等 人工智能技术将帮助提高效率
  • 各位大佬看看这是不是macos的一个bug啊

    请各位大佬看看是不是一个bug啊 打开mac自带的命令行 先输入man less 显示没问题 再输入man more 发现出现的是less的说明 这里出了问题 第一张图是man less 第二张图是man more 我的系统环境如下
  • 易点易动固定资产管理系统:集成飞书,助力企业全生命周期固定资产管理

    易点易动固定资产管理系统 集成飞书 助力企业全生命周期固定资产管理 在现代商业环境中 固定资产管理对企业的运营和发展至关重要 为了提高管理效率和降低成本 我们引入了易点易动固定资产管理系统 该系统集成了飞书 为企业提供全生命周期的固定资产管
  • 美军杀伤网概念研究及对我防空作战装备体系的启示

    源自 现代防御技术 作者 王玉茜 曹亚杰 佘晓琼 廖咏一 人工智能技术与咨询 发布 摘 要 DARPA寻求从杀伤链转向杀伤网 意图利用信息网络构建高度分散的杀伤网 形成难以预测的杀伤链 美空军在试验旗体系下开展 橙旗 翠旗 和 黑旗 试验
  • Jenkins集成部署java项目

    文章目录 Jenkins简介 安装 Jenkins简介 Jenkins能实时监控集成中存在的错误 提供详细的日志文件和提醒功能 还能用图表的形式形象的展示项目构建的趋势和稳定性 官网 安装 在官网下载windows版本的Jenkins 但是
  • 技术人的年终总结分享

    印象深刻的实战经历 系统学习新技术的心得体会 精心整理的技术文档 想要安利给所有人的开发工具 对技术行业的深度思考 职业规划与心灵成长 新年Flag 在项目中取得的辉煌成绩 在应用开发中遇到的问题与解决方案 职场经历与升职感悟 编程语言的新
  • 电锯切割狂

    欢迎来到程序小院 电锯切割狂 玩法 把木块切成等分的碎片 每关都会有切割次数 木块数 切割越均匀分数越搞 有简单 正常 困难 专家版 快去解锁不同版本进行切割吧 开始游戏 https www ormcc com play gameStart
  • String.join()方法

    String join 是 Java 8 中添加的一个静态方法 它可以将一个字符串数组或者一个迭代器中的元素连接成一个字符串 它的语法如下 public static String join CharSequence delimiter C
  • 老生常谈问题之——进程和线程的关系和区别

    最初 我们在学习进程和线程的时候都是和操作系统的知识相关的 但是我们前端菜鸟除了面试的时候很少用到他们 所以我们还是从前端常见的场景来详细的学习进程和线程吧 在前端提到关于进程和线程的概念主要有以下几个场景 1 js 是单线程的编程语言 也
  • JavaScript基础教程|自定义 Error,扩展 Error,深入继承,包装异常,继承 SyntaxError

    函数组件没有自己转台只负责数据展示 类组件有自己的状态 负责更新ui 27state和setState的方法 state的值是对象 表示一个组件里面可以有多个的数据 组件内部的私有数据 只能在组件内部使用 简化语法初始化state stat
  • 在 IBM Cloud 上使用 Spectrum LSF 管理数据

    在 IBM Cloud 上使用 Spectrum LSF 管理数据 在云环境中处理 HPC 工作负载时 要解决的一个关键挑战是如何以最佳方式管理运行工作负载所需的数据 以及可能需要分析以进行进一步处理和决策的输出 通过使用部署在 IBM C