如何减少 SORT 操作中的 CPU 占用

2024-01-06

我正在使用 DFSORT 将磁带数据集复制到临时文件，并处理大约 80000000 条记录。仅复制数据集就需要 3 个小时。有没有其他方法可以减少CPU时间。建议将会非常有帮助。谢谢。

    //STEP40  EXEC SORTD                                              
    //SORTIN   DD DSN=FILEONE(0),                           
    //            DISP=SHR                                            
    //SORTOUT  DD DSN=&&TEMP,                                       
    //            DISP=(NEW,PASS,DELETE),                          
    //            DCB=(RECFM=FB,LRECL=30050,BLKSIZE=0),               
    //            UNIT=TAPE                                           
    //SYSOUT   DD SYSOUT=*                                            
    //SYSPRINT DD SYSOUT=*                                            
    //SYSIN    DD *                                                   
         SORT FIELDS=(14,6,PD,A,8,6,PD,A,45,2,ZD,A)                   
         OUTREC IFTHEN=(WHEN=(70,18,CH,EQ,C' encoding="IBM037"'),     
                     OVERLAY=(70:C'  encoding="UTF-8"'))              
         OPTION DYNALLOC=(SYSDA,255)                                  
    /*

我喜欢诊断这类问题......

每条 30K 的 80M 记录大约为 2.5TB，并且由于您正在读取和写入这些数据，因此您至少要处理 5TB（不包括工作文件的 I/O）。如果我没算错的话，三个小时内平均每秒传输 500MB。

首先要做的是了解 DFSORT 是否确实主动运行了 3 个小时，或者是否存在等待时间的来源。例如，如果您的磁带是多卷数据集，则磁带安装可能需要等待时间。在作业日志消息中查找这一点 - 可能 3 小时中的 20 分钟只是在等待安装正确的磁带。

您还可能会遇到 CPU 使用问题，从而延长等待时间。根据系统的设置方式，您的作业可能只获得一小部分 CPU 时间并等待其余时间。您可以通过查看消耗的 CPU 时间（也在作业日志消息中）并将其与经过的时间进行比较来判断...例如，如果您的作业在 3 小时内获得 1000 CPU 秒（TCB + SRB），那么您在此期间，CPU 使用率平均为 9%。在不同的工作类别中提交您的工作可能会产生影响 - 询问您当地的系统程序员。

当然，9% 的 CPU 时间可能不是问题 - 您的作业可能严重受 I/O 限制，因此大量等待时间是等待 I/O 完成，而不是等待更多 CPU 时间。你真正想知道的是你的等待时间是等待CPU访问、等待I/O还是其他原因。同样，如果您的本地系统程序员知道如何阅读 RMF 报告，他应该能够帮助您回答这个问题。

接下来要做的就是更好地了解您的 I/O，目标是减少需要执行的物理 I/O 操作的总数和/或使每个 I/O 运行得更快一些。

可以这样想：每个物理 I/O 至少需要 2-3 毫秒。在最坏的情况下，如果您正在读取/写入的 160M 记录中的每一条都需要 3 毫秒，则经过的时间将为 160,000,000 X .003 = 480,000 秒，即五天半！

正如另一位回复者提到的，块大小和缓冲是你的朋友。由于 I/O 操作的大部分时间都归结为触发 I/O 并等待响应，因此“大 I/O”不会比“小 I/O”花费更长的时间。通常，您希望执行尽可能少且尽可能大的物理 I/O 操作，以缩短运行时间。

根据您使用的磁带设备类型，您应该能够在磁带上获得最多 256K 的块大小 - 即每个 I/O 7 条记录。您的 BLKSIZE=0 可能已经得到了这个，具体取决于您的系统配置方式。请注意，尽管这与设备相关，但请注意您的站点是否碰巧使用将“真实”磁带驱动器映射到磁盘的虚拟磁带产品之一……此处，超过特定限制 (32K) 的块大小往往会运行较慢。

不幸的是，缓冲比之前建议的答案更复杂......事实证明，BUFNO 适用于使用 IBM 的 QSAM 访问方法的相对简单的应用程序 - 而这不是 DFSORT 所做的。事实上，DFSORT 对于 I/O 处理方式非常聪明，并且它根据可用内存动态创建缓冲区。不过，您可能会尝试在更大的区域中运行作业（例如，JCL 中的 REGION=0），并且您可能会发现 DFSORT 选项，例如 MAINSIZE=MAX 帮助 - 请参阅这个链接 https://www.ibm.com/support/knowledgecenter/en/SSLTBW_2.1.0/com.ibm.zos.v2r1.icea100/gener.htm.了解更多信息。

至于磁盘 I/O（包括那些 SORTWK 数据集），这里也有很多选项。 30K LRECL 在很大程度上限制了您可以执行的阻止操作，但是您可以进行各种磁盘调整练习，从使用 VIO 数据集到 PAV（并行访问卷）。要点是，其中很多内容也是特定于配置的，因此正确的答案将取决于您的站点拥有什么以及如何配置。

但也许最重要的是，在你偶然发现正确的答案之前，你不想纯粹地尝试和犯错。如果您想学习，请熟悉 RMF 或您站点拥有的任何性能管理工具（或找到愿意与您合作的系统程序员）并深入研究。问问自己，瓶颈是什么 - 为什么这项工作运行得更快？然后找到瓶颈，修复它，然后继续下一个。这些都是需要掌握的巨大技能，一旦你了解了基础知识，它就不再像是一门黑魔法，而更像是一个你可以遵循的任何事情的系统过程。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何减少 SORT 操作中的 CPU 占用的相关文章

使用 PyTorch 直接将数据加载到 GPU 中

在训练循环中我将一批数据加载到 CPU 中然后将其传输到 GPU import torch utils as utils train loader utils data DataLoader train dataset batch si
按字母顺序比较 2 个字符串以进行排序

我正在尝试按字母顺序比较两个字符串以进行排序例如我想要进行布尔检查例如if aaaa lt ab 我尝试过但它没有给我正确的结果所以我想这不是正确的语法如何在 jquery 或 Javascript 中执行此操作您确实说比较是
无法在 Android Studio 2.3.3 中解析“com.google.firebase:firebase-messaging:11.0.4”

我想在 Android studio 上设置一个 firebase 云消息客户端应用程序我正在使用最新版本的 Android studio 2 3 3 并且我的 android SDK 已完全更新这是我的项目 gradle 文件 bui
部分可见的底部工作表 - 颤动

在颤振中是否可以在初始状态下部分查看底部工作表然后能够展开关闭我提供了 Google 地图实现的示例的屏幕截图 Use the DraggableScrollableSheet小部件与Stack widget 这是gist https

随机推荐

Rails 3：actionmailer 不使用 :from => 参数

大家好我正在尝试为联系页面运行电子邮件并且电子邮件发送得很好但问题是发件人字段不会显示我的邮件程序方法内的 from gt 下面的我的恢复密码功能也会发生同样的情况发件人字段中保留的电子邮件是电子邮件受保护 cdn cg
我如何在hadoop中处理大量小文件？

我是 hadoop 新手正在处理 wordcount 示例中的大量小文件它需要大量的地图任务并导致我的执行速度变慢如何减少地图任务的数量如果解决我的问题的最佳解决方案是将小文件捕获到较大的文件我该如何捕获它们如果你正在使用类似的
有效地生成链表的所有可能排列？

有许多算法可用于生成给定值集的所有可能排列通常这些值表示为具有 O 1 随机访问权限的数组然而假设要排列的元素表示为双向链表在这种情况下您无法在 O 1 时间内随机访问列表中的元素因此许多排列算法将经历不必要的减速是否有一种
如何找到两个序列之间的重叠并返回它

我需要找到两个序列之间的重叠部分重叠位于第一个序列的左端和第二个序列的右端我希望该函数找到重叠部分并返回它我的序列是 s1 CGATTCCAGGCTCCCCACGGGGTACCCATAACTTGACAGTAGATCTC s2 GGCT
putpkt：写入失败，管道损坏

我正在使用 AdHoc 部署在 iPad 上部署我的应用程序但收到此错误我已经检查了 SO 中的几个问题它们的说法相同但解决方案始终是重新启动 XCode 重新启动 iPad 重新启动 Mac 我已经完成了所有三个操作但此错误并未
带枕头的图像上出现羽状边缘

我试图弄清楚如何使用 Pillow 和 Python 来羽化图像的边缘我需要像这只可爱的猫这样的东西忽略可见的边缘 I tried im filter ImageFilter BLUR 但这不是我要找的看看这个例子 from PIL
使用 Hibernate / Spring / JUnit 设置和拆除复杂的数据库状态

我有一个正在进行单元测试的课程需要相当广泛的数据库设置才能运行各个测试方法此设置需要很长时间由于希望与当前问题无关的原因我需要以编程方式而不是从 SQL 转储填充数据库我遇到的问题是拆卸如何轻松回滚数据库设置阶段所做的所有更改
我可以用python生成真实的随机数吗？

我正在学习Python的随机模块我知道它会生成伪随机数其核心思想是使用高频时钟作为种子然后使用函数产生看起来像随机数据我所知在现实世界中产生真实的随机数是不可能的但我知道Unix随机数生成器引入了一些其他因素例如鼠标移动轨迹
C# - ADO.NET 的一些高性能最佳实践/技巧是什么 [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我决定不使用 orm 并直接在我的项目中使用 ADO NET 我知道我知道它会花费更长的时间来编程但我只是希望页面即使在高峰时间也能高速加载
声明 xsl 变量并为其赋值

我正在开发一个使用 apache cocoon 将 XML 转换为 PDF 的应用程序并且我正在重新设计处理输入 XML 的 XSL 目前在 XSL 中我们有这样的代码
使设置随机种子独立的函数

有时我想编写一个随机函数它始终为特定输入返回相同的输出我总是通过在函数顶部设置随机种子然后继续来实现这一点考虑以这种方式定义的两个函数 sample 12 lt function size set seed 144 sample 1
更改运行 Windows 窗体程序的用户

我用 C 编写了一个简单的 Windows 窗体程序我希望能够输入 Windows 用户名和密码当我单击登录按钮来运行代码时我会以我输入的用户身份运行代码您可以使用 WindowsIdentity Impersonate 方法来实
iOS购买收据验证失败怎么办？

iOS购买收据服务器验证通常是这样的用户在 iPhone 上购买您的应用程序将购买收据发送到服务器服务器收到收据并发送给Apple进行验证服务器从Apple获取验证结果服务器将验证结果发送给应用程序但如果只有第 1 步成功怎么办
带填充的 Python 整数到十六进制字符串

考虑一个整数 2 我想将其转换为十六进制字符串 0x02 通过使用python的内置函数hex 我可以获得 0x2 这不适合我的代码谁能告诉我如何以方便的方式获得我想要的东西谢谢 integer 2 hex string 0x 02x
将 CoreData 添加到现有项目

我正在尝试将 CoreData 添加到现有项目中并且有奇怪的错误我收到错误由于未捕获的异常而终止应用程序 NSInvalidArgumentException 原因无法创建 NSPersistentStoreCoordinator
当 `git add` 操作时，“不会添加文件别名‘samefile’（‘SameFile’已存在于索引中）”

我下载了linux的内核源代码并且想要git add商场 When I git add git 开始添加它们但很快它返回一个错误 fatal Will not add file alias include linux netfilter
应用掩码以格式化 SQL Server 查询/视图中的字符串

有没有一种巧妙的方法可以将掩码应用于 SQL Server 查询中的字符串我有两张表一张的电话号码存储为 varchar 没有文字0155567890和电话类型其中具有该电话号码类型的掩码返回字符串对于合并文档以便查询返回完全格
您可以对多个泛型类型参数强制执行相同的约束吗？

我知道你可以你可以这样做 void M
无法在 Linux 上安装 pyodbc

我正在运行 Linux 2 6 18 164 15 1 el5 centos plus 并尝试安装 pyodbc 我正在执行 pip install pyodbc 并得到一个很长的错误列表其结尾为错误命令 gcc 失败退出状态为 1
如何减少 SORT 操作中的 CPU 占用

我正在使用 DFSORT 将磁带数据集复制到临时文件并处理大约 80000000 条记录仅复制数据集就需要 3 个小时有没有其他方法可以减少CPU时间建议将会非常有帮助谢谢 STEP40 EXEC SORTD SORTIN DD

如何减少 SORT 操作中的 CPU 占用

如何减少 SORT 操作中的 CPU 占用 的相关文章

随机推荐

热门标签

如何减少 SORT 操作中的 CPU 占用的相关文章