人类可读、递归、排序的最大文件列表

2024-03-12

在 POSIX shell 中打印前 10 个最大文件列表的最佳实践是什么？必须有比我当前的解决方案更优雅的东西：

DIR="."
N=10
LIMIT=512000

find $DIR -type f -size +"${LIMIT}k" -exec du {} \; | sort -nr | head -$N | perl -p -e 's/^\d+\s+//' | xargs -I {} du -h {}

其中 LIMIT 是限制查找结果的文件大小阈值。

Edit:

使用 Gnu 实用程序（du and sort):

du -0h | sort -zrh | tr '\0' '\n'

这使用空分隔符在之间传递信息du and sort和用途tr将空值转换为换行符。空值允许该管道处理可能包含换行符的文件名。两个都-h选项使输出成为人类可读的形式。

原来的：

这使用awk为排序键创建额外的列。它只调用du一次。输出应该看起来完全像du.

我已将其分成多行，但可以将其重新组合成一行。

du -h |
  awk '{printf "%s %08.2f\t%s\n", 
    index("KMG", substr($1, length($1))),
    substr($1, 0, length($1)-1), $0}' |
  sort -r | cut -f2,3

解释：

BEGIN - 创建一个字符串来索引，用 1、2、3 代替 K、M、G 按单位分组，如果没有单位（大小小于 1K），则不匹配并返回零（完美！）
打印新字段 - 单位、值（为了使 alpha 排序正常工作，它是零填充的、固定长度）和原始行
索引大小字段的最后一个字符
拉出尺寸的数字部分
对结果进行排序，丢弃多余的列

尝试一下，无需cut命令来查看它在做什么。

Edit:

这是一个在 AWK 脚本内进行排序并且不需要剪切的版本（需要 GNU AWK (gawk) for asorti支持）：

du -h0 |
   gawk 'BEGIN {RS = "\0"}
        {idx = sprintf("%s %08.2f %s", 
         index("KMG", substr($1, length($1))),
         substr($1, 0, length($1)-1), $0);
         lines[idx] = $0}
    END {c = asorti(lines, sorted);
         for (i = c; i >= 1; i--)
           print lines[sorted[i]]}'

编辑：添加了空记录分隔以处理包含换行符的潜在文件名。需要 GNUdu and gawk.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Linux

shell

unix

POSIX

人类可读、递归、排序的最大文件列表的相关文章

在bash中用其他文件过滤一个文件

我有一个带有数字的文件例如 cat file 31038467 32048169 33058564 34088662 35093964 31018168 31138061 31208369 31538163 31798862 和其他例如
Linux 阻塞与非阻塞串行读取

I have 这段代码 https stackoverflow com questions 6947413 how to open read and write from serial port in c用于在Linux中从串行读取但我不
期待、互动，然后再次期待

有几篇关于相同内容的帖子但我仍然无法使我的期望脚本正常工作我的目的是自动化一切但保留用户输入的密码所以脚本有 3 个部分自动登录给予用户交互以输入密码将控制权交还给 Expect 脚本以继续工作所以我有一个将生成的脚本其中
Linux Shellcode“你好，世界！”

我有以下可用的 NASM 代码 global start section text start mov eax 0x4 mov ebx 0x1 mov ecx message mov edx 0xF int 0x80 mov eax 0x1
%config(noreplace) 文件上出现意外的 RPM 冲突

我正在创建我自己的RPM using rpmbuild My RPM 包含配置文件哪个应该永远不会被覆盖即使 RPM 包含这些配置文件的新版本为了存档这个我用以下标签标记了它们 config noreplace opt mypacka
如何使用 exec.Command 在 golang 中执行 Mysql 脚本

您好我正在尝试执行一个脚本以使用 Golang 将数据填充到数据库中 func executeTestScript cmd exec Command usr local mysql bin mysql h127 0 0 1 P3333 u
SVN 不断提示我输入密码并拒绝缓存我的凭据

环境 Eclipse Indigo Ubuntu 11 04 Subclipse 1 6 SVN 客户端 Subclipse RabbitVCS 我通过 svn ssh 连接我的网址如下所示 svn ssh 我的名字我的域名路径我可
_dl_runtime_resolve -- 共享对象何时加载到内存中？

我们有一个对性能要求很高的消息处理系统最近我们注意到第一条消息比后续消息花费的时间要长很多倍当它通过我们的系统时会发生大量转换和消息增强其中大部分是通过外部库完成的我刚刚描述了这个问题使用 callgrind 将仅一条消息的运
如何迭代 Bash 中变量定义的数字范围？

当范围由变量给出时如何在 Bash 中迭代数字范围我知道我可以做到这一点在 Bash 中称为序列表达式文档 http www gnu org software bash manual bashref html Brace Expa
为什么 RHEL 上的 bash 中 `read -t` 没有超时？

Why read t在 RHEL5 或 RHEL6 上从管道读取时不会超时这是我的示例在从管道读取数据时我的 RHEL 盒子不会超时 tail f logfile log grep something read t 3 variabl
ubuntu 中的 echo -e 选项不起作用

我的同事使用Ubuntu 我使用openSUSE 我们使用相同的makefile编译相同的源代码我的环境运行良好但我的同事不能总是输出无法识别 e选项我们检查makefile 只发现echo命令使用 e option Ubuntu的
C shell 脚本中是否有短路逻辑运算符？

我认为 C shell 脚本的行为会像 C 一样并对逻辑运算符使用短路求值 if e cache find monitor newer cache then endif 但在 if 语句中即使第一个条件为真也会检查第二个条件从而给出
如何按文件大小对查找结果进行排序

如何按文件大小对 find 命令的结果进行排序我试图对这个 find 命令的结果进行排序 find src type f print0 我不需要目录的大小我需要仅按大小排序的文件相对路径这是如何做的using find command
选择多个模式的 awk 代码

这是我的输入文件比如modified txt r4544 n479826 2012 08 28 07 12 33 0400 Tue 28 Aug 2012 1 line Changed paths M branches 8 6 0 con
Linux shell 标题大小写

我正在编写一个 shell 脚本并有一个如下所示的变量 something that is hyphenated 我需要在脚本中的各个点使用它如下所示 something that is hyphenated somethingthati
'>&0' 有用途吗（重定向到标准输入）？

在 bash 中你可以这样做 echo test gt 1 重定向到标准输出尽管它已经到那里了 echo test gt 2 重定向到标准错误 echo test gt 0 重定向到标准输入当我做最后一个时我的终端仍然打印test就像
C/C++ with GCC：静态地将资源文件添加到可执行文件/库

有人知道如何使用 GCC 将任何资源文件静态编译为可执行文件或共享库文件吗例如我想添加永远不会改变的图像文件如果它们改变了我无论如何都必须替换该文件并且不希望它们位于文件系统中如果这是可能的我认为这是因为 Visual C f
尝试编译 git 但在 linux 中找不到 libcurl

我想编译支持 http https 的 git 我有 ls usr include curl curlbuild h curl h curlrules h curlver h easy h mprintf h multi h stdchea
使用 execv 和输入重定向的 C++ 管道命令

尝试编写一个处理内部和外部命令的 shell 我一次可以获得内部命令和一个外部命令我的问题是如何运行这样的命令 ls l grep lib wc l 我正在使用 fork 并通过 char 中的 execv 传递外部命令关于如何工作有什
BlueZ D-Bus C，应用 BLE

我正在尝试编写一个应用程序来搜索附近的蓝牙设备并与它们通信我的应用程序将用 C 语言编写并打算在 Linux 下工作是否有通过 C 中的 D Bus 使用 BlueZ 的教程或示例此应用程序的目的是从 BLE 中的文件发送数据你能

随机推荐

使 vba 代码适用于所有盒子

您好所以我想做的是使此代码适用于所有复选框的 1 50 我希望代码仅影响单击的框 Private Sub CheckBox1 Click If MsgBox Do you want to lock this box vbYesNo War
xamarin UI 测试 - 无法加载我指向的本机 APK 路径

我想通过使用以下代码引用 APK 的路径来在本机 android APK 上运行 REPL UI 测试 public void BeforeEachTest app ConfigureApp Android ApkFile C app de
PHP应用程序无法连接到127.0.0.1的docker mysql容器

Mysql 位于它自己的 docker compose yml 中因为我想要一个 mysql 服务器启动并运行任何其他 php 应用程序都可以连接到所以我在同一个 docker compose yml 中没有 php 和 mysql
如何在 Laravel 5 中包含外部 CSS 和 JS 文件

我正在使用 Laravel 5 0 表单和 Html Helper 已从此版本中删除我不知道如何在头文件中包含外部 css 和 js 文件目前我正在使用这段代码我认为正确的方法是这样的这里我有一个jslaravel 的目录app p
防止表单内的 ASP.NET 文本框提交表单

这是我正在处理的页面 http mcstevenswholesale com catalog aspx http mcstevenswholesale com catalog aspx 目录下方的文本框允许您跳至目录中的特定页面但是如果
通过 C++ 检查 Windows 计算机是否在以太网上

因此我尝试为此寻找几个不同的答案我认为可能有希望的一个是如何使用 Qt 检查 Windows 上的网络接口类型是以太网还是无线 https stackoverflow com questions 21680108 how to che
JMockit javaagent 未初始化 JMockit

我已经设置了 JMockit 以便与一些也使用 Robolectric 的 JUnit 测试一起使用但我遇到了错误我主要使用 Maven 来运行测试当我运行测试时mvn test以及按指定配置的 javaagenthere http
在我的 GoDaddy 托管计划上设置 git 存储库

Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的答案或互动我有一个使用 git 进行版本控制的项目我想要做的是在我的启用 ssh 的 GoDaddy
计算 R 和 ggplot2 中平滑线的曲线最大值的 x 值

data lt dput data structure list x 1 16 y c 79 62962963 84 72222222 88 42592593 74 07407407 29 62962963 51 38888889 79 6
为什么 chunk_while 返回 Enumerator 对象

为什么chunk while返回一个实例Enumerator 这段代码 array 0 1 2 3 4 5 7 8 9 15 16 p array chunk while i j i 1 j 输出这个
SQL Server 全文搜索包含连字符的短语不返回预期结果

我们有一个使用 SQL Server 2008 数据库和全文搜索的应用程序我试图理解为什么以下搜索的行为不同首先一个包含连字符的单词的短语如下所示 contains column name one two three four fi
有什么方法可以通过查询自省来读取类型上的 GraphQL 指令吗？

对于身份验证等用例可以将自定义指令添加到 GraphQL 模式如文档中所示 https www graphql java com documentation v16 sdl directives https www graphql ja
使用 C# 求解偏微分方程

我正在开发一个项目 C 和 NET Framework 该项目需要我求解一些偏微分方程是否有任何基于 NET Framework 的特定库可供我查看并简化我的工作我使用过 MATLAb 求解偏微分方程非常简单我怎么解决这个问题取决于
如何在控制器之间共享通用逻辑？

我有两个页面和两个控制器可以对同一数据集执行搜索有一种简单的形式来指定搜索条件另一个允许用户在地图上选择数据通过选择区域或单击地图上的要素然后搜索结果将显示在搜索控件下方同一页面上的数据表中因此控制器具有不同的搜索功能
添加自签名 SSL 证书而不禁用权威机构签名的证书

我有一个公司 git 服务器使用自签名证书通过 https 工作本地克隆包含两个遥控器一个指向该服务器的源另一个指向 github 默认情况下从原点拉取失败 git pull fatal unable to access http
我提交的这些图标是什么

我最近开始从事项目工作并使用 Windows 版 Github 提交并推送它但如果你看看 gitignore 有一个 camel and a boom 提交旁边的图标这些有什么目的吗它们似乎是由 Github for Windows
如何迭代 Rails 应用程序中的所有模型？

我希望能够迭代并检查 Rails 应用程序中的所有模型在伪代码中它看起来像 rails env models each do model associations model reflect on all associations ha
语言识别和自动文本框方向切换

假设我有一个 HTML 文本框使用以下代码
Android TextView 中如何调整文本字距？

Android 有没有办法调整字符间距TextView 我相信这通常称为字距调整我知道android textScaleX属性但是会压缩字符以及间距我构建了一个扩展 TextView 并添加方法 setSpacing 的自定义类解
人类可读、递归、排序的最大文件列表

在 POSIX shell 中打印前 10 个最大文件列表的最佳实践是什么必须有比我当前的解决方案更优雅的东西 DIR N 10 LIMIT 512000 find DIR type f size LIMIT k exec du sort

人类可读、递归、排序的最大文件列表

人类可读、递归、排序的最大文件列表 的相关文章

随机推荐

热门标签

人类可读、递归、排序的最大文件列表的相关文章