bash 例程从文本文件返回给定行号的页码

2024-01-04

考虑一个包含分页 ASCII 控制字符“换页”($'\f') 的纯文本文件：

alpha\n
beta\n
gamma\n\f
one\n
two\n
three\n
four\n
five\n\f
earth\n
wind\n
fire\n
water\n\f

请注意，每个页面都有随机数量的行。

需要一个 bash 例程，从包含分页 ASCII 控制字符的文本文件中返回给定行号的页码。

经过长时间研究解决方案，我终于遇到了这段代码：

function get_page_from_line
{
    local nline="$1"
    local input_file="$2"

    local npag=0
    local ln=0
    local total=0

    while IFS= read -d $'\f' -r page; do

        npag=$(( ++npag ))

        ln=$(echo -n "$page" | wc -l)

        total=$(( total + ln ))

        if [ $total -ge $nline ]; then
            echo "${npag}"
            return
        fi

    done < "$input_file"

    echo "0"

    return
}

但不幸的是，这种解决方案在某些情况下被证明非常慢。

有更好的解决办法吗？

Thanks!

使用的想法read -d $'\f'然后计算行数就很好了。

这个版本可能显得不优雅：如果nline大于或等于文件中的行数，则文件被读取两次。

尝试一下，因为它超级快：

function get_page_from_line ()
{
    local nline="${1}"
    local input_file="${2}"    
    if [[ $(wc -l "${input_file}" | awk '{print $1}') -lt nline ]] ; then
        printf "0\n"
    else
        printf "%d\n" $(( $(head -n ${nline} "${input_file}" | grep -c "^"$'\f') + 1 ))
    fi
}

的表演awk比上面的 bash 版本更好。awk是为此类文本处理而创建的。

尝试一下这个经过测试的版本：

function get_page_from_line ()
{
  awk -v nline="${1}" '
    BEGIN {
      npag=1;
    }
    {
      if (index($0,"\f")>0) {
        npag++;
      }
      if (NR==nline) {
        print npag;
        linefound=1;
        exit;
      }
    }
    END {
      if (!linefound) {
        print 0;
      }
    }' "${2}"
}

When \f遇到时，页码增加。

NR是当前行号。

----

对于历史，还有另一个 bash 版本。

此版本仅使用内置命令来计算当前页面中的行数。

The speedtest.sh您在评论中提供的信息显示它有点超前（大约 20 秒），这使得它相当于您的版本：

function get_page_from_line ()
{
    local nline="$1"
    local input_file="$2"

    local npag=0
    local total=0

    while IFS= read -d $'\f' -r page; do
        npag=$(( npag + 1 ))
        IFS=$'\n'
        for line in ${page}
        do
            total=$(( total + 1 ))
            if [[ total -eq nline ]] ; then
                printf "%d\n" ${npag}
                unset IFS
                return
            fi
        done
        unset IFS
    done < "$input_file"
    printf "0\n"
    return
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

bash

shell

ascii

textprocessing

bash 例程从文本文件返回给定行号的页码的相关文章

如何执行“sudo nvm”？

在我的 Mac 上我想将一些需要 su 权限的包迁移到另一个节点版本我使用 homebrew 安装 nvm 现在我需要执行 sudo nvm 或 reinstall packages将失败 me MacBook sudo nvm sud
将相对符号链接转换为绝对符号链接

如何在 bash 中递归地将相对符号链接转换为绝对符号链接 ln sf readlink f link link
对目录中的所有文件执行命令

有人可以提供执行以下操作的代码假设有一个文件目录所有这些文件都需要通过程序运行该程序将结果输出到标准输出我需要一个脚本该脚本将进入一个目录对每个文件执行命令并将输出连接到一个大输出文件中例如要在 1 个文件上运行命令 cm
动态参数值取决于另一个动态参数值

启动前提非常严格的环境 Windows 7 SP1 Powershell 3 0 使用外部库的可能性有限或不可能我正在尝试重写之前创建的 bash 工具这次使用 PowerShell 在 bash 中我实现了自动完成功能以使该工具
如何在 Windows 下向 .sh 脚本传递参数？

我正在尝试在 Windows 下执行 sh 脚本我安装了 Git 它允许我执行 sh 文件但是如果不使用 sh 作为执行前缀我似乎无法传递任何参数我的 sh 文件 echo Test 1 如果我用以下命令执行它 gt sh tes
获取变量的名称作为输入并使用该名称更改变量

我从脚本用户那里获取变量的名称作为第一个参数并将该变量的值回显到控制台 bin bash variablename 1 echo The value of variablename is variablename 这太棒了我无法开始工作
从 shell 命令调用 SOAP 请求

我使用curl 向Web 服务发送SOAP 请求并使用shell 脚本获取响应请在下面找到我正在使用的命令 curl H Content Type text xml charset utf 8 H SOAPAction d sample
Python - Unicode 到 ASCII 的转换

我无法在不丢失数据的情况下将以下 Unicode 转换为 ASCII u ABRA xc3O JOS xc9 I tried encode and decode他们不会这么做有人有建议吗 Unicode 字符u xce0 and u xc
如何查看正在运行的 tcsh 版本？

如何查看我的 UNIX 终端中运行的 tcsh 的当前版本看着那这version多变的 echo version tcsh 6 14 00 Astron 2005 03 25 i386 intel linux options wide
如何以管理员身份在 rake 任务中运行 shell 命令？

我有一个简短的 cmd 文件我想将其作为部署过程的一部分运行不幸的是 cmd 文件需要管理员权限是否可以从 rake 中获得管理员权限或者我是否需要以管理员身份启动 shell 您可以尝试runas http ss64 com nt
从 UNIX 命令行向串行端口发送字节？

我想使用命令行将字节流发送到串行端口这可能吗我的串口位于 dev cu usbserial A700dYoR在我的 Mac 上例如如果我想将整数 50 或字符串 data 发送到该串行端口我该怎么做我对 UNIX 的了解非常有限
协助 awk/bash 捕获内存差异

我正在尝试从以下文件中提取以下输出 xr lab show clock Thu Sep 19 14 38 02 812 WIB 14 38 02 893 WIB Thu Sep 19 2019 xr lab xr lab xr lab sh
分叉/多线程进程|重击

我想让我的代码的一部分更加高效我正在考虑让它分叉成多个进程并让它们一次执行 50 100 次而不是只执行一次例如伪 for line in file do foo foo2 foo3 done 我希望这个 for 循环运行多次我
bash中的用户名、密码程序

我有一个程序要求用户输入用户名和密码然后将其存储在文本文件中第一列是用户名第二列是密码我需要一个命令在用户输入用户名和新密码时替换密码如下我拥有的 bin bash admin menu Register User echo
在脚本内使用不带密码的 sudo

由于某种原因我需要作为用户在没有 sudo 的情况下运行脚本 script sh 该脚本需要 root 权限才能工作我认为将 sudo 放入 script sh 中是唯一的解决方案让我们举个例子 script sh bin sh su
BASH：将数据从平面文件导入模板

我有一个平面记录文件每行有 33 行我需要将此文件格式化为模板中的规格模板为 DOS 格式源文件为 NIX 格式该模板具有必须遵守的特定缩进和间距我想到了几个选择 BASH 与经典的 nix 工具 sed awk grep 等
如何在 Bash 中给定超时后终止子进程？

我有一个 bash 脚本它启动一个子进程该进程时不时地崩溃实际上是挂起而且没有明显的原因闭源所以我对此无能为力因此我希望能够在给定的时间内启动此进程如果在给定的时间内没有成功返回则将其终止有没有simple and r
Bash 脚本：自动为 mpeg-dash 进行 ffmpeg 编码

我正在编写一个 bash 文件来创建视频编码和串联以供 dash 实时流媒体使用基本上它读取输入视频文件夹将所有视频编码为三种分辨率格式然后将它们连接起来创建三个适应集 DIAGRAM 该脚本检查 fps 一致性如果输入不是 1
Bash 正则表达式——似乎无法匹配任何 \s \S \d \D \w \W 等

我有一个脚本试图从 gparted 获取信息块我的数据如下所示 Disk dev sda 42 9GB Sector size logical physical 512B 512B Partition Table msdos Number
符合 POSIX 标准的 shell 相当于 Bash“while read -d $'\0' ...”？

我正在尝试使 Bash 脚本严格符合 POSIX 标准即消除任何潜在的 Bashisms http mywiki wooledge org Bashism 通过使用checkbashisms px script filename 在给定的

随机推荐

每 X 秒从 ArrayList 更新一次 JLabel - Java

我有一个简单的Java程序它读取一个文本文件用空格分割它显示第一个单词等待2秒显示下一个等等我想在Spring中执行此操作或其他一些 GUI 关于如何使用 spring 轻松更新单词有什么建议吗遍历我的列表并以某种方式使
C# 中 AVL 树的性能

我用C 实现了一个AVL树其插入矩阵如下 Number of Elements Time taken to insert sec 10 0 067 100 0 073 200 0 112 500 0 388 900 1 205 1000
如何通过 Concourse CI 管道发送电子邮件？

如何设置在 Concourse 中作业完成或失败时发送的电子邮件您可以使用https github com pivotal cf email resource https github com pivotal cf email resou
iPad 版 iOS 8.3 上 UIAlertView 关闭后键盘会弹出

随着最新的 iOS 8 3 版本的发布我们的应用程序开始出现奇怪的行为完成文本字段编辑后用户可以单击关闭按钮弹出一个UIAlertView 当用户点击时discard在警报视图中警报视图和当前视图被忽略但不知怎的键盘在视图消失
从静态方法调用 finish()

我正在使用 Facebook Android SDK 并希望在用户登录并获取用户对象后关闭我的 Activity 在实践中我存储了其中的一部分但无论如何我都想关闭该活动 make request to the me API Reques
Asp.Net Core 2.0 中的“HttpPostedFileBase”

我最近正在开发一个调用 API 的 ReactJS 应用程序使用 NET Core 2 0 开发我的问题是如何使用HttpPostedFileBase在 NET Core 2 0 API 中以获取文件内容并将其保存在数据库中你没有H
python实时写入文件

我有这段 python 代码它循环遍历文本文件 urls txt 中的 url 列表然后跟踪所有 url 的重定向如果 url 包含特定字符串则会将其写入名为 redirects txt 的文件中 import urllib req
生产中头变量丢失

我正在运行 Rails 3 1 后面有 PhusionPassenger 和 NGINX 我通过一个简单的 HttpClient OS X 的 GrahpicalHttpClient 发送请求我的代码需要标头中的令牌和 ID 来验证调用者
在Prepare()方法中找不到高级通配符映射参数

从文档中 Struts2 的高级通配符映射 http struts apache org release 2 3 x docs wildcard mappings html 高级通配符从2 1 9 开始可以在action中定义正则表达式
Visual Studio Ultimate 2013 安装失败

我有一台 CLEVO x7200 Intel i7 970 3 20GHz 12Gb RAM 2x512Gb HDD 2xATI Radeon HD6970M 2Gb Crossfire 我有一个非常恼人的问题我的笔记本电脑运行 Wind
项目文件受版本控制吗？

我从事一个大型项目其中除项目文件之外的所有源文件都存储在版本控制中这是首席开发人员的决定他的理由是协调开发人员工作目录之间的差异非常耗时它允许开发人员独立工作直到他们的更改稳定为止相反开发人员最初会获得其他开发人员的项目文件
os.path.dirname(os.path.abspath(__file__)) 和 os.path.dirname(__file__) 之间的区别

settings pyDjango 项目的文件包含这两行 BASE DIR os path dirname os path dirname os path abspath file PROJECT ROOT os path dirname
检查传递给泛型方法的类型

如何检查作为泛型方法的类型参数传递的类型是什么 foo
如何修复 NoSuchElementException（将 XPath 表达式与 Selenium 结合使用）

我正在尝试让 Selenium 导入元掩码但是当我使用 XPath 表达式时 html body div 1 div div 3 div div div button 我的控制台返回 selenium common exceptions
如何在简单计算器中将 Console.ReadLine() 转换为 double ？ C# 异常问题

I used double Parse and Convert ToDouble并得到同样的错误 System FormatException 输入字符串的格式不正确当我在控制台中写入时10 2或任何其他双数我从教程中学习并一步一步地遵
使用 bash tab-completion 忽略路径条目

我有两个命令 foo and foo bar where foo是一个符号链接foo bar 我希望能够打字f TAB 假设这是路径上仅有的两个以f 并填写其中一项即全名and后面的空格但最终发生的事情是它完成了foo 没有空格因为f
Rust Warp 中的依赖注入

如何将依赖项注入到 Warp 中的路由处理程序中一个简单的例子如下我有一个路由我想提供在启动时确定的静态值但过滤器是将值传递到最终处理程序的如何在不创建全局变量的情况下传递附加数据这对于依赖注入很有用 pub fn root r
有没有办法禁止在 c 风格变量参数列表中按值使用类？

意外使用 C 风格无类型变量参数列表中的类是一个常见的错误源例子 class MyString public char pChars int Length MyString char pChars this gt pChars pChar
如何解决 Scala 编译器崩溃问题？

我正在使用 Scala 2 9 1 编译一个项目并得到 java lang AssertionError assertion failed at scala Predef assert Predef scala 89 at scala to
bash 例程从文本文件返回给定行号的页码

考虑一个包含分页 ASCII 控制字符换页 f 的纯文本文件 alpha n beta n gamma n f one n two n three n four n five n f earth n wind n fire n water

bash 例程从文本文件返回给定行号的页码

----

bash 例程从文本文件返回给定行号的页码 的相关文章

随机推荐

热门标签

bash 例程从文本文件返回给定行号的页码的相关文章