Java 文件中的行数

2024-04-06

我使用巨大的数据文件，有时我只需要知道这些文件中的行数，通常我打开它们并逐行读取它们，直到到达文件末尾

我想知道是否有更聪明的方法来做到这一点

这是迄今为止我发现的最快的版本，比 readLines 快大约 6 倍。对于 150MB 的日志文件，这需要 0.35 秒，而使用 readLines() 则需要 2.40 秒。只是为了好玩，linux 的 wc -l 命令需要 0.15 秒。

public static int countLinesOld(String filename) throws IOException {
    InputStream is = new BufferedInputStream(new FileInputStream(filename));
    try {
        byte[] c = new byte[1024];
        int count = 0;
        int readChars = 0;
        boolean empty = true;
        while ((readChars = is.read(c)) != -1) {
            empty = false;
            for (int i = 0; i < readChars; ++i) {
                if (c[i] == '\n') {
                    ++count;
                }
            }
        }
        return (count == 0 && !empty) ? 1 : count;
    } finally {
        is.close();
    }
}

编辑，9 1/2 年后：我几乎没有 java 经验，但无论如何我已经尝试将此代码与LineNumberReader下面的解决方案，因为没有人这样做让我感到困扰。看来，特别是对于大文件，我的解决方案更快。尽管优化器似乎需要运行几次才能完成不错的工作。我对代码进行了一些操作，并生成了一个始终最快的新版本：

public static int countLinesNew(String filename) throws IOException {
    InputStream is = new BufferedInputStream(new FileInputStream(filename));
    try {
        byte[] c = new byte[1024];
        
        int readChars = is.read(c);
        if (readChars == -1) {
            // bail out if nothing to read
            return 0;
        }
        
        // make it easy for the optimizer to tune this loop
        int count = 0;
        while (readChars == 1024) {
            for (int i=0; i<1024;) {
                if (c[i++] == '\n') {
                    ++count;
                }
            }
            readChars = is.read(c);
        }
        
        // count remaining characters
        while (readChars != -1) {
            for (int i=0; i<readChars; ++i) {
                if (c[i] == '\n') {
                    ++count;
                }
            }
            readChars = is.read(c);
        }
        
        return count == 0 ? 1 : count;
    } finally {
        is.close();
    }
}

1.3GB 文本文件的基准测试结果，y 轴以秒为单位。我已经使用同一个文件执行了 100 次运行，并使用以下命令测量了每次运行System.nanoTime()。你可以看到countLinesOld有一些异常值，并且countLinesNew没有，虽然它只是快一点，但差异在统计上是显着的。LineNumberReader显然更慢。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java 文件中的行数的相关文章

清理码头 - 删除“不必要”的东西

我习惯用Jetty http jetty codehaus org jetty 作为我的网络容器我对我做了什么安装步骤得到原始的焦油球并且清理一些目录和文件从中我在这里想提出的是您通常从 Jetty 中删除什么以在生产登台环境中使用
Java Try Catch Final 没有 Catch 的情况下会阻塞

我正在审查一些新代码该程序只有一个 try 和一个 finally 块既然排除了 catch 块那么如果 try 块遇到异常或任何可抛出的内容它如何工作它直接进入finally块吗如果 try 块中的任何代码可以引发已检查异常
使用 GWT CellTableBuilder 构建树表

Is it possible to build a tree table like this http www sencha com examples ExamplePlace basictreegrid with the new Cell
Android 2.2 SDK - Droid X 相机活动无法正常完成

我注意到我在 Droid X 上调用的默认相机活动与我的 Droid 和 Nexus One 上的默认相机活动看起来不同在 Droid 和 Nexus One 上选择确定后活动将完成 Droid X 有一个完成按钮它将带您返回
使用cameltestsupport进行Camel单元测试，模板始终为空

我正在用 Camel 做一个简单的单元测试我想做的就是从文件在资源下读取 JSON 内容将其发送到 Java 类进行验证这是我试图测试的路线无论我做什么模板我用来发送正文 json 始终为空这是我的代码 public cl
Spring安全“记住我”cookie在第一个请求中不可用

我无法在登录请求后检索 Spring 记住我 cookie 但它在对受保护页面的下一个请求中工作正常谁能告诉我怎样才能立即得到它我在登录请求中设置了记住我的 cookie 但在 Spring 重定向回原始受保护的 url 后无法检索它
如何在 JSP 中导入类？

我是一个完全的JSP初学者我正在尝试使用java util List在 JSP 页面中我需要做什么才能使用除以下类之外的类java lang 使用以下导入语句进行导入java util List 顺便说一句要导入多个类请使用以下格式
如何将 android.net.Uri 转换为 java.net.URL？ [复制]

这个问题在这里已经有答案了有没有办法从Uri to URL 我正在使用的库需要这个它only接受一个URL但我需要在我的设备上使用图像如果该方案的Uri is http or https new URL uri toString 应该
Java 服务器-客户端 readLine() 方法

我有一个客户端类和一个服务器类如果客户端向服务器发送消息服务器会将响应发送回客户端然后客户端将打印它收到的所有消息例如如果客户端向服务器发送 A 则服务器将向客户端发送响应 1111 所以我在客户端类中使用 readLine 从服
Java - 返回值是否会中断循环？

我正在编写一些基本上遵循以下格式的代码 public static boolean isIncluded E element Node
Espresso 和 Proguard 的 Java.lang.NoClassDefFoundError

我对 Espresso 不太有经验但我终于成功地运行了它我有一个应用程序需要通过 Proguard 缩小才能处于 56K 方法之下该应用程序以 3 秒的动画开始因此我需要等到该动画结束才能继续这就是我尝试用该方法做的事情waitF
解析输入，除了 System.in.read() 之外不使用任何东西

我很难找到具体的细节System in read 有效也许有人可以帮助我似乎扫描仪会更好但我不允许使用它我被分配了一个任务我应该以 Boolean Operator Boolean 的形式读取控制台用户输入例如T F 或 T T
为什么java中的for-each循环中需要声明变量

for 每个循环的通常形式是这样的 for Foo bar bars bar doThings 但如果我想保留 bar 直到循环结束我可以not使用 foreach 循环 Foo bar null Syntax error on toke
如何在 Quartz 调度程序中每 25 秒运行一次？

我正在使用 Java 的 Quartz Scheduling API 你能帮我使用 cron 表达式每 25 秒运行一次吗这只是一个延迟它不必总是从第 0 秒开始例如序列如下 0 00 0 25 0 50 1 15 1 40 2 0
挂钩 Eclipse 构建过程吗？

我希望在 Eclipse 中按下构建按钮时能够运行一个简单的 Java 程序目前当我单击构建时它会运行一些 JRebel 日志记录代码我有一个程序可以解析 JRebel 日志文件并将统计信息存储在数据库中是否可以编写一个插件或
Java的-XX:+UseMembar参数是什么

我在各种地方论坛等看到这个参数并且常见的答案是它有助于高并发服务器尽管如此我还是找不到 sun 的官方文档来解释它的作用另外它是Java 6中添加的还是Java 5中存在的顺便说一句许多热点虚拟机参数的好地方是这一页 ht
Java：多线程内的 XA 事务传播

我如何使用事务管理器例如Bitronix http docs codehaus org display BTM Home JBoss TS http www jboss org jbosstm or Atomikos http www a
Android - 9 补丁

我正在尝试使用 9 块图片创建一个新的微调器背景我尝试了很多方法来获得完美的图像但都失败了 s Here is my 9 patch 当我用Draw 9 patch模拟时内容看起来不错但是带有箭头的部分没有显示或者当它显示时这部
Hibernate 和可序列化实体

有谁知道是否有一个框架能够从实体类中剥离 Hibernate 集合以使它们可序列化我查看了 BeanLib 但它似乎只进行实体的深层复制而不允许我为实体类中的集合类型指定实现映射 BeanLib 目前不适用于 Hibernate 3 5
Android 和 Java 中绘制椭圆的区别

在Java中由于某种原因Ellipse2D Double使用参数 height width x y 当我创建一个RectF在Android中参数是 left top right bottom 所以我对适应差异有点困惑如果在 Java 中创

随机推荐

如何获取ProgramFiles路径？

我有奇怪的问题我使用的是 Windows 7 Enterprise SP1 64 位我需要为我的项目获取程序文件和程序文件 X86 目录路径这就是我所做的 Environment GetFolderPath Environment S
C++ 将数字转换为单词

我在一本书中发现了这个将数字转换为单词的程序初始程序转换数字 1 1000 但随后要求您修改程序以接受最多 1 000 000 的数字我可以处理 20 999 以内的数字但无法处理超过 20 999 的数字我一整天都在修改它并在网
当 API 7 上有溢出操作时，菜单按钮会使应用程序崩溃

我正在尝试为 API 7 及更高版本实现操作栏我正在使用 Android Studio 创建一个新的简单项目配置如下最低 SDK API 7 目标SDK API 14 编译谷歌 API 14 主题带深色操作栏的全息灯设置创建活动
为什么我们需要在 Swing 应用程序中扩展 JFrame？

为什么我们需要延长JFrame构建 Swing 应用程序时的类据我所知extends用于继承基类没有任何功能JFrame类在以下程序中使用但仍然被扩展我知道我错过了一些信息 JFrame 类的某些功能是否在后台运行 1 Code i
函数编程和模拟对象

我最近正在观看 Clojure 上的网络广播在其中演讲者在讨论 Clojure 的 FP 性质时发表了评论内容类似于我希望我没有误会他模拟对象在嘲笑你不久前当我观看微软反应式框架开始出现的网络广播时我也听到了类似的评论它类
Eclipse ADT“...无法解析”Android NDK 和 C 文件

我的 NDK 项目的 Eclipse 索引器出现问题那里有很多类似的线程但似乎没有一个涉及相同的问题根源我有一个 OpenGL ES 应用程序我需要将其移植到纯粹用 C 编写的 Android 我想将其作为 NativeActivi
如何将图像转换为十六进制字节数组以将其发送到iOS sdk中的输出流

我想在蓝牙打印机上打印图像我从打印机制造商那里得到了一些示例代码这是代码 unsigned char buffer3 796 0x55 0x66 0x77 0x88 0x44 0x1B 0x58 0x31 0x19 0x20 0x00
使用捆绑包将数据在片段之间传递到另一个片段示例

我的应用程序中有 3 个 sherlockListFragments 每个片段都有一些 editText 最后一个片段有一个按钮按下该按钮时应访问和存储第一个和第二个片段中的所有数据我使用捆绑包在片段之间发送数据通过下面这个简单的例
@angular/material/index.d.ts' 不是一个模块

使用 Angular 8 在构建应用程序时我们遇到以下错误 app modules admin module pages editor editor component ts 6 27 error TS2306 File node mod
浏览器控制台并计算多个javascript执行时间差异

我可以轻松地做到这一点 console time mytimer doSomeWork console timeEnd mytimer 但是是否可以在多个函数中计算时间我需要在全局变量中定义脚本的开始时间然后在多个函数中我将写下自时间
将 DVB-T 流捕获到电影文件

我有一张带有电视信号实时视图的表格来自 DVB T 棒我有来自的示例项目 DTViewer http directshownet sourceforge net about html http directshownet sourcef
为什么当父元素绑定成功时，将子元素绑定到另一个元素时绑定会失败？

假设我有两个类可以引用第三个 UI 对象在本例中是一个按钮此外父类可以包含子类的元素如果它们都以相同的方式绑定到相同的控件孩子会失败但父母会成功这是 WPF 中的错误吗家长 class MyFrameworkElement
TiltEffect 和 LongListSelector

我正在尝试使用TiltEffect从 Silverlight 工具包中LongListSelector 这是在 XAML 中声明元素的方式
是否可以在 C# 中使用未绑定类型作为泛型类型参数？

我有一个 C 泛型 public class Generic
如何使用 dplyr 从 R 数据框中的多列中减去一列

我正在使用gapminder 数据从其他国家地区减去1 个国家地区的人均GDP 值我已经参考了同一主题的链接但仍然遇到问题从 R 中的许多列中减去数据框中的一列 https stackoverflow com questions
使用CSS访问属性作为文件的href

我有 2 个锚标记的 HTML 一个用于文件一个用于 google a href http example com files foobar csv http example com files foobar csv a a href h
如何在html中点击文本框显示日历

在 html 中我想显示calendar选择日期单击文本框然后我们从该日历中选择一个日期然后selected日期将显示在that文本框从 HTML5 开始
如何获取 Lollipop 中自定义通知的默认通知背景颜色？

我在 Lollipop 中自定义通知背景的颜色有问题应该是白色的地方却变成了黑色文本颜色没问题我在用着
如何在单元格编辑后保持 JTable 单元格渲染

你们太棒了在我的最后一个问题上为我指明了正确的方向我在这里对我原来的问题进行了扩展如何将 JTable 列设置为 String 并按 Double 排序 https stackoverflow com questions 100546
Java 文件中的行数

我使用巨大的数据文件有时我只需要知道这些文件中的行数通常我打开它们并逐行读取它们直到到达文件末尾我想知道是否有更聪明的方法来做到这一点这是迄今为止我发现的最快的版本比 readLines 快大约 6 倍对于 150MB 的日志

Java 文件中的行数

Java 文件中的行数 的相关文章

随机推荐

热门标签

Java 文件中的行数的相关文章