在 Java 中将文件的前 N 个字节作为输入流读取？

2024-01-02

在我的一生中，我一直无法找到与我想做的事情相匹配的问题，所以我将在这里解释我的用例。如果您知道某个主题已经涵盖了该问题的答案，请随时引导我找到该主题。 :)

我有一段代码可以定期（每 20 秒）将文件上传到 Amazon S3。该文件是由另一个进程写入的日志文件，因此此函数实际上是一种跟踪日志的方法，以便某人可以半实时读取其内容，而无需直接访问日志所在的计算机。

直到最近，我只是使用 S3 PutObject 方法（使用文件作为输入）来执行此上传。但在 AWS SDK 1.9 中，这不再有效，因为如果实际上传的内容大小大于上传开始时承诺的内容长度，S3 客户端会拒绝请求。此方法在开始流式传输数据之前读取文件的大小，因此考虑到此应用程序的性质，文件的大小很可能在该点和流结束之间增加。这意味着我现在需要确保只发送 N 字节的数据，无论文件有多大。

我不需要以任何方式解释文件中的字节，所以我不关心编码。我可以逐字节传输它。基本上，我想要的是一种简单的方法，我可以读取文件直至第 N 个字节，然后让它终止读取，即使文件中还有更多数据超过该点。（换句话说，将 EOF 插入流中的特定点。）

例如，如果我的文件在开始上传时为 10000 字节长，但在上传过程中增长到 12000 字节，则无论大小如何变化，我都希望在 10000 字节时停止上传。（在后续上传时，我会上传 12000 字节或更多。）

我还没有找到一种预先制作的方法来做到这一点 - 到目前为止我发现的最好的方法似乎是 IOUtils.copyLarge(InputStream, OutputStream, offset, length)，它可以被告知复制最大“长度”字节到提供的 OutputStream。然而，copyLarge 是一种阻塞方法，PutObject 也是如此（它可能在其 InputStream 上调用一种形式的 read()），所以看来我根本无法让它工作。

我还没有找到任何方法或预构建的流可以做到这一点，所以这让我觉得我需要编写自己的实现来直接监视已读取的字节数。这可能会像 BufferedInputStream 一样工作，其中每批读取的字节数是缓冲区大小或要读取的剩余字节中的较小者。（例如，如果缓冲区大小为 3000 字节，我会执行三个批次，每个批次为 3000 字节，然后是一个批次为 1000 字节 + EOF。）

有谁知道更好的方法来做到这一点？谢谢。

EDIT只是为了澄清一下，我已经知道了几种替代方案，但它们都不理想：

(1)我可以在上传文件时锁定文件。这样做会导致写入文件的过程中数据丢失或操作问题。

(2) 我可以在上传文件之前创建文件的本地副本。这可能效率非常低，并且占用大量不必要的磁盘空间（该文件可能会增长到几 GB 范围，并且运行它的计算机可能磁盘空间不足）。

EDIT 2:根据同事的建议，我的最终解决方案如下所示：

private void uploadLogFile(final File logFile) {
    if (logFile.exists()) {
        long byteLength = logFile.length();
        try (
            FileInputStream fileStream = new FileInputStream(logFile);
            InputStream limitStream = ByteStreams.limit(fileStream, byteLength);
        ) {
            ObjectMetadata md = new ObjectMetadata();
            md.setContentLength(byteLength);
            // Set other metadata as appropriate.
            PutObjectRequest req = new PutObjectRequest(bucket, key, limitStream, md);
            s3Client.putObject(req);
        } // plus exception handling
    }
}

LimitInputStream 是我的同事建议的，显然不知道它已被弃用。 ByteStreams.limit 是当前 Guava 的替代品，它可以满足我的需求。感谢大家。

完整答案删除和替换：

包裹起来相对简单InputStream例如在发出数据结束信号之前限制其将传递的字节数。FilterInputStream是针对这种一般类型的工作，但是由于您必须为此覆盖几乎所有方法特别的工作，它只是妨碍。

这是一个粗略的解决方案：

import java.io.IOException;
import java.io.InputStream;

/**
 * An {@code InputStream} wrapper that provides up to a maximum number of
 * bytes from the underlying stream.  Does not support mark/reset, even
 * when the wrapped stream does, and does not perform any buffering.
 */
public class BoundedInputStream extends InputStream {

    /** This stream's underlying @{code InputStream} */
    private final InputStream data;

    /** The maximum number of bytes still available from this stream */ 
    private long bytesRemaining;

    /**
     * Initializes a new {@code BoundedInputStream} with the specified
     * underlying stream and byte limit
     * @param data the @{code InputStream} serving as the source of this
     *        one's data
     * @param maxBytes the maximum number of bytes this stream will deliver
     *        before signaling end-of-data
     */
    public BoundedInputStream(InputStream data, long maxBytes) {
        this.data = data;
        bytesRemaining = Math.max(maxBytes, 0);
    }

    @Override
    public int available() throws IOException {
        return (int) Math.min(data.available(), bytesRemaining);
    }

    @Override
    public void close() throws IOException {
        data.close();
    }

    @Override
    public synchronized void mark(int limit) {
        // does nothing
    }

    @Override
    public boolean markSupported() {
        return false;
    }

    @Override
    public int read(byte[] buf, int off, int len) throws IOException {
        if (bytesRemaining > 0) {
            int nRead = data.read(
                    buf, off, (int) Math.min(len, bytesRemaining));

            bytesRemaining -= nRead;

            return nRead;
        } else {
            return -1;
        }
    }

    @Override
    public int read(byte[] buf) throws IOException {
        return this.read(buf, 0, buf.length);
    }

    @Override
    public synchronized void reset() throws IOException {
        throw new IOException("reset() not supported");
    }

    @Override
    public long skip(long n) throws IOException {
        long skipped = data.skip(Math.min(n, bytesRemaining));

        bytesRemaining -= skipped;

        return skipped;
    }

    @Override
    public int read() throws IOException {
        if (bytesRemaining > 0) {
            int c = data.read();

            if (c >= 0) {
                bytesRemaining -= 1;
            }

            return c;
        } else {
            return -1;
        }
    }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 Java 中将文件的前 N 个字节作为输入流读取？的相关文章

Mongo 可审核的 ZonedDateTime 字段在 Spring Boot 2 中不起作用

在 Spring Boot 项目中我使用 CreatedDate 之类的注释来保存有关创建更新相应文档的日期的信息整个项目都使用 ZonedDateTime 因此带注释的字段也是 ZonedDateTime 为了实现 Mongo 的日
Java中RandomAccessFile的并发

我正在创建一个RandomAccessFile对象通过多个线程写入文件在 SSD 上每个线程都尝试在文件中的特定位置写入直接字节缓冲区并且我确保线程写入的位置不会与另一个线程重叠 file getChannel write buffe
jvm中本机代码如何转换为机器代码[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我读过一些文章说 jvm将字节码转换为机器码 jvm将字节码转换为本机代码 jvm 将字节码转换为系统调用系统调用又由操作系统与硬件
Java中的文字赋值[重复]

这个问题在这里已经有答案了定义上有什么区别 double example 23 1d or double example 23 1 为什么long float double可以以l f d结尾之间没有区别double example 2
Spring boot 2.0.5.RELEASE和mongo 4.0连接问题

我正在关注使用 MongoDB 访问数据教程春季网站 https spring io guides gs accessing data mongodb 我将 Mongo DB 服务器版本 4 安装为服务当我使用客户端连接到它时它的身份验证
jpa2 CriteriaBuilder order by “ORDER BY 表达式必须出现在选择列表中”

我正在写一个查询标准生成器但无法添加order by子句因为它随消息一起抛出错误ORDER BY 表达式必须出现在选择列表中这是我的实体 public class A Integer aId ManyToOne JoinColumn n
Java“空白最终字段可能尚未初始化”方法中抛出异常

我有一些代码例如 final int var1 if isSomethingTrue var1 123 else throwErrorMethod int var2 var1 throwErrorMethod 的定义如下 private
ResultSet：通过索引检索列值与通过标签检索

使用 JDBC 时我经常遇到这样的结构 ResultSet rs ps executeQuery while rs next int id rs getInt 1 Some other actions 我问自己以及代码作者为什么不使用
按文件名过滤 eclipse 中的警告

我们使用 Eclipse 进行 Java 开发并使用 Maven 将 JSP 编译成 servlet 以便在嵌入式 Jetty 实例中使用这意味着要从 Eclipse 运行该项目我必须包含 target jsp source 作为源文
如何在Java中打印保留2位小数的浮点数？

我可以用System out print 您可以使用printf http java sun com j2se 1 5 0 docs api java io PrintStream html printf 28java lang Strin
如何在 JdbcTemplate 中创建 mySQL 存储过程

背景为了解决 MySql 中某些语句只允许在存储过程中出现的问题我尝试在 JdbcTemplate 提交的 sql 中创建运行然后删除存储过程一个简单的例子是这恰好是在 Spring Boot 中 Service public c
使用 Box2d（适用于 Android）进行碰撞检测？

有人可以解释一下使用 box2d for android 进行碰撞检测的工作原理吗我无法理解 BBContactListener 以什么方式工作 BBContactListener listener new BBContactListen
Java字符串查找和替换的最佳方法？

我正在寻找 Java 中字符串查找和替换的最佳方法这是一句话我的名字叫米兰人们都知道我叫米兰瓦西奇我想用 Milan Vasic 替换 Milan 弦但在我已经有 Milan Vasic 的地方情况不应该是这样搜索替换后的结
javax.xml.bind.JAXBException: 类 *** 及其任何超类在此上下文中均未知

我正在尝试通过 REST Web 服务传递对象以下是我的课程使用一些示例代码解释了我需要的功能 Rest Web 服务类方法 POST Path find Consumes MediaType APPLICATION FORM URLE
Java 中更高级的泛型

假设我有以下课程 public class FixExpr Expr
Java 验证日期为 yyyyMMddHHmmss

我想在java中验证给定的日期格式为yyyyMMddHHmmss 状况应符合格式 yyyyMMddHHmmss 它应该验证当前日期它应该验证与当前小时有 3 小时或 3 小时差异的小时数如果满足所有三个条件 Java 方法应返回 tr
ASTParser：解析绑定后查找声明节点

我创建了一个启用了绑定的 AST 当我稍后解析绑定时我得到了一个有效的 ITypeBinding 但是当我想要获取绑定的声明 Node 时它总是返回 null 除非 ITypeBinding 在 sourceFile 中声明这是我
Spring Transactional 减慢了整个过程

我正在尝试分析我有两堂课的情况其中一个类是 ProcessImpl 它是起点并在内部调用其他子事务我不知道出了什么问题 processImpl正在导入一些东西并将相关数据写入数据库 Specs Spring orm版本 3 2 18 发
构造函数参数和属性一起出现在 bean 定义中
AndroidAnnotations 和 Dagger

我正在尝试使用 Dagger 注入 Android 带注释的 Activity java lang IllegalArgumentException No inject registered for members com app serv

随机推荐

制作键盘记录器

我想在我自己的电脑上制作一个小型键盘记录器以了解击键如何与 C 配合使用我在网上找到了一些代码只是对其进行了一些编辑尽管我不确定如何做我想做的事情 include stdafx h include
如何在iOS自动布局中为按钮添加等间距和等宽度

我对 Xcode 中的自动布局约束不熟悉我有一个像这样的底视图UITabBar with 6 UIButtons 在没有限制的情况下我将这些按钮与每个按钮的 5 个空格填充对齐并且每个按钮的宽度为 50 现在我试图通过使用自动布局来
根据“.”将GL_CODE列拆分为不同的列，而不使用SQL中的函数[重复]

这个问题在这里已经有答案了我需要一个查询来根据将 GL CODE 分成不同的列作为分隔符我已附上我已完成的设置的屏幕截图但在提取第七段后出现错误请注意每个元素中的每行的字符串长度并不相同我使用过的代码 select YEAR
是否有任何工具可以将 SVG 数据转换为 Canvas 友好的输入？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
如何在 android 中限制仅沿 y 轴拖放？

我试图将拖放运动限制为仅在 Y 轴上以便用户只能查看视图并将其向上或向下拖动而不能向左或向右拖动我现在有两个视图 textView 和 dropZone 的 id 其中一个 textView 设置了触摸侦听器另一个 dropZone
自上而下的递归方案

我们能否定义一个递归方案在不失去任何通用性的情况下自上而下构造值而不是自下而上这将非常有帮助因为我已经看到很多次首先应用使用递归方案内部定义的函数reverse其输入清楚地表明需要foldl 就像从前到后执行尽管人们普遍认
经典 ASP - 获取完整的 url 名称

我想知道是否有人可以帮助我我有以下 URL 这是动态的 www website com images gal boxes pic004 asp 我如何使用经典 ASP 提取 boxes pic004 部分 Thanks
返回应用程序时取消选择表视图行

我有一个表格视图其中一个表格视图单元格打开另一个应用程序当我返回我的应用程序时表格视图单元格仍然突出显示返回应用程序时取消选择表格视图单元格的最佳方法是什么编辑问题是 viewWillAppear or viewDidAppea
如何为 UITextField 实现类似 NSLineBreakByTruncatingHead 的功能？

我需要实现类似的目标NSLineBreakByTruncatingHead for UITextField如此处所示我们假设原文是这是无法在 UITextField 内显示的长文本我需要它像无法显示在 UITextField 内但
在 Objective C (Cocoa) 线程中运行 C 代码（适用于 iOS）

首先我是一名非常新的 Objective C Cocoa iOS 开发人员但我以前编写过 C C 应用程序因此我设法在我的 iPhone 应用程序中运行 Rabbitmq c http hg rabbitmq com rabbitm
Java中数组的使用方法

我是 Java 新手我正在阅读如何在 java 中使用数组它说在java中使用数组你必须遵循三个步骤即声明数组创建数组和初始化数组我明白了但是当我没有遵循上面的所有步骤时下面的代码如何工作 int array 1234 234
正确保存并更新单选按钮响应 java

我正在尝试将单选按钮用户响应保存在 Firestore 中的 UID 下我有两个选择yes and no到这个问题它仅在用户按下按钮选择一个选项时起作用一次但如果用户想要更改答案它不会更新替换旧响应我想知道是否有人可以提供帮助
Python 长文件名支持在 Windows 中被破坏

我编写Python脚本来复制文件不幸的是由于文件名太长 gt 256 它一直失败有办法解决这个问题吗我使用的是 Python 2 5 4 和 Windows XP Cheers Use 以字符串开头的路径 http msdn mic
IPv4 和 IPv6 禁止

如果我想在我的网站上通过 IP 禁止用户是否可以通过两者来实现IPv4 and IPv6 某些浏览器显然默认使用 IPv4 地址而其他浏览器如果有可能则使用 IPv6 地址因此如果我通过某人当前的 IP 对其进行禁止他们只需使
解决MultisampleFramebufferAPPLE生成INVALID_OPERATION

我不明白为什么glResolveMultisampleFramebufferAPPLE生成错误 1282 0x0502 GL INVALID OPERATION 设置代码 glGenFramebuffers 1 framebuffer gl
为现有基于 MVC 的网站创建 REST API

我有一个使用 ASP NET MVC3 开发的网站我现在想公开一个 REST API 供其他人使用它将公开与网站相同的功能在网站中一旦用户登录并根据数据库验证凭据会话就会管理用户的登录状态我如何使用 REST API 执行相同的
在 PHP 中使用 getter 和 setter 代替函数或简单的公共字段有什么优点？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我不是 PHP 开发人员所以我想知道 PHP 中以纯 OOP 风格使用私有字段我喜欢的方式使用显式 getter setter 的优点和缺
保证金不起作用？两个元素之间需要空间

首先我很抱歉我没有把链接放在这里这是一个工作网站我不被允许如果有必要我会发布我的代码的相关部分所以问题是非常基本的我有一个带有一些图像的 div 和一个标题 h3 下面是我的内容开始的地方无论我如何努力在两者之间创造一些空间
在 if 语句/管理进程中使用 fork

我有这段代码 printf L1 if fork 0 printf L2 if fork 0 printf L3 fork printf End n 作为练习我试图找出运行此代码而不实际运行它所产生的有效无效输出的一些示例我仍然对
在 Java 中将文件的前 N 个字节作为输入流读取？

在我的一生中我一直无法找到与我想做的事情相匹配的问题所以我将在这里解释我的用例如果您知道某个主题已经涵盖了该问题的答案请随时引导我找到该主题我有一段代码可以定期每 20 秒将文件上传到 Amazon S3 该文件是由另一个进程

在 Java 中将文件的前 N ​​个字节作为输入流读取？

在 Java 中将文件的前 N ​​个字节作为输入流读取？ 的相关文章

随机推荐

热门标签

在 Java 中将文件的前 N 个字节作为输入流读取？

在 Java 中将文件的前 N 个字节作为输入流读取？的相关文章