读取 Amazon Kinesis Firehose 流写入 s3 的数据

2024-01-12

我正在将记录写入 Kinesis Firehose 流，该流最终由 Amazon Kinesis Firehose 写入 S3 文件。

我的记录对象看起来像

ItemPurchase {
    String personId,
    String itemId
}

写入 S3 的数据如下所示：

{"personId":"p-111","itemId":"i-111"}{"personId":"p-222","itemId":"i-222"}{"personId":"p-333","itemId":"i-333"}

没有逗号分隔。

Json 数组中没有起始括号

Json 数组中没有结束括号

我想读取此数据并获取 ItemPurchase 对象的列表。

List<ItemPurchase> purchases = getPurchasesFromS3(IOUtils.toString(s3ObjectContent))

读取这些数据的正确方法是什么？

令我难以置信的是，Amazon Firehose 以这种方式将 JSON 消息转储到 S3，并且不允许您设置分隔符或任何内容。

最终，我发现解决该问题的技巧是使用 JSON raw_decode 方法处理文本文件

这将允许您读取一堆串联的 JSON 记录，它们之间没有任何分隔符。

Python代码：

import json

decoder = json.JSONDecoder()

with open('giant_kinesis_s3_text_file_with_concatenated_json_blobs.txt', 'r') as content_file:

    content = content_file.read()

    content_length = len(content)
    decode_index = 0

    while decode_index < content_length:
        try:
            obj, decode_index = decoder.raw_decode(content, decode_index)
            print("File index:", decode_index)
            print(obj)
        except JSONDecodeError as e:
            print("JSONDecodeError:", e)
            # Scan forward and keep trying to decode
            decode_index += 1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

json

amazons3

amazonkinesis

amazonkinesisfirehose

读取 Amazon Kinesis Firehose 流写入 s3 的数据的相关文章

有人知道如何将 GMap Static JSON 转换为 HTML url？

我已经从以下位置下载了示例样式的地图snazzymaps com http snazzymaps com 我尝试转换为类似的网址但我做得不好我正在尝试改变下一个例子 Google 地图样式静态示例 http snazzymaps com
将 zip 从 Blazor WASM 应用程序上传到 AWS-S3 - 遵循教程，没有观察到错误，但存储桶中也没有文件

我有一个 Blazor WASM 应用程序即客户端用户可以向其中上传一些数据对数据进行一些完整性和安全性检查后我想将这些数据上传到 AWS S3 中的 zip 文件中目前我已经构建了 zip 文件如下所示 using var o
将 BufferedImage 对象作为文件保存到 Amazon S3

我目前使用以下方法将文件上传到 S3 File file new File my file path AmazonS3 s3 new AmazonS3Client new PropertiesCredentials cred s3 putO
PostgreSQL：比较 json [重复]

这个问题在这里已经有答案了众所周知目前 PostgreSQL 还没有方法来比较两个 json 值比较就像json json不起作用但是选角呢json to text before Then select x a y b json t
在android中从JSON生成listview

我对 Android 完全陌生目前正在尝试从从我的服务器中提取的 JSON 数组生成列表视图我已经阅读了很多教程但没有运气有一种独特的方法可以做到这一点请您指出一些适合开始的资源我读过了this http www josecgo
如何使用 Retrofit 解析嵌套 json....？

我不知道该怎么办使用 Retrofit 解析 json 熟悉使用 Retrofit 解析简单的 json 但不熟悉解析嵌套Json using Retrofit 这是我的 Json 数据 current observation image
json 解析器和编码器应如何处理转义的 unicode？

json 规范允许在 json 字符串格式为 uXXXX 中转义 unicode 它特别提到受限代码点非字符作为有效的转义代码点这是否意味着解析器应该从包含非字符和受限代码点的字符串生成非法的 unicode 一个例子 key uF
DbGeography 多边形到 JSON

我将 DbGeography 多边形存储在数据库中我的控制器从数据库获取多边形我需要将它们转换为 JSON var polygons db Areas Where x gt x Type type Select x gt new Vie
使用 Express.js 和 NodeJS，您可以通过响应正文中的重定向发送 JSON

我正在尝试通过 302 重定向发送 JSON 在 ExpressJS 中这可能吗 API 声明可以添加主体res json 例如 res json 302 name larry 在接收端重定向的目的地主体是空的这是一些示例代码发送应
IE9 JSON 数据“您要打开还是保存此文件”

开始使用 IE9 测试我的 jQuery 应用程序看来我在这里可能遇到麻烦了我注意到当我将 JSON 数据返回到 Javascript 方法时我总是收到此提示您想打开或保存此文件吗并为我提供了 3 个按钮打开保存和取消当然
AWS S3 上传的图像已损坏

我正在 AWS ec2 ubuntu 机器上工作我的代码在 cakephp 中当我尝试将任何图像上传到 AWS S3 时它都会损坏虽然它在核心 php 代码中运行良好这是我的控制器代码 if this gt User gt sav
如何将异常序列化为Json

C 异常是 ISerialisable 因此它们不能也是 DataContract 因此我无法使用 JsonDataContractSerializer 将异常序列化为 JSON 的替代方案是什么由于这个问题还没有真正得到解答只需创建一
Azure 应用服务在配置中添加字符串数组

Net core 应用程序并在 Azure 应用服务中部署该应用程序在我的应用程序中我有一个包含以下内容的应用程序 settings json 文件 Roles Roles Admins Users 我的 ARM 模板中有以下配置参数
JSON-LD 缺少“}”或对象成员名称。错误

我喜欢将 json ld 添加到我的网站然后我想将它添加到我的开发网站来测试它我收到错误消息指出缺少或对象成员名称这是什么错误我已正确关闭括号如何修复它
kafka 连接 s3 源无法与 Minio 一起使用

我已经验证了与 minio 的连接确保凭据工作正常并且可以访问 minio 另外如果我尝试任何其他值store url http minio 9000我无法保存配置所以我猜想在可见性方面不存在问题卡夫卡连接容器和minio容器我不确
Postgres JSONB：数组数组的 where 子句

postgres 中有 v 9 5 如果有的话 create table json test id varchar NOT NULL data jsonb NOT NULL PRIMARY KEY id 其中 data 是 json 并且包
根据 .NET Core 2.1 中的更改重新加载 Serilog JSON 配置

我目前正在开发 ASP NET Core 2 1 应用程序并使用 Serilog 进行日志记录我想在运行时为我的 Serilog 实现重新加载应用程序设置文件我的目标是在运行时更改日志级别例如我写入minimumLevelDebug
使用 NewtonSoft 在一行中生成 JSON 对象

我正在使用 JSON 库牛顿软件 http nuget org packages newtonsoft json生成 JSON 字符串 JObject out JObject FromObject new typ photos return
包含 contains 的 json 格式查询

我在 ansible 中有以下 json 输出 active transaction null cores 4 hostname alpha auth wb01 active transaction null cores 4 hostnam
使用 System.Text.Json 即时格式化 JSON 流

我有一个未缩进的 Json 字符串例如 hash 123 id 456 我想缩进字符串并将其序列化为 JSON 文件天真地我可以使用缩进字符串Newtonsoft如下 using Newtonsoft Json Linq JToken

随机推荐

SQLite3 导入 CSV 并排除/跳过标头

我正在尝试将我的数据文件其中有十几个左右放入 SQLite 中的表中每个文件都有一个标题我将在未来的一年中多次收到它们所以我想当我收到文件时避免编辑每个文件以删除标头避免依靠 shell 脚本或 Python 来执行此操作
Outlook Javascript API - window.open 无法在 Outlook 2016 桌面/Windows 上运行

我有一个用新的 JavaScript API 编写的 Office 加载项其中有一个 JS 函数经过一些逻辑后该函数在新窗口中打开一个 Web 应用程序window open url blank 当从 Outlook Web 中的加载
我可以设置 Javascript 对象的类型吗？

我正在尝试遵循 Doug Crawford 的超级构造函数模式使用 Javascript 的一些更高级的 OO 功能但是我不知道如何使用 Javascript 的本机类型系统设置和获取对象的类型我现在的情况是这样的 functi
CSS：如何摆脱默认窗口“填充”？设置为 100% 宽度的元素不会到达窗口边框

所以我有一个直接放置在 body 内部的元素 div Some stuff div Other stuff 以下是使用的CSS body text align center header margin auto 因此 header div
使用 Jeff Atwood 的示例清理 HTML

我正在使用 Jeff Atwood 发现的代码清理我的 Htmlhere http refactormycode com codes 333 sanitize html 但我遇到的问题是当我将 Markdown 链接输入表单时它们被删除
使用java.util.logging登录控制台

我只想使用 java util Logging 登录控制台 Logger log Logger getLogger my logger log setLevel Level ALL ConsoleHandler handler new Co
从另一个 docker 容器连接到 Mongodb docker 容器

我正在尝试从运行我的节点js代码的另一个docker容器连接在docker容器中运行的mongo DB 所以我使用以下命令运行 MongoDB docker docker run name my local mongo v mongo da
从数据库下载exe文件

我已经将一些 exe 文件上传到数据库中因为我不希望它们可供公开访问我尝试使用链接按钮和通用处理程序来使用以下代码提供文件 Context Response Clear Context Response ContentType appl
请求 ruby-on-rails 应用程序会出现 Psych::BadAlias 错误

我从应用程序目录运行 Rails 服务器但是当我尝试从浏览器发出请求时 http localhost 3000 我收到以下错误 Psych BadAlias 无法加载Rails application database configura
WebRTC 连接在本地网络之外无法工作

我们对 webrtc 双向视频和音频流进行了以下设置 Mobile Android应用程序使用谷歌网络RTC https webrtc org 实现java包装器测试了这两个库 implementation org webrtc goog
Pandas 将字典列表分解为行

拥有这个 items name 0 a 2 b 1 a 4 b 3 this 1 a 2 b 1 a 4 b 3 that 但希望将字典对象列表分解为展平为实际行如下所示 a b name 0 2 1 this 1 4 3 this
Angular 2 Promise/Observable 链两个事件？

我想知道是否可观察到的 or promise可用于 Angular 2 中的以下用例有两个异步上传任务我想知道如何检测这两项任务都已完成我的上传任务实现于promise但它很容易改变为可观察到的如果需要的话是这样的 myServi
在 macOS 中通过命令行与 Siri 交互

我在手机和手表上使用 Siri 随时随地创建提醒当我在办公室时我不想使用 Siri 打扰安静因此我通常使用与提醒应用程序集成的 Alfred 工作流程或者直接使用提醒应用程序然而两者都有一个相当笨拙的界面如果我可以在命
Zbar SDK - 缺少所需的架构 x86_64

我在最近的 Xcode 5 1 中构建应用程序时遇到了一个问题编译失败并出现架构 x86 64 的未定义符号错误我使用有效架构构建我的项目 armv7 armv7s 和 arm64 切换到最新的环境 Xcode 后我在相同的架构
随机化一个 BigInteger

I m looking to randomize a BigInteger The intent is to pick a number from 1 to 8180385048 Though from what I noticed the
运行 gulp 任务时如何解决“在 MakeCallback 中使用域属性已被弃用”警告？

我正在使用带有 gulp 的节点来运行一些构建任务直到几天前这一切都还顺利现在我假设在升级更新后不确定是哪一个我相信这是节点从 14 4 更新到 14 5 我不断收到此警告 DEP0097 DeprecationWarning
使用 webpack、Threejs 示例和 TypeScript？

我在将 Threejs 示例如 EffectComposer 或 Detector 中的内容与 webpack 和 typescript 一起使用时遇到了很多麻烦先把相关的 d ts文件全部存在并通过安装tsd 我的问题是让 webpa
Oracle：“= ANY()”与“IN ()”

我刚刚在 ORACLE SQL 中偶然发现了一些我很好奇的东西不确定其他中是否也有我在这里作为维基询问因为很难尝试在谷歌中搜索符号我刚刚发现当根据一组值检查一个值时您可以执行以下操作 WHERE x ANY a b c 与通常的
使用 OData 连接服务在 Blazor 客户端应用程序中使用 OData

创建了 netstandard2 1 blazor Web 程序集项目将 Odata Connected Service V 0 10 0 添加到同一项目生成 OData 代理类从 Razor 页面的 Task OnInitializ
读取 Amazon Kinesis Firehose 流写入 s3 的数据

我正在将记录写入 Kinesis Firehose 流该流最终由 Amazon Kinesis Firehose 写入 S3 文件我的记录对象看起来像 ItemPurchase String personId String itemId

读取 Amazon Kinesis Firehose 流写入 s3 的数据

读取 Amazon Kinesis Firehose 流写入 s3 的数据 的相关文章

随机推荐

热门标签

读取 Amazon Kinesis Firehose 流写入 s3 的数据的相关文章