用于 Azure Blob 存储的 Kafka 连接器

2023-12-21

我需要将推送到 Kafka 的消息存储在深度存储中。我们正在使用 Azure 云服务，因此我认为 Azure Blob 存储可能是更好的选择。我想使用 Kafka Connect 的接收器连接器 API 将数据推送到 Azure Blob。 Kafka 文档主要建议使用 HDFS 导出数据，但是在这种情况下，我需要一个运行 Hadoop 的 Linux VM，我猜这会很昂贵。我的问题是 Azure Blob 存储是存储 JSON 对象的适当选择，而构建自定义接收器连接器是这种情况的合理解决方案吗？

定制的水槽连接器绝对有效。 Kafka Connect 的设计绝对是为了让您可以插入连接器。事实上，连接器的开发是完全联合的。 Confluence 的 JDBC 和 HDFS 连接器首先实现只是因为这两个用例的流行，但还有更多（我们保留了我们知道的连接器列表）here http://connectors.confluent.io.

关于Azure blob存储是否合适，您提到了JSON对象。我认为您唯一需要考虑的是对象的大小以及Azure存储是否能够很好地处理对象的大小和数量。我不确定 Azure 存储的特性，但在许多其他对象存储系统中，您可能需要将许多对象聚合到单个 blob 中，以获得大量对象的良好性能（即，您可能需要支持许多 JSON 对象的文件格式）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

用于 Azure Blob 存储的 Kafka 连接器的相关文章

kafka 连接 s3 源无法与 Minio 一起使用

我已经验证了与 minio 的连接确保凭据工作正常并且可以访问 minio 另外如果我尝试任何其他值store url http minio 9000我无法保存配置所以我猜想在可见性方面不存在问题卡夫卡连接容器和minio容器我不确
在spark-kafka中使用schema将ConsumerRecord值转换为Dataframe

我正在使用 Spark 2 0 2 和 Kafka 0 11 0 并且我正在尝试在火花流中使用来自卡夫卡的消息以下是代码 val topics notes val kafkaParams Map String Object bootst
为什么卡夫卡这么快[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案如果我有相同的硬件请使用 Kafka 或我们当前的解决方案 ServiceMix Camel 有什么区别吗 Kafka 能处理比它
Kafka Consumer 无法加载任何密钥库类型和路径的 SSL 密钥库（Logstash ArcSight 模块）

我需要为 Kafka Consumer 提供客户端身份验证证书但是它总是失败并出现以下异常无法加载 SSL 密钥库 ssl cipher suites null ssl enabled protocols TLSv1 2 TLSv1
Kafka Producer配置重试策略

需要更改 Kafka Producer 配置的哪些参数以便生产者应该 1 重试n次 2 n个间隔后如果代理关闭也会收到相同的消息我需要处理与此相关的情况 https github com rsyslog rsyslog issues
如何在 Python 中以编程方式检查 Kafka Broker 是否已启动并运行

我正在尝试使用来自 Kafka 主题的消息我正在使用包装器confluent kafka消费者我需要在开始使用消息之前检查连接是否已建立我读到消费者很懒所以我需要执行一些操作才能建立连接但我想检查连接建立而不执行consume o
为每个键使用主题中的最新值

我有一个 Kafka 生产者它正在以高速率生成消息消息键是用户名值是他在游戏中的当前分数 Kafka消费者处理消费消息的速度相对较慢在这里我的要求是显示最新的分数并避免显示陈旧的数据但代价是某些分数可能永远不会显示本质上对于
从 Apache Kafka 中的主题删除消息

所以我是 Apache Kafka 的新手我正在尝试创建一个简单的应用程序以便我可以更好地理解 API 我知道这个问题在这里被问了很多但是如何清除存储在主题上的消息记录我看到的大多数答案都说要更改消息保留时间或删除并重新创建主题
使用访问密钥的 REST Api 到 Azure Blob 存储

我们正在尝试在不使用 Azure SDK 的情况下访问 azure blob 存储中的 blob 我们正在尝试通过 Azure REST API 通过共享密钥进行访问为此我们需要生成授权标头但是当我尝试从访问密钥创建签名时出现以下错误
使用 offsets_for_times 从时间戳消费

尝试使用 confluence kafka AvroConsumer 来消费给定时间戳的消息 if flag creating a list topic partitons to search list map lambda p Topic
我的 Kafka 流应用程序刚刚退出，代码为 0，什么也不做

为了尝试 Kafka 流我这样做了 public static void main String args final StreamsBuilder builder new StreamsBuilder final Properties
kafka新版本2.1.0 Broker无故挂起

起初集群中的所有代理都可以启动并正常工作但有时其中一个代理会遇到问题并且会出现一些现象整个集群挂了生产者和消费者也不工作因此从监视器来看网络流量降至零使用kafka topic sh描述主题消息每个副本都很好即使是异常的b
创建 Kafka 主题导致没有领导者

我正在使用 Kafka v0 9 0 1 Scala v2 11 和com 101tec zkclientv0 7 我正在尝试使用AdminUtils创建一个kafka主题我的代码如下 String zkServers node1 218
如何使用 Python 在 Kafka 中生成 Tombstone Avro 记录？

我的水槽属性 name jdbc oracle config connector class io confluent connect jdbc JdbcSinkConnector tasks max 1 topics orders con
Kafka Streams 反序列化处理程序

我正在尝试在反序列化中使用 LogAndContinueExceptionHandler 当发生错误时通过成功记录错误并继续它可以正常工作但是假设我的传入消息有连续的错误流我停止并重新启动 kafka 流应用程序然后我看到失败并
Mesos DCOS 未安装 Kafka

我正在尝试在 Mesos 上安装 Kafka 看来安装已经成功了 vagrant DevNode dcos dcos package install kafka This will install Apache Kafka DCOS Ser
Flink Kafka - 如何使应用程序并行运行？

我正在 Flink 中创建一个应用程序读取某个主题的消息对其进行一些简单的处理将结果写入不同的主题我的代码确实有效然而它不并行运行我怎么做看来我的代码只在一个线程块上运行在 Flink Web 仪表板上应用程序进入运行状态
不要覆盖 Azure Blob 存储

我有一种将文件添加到 Azure Blob 存储的方法问题是我试图指定一个条件在该条件下它不会覆盖 blob 而只是添加到其中我正在尝试使用参数访问条件但是 VS 说这个方法不能采用两个参数 async void archiveNe
Azure 数据工厂 V2 中的 LeaseAlreadyPresent 错误

我在管道中收到以下错误使用 Rest API 复制活动作为来源和Azure 数据湖存储第 2 代作为水槽 message 失败发生在 Sink 端 ErrorCode AdlsGen2OperationFailed Type Microso
如何检查 Azure Blob Storage V12 中是否存在容器

以前使用 Azure Blob Storage SDK V11 时如果您想要创建容器但不确定该容器是否存在可以使用 CreateIfNotExists 然而在版本 V12 中 CreateIfNotExists 不再可用我能从 Mic

随机推荐

SQL 中时间段的交集和合并

我想实现类似的功能 NET 的时间段库 https www codeproject com Articles 168662 Time Period Library for NET 但是在 SQL 中首先我有一个包含多行的表其中包含开始
使用 Gorm 更新为 0 值

我正在尝试使用 gorm 库更新一些值但值为 0 的字节和整数未更新 var treatment model TreatmentDB err json Unmarshal b treatment if err nil http Error
在 Netbeans 中，如何设置相当于 Eclipse 的运行/调试配置参数？

我继承了一个使用 XML 作为输入的 java 应用程序从命令行它运行如下 java jar myJar jar f path to my xmlfile xml 在 Eclipse 中您可以从运行 gt 调试配置参数选项卡设置运行
MWAA 上的 Airflow 作业失败且没有日志消息

我已经在 AWS MWAA 上使用 Airflow 几个月了我注意到有时一些 Airflow 任务会失败没有明显的原因并且 Cloudwatch 中没有日志消息我经常必须多次清除并重试任务才能最终成功有谁知道为什么会发生这种情况
R 从 URL 下载图片

我在使用 R 从网站下载图片时遇到问题看来该图像已被正确识别download file 尝试网址 https i stack imgur com Xh9kO png https i stack imgur com Xh9kO png 内容
如何使用 Laravel 5.8 中的视图在浏览器上显示 PDF 文档

我正在使用 Laravel 5 8 开发一个 Web 应用程序我是 Laravel 框架的新手我想当用户单击某些按钮时在浏览器上显示 PDF 文档我将允许经过身份验证的用户查看和下载 PDF 文档我创建了一个控制器和一个路由来
Node.js selenium webdriver - 在测试中获取浏览器功能？

我在node js上使用selenium webdriver 目前通过webdriverio 但我不介意切换到webdriverjs或wd 我在不同的浏览器上运行一些测试并希望保存每个测试的结果以及有关浏览器的信息例如测试 1 chr
使用 ASP.NET Core 在单元测试中模拟 POST 请求

我目前正在 ASP NET Core 项目中实现单元测试并且必须测试 API 控制器的 POST 方法以下是 POST 方法的示例 HttpPost public IActionResult Post FromBody Product
现在有哪些选项可以在 Ruby 和 RoR 中实现 UTF8？

通过密切关注 Ruby 的开发我了解到 Ruby 1 9 中实现了详细的字符编码我现在的问题是目前如何使用 Ruby 与以 UTF8 存储所有数据的数据库进行对话背景我参与了一个新项目其中 Ruby RoR 至少是一个选择但该
如果数据库包含特定 ID，如何停止将表单发布到 mysql？

我有一个用于将数据发布到 mysql 的表单在提交表单之前我想检查数据库看看 customerid 列中是否有任何字段等于 userid 如果是则不发布表单基本上我试图限制我的用户多次发帖用户将能够登录我的系统并发表一篇文章
有没有办法使用 Karate DSL 获取 sessionStorage？

我当前需要获取 sessionStorage 密钥下保存的身份验证令牌并将其用于其他 API 调用我使用 Karate UI 自动化来访问浏览器并访问该页面但无法访问 sessionStorage 我也想过用一些JS来获取它但我不确
使用 Jquery 将带有关闭按钮的 DIV 动态添加到另一个 DIV

我想在右上角添加 4 个带有关闭按钮的 div 与父 DIV 水平对齐单击关闭按钮时应从父 DIV 中删除该 div 这可以用 Jquery 实现吗如果有人可以发布示例代码我将非常感激 Thanks 让我们来帮助你吧 jsBin d
如何记录不正确的条目（php .htaccess）

我创建了一个 htaccess 文件该文件将阻止任何人访问文件除非他有用户名和密码当有人尝试使用不正确的信息访问然后禁止 IP 地址时我如何记录文件我在 php 中知道它但 htaccess 我对它仍然很陌生谢谢大家你可以使
有没有办法在不改变字体的情况下将导航栏中的标题更改为斜体、粗体和下划线？

我使用 UIAppearance 更改导航栏中标题的属性如下所示 UINavigationBar appearance setTitleTextAttributes NSForegroundColorAttributeName MM ma
将 C# 项目转换为 C++ 项目的 Dll

我是 C 的新手我目前正在学习C 代码我的最终目标是将 C 项目转换为 dll 以便我可以在我的 C exe 中使用它我用的是VS2005 我想知道是否可能如果可以我将不胜感激您在这方面的一些指导和建议请回复为什么不从托管库中
jQuery nextAll -- 单击 h 元素可切换所有 p 元素，直到下一个 h

我正在创建一个常见问题解答页面通过单击问题来切换答案问题是h3答案有几个p 元素像这样 h3 The First Question h3 p Answer Paragraph p p Answer Paragraph p p Answ
如何知道附件是否是 Outlook 电子邮件中的签名

我有一封 Outlook 电子邮件我需要处理它的附件但是当遍历附件时如果附件是签名我想跳过它要知道附件是否是我正在使用的签名 outlookMailItem Attachments i PropertyAccessor GetP
如何使用 Android NDK 修复 Eclipse CDT 错误“无法解析函数‘isdigit’”？

我正在将 Eclipse Indigo 与 Android NDK 混合项目一起使用我添加了 C 特性几乎一切都正常自动构建工作也就是说当我编辑文件时会调用 ndk build 并成功完成没有构建错误鼠标悬停代码辅助起作用
连接两个列表 - '+=' 和extend() 之间的区别

我已经看到实际上有两种也许更多方法可以在 Python 中连接列表一种方法是使用extend method a 1 2 b 2 3 b extend a 另一个使用加号运算符 b a 现在我想知道这两个选项中哪一个是进行列表连接的
用于 Azure Blob 存储的 Kafka 连接器

我需要将推送到 Kafka 的消息存储在深度存储中我们正在使用 Azure 云服务因此我认为 Azure Blob 存储可能是更好的选择我想使用 Kafka Connect 的接收器连接器 API 将数据推送到 Azure Blob

用于 Azure Blob 存储的 Kafka 连接器

用于 Azure Blob 存储的 Kafka 连接器 的相关文章

随机推荐

热门标签

用于 Azure Blob 存储的 Kafka 连接器的相关文章