Flink 使用 Ceph 作为持久存储

2024-04-18

Flink 文档建议 Ceph 可以用作状态的持久存储。https://ci.apache.org/projects/flink/flink-docs-release-1.3/dev/stream/checkpointing.html https://ci.apache.org/projects/flink/flink-docs-release-1.3/dev/stream/checkpointing.html

考虑到Ceph是事务型数据库，那不会对Flink的性能产生不利影响吗？

Ceph https://ceph.com将自己描述为“统一、分布式存储系统”并提供网络文件系统API。因此，它应该与 Flink 的状态后端无缝协作，将检查点保存到远程文件系统。

我不知道有人使用 Ceph（HDFS 和 S3 更常用），也没有有关性能的信息。但需要注意的是，Flink 能够异步写入检查点，因此存储系统的性能不会影响 Flink 应用程序的处理速度。然而，它可能会限制采取检查点的时间间隔。

Update:（2018 年 2 月）我注意到多个用户在 Flink 的用户邮件列表中报告说他们正在将 Ceph 与 Flink 结合使用。

更新2：Flink 在 S3 协议上运行良好，并且 (急速板和 Hadoop https://ci.apache.org/projects/flink/flink-docs-stable/ops/filesystems/s3.html#hadooppresto-s3-file-systems-plugins）Flink 的 S3 文件系统插件可以很好地使用它。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

apacheflink

ceph

Flink 使用 Ceph 作为持久存储的相关文章

任务管理器丢失/被杀死[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案当我尝试在独立集群中运行 flink 作业时出现以下错误 java lang Exception TaskManager was lost
从代码中取消 Apache Flink 作业

我现在的情况是想从代码中停止取消 flink 作业这是在我的集成测试中我正在向我的 flink 作业提交任务并检查结果当作业异步运行时即使测试失败通过它也不会停止我想在考试结束后在车站工作我尝试了一些事情我在下面列出获
Flink 作业在集群节点上的分布

我们有 4 个作业运行在 3 个节点上每个节点有 4 个槽位在 Flink 1 3 2 上作业均匀分布在每个节点上升级到 flink 1 5 后每个作业都在单个节点上运行如果没有剩余插槽则可以转移到另一个节点有没有办法恢复
Apache Flink - 启用连接排序

我注意到 Apache Flink 没有优化表的连接顺序目前它保留用户指定的连接顺序基本上它按字面意思接受查询我认为 Apache Calcite 可以优化连接顺序但由于某种原因这些规则没有在 Apache Flink 中使用
ClassNotFoundException：使用 kafka 主题时出现 org.apache.flink.streaming.api.checkpoint.CheckpointNotifier

我正在使用最新的 Flink 1 1 2 Hadoop 27 和 flink connector kafka 0 10 2 hadoop1 jar Flink消费者如下 StreamExecutionEnvironment env Stre
基于 ProcessWindowFunction 的 Flink 单元测试

如何为有状态流程函数创建单元测试我有这样的事情 private static SingleOutputStreamOperator
如何覆盖 Apache Flink 中的配置值？

我正在尝试将 Apache Flink 的指标收集到 Prometheus 中 Flink 文档说我需要将以下行添加到我的 flink conf yaml 中 metrics reporter promgateway class org a
我可以将自定义分区器与 group by 一起使用吗？

假设我知道我的数据集不平衡并且我知道键的分布我想利用它来编写一个自定义分区器以充分利用运算符实例我知道关于数据流 partitionCustom https ci apache org projects flink flink doc
Apache Flink 使用 Windows 在写入 Sink 之前引发延迟

我想知道 Flink 窗口是否可能导致从数据进入管道到写入 Cassandra 中的表之间有 10 分钟的延迟我最初的意图是将每个事务写入 Cassandra 中的一个表并在 Web 层使用范围键查询该表但由于数据量很大我正在考虑延
Flink REST API错误：请求与预期格式JarRunRequestBody不匹配

尝试使用下面的 REST API 远程运行 Flink 作业但抛出错误 curl X POST H Content Type application json data type object id urn jsonschema org
根据 Flink 的模式使用 GCS 文件

由于 Flink 支持 Hadoop 文件系统抽象并且有一个GCS连接器 https github com GoogleCloudPlatform bigdata interop 在 Google Cloud Storage 之上实现它的
谁能分享一下 Scala 中的 Flink Kafka 示例吗？

谁能分享一下Scala中Flink Kafka 主要是从Kafka接收消息的工作示例吗我知道有一个Kafka字数统计 https github com apache spark blob master examples src main
Apache Flink：设置并行度的指南？

我正在尝试获取一些简单的规则或指南来设置哪些值操作员或工作并行性在我看来它应该是一个数字例如假设我有 2 台任务管理器机器每台都有 4 个任务槽假设集群上没有运行其他作业我会设置并行度吗用于操作喜欢过滤并映射到 8 如
如何在其他流的基础上过滤Apache flink流？

我有两个流一个是 Int 另一个是 json 在 json Schema 中有一个键是一些 int 所以我需要通过与另一个整数流的键比较来过滤 json 流那么在 Flink 中是否可能是的您可以使用 Flink 进行这种流处理
Flink 中的水印和触发器有什么区别？

我读到排序运算符必须缓冲它接收到的所有元素然后当它接收到水印时它可以对时间戳低于水印的所有元素进行排序并按排序顺序发出它们这是正确因为水印表明不能有更多元素到达并与已排序元素混合 https cwiki apache org
示例 flink 作业的错误消息：无法使字段 private Final byte[] java.lang.String.value 可访问

我正在开始使用 Apache Flink 我将发布我遇到的错误然后复制它的步骤这是我运行的命令 bin flink run examples streaming WordCount jar input 这是错误文本 org apache
Ceph：每个 OSD PG 太多

我使用推荐值配置了 Ceph 使用文档中的公式我有 3 个 OSD 我的配置我已将其放在监视器节点和所有 3 个 OSD 上包括以下内容 osd pool default size 2 osd pool default min siz
如何正确处理自定义MapFunction中的错误？

我已经实施了MapFunction对于我的 Apache Flink 流程它正在解析传入元素并将其转换为其他格式但有时会出现错误即传入数据无效我看到两种可能的处理方法忽略无效元素但似乎我无法忽略错误因为对于任何传入元素我必须
Cassandra Pojo Sink Flink 中的动态表名称

我是 Apache Flink 的新手我正在使用 Pojo Sink 将数据加载到 Cassandra 中现在我在以下命令的帮助下指定表和键空间名称 Table注解现在我想在运行时动态传递表名称和键空间名称以便可以将数据加载到用
我可以将 flink RocksDB 状态后端与本地文件系统一起使用吗？

我正在探索使用 FlinkrocksDb 状态后端文档似乎暗示我可以使用常规文件系统例如 file data flink checkpoints 但代码 javadoc 仅在此处提到 hdfs 或 s3 选项我想知道是否可以将本地文件

随机推荐

对于二进制文件，我应该使用 bfiles 还是 bigfiles？

有一些善变的扩展可用于处理大型二进制文件 Bfiles http mercurial selenic com wiki BfilesExtension BigFiles http mercurial selenic com wiki Big
如何避免 MV3 Chrome 扩展中同时存在多个 Service Worker？

我正在将 Chrome 扩展程序从清单版本 2 MV2 转换为清单版本 3 MV3 在MV2版本中后台页面脚本在扩展中具有突出的作用在启动时后台脚本从IndexedDB读取大量数据到RAM 然后在运行期间处理注入到页面中的内容脚本
Android：合并标签不适用于片段[重复]

这个问题在这里已经有答案了我是使用片段的初学者是否可以有这样的布局
NetBeans JavaScript？

我刚刚下载了 Netbeans 因为我读到另一个问题说它是开发 Javascript 的一个很好的 IDE 我尝试创建一个新项目但没有选项将其设置为 Javascript 如果有人知道如何设置它以使用Javascript进行开发请留下
ggplot2 0.9.3中美学的继承以及annotation_custom的行为

跟进最近的一个问题mine https stackoverflow com questions 14391183 ggplot2 annotation custom gives an empty layer 这个有点不同它使用更简单的示例
C++ SFINAE：const char[] 与 std::string 的 is_constructible

我正在尝试禁用具有非 std string 可构造类型的 ctor 我的第一次尝试是这样的 include
带有任务的欧拉数

我想使用这个公式 3k 计算多线程的欧拉数 2 1 3k k 0 但到目前为止我没有得到正确的结果其中一个问题是当我使用相当大的数字时我超出了阶乘函数的小数范围这就是我的结果到目前为止已经完成了 static void Main s
JS：Array.map不添加到数组

我有一些数据想要使用Array prototype map 但是在映射函数中外部函数调用可能会引发错误我想捕获此错误并且不将该特定对象添加到返回的数组中目前我只是返回未定义然后使用Array prototype filter清除未
从中心以顺时针方向扩展的螺旋打印二维数组

我有保证成为完美方阵我想从矩阵的中心开始在这种情况下它是matrix 2 2 我知道如何计算中心 int dimensions 2 我需要在下面输出数组的内容向外螺旋图案当然该算法应该适用于任何完美的方阵我不确定这个算法是否已经存
Pandas：解散数据框以添加任意数量的列？

我有一个数据框df在 Pandas 中看起来像这样 stores product discount Westminster 102141 T Westminster 102142 F City of London 102141 T City
c - 将 uint8_t* 转换为 uint32_t* 行为

我读过这个问题将 uint8 转换为 uint32 如何工作 https stackoverflow com questions 28603243 how does casting uint8 to uint32 work但我不确定给出的
标准库中聚合可初始化性的类型特征？

C 标准库有std is constructible
在 Eclipse 之外使用 Maven

我已经在 Eclipse 之外使用 Maven 但想使用 Eclipse 作为我的主编辑器我不想使用已经嵌入 M2E 的 Maven 我想使用位于 usr bin mvn 的我的在 Window gt Preferences 下我尝试
从 JDBC 结果集中获取 XML 的最佳方法

我正在寻找从 JDBC 结果集中获取 XML 文档的最佳方法 XML 的结构并不是非常重要但它应该相当快为了清楚起见我想要结果集中的数据和足够的元数据来识别数据本质上是字段名称我目前正在使用 MySQL DB2 SQL Serve
礼品卡/借记卡激活

一般问题零售机构如何限制礼品卡或预付费电话借记卡的激活他们必须有一个系统只能阻止您打电话激活未通过收银机扫描的卡而且我认为零售 ERP 会计系统中必须内置一个标准解决方案它可能涉及 Web 服务或 EDI 具体问题我问这一切是
“破坏对象”的variable = null从何而来？

在许多不同的公司中我在使用各种 NET 版本编写的许多遗留系统上工作不断发现以下模式的示例 public void FooBar object foo null object bar null try foo new object ba
“用户模板”未显示在“新项目”窗口中 - Xcode 4

我最近从 SDL 网站下载了两个 SDL 包并将它们移动到相应的文件夹中在 Library Application Support Developer Shared Xcode Project Templates 中我创建了一个名为 A
如何在 Python 中使数据正确符合幂律？

我正在考虑Moby Dick 小说中独特单词的出现次数 http tuvalu santafe edu 7Eaaronc powerlaws data htm并使用powerlaw蟒蛇包 https pythonhosted org pow
在 Interface Builder 中的 View Effects Inspector 中选择 CALayer 有何作用？

在IB内部在View Effects Inspector中有一个设置核心动画层的选项如果我设置了它会做什么是否相当于setWantsLayer YES 如果是这样那么按照苹果文档 https developer apple com
Flink 使用 Ceph 作为持久存储

Flink 文档建议 Ceph 可以用作状态的持久存储 https ci apache org projects flink flink docs release 1 3 dev stream checkpointing html http

Flink 使用 Ceph 作为持久存储

Flink 使用 Ceph 作为持久存储 的相关文章

随机推荐

热门标签

Flink 使用 Ceph 作为持久存储的相关文章