Flink 文档建议 Ceph 可以用作状态的持久存储。https://ci.apache.org/projects/flink/flink-docs-release-1.3/dev/stream/checkpointing.html https://ci.apache.org/projects/flink/flink-docs-release-1.3/dev/stream/checkpointing.html
考虑到Ceph是事务型数据库,那不会对Flink的性能产生不利影响吗?
Ceph https://ceph.com将自己描述为“统一、分布式存储系统”并提供网络文件系统API。因此,它应该与 Flink 的状态后端无缝协作,将检查点保存到远程文件系统。
我不知道有人使用 Ceph(HDFS 和 S3 更常用),也没有有关性能的信息。但需要注意的是,Flink 能够异步写入检查点,因此存储系统的性能不会影响 Flink 应用程序的处理速度。然而,它可能会限制采取检查点的时间间隔。
Update:(2018 年 2 月)我注意到多个用户在 Flink 的用户邮件列表中报告说他们正在将 Ceph 与 Flink 结合使用。
更新2:Flink 在 S3 协议上运行良好,并且 (急速板和 Hadoop https://ci.apache.org/projects/flink/flink-docs-stable/ops/filesystems/s3.html#hadooppresto-s3-file-systems-plugins)Flink 的 S3 文件系统插件可以很好地使用它。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)