flinkstreaming

对 Parquet 批量格式使用压缩

从 Apache Flink 1 15 版本开始您可以使用压缩功能将多个文件合并为一个 https nightlies apache org flink flink docs master docs connectors datastre

apacheflink parquet flinkstreaming

我尝试将集群中的 flink 版本升级到 1 3 1 以及 1 3 2 但我的任务管理器中出现以下异常 2018 02 28 12 57 27 120 ERROR org apache flink streaming runtime tas

ApacheKafka apacheflink flinkstreaming

我想使用 Flink 来使用来自 Kinesis 的 POJO 是否有关于如何正确发送和反序列化消息的标准 Thanks 我用以下方法解决了它 DataStream

POJO apacheflink amazonkinesis flinkstreaming

我已将以下行添加到 flink conf yaml 中 env java opts Ddy props path PATH TO PROPS FILE 启动 jobmanager jobmanager sh start cluster 时

Java apacheflink flinkstreaming

我正在编写一个 Flink 流程序其中我需要使用一些静态数据集信息库 IB 来丰富用户事件的数据流对于例如假设我们有一个买家的静态数据集并且有一个传入的事件点击流对于每个事件我们希望添加一个布尔标志来指示事件的执行者是否是买家

Bigdata apacheflink dataanalysis flinkstreaming

我们正在运行一个 ListState 介于 300GB 到 400GB 之间的作业并且有时该列表可能会增加到数千在我们的用例中每个项目都必须有自己的 TTL 因此我们使用 S3 上的 RocksDB 后端为此 ListState 的每

apacheflink flinkstreaming rocksdb

我对 Apache Flink 比较陌生我正在尝试创建一个简单的项目将文件生成到 AWS S3 存储桶根据文档我似乎需要安装 Hadoop 才能执行此操作如何设置本地环境来测试此功能我在本地安装了 Apache Flink 和

Hadoop amazons3 apacheflink flinkstreaming

我正在写一个案例来测试 flink 两步提交下面是概述 sink kafka曾经是kafka生产者 sink stepmysql接收器是否扩展two step commit sink comparemysql接收器是否扩展two step

Streaming apacheflink flinkstreaming blink

我正在使用带有运动源和事件时间键控窗口的 F link 该应用程序将监听实时数据流窗口事件时间窗口并处理每个键控流我有另一个用例我还需要能够支持某些关键流的旧数据的回填这些将是事件时间鉴于我正在使用水印这会成为一个问题因为

apacheflink flinkstreaming watermark

我读到排序运算符必须缓冲它接收到的所有元素然后当它接收到水印时它可以对时间戳低于水印的所有元素进行排序并按排序顺序发出它们这是正确因为水印表明不能有更多元素到达并与已排序元素混合 https cwiki apache org

Stream Bigdata Realtime apacheflink flinkstreaming

我正在 15 台机器的裸机集群上构建 Flink 流应用程序原型我使用带有 90 个任务槽 15x6 的纱线模式该应用程序从单个 Kafka 主题读取数据 Kafka主题有15个分区所以我也将源算子的并行度设置为15 但是我发现 F