在 Flink 中，我可以在同一个槽中拥有一个算子的多个子任务吗？

2024-03-25

探索Apache Flink几天了，对Task Slot的概念有些疑惑。虽然有人问了几个问题，但有一点我不明白。

我正在使用一个玩具应用程序进行测试，运行本地集群。我已禁用运算符链接

我从文档中知道插槽允许内存隔离而不是 CPU 隔离。阅读文档，任务槽似乎是一个 Java 线程。

1）当我以parallelism=1部署应用程序时，所有操作员的子任务都部署在同一个槽中。但是，如果我从open()的方法AbstractStreamOperator，我看到不同的子任务有不同的 ID。那么，它们不是共享同一个线程（即插槽吗？）。

2) 如果我将并行度从 1 更改为 3，则需要 3 个插槽才能正确重新部署应用程序。文档证实槽的数量限制了我可以拥有的并行性。但是为什么我可以在同一个槽中拥有不同算子的子任务，而不能在同一个槽中拥有同一算子的子任务呢？

感谢您的任何解释！

槽的想法是将可用资源分割成更小的部分。可用的托管内存均匀分布在所有插槽中。 CPU 周期和 JVM 堆内存不是与插槽正确隔离的。

在每个插槽中您可以部署一个或多个Tasks。弗林克Task由专用线程执行。因此，如果您有多个线程，则可以在同一个插槽中运行多个线程Tasks部署到它。

A Task表示单个 Flink 运算符或多个运算符（如果可链接）的并行实例。链接并不总是可行或理想的，但如果应用，它将融合运算符，以便它们由相同的运算符执行Task线。这通常更有效，因为上下文切换更少，并且无需将记录移交给不同的线程。

为了提高资源利用率（特别是对于Tasks需要很少的资源）并且为了更容易地推理运行 Flink 程序需要多少个槽，Flink 支持槽共享。槽共享意味着不同算子的并行实例可以部署到同一个槽。由于这个特性，Flink 尽可能创建不同算子的长管道并将它们部署到同一个槽。这还有一个很好的效果，可以增加生产者与其各自消费者的同地办公。由于此功能，用户知道他们只需要提供与一个拓扑的所有运算符的最大并行度一样多的插槽。

但是，由于您仍然希望将运算符的并行实例分布在所有可用的TaskExecutors，Flink不支持将同一算子的并行实例部署到同一槽位。如果你想这样做，那么你应该简单地将相应运算符的并行度减少到1.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

apacheflink

在 Flink 中，我可以在同一个槽中拥有一个算子的多个子任务吗？的相关文章

Flink CsvTableSource 流式传输

我想使用 flink 流式传输 csv 文件并执行 sql 操作但我编写的代码只读取一次并停止它不流式传输提前致谢 StreamExecutionEnvironment env StreamExecutionEnvironment g
Flink 作业在集群节点上的分布

我们有 4 个作业运行在 3 个节点上每个节点有 4 个槽位在 Flink 1 3 2 上作业均匀分布在每个节点上升级到 flink 1 5 后每个作业都在单个节点上运行如果没有剩余插槽则可以转移到另一个节点有没有办法恢复
Apache Flink RollingFileAppender

我正在使用 Apache Flink v1 2 我想切换到滚动文件附加程序以避免包含几天数据的巨大日志文件然而它似乎不起作用我调整了 log4j 配置 log4j properties 如下 log4j appender file o
如何覆盖 Apache Flink 中的配置值？

我正在尝试将 Apache Flink 的指标收集到 Prometheus 中 Flink 文档说我需要将以下行添加到我的 flink conf yaml 中 metrics reporter promgateway class org a
在 kubernetes 上持续部署有状态 apache flink 应用程序

我想在 kubernetes 上运行 apache flink 1 11 1 流应用程序文件系统状态后端保存到 s3 s3 的检查点正在运行 args standalone job s s3 BUCKET NAME 34619f2862c
如何构建和使用flink-connector-kinesis？

我正在尝试将 Apache Flink 与 AWS kinesis 结合使用这document https ci apache org projects flink flink docs release 1 7 dev connector
为 Flink 集群中的插件添加自定义依赖项

我有一个 Flink 会话集群作业管理器任务管理器版本 1 11 1 配置了 log4j console properties 以包含 Kafka 附加程序此外在作业管理器和任务管理器中我都启用了 flink s3 fs had
如何判断 Apache Flink 运行在哪个端口？

我安装了 apache flink 转到flink 1 14 3文件夹并运行 bin start cluster sh 它似乎已成功启动集群因为它输出了以下内容 Starting cluster Starting standalonese
Kafka - 无法建立与节点-1的连接

我正在尝试使用 apache flink 流处理 kafka 主题但我遇到了这个问题 2018 04 10 02 55 59 856 ProducerConfig values acks 1 batch size 16384 bootst
为什么我的 Flink 窗口使用这么多状态？

我的 Flink 作业的检查点变得越来越大在深入研究各个任务后键控窗口函数似乎负责大部分大小我怎样才能减少这个如果您在 Windows 中绑定了很多状态则有几种可能性使用增量聚合通过使用reduce or aggregate
Apache Flink：设置并行度的指南？

我正在尝试获取一些简单的规则或指南来设置哪些值操作员或工作并行性在我看来它应该是一个数字例如假设我有 2 台任务管理器机器每台都有 4 个任务槽假设集群上没有运行其他作业我会设置并行度吗用于操作喜欢过滤并映射到 8 如
Apache Flink：如何从 Cassandra 读取数据流/数据集？

我尝试将 Cassandra 视为 Flink 中的数据源并使用以下链接中提供的信息从 Cassandra 读取数据以在 Flink 中进行处理 https stackoverflow com questions 43067681 re
flink集群启动错误[ERROR]无法正确获取JVM参数

bin start cluster sh Starting cluster INFO 1 instance s of standalonesession are already running on centos1 Starting sta
Flink 模式演化不适用于 POJO 类

我有一个类满足被视为 POJO 的要求这是我的流媒体工作中的主要传输类它只包含原语和Map
flink kafka生产者在检查点恢复时以一次模式发送重复消息

我正在写一个案例来测试 flink 两步提交下面是概述 sink kafka曾经是kafka生产者 sink stepmysql接收器是否扩展two step commit sink comparemysql接收器是否扩展two step
示例 flink 作业的错误消息：无法使字段 private Final byte[] java.lang.String.value 可访问

我正在开始使用 Apache Flink 我将发布我遇到的错误然后复制它的步骤这是我运行的命令 bin flink run examples streaming WordCount jar input 这是错误文本 org apache
Apache Flink AWS S3 Sink 是否需要 Hadoop 进行本地测试？

我对 Apache Flink 比较陌生我正在尝试创建一个简单的项目将文件生成到 AWS S3 存储桶根据文档我似乎需要安装 Hadoop 才能执行此操作如何设置本地环境来测试此功能我在本地安装了 Apache Flink 和
Flink CEP：对于不同类型的事件，使用哪种方法加入数据流？

假设我有两种不同类型的数据流一种提供天气数据另一种提供车辆数据我想使用 Flink 对数据进行复杂的事件处理 Flink 1 3 x 中哪种方法是正确的使用方法我看到了不同的方法如 Union Connect Window Joi
在 Flink 流中使用静态 DataSet 丰富 DataStream

我正在编写一个 Flink 流程序其中我需要使用一些静态数据集信息库 IB 来丰富用户事件的数据流对于例如假设我们有一个买家的静态数据集并且有一个传入的事件点击流对于每个事件我们希望添加一个布尔标志来指示事件的执行者是否是买家
Flink 流顺序

Flink 能保证流的执行顺序吗我有两个 Kafka 主题每个主题都有一个分区流 1 和流 2 并使用keyBy 流由一个处理coprocess功能在我的测试过程中我可以看到两个流的内容并不总是按顺序执行我可以将并行度设置为 1

随机推荐

在Python中提取每个子列表的第一项

我想知道提取列表列表中每个子列表的第一项并将其附加到新列表的最佳方法是什么所以如果我有 lst a b c 1 2 3 x y z 还有我想拔出来a 1 and x并从中创建一个单独的列表 I tried lst2 append x 0
在python中读取二进制文件

我必须用 python 读取二进制文件首先由 Fortran 90 程序这样编写 open unit 10 file filename form unformatted write 10 table n1 table n2 write 1
如何将wordpress循环与网格系统引导程序一起使用？

我想显示一个带两列的条形行其中包含wordpress循环内容标题以绿色块表示每行都有白色和灰色背景的列这些列在每行中反转就像国际象棋检查器一样 see the image for more detail 编辑答案我相信这就是您
如何让 Windows 错误报告 (WER) 保存内存转储以防止挂起？

WER 正在应用程序挂起后创建内存转储当 Windows 显示对话框时应用名称没有回应如果用户点击关闭程序我可以看到正在创建的 hdmp 文件C ProgramData Microsoft Windows WER Temp 将它们发送
如何在 CherryPy 中使用 cookie 和 HTTP 基本身份验证？

我有一个需要身份验证的 CherryPy Web 应用程序我正在使用 HTTP 基本身份验证其配置如下所示 app config tools sessions on True tools sessions name zknsrv too
获取字符串形式的命令行参数

我想将所有命令行参数打印为单个字符串我如何调用脚本以及我期望打印的内容的示例 RunT py mytst tst c qwerty c mytst tst c qwerty c 执行此操作的代码 args str sys argv 1 a
PostgreSQL upsert 查询的问题

我正在尝试通过更新或插入新记录来更新数据库投票用户表该表定义如下 Column Type Modifiers id integer not null default nextval vote user table id seq regcl
如何对类或函数定义进行哈希处理？

背景在尝试机器学习时我经常通过 pickling unpickling 的方式重用之前训练过的模型然而在进行特征提取部分时不混淆不同的模型是一个挑战因此我想添加一项检查以确保使用与测试数据完全相同的特征提取过程来训练模型 P
使用 nginx proxy_pass 和重写的多个 django 应用程序

我有一个名为的 django admin 应用程序myapp我想在不同的物理盒子上部署多个实例每个客户一个但是我希望它们都可以从类似的域访问 mydomain com customer1 myapp 我摆弄了特定的代理设置并尝试了多
如何在 JSF2 中将一个 @Named bean 注入到另一个 @Named bean 中？

我有以下代码 Named RequestScoped public class SearchBean private String title private String author getters and setter s In se
C++ 中的结构对齐

struct Vector float x y z func Vector vectors usage load float coords load file func coords 我有一个关于 C 中结构对齐的问题我将把一组点传递给函
如何检测scala执行上下文耗尽？

我的 Playframework 应用程序有时没有响应我想在运行时检测到这一点记录有关当前在耗尽的执行上下文上运行的内容的信息实现这一目标的最佳策略是什么我考虑过将小型可运行对象发布到执行上下文如果它们没有及时执行我会记录一条警
在 TabLayout 支持库中以编程方式设置选项卡指示器位置

在我的应用程序中我使用支持库中的 TabLayout 和视图寻呼机其中有 3 个片段假设我在 fragA 中其中有一个按钮单击该按钮会将我带到 fragB 我成功地转到 fragB 但唯一的问题是选项卡指示器保留在fragA Co
Meteor：读取简单的 JSON 文件

我正在尝试使用 Meteor 读取 JSON 文件我在 stackoverflow 上看到了各种答案但似乎无法让它们发挥作用我有试过这个 https stackoverflow com questions 22004412 how t
如何使用 WPF 获得本机“外观和感觉”？

我刚刚开始开发 WPF 应用程序这不是我的第一个 WPF 应用程序但它将是第一个需要改进的应用程序我对 WPF 的管道了解很多例如绑定等但对如何完善它知之甚少我不需要时髦的用户界面我只需要一些看起来像本机 Windows
从 Trello 身份验证中获取“未找到应用程序”

我正在尝试调用 Trello API 的身份验证部分以获得用户令牌我正在使用这个网址 https trello com 1 authorize callback method postMessage return url http 3A
python 模拟和未安装的库

我正在为机器人开发软件该软件通常在 Raspberry Pi 上运行让我们考虑两个文件的导入 motor py 运行电机 from RPi import GPIO as gpio and client py 与服务器通信并将命令转发给电
检查用户的 Postgres 访问权限

我已经查看了文档GRANT Found here http www postgresql org docs 9 0 static sql grant html我试图看看是否有一个内置函数可以让我查看数据库的可访问性级别当然有 dp and
需要 viber webservice 或 api 地址 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否有任何 api 或 web 服务可以通过 c net 通过 viber 发送消息并获得交付我用谷
在 Flink 中，我可以在同一个槽中拥有一个算子的多个子任务吗？

探索Apache Flink几天了对Task Slot的概念有些疑惑虽然有人问了几个问题但有一点我不明白我正在使用一个玩具应用程序进行测试运行本地集群我已禁用运算符链接我从文档中知道插槽允许内存隔离而不是 CPU 隔离阅读文

在 Flink 中，我可以在同一个槽中拥有一个算子的多个子任务吗？

在 Flink 中，我可以在同一个槽中拥有一个算子的多个子任务吗？ 的相关文章

随机推荐

热门标签

在 Flink 中，我可以在同一个槽中拥有一个算子的多个子任务吗？的相关文章