Azkaban的囚徒——Azkaban运行模式和流

2023-10-27

Azkaban运行模式

在3.x版本里,提供了3种运行模式

  • the stand alone “solo-server” mode standalone模式
  • the heavier weight two server mode 两个server的模式
  • distributed multiple-executor mode 分布式(多个executor的模式)

solo server mode
采用的DB是H2,而web server和executor server都在同一个进程中运行。
应用于小规模的用例。
two server mode
应用于生产环境,采用的DB是MySQL,master-slave模式。
web server和executor server在不同的进程中运行,因此升级和维护不会影响用户。
multiple executor mode
应用于生产环境(分布式),采用的DB是MySQL,master-slave模式。
web server和executor server在不同的主机上运行,因此升级和维护不应该影响用户。
该模式为Azkaban带来了健壮和可伸缩的性能。

上一节我们已经介绍过了 solo server mode,在此不做介绍。

集群部署详见https://blog.csdn.net/huohuotu/article/details/77487007

Azkaban运行

首先登陆8081端口的页面,然后创建项目(create project 右上角)。
在这里插入图片描述
创建完成后,进入项目如下所示:
在这里插入图片描述
右上角有个upload,需要上传azkaban的流,流的写法如下。

Azkaban 流

流有两种写法。


  • .flow写法:

在文件夹里创建一个叫flow20.project的文件,里面写入:azkaban-flow-version: 2.0
在文件夹里创建一个叫basic.flow的文件,里面写入:

nodes:
  - name: craw
    type: command
    config:
      command: echo "LeesangHyuk No.1."

将这个文件夹打包zip上传到之前的网页运行即可。


  • .job写法

在文件夹里创建一个叫craw.job的文件,里面写入:

type=command
command=echo  "LeesangHyuk No.1."

将这个文件夹打包zip上传到之前的网页运行即可。

上传后,如下图所示
在这里插入图片描述
Permissions可以修改用户权限(其他功能在此不做赘述)。
点击execute flow。
在这里插入图片描述
然后点击右下角execute即可,运行后,可以查看运行历史。
在这里插入图片描述

另外Schedule里面可以设置定时运行,设置方法与crontab一样。

Job Dependency


  • .flow版本
nodes:
  - name: jobC
    type: noop
    # jobC depends on jobA and jobB
    dependsOn:
      - jobA
      - jobB

  - name: jobA
    type: command
    config:
      command: echo "This is an echoed text."

  - name: jobB
    type: command
    config:
      command: pwd

  • .job版本

需要创建多个job文件,并且dependencies的名字和xxx.job的名字相同

type=command
#需要配置好hadoop命令,建议编写到shell中,可以后期维护
command=hadoop fs -put /data/*
#多个依赖用逗号隔开
dependencies=o2o_get_file_ftp1,o2o_get_file_ftp2
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Azkaban的囚徒——Azkaban运行模式和流 的相关文章

  • Redis——初识Redis

    Redis简介 Redis的数据结构致力于帮助用户解决问题 而不是像关系型数据库那样 要求用户扭曲问题来适应数据库 除此之外 通过复制 持久化和客户端分片 client side sharding 等特性 用户可以很方便的将Redis扩展成
  • 【redis】Redis cluster是AP架构还是CP架构?

    最近刚好在看CAP理论 加上之前分析的redis cluster 就在想redis的cluster是什么模式的 AP还是CP 首先还是简单讲下CAP 具体的可见 CAP分别是 强一致性 Consistency 可用性 Availabilit
  • k8s-多节点部署efk-dial tcp 172.20.2.134:5601: getsockopt: connection refused

    异常信息 Error dial tcp 172 20 0 145 5601 getsockopt connection refused Trying to reach http 172 20 0 145 5601 分析 部署好efk后 通过
  • Dubbo——快速启动(2)

    快速启动 Dubbo 采用全 Spring 配置方式 透明化接入应用 对应用没有任何 API 侵入 只需用 Spring 加载 Dubbo 的配置即可 Dubbo 基于 Spring 的 Schema 扩展 进行加载 mvn
  • Distributed Database System —— Multi-raft协议介绍

    文章目录 Multi Raft协议 Multi Raft需要解决的问题 Multi Raft实现细节 Cockroach Multi Raft Raft Consistency of Range Replicas Range Leaders
  • Azkaban源码阅读之CachingFlowManager

    CachingFlowManager这部分为Azkaban在管理job中cache管理这一部分 public CachingFlowManager FlowManager baseManager final int cacheSize th
  • Java大数据基础——day01

    大家好 自我介绍一下 我是接下来带大家超神的建哥 睁开大眼 看好了联系方式 18935466019 联系邮箱 zhangjianios 163 com QQ 343438569 在接下来的时间 会带大家走入新的旅程 Java 学习大数据之前
  • Spark一路火花带闪电——Spark底层原理介绍

    文章目录 Spark计算引擎原理 1 1 术语 1 1 1 Application Spark应用程序 1 1 2 Driver 驱动程序 1 1 3 Cluster Manager 资源管理器 1 1 4 Executor 执行器 1 1
  • 基于Spring Cloud Alibaba 分布式微服务高并发数据平台化(中台)思想+多租户saas企业开发架构技术选型和设计方案

    基于Spring Cloud Alibaba 分布式微服务高并发数据平台化 中台 思想 多租户saas设计的企业开发架构 支持源码二次开发 支持其他业务系统集成 集中式应用权限管理 支持拓展其他任意子项目 架构源码可以加我WX haiwab
  • 分布式系统之Raft算法

    介绍 Raft是一种为了管理日志复制的分布式一致性算法 Raft 出现之前 Paxos 一直是分布式一致性算法的标准 Paxos 难以理解 更难以实现 Raft 的设计目标是简化 Paxos 使得算法既容易理解 也容易实现 Paxos 和
  • 数据库架构演变过程

    背景 在互联网初创时期 企业往往采用单体架构去搭建自己的应用系统 但是 随着企业的不断壮大 系统访问量不断随之上升 数据量也急剧增长 数据的存储是首先要解决的问题 在这个大数据时代 数据就是企业的命根子 数据库的单体架构很难满足数据的存储
  • Hadoop是小象——Hadoop集群安装配置

    文章目录 所需软件 集群网络配置 集群SSH免密登陆设置 Hadoop安装配置 所需软件 Linux所需软件包括 JavaTM1 5 x 必须安装 建议选择Sun公司发行的Java版本 以前安装过 ssh 必须安装并且保证 sshd一直运行
  • Azkaban

    文章目录 前言 一 Azkaban是什么 二 Azkaban与其他的工作流调度系统 1 简单的任务调度系统 2 复杂的任务调度 三 Azkaban架构 四 Azkaban配置 basic flow 基础配置 basic flow条件工作流
  • 几张架构图阐述微服务架构治理相关知识点

    微服务架构的技术点 超时时间设置 接口重试机制 流量QPS限流 请求熔断处理 请求降级处理 今天给大家分享一下以上相关的知识点 通过微服务系统之间RPC通信的方式 以架构图的形式给大家展开介绍 1 超时时间设置 应用访问业务系统A 业务系统
  • Distributed Database System —— Mysql Binlog不止是主从同步

    文章目录 引入 Binlog应用场景 读写分离 数据恢复 保证数据最终一致性 异地多活 引入 Mysql 5 0以后 支持通过binary log 二进制日志 以支持主从复制 复制允许将来自一个MySQL数据库服务器 master 的数据复
  • 伸缩自如的ElasticSearch——文档CRUD操作

    文章目录 文档 文档元数据 index type id 取文档 更新文档 创建文档 删除文档 处理冲突 文档 在大多数应用中 多数实体或对象可以被序列化为包含键值对的 JSON 对象 一个 键 可以是一个字段或字段的名称 一个 值 可以是一
  • Elasticsearch使用教程

    下载ES elasticsearch的下载地址 https www elastic co cn downloads elasticsearch ik分词器的下载地址 https github com medcl elasticsearch
  • docker 安装 mysql (windows版本)

    docker 安装 mysql windows版本 1 下载 MySQL 社区版映像 运行以下命令 docker pull mysql mysql server 5 7 2 启动Docker容器 请使用以下命令 docker run nam
  • Distributed System Transaction —— 2PL

    文章目录 2PL 并发控制常见的方式有2PL MVCC等方式 2PL 两阶段锁 two phase locking 是用来解决多线程之间的竞态条件的 其算法非常简单 数据库中的每一个数据对象都有两种锁 S hared lock 和 e X
  • 大数据基础

    1 HDFS 1 HDFS为什么不适合存储大量小文件 答 1 大量文件的元数据占用NameNode大量内存空间 2 磁盘寻道时间超过读取时间 2 HDFS 何时离开安全模式 答 ActiveNameNode启动时HDFS进入安全模式只读 d

随机推荐

  • Nssm 安装Window服务

    环境 Wind10 1 下载nssm exe 官网 http nssm cc download 2 解压 根据操作系统选择32位或64位nssm 在该目录启动命令行窗口 3 服务注册 命令行输入 nssm exe install XX或者n
  • 在CentOS7上安装RabbitMQ(RPM安装方式)

    首先需要安装erlang 参考 http fedoraproject org wiki EPEL FAQ howtouse rpm Uvh https download fedoraproject org pub epel epel rel
  • SQL命令笔记

    sql中的排序倒序 排序采用 order by 子句 order by 后面跟上排序字段 排序字段可以放多个 多个采用逗号间隔 order by默认采用升序 asc 如果存在 where 子句 那么 order by 必须放到where 语
  • 使用VS配置OCCI环境

    一 配置方法 1 准备好occi的两个配置文件sdk与basic 之后将VS内的设置环境为release x64 2 c c 常规 附加库包含目录 F programmsoftware occi instantclient sdk wind
  • IDEA插件之 时序图 -- Sequence Diagram

    安装插件 使用 在方法上右击选择 Sequence Diagram 设置参数 可在控制台内查看时序图结果
  • 【数据结构与算法】树状数组

    Fenwick Tree 树状数组 Binary Indexed Tree 又称 Fenwick Tree 是一种基于数组实现的数据结构 用于高效地动态维护前缀和 树状数组可以在 O log n
  • uni-app 高度自适应

    方法一已知固定高度 注意 scrollH 初始值不等大于最终显示的高度 如果封装组件 onReady onLoad 获取可视区域高度 减去固定高度 uni getSystemInfo success res gt this scrollH
  • nacos--基础--1.2--理论--概念

    nacos 基础 1 2 理论 概念 1 地域 物理的数据中心 资源创建成功后不能更换 2 可用区 同一地域内 电力和网络互相独立的物理区域 同一可用区内 实例的网络延迟较低 3 接入点 地域的某个服务的入口域名 4 命名空间 用于进行租户
  • 国外程序员的BASIC情结——我的编程生涯始于BASIC

    关于BASIC Edsger Dijkstra曾经说过这么一段话 那些已经学过BASIC的学生是不可教化的 再去教他们优秀的编程风格注定徒劳无功 他们已经脑残 再生无望 成不了优秀的程序员 BASIC是Beginner sAll purpo
  • 如何正确使用QTcpSocket的readyRead信号?

    一 问题描述 你之所以会来看我这篇文章 大概是遇到了一下几个问题 1 使用QTcpSocket时 readyread函数没有触发 或者触发了 但是触发次数不是自己想象的那样 2 readyread槽函数中 接收到的数据不对 我们先看一下Qt
  • hashmap为什么用红黑树_关于HashMap的实现,一篇文章带你彻底搞懂,再也不用担心被欺负

    推荐学习 刷透近200道数据结构与算法 成功加冕 题王 挤进梦中的字节 面试官杠上Spring是种什么体验 莫慌 送你一套面试 大纲 源码 前言 在介绍HashMap之前先了解一个别的东西 红黑树 这边提前声明下 发布文章的时候没太注意 有
  • vue当前(路由)页面跳转当前(路由)页面,刷新数据

    最近呢 总是踩坑 就是那种今天我写了代码 但是吧一直报错 然后明天再写就对了 咱也不知道是为啥 咱也不知道是咋回事 只能说萌新小白在线吃菜 言归正传 最近写了一个商品详情页 在当前商品详情页 还可以跳到另一个商品的详情页 也就是改变参数 当
  • kudu : 扩容报错 Bad status: Not found: Unable to initialize catalog manager

    文章目录 1 美图 2 背景 1 美图 2 背景 kudu 原本只有一个master 和一个 tableServer 现在我想扩容成3个master 3个tableServer 然后报错了 错误信息如下
  • C++递推经典案例No.1——青蛙跳台问题

    一只青蛙一次可以跳上1级台阶 也可以跳上2级台阶 求该青蛙跳上一个 n 级的台阶总共有多少种跳法 这是一个经典的递归 动态规划的例题 代码部分并不难 关键是要理清思路 由于每次可以跳1个或者两个 所以跳到当前台阶的来源只有两种 下一个和下两
  • Android Studio 修改AVD模拟器文件默认存储路径

    AndroidStudio默认的模拟器文件路径为 C Users 用户名 android avd路径 通常windows系统上 C盘不是太大 而avd文件却不小 通常几个GB 所以有必要将avd路径换到一个非系统盘 更换方法如下 Help
  • sql 列名无效

    在SQLServer2008中 当设计 修改 表结构之后 再用SQL语句时 列名会显示无效 但执行可以通过 如下图 原因是SQL Server的intellisense 智能感知功能 需要重新整理一下 用快捷键Ctrl Shift R即可
  • YOLO:使用cv旋转图片,绘制最小矩形框,生成txt数据集,可用于yolo训练模型

    目录 一 前期的目录准备 二 代码部分需要用到的cv函数 三 cv部分函数参数详情 四 旋转方式 五 代码部分 六 代码完整版 一 前期的目录准备 创建一个名为rice的目录 在此下创建arborio basmati等五类米的子目录 并且分
  • (Android版)AR 现实增强 高通 Vuforia QCAR SDK环境搭建

    1 下载高通SDK 高通刚刚才更新开发中心地址 版本更新为V2 0 https developer vuforia com resources sdk android 下载对应系统的安装程序 下载完成后 你就下一步下一步安装吧 2 编译QC
  • Zotero使用

    zotero使用 实验平台 Zotero安装 导入文献到Zotero 设置PDF文件保存位置 Zotfile插件安装 Zotero文献同步 在Zotero中导入PDF翻译插件 参考文献 实验平台 Windows10 Mac平台有些设置的名字
  • Azkaban的囚徒——Azkaban运行模式和流

    文章目录 Azkaban运行模式 Azkaban运行 Azkaban 流 Job Dependency Azkaban运行模式 在3 x版本里 提供了3种运行模式 the stand alone solo server mode stand