第 142 集:使用 Apache Airflow 协调大型和小型项目

2023-10-10

Real Python Podcast Episode #142 Title Artwork

第 142 集:使用 Apache Airflow 协调大型和小型项目

真正的 Python 播客

2023 年 1 月 27 日54m

RSS Apple Podcasts Google Podcasts Spotify
播客瘾君子 灰蒙蒙 袖珍铸件 投盒 缝合器 YouTube 下载MP3
Christopher Bailey
Host
Calvin Hendryx-Parker
Guest

您是否参与过需要编排工具的项目?如何使用 Python 定义整个数据管道或消息传递系统的工作流程?在本周的节目中,Calvin Hendryx-Parker 回来谈论如何使用 Apache Airflow 和编排 Python 项目。

剧集赞助商:

Calvin 是 Six Feet Up 的联合创始人兼首席技术官,也是 Python Web 会议的联合组织者。他最近正在进行一个大型项目,需要数千个涉及数据传输和转换的工作。通过对编排系统的研究,他发现了 Apache Airflow。

Airflow 是一个用于定义、安排和监控工作流程的开源工具。该平台是纯Python 的,并与多种服务集成。我们讨论如何通过创建有向无环图 (DAG) 来定义工作流。

Calvin 讲述了最近的一个项目如何超出系统的规模,以及他的团队如何使用 Python 构建一个聪明的解决方案。我们还讨论了即将举行的 Python Web 会议以及虚拟与会者的期望。

课程亮点: Python 基础知识:面向对象编程

在本视频课程中,您将了解 OOP,即面向对象编程。您将学习如何创建类、使用类创建新对象以及使用属性实例化类。

主题:

  • 00:00:00- 介绍
  • 00:02:24– 描述大数据管道
  • 00:04:38– 数据的格式是什么?
  • 00:06:04– 数据的存储格式是否发生了变化?
  • 00:09:34– 数据工程和描述源和目标
  • 00:11:29– Apache Airflow 编排和命中限制
  • 00:18:12– 赞助商:CData 软件
  • 00:18:54– DAG:有向无环图
  • 00:22:29– 流数据和其他工具选择
  • 00:25:38– 克服 DAG Factory 限制
  • 00:31:49– Airflow 的另一个行业示例
  • 00:34:24– 作为咨询寻找解决方案
  • 00:35:12– Airflow 是否有最小规模的项目?
  • 00:37:37– 姜戈在幕后
  • 00:38:31– 视频课程聚焦
  • 00:39:58– 2023 年 Python 网络会议
  • 00:44:24– 您即将举行会议演讲吗?
  • 00:45:53– 人们如何在线关注您的作品?
  • 00:46:52– Mariatta Wijaya 的 IndyPy 演讲
  • 00:48:01– Python 世界中你对什么感到兴奋?
  • 00:51:45– 接下来你想学什么?
  • 00:53:22- 谢谢,再见

显示链接:

  • Apache Airflow - 文档
  • 对于 DAG 工厂来说太大了吗? — 六英尺高
  • 有向无环图 - 维基百科
  • DAG — 气流文档
  • 在 Airflow 中动态生成 DAG - 天文学家文档
  • Data Lakehouse 架构和人工智能公司 - Databricks
  • 第 10 集:流行病中的 Python 求职 – 真正的 Python 播客
  • 第 124 集:与 Al Sweigart 一起探索 Python 中的递归 – 真正的 Python 播客
  • 递归之递归书
  • 第 61 集:像 Netflix 一样扩展数据科学和机器学习基础设施 – 真正的 Python 播客
  • IndyPy — 印第安纳州 Python 用户组
  • 为 Python 做贡献 - Mariatta Wijaya - Python 核心开发人员 - YouTube
  • 家庭助理
  • 阿尔托利亚 - MicroFreak
  • Arturia - 颜料
  • CalvinHP (@calvinhp@fosstodon.org) - Fosstodon
  • 卡尔文HP - Twitter
  • 六英尺高 - 博客
  • Python 网络会议 2023

鸣叫 分享 分享 电子邮件 类=“h4”>

通过这些课程提升您的 Python 技能:

« 浏览所有剧集

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

第 142 集:使用 Apache Airflow 协调大型和小型项目 的相关文章

随机推荐

  • 堆栈帧和堆栈跟踪

    A 栈帧代表单个函数调用 您可以将相互调用的函数可视化为彼此堆叠的虚拟框架 这堆数据结构实际上就是用来干这个的 当一个函数调用将其数据返回给调用者时 其堆栈帧将从堆栈中删除 添加和删 除新的堆栈帧 及其相关数据 直到最底部的堆栈帧 有时称为
  • 使用 .format() 方法格式化字符串

    这 format 方法是一种较新的格式化方法 应该优先于 样式格式 在本课程中 您将学习何时应该使用它 如何生成强大的格式字符串而不使简单的用例复杂化 以及如何将 int 变量格式化为十六进制字符串 gt gt gt gt gt gt He
  • 真正的 Python Slack 社区

    社区以及与其他 Python 达人的联系是 Real Python 的一个非常重要的方面 我们最受欢迎的社区功能是私人 Slack 社区 在这里您可以结识 Real Python 团队的其他学生和成员 要了解更多信息 请点击学习Python
  • 关于克劳迪娅·吴

    关于克劳迪娅 吴 Claudia 是一位狂热的 Pythonista 和 Real Python 贡献者 她是一名数据科学家 曾在多家专门从事信用和欺诈风险建模领域的科技初创公司工作 看看她网站欲了解更多出版物 克劳迪娅的教程 如何使用 P
  • Python 基础知识:数字和数学(概述)

    你不需要成为数学高手也能编程得好 事实是 很少 程序员需要了解的不仅仅是基本代数 当然 您需要了解多少数学取决于 您正在开发的应用程序 一般来说 数学水平要求 成为一名程序员的难度比你想象的要低 尽管数学和计算机编程的相关性不如 有些人可能
  • 站点连接检查器

    以下是您可以从中获得灵感的站点连接检查器示例 平命令 关于网络实用程序的维基百科文章 站点24x7 网站监控服务 以下是可用于构建站点连接检查器的资源 要求 一个优雅而简单的 Python HTTP 库 专为人类而构建 使用 Python
  • 使用 Flask 在 Web 上部署 Python 脚本

    您编写了一个令您引以为豪的 Python 脚本 现在您想向世界展示它 但how 大多数人不知道如何处理你的 py文件 将您的脚本转换为Python 网络应用程序是一个很好的解决方案 可以让您的代码可供广大受众使用 在本课程中 您将学习如何从
  • 继承和组合:Python OOP 指南(摘要)

    你探索过Python 中的继承和组合 您了解了继承和组合创建的关系类型 您还完成了一系列练习来了解如何在 Python 中实现继承和组合 在本课程中 您学习了如何 使用继承来表达是一个两个类之间的关系 评估继承关系是否正确 在Python中
  • 自定义数据类型

    当你通过一个目的到print 它使用以下方法将其转换为字符串str 功能 您可以创建一个 str 自定义对象上的方法来更改输出内容 class Person def init self name age self name name sel
  • Python 内部函数的基础知识

    以下是一些资源 可提供有关本课程所涵盖主题的更多信息 在 Python 中递归思考 真正的Python教程 Python 中的递归 简介 真正的Python教程
  • Python 中的条件语句 (if/elif/else)

    在本分步课程中 您将学习如何在 Python 中使用条件 if 语句 逐步掌握 if 语句 并了解如何在程序中编写复杂的决策代码 参加测验 通过我们的交互式 Python 条件语句 测验来测试您的知识 完成后 您将收到一个分数 以便您可以跟
  • 设置您的 Python CI 项目

    在本视频中 您将学习如何设置用于持续集成 CI 的 Python 项目 因此 创建了 GitHub 存储库 克隆了项目并实现了一些基本的库功能 这是calculator py示例代码中使用的文件 calculator py Calculat
  • ChatterBot:使用 Python 构建聊天机器人

    目录 演示 项目概况 先决条件 第 1 步 使用 Python ChatterBot 创建聊天机器人 第 2 步 开始训练您的聊天机器人 第 3 步 导出 WhatsApp 聊天记录 第 4 步 清理您的聊天导出 第 5 步 使用自定义数据
  • 进行日期和时间算术

    Python 标准库提供了timedelta班级用于表演加减在一个datetime目的 第三方库dateutil有更有用的方法来进行数学计算
  • 运行 Python 脚本

    作为 Python 开发人员需要培养的最重要技能之一是能够运行 Python 脚本和代码 这将是您了解代码是否按计划运行的唯一方法 这甚至是了解您的代码是否有效的唯一方法 本分步课程将指导您完成一系列运行 Python 脚本的方法 具体取决
  • 第 2 节审查

    该视频总结了有关装饰器的第 2 部分 您现在知道如何 创建简单的装饰器并将它们应用到函数中 通过使用应用语法糖 装饰你的功能的符号 重用装饰器并将它们导入到您的程序中 用参数修饰函数 从修饰函数返回值 对Python对象进行内省以及如何使用
  • 通过真正的 Python Slack 社区提升您的技能

    目录 享受生活 保持好奇心 提出问题并尊重他人 找到提问的最佳渠道 Spend Some Time Composing Your Questions 总结您的问题 为您的问题提供背景信息 提供一个最小的可重复示例 提供追溯 请勿交叉发帖 尝
  • 处理时区

    Python 3 9 在时区方面引入了重大变化 添加了zoneinfo数据库 在本课程中 您将学习如何使用ZoneInfo类将时区信息添加到datetime目的 您还将探索不一致的命名标准造成的复杂性 如果您想了解有关圣诞岛 基里蒂马蒂示例
  • PyCon Africa 2019(回顾)

    目录 PyCon Africa 发生了什么 主会议 穆斯塔法 西塞 人工智能产生积极影响的潜力 Meili Triantafyllidi 在柏林 PyLadies 工作 6 年的经验教训 Candy Tricia Khohliwe 网络虚拟
  • 第 142 集:使用 Apache Airflow 协调大型和小型项目

    第 142 集 使用 Apache Airflow 协调大型和小型项目 真正的 Python 播客 2023 年 1 月 27 日54m RSS Apple Podcasts Google Podcasts Spotify More 播客瘾