Flink 核心编程(二) Source

2023-05-16

在这里插入图片描述
Flink框架可以从不同的来源获取数据，将数据提交给框架进行处理, 我们将获取数据的来源称之为数据源(Source)。

从java的集合中读取数据

一般情况下，可以将数据临时存储到内存中，形成特殊的数据结构后，作为数据源使用。这里的数据结构采用集合类型是比较普遍的。

//1.创建流环境
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
//2.创建集合
List<WaterSensor> waterSensors = Arrays.asList(new WaterSensor("ws_001", 1577844001L, 45),
	                                           new WaterSensor("ws_002", 1577844015L, 43),
	                                           new WaterSensor("ws_003", 1577844020L, 42));
//3.读取集合中数据并打印
env.fromCollection(waterSensors).print();
	        
env.execute();

从文件读取数据

1.参数可以是目录也可以是文件
2.路径可以是相对路径也可以是绝对路径
3.相对路径是从系统属性user.dir获取路径: idea下是project的根目录, standalone模式下是集群节点根目录
4.也可以从hdfs目录下读取, 使用路径:hdfs://…, 由于Flink没有提供hadoop相关依赖, 需要pom中添加相关依赖:

<dependency>
    <groupId>org.apache.hadoop</groupId>
    <artifactId>hadoop-client</artifactId>
    <version>3.1.3</version>
</dependency>

StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
env.readTextFile("data\\log4j.properties").print();
env.execute();

从网络Socket流中读取数据

StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
env.socketTextStream("linux01",9999);
env.execute();

从Kafka读取数据

添加相应的依赖

<dependency>
    <groupId>org.apache.flink</groupId>
    <artifactId>flink-connector-kafka_2.11</artifactId>
    <version>1.11.2</version>
</dependency>

StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
Properties properties = new Properties();
properties.setProperty("bootstrap.servers", "linux01:9092,linux02:9092,linux03:9092");
properties.setProperty("group.id", "test");
properties.setProperty("auto.offset.reset", "latest");
properties.setProperty("isolation.level", "read_committed");
DataStreamSource<String> topicDS = env.addSource(new FlinkKafkaConsumer<>("topic", new SimpleStringSchema(), properties));
topicDS.print();
env.execute();

自定义Source

大多数情况下，前面的数据源已经能够满足需要，但是难免会存在特殊情况的场合，所以flink也提供了能自定义数据源的方式.

import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.functions.source.SourceFunction;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.Socket;
import java.nio.charset.StandardCharsets;

public class Demo {
    public static void main(String[] args) throws Exception {
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.addSource(new MySource("linux01", 9999));
        env.execute();
    }

    //从Socket读取数据的source并封装成WaterSensor对象
    public static class MySource implements SourceFunction<WaterSensor> {
        private final String host;
        private final int port;
        private boolean cancel;
        private Socket socket;
        private BufferedReader bufferedReader;

        public MySource(String host, int port) {
            this.host = host;
            this.port = port;
        }

        //实现数据获取逻辑，并可以通过传入的参数ctx进行向下游节点的数据转发
        @Override
        public void run(SourceContext<WaterSensor> sourceContext) throws Exception {
            socket = new Socket(host, port);
            bufferedReader = new BufferedReader(new InputStreamReader(socket.getInputStream(), StandardCharsets.UTF_8));
            String line = bufferedReader.readLine();
            while (line != null) {
                String[] split = line.split(",");
                sourceContext.collect(new WaterSensor(split[0], Long.valueOf(split[1]), Integer.valueOf(split[2])));
                line = bufferedReader.readLine();
            }
        }

        //用来取消数据源，一般在run方法中，会存在一个循环来持续产生数据，cancel方法则可以使该循环终止
        @Override
        public void cancel() {
            cancel = true;
            if (bufferedReader != null) {
                try {
                    bufferedReader.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
            if (socket != null) {
                try {
                    socket.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }
    }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

flink

Source

核心编程

Flink 核心编程(二) Source 的相关文章

大数据架构图

大数据管理数据处理过程图大数据 big data 指无法在一定时间范围内用常规软件工具进行捕捉管理和处理的数据集合是需要新处理模式才能具有更强的决策力洞察力大数据处理的主要流程包括数据收集数据存储数据处理数据应用等主要环节

随机推荐

hutool定时器的使用封装

启动定时器建议在main 入口放置支持秒级别定时任务 CronUtil setMatchSecond true 启动 CronUtil start 使用deamon模式 xff0c CronUtil start true 轮子 impo
网络拓扑架构图

阿里云应用网络拓扑图云应用网络架构是指建立在可编程的基础设施之上基于统一的运行管理平台按需的分配资源的网络架构云网络架构在物理链路主机网络网关控制器四个纬度上全面升级大大提高了整体网络性能公司办公网络拓扑图对于很多大型
Kubernetes(K8S)中文文档

Kubernetes K8S 中文文档前言Kubernetes是什么互动教程 Kubernetes 基础概述使用Minikube 部署 Kubernetes 集群使用 kubectl 创建 DeploymentKubernetes 中浏
ASCII纯文本绘制流程图

我们使用纯文本写代码 xff0c 有了Markdown又可以使用纯文本写文档 xff0c 那么图片 xff0c 能不能使用纯文本描述呢 xff1f Text Flow是什么 xff1f Text Flow xff1a 一个强大的在线ASCI
ioDraw - 超好用的在线白板，能够手绘各种流程图、架构图

今天 xff0c 推荐给大家的是一款超级好用的在线绘图工具 xff0c ioDraw在线白板关于 ioDraw在线白板一款非常轻量的在线白板工具 xff0c 可以直接在浏览器打开 xff0c 轻松绘制具有手绘风格的图形比如可以绘制这样
ioDraw - 免费的在线图表制作工具

介绍 xff1a ioDraw是一款数据可视化图表库 xff0c 提供直观 xff0c 生动 xff0c 可交互 xff0c 可个性化定制的数据可视化图表 xff0c 支持折线图柱状图饼图散点图等地址 xff1a https www
在线流程图绘制工具测评-ioDraw

对于产品经理和程序员而言 xff0c 流程图制作工具绝对是刚需 xff0c 比起流程图制作软件 xff0c 我更喜欢在线工具今天跟大家分享一个好用的流程图在线制作工具 ioDraw xff0c 他是免费的且简单易上手 xff0c 功能强
一款免费好用的代码在线比较工具

在线代码对比工具 xff08 码工具 xff09 是一款免费的在线文本对比工具 xff0c 无需注册 xff0c 可以在线对两段文本进行对比 xff0c 检测比较两个文本有什么不同的差异 xff0c 以便修改 xff0c 常用于程序代码
LTE学习笔记之接口协议

LTE 接口协议三层两面三层两面空中接口UuL2功能模块用户面控制面 L3功能模块 xff08 控制面 xff09 RRC模块1 系统信息广播2 寻呼3 RRC连接管理4 无线资源控制5 移动性管理NAS信令地面接口同级接口 X2用户
从零开始构建gRPC的Go服务

介绍 Protocol Buffers and gRPC是用于定义通过网络有效通信的微服务的流行技术许多公司在Go中构建gRPC微服务 xff0c 发布了他们开发的框架 xff0c 本文将从gRPC入门开始 xff0c 一步一步构建一个g
在Spring Boot上启用HTTPS

折腾了很久 xff0c 最新教程一获取免费证书怎么申请不做教程 xff1b 下载证书 xff1a 一定要下载jks的二配置springboot 将下载下来的jks文件放进这里 xff1a 然后就是yml文件配置 xff1a key
操作系统整体思路把握

操作系统定义及功能硬件资源管理处理机存储设备文件和用户服务现代操作系统比早期阶段操作系统区别在于有了进程管理多道程序设计的基础虚拟机观点裸机 gt 操作系统的形成过程台人工操作阶段 lt 纸带输入数据 xff0c 人工
《计算机组成与系统结构（第二版）裘雪红李伯成西安电子科技大学出版社》课后习题答案（带解析）（二）

声明 xff1a 此系列答案配套计算机组成与系统结构 xff08 第二版 xff09 裘雪红李伯成西安电子科技大学出版社一书相关内容所有内容为博主个人编辑 xff0c 仅作参考学习交流之用 xff0c 转载请注明出处如发现错误
《计算机组成与系统结构（第二版）裘雪红李伯成西安电子科技大学出版社》课后习题答案（带解析）（三）

声明 xff1a 此系列答案配套计算机组成与系统结构 xff08 第二版 xff09 裘雪红李伯成西安电子科技大学出版社一书相关内容所有内容为博主个人编辑 xff0c 仅作参考学习交流之用 xff0c 转载请注明出处如发现错误
《计算机组成与系统结构（第二版）裘雪红李伯成西安电子科技大学出版社》课后习题答案（带解析）（四）

声明 xff1a 此系列答案配套计算机组成与系统结构 xff08 第二版 xff09 裘雪红李伯成西安电子科技大学出版社一书相关内容所有内容为博主个人编辑 xff0c 仅作参考学习交流之用 xff0c 转载请注明出处如发现错误
《计算机组成与系统结构（第二版）裘雪红李伯成西安电子科技大学出版社》课后习题答案（带解析）（五）

声明 xff1a 此系列答案配套计算机组成与系统结构 xff08 第二版 xff09 裘雪红李伯成西安电子科技大学出版社一书相关内容所有内容为博主个人编辑 xff0c 仅作参考学习交流之用 xff0c 转载请注明出处如发现错误
《计算机组成与系统结构（第二版）裘雪红李伯成西安电子科技大学出版社》课后习题答案（带解析）（六）

声明 xff1a 此系列答案配套计算机组成与系统结构 xff08 第二版 xff09 裘雪红李伯成西安电子科技大学出版社一书相关内容所有内容为博主个人编辑 xff0c 仅作参考学习交流之用 xff0c 转载请注明出处如发现错误
《计算机组成与系统结构（第二版）裘雪红李伯成西安电子科技大学出版社》课后习题答案（带解析）（七）

声明 xff1a 此系列答案配套计算机组成与系统结构 xff08 第二版 xff09 裘雪红李伯成西安电子科技大学出版社一书相关内容所有内容为博主个人编辑 xff0c 仅作参考学习交流之用 xff0c 转载请注明出处如发现错误
《计算机组成与系统结构（第二版）裘雪红李伯成西安电子科技大学出版社》课后习题答案（带解析）（八）

声明 xff1a 此系列答案配套计算机组成与系统结构 xff08 第二版 xff09 裘雪红李伯成西安电子科技大学出版社一书相关内容所有内容为博主个人编辑 xff0c 仅作参考学习交流之用 xff0c 转载请注明出处如发现错误
Flink 核心编程(二) Source

Flink框架可以从不同的来源获取数据 xff0c 将数据提交给框架进行处理我们将获取数据的来源称之为数据源 Source 从java的集合中读取数据一般情况下 xff0c 可以将数据临时存储到内存中 xff0c 形成特殊的数据结构后

Flink 核心编程(二) Source

Flink 核心编程(二) Source 的相关文章

随机推荐

热门标签