流处理架构选型

2023-11-05

greenplum + flink 做流处理

从批处理ETL到流式处理:一个来自Netflix的案例 https://juejin.im/entry/5aa73ccd6fb9a028c81285cb

greenplum = oracle12C 分布式RDB。 但是还是有局限性的。
flink、spark、storm

flink安装

docker run -t -p 8081:8081 flink local

greenplum安装

  • yum方式安装不行。200的python是3.0的,语法不兼容2.7
  • 在docker中安装greenplum: 不可以,到处都是坑。

总结

弄flink要把kafka 和 kafka connector做一下,flink不能从rdb抽取数据的话,用kafka connector弄一下
https://www.confluent.io/blog/kafka-connect-deep-dive-jdbc-source-connector

greenplum-boot集成的问题

  • get url = null and ClassDriver = null
    获取不到配置:
  1. 配置的默认mysql的Datasource没问题,
  2. spring.datasource配置是有的
  3. 获取不到配置文件?
    3.1 看jar的的classpath - 没有问题
    3.2 看appalication.ps里缺配置 - 没有问题
    3.3 这个默认的数据源失效,走的是greenplum的数据源。
    目前解决方案有2种: 
    1.  如果着急使用,把ys.manufacture.framework.controller.GreenplumConfig类的@Configuration类去掉。  我目前采用这个方式解决报错问题。
    2.  在各个项目的启动类上:   把GreenplumConfig类排除,
    @ComponentScan( value = { "ys.manufacture.framework", "ys.manufacture.sousa"} ,
        excludeFilters = @ComponentScan.Filter(
            type = FilterType.ASSIGNABLE_TYPE,
            classes = {GreenplumConfig.class}
    	)
    )
    这2种方式可能出现的问题:
        相当于没有整合Greenplum??
    

总结:

如果着急使用,把ys.manufacture.framework.controller.GreenplumConfig类的@Configuration类去掉。

参考资料

  • 从批处理ETL到流式处理:一个来自Netflix的案例 - 后端 - 掘金
  • Install Greenplum OSS on Ubuntu _ Greenplum Database
  • Hadoop与GreenPlum该如何选择_ - Hadoop分布式数据分析平台-炼数成金-Dataguru专业数据分析社区
  • Greenplum和Deepgreen性能简单对比 - 闻术苑 - OSCHINA
  • GreenPlum 浅谈 - yongshenghuang的博客 - CSDN博客
  • Flink初探-为什么选择Flink - 简书
  • 【大数据之数据仓库】GreenPlum PK DeepGreen(TPCH) - weixin_33860722的博客 - CSDN博客
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

流处理架构选型 的相关文章

  • 设备管理 USB ID

    发现个USB ID站点 对于做设备管理识别的小伙伴特别实用 http www linux usb org usb ids 附录 List of USB ID s Maintained by Stephen J Gowdy
  • pytorch低版本找到并安装torch_geometric对应版本

    一 找到官网的安装命令 不同版本的torch geometric 对应的安装命令不完全一致 因此我们需要首先找到所需torch geometric版本的正确安装命令 然后再去找对应的版本 目前torch geometric官网上只有pyto

随机推荐

  • Win10环境下CPU+GPU版本基于YOLOv5的行人检测研究(包括Anaconda安装超详细)

    安装Anaconda 直达链接Anaconda 点击get started 点击Download Anaconda Installers 点击Download 然后保存执行文件即可 开始安装Anaconda 双击执行文件 Anaconda3
  • Java中的“+“运算符

    前言 前面已经对各类运算符有了一个总的认知 运算符用处很多 一 关于Java中的 运算符 1 当 两边确定都是数字的话一定是进行加法运算 2 当 两边的数据是字符串 1个 一定会进行字符串的连接运算 并且连接过后运算结果一 定 还是一个字符
  • 关于IP分片的一篇小论文

    关键字 IP分片 MTU MSS 引言 分片是分组交换的思想体现 也是IP协议解决的两个主要问题之一 在IP协议中的分片算法主要解决不同物理网络最大传输单元 MTU 的不同造成的传输问题 但是分组在传输过程中不断地分片和重组会带来很大的工作
  • 使用C语言操作环境变量

    获取环境变量内容 char getenv char name 参数 name欲获取的环境变量名称 返回值 环境变量值 NULL表示没有找到环境变量 设置环境变量 int putenv char string 参数 string环境变量字符串
  • linuxsed替换字符串后保存_字符串方法——replace()

    1 字符串方法 replace str replace old new max 参数说明 Parameters old 被替换的字符串 new 新字符串 替换原来的old字符串 max 可选参数 替换不超过max次 例子 Example s
  • 什么是抖动?什么叫抖动

    什么是抖动 什么叫抖动 抖动的定义是 数字信号的各个有效瞬时对其当时的理想位置的短期性偏离 这意味着抖动是不希望有的数字信号的相位调制 相位偏离的频率称为抖动频率 与抖动有密切关系的第二个参数称为漂移 把它定义为 数字信号的各个有效瞬间相对
  • [NOI Online #3 入门组 T3]买表【二进制优化dp背包】

    题目链接 很可惜的一点就是 我正赛的时候好像把a和k看反了 于是一直想不到如何做 打了个暴力分 现在想想 暴力分也错了 因为a和k真的很关键 使得最后300变成200分 人生第一场OI就这样草草结束 或许这就是OI选手的刺激所在吧 得亏我不
  • DDR工作原理

    DDR SDRAM全称为Double Data Rate SDRAM 中文名为 双倍数据流SDRAM DDR SDRAM在原有的SDRAM的基础上改进而来 也正因为如此 DDR能够凭借着转产成本优势来打败昔日的对手RDRAM 成为当今的主流
  • csdn找到自己关注的人和关注自己的人-2021最新

    前言 csdn找到自己关注的人和关注自己的人 2021最新 入口 https my csdn net my follow 点进入以后是这样的 就是没办法查找具体某个人
  • JDK、IDEA等安装详解

    第一章 计算机基础知识 1 2 计算机简介 计算机俗称电脑 是第二次世界战争时 美国国防部利用它来进行弹道计算 第一台通用计算机叫做 ENIAC 当时计算机是一个庞然大物 用了18000个电子管 占地170平方米 重达30吨 耗电功率约15
  • nginx七层代理和四层转发的理解

    先来理解一下osi七层模型 应用层 应用层是ISO七层模型的最高层 它直接与用户和应用程序交互 提供用户与网络的接口 它包括各种应用协议 如HTTP FTP SMTP等 用于实现特定应用的功能和通信 表示层 表示层负责数据的格式转换 加密和
  • Introduction of moving block bootstrap (MBB)algorithm

    Because we can not use usual bootstrap sampling method to get subsamples from time series dataset then the MBB was propo
  • 软件测试人员的职业晋升之路

    关于软件测试行业的职业发展方向 在网络上总能看到各种各样的问题 有关注零基础能不能入行的 有关注25岁入行晚不晚的 还有关注35岁后的职业发展方向的 在此过程中 看到很多行业大佬分享了自己的工作经验 也给出了很多自己的建议 要想在测试行业有
  • Ubuntu18.04 安装 TensorFlow (GPU)

    重新在台式机上学习深度学习 Ubuntu18 04 Tensorflow gpu cuda8 0 cuDNN6 0 一 准备工作 有一些不是必需的 1 安装pip 打开终端输入命令 sudo apt get install python p
  • Netty实战(二)第一个Netty程序

    第一个Netty程序 一 环境准备 二 Netty 客户端 服务器概览 三 编写 Echo 服务器 3 1 ChannelHandler 和业务逻辑 3 2 引导服务器 四 编写 Echo 客户端 4 1 通过 ChannelHandler
  • AI芯片学习小结4-谷歌TPU与脉动阵列

    AI芯片学习小结4 谷歌TPU与脉动阵列 文章 In Datacenter Performance Analysis of a Tensor Processing Unit 时间 2017 Reference 深入理解Google TPU的
  • STM32 局部数组使用过大溢出到全局影响代码运行

    一 问题 在函数内定义局部数组大小为400 发现其影响了串口接收中断 二 原因 通过动态调试得知 其分配的局部数组地址与全局的串口结构体的空间部分重合造成了寄存器异常中断开启失败 出现此原因在于分配的栈不够造成局部数组溢出占用全局空间 如果
  • 基站信号强度些问题

    1 package myapplication com myjizhansj 2 3 import android content Context 4 import android graphics Color 5 import andro
  • 服务器装win7无限重启吗,win7系统重装系统后无限重启电脑的解决方法

    很多小伙伴都遇到过win7系统重装系统后无限重启电脑的困惑吧 一些朋友看过网上零散的win7系统重装系统后无限重启电脑的处理方法 并没有完完全全明白win7系统重装系统后无限重启电脑是如何解决的 今天小编准备了简单的解决办法 只需要按照1
  • 流处理架构选型

    greenplum flink 做流处理 从批处理ETL到流式处理 一个来自Netflix的案例 https juejin im entry 5aa73ccd6fb9a028c81285cb greenplum oracle12C 分布式R