流处理架构选型

2023-11-05

greenplum + flink 做流处理

从批处理ETL到流式处理：一个来自Netflix的案例 https://juejin.im/entry/5aa73ccd6fb9a028c81285cb

greenplum = oracle12C 分布式RDB。但是还是有局限性的。
flink、spark、storm

flink安装

docker run -t -p 8081:8081 flink local

greenplum安装

yum方式安装不行。200的python是3.0的，语法不兼容2.7
在docker中安装greenplum: 不可以，到处都是坑。

总结

弄flink要把kafka 和 kafka connector做一下，flink不能从rdb抽取数据的话，用kafka connector弄一下
https://www.confluent.io/blog/kafka-connect-deep-dive-jdbc-source-connector

greenplum-boot集成的问题

get url = null and ClassDriver = null
获取不到配置：

配置的默认mysql的Datasource没问题，
spring.datasource配置是有的

获取不到配置文件?
3.1 看jar的的classpath - 没有问题
3.2 看appalication.ps里缺配置 - 没有问题
3.3 这个默认的数据源失效，走的是greenplum的数据源。

默认数据源@Primary失效了??? 没有这种说法
深入Spring Boot：怎样排查expected single matching bean but found 2的异常
他只要配置了GreenplumDataSource数据源，就把他设置为默认的数据源了，事务也代替了mysql默认数据源了。 ??? 不知道为什么。

目前解决方案有2种: 
1.  如果着急使用，把ys.manufacture.framework.controller.GreenplumConfig类的@Configuration类去掉。  我目前采用这个方式解决报错问题。
2.  在各个项目的启动类上:   把GreenplumConfig类排除，
@ComponentScan( value = { "ys.manufacture.framework", "ys.manufacture.sousa"} ,
    excludeFilters = @ComponentScan.Filter(
        type = FilterType.ASSIGNABLE_TYPE,
        classes = {GreenplumConfig.class}
	)
)
这2种方式可能出现的问题:
    相当于没有整合Greenplum??

总结:

如果着急使用，把ys.manufacture.framework.controller.GreenplumConfig类的@Configuration类去掉。

参考资料

从批处理ETL到流式处理：一个来自Netflix的案例 - 后端 - 掘金
Install Greenplum OSS on Ubuntu _ Greenplum Database
Hadoop与GreenPlum该如何选择_ - Hadoop分布式数据分析平台-炼数成金-Dataguru专业数据分析社区
Greenplum和Deepgreen性能简单对比 - 闻术苑 - OSCHINA
GreenPlum 浅谈 - yongshenghuang的博客 - CSDN博客
Flink初探-为什么选择Flink - 简书
【大数据之数据仓库】GreenPlum PK DeepGreen（TPCH） - weixin_33860722的博客 - CSDN博客

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

架构

远舢智能

技术选型

greenplum

flink

流处理架构选型的相关文章

设备管理 USB ID

发现个USB ID站点对于做设备管理识别的小伙伴特别实用 http www linux usb org usb ids 附录 List of USB ID s Maintained by Stephen J Gowdy
pytorch低版本找到并安装torch_geometric对应版本

一找到官网的安装命令不同版本的torch geometric 对应的安装命令不完全一致因此我们需要首先找到所需torch geometric版本的正确安装命令然后再去找对应的版本目前torch geometric官网上只有pyto

随机推荐

Win10环境下CPU+GPU版本基于YOLOv5的行人检测研究（包括Anaconda安装超详细）

安装Anaconda 直达链接Anaconda 点击get started 点击Download Anaconda Installers 点击Download 然后保存执行文件即可开始安装Anaconda 双击执行文件 Anaconda3
Java中的“+“运算符

前言前面已经对各类运算符有了一个总的认知运算符用处很多一关于Java中的运算符 1 当两边确定都是数字的话一定是进行加法运算 2 当两边的数据是字符串 1个一定会进行字符串的连接运算并且连接过后运算结果一定还是一个字符
关于IP分片的一篇小论文

关键字 IP分片 MTU MSS 引言分片是分组交换的思想体现也是IP协议解决的两个主要问题之一在IP协议中的分片算法主要解决不同物理网络最大传输单元 MTU 的不同造成的传输问题但是分组在传输过程中不断地分片和重组会带来很大的工作
使用C语言操作环境变量

获取环境变量内容 char getenv char name 参数 name欲获取的环境变量名称返回值环境变量值 NULL表示没有找到环境变量设置环境变量 int putenv char string 参数 string环境变量字符串
linuxsed替换字符串后保存_字符串方法——replace()

1 字符串方法 replace str replace old new max 参数说明 Parameters old 被替换的字符串 new 新字符串替换原来的old字符串 max 可选参数替换不超过max次例子 Example s
什么是抖动?什么叫抖动

什么是抖动什么叫抖动抖动的定义是数字信号的各个有效瞬时对其当时的理想位置的短期性偏离这意味着抖动是不希望有的数字信号的相位调制相位偏离的频率称为抖动频率与抖动有密切关系的第二个参数称为漂移把它定义为数字信号的各个有效瞬间相对
[NOI Online #3 入门组 T3]买表【二进制优化dp背包】

题目链接很可惜的一点就是我正赛的时候好像把a和k看反了于是一直想不到如何做打了个暴力分现在想想暴力分也错了因为a和k真的很关键使得最后300变成200分人生第一场OI就这样草草结束或许这就是OI选手的刺激所在吧得亏我不
DDR工作原理

DDR SDRAM全称为Double Data Rate SDRAM 中文名为双倍数据流SDRAM DDR SDRAM在原有的SDRAM的基础上改进而来也正因为如此 DDR能够凭借着转产成本优势来打败昔日的对手RDRAM 成为当今的主流
csdn找到自己关注的人和关注自己的人-2021最新

前言 csdn找到自己关注的人和关注自己的人 2021最新入口 https my csdn net my follow 点进入以后是这样的就是没办法查找具体某个人
JDK、IDEA等安装详解

第一章计算机基础知识 1 2 计算机简介计算机俗称电脑是第二次世界战争时美国国防部利用它来进行弹道计算第一台通用计算机叫做 ENIAC 当时计算机是一个庞然大物用了18000个电子管占地170平方米重达30吨耗电功率约15
nginx七层代理和四层转发的理解

先来理解一下osi七层模型应用层应用层是ISO七层模型的最高层它直接与用户和应用程序交互提供用户与网络的接口它包括各种应用协议如HTTP FTP SMTP等用于实现特定应用的功能和通信表示层表示层负责数据的格式转换加密和
Introduction of moving block bootstrap （MBB）algorithm

Because we can not use usual bootstrap sampling method to get subsamples from time series dataset then the MBB was propo
软件测试人员的职业晋升之路

关于软件测试行业的职业发展方向在网络上总能看到各种各样的问题有关注零基础能不能入行的有关注25岁入行晚不晚的还有关注35岁后的职业发展方向的在此过程中看到很多行业大佬分享了自己的工作经验也给出了很多自己的建议要想在测试行业有
Ubuntu18.04 安装 TensorFlow (GPU)

重新在台式机上学习深度学习 Ubuntu18 04 Tensorflow gpu cuda8 0 cuDNN6 0 一准备工作有一些不是必需的 1 安装pip 打开终端输入命令 sudo apt get install python p
Netty实战（二）第一个Netty程序

第一个Netty程序一环境准备二 Netty 客户端服务器概览三编写 Echo 服务器 3 1 ChannelHandler 和业务逻辑 3 2 引导服务器四编写 Echo 客户端 4 1 通过 ChannelHandler
AI芯片学习小结4-谷歌TPU与脉动阵列

AI芯片学习小结4 谷歌TPU与脉动阵列文章 In Datacenter Performance Analysis of a Tensor Processing Unit 时间 2017 Reference 深入理解Google TPU的
STM32 局部数组使用过大溢出到全局影响代码运行

一问题在函数内定义局部数组大小为400 发现其影响了串口接收中断二原因通过动态调试得知其分配的局部数组地址与全局的串口结构体的空间部分重合造成了寄存器异常中断开启失败出现此原因在于分配的栈不够造成局部数组溢出占用全局空间如果
基站信号强度些问题

1 package myapplication com myjizhansj 2 3 import android content Context 4 import android graphics Color 5 import andro
服务器装win7无限重启吗,win7系统重装系统后无限重启电脑的解决方法

很多小伙伴都遇到过win7系统重装系统后无限重启电脑的困惑吧一些朋友看过网上零散的win7系统重装系统后无限重启电脑的处理方法并没有完完全全明白win7系统重装系统后无限重启电脑是如何解决的今天小编准备了简单的解决办法只需要按照1
流处理架构选型

greenplum flink 做流处理从批处理ETL到流式处理一个来自Netflix的案例 https juejin im entry 5aa73ccd6fb9a028c81285cb greenplum oracle12C 分布式R

热门标签