数据中台产品【数据服务中心】【含代码说明等】

2023-11-12




链接: https://pan.baidu.com/s/1_WNnt690-WWf8BX8uvNaKw 提取码: uscr

DataCenter

Todo:
 

  •     CDH, hbase,zk 部署和配置。代码发布。
  •     presto , redis集群,cachecloud 部署。
  •     Hive 开发的流程。 azkaban安装部署。
  •     Doubble 服务安装部署。
  •     MySQL的在模块里的配置。


Plan:
 

  •     3月底代码整体提交,做一次部署测试发现问题。 3月底验证可部署性。
  •     4月份提供可以使用的一个版本。 4月底验证可使用性。
  •     5,6月份主要是做一些二次开发,使得像一个真正的产品。 6月底验证产品完整性。


项目说明

项目整体架构
数据服务中心管理了所有业务服务的数据访问,业务层对外提供的是dubbo接口或Rest风格接口,路由网关负责对外接口的管理,是的web应用或其他三方应用的访问具有可控性

avatar
big-cbr(报表系统)

数据报表系统,报表元数据存储在数据库,可以通过前端进行动态配置报表的样式和数据查询功能
big-dbms(数据库管理系统)

可以理解它为’一个超级大的数据访问层’,在整个项目中承担了所有数据访问的工作,
big-dbms-server(数据查询服务系统)

提供数据的查询功能,可集成数据源有:mysql,hive,presto
big-gateway(服务网关)

所有对外服务接口api(dubbo,http)管理中心,可配置api的超时,权限,重试次数
big-msg(消息推送 提醒)

公司内部模块(考虑删除)
big-whtc(数仓配置服务)

提供数仓的基本任务配置功能,提供datax的配置
bigdata-interface(模块的对外服务接口)

所有模块间的调用接口信息
bigdata-parent(父工程)

包含了所有基础框架 详情

部署顺序
一、部署安装前置依赖服务
1、安装部署zookeeper

网上资料较多,不在赘述

2、安装部署nacos

1). 下载地址:https://github.com/alibaba/nacos/releases  
2). 解压 nacos-server-1.0.0-RC1.tar.gz
    目录结构:   
    |---nacos  
    |------|---bin  
    |------|---conf  
    |------|---data  
    |------|---plugins  
    |------|---target  
3). 创建数据库:nacos-config,在将nacos/conf/nacos-mysql.sql sql中的表数据刷入nacos-config中
4). 修改nacos/conf/application.properties
    在文件末尾添加以下类容
   
    db.num=1
    db.url.0=jdbc:mysql://188.188.22.165:3306/nacos_config?characterEncoding=utf8&connectTimeout=1000&socketTimeout=3000&autoReconnect=true
    db.user=root
    db.password=123

注意:将数据库连接改一下
5). 启动nacos
进入nacos/bin目录,执行startup.sh 或startup.cmd
6). 打开web页面
    地址: 127.0.0.1:8848/nacos   
    用户名:nacos  密码: nacos

3、安装部署sentinel
 

  •     主要是安装一个控制台,实时接受服务传来的运行参数,以及实时更改或配置一些限流策略


1)、下载
https://github.com/alibaba/Sentinel/releases  
选择sentinel-dashboard-1.5.0.jar 下载
2)、安装部署
执行以下命令即可  
java -jar sentinel-dashboard-1.5.0.jar
3)、访问web页面
默认端口是8080: 127.0.0.1:8080

4、安装部署cachecloud

此处有两种部署方式:
方式一、可以根据官方文档进行部署admin控制台
部署文档

方式二、以下是源码部署

1)、刷入sql
在script文件夹中有cachecloud.sql 文件,新建数据库(cache_cloud),将sql中的数据刷入该库中

2)、 修改配置
进入cachecloud/cachecloud-open-web/src/main/swap文件夹可以看到两个文件
local.properties(开发环境的配置文件)
online.properties(生产环境的配置文件)
*注:主要修改其中的数据库连接信息

2)、编译源码
进入cachecloud
mvn clean install
进入cachecloud/cachecloud-open-web 执行:
mvn clean package -Plocal # 开发环境
mvn clean package -Ponline # 生产环境

3)、部署
进入cachecloud/cachecloud-open-web/target下;找到cachecloud-open-web-1.0-SNAPSHOT.war
进入cachecloud/script下找到start.sh
mkdir -p /opt/cachecloud-web/logs
将cachecloud-open-web-1.0-SNAPSHOT.war和start.sh 一起复制到指定的发布目录/opt/cachecloud-web下
*注:目录权限要保证(推荐使用一个新用户,而不是root)

4)、启动
chmod +x start.sh
./start.sh  #直接启动

5)、验证
127.0.0.1:9999 (开发环境)
127.0.0.1:8585 (生产环境)
用户名:admin
默认密码:admin

二、部署bigdata-parent

因为此项目是其他项目的依赖,所以需要最先部署

cd path/to/bigdata-parent
mvn clean install

部署数据服务中心项目:https://github.com/sevenfang/DataCenter

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

数据中台产品【数据服务中心】【含代码说明等】 的相关文章

  • 数据仓库建设及数据治理总结

    在谈数仓之前 先来看下面几个问题 数仓为什么要分层 用空间换时间 通过大量的预处理来提升应用系统的用户体验 效率 因此数据仓库会存在大量冗余的数据 不分层的话 如果源业务系统的业务规则发生变化将会影响整个数据清洗过程 工作量巨大 通过数据分
  • 数仓建设-架构&建模

    目录 一 架构篇 1 1 企业架构 1 2 数据平台架构 二 建模篇 2 1 FS LDM 2 2 数据模型概念 2 2 1 概念 2 2 2 数据模型三要素 2 2 3 数据模型分类 以旅客身份识别为例 2 3 维度建模工作过程 2 3
  • Data Lake数据湖详解2.0

    一 什么是数据湖 数据湖是目前比较热的一个概念 许多企业都在构建或者计划构建自己的数据湖 但是在计划构建数据湖之前 搞清楚什么是数据湖 明确一个数据湖项目的基本组成 进而设计数据湖的基本架构 对于数据湖的构建至关重要 关于什么是数据湖 有不
  • 数据中台元年,企业数字化转型面临的三大挑战

    随着企业信息化程度越来越高 企业掌握的数据量从原来的TB级发展到PB级 再到EB级甚至往ZB级别发展 数据形式也在从原来的结构化数据为主转变为以日志 视频 图片 语音等非结构化数据为主 然而 数据存储和计算 数据组织的运行都是有成本的 当数
  • 第三章、中台实践-业务中台建设

    第三章 业务中台建设 3 1 什么事业务中台 从业务运行机制和系统开发机制两个维度 展开产生建设业务中台的主要内容 3 1 1 业务中台定义 业务中台是以业务领域划分边界 形成高内聚 低耦合的面向业务领域的能力中心 打造持续演进的企业级业务
  • KVM-1、Linux 操作系统及虚拟化

    1 前言 一台计算机是由一堆硬件设备组合而成 在硬件之上是操作系统 操作系统与计算机硬件密不可分 操作系统用来管理所有的硬件资源提供服务 各个硬件设备是通过 总线 进行连接起来的 在操作系统之上 需要一个人机交互接口 我们才能使用计算机对其
  • 【ETL】常见的ETL工具(含开源及付费)一览和优劣势分析?

    一 Kettle Kettle 中文名称叫水壶 该项目的概念是把各种数据放到一个壶里 然后以一种指定的格式流出 Kettle是一款国外开源的ETL工具 纯java编写 可以在Window Linux Unix上运行 无需安装 数据抽取 高效
  • 数据中台盛行,DataOps兴起,数据架构才是未来

    导读 在数字化转型的浪潮下 数据架构获得了越来越多的关注 作为企业架构中的关键纽带 数据架构解决了业务与数据间的映射 规范了应用架构中的数据集成关系 指导了技术架构的技术选型 在企业中发挥着不可或缺的作用 伴随DataOps等场景的出现 数
  • 中台战略-第九章、数字营销的技术架构与路径

    文章目录 第九章 数字营销的技术架构与路径 9 1基于中台架构 构建立体数字营销云 9 2 数字营销技术架构和设计理念 9 2 1 数字营销云应用介绍 1 全域会员i CDP 2 智能营销i Marketing 3 全渠道销售i Comme
  • 大数据数据仓库建设流程概述

    数据仓库的逻辑分层架构 想看懂数据仓库的逻辑分层架构 必须先弄懂以下4大概念 数据源 数据来源 互联网公司的数据来源随着公司的规模扩张而呈递增趋势 同时自不同的业务源 比如埋点采集 客户上报 API等 ODS层 数据仓库源头系统的数据表通常
  • 数据中台-数据安全管理-11

    文章目录 数据安全管理 11 1 数据安全面临的调整 11 1 1 数据安全问题带来的4大损害 11 1 2 法律和政策背景 11 1 3 数据安全的4大技术挑战 1 平台安全 2 服务安全 3 数据本身的安全 4 APT攻击防御 11 1
  • 收入最高的十大IT职位

    过去的一年对科技行业来说非常艰难 一些公司宣布裁员 面临着迫在眉睫的经济衰退威胁 尽管经历了坎坷的一年 但市场对科技人才的需求仍然强劲 截至1月 美国的科技人才失业率下降到1 5 对于拥有适当技能和专业知识的技术人员来说 市场对人才的需求仍
  • 2023-数仓建设规范指南

    一 数据模型架构原则 1 数仓分层原则 优秀可靠的数仓体系 往往需要清晰的数据分层结构 即要保证数据层的稳定又要屏蔽对下游的影响 并且要避免链路过长 那么问题来了 一直在讲数仓要分层 那数仓分几层最好 目前市场上主流的分层方式眼花缭乱 不过
  • 数据整理——大数据治理的关键技术

    摘要 数据是政府 企业和机构的重要资源 数据治理关注数据资源有效利用的众多方面 如数据资产确权 数据管理 数据开放共享 数据隐私保护等 从数据管理的角度 探讨了数据治理中的一项关键技术 数据整理 介绍了以数据拥有者和直接使用者 行业用户 为
  • 数据仓库灵魂30问之如何建设数据中台?一幅图说清中台。

    什么是中台 什么是数据中台 数据仓库实现了企业数据模型的构建 大数据平台解决了海量 实时数据的计算和存储问题 数据中台要解决什么呢 数据如何安全的 快速的 最小权限的 且能够溯源的被探测和快速应用的问题 数据中台不应该被过度的承载平台的计算
  • 数据中台产品【数据服务中心】【含代码说明等】

    链接 https pan baidu com s 1 WNnt690 WWf8BX8uvNaKw 提取码 uscrDataCenterTodo CDH hbase zk 部署和配置 代码发布 presto redis集群 cacheclou
  • 2023企业级数仓建设概要

    一 前言 1 1 背景 无忧搬家数据以前很多都是数仓同学从业务库负责接入数据至ods层 然后就由各个下游分析师取ods贴源层数据然后进行取数计算分析 数仓这边缺乏沉淀公共层数据 从而有以下问题 直接从ods贴源层取数据 业务研发侧一改造则下
  • 中台战略-第一章、企业数字化转型

    第一章 企业数字化转型 数字经济是当前所有企业在时代都要考虑的问题 不久的将来 他会成为社会经济中的新引擎 也会逐步推动产业互联和企业商业生态的数字化转型 消费者对于产品与服务的升级需求带动着各类触点场景和产品延伸服务的不断变化 云计算 大
  • 【华为数据之道学习笔记】5-6非结构化数据入湖

    1 非结构化数据管理的范围 非结构化数据包括无格式的文本 各类格式的文档 图像 音频 视频等多样异构的格式文件 相较于结构化数据 非结构化数据更难以标准化和理解 因而非结构化数据的管理不仅包括文件本身 而且包括对文件的描述属性 也就是非结构
  • 【华为数据之道学习笔记】5-9图模型设计

    图模型作为当前流行的信息处理加工技术 自提出以来 迅速在 学术界和工业界得到了普及 在智能推荐 决策分析等方面有着广泛的应用 图模型由节点和边组成 节点表示实体或概念 边则由属性或关 系构成 实体指的是具有可区别性且独立存在的某种事物 如某

随机推荐