java strom实例_storm 入门教程+简单实例

2023-11-10

写在前面:

本篇博客主要介绍 storm 基本概念和一个简单实例,storm版本1.0.2

storm基本概念

storm的集群架构

storm 是一个主从架构,一个主节点,n个从节点,主节点和从节点之间通过zk集群来进行交互,

(这张图是盗的......)

简述一下集群搭建:

1,解压并且修改 storm.yaml,并且scp到其他节点机器上

2,在主节点启动 nimbus服务,ui界面服务和logviewer日志服务

3, 在从节点启动 supervisor服务和logviewer日志服务

主要进程介绍

nimbus : nimbus 是storm集群的主控制节点

zookeeper :集群协调中心

supervisor: 负责接收任务管理 worker的进程,work进程处理具体逻辑

logviewer:日志服务进程

ui: web ui 管理界面进程

编程模型:DAG有向无环图

正如 Hadoop的编程模型是 map-reduce,storm也有自己的编程模型,这种模型直白的表述就是有向无环图,这里面引用官网的图例

storm 是做流数据处理,所有选择了一种像"水流"一样的编程模型,更准确的说是一种"水槽",数据就像水流一样,在这条"水槽"中"流淌"(被处理)

storm 编程有如下几个基本概念

spout:相当于"水流"(数据流)的源头

bolt:相当于"水槽的处理站",对流经的数据进行处理

Topology: 整个这个有向无环图 , 这个 topology 将作为一个任务提交给 storm集群处理

tuple:元组相当于每一个水滴每一条数据

编写一个storm程序就是编写若干个spout接入数据发射(emit)数据给bolt,编写若干个bolt处理数据并且e发射(emit)数据给其他的bolt,在这个过程中每一个bolt都有能力把数据持久化,如果没有任何一个bolt持久化数据,数据将被丢弃,最后由一个 topology将这些节点连接起来,提交给集群执行任务或者在本地模拟集群进行任务执行.

一个简单的实例 wordcount

实例流程: 随机读取文本行, 统计整个文本的每个单词的个数

SpoutWordline类:产生数据的源头

package leap.storm.simple;

import org.apache.storm.spout.SpoutOutputCollector;

import org.apache.storm.task.TopologyContext;

import org.apache.storm.topology.OutputFieldsDeclarer;

import org.apache.storm.topology.base.BaseRichSpout;

import org.apache.storm.tuple.Fields;

import org.apache.storm.tuple.Values;

import org.apache.storm.utils.Utils;

import java.util.Map;

import java.util.Random;

/**

* Created by FromX on 2017/3/15.

public class SpoutWordline extends BaseRichSpout {

SpoutOutputCollector _collector;

Random _r

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

java strom实例

java strom实例_storm 入门教程+简单实例的相关文章

linux下MQTT服务器(EMQX)搭建及paho.mqtt.c客户端开发

前言 MQTT 是一种基于客户端服务端架构的发布订阅模式的消息传输协议它的设计思想是轻巧开放简单规范易于实现这些特点使得它对很多场景来说都是很好的选择特别是对于受限的环境如机器与机器的通信 M2M 以及物联网环境 IoT
Typora 免费版下载安装（超简单亲测适用于Windows）与入门

前言 Typora大家都知道是一款好用的编辑器和阅读器鬼鬼为大家找了一个可使用版本安装过程十分简单亲测有效不浪费大家时间现在将Typora分享给大家免费使用下载链接在文章最后目录前言一 Typora的介绍 MarkDow
图的两种遍历方式dfs/bfs

include
nodejs中express框架使用

一 express介绍 express 是一个基于 Node js 平台的极简灵活的 WEB 应用开发框架 express中文官网网址 https www expressjs com cn 简单来说 express 是一个封装好的工具包
C标准库的setlocale()用法笔记

转自 http zyxhome org wp cc prog lang c stdlib setlocale usage note 在此向原文作者说声谢谢若有读者看到文章转载时请写该转载地址不要写我的BLOG地址尊重他人的劳动成果 C
计算机网络连接显示678是什么意思,宽带连接错误678,教您宽带连接出现错误提示代码678怎么解决...

对电脑网络有资深了解的用户就知道网络的错误代码678是宽带的故障代码之一其含义是远程计算机无响应而在网上罗列了一堆的可能性其中涉及的一些高深的专业知识与判断很多的用户都表示看得是云里雾里不知所云下面小编就给大家分享宽带连接出现
VScode连接服务器运行代码

我的pycharm到期了只能用VScode了说一下怎么用VScode连接服务器安装Remote SSH插件设置搜ssh 把这个打上对勾这里建立新的连接会让你输入你需要输入username 地址端口输入完之后打开这个con
JS 判断当前浏览器是谷歌Google、火狐Firefox、Safari、Edge、Opera还是其他浏览器的方法

JS 判断当前浏览器是谷歌Google 火狐Firefox Safari Edge还是其他浏览器的方法如下第一种 function detectBrowser const userAgent navigator userAgent if
Linux操作系统之C语言实现shell命令解释器项目

文章目录一实现原理二具体实现过程一实现原理普通命令 ls pwd cp clear 通过exec fork 内置命令 cd exit bash本身提供方法调用自己的函数不会产生子进程二具体实现过程 1 mybash项目
mockito

mock 对接口返回值进行模拟数据使用场景 1 协同开发的时候需要调用未开发接口模拟接口返回值数据 2 接口联调网络不通的时候把线上数据拷贝回来模拟数据添加mockito依赖
java用lambda函数排序,Java函数式编程-4.lambda表达式排序

1 lambda表达式排序咱们首先看几个比较常见的排序例子基本数据类型的排序ide List list Arrays asList 1 3 2 5 4 list sort Comparator naturalOrder System o
cartographer更新地图-移除未完成的子图

首先说明为什么要移除未完成的子图因为如果不删除每次更新都会保留以前未完成的子图那时间累计数据量不断增长不得了 overlapping submaps trimmer移除的只有已经完成的子图那对于未完成的子图如何处理呢首先在ove
tq210基本参数

这个板子的核心板为core B 底板为tq210 board v4 1G ddr2 128Mx8pcs 1G slc flash K9K8G08 PMU TPS659101 使用系统自带的sd uboot 使用板子带的串口线这个线与ok2
win10如何修改windows默认远程桌面端口号

修改默认端口需要修改注册表打开开始运行输入regedit 进入注册编辑器依次点击进入 HKEY LOCAL MACHINE SYSTEM CurrentContro1Set 接着找到以下路径Control Tenninal Serv
NAT穿透 - P2P

NAT穿透 P2P 一 NAT穿透二 NAT分类总结一 NAT穿透 NAT穿透即内网穿透也称为打洞其网络拓扑示例二 NAT分类完全锥型NAT 内网客户端映射到一个外部IP Port IP端口无限制任意主机都可往该映射端口发
逻辑分析题目：“给你一个9升的水桶和一个4升的水桶，在河里取6升水”

问题答案 1 大桶装满然后倒满小桶这样大桶剩5升小桶4升 2 小桶倒空大桶再往小桶灌满大桶剩1升小桶4升 3 小桶倒空把大桶的一升灌进小桶这时大桶没有了小桶一升 4 再灌满大桶此时往已有1升得小桶里灌三升大桶剩下6升
算法训练Day38

目录动态规划理论基础 LeetCode509 斐波那契数 1 思路 2 代码实现 3 复杂度分析 4 总结与收获 LeetCode70 爬楼梯 1 思路 2 代码实现 3 复杂度分析 4 思考与收获 LeetCode746 使用最小花费爬
input/textarea文本的选择与获取

获取input textarea中选择的文本function getSelectedText textbox if document selection IE return document selection createRange te
网络与信息安全——知识整理（1）

1 The Security Goals a Confidentiality to protect theconfidential information and to guard against the malicious actions

随机推荐

数据结构——算法

算法是什么算法 Algorithm 是对解题方案的准确而完整的描述是一系列解决问题的清晰指令说白了就是用来解决问题的算法的特性必须全部符合才可称之为一个算法 1 有穷性一个算法必须在执行有穷步后结束且每一步必须在有穷时间内完成
Unity项目架构

整理了一下Unity项目客户端涵盖一些内容如果有遗漏欢迎大家指出感谢
动画 + 大白话讲清楚React渲染原理

前言相信很多人跟我之前一样看到源码两个字觉得触不可及觉得离自己还很遥远是需要非常多年的工作经验的大佬才能触及到的领域就在去年我改变了这个想法当时被react的几个生命周期执行顺序弄的睡不着觉为什么有些时候生命周期的执行事与愿违
小软件项目开发的管理

小软件项目开发的管理创建成功的工程成功项目管理的秘密更好地领导一个项目的诀窍参与变革走向成功 CMM TSP PSP讲义稿开发流程中的可用性软件开发的管理和控制如何组织软件开发团队软件项目管理 CMM 经验谈实施CMM
stable-diffusion的webui和comfyuig共享模型路径

1 修改上图extra model paths yaml example为extra model paths yaml Rename this to extra model paths yaml and ComfyUI will load
最长公共子序列问题（Java）-动态规划

动态规划法经常会遇到复杂问题不能简单地分解成几个子问题而会分解出一系列的子问题简单地采用把大问题分解成子问题并综合子问题的解导出大问题的解的方法问题求解耗时会按问题规模呈幂级数增加为了节约重复求相同子问题的时间引入一个数组不
关于Springcloud的RestTemplate使用服务名报异常java.net.UnknownHostException

关于Springcloud的RestTemplate使用服务名报异常java net UnknownHostException和使用localhost 8081报异常java lang IllegalStateException No in
ConstraintLayout基本使用之toLeftOf 、toTopOf、toRightOf、toBottomOf

关于ConstraintLayout的博客文章想必大家已经见过很多了都是很全面的今天这篇博客主要将ConstraintLayout的 layout constraintLeft toLeftOf layout constraintLe
HTML常考知识点和面试题

保证页面不会出现编码问题乱码宽度等于设备宽度初始化比例等于1 最大初始化比例等于1 user scalable no 将控制用户无法进行触屏扩大或缩小网页适配移动端的第一步加上viewport 再针对手机屏幕大小调整指定一个基础的
【LeetCode队列】933 最近的请求次数 RecentCounter(java实现)

文章目录题目描述一解题思路二代码 1 最近的请求次数 2 测试数据 3 复杂度分析 4 执行时间题目描述写一个 RecentCounter 类来计算特定时间范围内最近的请求请你实现 RecentCounter 类 Recen
2023-04-29 读取内容为十六进制数字的txt文件转换为二进制文件

读取内容为十六进制数字的txt文件转换为二进制文件前言一示例代码总结前言一个有趣的题目读取txt文件内容两两结合存储为dat文件实现十分简单有很多有意思的回答但大都是python 其实这个用C的格式化读取fscanf
DC/DC:单端反激直流变换电路设计及matlab/Simulink仿真

直流单端反激变换电路在开关管导通时电源将电能转为磁场能储存在变压器中当开关管关断时再将磁能转变为电能传送到负载单端反激变换电路是由升降压 Buck Boost 变换电路派生而来的电路图如图所示参数计算理论计算可参考Buck Boo
通过hyperledger fabric理解区块链存储

hyperledger fabric 是一个联盟链框架基于这个框架的最简单案例 A与B转账我们来理解一下什么是区块链第一个问题区块链是干什么用的很多人想到了比特币以太坊等等那具体是干什么用的呢实际上可以理解为一个特别的数据存
ERROR: cannot launch node of type [map_server/map_server]: map_server等

问题说明在运行Autolabor simulation中README md的Quick start时 roslaunch simulation launch gmapping navigation launch 出现了以下错误发现找不到
phpstudy安装和使用

一 phpstudy 1 下载网址 http www xp cn 2 过程 1 往下拉可以看到推荐版本我下载的是8 1版本注意下载路径不可以有中文或空格 2 按需下载 3 安装完成后解压点击这个一步一步做就可以啦 3 简单熟悉phpst
回形数（转载）

转载及参考https blog csdn net sinat 37976731 article details 78614723 import java util Scanner author litianfu version 1 0 em
CCNP14-BGP基础

文章目录一概念二特点三数据包四邻居关系名词解释五 BGP的防环机制水平分割六 BGP的工作过程七基本配置八 BGP的三张表 1 简化邻居表 2 BGP的路由表 3 IP路由表一概念 BGP 边界网关协议应
（4层）TCP 首部字段

TCP 报文段的首部格式 TCP 虽然是面向字节流的但 TCP 发送的数据单元却是报文段一个 TCP 报文段分为首部和数据两部分而 TCP 的全部功能都体现在它首部中各字段的作用 TCP 报文段首部的前 20 个字节是固定的后面有
【搭建博客】picGo+OSS防盗链配置（不同平台）

汝之观览吾之幸也本文主要讲解在使用picGo OSS使用时会出现防盗链问题配置OSS的防盗链 OSS支持对存储空间 Bucket 设置防盗链即通过对访问来源设置白名单的机制避免OSS资源被其他人盗用可参考防盗链配置目录登录O
java strom实例_storm 入门教程+简单实例

写在前面本篇博客主要介绍 storm 基本概念和一个简单实例 storm版本1 0 2 storm基本概念 storm的集群架构 storm 是一个主从架构一个主节点 n个从节点主节点和从节点之间通过zk集群来进行交互这张图是盗的

java strom实例_storm 入门教程+简单实例

java strom实例_storm 入门教程+简单实例 的相关文章

随机推荐

热门标签

java strom实例_storm 入门教程+简单实例的相关文章