SparkStreaming与Kafka010之05之02 Consumer的offset 自定义设置offset

2023-11-06

package Kafka010

import Kafka010.Utils.MyKafkaUtils
import org.apache.kafka.clients.consumer.ConsumerRecord
import org.apache.kafka.common.TopicPartition
import org.apache.spark.SparkConf
import org.apache.spark.streaming.dstream.InputDStream
import org.apache.spark.streaming.kafka010.{ConsumerStrategies, KafkaUtils, LocationStrategies}
import org.apache.spark.streaming.{Seconds, StreamingContext}

/**
 * Created by Shi shuai RollerQing on 2019/12/24 19:47
 *
 * kakfa的API 0-10版本的Consumer测试
 */
//TODO :  kakfa的API 0-10版本的Consumer测试
object Kafka010Demo02 {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setMaster("local[*]").setAppName(s"${this.getClass.getCanonicalName}")
    val ssc = new StreamingContext(conf, Seconds(5))

    val topics = List("topicB") //后面的ConsumerStrategies的参数要求topic为集合的形式 可能不止一个topic
    val kafkaParams = MyKafkaUtils.getKafkaConsumerParams("SparkKafka010")


    //自定义设置offsets
    val offsets: Map[TopicPartition, Long] = Map(
      new TopicPartition("topicB", 0) -> 300L,
      new TopicPartition("topicB", 1) -> 300L,
      new TopicPartition("topicB", 2) -> 300L
    )


    val ds: InputDStream[ConsumerRecord[String, String]] = KafkaUtils.createDirectStream[String, String](
      ssc,
      LocationStrategies.PreferConsistent,
      ConsumerStrategies.Subscribe[String, String](topics, kafkaParams, offsets)
    )
    ds.foreachRDD(rdd => {
      rdd.foreach(println)
    })

    ssc.start()
    ssc.awaitTermination()

  }
}

没错从三百开始的
在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

spark

kafka

SparkStreaming与Kafka010之05之02 Consumer的offset 自定义设置offset 的相关文章

Spark大数据分析与实战笔记（第一章 Scala语言基础-3）

文章目录 1 3 Scala的数据结构 1 3 1 数组数组的遍历数组转换 1 3 2 元组创建元组获取元组中的值拉链操作 1 3 3 集合 List Set Map 1 3 Scala的数据结构对于每一门编程语言来说数组 A
大数据开发必备面试题Spark篇合集

1 Hadoop 和 Spark 的相同点和不同点 Hadoop 底层使用 MapReduce 计算架构只有 map 和 reduce 两种操作表达能力比较欠缺而且在 MR 过程中会重复的读写 hdfs 造成大量的磁盘 io 读写操作
windows python kafka 初级使用

今天花了点时间在这个kafka上因为我们工作中也用到了kafka 我这边对于kafka的理解是能用或者知道基本原理就行实现在自己的windows环境搭建一次kafka 然后使用python进行数据的生产和消费如果之后工作中对于kafk
附录：kafka源码启动

本文以源码2 8为例准备如下 idea 2019 1 4 jdk 1 8 scala 2 12 8 gradle 6 8 1 zookeeper 3 4 10 kafka2 8源码注意以下安装都需要装在没有空格的路径上比如D Pro
ELK配置记录（filebeat+kafka+Logstash+Elasticsearch+Kibana）

一简介 elk日志平台日志收集分析和展示的解决方案满足用户对志的查询排序统计需求 elk架构 filebeat 采集 kafka Logstash 管道 Elasticsearch 存储搜索 Kibana 日志应用各组件功
学习笔记-Spark环境搭建与使用

一 20 04 Ubuntu安装清华源ISO源 https mirrors tuna tsinghua edu cn ubuntu releases 20 04 下载链接 https mirrors tuna tsinghua edu c
kafka配置内外网访问

listeners 学名叫监听器其实就是告诉外部连接者要通过什么协议访问指定主机名和端口开放的 Kafka 服务 advertised listeners 和 listeners 相比多了个 advertised Advertised 的
kafka问题解决：org.apache.kafka.common.errors.TimeoutException

记录使用kafka遇到的问题 1 Caused by java nio channels UnresolvedAddressException null 2 org apache kafka common errors TimeoutExc
大数据手册(Spark)--Spark基本概念

文章目录 Spark 基本概念 Hadoop 生态 Spark 生态 Spark 基本架构 Spark运行基本流程弹性分布式数据集 RDD Spark安装配置 Spark基本概念 Spark基础知识 PySpark版 Spark机器学习
kafka（三）重平衡

历史文章 kafka 一 kafka的基础与常用配置文章目录一 kafka消费者组二重平衡 Rebalance 2 1 重平衡触发条件 2 2 重平衡策略 2 2 1 Range 平均分配 2 2 2 RoundRobin 轮询分配
WebSocket + kafka实时推送数据（springboot纯后台）

逻辑 kafka订阅消费者主题消费后通过webSocket推送到前端 kafka vue financial webSocket 学习引用 SpringBoot2 0集成WebSocket 实现后台向前端推送信息 World Of Mos
[分布式] zookeeper集群与kafka集群

目录一 Zookeeper 概述 1 1 Zookeeper定义 1 2 Zookeeper 工作机制 1 3 Zookeeper 特点 1 4 Zookeeper 数据结构 1 5 Zookeeper 应用场景 1 6 Zookeepe
【硬刚大数据之学习路线篇】2021年从零到大数据专家的学习指南(全面升级版)

欢迎关注博客主页 https blog csdn net u013411339 本文由王知无原创首发于 CSDN博客本文首发CSDN论坛未经过官方和本人允许严禁转载欢迎点赞收藏留言欢迎留言交流声明本篇博客在我之前发表
sparkstreamming 消费kafka(2)

spark streaming提供了两种获取方式一种是同storm一样实时读取缓存到内存中另一种是定时批量读取这两种方式分别是 Receiver base Direct 一 Receiver base Spark官方最先提供了基于R
sparkstreamming 消费kafka(1)

pom
kafka系列——KafkaProducer源码分析

实例化过程在KafkaProducer的构造方法中根据配置项主要完成以下对象或数据结构的实例化配置项中解析出 clientId 用于跟踪程序运行情况在有多个KafkProducer时若没有配置 client id则clientId
在windows系统下使用IDEA对kafka源码进行编译环境搭建以及配置

目录一前期准备工作 step1 安装JDK1 8 step2 安装zookeeper单机版 step3 安装Gradle 5 4 step4 安装scala 2 11 12 二将kafka源代码部署到编辑器IDEA并测试 step1
shell脚本，一次性启动kafka集群

版本centos6 5 64位操作系统已配置JDK1 8 三个节点在s121节点上可以免密登录到另外两个节点另外kafka0 9 0 1的安装目录相同修改了主机名并在每个节点的hosts文件中设置了映射脚本内容 bin bash
Kafka——Mac搭建kafka环境

1 下载Kafka安装包下载地址将压缩包移动到 usr local mv kafka 2 12 3 1 0 tgz usr local 解压 tar zxvf kafka 2 12 3 1 0 tgz 2 启动启动zookeeper
一文弄懂事件Event与Kafka的区别

事件 Event 和 Apache Kafka 是两个概念层面上有所不同的东西它们在应用程序中的作用和使用场景也有很大的差异 1 概念和定义事件 Event 事件是系统内发生的特定事情或状态变化的表示在编程和软件设计中事件通常被

随机推荐

NUC980开源项目11-启动方式

上面是我的微信和QQ群欢迎新朋友的加入项目码云地址国内下载速度快 https gitee com jun626 nuc980 open source project 项目github地址 https github com Jun117
Windows7/10上快速搭建Tesseract-OCR开发环境操作步骤

之前在https blog csdn net fengbingchun article details 51628957 中描述过如何在Windows上搭建Tesseract OCR开发环境那时除了需要clone https github
MySQL——事务和视图

2023 9 17 本章开始介绍TCL语言 Transaction Control Language 事务控制语言事务事务的概念一个或一组sql语句组成一个执行单元这个执行单元要么全部执行要么全部不执行事务的特性 ACID 原子
scala---spark本地调式远程获取hdfs数据注意事项

文章目录前言一 Hadoop配置注意事项 1 1 core site xml 1 2 core site xml 二本地hadoop环境配置注意事项三本地scala项目spark代码调试总结前言这篇文章主要帮大家绕开一些本地
异常关机后Oracle无法正常连接，使用 conn /as sysdba 出现 ORA-01034 和 ORA-27101: shared memory realm does not exist...

最近异常关机导致oracle无法连接一直提示ORA 01034和ORA 27101的错误打开cmd后输入 sqlplus npolog conn as sysdba 提示 ORA 01034 Oracle not available
windows10使用WSL安装Linux(以ubuntu为例)

1 安装工具WSL 适用于 Linux 的 Windows 子系统 WSL 可让开发人员直接在 Windows 上按原样运行 GNU Linux 环境包括大多数命令行工具实用工具和应用程序且不会产生传统虚拟机或双启动设置开销是win
浙大水业oa系统服务器地址,OA系统

OA系统功能定位于知识管理企业决策支持资源共享和企业协同工作它由单纯的办公自动化向提升到协助管理整个企业为目标表现在以下四个方面把协同工作融入业务流程中团队中通过及时的交流准确的任务分派从而实现高绩效管理 E OFFICE办公
通过js修改网页内容

js可以通过文本所在标签的id获取该标签对象然后修改其内容如 document getElementById 标签id innerHTML 要修改的文本内容该方法可以在要修改的文本内容中加html标签如果只是纯文本的话可以使用in
严重性代码说明项目文件行禁止显示状态

严重性代码说明项目文件行禁止显示状态错误 LNK2019 无法解析的外部符号 public void thiscall LinkedList
解决ubuntu无法输入中文标点

使用Ctrl 切换
ListBox控件滚动条

今天在使用LISTBOX控件中遇到的一点小问题主要是两个问题水平滚动条不显示内容垂直滚动条没有自动滚动在网上查了一下找到了解决办法原来只需要向控件发送消息就行了具体代码如下以下都是在Dialog类中的函数操作如果是使用 Se
C++编程规范（101条规则、准则与最佳实践）

C 编程规范 101条规则准则与最佳实践虽然是书本的目录但也是高度的概括和总结组织和策略问题第0条不要拘泥于小节了解哪些东西不应该标准化第1 条在高警告级别干净利落地进行编译第2 条使用自动构建系统第3 条使用版本
解决uniapp在微信小程序显示图片/数据，h5不显示图片/数据。

配置跨域首先在mainifest json中的源码视图中配置跨域 h5 devServer port 8080 disableHostCheck true proxy dpc target https www edonguoji cn c
Linux系统编程之常用线程同步的三种方法

Linux系统编程之线程同步高效率编程 Linux系统中线程最大的特点就是共享性线程同步问题较为困难也很重要最常用的三种是条件变量互斥锁无名信号量 ps 有名信号量可用于进程同步无名信号量只能用于线程同步是轻量级的一互斥锁
Google Guava

转载自并发编程网 ifeve com 本文链接地址 Google Guava官方教程中文版中文文档 http ifeve com google guava 开源地址 https github com google guava 今天偶然发
swagger3或者swagger报nullpointexception

很简单这个问题就是版本不匹配就是2 6 0以上版本的springbootmvc扫描方法和老版本不同在springboot配置 application yml 里面加上如果是properties则是加上 spring mvc pathma
配置Spark on YARN集群内存

在这里插入代码片运行文件有几个G大默认的spark的内存设置就不行了需要重新设置还没有看Spark源码只能先搜搜相关的博客解决问题按照Spark应用程序中的driver分布方式不同 Spark on YARN有两种模式 yarn
利用CNN进行人脸年龄预测

很久之前做的东西了最近做了一个人脸相似度检测里面用到了这里的一个模型所以抽个空把人脸年龄检测的思路总结一下与其他CNN分类问题类似人脸年龄预测无非就是将人脸分为多个类别然后训练卷积神经网络最后利用训练好的卷积神经网络进行分类即
数据结构: 线性表(无哨兵位单链表实现)

文章目录 1 线性表的链式表示链表 1 1 顺序表的优缺点 1 2 链表的概念 1 3 链表的优缺点 1 4 链表的结构 2 单链表的定义 2 1 单链表的结构体 2 2 接口函数 3 接口函数的实现 3 1 动态申请一个结点 BuySL
SparkStreaming与Kafka010之05之02 Consumer的offset 自定义设置offset

package Kafka010 import Kafka010 Utils MyKafkaUtils import org apache kafka clients consumer ConsumerRecord import org a

SparkStreaming与Kafka010之05之02 Consumer的offset 自定义设置offset

SparkStreaming与Kafka010之05之02 Consumer的offset 自定义设置offset 的相关文章

随机推荐

热门标签