Spark大数据分析实战 第6章 Kafka分布式消息系统
所属分类 spark
浏览量 822
什么是Kafka
Kafka架构
主题与分区
分区副本
消费者组
Kafka集群环境搭建
Kafka命令行操作
什么是Kafka
分布式发布与订阅消息系统
消息中间件
作为Spark Streaming的实时数据源
Spark Streaming从Kafka中读取实时消息进行处理,保证了数据的可靠性与实时性
一些基本概念
消息(Message)
服务器节点(Broker)
主题(Topic)
分区(Partition)
生产者(Producer)
消费者(Consumer)
Kafka架构
ZooKeeper
Broker
生产者 Push
消费者 pull
kafka消息发送机制
kafka消费机制要点
主题与分区
主题 分区 水平扩展
分区日志 追加写入
偏移量 offset
消费者 指定 分区 和 offset 读取消息
可以指定从某个分区中一次获取的消息数
kafka消息存储及索引机制
分区副本
副本 可靠性 高可用
leader follower 副本
读写 leader 副本
follower 从 leader 同步
leader 挂了,选出 follower ,提升为leader
消费者组
消费者组 Consumer Group
队列模式和发布订阅模式
kafka消费机制要点
Kafka集群环境搭建
kafka集群搭建
Kafka命令行操作
kafka运维常用命令
kafka核心知识点
深入理解Kafka:核心设计与实践原理 读书笔记
上一篇
下一篇
Spark大数据分析实战 第3章 RDD弹性分布式数据集
Spark大数据分析实战 第4章 Spark内核源码分析
Spark大数据分析实战 第5章 Spark SQL结构化数据处理引擎
Spark大数据分析实战 第7章 Spark Streaming实时流处理引擎
Clickhouse 监控运维常用SQL
Spark大数据分析实战 第8章 Structured Streaming结构化流处理引擎