Kafka必备基础和集群架构知识.docx
《Kafka必备基础和集群架构知识.docx》由会员分享,可在线阅读,更多相关《Kafka必备基础和集群架构知识.docx(9页珍藏版)》请在第壹文秘上搜索。
1、一、Kafka基础消息系统的作用应该大部份小伙伴都清楚,用机油袋箱举个例子可以看出,就是在中恒12程屯加入f燎;中区域,之后灌好油的插跄亘接送往仓库,然后1.ft这个ift程亘蛭从仓尾荻取油桶上虺,上完前的送往仓库.打包装的也是TtTtM仓库获取所以消息系统就是如上图我们所说的仓库,能在中间过程作为缓存,并且实现解烟台的作用*引入一个场景,我们知道中国移动,中国联通,中国电信的口志处理,是交给外包去做大数据分析的,假设现在它们的日志都交给了你做的系统去做用户画像分析Mma.*5RJRW.B三8三a.ICHDFswxae按照刚刚前而提到的消息系统的作用,我们知道了消息系统其实就是一个模拟缓存,且
2、仅仅是起到J缓存的作用而并不是真正的缓存,数据仍然是存储在磁盘上面而不是内存。l.Topic主通kafka学习了数据摩里面的设计,在里面设计了IoPiC(主题),这个东西类似于关系型数据库的表。M*a:三MJS,K.KXDFSWff此时我能要获取中国移动的数据,那就直接监听TopicA即可2 .Partition分区kafka还有一个概念叫PartiIion(分区),分区具体在服务器上面去现起初就是一个目录,一个主胞卜面有多个分区,这些分区会存储到不同的服务器上面或者说,其实就是在不同的主机上建了不同的目录.这些分区主要的信息就存在了.Iog文件里面.跟数据底里面的分区差不多,是为了提高性能,
3、Uika:S*W,*MMit.WH0*rSW至于为什么提高了性能.很简单,多个分区多个线程,多个线程并行处理肯定会比单线程好得多eTopic和partition像是IIBASE里.的table和region的概念,table只是个逻辑上的概念,真正存储数据的是region,这region会分布式地存储在各个服务器上面,对应于kilfka,也是一样,TUPiC也是逻辑概念,而partition就是分布式存储单元.这个设计是保证了海量数据处理的基础.我们可以对比一下,如果HwS没有block的设计,一个100T的文件也只能尊独放在一个赧务器上面,那就直接占满整个服务器了,引入block后,大文件可
4、以分散存储在不同的服务器上。注意;分区会有单点故障问题,所以我们会为每个分区设置副本数分区的编号是从0开始的3 .Producer-生产者往消息系统里而发送数据的就是生产者ka:JK,三三*三式.和HOFSW今4.Consumer-消费者从kafka里读取数据的就是消费者Kalka:是Tj票线,是一个占式,6OFSMM5.Message-消息kafka里面的我们处理的数据叫做消息.二、kafka的集群架构创建一个TopicA的主题,3个分区分别存储在不同的服务器,也就是broker下面.Topic是一个逻森上的概念,并不能宜接在图中把Topic的相关单元iS出.Kafka集群需要注,旗:kaf
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Kafka 必备 基础 集群 架构 知识
![提示](https://www.1wenmi.com/images/bang_tan.gif)