當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

消息中间件系列(二)：Kafka的原理、基础架构、以及使用场景

發(fā)布時間：2024/7/5 编程问答 27 豆豆

生活随笔收集整理的這篇文章主要介紹了消息中间件系列(二)：Kafka的原理、基础架构、以及使用场景小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一：Kafka簡介

Apache Kafka是分布式發(fā)布-訂閱消息系統，在 kafka官網上對 kafka 的定義：一個分布式發(fā)布-訂閱消息傳遞系統。它最初由LinkedIn公司開發(fā)，Linkedin于2010年貢獻給了Apache基金會并成為頂級開源項目。Kafka是一種快速、可擴展的、設計內在就是分布式的，分區(qū)的和可復制的提交日志服務。

二：Kafka基本架構

它的架構包括以下組件：

1、話題（Topic）：是特定類型的消息流。消息是字節(jié)的有效負載（Payload），話題是消息的分類名或種子（Feed）名；

2、生產者（Producer）：是能夠發(fā)布消息到話題的任何對象；

3、服務代理（Broker）：已發(fā)布的消息保存在一組服務器中，它們被稱為代理（Broker）或Kafka集群；

4、消費者（Consumer）：可以訂閱一個或多個話題，并從Broker拉數據，從而消費這些已發(fā)布的消息；

上圖中可以看出，生產者將數據發(fā)送到Broker代理，Broker代理有多個話題topic，消費者從Broker獲取數據。

三：Kafka基本原理

我們將消息的發(fā)布（publish）稱作 producer，將消息的訂閱（subscribe）表述為 consumer，將中間的存儲陣列稱作 broker（代理），這樣就可以大致描繪出這樣一個場面：

生產者將數據生產出來，交給 broker 進行存儲，消費者需要消費數據了，就從broker中去拿出數據來，然后完成一系列對數據的處理操作。

kafka 官方給出的圖：

多個 broker 協同合作，producer 和 consumer 部署在各個業(yè)務邏輯中被頻繁的調用，三者通過 zookeeper管理協調請求和轉發(fā)。這樣一個高性能的分布式消息發(fā)布訂閱系統就完成了。

圖上有個細節(jié)需要注意，producer 到 broker 的過程是 push，也就是有數據就推送到 broker，而 consumer 到 broker 的過程是 pull，是通過 consumer 主動去拉數據的，而不是 broker 把數據主懂發(fā)送到 consumer 端的。

四：Zookeeper在kafka的作用

（1）無論是kafka集群，還是producer和consumer都依賴于zookeeper來保證系統可用性集群保存一些meta信息。

（2）Kafka使用zookeeper作為其分布式協調框架，很好的將消息生產、消息存儲、消息消費的過程結合在一起。

（3）同時借助zookeeper，kafka能夠生產者、消費者和broker在內的所以組件在無狀態(tài)的情況下，建立起生產者和消費者的訂閱關系，并實現生產者與消費者的負載均衡。

五：Kafka的特性

1.高吞吐量、低延遲

kafka每秒可以處理幾十萬條消息，它的延遲最低只有幾毫秒，每個topic可以分多個partition, consumer group 對partition進行consume操作。

2.可擴展性

kafka集群支持熱擴展

3.持久性、可靠性

消息被持久化到本地磁盤，并且支持數據備份防止數據丟失

4.容錯性

允許集群中節(jié)點失敗（若副本數量為n,則允許n-1個節(jié)點失敗）

5.高并發(fā)

支持數千個客戶端同時讀寫

Kafka的使用場景：

1.日志收集

一個公司可以用Kafka可以收集各種服務的log，通過kafka以統一接口服務的方式開放給各種consumer，例如hadoop、Hbase、Solr等。

2.消息系統

解耦和生產者和消費者、緩存消息等。

3.用戶活動跟蹤

Kafka經常被用來記錄web用戶或者app用戶的各種活動，如瀏覽網頁、搜索、點擊等活動，這些活動信息被各個服務器發(fā)布到kafka的topic中，然后訂閱者通過訂閱這些topic來做實時的監(jiān)控分析，或者裝載到hadoop、數據倉庫中做離線分析和挖掘。

4.運營指標

Kafka也經常用來記錄運營監(jiān)控數據。包括收集各種分布式應用的數據，生產各種操作的集中反饋，比如報警和報告。

5.流式處理

比如spark streaming和storm

六：ActiveMQ、Kafka、RabbitMQ消息系統的對比

你可能也喜歡:

消息中間件系列（七）：如何從0到1設計一個消息隊列中間件

消息中間件系列（三）：主流的消息隊列中間件有哪些？

消息中間件系列（一）：消息中間件介紹、典型使用場景、以及使用原則

消息中間件系列（四）：消息隊列MQ的特點、選型、及應用場景詳解

消息中間件系列（八）：Kafka、RocketMQ、RabbitMQ等的優(yōu)劣勢比較

消息中間件系列（五）：MQ消息隊列的12點核心原理總結

總結

以上是生活随笔為你收集整理的消息中间件系列(二)：Kafka的原理、基础架构、以及使用场景的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：论文浅尝 - AAAI2020 | 从异
下一篇：论文浅尝 | Convolutional