监控zabbix面试题
目錄
1.我們可以用zabbix監控哪些
2.zabbix的主動監控與被動監控
3.Zabbix監控做過哪些
4.zabbix監控mysql的四大性能指標:
5.配置zabbix自定義監控流程
6.安全組是什么,限制了3306的入規則,客戶端還能訪問嗎
7.Nagio監控?
8.服務器一般需要監控哪些項目? 憑借這些項目如何判斷服務器的瓶頸?
9.zabbix監控mysql的io情況是否正常的流程
10.監控MySQL主從同步是否異常,如果異常,則發送短信或者郵件給管理員。
11.zabbix如何修改其中監控的一臺服務器中內存閾值信息,比如正常內存使用到了 80%報**警,我想修改為 60%報警?
12.報警類型和故障處理:
13.告警屏蔽:
1.我們可以用zabbix監控哪些
1.硬件監控。 通過SNMP來進行路由器交換機的監控 2.系統監控。 如CPU的負載,上下文切換、內存使用率、磁盤讀寫、磁盤使用率、磁盤inode節點。 3.服務監控。 比如公司用LNMP nginx自帶Status模塊、PHP也有相關的Status、 MySQL的話可以通過percona來進行監控。4.網絡監控。 如果是云主機又不是跨機房,那么可以選擇不監控網絡。 5.安全監控。 如果是云主機可以考慮使用自帶的安全防護。當然也可以使用iptables。 如果是硬件,那么推薦使用硬件防火墻。 6.Web監控。 web監控的話題其實還是很多。比如可以使用自帶的web監控來監控頁面相關的延遲、 js響應時間、下載時間、等等。 7.日志監控。 如果是web的話可以使用監控Nginx的500x日志。 PHP的ERROR日志。 8.流量分析。 平時我們分析日志都是拿awk sed xxx一堆工具來實現。 這樣對我們統計ip、pv、uv不是很方便。那么可以使用百度統計、 google統計、商業,讓開發嵌入代碼即可 9.可視化。 通過screen以及引入一 些第三方的庫來美化界面,同時我們也需要知道、訂單量突然增加、 突然減少。或者說突然來了一大波流量,這流量從哪兒來,是不是推廣了, 還是被攻擊了。可以結合監控平來來梳理各個系統之間的業務關系。 10.自動化監控。 如上我們做了那么多的工作,當然不能是一臺一臺的來加key實現。 可以通過Zabbix的主動模式以及被動模式來實現。當然最好還是通過API來實現。2.zabbix的主動監控與被動監控
主動監控和被動監控都是相對于被監控端主機而言的 默認zabbix采用被動監控 當監控主機達到一定量級后,zabbix服務器會越來越慢,此時可以考慮使用主動監控,釋放服務器的壓力zabbix也支持分布式監控 被動監控:server向Agent發起連接,發送監控key,Agent接受請求,響應監控數據 主動監控:Agent向server發起連接,Agent請求需要檢測監控項目列表,server相應Agent發送一個items列表,Agent確認收到監控列表,TCP連接完成,會話關閉,Agent開始周期性收集數據 區別: server不用每次需要數據都連接Agent,Agent會自己收集數據并處理數據,Server僅需要保存數據即可3.Zabbix監控做過哪些
zabbix監控mysql集群:1)創建并編輯監控mysql的腳本(通常有腳本模板),添加執行權限
?????????2)修改zabbix-agent配置文件,默認有一個MySQL的子配置文件,直接編輯該文件即可,數據庫添加授權用戶
?????????3)重啟zabbix-agent
???????4)Web界面配置、點擊需要監控的主機,進去添加監控模板,自帶的Template DB MySQL
?????????5)配置完成后等一會兒就可以查看到監控主機的MySQL監控信息
如果發現監控沒有數據,請排查如下問題
\1. zabbix客戶端是否重啟
\2. 腳本是否有執行權限
\3. 數據庫是否有用戶授權
\4. 環境變量是否有問題
4.zabbix監控mysql的四大性能指標:
????????查詢吞吐量 ?
????????查詢執行性能 ?
????????連接情況
????????緩沖池使用情況
5.配置zabbix自定義監控流程
①被監控端修改Agent配置文件(修改是否允許自定義key,加載配置文件目錄) ②被監控端創建存放自定義key文件(在zabbix_agentd.conf文件中定義),書寫自定義key③重起客戶端agentd ④測試自定義key是否生效 ⑤在zabbix頁面創建監控模板,創建應用,創建監控項,關聯主機6.安全組是什么,限制了3306的入規則,客戶端還能訪問嗎
因為安全組的默認規則是在出方向上的數據報文全部放行,同一個安全組內的彈性云服務器和華為云關系型數據庫實例可互相訪問。 默認情況下,一個租戶可以創建500條安全組規則。 為一個安全組設置過多的安全組規則會增加首包延時,因此,建議一個安全組內的安全組規則不超過50條。 當需要從安全組外訪問安全組內的華為云關系型數據庫實例時,需要為安全組添加相應的入方向規則。 限制了3306的入規則,客戶端就沒有辦法訪問了,就好像ping一樣7.Nagio監控?
不用存儲歷史數據,注重服務或者監控項的狀態 Nagios是一款開源的免費網絡監視工具,能有效監控Windows、Linux和Unix的主機狀態,交換機路由器等網絡設置,打印機等。在系統或服務狀態異常時發出郵件或短信報警第一時間通知網站運維人員,在狀態恢復后發出正常的郵件或短信通知。; Nagios 可以監控的功能有: 監控網絡服務(SMTP、POP3、HTTP、NNTP、PING等); 監控主機資源(處理器負荷、磁盤利用率等); 簡單地插件設計使得用戶可以方便地擴展自己服務的檢測方法; 并行服務檢查機制; 具備定義網絡分層結構的能力,用"parent"主機定義來表達網絡主機間的關系,這種關系可被用來發現和明晰主機宕機或不可達狀態; 當服務或主機問題產生與解決時將告警發送給聯系人(通過EMail、短信、用戶定義方式); 可以定義一些處理程序,使之能夠在服務或者主機發生故障時起到預防作用; 自動的日志滾動功能; 可以支持并實現對主機的冗余監控; 可選的WEB界面用于查看當前的網絡狀態、通知和故障歷史、日志文件等;8.服務器一般需要監控哪些項目? 憑借這些項目如何判斷服務器的瓶頸?
1)比如網站故障監控、服務器性能監控、網站安全監控、用戶訪問速度監控等;內存,IO,
CPU,網絡,這個四個模塊是必須的;
2)不能單一指標衡量性能瓶頸,比如說是IO出現在性能瓶頸:
第一種是調整緩沖區的大小、調整緩沖區中的數據同步的磁盤中的時間
第二種是修改磁盤調度算法,查看的路徑cat /sys/bock/sda/queue/scheduler
9.zabbix監控mysql的io情況是否正常的流程
在zabbix的配置文件中開啟自定義監控 編寫監控腳本,過濾出mysql的IO線程是否為yes 編寫自定義監控文件,監控腳本 測試定義的監控命令是否成功 在zabbix網頁中自定義監控項,添加監控文件中的UserParameter10.監控MySQL主從同步是否異常,如果異常,則發送短信或者郵件給管理員。
a. 開發一個守護進程腳本每30秒實現檢測一次。 b. 如果同步出現如下錯誤號(1158,1159,1008,1007,1062),則跳過錯誤。 c. 請使用數組技術實現上述腳本(獲取主從判斷及錯誤號部分)。 #!/bin/bash mysqlbin=/usr/bin/mysql mysqlhost=127.0.0.1 mysqluser=root mysqlpwd=root skiperrors=(1158 1159 1008 1007 1062) admin='email@qq.com' check() { LASTNO= mysqlbin -h mysqluser -p$mysqlpwd -e "show slave status\G"|grep Last_Errno|awk -F: '{print $2}') } skip() { for errorno in? skiperrors[@];doif[errorno == LASTNO] ;thrnnotifyerrorno break fi done } notify() { text="mysql slave monitor error: I "echotext|mail -s 'mysql error' } main() { while :;do check && skip || notify "mysql connected failed!" sleep 30 done } main11.zabbix如何修改其中監控的一臺服務器中內存閾值信息,比如正常內存使用到了 80%報**警,我想修改為 60%報警?
正常來說,一般會把監控的服務器統一加入到一個模板中,修改模板的其是某一項的監控項 參數和告警閾值后,加入模板中的所有主機都會同步。如果單獨想修改其中某一臺服務器內 存告警閾值,需要進入這臺主機,單獨創建一個告警 Triggers,關聯這臺主機監控內存的項, 配置好告警的閾值為 60%即可實現。12.報警類型和故障處理:
1.E-mail 郵件 2.微信報警等
故障:如監控服務器down機不報警
解決:1.先定位問題:zabbix服務器采用輪詢的方式從監控目標機的agent獲取數據。但如果目標機down了,目標機的agent通常也無法工作,所以檢查被監控的主機服務
2.增加一個目標主機進行是否存活的檢測。
告警收斂:
????????1)所有產生告警均由zabbix調用腳本推入緩存redis當中。
????????2)分析系統將在規定時間(1分鐘)內去redis中拉取數據,根據定義好的一系列規則進行,合并、分析或直接丟棄,并存入分析平臺數據庫,以便供歷史查詢。
????????3)根據預先定義好的規則將報警通過定義好的方式發送給相關人員。
13.告警屏蔽:
1、處于維護中的主機,告警信息還是會報出來,但是不會觸發動作;
2、對于可預知的臨時維護或緊急維護,可以提前設置告警屏蔽;
3、可針對組、單臺或多臺主機,進行一次性、每日定時、每月定時、每周定時屏蔽;
4、前端可以將維護中的主機不進行顯示,Dashboard右上角有個圖標可以進行篩選是否顯示維護中的主機;
5、告警屏蔽時,可以設置采集數據或不采集數據兩種方式;
至此,zabbix的告警屏蔽介紹完成。
總結
以上是生活随笔為你收集整理的监控zabbix面试题的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: docker与k8s面试题基础
- 下一篇: Web运维面试题