SCCM 2012系列之一 Operations Manager 关键概念
Operations Manager 關鍵概念
1. Operations Manager 的用途
? ? ?大小型企業通常依賴于其計算環境提供的服務和應用程序。 IT 部門負責確保這些關鍵服務和應用程序的性能和可用性。 這意味著,IT 部門需要知道何時存在問題、找到問題所在以及斷定問題的原因,最好是在應用程序的用戶遇到問題之前。 企業中的計算機和設備越多,此項任務就越復雜。
如果在環境中使用 Operations Manager,則可以更加輕松地監視多個計算機、設備、服務和應用程序。 操作控制臺(如下圖所示)允許你檢查環境中所有監視對象的運行狀況、性能和可用性,并有助于你確定和解決問題。Operations Manager 將告訴你哪些監視的對象不正常,在找到問題時發送警報,并提供信息以幫助你確定問題的原因以及可能的解決方案。 作為管理員,通過選擇要監視的計算機和設備,并導入為特定功能和應用程序提供監視的管理包,你可以配置將要監視的內容。
2. Operations Manager 基礎結構
如果安裝 Operations Manager,則將創建一個管理組。 管理組是功能的基本單位。 管理組至少包含管理服務器、操作數據庫以及報表數據倉庫數據庫。
管理服務器是對管理組進行管理以及與數據庫通信的焦點。 打開操作控制臺并連接到管理組時,你就會連接到該管理組的管理服務器。 根據計算環境的規模,管理組可以包含單個管理服務器或多個管理服務器。
操作數據庫是一個 SQL Server 數據庫,此數據庫包含管理組的所有配置數據,并存儲為管理組收集和處理的所有監視數據。 操作數據庫保留短期數據,默認情況下保留 7 天。
數據倉庫數據庫是一個存儲監視和警報數據以備歷史查詢的 SQL Server 數據庫。 寫入到 Operations Manager 數據庫的數據也會寫入到數據倉庫數據庫,以便報告始終包含當前數據。 數據倉庫數據庫保留長期數據。
安裝 Operations Manager 報表功能時,管理組還包含一個報表服務器,此服務器利用數據倉庫數據庫中的數據建立并提供報表。
管理組的這些核心組件可以存在于單一服務器上,也可以分布在多臺服務器中,如下圖所示。
管理服務器
管理服務器的作用是對管理組配置進行管理,管理代理并與其通信,以及與管理組中的數據庫通信。
管理組可以包含多臺管理服務器以提供其他功能和連續的可用性。 將兩臺或更多臺管理服務器添加到管理組后,管理服務器會變為資源池 的一部分,并且會在池成員中分攤工作。 如果資源池的一個成員出現故障,則資源池中的其他成員將獲取該成員的工作負荷。 添加新管理服務器后,新管理服務器會自動從資源池內的現有成員那里獲取一些工作。 資源池中的所有成員將管理不同的一組遠程對象;在任意給定時間,相同池中的兩個成員將不會同時管理同一對象。
網關服務器是一種特殊類型的管理服務器。 利用網關服務器,可以監視不受信任域中的計算機。 有關詳細信息,請參閱 Monitoring Across Untrusted Boundaries(跨不信任的邊界進行監視)。
代理
Operations Manager“代理”是安裝在計算機上的一項服務。 代理會收集數據、將采樣數據與預定義的值進行比較、創建警報并運行響應。 管理服務器會接收配置并將配置分發到受監視的計算機上的代理。
所有代理均要向管理組中的一個管理服務器報告。 此管理服務器稱為代理的主管理服務器。
代理根據管理服務器發送的配置觀察受監視的計算機上的數據源并收集信息。 此代理還計算監視的計算機以及監視的計算機上的對象的運行狀況狀態,并向管理服務器報告。 監視的對象的運行狀況變化或其他條件滿足時,代理將生成警報。 這樣,操作員可以知道有些東西需要注意。 通過將有關監視對象的運行狀況數據提供給管理服務器,代理提供設備及其主持的所有應用程序的運行狀況的最新狀態。
可以將代理配置為充當代理程序。 代理程序是一個能夠代表計算機或網絡設備(而不是其主機)將數據轉發給管理服務器的代理。 例如,可以啟用安裝在 SQL 群集物理節點上的代理以用作代理來監視群集資源。 代理程序能夠實現監視無法安裝代理的計算機和設備。 有關詳細信息,請參閱 Agentless Monitoring(無代理監視)。
服務
在被監視的計算機上,Operations Manager 代理作為 System Center Management 運行狀況服務被列出。 System Center Management 運行狀況服務收集性能數據、執行任務等。 即使服務無法與它所報告到的管理服務器通信,它仍會在被監視計算機的磁盤上繼續運行并將收集的數據和事件排隊。 當恢復連接時,System Center 管理運行狀況服務會將收集的數據和事件發送到管理服務器。
| System Center Management 運行狀況服務有時也稱為運行狀況服務。 |
System Center Management 運行狀況服務還會在管理服務器上運行。 在管理服務器上,System Center Management 運行狀況服務會運行監視工作流并管理憑據。 為了運行工作流,System Center Management 運行狀況服務會使用指定的憑據啟動 MonitoringHost.exe 進程。 這些進程監視和收集事件日志數據、性能計數器數據、Windows Management Instrumentation (WMI) 數據,并運行諸如腳本之類的操作。
管理服務器還運行 System Center Data Access 服務及 System Center Management Configuration 服務。
System Center Data Access 服務為操作控制臺提供操作數據庫的訪問權限,并將數據寫入數據庫。
System Center Management Configuration 服務對管理組的關系和拓撲進行管理。 它還將管理包分發給受監視的對象。
管理包
System Center 管理服務運行的工作流由管理包來定義。 管理包定義代理收集并返回到特定應用程序或技術的管理服務器的信息。 例如,BizTalk 服務器管理包包含規則和監視器,這些規則和監視器收集并評估對于確保 BizTalk 服務器應用程序的運行狀況和效率非常重要的事件和操作。
當 Operations Manager 在計算機上安裝代理后,它會將初始配置發送給該代理。 初始配置包括管理包中的對象發現。 管理包定義對象類型,如應用程序和功能,這些類型的對象將在 Operations Manager 已經發現的計算機上受到監視。 代理會將數據發送到管理服務器,該管理服務器將標識在計算機上發現的對象的實例。 然后該管理服務器會向代理發送適用于每個計算機的發現對象的管理包元素,如規則和監視器。
規則定義從計算機中收集的事件和性能數據,以及如何處理收集的信息。 考慮規則的一個簡單方式就是 If/Then 語句。 例如,應用程序的管理包可能包含以下這些規則,如:
如果事件日志中顯示一條表明應用程序正在關閉的消息,則創建警報。
如果加載源文件失敗,則收集指明此次失敗的事件。
如這些示例所示,規則可以創建警報,并收集事件或性能數據,代理會將這些事件或性能數據發送到管理服務器。 規則也可以運行腳本,例如允許規則嘗試重新啟動已失敗的應用程序。
發現的對象具有運行狀況狀態,在操作控制臺中此狀態表現為綠色(成功或正常)、×××(警告)或紅色(嚴重或不正常)。 監視器定義受監視對象的特定方面的運行狀況狀態。 例如,磁盤驅動器容量監視器可能會將綠色定義為小于 85% 的填充百分比,將×××定義為大于 85% 的填充百分比,將紅色定義為大于 90% 的填充百分比。 可以將監視器配置為在狀態發生變化時生成警報。
如何發現和監視對象
下圖是如何發現和監視對象的簡化圖。
管理員可將 Operations Manager 配置為搜索要管理的計算機。 有關發現計算機的詳細信息,請參閱 Managing Discovery and Agents(管理發現和代理)。
滿足指定條件且尚未被管理的計算機會被標識出來。
Operations Manager 代理已安裝在發現的計算機上。
代理請求配置數據,然后管理服務器會從包含要發現的類的已安裝管理包中發送代理配置數據。 例如,如果安裝了 Windows Server 操作系統管理包,則管理服務器將向代理發送操作系統類。
代理會將配置數據與計算機進行比較,標識它發現的任何對象,并將信息返回給管理服務器。 例如,代理會將以下信息返回給管理服務器:計算機上存在 Windows Server 2008 R2 操作系統的實例。
管理服務器會從已安裝的管理包中向代理發送適用于發現的對象的所有監視邏輯。 例如,代理將接收適用于 Windows Server 2008 R2 的所有監視邏輯。
代理會應用諸如規則和監視器之類的監視邏輯,運行工作流以及將數據返回給管理服務器。
當發現的對象發生變化時,如正在添加或卸載應用程序,代理會將更新的信息發送給管理服務器,然后該管理服務器會發送更新的監視邏輯。
| Operations Manager 也可以發現和監視網絡設備以及運行 UNIX 和 Linux 操作系統的計算機,并且可以提供無代理監視。 有關詳細信息,請參閱操作指南中的 Operations Manager Monitoring Scenarios(Operations Manager 監視方案)。 |
代理和管理服務器之間的通信
Operations Manager 代理會將警報和發現數據發送給主管理服務器,此服務器會將數據寫入操作數據庫。 此代理還會將事件、性能和狀態數據發送給主管理服務器,此服務器會將數據同時寫入操作數據庫和數據倉庫數據庫。
代理會根據每個規則和監視器的計劃參數發送數據。 對于優化的收集規則,只有當計數器樣本與先前樣本之差達到指定容差(如 10%)時,才會傳輸數據。 這將有助于減少網絡流量以及操作數據庫中存儲的數據量。
此外,所有代理會按定期計劃向管理服務器發送數據包,此數據包稱為檢測信號;默認情況下,每 60 秒發送一次。 檢測信號的用途是驗證代理的可用性以及代理與管理服務器之間的通信。 有關檢測信號的詳細信息,請參閱 How Heartbeats Work in Operations Manager(檢測信號在 Operations Manager 中的工作原理)。
對于每個代理,Operations Manager 將運行運行狀況服務觀察程序,此程序從管理服務器的角度監視遠程運行狀況服務的狀態。
轉載于:https://blog.51cto.com/adam1943/1296342
總結
以上是生活随笔為你收集整理的SCCM 2012系列之一 Operations Manager 关键概念的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: HDU 1828 Picture 线段树
- 下一篇: WPF 的拖拽操作(DragDrop)