0207.Domino R8.0.x群集配置手册
1. 服務(wù)器要求
- 集群中的所有服務(wù)器必須基于 IBM(R) Lotus(R) Domino(TM) Enterprise 服務(wù)器或 Domino Utility 服務(wù)器運(yùn)行。
- 集群中的所有服務(wù)器必須使用高速 LAN(局域網(wǎng))或高速 WAN(廣域網(wǎng))進(jìn)行連接。也可以為集群通訊設(shè)置專用局域網(wǎng)。
- 集群中的所有服務(wù)器必須使用 TCP/IP 并處于相同的 IBM(R) Lotus(R) Notes(R) 命名網(wǎng)絡(luò)中
- 集群中所有的服務(wù)器必須在同一 Domino 域中,并且共享一個公用 Domino 目錄。
- 必須在包含集群的域中為 Domino 目錄指定一個管理服務(wù)器。如果不指定管理服務(wù)器,那么管理進(jìn)程便無法更改集群成員。管理服務(wù)器并非必須是集群的成員。
- 集群中的每個服務(wù)器必須有層次服務(wù)器標(biāo)識。如果任何服務(wù)器具有平級的標(biāo)識,則必須將平級標(biāo)識轉(zhuǎn)換為層次標(biāo)識,這樣才能在集群中使用它們。
- 一個服務(wù)器不能同時是多個集群的成員。
- 每個服務(wù)器必須有足夠的磁盤空間,才能承擔(dān)集群成員的任務(wù)。因?yàn)榧和ǔP枰嗟臄?shù)據(jù)庫副本,所以集群中的服務(wù)器比非集群服務(wù)器需要更多的磁盤空間。
- 每個服務(wù)器必須具有足夠的處理能力和內(nèi)存容量。一般來說,集群的服務(wù)器比非集群的服務(wù)器需要更高的性能。
2. 硬件方面考慮
磁盤空間的大小和每臺服務(wù)器的處理能力可以影響集群中包含的服務(wù)器數(shù)量。決定要在集群中使用的硬件時,請牢記以下幾點(diǎn):
-
創(chuàng)建的副本越多,集群復(fù)制所需的磁盤空間和處理能力就越大。
-
集群數(shù)據(jù)庫目錄需要的磁盤空間大約為?2M?,集群中每兩千個數(shù)據(jù)庫還需要?1M?額外空間。
-
集群中的服務(wù)器越多,每臺服務(wù)器就需要使用更強(qiáng)大的處理能力與其他集群服務(wù)器進(jìn)行通信。
-
在服務(wù)器上運(yùn)行的服務(wù)器任務(wù)和占用大量?CPU?資源的應(yīng)用程序越多,所需的處理能力就越大。
-
每臺服務(wù)器不但對它所包含的數(shù)據(jù)庫要有足夠的處理能力,而且對可能故障轉(zhuǎn)移到此服務(wù)器的任何數(shù)據(jù)庫都要有足夠的處理能力。
-
集群服務(wù)器需要的內(nèi)存比非集群服務(wù)器更多。實(shí)際所需的內(nèi)存大小取決于服務(wù)器上的活動級別。
-
要查看計(jì)算機(jī)是否需要額外的內(nèi)存或處理能力,請檢查平臺統(tǒng)計(jì)信息。
-
當(dāng)有大集群或工作負(fù)載很重的集群時,可能需要使用多個集群復(fù)制器來提高集群復(fù)制的性能。請檢查集群復(fù)制器統(tǒng)計(jì)信息,以查看等候處理的數(shù)據(jù)庫隊(duì)列是否很長。如果很長,請一次添加一個集群復(fù)制器,直至統(tǒng)計(jì)信息提高到足夠水平。
-
因?yàn)榧簭?fù)制器占用系統(tǒng)資源,所以添加集群復(fù)制器時,系統(tǒng)的整體性能可能會下降。因此,不要添加太多的集群復(fù)制器,夠用即可。
3. 前期準(zhǔn)備
3.1 確定是否為集群創(chuàng)建專用局域網(wǎng)
要使繁忙的集群更加有效,可為集群創(chuàng)建專用網(wǎng)絡(luò)。為此,請?jiān)诿颗_集群服務(wù)器上多安裝一塊網(wǎng)卡,并通過專用集線器或切換器連接這些網(wǎng)絡(luò)接口卡。
為集群創(chuàng)建專用局域網(wǎng)的主要原因是為了將集群在使用集群復(fù)制和服務(wù)器探測信號時所產(chǎn)生的網(wǎng)絡(luò)流量獨(dú)立出來。專用局域網(wǎng)可以將可用帶寬更多地留給主局域網(wǎng)。如果估計(jì)可能使用大量的集群復(fù)制活動,則應(yīng)創(chuàng)建專用局域網(wǎng)。
另外,還可以考慮為內(nèi)部集群通訊創(chuàng)建專用局域網(wǎng),即使在出現(xiàn)某種網(wǎng)絡(luò)故障時,也可以保證集群服務(wù)器之間的通訊。通過添加專用網(wǎng)絡(luò),集群中的所有服務(wù)器至少由兩種不同的局域網(wǎng)段連接。因此,如果一個局域網(wǎng)段上的網(wǎng)絡(luò)插頭或電纜出現(xiàn)故障,集群中的所有服務(wù)器之間仍然具有網(wǎng)絡(luò)連接。這樣就可以確保集群服務(wù)器相互之間仍保持聯(lián)系,并繼續(xù)進(jìn)行集群復(fù)制以保持?jǐn)?shù)據(jù)庫同步。
如果為集群創(chuàng)建專用局域網(wǎng),必須將所有的集群成員同時連接到專用局域網(wǎng)(用于內(nèi)部集群通訊)和主局域網(wǎng)(用于客戶機(jī)訪問)。
3.2?為每塊網(wǎng)卡指定IP
輸入命令smit tcpip?,出現(xiàn)以下圖:
選擇“Minimum Configuration & Startup”?,進(jìn)入如下畫面:
?
選擇相應(yīng)的網(wǎng)卡,如en0?或en1,?輸入回車,如下圖:
填寫相關(guān)IP?設(shè)置信息,輸入回車。返回信息如下圖:
?IP?設(shè)置完成。
使用以上方法設(shè)置其他網(wǎng)卡
?
| 設(shè)備 | 網(wǎng)卡設(shè)備名 | IP?地址 | 主機(jī)名 |
| 服務(wù)器01 | en0 | 10.1.177.18 | dev01.acme.com |
| ? | en1 | 10.1.177.28 | clunode01 |
| 服務(wù)器02 | en0 | 10.1.177.19 | dev02.acme.com |
| ? | en1 | 10.1.177.29 | clunode02 |
?
3.3?測試?IP?與主機(jī)名是否生效
在每臺服務(wù)器上輸入以下命令
ping 10.1.177.18
ping 10.1.177.19
ping 10.1.177.28
ping 10.1.177.29
ping dev01.acme.com
ping dev02.acme.com
ping clunode01
ping clunode02
?
請確認(rèn)以上在兩臺服務(wù)器之間均能ping?通。
4. 安裝Domino Server R8.02
參考 Domino安裝文檔
5. 配置集群
5.1 為每臺服務(wù)器添加cluster端口
?
| 項(xiàng)目 | 值 |
| 端口 | CLUSTER |
| 協(xié)議 | TCP |
| Notes?網(wǎng)絡(luò) | 集群網(wǎng)絡(luò) |
| 網(wǎng)絡(luò)地址 | clunode01 clunode02 |
| 啟用 | ENABLED |
?
為DevSVR01?添加端口,打開公共地址本,相應(yīng)服務(wù)器文檔,如下圖:
以相同的方法為DevSVR02?添加端口,網(wǎng)絡(luò)地址為clunode02?。
5.2?從相應(yīng)的子網(wǎng)中為每個端口分配一個?IP?地址
修改DevSVR01?的notes.ini?,輸入如下命令:
vi /data2/devsvr01/notes.ini
修改如下圖:
從相應(yīng)的子網(wǎng)中為每個端口分配一個?IP?地址,并且將此信息以下列格式置于?NOTES.INI?文件中:
PORT1_?TcpIPAddress=0,?a.b.c.d?:1352
PORT2_?TcpIPAddress=0,?e.f.g.h?:1352
其中?PORT1?和?PORT2?是端口名稱,而?a.b.c.d?和?e.f.g.h?是這些端口的?IP?地址。
例如,如果端口名稱為?TCPIP?和?CLUSTER?,則這些信息可能是:
TCPIP_TcpIPAddress=0,192.114.32.5:1352
CLUSTER_TcpIPAddress=0,192.168.64.1:1352
以相同的方法設(shè)置DevSVR02?的notes.ini?。
5.3?確保所有集群通訊使用此集群通訊端口
將下列行添加到 NOTES.INI 文件中:Server_Cluster_Default_Port=?Cluster Port?
其中?Cluster Por?是為集群創(chuàng)建的端口。在本樣例中,此行應(yīng)為:
Server_Cluster_Default_Port=CLUSTER
這將確保所有集群通訊使用此集群通訊端口,而不管該端口所在的順序。
注意:使用 Server_Cluster_Default_Port 設(shè)置將端口分配到集群通訊的專用局域網(wǎng)的方法存在一個缺點(diǎn)。如果集群服務(wù)器在此端口上連接時遇到問題,它將嘗試另一個端口。因此,該服務(wù)器將能夠與其他集群服務(wù)器進(jìn)行通訊或復(fù)制。在該服務(wù)器可以與集群再次通訊之前,必須解決網(wǎng)絡(luò)問題或從 NOTES.INI 文件中刪除此設(shè)置。?5.4?創(chuàng)建集群
打開DevSVR01/ChemChina?服務(wù)器上的names.nsf?,打開服務(wù)器視圖,先中所有要加入至集群的服務(wù)器文檔,單擊”Add Cluster”?按鈕,如下圖:
出現(xiàn)對話框后,單擊“是”,出現(xiàn)如下圖:
選擇“Create New Cluster”?,單擊“確定”,彈出輸入集群名稱對話框,如下圖:
輸入集群名稱:ClusterDev?,點(diǎn)擊“確定”,出現(xiàn)以下圖:
點(diǎn)擊“是”,立即執(zhí)行;
點(diǎn)擊“否”,由服務(wù)器管理進(jìn)程執(zhí)行
Domino?集群已創(chuàng)建成功,在控制臺使用以下命令將地址本同步至DevSVR02?上;
Repl devsvr02/chemchina names.nsf
完成后,重啟所有集群中的服務(wù)器。
5.4 驗(yàn)證集群
重啟服務(wù)后,domino?會自動啟動兩個服務(wù)--?Cluster Replicator?和Cluster Director?服務(wù)。在控制臺輸入show task?,如下圖:
輸入show cluster?,查看群集狀態(tài),如下圖:
如果availability index?為無效,則說明服務(wù)器宕機(jī)我停止服務(wù),或當(dāng)前服務(wù)器無法連接至相關(guān)服務(wù)器。確認(rèn)Server cluster default port?是否為你指定的集群通訊端口。
6. 其他調(diào)整
6.1 關(guān)閉Domino模板的群集復(fù)制
為了減少集群之間服務(wù)器的復(fù)制流量,標(biāo)準(zhǔn)的模板或沒有在集群之間部署的數(shù)據(jù)庫都應(yīng)該關(guān)閉集群復(fù)功能,需要時再打開。使用Domino Administrator?進(jìn)行設(shè)置,如下圖:
在工具面板中選擇“集群”->“?禁用集群復(fù)制”,點(diǎn)擊確定,即可。
6.2? 用于集群復(fù)制的 Tell 命令
?
| 命令 | 顯示的信息 | 用途 |
| tell clrepl dump |
|
|
| tell clrepl dump server |
|
|
| tell clrepl dump retry |
|
|
| tell clrepl pause | 暫停集群復(fù)制器 | |
| tell clrepl resume | 繼續(xù)集群復(fù)制器 | |
| tell clrepl retry | 強(qiáng)制集群復(fù)制器立即重試失敗的復(fù)制 | |
| tell clrepl refresh | 強(qiáng)制集群復(fù)制器立即更新集群數(shù)據(jù)庫目錄信息 | |
| tell clrepl log | 強(qiáng)制集群復(fù)制器立即記錄 | |
| show stat server.cluster* | 查看集群管理器事件和統(tǒng)計(jì)信息 | |
| show stat replica.cluster* | 查看集群復(fù)制事件和統(tǒng)計(jì)信息 | |
?
6.3 注意事項(xiàng)
集群目錄數(shù)據(jù)庫(cldbdir.nsf)?在所有集群服務(wù)器上必須的一致。如果不一致時,使用復(fù)制功能,手工強(qiáng)制復(fù)制。
7.? Domino 集群中的工作負(fù)載平衡
為?Lotus Domino?服務(wù)器創(chuàng)建集群還提供活動的負(fù)載平衡,從而更好地利用資源。我們可以通過以下步驟在?Domino?服務(wù)器之間實(shí)現(xiàn)工作負(fù)載平衡:
-
限制每個服務(wù)器的工作負(fù)載(更改服務(wù)器可用性閾值)
-
更改可以同時訪問某個服務(wù)器的最大用戶數(shù)
-
將數(shù)據(jù)庫移動(分發(fā))到其他服務(wù)器
-
在集群中計(jì)劃和放置副本,為繁忙的數(shù)據(jù)庫創(chuàng)建更多的副本
-
向集群添加一個或多個服務(wù)器
-
使用?Activity Trends?工具分析集群的情況并提供建議
一定要記住,工作負(fù)載平衡并不能解決企業(yè)的總體計(jì)算能力匱乏問題。如果您的?Domino?服務(wù)器目前已經(jīng)不堪重負(fù),并且沒有額外的服務(wù)器處理更多的負(fù)載,那么啟用工作負(fù)載平衡也不能解決問題。
要平衡工作負(fù)載,必須能夠?qū)⒊d的服務(wù)器的過剩負(fù)載發(fā)送到其他服務(wù)器。如果沒有接受過剩負(fù)載的服務(wù)器,那么這些負(fù)載還得由原來的服務(wù)器處理。
不過要注意,為每個請求查找另一個可用的服務(wù)器增加了服務(wù)器的工作負(fù)載。如果您的企業(yè)沒有足夠的計(jì)算能力,可以考慮增加處理器或內(nèi)存,或者升級設(shè)備以處理更多的負(fù)載。
如果您的集群的負(fù)載一般都比較平均分布,那么可以僅考慮配置故障轉(zhuǎn)移,而不需配置工作負(fù)載平衡。
7.1 服務(wù)器可用性指數(shù)
服務(wù)器可用性指數(shù)是管理工作負(fù)載平衡的重要設(shè)置;因此,為了實(shí)現(xiàn)高效的工作負(fù)載平衡,我們需要了解什么是工作負(fù)載平衡以及如何計(jì)算它。?集群中的每個服務(wù)器都定期根據(jù)服務(wù)器最近處理請求的響應(yīng)時間確定其工作負(fù)載。工作負(fù)載由 0 至 100 的數(shù)字表示,0 表示服務(wù)器的負(fù)載非常繁忙,而 100 表示服務(wù)器的負(fù)載很輕松。這個數(shù)字稱為服務(wù)器可用性指數(shù)。服務(wù)器可用性指數(shù)隨著響應(yīng)時間的變長而下降。?
服務(wù)器可用性指數(shù)大約等于服務(wù)器可用計(jì)算能力百分比。例如,如果服務(wù)器可用性指數(shù)為65,那么您的服務(wù)器大約有 65% 的計(jì)算能力是可用的。?
盡管企業(yè)中的各個服務(wù)器在計(jì)算能力上可能不同,但可用性指數(shù)在每個服務(wù)器上都表示相同的含義 —— 服務(wù)器中仍然可用的計(jì)算能力。
7.2 膨脹系數(shù)
服務(wù)器的可用性指數(shù)基于一個表示服務(wù)器的當(dāng)前工作負(fù)載的膨脹系數(shù)。膨脹系數(shù)取決于特定類型的事務(wù)的最近響應(yīng)時間與服務(wù)器以前處理該事務(wù)時所用的最小時間之比。?例如,如果服務(wù)器當(dāng)前執(zhí)行 Database Open 事務(wù)的平均響應(yīng)時間為 12 微秒,但是服務(wù)器以前處理 Database Open 事務(wù)的最小時間為 3 微秒,那么 Database Open 事務(wù)的膨脹系數(shù)應(yīng)該為 4(用當(dāng)前的 12 微秒除以最快響應(yīng)時間 3 微秒)。?
換句話說,膨脹系數(shù)決定當(dāng)前完成某個事務(wù)比最佳條件下完成該事務(wù)要延長多少時間。?
Lotus Domino 將每種類型事務(wù)的最小完成時間儲存在內(nèi)存和 LOADMON.NCF 文件中,服務(wù)器每次啟動時都會讀取該文件中的信息。當(dāng)服務(wù)器關(guān)閉時,Lotus Domino 將使用最新的信息更新 LOADMON.NCF 文件。?
為了確定當(dāng)前的膨脹系數(shù),Lotus Domino 在一段特定的時間內(nèi)跟蹤最常用的 Domino 事務(wù),默認(rèn)情況下每次跟蹤時長為 15 秒,跟蹤次數(shù)為 5 次。?
然后,Lotus Domino 確定它完成每種類型的事務(wù)所需的平均時間,然后用它以前完成相同事務(wù)的最小時間除該時間。通過這種方式可以確定每種類型的事務(wù)的膨脹系數(shù)。?
為了確定整個服務(wù)器的膨脹系數(shù),Lotus Domino 將求取所有類型事務(wù)的膨脹系數(shù)的平均值,并且增加最常用的事務(wù)類型的權(quán)重。?
隨著服務(wù)器變得越來越繁忙,添加額外的負(fù)載會對性能和可用性產(chǎn)生更大的影響。換句話說,向繁忙的服務(wù)器添加額外的工作負(fù)載比向不那么繁忙的服務(wù)器添加額外的工作負(fù)載得到更大的膨脹系數(shù)。?
由于服務(wù)器的速度、容量和計(jì)算能力不同,因此它們能夠處理的工作負(fù)載量也不同。因此,在兩個不同的服務(wù)器上,相同的膨脹系數(shù)不一定表示它們擁有相同的工作負(fù)載。?
例如,如果一個小型服務(wù)器在空閑時需要很長時間執(zhí)行事務(wù),那么膨脹系數(shù)為 40 可能表明用戶需要等待很長時間。但是,在更大更快的服務(wù)器上,即使膨脹系數(shù)為 400,用戶需要等待的時間可能也會少于 1 秒。
可用性指數(shù)和膨脹系數(shù)對比?
為了確定服務(wù)器的可用性指數(shù),Lotus Domino 使用一個公式將膨脹系數(shù)轉(zhuǎn)換成服務(wù)器的可用計(jì)算能力的近似值。
?
| 膨脹系數(shù) | 可用性指數(shù) |
| 1 | 100 |
| 2 | 83 |
| 4 | 67 |
| 8 | 50 |
| 16 | 33 |
| 32 | 17 |
| 64 | 0 |
?
注意:膨脹系數(shù)和可用性指數(shù)僅度量服務(wù)器的響應(yīng)時間,服務(wù)器響應(yīng)時間通常只是客戶端經(jīng)歷的響應(yīng)時間的一小部分。例如,客戶端和服務(wù)器之間的網(wǎng)絡(luò)響應(yīng)時間在客戶端經(jīng)歷的響應(yīng)時間中占據(jù)很大比重。
更改表示服務(wù)器滿載的膨脹系數(shù)值
為了讓 Domino 工作負(fù)載平衡更高效,您必須調(diào)整膨脹系數(shù)和可用性指數(shù)之間的關(guān)系,讓服務(wù)器在達(dá)到您指定的工作負(fù)載時執(zhí)行故障轉(zhuǎn)移。您可以通過指定表示服務(wù)器滿載的膨脹系數(shù)值來實(shí)現(xiàn)這個目的。?在?Lotus Domino?服務(wù)器中,默認(rèn)值為?64?。當(dāng)膨脹系數(shù)達(dá)到這個值時,就認(rèn)為服務(wù)器已經(jīng)滿載,這時它的可用性指數(shù)就下降到?0?。
技巧:您可以通過?Show AI?服務(wù)器命令查看推薦的可用性指數(shù)設(shè)置。
如果您的服務(wù)器非常強(qiáng)勁快速,您可以增加表示服務(wù)器滿載的膨脹系數(shù)值。在一些非常快的服務(wù)器上,您可以將該值設(shè)置為幾百或更高。如果您的服務(wù)器很慢,則可以考慮降低膨脹系數(shù)值。
?
要更改表示服務(wù)器滿載的膨脹系數(shù)值,請遵循以下步驟:
SERVER_TRANSINFO_RANGE=n
注:對于?n?值,您可以選擇一個數(shù)字,讓?2?的?n?次方等于您希望表示服務(wù)器滿載的膨脹系數(shù)值。?n?的默認(rèn)值為?6?,那么得出的膨脹系數(shù)值為64?(因?yàn)?2?的?6?次方等于?64?)。
如果您將?SERVER_TRANSINFO_RANGE?設(shè)置為?7?,那么表示服務(wù)器滿載的膨脹系數(shù)值則為?128?。如果將該參數(shù)設(shè)置為?8?,那么膨脹系數(shù)值就變成?256?。
為了確定?SERVER_TRANSINFO_RANGE?的最佳值,請遵循以下步驟:
- 在服務(wù)器繁忙使用期間使用控制臺命令?show stat server.expansionfactor?監(jiān)控它的膨脹系數(shù)。您還可以在此期間監(jiān)控性能統(tǒng)計(jì)數(shù)據(jù)。在繁忙時期記錄足夠的膨脹系數(shù)值,以確定表示服務(wù)器滿載時的膨脹系數(shù)值。
- 為?SERVER_TRANSINFO_RANGE?確定一個值,將該值作為?2?的指數(shù)得出的結(jié)果應(yīng)該為您在步驟?1?中選擇的膨脹系數(shù)值。當(dāng)更改表示服務(wù)器滿載的膨脹系數(shù)值時,膨脹系數(shù)和可用性指數(shù)之間的關(guān)系就會發(fā)生變化。
?
| 膨脹系數(shù) | 可用性指數(shù) |
| 1 | 100 |
| 2 | 88 |
| 4 | 75 |
| 8 | 63 |
| 16 | 50 |
| 32 | 38 |
| 64 | 25 |
| 128 | 13 |
| 256 | 0 |
?
- 使用服務(wù)器控制臺命令?Show AI?為該變量獲取一個適當(dāng)?shù)闹怠T趲ж?fù)載運(yùn)行服務(wù)器一段時間之后輸入命令,控制臺將顯示該服務(wù)器的膨脹系數(shù)歷史和?AI?。
改變用于計(jì)算膨脹系數(shù)的數(shù)據(jù)量
盡管一般情況下沒有必要這樣做,但是您可以使用下面的?Notes.ini?設(shè)置更改Lotus Domino?收集用于計(jì)算膨脹系數(shù)的數(shù)據(jù)量。
更改數(shù)據(jù)收集周期的次數(shù):
Server_Transinfo_Max=x
其中?x?是您希望?Lotus Domino?使用的收集周期次數(shù)。
更改數(shù)據(jù)收集周期的時間長度:
?
Server_Transinfo_Update_I nterval=x
其中?x?是每個周期的時長,單位為秒。
7.3? 與工作負(fù)載平衡相關(guān)的統(tǒng)計(jì)數(shù)據(jù)
?
| 項(xiàng)目 | 描述 |
| Server.AvailabilityIndex | 服務(wù)器可用性指數(shù)的當(dāng)前值。可用性指數(shù)的值的范圍是0?至?100?。?0?表示服務(wù)器沒有可用資源。?100?表示服務(wù)器完全可用 |
| Server. Expansion Factor | 服務(wù)器膨脹系數(shù)的當(dāng)前值。該值用于計(jì)算可用性指數(shù)。值為?1?時表示服務(wù)器以最小時間完成事務(wù)。值為?64?時表示完成事務(wù)所需的時間是最小時間的?64?倍。默認(rèn)情況下,膨脹系數(shù)為?64?時表示服務(wù)器滿載,轉(zhuǎn)換成可用性指數(shù)為?0?。您可以通過?Notes.ini?設(shè)置的Server_Transinfo_Range?更改表示服務(wù)器滿載的膨脹系數(shù)。 您可以使用服務(wù)器命令?Show AI?獲取推薦的可用性指數(shù)。 |
| Server.Cluster.OpenRedirects. LoadBalance.Successful | 繁忙服務(wù)器成功將客戶端重定向到另一個集群成員的次數(shù) |
| Server.Cluster.OpenRedirects.LoadBalance.Unsuccessful | 繁忙服務(wù)器沒有成功將客戶端重定向到另一個集群成員的次數(shù)。如果目標(biāo)服務(wù)器的狀態(tài)為繁忙或不可用,那么重定向?qū)⒉怀晒?/span> |
| Server.Cluster.OpenRequest.ClusterBusy | 當(dāng)所有集群服務(wù)器都處于繁忙狀態(tài)時繁忙服務(wù)器嘗試重定向客戶端請求的次數(shù) |
| Server.Cluster.OpenRequest.LoadBalanced | 用戶試圖打開狀態(tài)為繁忙的服務(wù)器的數(shù)據(jù)庫的次數(shù) |
?
對比集群中的所有服務(wù)器的這些數(shù)據(jù),然后更改負(fù)載沒有良好平衡的服務(wù)器的可用性閾值。
技巧?:工作負(fù)載平衡并不是為企業(yè)提供足夠計(jì)算資源的代替辦法。如果所有服務(wù)器已經(jīng)超載,那么啟用負(fù)載平衡會帶來更多問題,因?yàn)闆]有存放繁忙服務(wù)器重定向的客戶端請求的地方。另外,查找可用服務(wù)器會降低處于繁忙狀態(tài)下的服務(wù)器的性能。
7.4 設(shè)置服務(wù)器的最大用戶數(shù)
您還可以通過?Notes.ini?設(shè)置服務(wù)器的最大用戶數(shù)實(shí)現(xiàn)集群工作負(fù)載平衡:
Server_MaxUsers=n
?
該設(shè)置指定服務(wù)器同時允許的最大活動用戶數(shù)量。當(dāng)服務(wù)器達(dá)到該極限時,服務(wù)器就進(jìn)入?MAXUSERS?狀態(tài),并在活動用戶數(shù)降到Server_MaxUsers?極限以下之前拒絕任何用戶請求。
當(dāng)?Lotus Domino?服務(wù)器因?yàn)樘幱?MAXUSERS?狀態(tài)而拒絕訪問請求時,Cluster Manager?就試圖將請求重定向到另一個包含正確副本的集群服務(wù)器。如果其他服務(wù)器都不可用,Lotus Domino?將拒絕訪問請求并顯示一條解釋性消息。
?
另外,您可以通過監(jiān)控中的統(tǒng)計(jì)數(shù)據(jù)更好地管理集群。除了?AvailabilityIndex?之外,統(tǒng)計(jì)數(shù)據(jù)?AvailabilityThreshold?和?ExpansionFactor的名稱都包含前綴?Server.Cluster?,但省去了這個前綴。
AvailabilityIndex?、AvailabilityThreshold?和?ExpansionFactor?都包含前綴“Server.”?。
注意:Server_MaxUsers 設(shè)置不會影響復(fù)制。即使服務(wù)器處于 MAXUSERS 狀態(tài)時仍然會發(fā)生復(fù)制。
7.5 用于集群管理的更多統(tǒng)計(jì)數(shù)據(jù)
?
| 統(tǒng)計(jì)數(shù)據(jù)名稱 | 說明 |
| Member | 顯示集群中的服務(wù)器的名稱和可用性指數(shù)。 |
| AvailabilityIndex | 度量服務(wù)器可用性的方法之一。?0?表示沒有可用資源;?100表示服務(wù)器的所有資源完全可用。 |
| AvailabilityThreshold | 服務(wù)器當(dāng)前的可用性閾值。當(dāng)可用性指數(shù)小于等于可用性閾值時,服務(wù)器將進(jìn)入繁忙狀態(tài)。 |
| ExpansionFactor | 服務(wù)器當(dāng)前的膨脹系數(shù)。該值用于計(jì)算可用性指數(shù)。值為?1時表示該服務(wù)器以最小的時間完成事務(wù)。值為?64?時表示該服務(wù)器完成事務(wù)所需的時間比最小時間長?64?倍。默認(rèn)情況下,膨脹系數(shù)為?64?時表示服務(wù)器滿載,而轉(zhuǎn)換成可用性指數(shù)則為0?。? |
| OpenRedirects.Failover.Successful | 在客戶端通過副本?ID?打開數(shù)據(jù)庫失敗之后,服務(wù)器成功將客戶端重定向到另一個集群成員所需的總時間。 |
| OpenRedirects.Failover.Unsuccessful | 在客戶端通過副本?ID?打開數(shù)據(jù)庫失敗之后,服務(wù)器不能將客戶端重定向到另一個集群成員所需的總時間。 |
| OpenRedirects.FailoverByPath.Successful | 在客戶端通過路徑名打開數(shù)據(jù)庫失敗之后,服務(wù)器成功將客戶端重定向到另一個集群成員所需的總時間。 |
| OpenRedirects.FailoverByPath.Unsuccessful | 在客戶端通過路徑名打開數(shù)據(jù)庫失敗之后,服務(wù)器不能將客戶端重定向到另一個集群成員所需的總時間。 |
| OpenRedirects.LoadBalance.Successful | 在服務(wù)器處于繁忙狀態(tài)時客戶端通過副本?ID?打開數(shù)據(jù)庫失敗之后,服務(wù)器成功將客戶端重定向到另一個集群成員所需的總時間。 |
| OpenRedirects.LoadBalance.Unsuccessful | 在服務(wù)器處于繁忙狀態(tài)時客戶端通過副本?ID?打開數(shù)據(jù)庫失敗之后,服務(wù)器不能將客戶端重定向到另一個集群成員所需的總時間。 |
| OpenRedirects.LoadBalanceByPath.Unsuccessful | 在服務(wù)器處于繁忙狀態(tài)時客戶端通過路徑名打開數(shù)據(jù)庫失敗之后,服務(wù)器不能將客戶端重定向到另一個集群成員所需的總時間。 |
| OpenRedirects.LoadBalanceByPath.Successful | 在服務(wù)器處于繁忙狀態(tài)時客戶端通過路徑名打開數(shù)據(jù)庫失敗之后,服務(wù)器成功將客戶端重定向到另一個集群成員所需的總時間。 |
| OpenRequest.ClusterBusy | 當(dāng)所有服務(wù)器 處于繁忙狀態(tài)時的客戶端請求總數(shù)。 |
| OpenRequest.DatabaseOutOfService | 客戶端嘗試打開標(biāo)記為不可用的服務(wù)器上的數(shù)據(jù)庫所需的總時間。 |
| OpenRequest.LoadBalanced | 客戶端嘗試打開標(biāo)記繁忙的服務(wù)器上的數(shù)據(jù)庫所需的總時間。 |
| PortName | 用于內(nèi)部集群網(wǎng)絡(luò)通信的默認(rèn)端口,或一個星號,表示沒有可以的默認(rèn)端口或其他活動端口。 |
| ProbeCount | 服務(wù)器查找其他集群成員所需的總時間。 |
| ProbeError | 一個服務(wù)器查找另一個服務(wù)器時收到的錯誤。 |
| ProbeTimeout(mins)?* | 顯示發(fā)生集群內(nèi)部查找集群成員的時間間隔。 |
?
7.6 集群復(fù)制器統(tǒng)計(jì)數(shù)據(jù)
?
| 統(tǒng)計(jì)數(shù)據(jù)名稱 | 說明 |
| Servers | 從該服務(wù)器接收復(fù)制的所有集群成員 |
| Successful | 服務(wù)器啟動之后的所有成功復(fù)制 |
| Failed | 服務(wù)器啟動之后的所有失敗復(fù)制 |
| Docs.Added | Cluster Replicator?添加的所有文檔 |
| Docs.Updated | Cluster Replicator?更新的所有文檔 |
| Docs.Deleted | Cluster Replicator?刪除的所有文檔 |
| Files. Local | 存在當(dāng)前服務(wù)器中并且在集群中的其他服務(wù)器上擁有副本的數(shù)據(jù)庫數(shù) |
| Files.Remote | Cluster Replicator?用于執(zhí)行更改并且在其他服務(wù)器上的數(shù)據(jù)庫數(shù) |
| Retry.Skipped | Cluster Replicator?沒有嘗試復(fù)制數(shù)據(jù)庫的總時間。當(dāng)目標(biāo)服務(wù)器不可用或正在等待另一個重試請求時忽略的重試次數(shù) |
| Retry.Waiting | 等待重試的副本數(shù) |
| SecondsOnQueue | 最后復(fù)制的數(shù)據(jù)庫在工作隊(duì)列中的時間,以秒為單位 |
| SecondsOnQueue.Avg | 數(shù)據(jù)庫在工作隊(duì)列中的平均時間,以秒為單位 |
| SecondsOnQueue.Max | 數(shù)據(jù)庫在工作隊(duì)列中的最長時間,以秒為單位 |
| SessionBytes.In | 集群復(fù)制期間接收的總字節(jié)數(shù) |
| SessionBytes.Out | 集群復(fù)制期間發(fā)送的總字節(jié)數(shù) |
| WorkQueueDepth | 正在等待通過?Cluster Replicator?進(jìn)行復(fù)制的數(shù)據(jù)庫數(shù) |
| WorkQueueDepth.Avg | 自從服務(wù)器啟動之后的平均工作隊(duì)列長度 |
| WorkQueueDepth.Max | 自從服務(wù)器啟動之后的最大工作隊(duì)列長度 |
?
下載PDF格式
?
總結(jié)
以上是生活随笔為你收集整理的0207.Domino R8.0.x群集配置手册的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 排骨莲子放多少钱一斤?
- 下一篇: 喝完橙汁后他一共喝了多少杯水?