oracle 运维案例,运维注意事项及案例讲解(个人心得)
應(yīng)客戶要求,需要寫一篇《數(shù)據(jù)庫(kù)運(yùn)維注意事項(xiàng)和案例講解》,正好自己也可以把近來(lái)這段時(shí)間中碰到的運(yùn)維問(wèn)題總結(jié)一下。同時(shí)也分享給大家。記之
----------------------
1.數(shù)據(jù)庫(kù)運(yùn)維工作目標(biāo)
數(shù)據(jù)庫(kù)的運(yùn)維工作目標(biāo)是保證服務(wù)范圍內(nèi)的數(shù)據(jù)庫(kù)正常運(yùn)行,用好、管好現(xiàn)有的已交付數(shù)據(jù),在數(shù)據(jù)生命周期中,達(dá)到數(shù)據(jù)庫(kù)安全性、可用性、可靠性等幾個(gè)目標(biāo)。
2. 數(shù)據(jù)庫(kù)運(yùn)維工作范圍
數(shù)據(jù)庫(kù)運(yùn)維范圍主要是管理維護(hù)數(shù)據(jù)庫(kù),在數(shù)據(jù)庫(kù)出現(xiàn)異常的時(shí)候,有時(shí)往往是應(yīng)用人員或者部門提出查詢緩慢、或者不能正常使用等問(wèn)題,有時(shí)可能原因出在使用人員的客戶端機(jī)器或者網(wǎng)絡(luò)部分,比如有以下情況出現(xiàn):
同一部門或者同一應(yīng)用使用者沒(méi)有問(wèn)題,但有個(gè)別應(yīng)用人員提出應(yīng)用不能正常使用的現(xiàn)象。原因可能如下:
1)原來(lái)使用正常,但是安裝其他的安全軟件,屏蔽了數(shù)據(jù)庫(kù)連通的端口,導(dǎo)致應(yīng)用不能使用。
2)所在的網(wǎng)絡(luò)終端可能出現(xiàn)問(wèn)題,使用ping命令,查看是否有丟包現(xiàn)象。
3)開(kāi)始能正常使用,但是有個(gè)長(zhǎng)時(shí)間的處理之后,整個(gè)應(yīng)用就不能用了,有可能是因?yàn)槟承┸浖?duì)應(yīng)用端口的使用做了超時(shí)連結(jié)控制的結(jié)果。
根據(jù)以上的一些情況,首先要判斷問(wèn)題出現(xiàn)在哪個(gè)環(huán)節(jié),然后再進(jìn)行數(shù)據(jù)庫(kù)的處理,當(dāng)然對(duì)于數(shù)據(jù)庫(kù)服務(wù)器問(wèn)題,查看alter日志是最有效和直接的,因?yàn)橐坏┦菙?shù)據(jù)庫(kù)服務(wù)器出現(xiàn)問(wèn)題,在alter日志中都會(huì)有記錄。
3. ?數(shù)據(jù)庫(kù)運(yùn)維工作內(nèi)容及相關(guān)案例
數(shù)據(jù)庫(kù)運(yùn)維工作內(nèi)容很多,從工作內(nèi)容復(fù)雜性和常用性方面可以分為日常運(yùn)維管理、高級(jí)運(yùn)維管理,從達(dá)到目標(biāo)分安全性、可用性、可靠性方面,具體內(nèi)容如下。
3.1. 安全性
安全性包括數(shù)據(jù)訪問(wèn)安全和數(shù)據(jù)安全備份恢復(fù)方面的工作。
1.數(shù)據(jù)安全訪問(wèn)
作為數(shù)據(jù)庫(kù)訪問(wèn)安全,主要是對(duì)于數(shù)據(jù)庫(kù)用戶及其權(quán)限的管理工作。訪問(wèn)計(jì)算機(jī)系統(tǒng)時(shí)需要遵循的重要的安全原則是“最小權(quán)限”原則(即用戶應(yīng)當(dāng)只擁有執(zhí)行其任務(wù)所需的最小權(quán)限,并且禁止所有未被特別允許的權(quán)限)。Oracle數(shù)據(jù)庫(kù)遵循了最小權(quán)限原則,在默認(rèn)情況下,只有用戶SYS和SYSTEM才擁有所有權(quán)限.其他用戶甚至都無(wú)法連接數(shù)據(jù)庫(kù)。采用一些安全策略來(lái)對(duì)用戶的權(quán)限進(jìn)行管理,比如:更改dba用戶名,禁用sys和system用戶等。
其次可以采用審計(jì)功能來(lái)提高數(shù)據(jù)訪問(wèn)安全的審計(jì)倒查來(lái)防范一些非法訪問(wèn)或者非法操作等。
2.數(shù)據(jù)安全備份恢復(fù)
數(shù)據(jù)安全備份恢復(fù)主要采用Rman對(duì)數(shù)據(jù)庫(kù)進(jìn)行增量備份恢復(fù)策略,并有計(jì)劃的進(jìn)行恢復(fù)測(cè)試,以便保證數(shù)據(jù)備份文件的有效性。或者采用DataGuard進(jìn)行實(shí)時(shí)數(shù)據(jù)保護(hù)等。這些一般是數(shù)據(jù)庫(kù)大級(jí)別的安全備份恢復(fù),作為日常工作中,對(duì)于一個(gè)重要表進(jìn)行操作時(shí),還是需要進(jìn)行表級(jí)備份的,這樣才能做到數(shù)據(jù)的安全性,不至于出現(xiàn)數(shù)據(jù)誤刪或者誤更新操作。但是目前已經(jīng)有flashback閃回操作,也能增加其數(shù)據(jù)的安全性。方法很多,但是重在數(shù)據(jù)安全意識(shí)。
3.2.可用性
數(shù)據(jù)庫(kù)可用性的日常維護(hù)包括很多,如:系統(tǒng)的可用磁盤空間、表空間的可用空間監(jiān)控、回滾表空間、臨時(shí)表空間的監(jiān)控、在線redo監(jiān)控、歸檔日志監(jiān)控清理、對(duì)象的有效性等,如果后期用ASM進(jìn)行管理,還要監(jiān)測(cè)ASM的可用磁盤空間,并考慮其不同數(shù)據(jù)的增量,預(yù)估出表空間和磁盤大小,及時(shí)擴(kuò)展,以便避免因?yàn)楸砜臻g或者磁盤空間不足而導(dǎo)致的數(shù)據(jù)庫(kù)問(wèn)題。
案例1:由于沒(méi)有及時(shí)清理歸檔日志導(dǎo)致磁盤空間耗盡,引起數(shù)據(jù)庫(kù)掛起。
案例2:由于沒(méi)有及時(shí)擴(kuò)展表空間,導(dǎo)致數(shù)據(jù)無(wú)法增加和插入,引起應(yīng)用異常。
案例3:由于redo日志過(guò)小或者日志組過(guò)少,導(dǎo)致redo日志切換過(guò)快,引起應(yīng)用數(shù)據(jù)插入和更新。
案例4:由于磁盤或者ASM空間耗盡,引起數(shù)據(jù)庫(kù)服務(wù)掛起。
案例5:由于數(shù)據(jù)庫(kù)對(duì)象失效,或者索引失效,引起應(yīng)用無(wú)法正常使用,或者查詢數(shù)據(jù)響應(yīng)緩慢的問(wèn)題。
3.3. 可靠性
可靠性是指數(shù)據(jù)庫(kù)能不間斷的運(yùn)行,即使是做其他數(shù)據(jù)處理的時(shí)候也能保證數(shù)據(jù)庫(kù)的正常使用,這樣就要保證數(shù)據(jù)的安全性和實(shí)例的有效性,oracle rac和oracle dataguard提供了這一功能。
在對(duì)于可靠性的維護(hù)方面,一般是在oracle RAC環(huán)境下進(jìn)行維護(hù)的,其中包括了cluster的維護(hù)和數(shù)據(jù)庫(kù)實(shí)例以及ASM實(shí)例的維護(hù)。
3.4. 故障排除
針對(duì)故障排除方面,遵循以下思路,一般故障出現(xiàn)之后,在alter日志中都有記錄,根據(jù)alter日志中的錯(cuò)誤號(hào)和提示信息,來(lái)判定數(shù)據(jù)庫(kù)出現(xiàn)的錯(cuò)誤是什么,定位錯(cuò)誤環(huán)節(jié):數(shù)據(jù)庫(kù)整體環(huán)節(jié)(如:redo、archivelog、undo表空間、temp表空間、session等)、應(yīng)用環(huán)境(如是否是存儲(chǔ)過(guò)程問(wèn)題、或者觸發(fā)器、視圖等)或者是系統(tǒng)級(jí)問(wèn)題。定位好問(wèn)題之后再做進(jìn)一步處理。
3.5. 故障分析及解除總結(jié)
略。。。總結(jié)自己這段時(shí)間遇到的ORA-XXX錯(cuò)誤信息和分析思路、解決方法。
4. 日常運(yùn)維管理任務(wù)及知識(shí)點(diǎn)
4.1. 日常運(yùn)維管理任務(wù)
序號(hào)
工作內(nèi)容
周期
備注
1
確認(rèn)所有的INSTANCE狀態(tài)正常
日
2
檢查文件系統(tǒng)的使用(剩余空間)
日
3
檢查日志文件和trace文件記錄
日
4
檢查數(shù)據(jù)庫(kù)當(dāng)日備份的有效性
日
5
檢查數(shù)據(jù)文件的狀態(tài)
日
6
檢查表空間的使用情況
日
7
檢查剩余表空間
日
8
監(jiān)控?cái)?shù)據(jù)庫(kù)性能
日
9
檢查數(shù)據(jù)庫(kù)系統(tǒng)性能
日
10
日常出現(xiàn)問(wèn)題的處理
日
11
監(jiān)控?cái)?shù)據(jù)庫(kù)對(duì)象的空間擴(kuò)展情況
周
12
監(jiān)控?cái)?shù)據(jù)量的增長(zhǎng)情況
周
13
系統(tǒng)健康檢查
周
14
檢查無(wú)效的數(shù)據(jù)庫(kù)對(duì)象
周
15
Analyze Tables/Indexes/Cluster
月
16
檢查表空間碎片
月
17
尋找數(shù)據(jù)庫(kù)性能調(diào)整的機(jī)會(huì)
月
18
數(shù)據(jù)庫(kù)性能調(diào)整
月
19
提出下一步空間管理計(jì)劃
月
4.2. 相關(guān)知識(shí)點(diǎn)
日常運(yùn)維需要了解的知識(shí)點(diǎn)也比較多,具體如下:
序號(hào)
知識(shí)點(diǎn)
基本
具體工作
1
ORACLE數(shù)據(jù)庫(kù)部署
日常
2
ORACLE數(shù)據(jù)庫(kù)創(chuàng)建
日常
3
ORACLE SQL語(yǔ)言
日常
4
ORACLE體系架構(gòu)
日常
5
ORACLE用戶管理
日常
6
ORACLE實(shí)例管理
日常
7
ORACLE數(shù)據(jù)文件數(shù)據(jù)塊
日常
8
ORACLE對(duì)象管理
日常
9
ORACLE UNDO表空間管理
日常
10
ORACLE在線歸檔日志維護(hù)管理
日常
11
ORACLE安全管理
日常
12
ORACLE RMAN基本備份恢復(fù)
日常
13
ORACLE數(shù)據(jù)庫(kù)閃回
日常
14
ORACLE DATAPUMP
日常
15
ORACLE數(shù)據(jù)庫(kù)升級(jí)
中級(jí)
16
ORACLE數(shù)據(jù)庫(kù)遷移(涵蓋ORACLE ASM磁盤組之間數(shù)據(jù)庫(kù)的遷移)
中級(jí)
17
ORACLE數(shù)據(jù)庫(kù)日常
中級(jí)
18
備份策略制定和備份恢復(fù)
中級(jí)
19
ORACLE數(shù)據(jù)庫(kù)壞塊修復(fù)
中級(jí)
20
ORACLE數(shù)據(jù)庫(kù)數(shù)據(jù)塊編輯
中級(jí)
21
ORACLE數(shù)據(jù)庫(kù)日常健康檢查
中級(jí)
22
ORACLE數(shù)據(jù)庫(kù)日常性能巡檢
中級(jí)
23
ORACLE數(shù)據(jù)庫(kù)日常運(yùn)維監(jiān)控
中級(jí)
24
ORACLE高并發(fā)和高可用即
高級(jí)顧問(wèn)
25
ORACLE REAL APPLICATION CLUSTERS和ORACLE DATAGUARD,
高級(jí)顧問(wèn)
26
做為集中數(shù)據(jù)庫(kù)運(yùn)維監(jiān)控的ORACLE GRID
高級(jí)顧問(wèn)
27
ORACLE數(shù)據(jù)倉(cāng)庫(kù)
高級(jí)顧問(wèn)
28
ORACLE高并發(fā)與高可用綜合應(yīng)用
高級(jí)顧問(wèn)
29
ORACLE高級(jí)安全設(shè)計(jì)
高級(jí)顧問(wèn)
30
ORACLE SQL優(yōu)化
高級(jí)顧問(wèn)
31
ORACLE性能優(yōu)化
高級(jí)顧問(wèn)
32
ORACLE數(shù)據(jù)庫(kù)系統(tǒng)綜合并發(fā)壓力測(cè)試
高級(jí)顧問(wèn)
總結(jié)
以上是生活随笔為你收集整理的oracle 运维案例,运维注意事项及案例讲解(个人心得)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: oracle经典博客,Oracle启动步
- 下一篇: 如何在家里做出健康又美味的饭菜?