Oracle SQL性能优化技巧大总结
(1) 選擇最有效率的表名順序 ( 只在基于規則的優化器中有效 ) :
? Oracle 的解析器按照從右到左的順序處理 FROM 子句中的表名, FROM 子句中寫在最后的表 ( 基礎表 driving table) 將被最先處理,在 FROM 子句中包含多個表的情況下 , 你必須選擇記錄條數最少的表作為基礎表。如果有 3 個以上的表連接查詢 , 那就需要選擇交叉表 (intersection table) 作為基礎表 , 交叉表是指那個被其他表所引用的表 .
? ( 2 ) WHERE 子句中的連接順序.:
??? ORACLE 采用自下而上的順序解析 WHERE 子句 , 根據這個原理 , 表之間的連接必須寫在其他 WHERE 條件之前 , 那些可以過濾掉最大數量記錄的條件必須寫在 WHERE 子句的末尾 .
? ( 3 ) SELECT 子句中避免使用 ‘ * ‘ :
??? ORACLE 在解析的過程中 , 會將 '*' 依次轉換成所有的列名 , 這個工作是通過查詢數據字典完成的 , 這意味著將耗費更多的時間
? ( 4 ) 減少訪問數據庫 的次數:
??? ORACLE 在內部執行了許多工作 : 解析 SQL 語句 , 估算索引的利用率 , 綁定變量 , 讀數據塊等;
? ( 5 ) 在 SQL*Plus , SQL*Forms 和 Pro*C 中重新設置 ARRAYSIZE 參數 , 可以增加每次數據庫訪問的檢索數據量 , 建議值為 200
? ( 6 ) 使用 DECODE 函數來減少處理時間:
??? 使用 DECODE 函數可以避免重復掃描相同記錄或重復連接相同的表 .
? ( 7 ) 整合簡單 , 無關聯的數據庫訪問:
??? 如果你有幾個簡單的數據庫查詢語句 , 你可以把它們整合到一個查詢中 ( 即使它們之間沒有關系 )
? ( 8 ) 刪除重復記錄:
??? 最高效的刪除重復記錄方法 ( 因為使用了 ROWID) 例子:
DELETE FROM EMP E WHERE E.ROWID > (SELECT MIN(X.ROWID)
FROM EMP X WHERE X.EMP_NO = E.EMP_NO);
? ( 9 ) 用 TRUNCATE 替代 DELETE :
??? 當刪除表中的記錄時 , 在通常情況下 , 回滾段 (rollback segments ) 用來存放可以被恢復的信息 . 如果你沒有 COMMIT 事務 ,ORACLE 會將數據恢復 到刪除之前的狀態 ( 準確地說是恢復到執行刪除命令之前的狀況 ) 而當運用 TRUNCATE 時 , 回滾段不再存放任何可被恢復的信息 . 當命令運行后 , 數據不能被恢復 . 因此很少的資源被調用 , 執行時間也會很短 . ( 譯者按 : TRUNCATE 只在刪除全表適用 ,TRUNCATE 是 DDL 不是 DML)?
? ( 10 ) 盡量多使用 COMMIT :
??? 只要有可能 , 在程序中盡量多使用 COMMIT, 這樣程序的性能得到提高 , 需求也會因為 COMMIT 所釋放的資源而減少 :
COMMIT 所釋放的資源 :
a. 回滾段上用于恢復數據的信息 .
b. 被程序語句獲得的鎖
c. redo log buffer 中的空間
d. ORACLE 為管理上述 3 種資源中的內部花費
(11 )用Where 子句替換HAVING 子句:
避免使用HAVING 子句, HAVING 只會在檢索出所有記錄之后才對結果集進行過濾. 這個處理需要排序, 總計等操作. 如果能通過WHERE 子句限制記錄的數目, 那就能減少這方面的開銷. ( 非oracle 中)on 、where 、having 這三個都可以加條件的子句中,on 是最先執行,where 次之,having 最后,因為on 是先把不符合條件的記錄過濾后才進行統計,它就可以減少中間運算要處理的數據,按理說應該速度是最快的,where 也應該比having 快點的,因為它過濾數據后才進行sum ,在兩個表聯接時才用on 的,所以在一個表的時候,就剩下where 跟having 比較了。在這單表查詢統計的情況下,如果要過濾的條件沒有涉及到要計算字段,那它們的結果是一樣的,只是where 可以使用rushmore 技術,而having 就不能,在速度上后者要慢如果要涉及到計算的字段,就表示在沒計算之前,這個字段的值是不確定的,根據上篇寫的工作流程,where 的作用時間是在計算之前就完成的,而having 就是在計算后才起作用的,所以在這種情況下,兩者的結果會不同。在多表聯接查詢時,on 比where 更早起作用。系統首先根據各個表之間的聯接條件,把多個表合成一個臨時表后,再由where 進行過濾,然后再計算,計算完后再由having 進行過濾。由此可見,要想過濾條件起到正確的作用,首先要明白這個條件應該在什么時候起作用,然后再決定放在那里
? (12 ) 減少對表的查詢:
??? 在含有子查詢的SQL 語句中, 要特別注意減少對表的查詢. 例子:
SELECT TAB_NAME FROM TABLES WHERE (TAB_NAME,DB_VER) = ( SELECT
TAB_NAME,DB_VER FROM TAB_COLUMNS WHERE VERSION = 604)
? (13 ) 通過內部函數提高SQL 效率. :
??? 復雜的SQL 往往犧牲了執行效率. 能夠掌握上面的運用函數解決問題的方法在實際工作中是非常有意義的
? (14 ) 使用表的別名(Alias) :
??? 當在SQL 語句中連接多個表時, 請使用表的別名并把別名前綴于每個Column 上. 這樣一來, 就可以減少解析的時間并減少那些由Column 歧義引起的語法錯誤 .
? (15 ) 用EXISTS 替代IN 、用NOT EXISTS 替代NOT IN :
??? 在許多基于基礎表的查詢中, 為了滿足一個條件, 往往需要對另一個表進行聯接. 在這種情況下, 使用EXISTS( 或NOT EXISTS) 通常將提高查詢的效率. 在子查詢中,NOT IN 子句將執行一個內部的排序和合并. 無論在哪種情況下,NOT IN 都是最低效的 ( 因為它對子查詢中的表執行了一個全表遍歷). 為了避免使用NOT IN , 我們可以把它改寫成外連接(Outer Joins) 或 NOT EXISTS.
例子:
(高效)SELECT * FROM EMP ( 基礎表 ) WHERE EMPNO > 0 AND EXISTS (SELECT ‘X' FROM DEPT WHERE DEPT.DEPTNO = EMP.DEPTNO AND LOC = ‘MELB')
( 低效)SELECT * FROM EMP ( 基礎表 ) WHERE EMPNO > 0 AND DEPTNO IN(SELECT DEPTNO FROM DEPT WHERE LOC = ‘MELB')
? (16 ) 識別' 低效執行' 的SQL 語句:
??? 雖然目前各種關于SQL 優化的圖形化工具層出不窮, 但是寫出自己的SQL 工具來解決問題始終是一個最好的方法:
SELECT EXECUTIONS , DISK_READS, BUFFER_GETS, ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2) Hit_radio, ROUND(DISK_READS/EXECUTIONS,2) Reads_per_run,
SQL_TEXT FROM V$SQLAREA WHERE EXECUTIONS>0 AND BUFFER_GETS > 0 AND (BUFFER_GETS-DISK_READS)/BUFFER_GETS < 0.8 ORDER BY 4 DESC;
? (17 ) 用索引提高效率:
??? 索引是表的一個概念部分, 用來提高檢索數據的效率,ORACLE 使用了一個復雜的自平衡B-tree 結構. 通常, 通過索引查詢數據比全表掃描要快. 當ORACLE 找出執行查詢和Update 語句的最佳路徑時, ORACLE 優化器將使用索引. 同樣在聯結多個表時使用索引也可以提高效率. 另一個使用索引的好處是, 它提供了主鍵(primary key) 的唯一性驗證. 。那些LONG 或LONG RAW 數據類型, 你可以索引幾乎所有的列. 通常, 在大型表中使用索引特別有效. 當然, 你也會發現, 在掃描小表時, 使用索引同樣能提高效率. 雖然使用索引能得到查詢效率的提高, 但是我們也必須注意到它的代價. 索引需要空間來存儲, 也需要定期維護, 每當有記錄在表中增減或索引列被修改時, 索引本身也會被修改. 這意味著每條記錄的INSERT , DELETE , UPDATE 將為此多付出4 , 5 次的磁盤I/O . 因為索引需要額外的存儲空間和處理, 那些不必要的索引反而會使查詢反應時間變慢. 。定期的重構索引是有必要的. :
ALTER INDEX <INDEXNAME> REBUILD <TABLESPACENAME>
? (18 ) 用EXISTS 替換DISTINCT :
??? 當提交一個包含一對多表信息( 比如部門表和雇員表) 的查詢時, 避免在SELECT 子句中使用DISTINCT. 一般可以考慮用EXIST 替換, EXISTS 使查詢更為迅速, 因為RDBMS 核心模塊將在子查詢的條件一旦滿足后, 立刻返回結果. 例子:
( 低效 ): SELECT DISTINCT DEPT_NO,DEPT_NAME FROM DEPT D , EMP E
WHERE D.DEPT_NO = E.DEPT_NO ( 高效 ): SELECT DEPT_NO,DEPT_NAME FROM DEPT D WHERE EXISTS ( SELECT ‘X' FROM EMP E WHERE E.DEPT_NO = D.DEPT_NO);
? (19 ) sql 語句用大寫的;因為oracle 總是先解析sql 語句,把小寫的字母轉換成大寫的再執行
? (20 ) 在java 代碼中盡量少用連接符“ +” 連接字符串!
( 21 ) 避免在索引列上使用 NOT 通常,
??? 我們要避免在索引列上使用 NOT, NOT 會產生在和在索引列上使用函數相同的影響 . 當Oracle" 遇到 ”NOT, 他就會停止使用索引轉而執行全表掃描 .
? ( 22 ) 避免在索引列上使用計算. WHERE 子句中,如果索引列是函數的一部分.優化器將不使用索引而使用全表掃描. 舉例 : 低效:
SELECT … FROM DEPT WHERE SAL * 12 > 25000; 高效 :
SELECT … FROM DEPT WHERE SAL > 25000/12;
( 23 ) 用 >= 替代 >
??? 高效 :
SELECT * FROM EMP WHERE DEPTNO >=4 低效 :
SELECT * FROM EMP WHERE DEPTNO >3 兩者的區別在于 , 前者 DBMS 將直接跳到第一個 DEPT 等于 4 的記錄而后者將首先定位到 DEPTNO=3 的記錄并且向前掃描到第一個 DEPT 大于 3 的記錄 .
? ( 24 ) 用 UNION 替換 OR ( 適用于索引列 )
??? 通常情況下 , 用 UNION 替換 WHERE 子句中的 OR 將會起到較好的效果 . 對索引列使用 OR 將造成全表掃描 . 注意 , 以上規則只針對多個索引列有效 . 如果有 column 沒有被索引 , 查詢效率可能會因為你沒有選擇 OR 而降低 . 在下面的例子中 , LOC_ID 和 REGION 上都建有索引 . 高效 : SELECT LOC_ID , LOC_DESC , REGION FROM LOCATION WHERE LOC_ID = 10 UNION SELECT LOC_ID , LOC_DESC , REGION FROM LOCATION WHERE REGION = “MELBOURNE” 低效 : SELECT LOC_ID , LOC_DESC , REGION FROM LOCATION WHERE LOC_ID = 10 OR REGION = “MELBOURNE” 如果你堅持要用 OR, 那就需要返回記錄最少的索引列寫在最前面 .?
? ( 25 ) 用 IN 來替換 OR
??? 這是一條簡單易記的規則,但是實際的執行效果還須檢驗,在 ORACLE8i 下,兩者的執行路徑似乎是相同的.
低效 : SELECT…. FROM LOCATION WHERE LOC_ID = 10 OR LOC_ID = 20 OR LOC_ID = 30 高效 SELECT… FROM LOCATION WHERE LOC_IN IN (10,20,30);
? ( 26 ) 避免在索引列上使用 IS NULL 和 IS NOT NULL
??? 避免在索引中使用任何可以為空的列, ORACLE 將無法使用該索引.對于單列索引,如果列包含空值,索引中將不存在此記錄 . 對于復合索引,如果每個列都為空,索引中同樣不存在此記錄 . 如果至少有一個列不為空,則記錄存在于索引中.舉例 : 如果唯一性索引建立在表的 A 列和 B 列上 , 并且表中存在一條記錄的 A,B 值為 (123,null) , ORACLE 將不接受下一條具有相同 A,B 值( 123,null )的記錄 ( 插入 ). 然而如果所有的索引列都為空, ORACLE 將認為整個鍵值為空而空不等于空 . 因此你可以插入 1000 條具有相同鍵值的記錄 , 當然它們都是空 ! 因為空值不存在于索引列中 , 所以 WHERE 子句中對索引列進行空值比較將使 ORACLE 停用該索引 .
低效 : ( 索引失效 ) SELECT … FROM DEPARTMENT WHERE DEPT_CODE IS NOT NULL; 高效 : ( 索引有效 ) SELECT … FROM DEPARTMENT WHERE DEPT_CODE >=0;
? ( 27 ) 總是使用索引的第一個列:
??? 如果索引是建立在多個列上 , 只有在它的第一個列 (leading column) 被 where 子句引用時 , 優化器才會選擇使用該索引 . 這也是一條簡單而重要的規則,當僅引用索引的第二個列時 , 優化器使用了全表掃描而忽略了索引
? ( 28 ) 用 UNION-ALL 替換 UNION ( 如果有可能的話 ) :
??? 當 SQL 語句需要 UNION 兩個查詢結果集合時 , 這兩個結果集合會以 UNION-ALL 的方式被合并 , 然后在輸出最終結果前進行排序 . 如果用 UNION ALL 替代 UNION, 這樣排序就不是必要了 . 效率就會因此得到提高 . 需要注意的是, UNION ALL 將重復輸出兩個結果集合中相同記錄 . 因此各位還是要從業務需求分析使用 UNION ALL 的可行性 . UNION 將對結果集合排序 , 這個操作會使用到 SORT_AREA_SIZE 這塊內存 . 對于這塊內存的優化也是相當重要的 . 下面的 SQL 可以用來查詢排序的消耗量
低效:
SELECT ACCT_NUM, BALANCE_AMT FROM DEBIT_TRANSACTIONS WHERE TRAN_DATE = '31-DEC-95' UNION SELECT ACCT_NUM, BALANCE_AMT FROM DEBIT_TRANSACTIONS WHERE TRAN_DATE = '31-DEC-95' 高效 : SELECT ACCT_NUM, BALANCE_AMT FROM DEBIT_TRANSACTIONS
WHERE TRAN_DATE = '31-DEC-95' UNION ALL SELECT ACCT_NUM, BALANCE_AMT FROM DEBIT_TRANSACTIONS WHERE TRAN_DATE = '31-DEC-95'
( 29 ) 用 WHERE 替代 ORDER BY :
ORDER BY 子句只在兩種嚴格的條件下使用索引 .
ORDER BY 中所有的列必須包含在相同的索引中并保持在索引中的排列順序 .
ORDER BY 中所有的列必須定義為非空 .
WHERE 子句使用的索引和 ORDER BY 子句中所使用的索引不能并列 .
例如 : 表 DEPT 包含以下列 :
DEPT_CODE PK NOT NULL
DEPT_DESC NOT NULL
DEPT_TYPE NULL
低效 : ( 索引不被使用 ) SELECT DEPT_CODE FROM DEPT ORDER BY DEPT_TYPE 高效 : ( 使用索引 ) SELECT DEPT_CODE FROM DEPT WHERE DEPT_TYPE > 0?
? ( 30 ) 避免改變索引列的類型 .:
??? 當比較不同數據類型的數據時 , ORACLE 自動對列進行簡單的類型轉換 .
假設 EMPNO 是一個數值類型的索引列 . SELECT … FROM EMP WHERE EMPNO = ‘123' 實際上 , 經過 ORACLE 類型轉換 , 語句轉化為 : SELECT … FROM EMP WHERE EMPNO = TO_NUMBER(‘123') 幸運的是 , 類型轉換沒有發生在索引列上 , 索引的用途沒有被改變 . 現在 , 假設 EMP_TYPE 是一個字符類型的索引列 . SELECT … FROM EMP WHERE EMP_TYPE = 123 這個語句被 ORACLE 轉換為 : SELECT … FROM EMP WHERETO_NUMBER(EMP_TYPE)=123 因為內部發生的類型轉換 , 這個索引將不會被用到 ! 為了避免 ORACLE 對你的 SQL 進行隱式的類型轉換 , 最好把類型轉換用顯式表現出來 . 注意當字符和數值比較時 , ORACLE 會優先轉換數值類型到字符類型 ?
( 31 ) 需要當心的 WHERE 子句 :
??? 某些 SELECT 語句中的 WHERE 子句不使用索引 . 這里有一些例子 . 在下面的例子里 , (1) ‘ !=' 將不使用索引 . 記住 , 索引只能告訴你什么存在于表中 , 而不能告訴你什么不存在于表中 . (2) ‘ ||' 是字符連接函數 . 就象其他函數那樣 , 停用了索引 . (3) ‘ +' 是數學函數 . 就象其他數學函數那樣 , 停用了索引 . (4) 相同的索引列不能互相比較 , 這將會啟用全表掃描 .
? ( 32 ) a. 如果檢索數據量超過 30% 的表中記錄數 . 使用索引將沒有顯著的效率提高 .
b. 在特定情況下 , 使用索引也許會比全表掃描慢 , 但這是同一個數量級上的區別 . 而通常情況下 , 使用索引比全表掃描要塊幾倍乃至幾千倍 !
? ( 33 ) 避免使用耗費資源的操作 :
??? 帶有 DISTINCT,UNION,MINUS,INTERSECT,ORDER BY 的 SQL 語句會啟動 SQL 引擎 執行耗費資源的排序 (SORT) 功能 . DISTINCT 需要一次排序操作 , 而其他的至少需要執行兩次排序 . 通常 , 帶有 UNION, MINUS , INTERSECT 的 SQL 語句都可以用其他方式重寫 . 如果你的數據庫的 SORT_AREA_SIZE 調配得好 , 使用 UNION , MINUS, INTERSECT 也是可以考慮的 , 畢竟它們的可讀性很強
? ( 34 ) 優化 GROUP BY:
??? 提高 GROUP BY 語句的效率 , 可以通過將不需要的記錄在 GROUP BY 之前過濾掉 . 下面兩個查詢返回相同結果但第二個明顯就快了許多 .
低效 :
?
?
SELECT JOB , AVG(SAL)
FROM EMP GROUP JOB HAVING JOB = ‘ PRESIDENT' OR JOB = ‘ MANAGER' 高效 :
SELECT JOB , AVG(SAL)
FROM EMP
WHERE JOB = ‘PRESIDENT'
OR JOB = ‘MANAGER' GROUP JOB ?
本文轉自:
http://www.cnblogs.com/happyday56/archive/2007/06/26/795876.html
總結
以上是生活随笔為你收集整理的Oracle SQL性能优化技巧大总结的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Dynamic Performance
- 下一篇: oracle USER 与 Schema