如何作Oracle SQL跟蹤以及SQL跟蹤

不少的時侯,作Oracle DBA的咱們,當應用管理員向咱們通告如今應用很慢、數據庫很慢的時侯,咱們到數據庫時作幾個示例的Select也發現一樣的問題時,有些時侯咱們會無從下手,由於咱們認爲數據庫的各類命種率都是知足Oracle文檔的建議。實際上現在的優化己經向優化等待(waits)轉型了,實際中性能優化最 
根本的出現點也都集中在IO,這是影響性能最主要的方面,由系統中的等待去發現Oracle庫中的不足、操做系統某些資源利用的不合理是一個比較好的辦法,下面把個人一點實踐經驗與你們分享一下,本文測重於Unix環境。sql

1、經過操做系統的一些工具檢查系統的狀態,好比CPU、內存、交換、磁盤的利用率,根據經驗或與系統正常時的狀態相比對,有時系統表面上看起來看空閒這也可能不是一個正常的狀態,由於cpu可能正等待IO的完成。除此以外咱們還應觀注那些佔用系統資源(cpu、內存)的進程。數據庫

一、如何檢查操做系統是否存在IO的問題?使用的工具備sar,這是一個比較通用的工具。
Rp1#Sar -u 2 10
即每隔2秒檢察一次,共執行20次,固然這些都由你決定了。
示例返回:
HP-UX hpn2 B.11.00 U 9000/800 08/05/03
18:26:32 %usr %sys %wio %idle
18:26:34 80 9 12 0
18:26:36 78 11 11 0
18:26:38 78 9 13 1
18:26:40 81 10 9 1
18:26:42 75 10 14 0
18:26:44 76 8 15 0
18:26:46 80 9 10 1
18:26:48 78 11 11 0
18:26:50 79 10 10 0
18:26:52 81 10 9 0性能優化

Average 79 10 11 0session

其中的%usr指的是用戶進程使用的cpu資源的百分比,%sys指的是系統資源使用cpu資源的百分比,%wio指的是等待io完成的百分比,這是值得咱們觀注的一項,%idle即空閒的百分比。若是wio列的值很大,如在35%以上,說明你的系統的IO存在瓶頸,你的CPU花費了很大的時間去等待IO的完成。Idle很小說明系統CPU很忙。像個人這個示例,能夠看到wio平均值爲11說明io沒什麼特別的問題,而個人idle值爲零,說明個人cpu已經滿負荷運行了。異步


當你的系統存在IO的問題,能夠從如下幾個方面解決工具

♀聯繫相應的操做系統的技術支持對這方面進行優化,好比hp-ux在劃定卷組時的條帶化等方面。
♀查找Oracle中不合理的sql語句,對其進行優化
♀對Oracle中訪問量頻繁的表除合理建索引外,再就是把這些表分表空間存放以避免訪問上產生熱點,再有就是對錶合理分區。性能


二、關注一下內存。
經常使用的工具即是vmstat,對於hp-unix來講能夠用glance,Aix來講能夠用topas,當你發現vmstat中pi列非零,memory中的free列的值很小,glance,topas中內存的利用率多於80%時,這時說明你的內存方面應該調節一下了,方法大致有如下幾項。
♀劃給Oracle使用的內存不要超過系統內存的1/2,通常保在系統內存的40%爲益。
♀爲系統增長內存
♀若是你的鏈接特別多,可使用MTS的方式
♀打全補丁,防止內存漏洞。優化


三、如何找到點用系用資源特別大的Oracle的session及其執行的語句。
Hp-unix能夠用glance,top
IBM AIX能夠用topas
些外可使用ps的命令。
經過這些程序咱們能夠找到點用系統資源特別大的這些進程的進程號,咱們就能夠經過如下的sql語句發現這個pid正在執行哪一個sql,這個sql最好在pl/sql developer,toad等軟件中執行, 把<>中的spid換成你的spid就能夠了。
SELECT a.username,
a.machine,
a.program,
a.sid,
a.serial#,
a.status,
c.piece,
c.sql_text
FROM v$session a,
v$process b,
v$sqltext c
WHERE b.spid=<spid> 
AND b.addr=a.paddr
AND a.sql_address=c.address(+)
ORDER BY c.piece操作系統

咱們就能夠把獲得的這個sql分析一下,看一下它的執行計劃是否走索引,對其優化避免全表掃描,以減小IO等待,從而加快語句的執行速度。unix

提示:我在作優化sql時,常常碰到使用in的語句,這時咱們必定要用exists把它給換掉,由於Oracle在處理In時是按Or的方式作的,即便使用了索引也會很慢。
好比:
SELECT col1,col2,col3 FROM table1 a 
WHERE a.col1 not in (SELECT col1 FROM table2)
能夠換成:
SELECT col1,col2,col3 FROM table1 a 
WHERE not exists
(SELECT 'x' FROM table2 b
WHERE a.col1=b.col1)


四、另外一個有用的腳本:查找前十條性能差的sql.
SELECT * FROM 
(
SELECT PARSING_USER_ID
EXECUTIONS,
SORTS,
COMMAND_TYPE,
DISK_READS,
sql_text
FROM v$sqlarea
ORDER BY disk_reads DESC 

WHERE ROWNUM<10 ;


2、迅速發現Oracle Server的性能問題的成因,咱們能夠求助於v$session_wait這個視圖,看系統的這些session在等什麼,使用了多少的IO。如下是我提供的參考腳本:

腳本說明:查看佔io較大的正在運行的session
SELECT se.sid,
se.serial#,
pr.SPID,
se.username,
se.status,
se.terminal,
se.program,
se.MODULE,
se.sql_address,
st.event,
st.p1text,
si.physical_reads,
si.block_changes 
FROM v$session se,
v$session_wait st,
v$sess_io si,
v$process pr
WHERE st.sid=se.sid 
AND st.sid=si.sid
AND se.PADDR=pr.ADDR
AND se.sid>6
AND st.wait_time=0 
AND st.event NOT LIKE '%SQL%'
ORDER BY physical_reads DESC

對檢索出的結果的幾點說明:
一、我是按每一個正在等待的session已經發生的物理讀排的序,由於它與實際的IO相關。


二、你能夠看一下這些等待的進程都在忙什麼,語句是否合理?
Select sql_address from v$session where sid=<sid>;
Select * from v$sqltext where address=<sql_address>;
執行以上兩個語句即可以獲得這個session的語句。
你也以用alter system kill session 'sid,serial#';把這個session殺掉。


三、應觀注一下event這列,這是咱們調優的關鍵一列,下面對常出現的event作以簡要的說明:
a、buffer busy waits,free buffer waits這兩個參數所標識是dbwr是否夠用的問題,與IO很大相關的,當v$session_wait中的free buffer wait的條目很小或沒有的時侯,說明你的系統的dbwr進程決對夠用,不用調整;free buffer wait的條目不少,你的系統感受起來必定很慢,這時說明你的dbwr已經不夠用了,它產生的wio已經成爲你的數據庫性能的瓶頸,這時的解決辦法以下:
a.1增長寫進程,同時要調整db_block_lru_latches參數
示例:修改或添加以下兩個參數
db_writer_processes=4
db_block_lru_latches=8
a.2開異步IO,IBM這方面簡單得多,hp則麻煩一些,能夠與Hp工程師聯繫。
b、db file sequential read,指的是順序讀,即全表掃描,這也是咱們應該儘可能減小的部分,解決方法就是使用索引、sql調優,同時能夠增大db_file_multiblock_read_count這個參數。


c、db file scattered read,這個參數指的是經過索引來讀取,一樣能夠經過增長db_file_multiblock_read_count這個參數來提升性能。


d、latch free,與栓相關的了,須要專門調節。

e、其餘參數能夠不特別觀注。