解决Oracle数据库出现问题时的脚本有哪些
本篇内容主要讲解“解决Oracle数据库出现问题时的脚本有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“解决Oracle数据库出现问题时的脚本有哪些”吧!
>>>>查看操作系统负载
登上数据库服务器后,第一个就是通过系统命令确认下CPU、内存、I/O是否异常,每个系统的命令不一样,常见的有top、topas、vmstat、iostat。
>>>>查看等待事件
第二步就是连到数据库查看活动的等待事件,这是监控、巡检、诊断数据库最基本的手段,通常81%的问题都可以通过等待事件初步定为原因,它是数据库运行情况最直接的体现,如下脚本是查看每个等待事件的个数、等待时长,并排除了一些常见的IDLE等待事件。
--墨天轮wait_eventcoleventfora45SELECTinst_id,EVENT,SUM(DECODE(WAIT_TIME,0,0,1))"Prev",SUM(DECODE(WAIT_TIME,0,1,0))"Curr",COUNT(*)"Tot",sum(SECONDS_IN_WAIT)SECONDS_IN_WAITFROMGV$SESSION_WAITWHEREeventNOTIN('smontimer','pmontimer','rdbmsipcmessage','SQL*Netmessagefromclient','gcsremotemessage')ANDeventNOTLIKE'%idle%'ANDeventNOTLIKE'%Idle%'ANDeventNOTLIKE'%StreamsAQ%'GROUPBYinst_id,EVENTORDERBY1,5desc;
这里就需要掌握一些常见异常等待事件的原因,并形成条件反射,比如library cache lock、read by other session、row cache lock、buffer busy waits、latch:shared pool、gc buffer busy、cursor: pin S on X、direct path read、log file sync、enq: TX - index contention、PX Deq Credit: send blkd、latch free、enq: TX - row lock contention等等,如果异常等待事件的个数和等待时间很长,那么排查原因的入口就在这里。
>>>>根据等待事件查会话
得到异常等待事件之后,我们就根据等待事件去查会话详情,也就是查看哪些会话执行哪些SQL在等待,另外还查出来用户名和机器名称,以及是否被阻塞。另外如下脚本可改写成根据用户查会话、根据SQL_ID查会话等等。
--墨天轮session_by_eventSELECT/*+rule*/sid,s.serial#,spid,event,sql_id,seconds_in_waitws,row_wait_obj#obj,s.username,s.machine,BLOCKING_INSTANCE||'.'||blocking_sessionb_sessFROMv$sessions,v$processpWHEREevent='&event_name'ANDs.paddr=p.addrorderby6;
>>>>查询某个会话详情
得到会话列表之后,可以根据如下SQL查询某个会话的详细信息,如上次个执行的SQL_ID,登录时间等,该SQL也可改写成多个。
--墨天轮session_by_sidSELECTs.sid,s.serial#,spid,event,sql_id,PREV_SQL_ID,seconds_in_waitws,row_wait_obj#obj,s.username,s.machine,module,blocking_sessionb_sess,logon_timeFROMv$sessions,v$processpWHEREsid='&sid'ANDs.paddr=p.addr;
>>>>查询对象信息
从前面两个SQL都可以看到会话等待的对象ID,可以通过如下SQL查询对象的详细信息。
--墨天轮obj_infocolOBJECT_NAMEfora30selectowner,object_name,subobject_name,object_typefromdba_objectswhereobject_id=&oid;>>>>查询SQL语句
根据SQL_ID、HASH_VALUE查询SQL语句。如果v$sqlarea中查不到,可以尝试DBA_HIST_SQLTEXT视图中查询。
--墨天轮sql_textselectsql_id,SQL_fullTEXTfromv$sqlareawhere(sql_id='&sqlid'orhash_value=to_number('&hashvale'))andrownum<2;
关于SQL语句的执行计划、对象的统计信息、性能诊断、跟踪SQL等这里就不展开,后面计划出一个类似的系列,敬请关注。
>>>>查询会话阻塞情况
通过如下SQL查询某个会话阻塞了多少个会话。
--墨天轮blocking_sessselectcount(*),blocking_sessionfromv$sessionwhereblocking_sessionisnotnullgroupbyblocking_session;
>>>>查询数据库的锁
通过如下SQL查询某个会话的锁,有哪些TM、TX锁,以及会话和锁关联查询的SQL,注意这里指定了ctime大于100秒,30%的情况是人为误操作锁表,导致应用SQL被阻塞,无法运行。
--墨天轮locksetlinesize180colusernamefora15colownerfora15colOBJECT_NAMEfora30colSPIDfora10--查询某个会话的锁select/*+rule*/SESSION_ID,OBJECT_ID,ORACLE_USERNAME,OS_USER_NAME,PROCESS,LOCKED_MODEfromgv$locked_objectwheresession_id=&sid;--查询TM、TX锁select/*+rule*/*fromv$lockwherectime>100andtypein('TX','TM')orderby3,9;--查询数据库中的锁select/*+rule*/s.sid,p.spid,l.type,round(max(l.ctime)/60,0)lock_min,s.sql_id,s.USERNAME,b.owner,b.object_type,b.object_namefromv$sessions,v$processp,v$lockl,v$locked_objecto,dba_objectsbwhereo.SESSION_ID=s.sidands.sid=l.sidando.OBJECT_ID=b.OBJECT_IDands.paddr=p.addrandl.ctime>100andl.typein('TX','TM','FB')groupbys.sid,p.spid,l.type,s.sql_id,s.USERNAME,b.owner,b.object_type,b.object_nameorderby9,1,3
>>>>保留现场证据
有的问题可能需要分析很长时间,或者是需要外部人员协助分析,那么保留现场证据就非常重要了,下面脚本是systemstate dump和hanganalyze步骤,如果有sqlplus无法登陆的情况,可以加-prelim参数。
--systemstatedumpsqlplus-prelim/assysdbaoradebugsetmypidoradebugunlimit;oradebugdumpsystemstate266;--waitfor1minoradebugdumpsystemstate266;--waitfor1minoradebugdumpsystemstate266;oradebugtracefile_name;--hanganalyzeoradebugsetmypidoradebugunlimit;oradebugdumphanganalyze3--waitfor1minoradebugdumphanganalyze3--waitfor1minoradebugdumphanganalyze3oradebugtracefile_name
>>>>杀会话
通常情况下,初步定为问题后为了快速恢复业务,需要去杀掉某些会话,特别是批量杀会话,有时还会直接kill所有LOCAL=NO的进程,再杀会话时一定要检查确认,更不能在别的节点或者别的服务器上执行。
-墨天轮kill_sesssetline199coleventformata35--杀某个SID会话SELECT/*+rule*/sid,s.serial#,'kill-9'||spid,event,blocking_sessionb_sessFROMv$sessions,v$processpWHEREsid='&sid'ANDs.paddr=p.addrorderby1;--根据SQL_ID杀会话SELECT/*+rule*/sid,s.serial#,'kill-9'||spid,event,blocking_sessionb_sessFROMv$sessions,v$processpWHEREsql_id='&sql_id'ANDs.paddr=p.addrorderby1;--根据等待事件杀会话SELECT/*+rule*/sid,s.serial#,'kill-9'||spid,event,blocking_sessionb_sessFROMv$sessions,v$processpWHEREevent='&event'ANDs.paddr=p.addrorderby1;--根据用户杀会话SELECT/*+rule*/sid,s.serial#,'kill-9'||spid,event,blocking_sessionb_sessFROMv$sessions,v$processpWHEREusername='&username'ANDs.paddr=p.addrorderby1;--kill所有LOCAL=NO进程ps-ef|grepLOCAL=NO|grep$ORACLE_SID|grep-vgrep|awk'{print$2}'|xargski
>>>>重启方法
tail-falert_.logaltersystemcheckpoint;altersystemswitchlogfile;shutdownimmediate;startu
如需要修改静态参数、内存等问题,需要重启数据库,(不要觉得重启很LOW,在很多情况下为了快速恢复业务经常使用这个从网吧里传出来的绝招),记住千万不要在这个时候死磕问题原因、当作课题研究,我们的首要任务是恢复业务。
>>>>CRT按钮小技巧
另外介绍一个小技巧,就是把常用的脚本整理到SecureCRT的Button Bar中,只需要点一下设置好的button,就相当于直接执行相应的SQL语句,这样就不用每次粘贴复制执行,或者是把脚本上传到每个服务器上。不过不要设置DDL等操作性的button,以免误点。
到此,相信大家对“解决Oracle数据库出现问题时的脚本有哪些”有了更深的了解,不妨来实际操作一番吧!这里是亿速云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。