Oracle 学习之性能优化（七）join的实现方式

2025-04-02 技术教程

本文讨论一下join技术背后的机制。我们知道常用的表连接有如下几种

笛卡尔连接

内连接

左外连接

右外连接

全连接

这些sql的写法，想必大家都很清楚了，那么这些连接的数据访问是如何实现的呢？

nested loop

我们看如下查询

SQL>altersessionsetoptimizer_mode=rule;Sessionaltered.SQL>selectename,dnamefromemp,deptwhereemp.deptno=dept.deptno;14rowsselected.ExecutionPlan----------------------------------------------------------Planhashvalue:3625962092------------------------------------------------|Id|Operation|Name|------------------------------------------------|0|SELECTSTATEMENT|||1|NESTEDLOOPS|||2|NESTEDLOOPS|||3|TABLEACCESSFULL|EMP||*4|INDEXUNIQUESCAN|PK_DEPT||5|TABLEACCESSBYINDEXROWID|DEPT|------------------------------------------------PredicateInformation(identifiedbyoperationid):---------------------------------------------------4-access("EMP"."DEPTNO"="DEPT"."DEPTNO")

根据我们之前讲的执行计划解读，本查询是这样实现的：

全表扫描emp表（非阻塞扫描，并不是将数据全部取出，才执行下一步）。

将emp中的数据逐条取出，通过索引PK_DEPT查询出索引中的rowid，结果集变成（ename，rowid）

将2生成的结果集逐条取出，通过rowid去访问dept表，结果集变成（ename，dname）

将结果集返回。

这种以循环的方式取出数据的join实现方式就叫嵌套循环。

此计划可以用如下逻辑伪代码实现

foryin（forxin（select*fromemp）loopindexlookuptherowidforx.deptnooutputjoinedrecord（ename，dept.rowid）endloop）loopselect*fromdeptwhererowid=y.rowidoutputjoinedrecord(ename,dname)endloop

我们把emp表称之为驱动表（注驱动表与from子句的表顺序无关，主要看执行计划）。

此种连接方式，适用于驱动表返回数据比较少，并且被驱动表dept上deptno列有索引。如果查询返回n行，那么dept表将被扫描n次。此连接擅长于从结果集中迅速取出第一行。

Hash Join

Hash Join适合处理大型结果集，优化器选择两个表或者源数据中比较小的，使用join key在内存中建立一个hash table。然后扫描大表，并探查hash表，去发现匹配的记录。
小表称为驱动表，大表称为探查表

当hash table能全部放到内存中，此种情况最好。如果内存中放不下hash table，优化器将hash table分区，超出内存范围的分区将被写到临时表空间中。

我们分两种情况讨论hash join的实现

hash table 全部在内存里

hash table是Oracle根据join key利用一个hash函数将小表分割成多个bucket。hash table建立完成后，Oracle去扫描大表，并且采用相同的hash算法，将读入的数据也分割成多个bucket。bucket与bucket之间进行join运算，返回结果。直到大表读完为止。

2. hash table 不能全部放到内存中

这种情况有点麻烦，当Oracle发现内存无法完全存放小表，Oracle在构造hash table时，将小表进行分区，每个分区中再构造bucket 。当内存写满时，Oracle将内存中最大的分区写到tempfile中。用这个方法，直到小表hash table构造完成。此时，hashtable一部分数据在内存，一部分数据在tempfile。

当Oracle去扫描大表时，如果扫描的行通过hash在内存中能找到结果，就匹配成功。如果不能命中，则采用与hash table相同的分区方式，先将数据写入tempfile中。当大表全部扫描完毕，hash table内存中的部分已全部匹配完。此时依次将tempfile中的分区加载到内存中。重新扫描大表临时存在tempfile中的相应分区加以匹配。直到数据全部处理完。

SQL>insertintobig_empselect*frombig_emp;SQL>insertintobig_empselect*frombig_emp;#重复执行多次SQL>/458752rowscreated.SQL>createtabledept_newasselect*fromdept;Tablecreated.SQL>setautottraceonlySQL>select*frombig_empa,dept_newbwherea.deptno=b.deptno;917504rowsselected.ExecutionPlan----------------------------------------------------------Planhashvalue:1925493178-------------------------------------------------------------------------------|Id|Operation|Name|Rows|Bytes|Cost(%CPU)|Time|-------------------------------------------------------------------------------|0|SELECTSTATEMENT||917K|54M|1490(2)|00:00:18||*1|HASHJOIN||917K|54M|1490(2)|00:00:18||2|TABLEACCESSFULL|DEPT_NEW|4|120|3(0)|00:00:01||3|TABLEACCESSFULL|BIG_EMP|917K|28M|1482(1)|00:00:18|-------------------------------------------------------------------------------PredicateInformation(identifiedbyoperationid):---------------------------------------------------1-access("A"."DEPTNO"="B"."DEPTNO")Note------dynamicsamplingusedforthisstatement(level=2)Statistics----------------------------------------------------------4recursivecalls1dbblockgets66338consistentgets0physicalreads0redosize62512398bytessentviaSQL*Nettoclient673349bytesreceivedviaSQL*Netfromclient61168SQL*Netroundtripsto/fromclient0sorts(memory)0sorts(disk)917504rowsprocessed

Sort Merge Joins

排序合并连接与嵌套循环和散列连接都不同，排序合并连接没有驱动表的概念。简言之，排序合并将依次处理排序第一个输入集，排序第二个输入集，然后合并结果。排序合并通常不如散列高效，因为两个结果集都需要排序，而散列连接在数据输出前，只需处理一个结果集。排序合并通常在非等值连接中有效。即连接条件不是一个等式而是范围比较（<或者>=）. 或者是两个表的数据已经排好序啦。

我们看如下例子

SQL>setlinesize200pagesize200SQL>setautottraceonlySQL>selecta.ename,b.ename,a.hiredate,b.hiredate2fromempa,empb3wherea.empno<>b.empnoanda.hiredate<b.hiredate;90rowsselected.ExecutionPlan----------------------------------------------------------Planhashvalue:3733349388-----------------------------------------------------------------------------|Id|Operation|Name|Rows|Bytes|Cost(%CPU)|Time|-----------------------------------------------------------------------------|0|SELECTSTATEMENT||84|3024|8(25)|00:00:01||1|MERGEJOIN||84|3024|8(25)|00:00:01||2|SORTJOIN||14|252|4(25)|00:00:01||3|TABLEACCESSFULL|EMP|14|252|3(0)|00:00:01||*4|FILTER|||||||*5|SORTJOIN||14|252|4(25)|00:00:01||6|TABLEACCESSFULL|EMP|14|252|3(0)|00:00:01|-----------------------------------------------------------------------------PredicateInformation(identifiedbyoperationid):---------------------------------------------------4-filter("A"."EMPNO"<>"B"."EMPNO")5-access("A"."HIREDATE"<"B"."HIREDATE")filter("A"."HIREDATE"<"B"."HIREDATE")Statistics----------------------------------------------------------1recursivecalls0dbblockgets12consistentgets0physicalreads0redosize3500bytessentviaSQL*Nettoclient578bytesreceivedviaSQL*Netfromclient7SQL*Netroundtripsto/fromclient2sorts(memory)0sorts(disk)90rowsprocessed

再看一个等值连接的

SQL>selectename,dnamefromempa,deptbwherea.deptno=b.deptno;14rowsselected.ExecutionPlan----------------------------------------------------------Planhashvalue:844388907----------------------------------------------------------------------------------------|Id|Operation|Name|Rows|Bytes|Cost(%CPU)|Time|----------------------------------------------------------------------------------------|0|SELECTSTATEMENT||14|308|6(17)|00:00:01||1|MERGEJOIN||14|308|6(17)|00:00:01||2|TABLEACCESSBYINDEXROWID|DEPT|4|52|2(0)|00:00:01||3|INDEXFULLSCAN|PK_DEPT|4||1(0)|00:00:01||*4|SORTJOIN||14|126|4(25)|00:00:01||5|TABLEACCESSFULL|EMP|14|126|3(0)|00:00:01|----------------------------------------------------------------------------------------PredicateInformation(identifiedbyoperationid):---------------------------------------------------4-access("A"."DEPTNO"="B"."DEPTNO")filter("A"."DEPTNO"="B"."DEPTNO")Statistics----------------------------------------------------------1recursivecalls0dbblockgets10consistentgets0physicalreads0redosize819bytessentviaSQL*Nettoclient523bytesreceivedviaSQL*Netfromclient2SQL*Netroundtripsto/fromclient1sorts(memory)0sorts(disk)14rowsprocessed