怎么正确使用PostgreSQL中的OR
本篇内容介绍了“怎么正确使用PostgreSQL中的OR”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
在SQL语句中,对OR使用不当可能会导致较差的查询效率。这并不意味着不能用OR而是在使用OR时需考虑可能存在的性能问题。
测试数据:
DROPTABLEa;CREATETABLEa(idintegerNOTNULL,a_valtextNOTNULL);INSERTINTOaSELECTi,md5(i::text)FROMgenerate_series(1,1000000)i;DROPTABLEb;CREATETABLEb(idintegerNOTNULL,b_valtextNOTNULL);INSERTINTObSELECTi,md5(i::text)FROMgenerate_series(1,1000000)i;ALTERTABLEaADDPRIMARYKEY(id);ALTERTABLEbADDPRIMARYKEY(id);ALTERTABLEbADDFOREIGNKEY(id)REFERENCESa;VACUUM(ANALYZE)a;VACUUM(ANALYZE)b;
OR vs IN
条件语句p1 OR p2,如可以考虑使用IN来改写,比如:
[local:/data/pg12]:5432pg12@testdb=#EXPLAINverboseSELECTidFROMaWHEREid=42ORid=4711;QUERYPLAN---------------------------------------------------------------------------BitmapHeapScanonpublic.a(cost=8.87..16.80rows=2width=4)Output:idRecheckCond:((a.id=42)OR(a.id=4711))->BitmapOr(cost=8.87..8.87rows=2width=0)->BitmapIndexScanona_pkey(cost=0.00..4.43rows=1width=0)IndexCond:(a.id=42)->BitmapIndexScanona_pkey(cost=0.00..4.43rows=1width=0)IndexCond:(a.id=4711)(8rows)[local:/data/pg12]:5432pg12@testdb=#[local:/data/pg12]:5432pg12@testdb=#EXPLAINverboseSELECTidFROMaWHEREidin(42,4711);QUERYPLAN----------------------------------------------------------------------------IndexOnlyScanusinga_pkeyonpublic.a(cost=0.42..8.88rows=2width=4)Output:idIndexCond:(a.id=ANY('{42,4711}'::integer[]))(3rows)[local:/data/pg12]:5432pg12@testdb=#
使用OR操作符,PG优化器走的是Bitmap Index Scan,使用IN,优化器选择的路径是Index Only Scan,相对于Bitmap Index Scan少了Bitmap的建立,成本自然要低不少。
OR and Join
在Join场景中,如果在参与join的表上都存在查询条件然后在where子句中应用OR关联,那么优化器会选择a和b连接然后使用Filter过滤,由于先进行join而没有进行谓词下推,因此为了得到1行而filter了999999行,代价巨大。
[local:/data/pg12]:5432pg12@testdb=#EXPLAINverboseSELECTid,a.a_val,b.b_valFROMaJOINbUSING(id)WHEREa.id=42ORb.id=42;QUERYPLAN---------------------------------------------------------------------------------------------Gather(cost=21965.00..45327.62rows=2width=70)Output:a.id,a.a_val,b.b_valWorkersPlanned:2->ParallelHashJoin(cost=20965.00..44327.42rows=1width=70)Output:a.id,a.a_val,b.b_valInnerUnique:trueHashCond:(a.id=b.id)JoinFilter:((a.id=42)OR(b.id=42))->ParallelSeqScanonpublic.a(cost=0.00..12500.67rows=416667width=37)Output:a.id,a.a_val->ParallelHash(cost=12500.67..12500.67rows=416667width=37)Output:b.b_val,b.id->ParallelSeqScanonpublic.b(cost=0.00..12500.67rows=416667width=37)Output:b.b_val,b.id(14rows)
在这种情况下,可以通过使用UNION来关联两个JOIN提升性能
[local:/data/pg12]:5432pg12@testdb=#EXPLAINverbosepg12@testdb-#SELECTid,a.a_val,b.b_valpg12@testdb-#FROMaJOINbUSING(id)pg12@testdb-#WHEREa.id=42pg12@testdb-#UNIONpg12@testdb-#SELECTid,a.a_val,b.b_valpg12@testdb-#FROMaJOINbUSING(id)pg12@testdb-#WHEREb.id=42pg12@testdb-#;QUERYPLAN----------------------------------------------------------------------------------------------------Unique(cost=33.83..33.85rows=2width=68)Output:a.id,a.a_val,b.b_val->Sort(cost=33.83..33.84rows=2width=68)Output:a.id,a.a_val,b.b_valSortKey:a.id,a.a_val,b.b_val->Append(cost=0.85..33.82rows=2width=68)->NestedLoop(cost=0.85..16.90rows=1width=70)Output:a.id,a.a_val,b.b_val->IndexScanusinga_pkeyonpublic.a(cost=0.42..8.44rows=1width=37)Output:a.id,a.a_valIndexCond:(a.id=42)->IndexScanusingb_pkeyonpublic.b(cost=0.42..8.44rows=1width=37)Output:b.id,b.b_valIndexCond:(b.id=42)->NestedLoop(cost=0.85..16.90rows=1width=70)Output:a_1.id,a_1.a_val,b_1.b_val->IndexScanusinga_pkeyonpublic.aa_1(cost=0.42..8.44rows=1width=37)Output:a_1.id,a_1.a_valIndexCond:(a_1.id=42)->IndexScanusingb_pkeyonpublic.bb_1(cost=0.42..8.44rows=1width=37)Output:b_1.id,b_1.b_valIndexCond:(b_1.id=42)(22rows)[local:/data/pg12]:5432pg12@testdb=#
两个子连接选择了成本最低的NL join,总成本是原来SQL语句成本的0.1%都不到,差了3个数量级。
“怎么正确使用PostgreSQL中的OR”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。