本篇内容主要讲解“怎么理解PostgreSQL12 COPY和bulkloading有什么特性”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么理解PostgreSQL12 COPY和bulkloading有什么特性”吧!

业务是否依赖COPY命令加载数据?PostgreSQL12提供了一个新特性,大大加快了加载速度。

COPY:Loading and unloading data as fast as possible

细看PostgreSQL12的COPY语法,发现有两处变动:

1)\h 会有手册文档链接

2)COPY支持WHERE条件

下面是完整语法:

db12=#\hCOPYCommand:COPYDescription:copydatabetweenafileandatableSyntax:COPYtable_name[(column_name[,...])]FROM{'filename'|PROGRAM'command'|STDIN}[[WITH](option[,...])][WHEREcondition]COPY{table_name[(column_name[,...])]|(query)}TO{'filename'|PROGRAM'command'|STDOUT}[[WITH](option[,...])]whereoptioncanbeoneof:FORMATformat_nameFREEZE[boolean]DELIMITER'delimiter_character'NULL'null_string'HEADER[boolean]QUOTE'quote_character'ESCAPE'escape_character'FORCE_QUOTE{(column_name[,...])|*}FORCE_NOT_NULL(column_name[,...])FORCE_NULL(column_name[,...])ENCODING'encoding_name'URL:https://www.postgresql.org/docs/12/sql-copy.html

虽然添加文档链接功能带来便利,但是WHERE过滤功能更加有用。这个功能的目的是什么?当前,COPY只能导入整个文件。但是某些场景下会有问题:很多场景下,人们只想加载数据的一个子集,并且在导出前必须编写大量代码进行过滤。

COPY...WHERE:导入时过滤

PostgreSQL通过该条件可以轻松地进行过滤。下面讲述一个简单的例子:

db12=#CREATETABLEt_demoASSELECT*FROMgenerate_series(1,1000)ASid;SELECT1000

首先先插入1000行数据,然后导出到一个文件:

db12=#COPYt_demoTO'/tmp/file.txt';COPY1000

最后,再重新导入数据:

db12=#CREATETABLEt_import(xint);CREATETABLEdb12=#COPYt_importFROM'/tmp/file.txt'WHEREx<5;COPY4db12=#SELECT*FROMt_import;x---1234(4rows)

如上说是,过滤数据非常简单直接。需要注意,导出列是“id”,导入列是“x”。文件文件不知道导入表的表结构---需要确保过滤导入表的列名。

其他特性

COPY可以将数据发送到UNIX pipe,还可以从pipe中读取数据。如下所示:

db12=#COPYt_demoTOPROGRAM'gzip-c>/tmp/file.txt.gz';COPY1000db12=#COPYt_importFROMPROGRAM'gunzip-c/tmp/file.txt.gz'WHERExBETWEEN100AND103;COPY4db12=#SELECT*FROMt_importWHEREx>=100;x-----100101102103(4rows)

某些场景下,不止想将数据导出。上面场景,我们想导出数据时将数据压缩;导入时将数据解压并过滤。如上所示,这种方法非常简单。

到此,相信大家对“怎么理解PostgreSQL12 COPY和bulkloading有什么特性”有了更深的了解,不妨来实际操作一番吧!这里是亿速云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!