PostgreSQL7.0手册-用户手册-19. SQL命令-COPY

减小字体 增大字体 作者:佚名  来源:本站整理  发布时间:2009-03-16 13:42:13
COPY
拷贝
COPY — 在表和文件之间拷贝数据
语法
COPY [ BINARY ] table [ WITH OIDS ]
    FROM { 'filename'  stdin }
    [ [USING] DELIMITERS 'delimiter' ]
    [ WITH NULL AS 'null string' ]
COPY [ BINARY ] table [ WITH OIDS ]
    TO { 'filename'  stdout }
    [ [USING] DELIMITERS 'delimiter' ]
    [ WITH NULL AS 'null string' ]
输入
BINARY 
改变字段格式属性,强制所有数据都使用二进制格式存储和读取. 
  
table 
现存表的名字. 
WITH OIDS 
拷贝每行的内部唯一对象标识(OID). 
filename 
输入或输出的Unix文件的绝对路径(文件)名. 
stdin 
声明输入是来自管道还是终端. 
stdout 
声明输出是进入管道还是终端. 
delimiter 
一个用于分隔输入或输出的域的分隔符. 
null print 
一个代表 NULL 值的字串。因历史原因,缺省是“\N”(反斜杠-N)。例如,你可以自己挑一个空字串。 
注意:对于拷贝入(copy in),任何匹配这个字串的字串将被存储为 NULL 值,所以你应该确保你用的字串和拷贝出(copy out)相同。
输出
COPY 
拷贝成功完成. 
ERROR: reason 
拷贝失败,原因在错误信息里. 

描述
COPY 在 Postgres 表和标准 Unix 文件之间交换数据.COPY 指示 Postgres 后端直接从文件中读写数据.该文件必须为后端可见,而且文件名必须从后端的角度声明.如果声明的是 stdin 或 stdout,数据通过客户前端流到后端. 
注意
BINARY 关键字将强制使用二进制对象而不是文本存储/读取所有数据.这样做在一定程度上比传统的拷贝命令快,但移植性不是很好,而且生成的文件也较大,尽管这个方面与数据本身密切相关. 
缺省地,文本拷贝使用 tab ("\t")字符作为分隔符.分隔符仍然可以用关键字 USING DELIMITERS 改成任何其它的字符.在数据中碰巧与分隔符相同的字符将用引号引起. 

你对任何要 COPY 出来的数据必须有select权限,对任何要 COPY 入数据的表必须有inser和update权限.使用 COPY 时后端同样需要适当的对文件操作的 Unix 权限. 

关键字 USING DELIMITERS 声明一个作为所有列的分隔符的字符.如果在分隔符字串里声明了多个字符,只使用第一个字符. 

小技巧: 不要把 COPY 和 psql 的命令\copy 混淆.
COPY 不会激活规则,也不会处理字段缺省值。不过它的确激活触发器。 
COPY 在第一个错误处停下来.这些在 COPY FROM 中不应该导致问题,但在 COPY TO 时目的表会部分改变.应该在一次失败的拷贝后用 VACUUM 查询做一些清除工作. 

因为 Postgres 后端的工作目录通常和用户的工作目录不一样,本地用户向一个文件"foo"(没有附加的路径信息)可能会产生不可预见的结果.这时,foo 将生成在 $PGDATA/foo. 通常,声明拷贝文件时要加上相对后端服务器的全路径. 

作为 COPY 参数声明的文件名必须存在与数据库服务器可访问的地方,不管是在本地硬盘还是在网络文件系统上. 

如果使用了一个从一台机器到另一台机器的 TCP/IP 连接,而且声明了目标文件,那么目标文件将会写到后端运行的机器上,而不是用户的机器上.

文件格式
文本格式
当不带 BINARY 选项使用 COPY TO 时,生成的文件每条记录占据一行,每列(字段)用分隔符分开.内嵌的分隔符字符将由一个反斜杠("\")开头.字段值本身是由与每个字段类型相关的输出函数生成的字符串.某一类型的输出函数本身不应该生成反斜杠;这个任务由 COPY 本身完成. 
每个记录的实际格式是 

...
如果声明了 WITH OIDST,它将被放在每行的开头. 
如果 COPY 将它的输出输出到标准输出而不是一个文件,在拷贝结束时,它将在一个新行上输出一个反斜杠("\")和一个句点("."),最后是一个换行符做为文件结束符.类似,如果 COPY 从标准输入读入数据,它将把一行开头的由一个反斜杠("\")和一个句点(".")和一个换行符组成的这三个连续字符作为文件结束符.不过,如果在这三个字符组合之前碰到一个真的EOF(文件结束符) COPY 将结束 terminate (接着就是后端自身). 

斜杠有其他的含义.NULL属性输出为"\N". 一个反斜杠字符输出成两个连续的反斜杠("\\")一个tab字符用一个反斜杠后面跟一个tab代表. 一个新行字符用一个反斜杠和一个新行代表.当装载不是由Postgres 生成的文件时,你需要将反斜杠字符 ("\")转换成双反斜杠("\\")以保证正确装载.?/div> 

二进制格式
当使用 COPY BINARY,文件的头四个字节将是文件中记录的个数.如果数值是零, COPY BINARY 命令将一直读到文件尾.否则,它将在达到个数时停止读取.文件中剩余的数据将被忽略. 
文件中每一实例的格式如下表.要注意本格式一定要 完全 符合.无符号的四字节整数数量在下表中称做 uint32 . 

表 19-1. 二进制拷贝文件的内容 
   
 文件开始 
uint32 记录个数 
每条记录 
uint32 记录数据总长 
uint32 oid (如果声明了) 
uint32 null 字段的个数 
[uint32,...,uint32] 字段个数(attribute numbers of attributes), 从0开始 
- <字段数据> 

二进制数据的对齐
在Sun-3s,2-字节字段以2-字节为界对齐,而所有整数字段以4-字节为界对齐.字符字段以1-字节为界对齐.在大部分其他机器上,所有大于1字节的整数是按照4-字节为边界对齐的.注意,变长字段由字段长度在埃皇橹皇羌虻サ氖樵乩嘈偷牧鳎?/div> 
用法
下面的例子将一个表拷贝到标准输出,使用竖直条("")作为域分隔符: 
COPY country TO stdout USING DELIMITERS '';
从一个 Unix 文件中拷贝数据到表 "country": 
COPY country FROM '/usr1/proj/bray/sql/country_data';
这里是一些可以从标准输入 stdin 输入的数据的例子(所以在最后有结束符): 
  
   AF      AFGHANISTAN
   AL      ALBANIA
   DZ      ALGERIA
   ...
   ZM      ZAMBIA
   ZW      ZIMBABWE
   \.
同样的数据,输出到一个Linux/i586机器的二进制文件中去.数据是用 Unix 应用 od -c 显示的.表里有三个域;第一个是char(2) 第二个是 text.所有记录在第三字段有空(null)值.注意 char(2) 字段是如何用空(null)补齐成四个字节的以及text字段是如何前面补长度的: 
   355  \0  \0  \0 027  \0  \0  \0 001  \0  \0  \0 002  \0  \0  \0
   006  \0  \0  \0   A   F  \0  \0 017  \0  \0  \0   A   F   G   H
     A   N   I   S   T   A   N 023  \0  \0  \0 001  \0  \0  \0 002
    \0  \0  \0 006  \0  \0  \0   A   L  \0  \0  \v  \0  \0  \0   A
     L   B   A   N   I   A 023  \0  \0  \0 001  \0  \0  \0 002  \0
    \0  \0 006  \0  \0  \0   D   Z  \0  \0  \v  \0  \0  \0   A   L
     G   E   R   I   A
   ...              \n  \0  \0  \0   Z   A   M   B   I   A 024  \0
    \0  \0 001  \0  \0  \0 002  \0  \0  \0 006  \0  \0  \0   Z   W
    \0  \0  \f  \0  \0  \0   Z   I   M   B   A   B   W   E
兼容性
SQL92
在SQL92里没有 COPY 语句.

Tags:

作者:佚名
分享到: 微信 更多