1

我正在寻找允许快速(轻松)将数据导入现有数据库表的工具/库。例如,phpmyadmin 允许从 .csv、.xml 等文件导入数据。在 Hadoop hue 中,通过 Beesvax for Hive 我们可以从文件创建表。我正在寻找可以与 postgresql 或库一起使用的工具,这些工具可以快速轻松地完成这些事情 - 我正在寻找避免手动编码的方法,从读取文件到通过 jdbc 插入到 db。

4

1 回答 1

1

可以使用 PostgreSQL 中的标准工具来完成所有这些操作,而无需额外的库。

对于.csv文件,您可以使用内置的COPY命令。COPY 既快速又简单。为此,源文件必须与数据库位于同一台机器上。如果没有,您可以使用与psql非常相似的 \copy 元命令。

对于.xml文件(或任何格式),您可以在plpgsql 函数中使用内置的pg_read_file()。但是,我引用:

只能访问数据库集群目录和 log_directory 中的文件。

因此,您必须将源文件放在那里或创建指向实际文件/目录的符号链接。然后你可以用unnest()xpath() 和 friends解析它。为此,您至少需要 PostgreSQL 8.4。

在Scott Bailey 的这篇博客文章中开始解析 XML 。

于 2011-10-02T14:37:10.900 回答