我需要以 ORCFile 格式创建输出。根据这个页面(http://hortonworks.com/blog/orcfile-in-hdp-2-better-compression-better-performance/)它是最好的。
问题?
1) 我应该使用什么编解码器来创建 ORCFile 格式的文件?2) 以这种格式创建的文件是否可以使用 -text 选项读取(例如
hadoop fs -cat -text /tmp/a.orc
3)任何其他指针?使用这种格式是否为时过早?优点缺点?
谢谢。