我使用 LZO 来压缩减少输出。我试过这个:Kevin Weil 的 Hadoop-LZO 项目,然后LzoCodec在我的工作中使用了类:
TextOutputFormat.setOutputCompressorClass(job, LzoCodec.class);
现在压缩工作得很好。
我的问题是压缩结果是一个.lzo_deflate我无法解压缩的文件。
Lzop 实用程序似乎不支持该类型的文件。
LzopCodec应该提供一个.lzo文件,但它不起作用,但是它与LzoCodec( org.apache.hadoop.io.compress) 位于同一包中,这可能涉及兼容性问题,因为我使用旧 API (0.19) 来进行压缩。
这个问题的答案建议使用 Python 解决方案,但是我在 Java 中需要它。
我正在使用 Hadoop 1.1.2 和 Java 6。