问题标签 [lzo]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
32878 浏览

bash - 使用 shell 脚本解压缩 .lzo 文件

好的,所以我在网上做了一些搜索,但没有找到任何答案。我正在编写一个 shell 脚本,我需要在其中解压缩一个 .lzo 文件。看不到任何线索。有人有什么想法吗?我基本上是在阅读一个带时间戳的日志文件。我的脚本接受年、月、日作为参数。我能够找到我的文件,但现在当我必须解压缩它时,我不知道如何处理 .lzo 文件。需要帮助。

提前致谢。

0 投票
1 回答
3536 浏览

hadoop - Hadoop 和 Hive 中的 Hadoop LZO 和 SnappyCodec 错误

我正在使用 Ubuntu-12.04,Hadoop-1.0.2,Hive-0.10.0 从 hive 读取大约 100 万条记录的数据时出现以下错误以进行查询

所以我在 $HADOOP_HOME/lib 文件夹中安装了 Snappy for Hadoop,它会生成文件 libsnappy.a、libsnappy.la、libsnappy.so、libsnappy.so.1、libsnappy.so.1.1.4

还在 $HADOOP_HOME/lib/ 中添加 hadoop-lzo-0.4.3.jar 并在 cor-site.xml,mapred-site.xml 中进行如下更改

核心站点.xml:-

mapred-site.xml :-

但是当我开始 hive & do 时show databases,会出现错误:-

0 投票
1 回答
571 浏览

c# - Pinvoke 错误堆栈不平衡 - lzo 解压 C 函数

我知道这个问题已经被问过好几次了,如下:(Unbalanced Stack!

但我使用的是开源 DLL,LZO 2.0.3用 ANSI C 编写。关于 DLL 的信息在这里: LZO 下载源代码

我的 C# 程序是一个下载器,它与服务器建立 TCP 套接字,通过 TCP 连接发送 LZO 压缩数据包。

.NET中有几个LZO的端口,例如:

http://lzohelper.codeplex.com/

http://wallaceturner.com/lzo-for-c

http://lzo-net.sourceforge.net/ [过时]

http://www.codeproject.com/Articles/16239/Pure-C-MiniLZO-port

http://powerawarebt2.googlecode.com/svn/trunk/PowerAwareBT/CompactFramework/ADOHelper/SRC_Helper/MiniLZO.cs

与 .NET 中的多个 LZO 和 miniLZO 端口不同,它们具有自己的解压缩函数,根据数据包的最后 4 位建立目标缓冲区的长度,我的数据包包含一个未压缩的 8 字节标头,如下所示:

这是我的代码片段:

使用 PInvoke 的函数调用如下:

我在 64 位 Windows Server 2008 机器上使用 Visual Studio 2012 Express。

正如这篇文章的标题所示,我收到的错误是:

调试控制台产生以下输出:

如果您查看 LZO 2.0.3 库的源代码 - 特别是文件 lzo1x.h,它会说:

我的问题很简单——我该如何解决这个错误?作为一个对 C 知之甚少的新手 C# 程序员,我不熟悉 PInvoke,并且非常感谢您可能提出的任何具体建议。对于可能重复的问题/场景,请提前道歉。

0 投票
2 回答
4946 浏览

hadoop - Hadoop 压缩:“已加载本机 gpl 库”但“无法加载/初始化本机 lzo 库”

在几次尝试为 hadoop 安装 Lzo 压缩之后,我需要帮助,因为我真的不知道为什么它不起作用。

我在 CentOs 6 上使用 hadoop 1.0.4。我尝试了http://opentsdb.net/setup-hbase.htmlhttps://github.com/kevinweil/hadoop-lzo和其他一些,但我仍然收到错误:

13/07/03 19:52:23 INFO lzo.GPLNativeCodeLoader: Loaded native gpl library 13/07/03 19:52:23 WARN lzo.LzoCompressor: java.lang.NoSuchFieldError: workingMemoryBuf

13/07/03 19:52:23 ERROR lzo.LzoCodec: Failed to load/initialize native-lzo library

即使加载了本机 gpl。我已经根据下面的链接更新了我的 mapred-site 和 core-site,我在正确的路径中复制/粘贴了库(仍然根据链接)。

真正的问题是 lzo 测试适用于 namenode :

13/07/03 18:55:47 INFO lzo.GPLNativeCodeLoader: Loaded native gpl library 13/07/03 18:55:47 INFO lzo.LzoCodec: Successfully loaded & initialized native-lzo library [hadoop-lzo rev ]

我尝试在 haddop-env.sh 中设置多个路径,但似乎没有正确的解决方案...所以,如果您有任何想法,请链接...?我真的很感兴趣

[编辑] 一周后,我仍在努力让它发挥作用。我已经尝试过 sudhirvn.blogspot.fr/2010/08/hadoop-lzo-installation-errors-and.html 但删除所有 Lzo 和 gplcompression 库然后进行 nez 安装一点也不更好。

那是因为我的hadoop核心版本吗?是否可以同时拥有 hadoop-core-0.20 和 hadoop-core-1.0.4 ?我应该在 0.20 hadoop 上编译 Lzo 以使用 lzo 吗?顺便说一句,我已经尝试过像这样编译 hadoop-lzo:

CLASSPATH=/usr/lib/hadoop/hadoop-core-1.0.4.jar CFLAGS=-m64 CXXFLAGS=-m64 ant compile-native tar

如果它有助于完整的错误是:

我真的很想使用 lzo,因为我必须在一个相当小的集群(5 个节点)上处理非常大的文件。拥有可拆分的压缩文件可以使它运行得非常快。欢迎每一个评论或想法。

0 投票
0 回答
311 浏览

java - Hadoop lzopCodec 包

我正在尝试创建简单的 map-reduce 示例。这是我的代码

这是我的映射器

和 MyReducer

当我在本地运行这个程序时,它工作正常!但是当我将此程序加载到另一台 hadoop 机器时,它给了我下一个错误:

但我不在任何地方使用 lzopCodec。我尝试通过创建配置来禁用此编解码器,设置它的属性

并将此配置传递给作业。但它仍然失败。

有没有人有建议,为什么它尝试使用 lzopCodec 以及如何禁用它?

0 投票
0 回答
1026 浏览

hadoop - 制作 hadoop 拆分 Lzo 输入文件

我正在使用 hadoop-lzo 处理大型压缩数据的 MR。实际上我的工作是由工具自动生成的,但这不是问题。我的 lzo 压缩适用于所有节点(尝试过 DistributedLzoIndexer),我还可以使用以下命令行对拆分的 lzo 文件使用流式传输:

它创建 11 个地图(根据我的文件大小我猜)并正常处理它。但是当我尝试任何其他 jar 文件时,lzo 文件只使用一个映射来处理。所以我的问题是

通常hadoop会根据压缩编解码器使用输入格式吗?我的 hadoop-lzo-0.4.3.jar 在路径中,所以我真的不明白为什么它仍然使用默认的文本格式。

有什么方法可以强制 hadoop 使用 LzoTextInputFormat 吗?

谢谢阅读。

0 投票
1 回答
477 浏览

hadoop - 尝试使用 LzoPigStorage 和大象鸟加载索引 LZO 文件

我有一个默认 LZO 压缩的日志文件和一个使用 Hadoop-LZO 生成的 .index 文件,但是当我运行一个简单的 Pig 文件以使用 LzoPigStorage 检索前 100 条记录时,我得到以下异常:

我正在运行 Hadoop 2.0、Pig 0.11 和大象鸟 2.2.3

0 投票
1 回答
355 浏览

hadoop - 使用 Hadoop-LZO 构建 Java 项目但找不到类

我正在尝试构建一个简单的 WordCount jar 项目,该项目利用 Hadoop-lzo 库但似乎无法使以下命令工作,即使我引用的类在hadoop classpath

有任何想法吗?

0 投票
0 回答
121 浏览

java - 索引 .lzo 日志文件的执行速度比 .gz 压缩xt 慢

我在 lzo 设置 7 下压缩了一些日志文件,在默认压缩下压缩了 gzip,我的结果如下:

MapReduce 工作结束:

  • 1GB .gz 文件 - 340 秒
  • 1GB .lzo 文件未编入索引 - 410 秒
  • 1GB .lzo 文件索引 - 380 秒

MapReduce 作业只是利用 Hadoop-LZO 库的 LzoTextInputFormat 类而不是通常的 TextInputFormat 类。这是唯一的区别。

我看到 37 个地图任务通过并拆分作业并使用 .index 文件,但性能还有很多不足之处。有任何想法吗?

0 投票
4 回答
8005 浏览

hadoop - native-lzo library not available on Hadoop datanodes

I've written a simple LzoWordCount the following to my Gateway/hadoop-env.sh:

When I run the MR job, I get:

Any ideas how to fix this issue? I did notice that 'hadoop classpath | grep native' returns nothing?