问题标签 [hiveql]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3011 浏览

hive - Hive multiple subqueries and group by

I'm switching statistics from MySQL to Amazon DynamoDB and Elastic MapReduce.

I have query bellow that works with MySQL and I have the same table on hive and need the same results as on MySQL (product views for last_week, last_month and last_year).

I figured out how to get results for example for last month with hive:

but i need grouped results like I get with MySql:

Is it possible to do this with hive?

Thank you in advance,

Amer

0 投票
2 回答
7049 浏览

hadoop - Hive CREATE EXTERNAL TABLE 与参数化 LOCATION

这按预期工作:

但这不是:

它失败并出现以下错误(Hive 0.9.0):

失败:解析错误:第 9:11 行不匹配输入 'hdfs' 期望在 '''' 附近出现 EOF

我做错了什么,还是这是一个已知问题/限制?对解决方法有什么建议吗?

0 投票
1 回答
14971 浏览

hive - Hive CASE 语句中的数据类型转换错误

我有一个 HiveQL 查询,看起来像:

当我在 Hive 中执行此操作时,我最近开始收到错误FAILED: Error in semantic analysis: Line X:Y ArgumentTypeMismatch 'col_a': The expression after ELSE should have the same type as those after THEN: "int" is expected but "double" is found.

虽然我知道文字0和 的结果之间存在数据类型不匹配(col_a / col_b),但我不清楚 Hive 为何对此感到窒息,更重要的是,解决此错误的最佳行动方案是什么。我应该将文字转换0为 adouble还是有更好的方法?

这是在 Amazon EMR 中运行的 Hive 0.8.1。

0 投票
1 回答
406 浏览

hadoop - 使用 HDFS+Map Reduce 的示例应用程序

我有一门学术课程“中间件”,涵盖了分布式软件系统的不同方面,包括对 [tag:Distributed File system] 等主题的介绍。这还涉及到的介绍。我想知道,我可以有一个尝试整合上述技术的小项目。对于初学者,我知道提供的用于体验和使用 Eclipse。我正在考虑实现一个接受事件流作为输入的应用程序,分析它并给出输出。

我的机器上有 / ,带有 procoessor和4Gb Ram。

请让我知道如何开始一切,欢迎对简单示例应用程序提出任何建议。

0 投票
1 回答
9336 浏览

hive - 查询多个分区配置单元?

如何在 Hive 中查询同一张表的多个分区?在同一个命令中?

就像是 ???

0 投票
2 回答
3673 浏览

sql - Hive 唯一字符串计数

我在 Hive 表中有一列 stings,我想计算此列中每个字符串的出现次数。我怎样才能做到这一点?

0 投票
2 回答
5232 浏览

hive - HIVE中的多个插入覆盖

我正在尝试通过以下命令在 Hive 中进行多次插入覆盖。

以及第一个命令后的 results_3 表的内容

以及第二条命令后 results_3 表的内容

但我想将这两件事合并在一起。你知道我该如何解决这个问题吗?

谢谢

0 投票
1 回答
3046 浏览

hive - 蜂巢计数元组?

我对 HiveQL 很陌生,我有点卡住了:S

我有一个以下模式的表。一个名为 res 的列和三个在 partion_column 下分区的名为 filed。

然后我在这个表中导入数据

我正在尝试计算三个分区中的唯一管。

例如,此命令计算数据集中某些标题的存在次数。

它输出类似

如何将其扩展到元组(标题、专辑、艺术家)?如果我想有这样的输出:

我的整个代码:

一行xml数据就像

0 投票
1 回答
10116 浏览

hive - 横向视图在蜂巢中爆炸

我有一个名为 exampleTable 的两列字符串数组的表。

我的目标是制作一张这样的表格

我想过像这样使用 LATERL VIEW:

但这会产生这个

我该如何解决这个问题?提前致谢。

0 投票
0 回答
1049 浏览

xpath - 如何使用属性作为列将 XML 数据导入 Hive

我对 HiveQL 很陌生,我有点卡住了:S

我有一个以 xml 格式存储的数据,我想从此 xml 文件中的 Hive 列表中提取字段 (字符串 Titles_2 , sting Artists_2,字符串 Albums_2) 。

xml数据示例:

此数据存储在名为 xmlout_2(line) 的表中。

现在我运行了这些 xpath 命令来构建 HiveQL 表 Stores,但它只添加了每行的第一首歌曲。知道为什么会这样吗?

如果我尝试使用 xpath 而不是 xpath_string 我得到一个字符串数组而不是字符串。

我正在考虑在那之后爆炸列,但爆炸只能在单个列上使用。