问题标签 [kylin]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hbase - Apache kylin:多维数据集创建在第 5 步失败 - KeyValue 大小太大
我开始使用 Apache kylin(版本 1.5.3)。创建多维数据集时,我在第 5 步“保存长方体统计信息”处收到错误消息。日志说:
首先,我尝试创建具有较少维度的相同多维数据集并且它可以工作。创建带有遗漏尺寸的另一个立方体也可以。但是,当我尝试创建一个具有所有这些 (13) 维度的立方体时,它失败了。我也厌倦了将hbase.client.keyvalue.maxsize设置为 0 以禁用检查。还是同样的错误。
有谁知道问题是什么以及我该如何解决?
顺便说一下,我在 Sandbox HDP 2.4 上使用了 kylin。
提前感谢您的帮助
索伦
sql - Apache Kylin:如何在查询中使用'!='?
我有一个关于 Apache kylin(版本 1.5.3)的简短问题。我已经成功构建了一个立方体。现在我想使用 kylin 的 'insight' 选项卡来提交一些查询。我有一个包含两列的表(id [varchar],abc [int])。
像这样的查询
工作正常。但
返回错误:
第 3 行第 11 列出现词汇错误。遇到:“!” (33),在:“”之后
有谁知道“不”的正确词汇?
提前谢谢你,索伦
sql - Apache Kylin:查询不返回完整结果
我在 Apache kylin 中创建了一个多维数据集,其中“ft”是我的事实表,“ls”是维度表之一。两者都连接在“盖子”列上。我的查询
返回一行
1500 1500221 14
到目前为止,一切都很好。省略第一个 where 条件,我的结果也是一行,但这次是另一个......
返回
0140 0140110 14
两者都是正确的结果,但是第二个查询应该返回不止一行,至少也应该返回第一个查询的结果。
有谁知道这里出了什么问题?
提前致谢, 索伦
sql - Apache Kylin:多维数据集设置
我在 Apache Kylin (1.5.3) 中创建了一个多维数据集,其中包含 2 个如下所示的表:
这些表在 facttable.id_b = dimensiontable.id 上是联合的。在“多维数据集设计器 - 高级设置”中,我在“包含”中创建了一个包含 id_a、id_b 和 pos 的聚合组。
现在我想知道'pos = 1'不止一次相关的每个id_a。
因此,在上表的情况下:
在“洞察力”选项卡中,我尝试了查询
但它返回
执行 SQL“[query]”时出错:null
任何人都知道问题是什么?我是否需要更改“模型创建”或“立方体创建”中的某些设置?
任何帮助表示赞赏!
apache - apache kylin-pivot 功能不起作用
嗨,我无法在 apache kylin 中使用枢轴功能,我是否必须启用任何属性,因为 kylin 文档说 kylin 网络向导本身提供了枢轴功能。
sql - id 的 SQL 查询,从不显示特殊组合
我有 2 张桌子
和
这些表在 id_b 上连接。现在我想知道没有F9.00 | G
. 所以在这种情况下,我想要的结果是02
. 即使该行01 | 012 | F3.00 | G
不符合F9.00 | G
要求,我也不希望有01
结果,因为有01 |011 | F9.00 | G
as01
的组合id_a
。
目前想不出一个简单的查询。也许你们中的一些人有一个想法。
问候, 索伦
database - 在没有 HDFS 和 HBase 的情况下使用 Kylin
是否可以在没有其他数据库(如 Hbase(加上 HDFS))的情况下连接 Apache Kylin?那么您可以将原始数据和多维数据集元数据存储在其他地方吗?
kylin - Kylin - 按 Rollup 和 Cube 分组
我正在尝试使用 ROLLUP 和 CUBE 运算符使用示例多维数据集来汇总数据。如果我执行查询,则会返回以下错误消息:
内部错误:应用规则 OLAPAggregateRule 时出错,args [rel#1246:LogicalAggregate.NONE.[](input=rel#1245:Subset#1.NONE.[],group={0, 1},groups=[{0 , 1}, {0}, {}],indicator=true,SUMOFPRICE=SUM($2))]。
我正在使用来自http://calcite.apache.org/docs/reference.html的文档来构建查询。
测试查询:
不使用多维数据集的简单查询
选择 a, b, sum(c) from (values (1, 2, 3, 4)) as t(a, b, c, d) group by rollup(a, b)
此查询返回预期结果
使用 ROLLUP 运算符使用 KYLIN_SALES 表进行查询
通过 rollup(seller_id, leaf_categ_id) 从 kylin_sales 组中选择 Seller_id、leaf_categ_id、sum(price) 作为 SumOfPrice
执行此查询时会返回问题开头提到的错误。
hadoop - 大数据世界中 OLAP 的第一步
首先,我现在可能对大数据能力有误解。所以,如果我过于乐观,请不要犹豫纠正我。
我通常使用常规 KPI,例如向我展示:在特定月份为每位经理提供满足某些复杂条件(加入少数事实表)的新客户数量。
这些请求是非常动态的,因此无法预测预先计算的数据。我们使用 OLAP 和 MDX 进行动态报告。动态计算的代价是性能。用户通常等待结果超过一分钟。
在这里,我得到了 BigData。我读过一些文章、论坛、文档,导致我得出模棱两可的结论。BigData 提供了在几秒钟内处理数据的工具,但它并不适合 BI 任务,例如连接、预聚合。hadoop 概念上没有经典的 DWH 等等。
尽管如此,这是一个理论。我找到了 Kylin,这让我实际尝试了一下。我挖掘的越多,出现的问题就越多。他们中有一些:
- 我需要任何编程知识(Java、Scala、Python)吗?
- 我需要图形工具,ssh 访问就足够了吗?
- 哪些硬件要求可以满足我对 100-200 GB 数据库(也是硬件数量)的需求?
- 什么是最好的文件系统(ext4),我应该关心吗?
- 如何从 RDBMS 迁移数据,是否有任何智能 ETL?
- 我应该首先学习和使用哪些技术(pig、spark 等)?
实际上我可能会提出错误的问题并且完全误解了这个概念,但希望有一些好的线索。随意提供您认为对 BI 和大数据整合有用的任何建议。
我知道http://kylin.apache.org/docs15/index.html 但如果没有后端背景,我会感到不舒服。
hadoop - Apache kylin 多维数据集失败“没有作业计数器”
使用 kylin 1.5.4,当我构建立方体时,它在第 3 步失败,日志显示“没有作业计数器”。它也没有获取蜂巢表的基数。当我创建一个模型或多维数据集时,它会抛出无法采取行动的错误,但是当我关闭 json 页面时,它们会被创建。它没有获取日期分区列,而是在日志中找不到列。
非常感谢任何帮助或见解。