问题标签 [datastax-enterprise-graph]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
22 浏览

datastax - 如何从另一个程序中使用 graphLoader 并获得结果成功或失败

我在控制台中运行 graphLoader 但我想要一个自动进程来调用 graphLoader 并能够知道 graphLoader 是成功还是失败。如果出现错误,插入时哪些顶点和边失败。(是 graphLoader 成功意味着所有数据插入和失败意味着,整个加载失败?)

0 投票
1 回答
163 浏览

node.js - 如何使用 Node.js Driver for DataStax 图运行 OLAP 查询?

我想运行 OLAP 查询。我为 OLTP 查询使用 datastax node.js 驱动程序。如何使用 node.js 运行 OLAP?

http://www.datastax.com/dev/blog/nodejs-driver-for-datastax-enterprise

0 投票
1 回答
60 浏览

datastax - datastax graphloader 性能,是批量加载还是为每个顶点使用 api graph.addVertex?

如何批量加载到 dse 图中?

graph.addVertex 仅用于一个顶点。

我不明白“batch_size”配置在 graphLoader 中的工作原理。

graphLoader 如何创建事务?

0 投票
0 回答
55 浏览

datastax - 修改大图 DSE Datastax

我想遍历每个节点并计算该节点的连接数。有没有办法以分布式方式遍历节点?我有大约 5000 万个节点

谢谢克里斯蒂

0 投票
1 回答
199 浏览

datastax-enterprise - 带有示例 CSV 文件的 DSE 图形加载器错误

我正在尝试 DSE 图形加载器。DSE 图形加载器版本为 5.0.3。我正在使用从 DataStax 网站下载的 Virtual Box 图像。

当我遵循https://docs.datastax.com/en/latest-dse/datastax_enterprise/graph/dgl/dglCSV.html的指示时。它总是因以下两种类型的错误而失败。

错误 DataLoaderImpl:594 - 此操作超出图形驱动程序尝试,记录失败,但不存在记录(可能是模式操作)com.datastax.dsegraphloader.exception.TemporaryException:om.datastax.driver.core.exceptions.InvalidQueryException :无法识别的选项字符串:graph.tx_groups.default.verify_unique

2016-11-23 13:38:41 错误 DataLoaderImpl:594 - 无法加载记录 [{gender =F, name=Julia Child}] 为源记录 [CSVRecord [comment=null, mapping={name] 加载 [作者] =0, 性别 =1}, recordNumber=1, values=[Julia Child, F]]] java.lang.NullPointerException

0 投票
1 回答
242 浏览

datastax - 从 Titan 迁移到 DataStax Enterprise Graph

我正在从 Titan 迁移到 Datastax。我有一个包含大约 5000 万个节点的图表,由人员、地址、电话等组成

我想计算一个 Person 节点连接(有多少人拥有相同的电话、地址等)。

在 Titan 中,我编写了一个遍历所有人员节点的 Hadoop 作业,我可以编写一个 gremlin 脚本来查看有多少人在这个特定节点上拥有相同的电话

因此,作为输入属性,我有:

对于查询过滤器,我只查询人员节点

并运行我使用的脚本

这将为每个节点计算该人拥有的共享电话连接数。

有没有办法在 Datastax 中编写这种脚本来检查人员节点。我看到 Datastax 使用 Spark 分析来计算节点,例如,

https://docs.datastax.com/en/latest-dse/datastax_enterprise/graph/graphAnalytics/northwindDemoGraphSnapshot.html

但我没有找到更多关于如何使用分析运行自定义脚本的文档

谢谢

0 投票
1 回答
231 浏览

datastax - gremlin-console 中的远程 OLAP 连接失败:当 spark 未运行或无法检测到时,无法创建 OLAP 遍历源

根据 :

https://docs.datastax.com/en/latest-dse/datastax_enterprise/graph/graphAnalytics/northwindDemoGraphSnapshot.html

我以 OLAP 模式连接并遇到上述故障。

我做了'dse spark',成功。但我不明白为什么我不能运行 OLAP 查询。我在多台机器上使用 datastax dse 图集群

0 投票
1 回答
54 浏览

datastax - datastax 5.0.3 图形分析更多示例

在以下链接 http://www.datastax.com/dev/blog/dse-5-0-3-released-huge-performance-gains-for-graph-analytics

有一些 OLAP 查询示例,但我想获得更多示例。

我可以在结果查询中获取顶点和边吗?(不仅是 groupCount() 和 count())?

0 投票
0 回答
83 浏览

cassandra - 在 cassandra 中分发图形数据

我正在加载一些图形数据,使用 Titan API,并将 cassandra 配置为存储后端。我的图形数据有大约 100 万个顶点。我希望这些数据分布在 N 个 cassandra 节点上。

因此,为此,我在同一系统中配置了 3 个节点,每个节点的 IP 为127.0.0.1,127.0.0.2127.0.0.3. nodetool status 的输出显示所有 3 个 IP 和负载均摊。

我尝试加载一个图,但整个数据在所有 3 个节点(节点 1 中的 1M 顶点、节点 2 中的 1M 顶点和节点 3 中的 1M 顶点)中复制。我希望数据分布在所有 3 个节点上,例如 node1 中的 1M/3、node2 中的 1M/3 和 node3 中的 1M/3。

输出DESCRIBE KEYSPACE TITAN

nodetool状态的输出:

有人可以与我分享正确配置的详细信息以分担负载。如果有任何问题,请纠正我。

谢谢,哈里

0 投票
0 回答
940 浏览

apache-spark - PySpark、Graph 和 Spark 数据帧 foreach

我正在使用 spark sql 上下文数据帧来并行化操作。简而言之,我将 CSV 读入数据框 df,然后调用 df.foreachPartition(testFunc) 在图上执行获取或创建操作(在 testFunc 中)。

我不确定在这种情况下是否需要在传递给数据帧(testFunc)的函数中定义集群和会话,因为我在定位以这种方式完成的图遍历的示例时遇到了一些麻烦.

我可以手动运行图形遍历就好了。如果我省略 session.execute_graph("gV()....") 部分,我还可以在调用 df.foreachPartition(testFunc) 时打印出行中的值。

最重要的是,如果我只是显式调用 testFunc 并传递行列表(例如 testFunc(df.collect())),它将成功运行并在图中获取或创建适当的顶点。

所以我认为它与函数内调用图形遍历的方式有关,因为它被传递给不同的线程?

test_sc_CSV.py

错误日志

图架构

CSV