问题标签 [datastax-enterprise-graph]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
datastax - 如何从另一个程序中使用 graphLoader 并获得结果成功或失败
我在控制台中运行 graphLoader 但我想要一个自动进程来调用 graphLoader 并能够知道 graphLoader 是成功还是失败。如果出现错误,插入时哪些顶点和边失败。(是 graphLoader 成功意味着所有数据插入和失败意味着,整个加载失败?)
node.js - 如何使用 Node.js Driver for DataStax 图运行 OLAP 查询?
我想运行 OLAP 查询。我为 OLTP 查询使用 datastax node.js 驱动程序。如何使用 node.js 运行 OLAP?
http://www.datastax.com/dev/blog/nodejs-driver-for-datastax-enterprise
datastax - datastax graphloader 性能,是批量加载还是为每个顶点使用 api graph.addVertex?
如何批量加载到 dse 图中?
graph.addVertex 仅用于一个顶点。
我不明白“batch_size”配置在 graphLoader 中的工作原理。
graphLoader 如何创建事务?
datastax - 修改大图 DSE Datastax
我想遍历每个节点并计算该节点的连接数。有没有办法以分布式方式遍历节点?我有大约 5000 万个节点
谢谢克里斯蒂
datastax-enterprise - 带有示例 CSV 文件的 DSE 图形加载器错误
我正在尝试 DSE 图形加载器。DSE 图形加载器版本为 5.0.3。我正在使用从 DataStax 网站下载的 Virtual Box 图像。
当我遵循https://docs.datastax.com/en/latest-dse/datastax_enterprise/graph/dgl/dglCSV.html的指示时。它总是因以下两种类型的错误而失败。
错误 DataLoaderImpl:594 - 此操作超出图形驱动程序尝试,记录失败,但不存在记录(可能是模式操作)com.datastax.dsegraphloader.exception.TemporaryException:om.datastax.driver.core.exceptions.InvalidQueryException :无法识别的选项字符串:graph.tx_groups.default.verify_unique
2016-11-23 13:38:41 错误 DataLoaderImpl:594 - 无法加载记录 [{gender =F, name=Julia Child}] 为源记录 [CSVRecord [comment=null, mapping={name] 加载 [作者] =0, 性别 =1}, recordNumber=1, values=[Julia Child, F]]] java.lang.NullPointerException
datastax - 从 Titan 迁移到 DataStax Enterprise Graph
我正在从 Titan 迁移到 Datastax。我有一个包含大约 5000 万个节点的图表,由人员、地址、电话等组成
我想计算一个 Person 节点连接(有多少人拥有相同的电话、地址等)。
在 Titan 中,我编写了一个遍历所有人员节点的 Hadoop 作业,我可以编写一个 gremlin 脚本来查看有多少人在这个特定节点上拥有相同的电话
因此,作为输入属性,我有:
对于查询过滤器,我只查询人员节点
并运行我使用的脚本
这将为每个节点计算该人拥有的共享电话连接数。
有没有办法在 Datastax 中编写这种脚本来检查人员节点。我看到 Datastax 使用 Spark 分析来计算节点,例如,
但我没有找到更多关于如何使用分析运行自定义脚本的文档
谢谢
datastax - gremlin-console 中的远程 OLAP 连接失败:当 spark 未运行或无法检测到时,无法创建 OLAP 遍历源
根据 :
我以 OLAP 模式连接并遇到上述故障。
我做了'dse spark',成功。但我不明白为什么我不能运行 OLAP 查询。我在多台机器上使用 datastax dse 图集群
datastax - datastax 5.0.3 图形分析更多示例
在以下链接 http://www.datastax.com/dev/blog/dse-5-0-3-released-huge-performance-gains-for-graph-analytics
有一些 OLAP 查询示例,但我想获得更多示例。
我可以在结果查询中获取顶点和边吗?(不仅是 groupCount() 和 count())?
cassandra - 在 cassandra 中分发图形数据
我正在加载一些图形数据,使用 Titan API,并将 cassandra 配置为存储后端。我的图形数据有大约 100 万个顶点。我希望这些数据分布在 N 个 cassandra 节点上。
因此,为此,我在同一系统中配置了 3 个节点,每个节点的 IP 为127.0.0.1
,127.0.0.2
和127.0.0.3
. nodetool status 的输出显示所有 3 个 IP 和负载均摊。
我尝试加载一个图,但整个数据在所有 3 个节点(节点 1 中的 1M 顶点、节点 2 中的 1M 顶点和节点 3 中的 1M 顶点)中复制。我希望数据分布在所有 3 个节点上,例如 node1 中的 1M/3、node2 中的 1M/3 和 node3 中的 1M/3。
输出DESCRIBE KEYSPACE TITAN
:
nodetool状态的输出:
有人可以与我分享正确配置的详细信息以分担负载。如果有任何问题,请纠正我。
谢谢,哈里
apache-spark - PySpark、Graph 和 Spark 数据帧 foreach
我正在使用 spark sql 上下文数据帧来并行化操作。简而言之,我将 CSV 读入数据框 df,然后调用 df.foreachPartition(testFunc) 在图上执行获取或创建操作(在 testFunc 中)。
我不确定在这种情况下是否需要在传递给数据帧(testFunc)的函数中定义集群和会话,因为我在定位以这种方式完成的图遍历的示例时遇到了一些麻烦.
我可以手动运行图形遍历就好了。如果我省略 session.execute_graph("gV()....") 部分,我还可以在调用 df.foreachPartition(testFunc) 时打印出行中的值。
最重要的是,如果我只是显式调用 testFunc 并传递行列表(例如 testFunc(df.collect())),它将成功运行并在图中获取或创建适当的顶点。
所以我认为它与函数内调用图形遍历的方式有关,因为它被传递给不同的线程?
test_sc_CSV.py:
错误日志:
图架构:
CSV: