0

我正在加载一些图形数据,使用 Titan API,并将 cassandra 配置为存储后端。我的图形数据有大约 100 万个顶点。我希望这些数据分布在 N 个 cassandra 节点上。

因此,为此,我在同一系统中配置了 3 个节点,每个节点的 IP 为127.0.0.1,127.0.0.2127.0.0.3. nodetool status 的输出显示所有 3 个 IP 和负载均摊。

我尝试加载一个图,但整个数据在所有 3 个节点(节点 1 中的 1M 顶点、节点 2 中的 1M 顶点和节点 3 中的 1M 顶点)中复制。我希望数据分布在所有 3 个节点上,例如 node1 中的 1M/3、node2 中的 1M/3 和 node3 中的 1M/3。

输出DESCRIBE KEYSPACE TITAN

CREATE KEYSPACE titan WITH replication = {'class': 'SimpleStrategy', 'replication_factor': '1'} AND durable_writes = true;

nodetool状态的输出:

Status=Up/Down |/ State=Normal/Leaving/Joining/Moving -- Address Load Tokens Owns Host ID Rack 
UN 127.0.0.1 7.79 MB 1 ? f5a689f0-f4c1-4f68-ab81-58066e986cd4 rack1 
UN 127.0.0.2 229.79 KB 1 ? b6940e7e-b6eb-4d1f-959e-b5bd0f5cea15 rack1 
UN 127.0.0.3 7.11 MB 1 ? a3244b16-a73c-4801-868f-05de09615ed9 rack1

有人可以与我分享正确配置的详细信息以分担负载。如果有任何问题,请纠正我。

谢谢,哈里

4

0 回答 0