我正在加载一些图形数据,使用 Titan API,并将 cassandra 配置为存储后端。我的图形数据有大约 100 万个顶点。我希望这些数据分布在 N 个 cassandra 节点上。
因此,为此,我在同一系统中配置了 3 个节点,每个节点的 IP 为127.0.0.1
,127.0.0.2
和127.0.0.3
. nodetool status 的输出显示所有 3 个 IP 和负载均摊。
我尝试加载一个图,但整个数据在所有 3 个节点(节点 1 中的 1M 顶点、节点 2 中的 1M 顶点和节点 3 中的 1M 顶点)中复制。我希望数据分布在所有 3 个节点上,例如 node1 中的 1M/3、node2 中的 1M/3 和 node3 中的 1M/3。
输出DESCRIBE KEYSPACE TITAN
:
CREATE KEYSPACE titan WITH replication = {'class': 'SimpleStrategy', 'replication_factor': '1'} AND durable_writes = true;
nodetool状态的输出:
Status=Up/Down |/ State=Normal/Leaving/Joining/Moving -- Address Load Tokens Owns Host ID Rack
UN 127.0.0.1 7.79 MB 1 ? f5a689f0-f4c1-4f68-ab81-58066e986cd4 rack1
UN 127.0.0.2 229.79 KB 1 ? b6940e7e-b6eb-4d1f-959e-b5bd0f5cea15 rack1
UN 127.0.0.3 7.11 MB 1 ? a3244b16-a73c-4801-868f-05de09615ed9 rack1
有人可以与我分享正确配置的详细信息以分担负载。如果有任何问题,请纠正我。
谢谢,哈里