我想加载一个 csv,其中包含 Wikipedia 类别 rels.csv (类别之间的 400 万个关系)之间的关系。我尝试通过更改以下参数值来修改设置文件:
dbms.memory.heap.initial_size=8G
dbms.memory.heap.max_size=8G
dbms.memory.pagecache.size=9G
我的查询如下:
USING PERIODIC COMMIT 10000
LOAD CSV FROM
"https://github.com/jbarrasa/datasets/blob/master/wikipedia/data/rels.csv?raw=true" AS row
MATCH (from:Category { catId: row[0]})
MATCH (to:Category { catId: row[1]})
CREATE (from)-[:SUBCAT_OF]->(to)
此外,我在 catId 和 catName 上创建了索引。尽管进行了所有这些优化,查询仍在运行(从昨天开始)。
你能告诉我是否应该做更多的优化来加载这个 CSV 文件?