0

我使用 mongoimport 导入了一个 csv 文件。这个数据集要具体:

https://www.google.com/fusiontables/DataSource?docid=1d7Qps--r0i-E4drYQQzntSdXN8xJ4-6qk24CiMed#map:id=3

我遇到的问题与该description领域有关。

[{"landing_point_id":3522,"latlon":"51.898325,-8.472768","name":"Cork, Ireland"}]

我认为这是一个对象数组,所以我正在为它制作一个猫鼬模型,如下所示:

  description: [{
    landing_point_id: Number,
    latlon: String,
    name: String
        }],

但这给了我一个空数组。如果我将类型设置为descriptionString我会得到值——但当然是作为字符串,所以属性是不可访问的。

"description" : "[{\"landing_point_id\":8398,\"latlon\":\"52.207114,1.620294\",\"name\":\"Sizewell, United Kingdom\"}]"

所以问题似乎是该领域descriptionString我希望它成为Array.

按照此处的答案,我尝试将其从字符串转换为数组,但没有运气。

db.cables.find().snapshot().forEach(function (el) {
  el.description_array = [ el.description ];
  db.cables.save(el);
});

这只是将字符串包装在另一个数组中。

"description_array" : [ "[{\"landing_point_id\":8398,│    col10: '',
\"latlon\":\"52.207114,1.620294\",\"name\":\"Sizewell, United Kingdom\"}]" ]

同样的

  el.description_array = new Array(el.description);

任何想法如何解决这个问题?

在导入之前可以在 csv 文件中编辑的内容以使 mongoimport 正确解释它?

4

1 回答 1

0

现在需要将“字符串”“解析”成有效的数据结构。此外,“latlong”作为“字符串”本身和 MongoDB 如何期望坐标的错误顺序对您来说都是无用的。

所以我们修复了这两个:

var bulk = db.cables.initializeOrderedBulkOp(),
    count = 0;

db.cables.find({ "description": { "$type": 2 } }).forEach(function(doc) {
    doc.description = JSON.parse(doc.description);
    doc.description = doc.description.map(function(desc) {
        desc.coordinates = desc.latlon.split(",").reverse().map(function(el) { 
            return parseFloat(el);
        });
        delete desc.latlong;
        return desc;
    });

    bulk.find({ "_id": doc._id }).updateOne({
        "$set": { "description": doc.description }
    });
    count++;

    // Send batch one in 1000
    if (count % 1000 == 0) {
       bulk.execute();
       bulk = db.cables.initializeOrderedBulkOp();
    }
});

// Clear any queued
if ( count % 1000 != 0 )
    bulk.execute();

将您的猫鼬模式更改为:

"description": [{
    "landing_point_id": Number,
    "coordinates": [],
    "name": String
}],

现在您有了可以索引并与 GeoSpatial 查询一起使用的数据。

于 2015-07-19T22:58:26.827 回答