0

在 Visual Studio 2019 中使用 ElasticSearch NEST .Net 包 7.13.2

对于产品列表,我目前正在使用以下代码更新我的产品索引中的现有文档:

var productIndex = "productindex";
foreach (var product in products)
{
  productClassIdScript = $"ctx._source.productClassId = \"{product.ProductClassId}\"; ";
  elasticClient.Update<productIndex, object>(product.Id,
               q => q.Script(s => s.Source(productClassIdScript).Lang("painless")));
}

我为超过 10000 种产品执行此操作,大约需要 2 个小时。我知道我可以使用批量 API插入新文档。我可以使用BulkAll方法进行更新吗?

像这样的东西:

var bulkAllObservable = elasticClient.BulkAll<Product>(myBulkAllRequest)
                        .Wait(TimeSpan.FromMinutes(15), next =>
                        {
                            // do something e.g. write number of pages to console
                        });

我应该如何构造myBulkAllRequest

任何帮助深表感谢。

4

1 回答 1

0

批量索引将大大减少您的索引/更新时间,所以这是一个好方法。

您仍然可以BulkAll用于更新,如果 elasticsearch 已经有提供 id 的文档,该文档将被更新。

var bulk = elasticClient.BulkAll<EsDocument>(new List<EsDocument> { new EsDocument { Id = "1", Name = "1" }}, d => d);
using var subscribe = bulk.Subscribe(new BulkAllObserver(onNext: response => Console.WriteLine("inserted")));
bulk.Wait(TimeSpan.FromMinutes(1), response => Console.WriteLine("Bulk insert done"));

var bulk2 = elasticClient.BulkAll<EsDocument>(new List<EsDocument> { new EsDocument { Id = "1", Name = "1_updated"  }}, d => d);
using var subscribe2 = bulk2.Subscribe(new BulkAllObserver(onNext: response => Console.WriteLine("inserted")));
bulk2.Wait(TimeSpan.FromMinutes(1), response => Console.WriteLine("Bulk insert done"));

首先BulkAll将插入带有Id“1”的文档,第二个将使用“1”更新文档Id

第一次大容量后的索引状态

在此处输入图像描述

在第二个之后

在此处输入图像描述

于 2021-07-12T11:31:35.743 回答