1

例如,有 5 个对象存储。我正在考虑将文档插入其中,但不是按顺序插入。最初它可能是顺序的,但如果我可以使用某种排名方法插入,则更容易知道要搜索哪个对象存储以找到文档。目标是减少对象存储搜索的次数。这只有在插入使用一些智能算法时才能实现。

我发现有用的一种方法是使用当年的 MOD N(对象存储数量)来确定文档的去向。我们能有一些更好的方法来解决这个问题吗?

4

2 回答 2

0

您对“FileNet 对象存储中的内容”的标准是什么?基本上是“哪些文件在逻辑上属于一起?”。

于 2012-03-31T02:50:35.377 回答
0

如果您想要快速访问,有几个标准:

  1. 散列函数必须基于所查询的数据是可重现的。这意味着,很大程度上取决于您期望的查询。

  2. 您通常希望将对象尽可能均匀地分布在各个存储中。如果你想并行,你想从不同的商店访问给定查询的每个文档,这样它们就不会互相阻塞。因此,您的散列函数应该尽可能地分散到不同的存储中以获取相似的文档。如果您希望与同一查询相关的文档来自同一年,请不要直接使用年份。

这假设,您希望能够进行可以瘫痪的快速查询。如果你有一个系统,你首先必须打开一个可能很昂贵的存储连接,那么与同一查询相关的大多数文档都应该放在同一个存储中,你不应该接受我上面的建议。

于 2012-03-31T13:26:19.927 回答