我将在 solr 上构建一个搜索引擎,并将 nutch 作为爬虫。我必须索引大约 1300 万份文档。我有 3 台服务器来完成这项工作:
- 4 核 Xeon 3Ghz,20Gb 内存,1.5Tb sata
- 2*4 核 Xeon 3Ghz,16Gb 内存,500Gb ide
- 2*4 核 Xeon 3Ghz,16Gb 内存,500Gb ide
我可以使用其中一台服务器作为主服务器进行爬网和索引,另外两台服务器作为从服务器进行搜索,或者我可以使用一台服务器进行搜索,另外两台用于使用两个分片进行索引。你能推荐什么架构?我应该使用分片,多少分片,以及我应该使用哪些服务器?