我有一份公司名称和详细信息列表,例如电话号码、地址、电子邮件等。我想得到他们的 company_url。我们曾想过使用 google API 来发出请求,但结果证明成本很高。
搜索后,我发现 Common_Crawl 在网站愚蠢数据方面有点接近谷歌。
我找到了一个网站,可以将我们的电话号码与 Common_Crawl 中的可用电话号码进行实际映射。
我需要找到一种使用公司名称来匹配它们的方法。
有什么方法可以通过公司名称与 Common_crawl 数据进行映射。我不想查看每个公司名称的 32.5 亿条 common_crawl 记录。