2

我们计划将大量商业研究报告和文章从我们的内部网放到互联网上。但是,我们不希望其他人复制内容并自行托管。

我读到了 CAPTCHA 的保护,想知道这是否可能。读者应该能够免费阅读 50% 的文章,然后输入验证码以阅读文章的其余部分 [这样我们让那些模仿者的生活变得不那么艰难]

关于如何实现这一点的任何指示?内容是 HTML 和 Perl、PHP 的编程经验。如果需要,可以雇用其他人。

此外,搜索引擎会抓取文章的一半,并想知道它是否会因为无法破解验证码而无法抓取文章的其余部分而惩罚该网站?

谢谢。

4

4 回答 4

3

Recaptcha 提供了一个非常好的验证码服务 - http://recaptcha.net/

有一个 PHP 类可用于完成所有艰苦的工作。

重要的是要记住,搜索引擎无法解决验证码,因此它们只会索引报告的前半部分。只要这半部分主要包含正确的关键词,就不会造成大问题。不要犯“检测”搜索引擎并向普通用户显示不同内容的错误,因为主要搜索引擎认为这是垃圾邮件。

另一种解决方案是使用像 Copyscape ( http://www.copyscape.com/ ) 这样的服务来保护您的内容。

于 2009-03-10T08:07:11.547 回答
1

我知道这不是您要问的,但请考虑到 CAPTCHA 普遍存在问题,并且不会保护您的内容。你说前半段是免费的,那你是不是打算收下半段?CAPTCHA 在这里根本帮不上你的忙……

但即使你只是想阻止自动抓取,CAPTCHA 仍然无法解决问题。看看我对另一个验证码问题的回答……或者你可以直接看我去年在OWASP上展示的 ppt 。

于 2009-03-10T11:07:15.950 回答
0

如前所述, reCAPTCHA是一个很好的方法。

看看CPAN 上的Captcha::reCAPTCHA,根据CPAN评级评论开箱即用”

如果您想要验证码,那么在 CPAN 上有很多模块可以执行此操作;-)

希望有帮助。

于 2009-03-10T16:53:30.500 回答
0

读者应该能够免费阅读 50% 的文章,之后应输入验证码以阅读文章的其余部分

让您的 PHP 程序员输出 50% 的文章。在底部,添加验证码。如果用户输入了正确的验证码,则输出 100% 的文章。

关于如何实现这一点的任何指示?内容是 HTML 和 Perl、PHP 的编程经验。如果需要,可以雇用其他人。

作为一名 PHP 程序员,我使用http://www.phpcaptcha.org来实现验证码。

此外,搜索引擎会抓取文章的一半,并想知道它是否会因为无法破解验证码而无法抓取文章的其余部分而惩罚该网站?

不,它不会惩罚您,但该特定部分不会显示在搜索结果中。

于 2009-03-10T07:32:08.963 回答