欢迎光临杨雨的个人博客站!

杨雨个人网站-杨雨个人博客-杨照佳

杨雨个人博客网站

关注互联网和搜索引擎的个人博客网站

首页 > cms使用教程 > wordpress使用教程 >

wordpress防采集防恶意爬虫的一点思路

发布时间:2016-07-30  编辑:杨雨个人博客网站   点击:   

前一阵子杨雨个人博客接到一个客户的反映,网站被一个dedecms站点采集了,需求杨雨个人博客协助防止网站被采集。当时杨雨个人博客也没有头绪,只好叫客户先把服务器日志发过来分析下了。通过查看服务器日志,杨雨个人博客发现一个空http_user_agent的IP频繁的对网站发起请求。经过站长工具查询发现该IP正式采集客户网站的织梦站点的IP。当时杨雨个人博客立即联系客户,叫客户屏蔽这个IP。客户屏蔽IP后当天立马就看到效果了,可是第三天的时候,该织梦站点换了个IP又开始对客户的站点进行采集了。显然封IP的方法不是长久之计。正好有个好基友找到杨雨个人博客问如何判断浏览器类型来返回不同Css。杨雨个人博客立马想到了客户被采集的事,那么也可以通过判断HTTP_USER_AGENT来达到防止采集的,代码如下:

if(!$_SERVER['HTTP_USER_AGENT']) { //判断是否为空AGENT header("Content-type: text/Html; charset=utf-8"); echo '不许采集!因为采集的站长MJJ!'; exit; }

客户使用了以上代码之后,直到杨雨个人博客发布此篇文章时也未被再次采集了。

另外可能有人会问代码加到哪?(PS:将以上代码丢到根目录的index.php或者functions.php文件的 本文地址:http://itbyc.com/cms/wordpress/10793.html
转载请注明出处。

分享是一种快乐,也是一种美德:
评论列表(网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述)
博客首页 | WEB开发 | 网站运营 | CMS使用教程 滇ICP备14002061号-1