关于怎么有效防止采集
作者: 唐布拉草原 日期: 2008-03-16 19:11
1。防采集就是用JS调用,列表用JS调用,或者文章的开头或者结尾替换成JS文件。但是这样对于有些禁用JS的浏览器访问,更不根本访问不到内容,或者访问内容不全。
2. 采用限制刷新次数,就是同一个IP在规定时间内刷新几次,有服务器上限制的,也有程序限制的,但是对于搜索的蜘蛛有很大影响。
3. 还有就是采用多套模板,像我采集的时候碰到多套模板就是先一个规则采集好,再找到另外一个模板的规则,再采一篇。。。。。
4、还有就是内容中增加随机字符,但是这个效果不是很大,可以过滤,除非要N多的信息,但是可以直接过滤掉网站名称相关的词,也网站地址相关的,同样可以处理。
5. 其实现在觉得一个最好的方法就是内容的部分文字生成图片,再打上图片。碰到这种基本人家看不上了、。、、
评论: 0 |
引用: 0 |
阅读: 186
发表评论
订阅
上一篇
返回
下一篇
标签:


终于差不多将湖州高歌的网站完成了。 (2007-09-16 22:50)
网站雷达 4.6 (Radar Website Monitor 4.6) 站长必备 汉化版 (2007-09-08 10:11)
今天一冲动又弄了个垃圾站。。 (2007-08-07 22:38)
火车头占用内存真高。。。 (2007-07-03 22:31)