• 1 
预览模式: 普通 | 列表

关于怎么有效防止采集

      现在虽然来说采集站越来越难做了,但是还是有很多人在采集,毕竟不需要很多精力就可以做一个内容丰富的站出来了。防采集现在虽然有很多方法,但是也没有有效方法,虽然有的能防止采集但是弊端也有很多,下面对几个放采集的方法做个总结,可能不是很全、

1。防采集就是用JS调用,列表用JS调用,或者文章的开头或者结尾替换成JS文件。但是这样对于有些禁用JS的浏览器访问,更不根本访问不到内容,或者访问内容不全。

2. 采用限制刷新次数,就是同一个IP在规定时间内刷新几次,有服务器上限制的,也有程序限制的,但是对于搜索的蜘蛛有很大影响。

3. 还有就是采用多套模板,像我采集的时候碰到多套模板就是先一个规则采集好,再找到另外一个模板的规则,再采一篇。。。。。

4、还有就是内容中增加随机字符,但是这个效果不是很大,可以过滤,除非要N多的信息,但是可以直接过滤掉网站名称相关的词,也网站地址相关的

[阅读全文]

标签: 采集 网站

火车头占用内存真高。。。

attachments/200707/8168104787.jpg    才采了一点点就占了 我300多M 的内存,本来我有 768M 内存的 现在都剩下一点点了。诶。。。

没办法,如果有钱的话 去配台2G 内存的新机,现在我电脑都老爷货了。。。DDR1的 内存又这么贵。。
标签: 采集
  • 1