全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 765|回复: 5

现在的搜索引擎是不是会"隐秘式"抓取?

[复制链接]
发表于 2023-10-22 10:37:48 | 显示全部楼层 |阅读模式
本帖最后由 squalll 于 2023-10-22 10:40 编辑

新站北岸下来,刚上线1天。除了提交搜索引擎外,其他啥宣传都还没干过

以前有老站在国外,发现有很多河南数据中心IP抓取,我当时甚至以为是CC攻击,我还纳闷为什么这么多河南,甚至一直开了5秒盾封堵,现在排名也全没了,当然这不见得是一回事,大概1年前开始的.

这新站发现也来了很多36和111开头的河南数据中心抓取,手法类似蜘蛛,但是UA就是普通访客。手法类似是因为每秒同段不同结尾的IP抓取不同的URL

就以前的经验假设就算是MJJ采集或者有什么攻击(新站不可能吧),是不会用类似蜘蛛的手法(不怕你疯他IP,他达不到目的抓不到了)一般都是同一个IP慢抓或者照死里抓。

感觉如果是,那可能就是类似于,现在搜索被作弊搞恶心了,也学的把自己隐秘式了,不说我是蜘蛛,反正我抓了,至于放不放出,我审核后再说吧

你们觉得呢?
发表于 2023-10-22 10:54:19 | 显示全部楼层
啥隐秘式,几大搜索引擎都会去模拟真实用户,抓了也不给流量,甚至不按协议抓取,自动封它ip就轮动整个ip段来抓,比如头条和流氓360
发表于 2023-10-22 10:56:19 来自手机 | 显示全部楼层
普通人做采集可能会吃免费饭,大厂做采集,合理合法
发表于 2023-10-22 11:10:05 | 显示全部楼层
河南的ip是挺多的,也不知道是干嘛的?有人说是再爬数据看有没有违规之类的
发表于 2023-10-22 11:13:53 | 显示全部楼层
这玩意要么是360的。要么就是未知爬虫。反正封了也没事。
发表于 2023-10-22 12:48:12 来自手机 | 显示全部楼层
还好直接阻断China mainland
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2026-2-6 03:20 , Processed in 0.063910 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表