全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 599|回复: 8

百度爬虫竟然支持js渲染??

[复制链接]
发表于 2021-8-4 21:23:38 | 显示全部楼层 |阅读模式
本帖最后由 jiangyi 于 2021-8-4 21:26 编辑

这个页面是js渲染的,然而百度可以抓到内容
https://www.baidu.com/s?wd=%E4%B ... 9%99%A9%E5%8C%BAapi


发表于 2021-8-4 21:26:53 | 显示全部楼层
这个应该不稀奇,因为现在 JS 动态加载网页内容的网站越来越多了~
发表于 2021-8-4 21:27:53 | 显示全部楼层
"Mozilla/5.0 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)"


都想屏蔽了,天天来盗图
发表于 2021-8-4 21:28:24 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2021-8-4 21:28:52 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2021-8-4 21:29:55 | 显示全部楼层
挂了联盟js广告,掉收录
发表于 2021-8-4 21:30:09 | 显示全部楼层
这不是正常操作吗
 楼主| 发表于 2021-8-4 22:11:18 | 显示全部楼层
alpha 发表于 2021-8-4 21:28
这种是json直接写入源码的,百度解析能力仅限于此,xhr请求的没戏。

原来如此
发表于 2021-8-4 22:15:39 | 显示全部楼层
应该是有渲染蜘蛛的,不过比较少
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-25 19:06 , Processed in 0.063222 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表