全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
楼主: 唐王李世民

[疑问] 求助一个PHP Curl网页源码动态的问题

[复制链接]
 楼主| 发表于 2024-11-11 16:24:19 | 显示全部楼层
vikin 发表于 2024-11-11 14:35
这种动态的网页 我之前研究了很久你百度下:
ChromeDriver抓取动态网页

谢谢您的回复,我了解一下
 楼主| 发表于 2024-11-11 16:25:25 | 显示全部楼层
kpxyyyy 发表于 2024-11-11 14:43
做爬虫要先分析网页的结构,而不是直接就写请求,现在的网站很多都是前后端分离动态加载。 ...

谢谢您的回复,技术菜,所以很多不懂
 楼主| 发表于 2024-11-11 16:33:02 | 显示全部楼层
kof21411 发表于 2024-11-11 14:50
你可以直接curl他的接口api拿内容

它的接口现在改了好像,找不到vid了
 楼主| 发表于 2024-11-11 16:35:24 | 显示全部楼层
imdong 发表于 2024-11-11 15:06
你要获取页面内容不需要输出响应头信息
把这段curl_setopt($ch, CURLOPT_HEADER, $header); 改成curl_setop ...

好的,谢谢您的回复
发表于 2024-11-11 16:36:27 | 显示全部楼层
zhughe 发表于 2024-11-11 15:16
python + playwright 轻松搞定,php只能通过浏览器分析接口,直接抓接口

其实php也有querylist
 楼主| 发表于 2024-11-11 16:43:09 | 显示全部楼层
imdong 发表于 2024-11-11 15:06
你要获取页面内容不需要输出响应头信息
把这段curl_setopt($ch, CURLOPT_HEADER, $header); 改成curl_setop ...

  看不到内容跳转了,但是一直在转圈圈了,代码没办法进入下一步
 楼主| 发表于 2024-11-11 17:46:59 | 显示全部楼层
kpxyyyy 发表于 2024-11-11 16:36
其实php也有querylist

需要额外安装模块吗?谢谢您了
发表于 2024-11-11 21:16:10 | 显示全部楼层
本帖最后由 imdong 于 2024-11-11 21:27 编辑
唐王李世民 发表于 2024-11-11 16:43
看不到内容跳转了,但是一直在转圈圈了,代码没办法进入下一步


设置cookie
头信息下只需要设置UA,cookie 设置一个ttwid参数值随机数

https:   //  i.ibb  .co/1stn4fW/20241111211814.jpg (去掉空格)
 楼主| 发表于 2024-11-12 09:04:12 | 显示全部楼层
imdong 发表于 2024-11-11 21:16
设置cookie
头信息下只需要设置UA,cookie 设置一个ttwid参数值随机数

谢谢您的回复,我试一试
发表于 2024-11-12 12:22:37 | 显示全部楼层
说实话,整贴下来也没看到你到底要取什么内容,取网页代码平常的请求就能拉,取数据爬人家接口就行了.
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-9-26 19:21 , Processed in 0.075509 second(s), 6 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表