全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 1693|回复: 35

PHP无法获取网页源码的问题

[复制链接]
发表于 2021-7-7 19:42:38 | 显示全部楼层 |阅读模式
本帖最后由 唐王李世民 于 2021-7-7 20:15 编辑

      

     今日头条网页,使用PHP无法读取它的源码,使用curl会返回error几个字符,而使用 file_get_contents直接返回空,模拟浏览器post和get的方法都试过了,直接返回空白或错误。

    应该如何获取呢?谢谢大家了。

例如地址:https://www.ixigua.com/6981346230844686862





 楼主| 发表于 2021-7-7 19:44:53 | 显示全部楼层
在本地使用浏览器的另存为,可以下载完整的源码,但是在服务器上用PHP来读取却总是出错。
发表于 2021-7-7 19:46:53 | 显示全部楼层
有些网页是先加载网页框架 然后 在通过js 来加载实际内容的
 楼主| 发表于 2021-7-7 19:49:37 | 显示全部楼层
dollck 发表于 2021-7-7 19:46
有些网页是先加载网页框架 然后 在通过js 来加载实际内容的

那应该如何获取内容呢?谢谢了
发表于 2021-7-7 20:01:47 | 显示全部楼层
你能说说你是怎么模拟浏览器的post和get么?
file_get_contents直接返回空 状态码是多少? 返回的response header中有什么内容?
发表于 2021-7-7 20:03:33 | 显示全部楼层
给个目标url 看看
发表于 2021-7-7 20:04:39 | 显示全部楼层
模拟 user agent了吗?
发表于 2021-7-7 20:07:13 来自手机 | 显示全部楼层
php发送请求的时候把 request headers 参数和浏览器一模一样提交过去。
 楼主| 发表于 2021-7-7 20:11:03 | 显示全部楼层
yjsx86 发表于 2021-7-7 20:01
你能说说你是怎么模拟浏览器的post和get么?
file_get_contents直接返回空 状态码是多少? 返回的response he ...

没留意返回状态码,网页上返回error几个字母或者空白,调试了几个UA,都是返回301,header我截图发原文中,谢谢您了。
 楼主| 发表于 2021-7-7 20:16:05 | 显示全部楼层
alk19t 发表于 2021-7-7 20:03
给个目标url 看看

地址已发1楼,谢谢您了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-27 12:02 , Processed in 0.063074 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表