全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 1603|回复: 8

有谁采集过知乎的图片么?求可行经验

[复制链接]
发表于 2017-9-29 16:35:58 | 显示全部楼层 |阅读模式
知乎载入一个话题,不会全部将所有回复都展现出来,每次都需要点“更多”,对想采集知乎某个话题里的图片,面对几千条回复的话题,着实头大。
有没有靠谱的高效率采集方法?
发表于 2017-9-29 16:48:12 | 显示全部楼层
我有现成的python脚本。
 楼主| 发表于 2017-9-29 16:51:30 | 显示全部楼层
tumbzzc 发表于 2017-9-29 16:48
我有现成的python脚本。

请不吝赐教分享脚本
发表于 2017-9-29 16:59:54 | 显示全部楼层
ultramancliub 发表于 2017-9-29 16:51
请不吝赐教分享脚本

https://github.com/za2016/pythoncode/blob/master/zhihu/zhihu_picture_downloader.py
 楼主| 发表于 2017-9-29 17:35:39 | 显示全部楼层
tumbzzc 发表于 2017-9-29 16:59
https://github.com/za2016/pythoncode/blob/master/zhihu/zhihu_picture_downloader.py

非常感谢
 楼主| 发表于 2017-9-29 20:02:57 | 显示全部楼层
tumbzzc 发表于 2017-9-29 16:59
https://github.com/za2016/pythoncode/blob/master/zhihu/zhihu_picture_downloader.py

运行这个脚本,你用的PYTHON版本是多少?
发表于 2017-9-30 09:22:50 | 显示全部楼层
ultramancliub 发表于 2017-9-29 20:02
运行这个脚本,你用的PYTHON版本是多少?

2.7
 楼主| 发表于 2017-9-30 13:34:54 | 显示全部楼层

关于您在“有谁采集过知乎的图片么?求可行经验”的帖子
关于知乎采集的脚本,我在WINDOWS 10运行出现以下错误。不知道你这边是否有遇到过没有?
”=====开始解析======
+++++正在解析第1页+++++
Traceback (most recent call last):
  File "zhihu_picture_downloader.py", line 149, in <module>
    pics=get_pic_from_topic(id,offset)
  File "zhihu_picture_downloader.py", line 116, in get_pic_from_topic
    dat=json.loads(js_data.content)['msg']
  File "C:\Python27\lib\json\__init__.py", line 339, in loads
    return _default_decoder.decode(s)
  File "C:\Python27\lib\json\decoder.py", line 364, in decode
    obj, end = self.raw_decode(s, idx=_w(s, 0).end())
  File "C:\Python27\lib\json\decoder.py", line 382, in raw_decode
    raise ValueError("No JSON object could be decoded")
ValueError: No JSON object could be decoded“
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-9-23 15:34 , Processed in 0.060421 second(s), 6 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表