全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 398|回复: 7

[疑问] 关于火车头(高铁)关联分页的问题,来个彦祖解答下

[复制链接]
发表于 2022-5-10 18:03:17 | 显示全部楼层 |阅读模式
本帖最后由 Twice 于 2022-5-10 18:12 编辑

问题很简单:
用火车头(高铁)采集小说这种类型的数据,
1.txt
2.txt
这类的,但是别人的网站存在分页。也就是1.txt这个章节分成1-3或者更多页面。

我用火车头采集这种页面,既要1-2-3-4-5-6.TXT这个章节,也需要把1.txt(1-3)在后台合成一个章节。

搞了一下午了,没有弄出头绪,来个大佬讲讲是软件本身的原因还是我思考有盲区。

loc.rar

1.83 KB, 下载次数: 2

高铁规则

发表于 2022-5-10 18:05:33 | 显示全部楼层
采集内容时候本身就有分页功能的吧
 楼主| 发表于 2022-5-10 18:08:39 | 显示全部楼层
本人马保国 发表于 2022-5-10 18:05
采集内容时候本身就有分页功能的吧

存在分页功能,但是内容是下一页下一页这种类型的,如果到达下一章这种程度就无法识别了。
我需要的是识别这个下一章做出判断。
 楼主| 发表于 2022-5-10 18:18:13 | 显示全部楼层
本人马保国 发表于 2022-5-10 18:05
采集内容时候本身就有分页功能的吧

意思是多级内容分页,1下面有1-3,2下面有1-3,以此类推
发表于 2022-5-10 18:20:13 | 显示全部楼层
最近我也在研究火车头,等回去看看
 楼主| 发表于 2022-5-10 19:19:42 | 显示全部楼层
蝙蝠侠 发表于 2022-5-10 18:20
最近我也在研究火车头,等回去看看

放弃了,不搞多级分页了。
发表于 2022-5-10 19:41:21 | 显示全部楼层
都采集小说了 为什么用关关或者94
 楼主| 发表于 2022-5-10 19:47:46 | 显示全部楼层
没钱图屌丶 发表于 2022-5-10 19:41
都采集小说了 为什么用关关或者94

关关94适用性不好,只能支持杰奇。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-25 22:24 , Processed in 0.131365 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表