全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 999|回复: 24

[经验] 全球DZ开发论坛之如何辨别用户是脚本?

[复制链接]
发表于 2022-6-21 14:02:35 | 显示全部楼层 |阅读模式
本帖最后由 深海空间 于 2022-6-21 18:24 编辑

某论坛需要每天签到, 所以我是用python的requests库写了个签到脚本, 大概实现逻辑是:

1. 使用chrome浏览器登录并访问签到页面, 然后把headers复制出来, 后续每天使用requests携带这个headers完成签到(cookie过期脚本会写相应处理逻辑)

2. 脚本启动前会随机休眠5-15分钟再执行签到函数(每天同一时间一分不差的签到看起来很可疑....)

3. 在linux上使用cron来每天执行脚本

以上, 仅从技术角度讨论, 网站管理员有没有办法知道我是脚本?

ps. 站方禁用脚本签到, 原因不是危害服务器, 而是有人举报那些使用脚本签到的, 然后站方出于"公平"考虑禁用了.
发表于 2022-6-21 14:27:03 | 显示全部楼层
看管理员技术如何,一般情况下你带上正常浏览器的header,时间不那么频繁,管理员基本判断不出来,会点技术的就很容易把你找出来了,比如进入签到页面给setcookie,你签到的时候没这个cookie就把你抓出来了,更复杂点就js判断咯,不过你没啥危害基本没人查
发表于 2022-6-21 18:42:52 | 显示全部楼层
深海空间 发表于 2022-6-21 18:25
loc难得有正经贴讨论,咋就没人了

因为都是些盲流子,正经的技术贴没多少懂的
 楼主| 发表于 2022-6-21 15:13:21 | 显示全部楼层

请指点一下~

点评

现在一些爬虫都是用 Chrome 了, docker 调用. 让 Chrome 库自己去处理这些,只需要模拟登录进去,然后模拟点击 处理. 这样复杂的留给库处理. 专注逻辑.  发表于 2022-6-21 18:44
1. cookie, 其实会 带很多信息,比如你上一次浏览的哪个页面,都有, 2. header 信息 如果管理员非要查看具体日志,还是能找到你的, 但是,谁有那功夫找你  发表于 2022-6-21 18:42
发表于 2022-6-21 14:08:45 | 显示全部楼层
从技术的角度说一点,比如gmail注册页面,JD/TB某登录页面,就有行为分析,会判断鼠标轨迹、
一般网站是不会弄这个的,如果你同一时间签到,除非网站管理员写了异常监控或者手动去看日志,否则不会知道你是用的脚本,一般网站管理员不会这么闲,正常用户脚本签到,这是很正常的情况,可容许,如果批量发帖广告,才会查你。
 楼主| 发表于 2022-6-21 14:23:59 | 显示全部楼层
sah 发表于 2022-6-21 14:08
从技术的角度说一点,比如gmail注册页面,JD/TB某登录页面,就有行为分析,会判断鼠标轨迹、
一般网站是不 ...

假设管理员真的查日志的话,会从哪里来查? 我没搭建过论坛, 所以不知道后台看用户的时候是怎么样的, 以我的认识的话, 会查user-agent? 还是什么?
发表于 2022-6-21 14:34:15 | 显示全部楼层
深海空间 发表于 2022-6-21 14:23
假设管理员真的查日志的话,会从哪里来查? 我没搭建过论坛, 所以不知道后台看用户的时候是怎么样的, 以我 ...

这得找个DZ大佬来解答了,我也没搭建过。
如果是我自己的网站,我也没搭建监控,我都是从日志里面查的,日志有访问IP,访问网址,header头部(浏览器语言,UA,host等) 这些记录。
更详细点的可以看到你什么时间访问了什么页面,从哪个页面跳转到哪个页面,停留时间等等。
如4楼所说,无危害人家不会管你。
发表于 2022-6-21 14:42:14 | 显示全部楼层
你用个headless浏览器来搞,发现不了的,单纯的requests会被发现的,但你签个到不犯罪,不要怕
发表于 2022-6-21 14:46:11 | 显示全部楼层
这事,你得问我.
 楼主| 发表于 2022-6-21 15:10:23 | 显示全部楼层
helone 发表于 2022-6-21 14:27
看管理员技术如何,一般情况下你带上正常浏览器的header,时间不那么频繁,管理员基本判断不出来,会点技术 ...

脚本每天只访问一次服务器确实人畜无害, 主要是站方出于"公平"考虑, 不给使用...
 楼主| 发表于 2022-6-21 15:11:41 | 显示全部楼层
PHP是最好的语言 发表于 2022-6-21 14:42
你用个headless浏览器来搞,发现不了的,单纯的requests会被发现的,但你签个到不犯罪,不要怕 ...

脚本每天只访问一次服务器确实人畜无害, 主要是站方出于"公平"考虑, 不给使用...
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-3-29 01:04 , Processed in 0.063360 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表