全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 996|回复: 6

claude用盗版书籍训练数据国人不说话

[复制链接]
发表于 14 小时前 | 显示全部楼层 |阅读模式
本帖最后由 kaka1 于 2026-4-1 02:44 编辑

但是为什么DeepSeek蒸馏其他模型的数据会招很多国人骂呢?


2025年9月,Anthropic刚因版权官司和一群作者达成15亿美元和解。原告指控Anthropic从LibGen、Pirate Library等盗版网站下载了数百万本版权书,用来训练Claude。和解后Anthropic要删除这些数据并赔钱,但当时估值已超1800亿美元,这点罚款对它来说九牛一毛。马斯克多次嘲讽的就是这个“前科”。


Anthropic指控三家中国AI公司(DeepSeek、Moonshot AI/月之暗面、MiniMax)对Claude进行了“工业级蒸馏攻击”。
他们通过约24,000个虚假账号,生成了超过1600万次对话,系统性地提取Claude的核心能力,然后用这些输出数据去训练自己的模型。
Anthropic认为这违反了服务条款和地区访问限制,还上升到了“风险”高度——因为蒸馏出来的模型没有Claude的安全防护,可能被用于网络攻击、生物武器或监控等。





Anthropic自己一边到处指控别人“蒸馏”它的Claude模型,一边却被马斯克直接一针见血地戳穿了“双标”:你自己当年不也靠“偷”数据起家吗?现在别人偷你的,你急了?

马斯克原贴:https://x.com/elonmusk/status/2026012296607154494

claude原贴地址:https://www.anthropic.com/news/detecting-and-preventing-distillation-attacks


发表于 13 小时前 | 显示全部楼层
谁家 AI 不是从互联网找数据?别人是从各种网站找数据,DS 是蒸馏 GPT 的数据,初期 DS 它告诉自己就是 chatgpt
发表于 8 小时前 来自手机 | 显示全部楼层
翻译:大家快看别人也在吃石,我吃点怎么了!
发表于 5 小时前 | 显示全部楼层
其实基本所有AI模型都会有下载并且学习盗版书籍吧
发表于 1 小时前 | 显示全部楼层
所以,被告了,赔钱,有什么不合理?
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2026-4-1 16:42 , Processed in 0.065358 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表