大瓜!华为盘古开源大模型被质疑抄袭 QWEN
本帖最后由 不要搞我 于 2025-7-4 16:34 编辑HonestAGI 研究团队发表论文,提出通过分析大语言模型注意力参数标准差模式来识别模型"指纹"的新方法。该技术能够检测模型是否通过继续训练从其他模型衍生而来,即使经过大量训练也难以消除这些内在特征。
研究团队使用此方法发现,华为盘古 Pro MoE 模型与 Qwen-2.5 14B 模型存在 0.927 的极高相关性,表明前者可能通过"升级改造" Qwen 模型获得,而非从零训练。这一发现质疑了华为在技术报告中关于大规模独立训练投入的声明,涉嫌版权侵犯和信息造假。
https://github.com/HonestAGI/LLM-Fingerprint
知乎有 HonestAGI PDF 的翻译:
https://www.zhihu.com/question/1924254207063593527/answer/1924429291443164725
盘古团队跟HonestAGI团队吵起来了:
https://github.com/HonestAGI/LLM-Fingerprint/issues/8
“为”抄袭为生:lol 现有的证据完全石锤不了,这种类似的指控每天都在全世界上演 正常了超级然后想办法超越嘛 都是这样过来的 华为就是靠抄袭思科起家的,可不能忘了本:lol 这么多年,不都是靠抄袭活下来的吗? 习以为常了。
华伪 = 抄袭大王
粗粮 = 山寨大王
:lol 有点意思 好家伙,被曝光后,已经删库了 怎么现在才问? HonestAGI 这三无作者自己都删库跑路了……
一些事实:
- 两天前注册 GitHub ,只有这一个仓库
- 作者自称韩国人,但 Research Gate 和 Google Scholar 什么都搜不到
- 整个 README 都像 AI 生成的,AI 特有的 emoji 滥用、比喻乱飞、感叹号洗地
- 证明方法是把每一层输出的方差算出来然后算相似度,当时看了一眼就感觉不对。根据第三方实验,按他这个算法,几乎所有国内外模型全都抄 Qwen 了,纯搞笑
- 论文格式千疮百孔,像根本没做过学术研究的人用 AI 写的
仓库存档: https://web.archive.org/web/20250704072325/https://github.com/HonestAGI/LLM-Fingerprint
ighook 发表于 2025-7-6 14:37
怎么现在才问? HonestAGI 这三无作者自己都删库跑路了……
一些事实:
再加一条,列出的参考文献找不到
页:
[1]
2
