首页
学习
活动
专区
圈层
工具
发布

里约大模型现形记:开源权重里藏不住的数学指纹

里约热内卢政府宣称自主研发出Rio-3.5大模型,结果被原作者Nex-AGI光速打脸。对方脱掉Rio的系统提示词马甲,模型直接自曝“我是Nex”。更绝的是数学检测:Rio的权重张量,全盘呈现出0.6倍Nex和0.4倍Qwen的线性融合,共线性高达0.99。

这事最有趣的不是政客吹牛或“传错版本”的嘴硬,而是开源时代一条铁律:权重是洗不干净的数学指纹。大模型微调在多维空间里有独特的几何轨迹,独立训练的两个模型绝不可能撞款到这种精度。

技术上看,直接对权重进行线性拼接(model merging)不仅可行,还能通过简单调参在特定榜单上刷出高分。这种极低门槛的“缝合技术”成了部分机构套取经费和名气的温床。但好在,开源的透明性让一切伪装都变成了数学上的裸奔。

github.com/nex-agi/Nex-N2/issues/4

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OxtNDqyOJVWVdhL0PJ3Hd-xA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券