Echo

关注TA

大家好，我是Echo！

普罗旺斯
自由职业
写了280,085,487字

a崽

在文章《比亚迪腾势 N7 车型推出限时优惠政策，2000 元可抵 5.2 万元》中回复：
```
哇！现在这个价格太顶了吧！赶紧入手！
```

野人霸霸

终于看到关注的车型，改款了，这波颜值，是我喜欢的，如果上市后的价格给力，就冲了，腾势这波改款真棒！

我是萌萌萌萌哒

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：
```
从去年就开始关注，终于等到改款了，眼前一亮，颜值不错，期待上市价格
```

海绵小宝宝P

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：

希望将来公布的价格能给力一点，这次改款已经非常让我心动了，腾势还是懂车主的喜好的！

Wmx0819

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：
```
改的好，改的秒，改的呱呱呱。N7大麦大麦大麦
```
瘦瘦不瘦

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：
```
赵总主打就是一个听劝哈哈哈
```

栗子羊羊羊

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：

这车改款改的不错.眼前一亮的感觉，挺好看的，看来腾势去年认真听了车友的意见，2024大动作，够吸引人了

甜梦国的睡仙

在文章《东风纳米 01 纯电小车在襄阳量产下线：预售 7.98 万元起，明日上市》中回复：
```
这个设计很可以啊，比较符合当代人审美
```
追逐明天5555

在文章《科技昨夜今晨 0724：我国载人登月火箭主发动机已达到试验要求、国产核磁共振技术成功突破国外长期封锁、蔚来副总裁回应“部分充电桩不对其它车主开放”》中回复：
```
印度真的是有点无语，比亚迪成功躲过一劫
```

好好好看

在文章《因安全问题，印度拒绝比亚迪 10 亿美元建厂提案》中回复：

比亚迪公司提出了在印度合资建立新能源汽车工厂的计划，但遭到了印度的拒绝。

该文章投稿至Nemo社区资讯板块复制链接

ChatGPT 参数规模被扒：只有 7B

发布于 2024/03/17 15:43 82浏览 0回复 1,499字

ChatGPT 惨遭攻击，参数规模终于被扒出来了 —— 很可能只有 7B（70 亿）。

消息来自南加州大学最新研究，他们使用一种攻击方法，花费不到 1000 美元就把最新版 gpt-3.5-turbo 模型的机密给挖了出来。

ChatGPT 参数规模被扒：只有 7B

果然，OpenAI 不 Open，自有别人帮他们 Open。

ChatGPT 参数规模被扒：只有 7B

具体来说，南加大团队三位作者破解出了未公布的 gpt-3.5-turbo 嵌入向量维度（embedding size）为 4096 或 4608。

而几乎所有已知的开源大模型如 Llama 和 Mistral，嵌入向量维度 4096 的时候都是约 7B 参数规模。其它比例的话，就会造成网络过宽或过窄，已被证明对模型性能不利。

因此南加大团队指出，可以推测 gpt-3.5-turbo 的参数规模也在 7B 左右，除非是 MoE 架构可能不同。

ChatGPT 参数规模被扒：只有 7B

数月前，曾有微软 CODEFUSION 论文意外泄露当时 GPT-3.5 模型参数为 20B，在后续论文版本中又删除了这一信息。

ChatGPT 参数规模被扒：只有 7B

当时引起了一阵轩然大波，业界很多人分析并非不可能，先训练一个真正的千亿参数大模型，再通过种种手段压缩、蒸馏出小模型，并保留大模型的能力。

而现在的 7B，不知道是从一开始 20B 的消息就不准确，还是后来又再次压缩了。但无论是哪一种，都证明 OpenAI 有很恐怖的模型优化能力。

撬开 ChatGPT 的保护壳

那么，南加大团队是怎么扒出 ChatGPT 未公开配置的呢？还要说到现代语言模型中普遍存在的“Softmax 瓶颈”。

当 Transformer 网络处理完输入，会得到一个低维的特征向量，也就是 Embedding。这个特征向量再经过 Softmax 变换，就得到了最后的概率分布输出。

ChatGPT 参数规模被扒：只有 7B

问题就出在 Softmax 这里，因为矩阵的秩受限于特征向量的维度，所以大模型的输出空间事实上被限制在了一个低维的线性子空间里。

ChatGPT 参数规模被扒：只有 7B

这就像是无论你的衣柜里有多少件衣服，最后能穿出去的搭配，其实是有限的。这个”衣柜”的大小，就取决于你的“特征向量维度”有多大。

南加大团队抓住了这一点，他们发现，只要从 API 调用中获取到足够多的输出样本，就足以拼凑出这个大模型的特征向量维度。

有了这个特征向量维度，可以进一步推断大模型的参数规模、还原出完整的概率输出，在 API 悄悄更新时也能发现变化，甚至根据单个输出判断来自哪个大模型。

更狠的是，推测特征向量维度并不需要太多的样本。

以 OpenAI 的 gpt-3.5-turbo 为例，采集到 4000 多个样本就绰绰有余了，花费还不到 1000 美元。

在论文的最后，团队还探讨了目前的几个应对这种攻击的方法，认为这些方法要么消除了大模型的实用性，要么实施起来成本高昂。

不过他们倒也不认为这种攻击不能有效防护是个坏事，一方面无法用此方法完整窃取模型参数，破坏性有限。另一方面允许大模型 API 用户自己检测模型何时发生变更，有助于大模型供应商和客户之间建立信任，并促使大模型公司提供更高的透明度。

这是一个 feature，不是一个 bug。

ChatGPT 参数规模被扒：只有 7B

论文：
https://arxiv.org/abs/2403.09539
参考链接：
https://x.com/TheXeophon/status/1768659520627097648

本文来自微信公众号：量子位（ID：QbitAI），作者：梦晨

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/756/240.htm]

本文标签
人工智能 openai chatgpt

上一个文章：任天堂 Switch 美服开启华纳兄弟系列游戏促销：《霍格沃茨之遗》史低 35 美元等

下一个文章：珂芝推出 K20 三模机械 19 键数字小键盘：Top 结构“相逢轴”，首发价 129 元

点了个评

Echo

最近回复

ChatGPT 参数规模被扒：只有 7B

撬开 ChatGPT 的保护壳

点击排行

没有找到这位爷的热门文章哦~

最新文章

交通运输部：公路沿线充电桩达 2.36 万个，上高速跑长途“补能焦虑”正逐步缓解

吉利银河 App 更新 1.15.0 版本，车辆信息展示、快捷控车优化

18 艘，中国企业拿下全球最大单笔造船订单

运城高速回应问界 M7 追尾养护车致 3 死：养护车在移动作业，司机曾下车施救

AI 正让管理者紧张：它管理比我强，我可能会降薪

小米米家多功能养生壶 S2 上架预约：1.5L 容量，售 149 元

英特尔：晶圆级封装能力不足，酷睿 Ultra 处理器二季度供应受限

到手价不高于 5999 元，雷神黑武士・SE 台式机促销：i7-13620H + RTX4060Ti

国家能源局：2024 年一季度全国可再生能源新增装机 6367 万千瓦，同比增长 34%

官方详解浩瀚-M 架构首款车型极氪 MIX：将于 2024 下半年上市