Echo

关注TA

大家好，我是Echo！

普罗旺斯
自由职业
写了280,525,413字

a崽

在文章《比亚迪腾势 N7 车型推出限时优惠政策，2000 元可抵 5.2 万元》中回复：
```
哇！现在这个价格太顶了吧！赶紧入手！
```

野人霸霸

终于看到关注的车型，改款了，这波颜值，是我喜欢的，如果上市后的价格给力，就冲了，腾势这波改款真棒！

我是萌萌萌萌哒

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：
```
从去年就开始关注，终于等到改款了，眼前一亮，颜值不错，期待上市价格
```

海绵小宝宝P

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：

希望将来公布的价格能给力一点，这次改款已经非常让我心动了，腾势还是懂车主的喜好的！

Wmx0819

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：
```
改的好，改的秒，改的呱呱呱。N7大麦大麦大麦
```
瘦瘦不瘦

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：
```
赵总主打就是一个听劝哈哈哈
```

栗子羊羊羊

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：

这车改款改的不错.眼前一亮的感觉，挺好看的，看来腾势去年认真听了车友的意见，2024大动作，够吸引人了

甜梦国的睡仙

在文章《东风纳米 01 纯电小车在襄阳量产下线：预售 7.98 万元起，明日上市》中回复：
```
这个设计很可以啊，比较符合当代人审美
```
追逐明天5555

在文章《科技昨夜今晨 0724：我国载人登月火箭主发动机已达到试验要求、国产核磁共振技术成功突破国外长期封锁、蔚来副总裁回应“部分充电桩不对其它车主开放”》中回复：
```
印度真的是有点无语，比亚迪成功躲过一劫
```

好好好看

在文章《因安全问题，印度拒绝比亚迪 10 亿美元建厂提案》中回复：

比亚迪公司提出了在印度合资建立新能源汽车工厂的计划，但遭到了印度的拒绝。

该文章投稿至Nemo社区资讯板块复制链接

专治大模型说胡话：华科大等高校提出首个“故障 token”检测方法，精确度 100%

发布于 2024/04/19 23:26 47浏览 0回复 2,512字

针对大模型偶发脑回路故障难题，最新研究 GlitchHunter 收集了大量故障词元，并针对不同情况进行分类，极大改善了大模型的输出质量。

如今，大型语言模型（LLM）已经成为了我们生活中的好帮手。

当用户使用大模型时，模型首先会将输入的内容拆分成一个个的词元（token），通过分析这些词元来生成答案，为我们解答疑惑、提供建议、翻译外语、撰写报告・・・・・・但是，你能想象大模型也会出错吗？

想象一下，你正在使用最新款的智能手机，它快速、聪明、几乎可以做任何你想要的事情。

但偶尔，你发现手机的一两个按键不按常理出牌 —— 比如说，你按下「S」，它偏偏跳出「E」，或者干脆点了没反应，那估计用的时候就只想砸手机了。

大模型中存在一些故障词元（glitch token），一个个本应协助模型流畅运行的小小词元，偏偏要搞点小破坏。

专治大模型说胡话：华科大等高校提出首个“故障 token”检测方法，精确度 100%

针对这个情况，由华中科技大学、南洋理工大学等高校联合组成的研究团队近日发表了一项研究，该工作已经被软件工程领域国际顶级会议 ——FSE 2024 接收。

专治大模型说胡话：华科大等高校提出首个“故障 token”检测方法，精确度 100%

论文链接： https://arxiv.org/ abs / 2404.09894 项目链接： https://sites.google.com/ view / glitchhunter-fse2024 / glitchhunter

该研究是第一个关于故障词元的全面研究，并且研究中针对故障词元的检测方法为减少大模型中与分词（tokenizer）相关的错误提供了有意义的见解。

简单来说，这项研究就像是在告诉我们：在大模型的世界里，有些小故障不仅仅是小插曲，它们可以大大影响模型的输出质量。通过识别出这些故障，可以更好地理解和优化这些聪明但偶尔会犯糊涂的大型语言模型。

论文简介

这篇工作中，作者首先提出了一个实证研究来了解故障词元在大语言模型中的存在性与普遍性。作者调查了包括 GPT-4，Llama-2 在内的七种热门的大模型，其中包含了三种不同的分词器，总共分析了十八万个不同的词元。

作者要求大模型完成针对词元的三个基础且简单的任务：复现，拼写以及求长度。根据不同的词元的完成情况，作者从完成形式上不能完成任务的词元分为了如下图所示的 5 个种类。在此基础上，只要这个词元不能够完成以上的三个任务之一，他就会被标记为故障词元。

专治大模型说胡话：华科大等高校提出首个“故障 token”检测方法，精确度 100%

实证研究的第二个问题是对故障词元的形式进行分类。这些词元有些是不同单词的组合，一些是无意义字母的堆叠，还有一些是单纯的无意义的符号。作者通过人工标注的方法，将这些所有的故障词元分为了表所示的 5 个种类。

专治大模型说胡话：华科大等高校提出首个“故障 token”检测方法，精确度 100%

实证研究的第三个问题故障词元在真实的数据集中的存在情况。作者研究了包括 Alpaca，ShareGPT 在内的用于大模型微调的主流数据集，发现在每个数据集中平均有 2% 以上的故障词元。这说明了故障词元在数据集中很普遍，而且很可能会影响到使用这些数据集进行微调的模型的效果。

专治大模型说胡话：华科大等高校提出首个“故障 token”检测方法，精确度 100%

在实证研究中作者还发现，故障词元在嵌入空间中有聚集效应，这便启发作者可以通过聚类的算法来完成针对故障词元的识别工作。

专治大模型说胡话：华科大等高校提出首个“故障 token”检测方法，精确度 100%

作者基于上述的发现构建了 GlitchHunter，一种用于检测大模型中故障词元的自动化工具，主要依赖迭代聚类技术来识别潜在的故障词元群组，整个检测流程分为几个步骤：

- 构建词元嵌入图 (TEG, Token Embedding Graph)：首先，GlitchHunter 会构建一个包括所有词元及其相应的嵌入向量的词元嵌入图，来展示所有词元在嵌入空间中的位置和相互之间的关系。

- 候选聚类：接着，GlitchHunter 在词元嵌入图上寻找紧密聚集的词元，使用 Leiden 聚类算法形成潜在的故障词元群组，这些词元通常有相似的特征。

- 假设检验：在每个词元群组内，GlitchHunter 进行假设检验，通过分析群组内词元的行为和输出结果来找出群组内行为显著偏离预期规范的词元，确定哪些群组实际上包含故障词元。

- 更新与迭代：选定包含故障词元的群组后，这些词元会被整合到一个更新的词元嵌入图中。随后，GlitchHunter 会继续进行聚类和检测，直到词元嵌入图不再经历任何更新，即没有新的故障词元被发现。

专治大模型说胡话：华科大等高校提出首个“故障 token”检测方法，精确度 100%

通过这种方法，GlitchHunter 能够有效地在大数据集中快速定位并处理故障词元，减少错误输出，提高语言模型的整体质量和可靠性。

为了验证 GlitchHunter 的效果，本文采用了几项关键指标来比较 GlitchHunter 与几种基线方法的性能，包括随机抽样、基于规则的随机抽样和 K-means 聚类。评估结果显示，GlitchHunter 在各个测试模型中普遍表现出色。

专治大模型说胡话：华科大等高校提出首个“故障 token”检测方法，精确度 100%

首先，GlitchHunter 的真阳性率（True Positive Rate）显著高于其他方法，这表明它在实际检测到故障词元的准确性方面表现优异。同时，其精确度（Precision）达到接近或等于 100%，远高于其他比较方法，这反映了其在识别故障词元时的高精确性。

在召回率（Recall）方面，GlitchHunter 同样展现了较高的性能，有效地识别了大部分存在的故障词元，确保了较少的遗漏。

专治大模型说胡话：华科大等高校提出首个“故障 token”检测方法，精确度 100%

此外，GlitchHunter 相较于完整遍历词元表的方法，显著减少了所需的时间和处理的词元数量，展示了其在达到高性能的同时保持了较低的资源开销。这些评估结果充分验证了 GlitchHunter 在实际应用中提高 LLM 输出质量和可靠性的潜力，证明了其作为故障词元检测工具的有效性和实用性。

未来工作

在这个工作中，作者完成了对故障词元的系统性探究，但是对于故障词元出现的原因以及如何进行修复并未进行过多的探讨，而这也是进行故障词元研究的终极目标：解决掉所有这样的故障词元，完善大语言模型对于每一个词元的理解。

参考资料：

https://arxiv.org/abs/2404.09894

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/763/015.htm]

本文标签
大语言模型

上一个文章：联想智能门锁 E20 上架：六种解锁方式 + C 级锁芯，售价 399 元

下一个文章：小米 SU7 后续 OTA 升级锥桶工况处理能力，车主账号暂不支持管理权转移

点了个评

Echo

最近回复

专治大模型说胡话：华科大等高校提出首个“故障 token”检测方法，精确度 100%

论文简介

未来工作

点击排行

没有找到这位爷的热门文章哦~

最新文章

苹果确认欧盟的 iPad 今年秋季支持应用侧载、第三方浏览器引擎

环球分享美国奥兰多“超级任天堂世界”最新动态：包含两个园区、2025 年开园

Epic 喜加二：《兽人必须死！3》《喵咪斗恶龙 2》游戏免费领取

微软：即日起为所有消费级用户账户提供安全密钥（passkey）支持

索尼公布 5 月 PS+ 会免游戏，包括《EA SPORTS FC 24》《幽灵行者 2》《命运 2：光陨之秋》等

湖北首座“光储充换放”一体充电站投运：华为设备加持，充电 5 分钟补能 300 公里

罗技庆祝 G502 鼠标发布 10 周年：销量超 2100 万，即日起赠送鼠标垫

前员工称特斯拉经常处于混乱、忙碌状态，担忧超级充电网络质量下降

990 万拍下周鸿祎迈巴赫当事人“褚会长”发声：已按约定完成支付

Banana Pi 香蕉派推出 BPI-M5 Pro 开发板：RK3576 处理器，最高 16GB 内存