Echo

关注TA

大家好，我是Echo！

普罗旺斯
自由职业
写了282,381,684字

小细节

在文章《长安 UNI 新车曝光：代号 C928，预计下半年上市》中回复：
```
CS75 PLUS算是我今年最期待的车型了
```
想念一个人

在文章《长安 UNI 新车曝光：代号 C928，预计下半年上市》中回复：
```
长安CS75P还是很不错啊，身边的人评价都可以，我对新车很有信心
```
蝴蝶的翅膀

在文章《长安 UNI 新车曝光：代号 C928，预计下半年上市》中回复：
```
cs75plus口碑怎么样，网上随便一搜就能搜到，不用多说，看新车表现吧
```
飞天小牛

在文章《长安 UNI 新车曝光：代号 C928，预计下半年上市》中回复：
```
如果还是现在的价格，必入一辆！
```
幸福小胖珠

在文章《长安 UNI 新车曝光：代号 C928，预计下半年上市》中回复：
```
我买车主要看口碑，cs75plus口碑不错，新我肯定会去试驾的
```
a崽

在文章《比亚迪腾势 N7 车型推出限时优惠政策，2000 元可抵 5.2 万元》中回复：
```
哇！现在这个价格太顶了吧！赶紧入手！
```

野人霸霸

终于看到关注的车型，改款了，这波颜值，是我喜欢的，如果上市后的价格给力，就冲了，腾势这波改款真棒！

我是萌萌萌萌哒

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：
```
从去年就开始关注，终于等到改款了，眼前一亮，颜值不错，期待上市价格
```

海绵小宝宝P

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：

希望将来公布的价格能给力一点，这次改款已经非常让我心动了，腾势还是懂车主的喜好的！

Wmx0819

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：
```
改的好，改的秒，改的呱呱呱。N7大麦大麦大麦
```

该文章投稿至Nemo社区资讯板块复制链接

放话挑战 GPT-3：以色列推出参数多 30 亿、词条多 5 倍的新语言模型

发布于 2021/08/15 13:42 407浏览 0回复 2,290字

8 月 15 日消息 GPT-3 有多厉害不用多说了吧？

现在，以色列特拉维夫一家 AI 公司 ——AI21 Labs 表示要挑战一下这个巨星在 NLP 领域的主导地位。

放话挑战 GPT-3：以色列推出参数多 30 亿、词条多 5 倍的新语言模型

他们计划发布一个比 GPT-3 还要大的模型，且目前不用排队苦苦申请，所有人都可以免费“调教”。

大多少呢？

GPT-3 模型拥有 1750 亿个参数，而他们这个叫做 Jurassic-1 (侏罗纪-1) 的模型有 1780 亿个。

GPT-3 模型的词汇表有 5 万个 token，而 Jurassic-1 使用的词汇表则有 25 万个！

放话挑战 GPT-3：以色列推出参数多 30 亿、词条多 5 倍的新语言模型

对所有人开放，训练只需提供 50-100 个样本

Jurassic-1 模型的训练数据包括 3000 亿个 tokens，由维基百科、新闻出版物、StackExchange（问答网站）和 OpenSubtitles（全球最大的多国语言开放字幕库）上的信息编译而来。

在云上经过数百个 GPU 的分布式训练而成，由于最终存储 1780 亿个参数需要超过 350GB 的内存，这就要求开发团队使用多种策略来尽可能提高流程的效率。

而减少文本表示所需的 token 数就是一个好办法。

Jurassic-1 使用的词汇表不仅包括了完整词和分词（word piece），还挖掘了一些不太常见的词或词组，比如“纽约洋基队”、“run of the mill（习语，平庸的）”、国家元首名字。

这也是 Jurassic-1 成为第一个使用包含多词汇（muti-word） token 的语言模型。

这就让模型的效率提上来了，比如“Once in a while I like to visit New York City”这句，GPT-3 需要使用 11 个 token 来表示，而 Jurassic-1 只需 4 个。

放话挑战 GPT-3：以色列推出参数多 30 亿、词条多 5 倍的新语言模型

Jurassic-1 模型的规模大了 30 亿参数，GPT-3 能干的活它自然也“不甘示弱”：生成“人话”自不用说，文本转表格、话题分类、Python 转 JavaScript、从产品描述中生成简短的产品名称、写歌、算数等从简单到复杂的任务都能 hold 住。

放话挑战 GPT-3：以色列推出参数多 30 亿、词条多 5 倍的新语言模型

▲ Jurassic-1 重新解读商场“黑话”

放话挑战 GPT-3：以色列推出参数多 30 亿、词条多 5 倍的新语言模型

▲ Jurassic-1 写博客

性能如何呢？

实验显示，Jurassic-1 模型在一系列任务中的表现与 GPT-3 相当或更好 (尤其是在回答学术和法律问题方面)。

下表说明了在几乎所有的语料库中，Jurassic-1 模型的适用性都大幅领先对手 GPT-3。

放话挑战 GPT-3：以色列推出参数多 30 亿、词条多 5 倍的新语言模型

▲ 各种语料库中每个字节的平均对数概率（log-probabilities）

此外，与 GPT-3 相比，Jurassic-1 在零样本学习中与之性能持平，但在少样本学习中略胜一筹，这也是因为它的 tokenizer 可以在相同的上下文长度中容纳更多的文本，因此可以在 prompt 中包含更多的示例。

放话挑战 GPT-3：以色列推出参数多 30 亿、词条多 5 倍的新语言模型

▲ 零样本实验结果

放话挑战 GPT-3：以色列推出参数多 30 亿、词条多 5 倍的新语言模型

▲ 少样本实验结果

现在，Jurassic-1 模型的公测版本已通过 AI21 Labs 的 Studio 平台提供给开发人员使用，大家训练只需提供 50-100 个样本，就能搭建一些诸如聊天机器人的应用程序原型。

无论你是大中小企业、研究员、自由职业者还是什么身份，所有人都可以不用排队申请就能使用。

如果有人希望上线自己搭出来的成果，获得生产规模流量，可申请访问定制模型并获得私有微调版本，在一个“按量付费”（pay-as-you-go ）的云服务模式中使用。

ps.多少人申请的 GPT-3 API 一直是 still waiting 的状态？

不过，至于如何将模型定制到新任务上，AI21 Labs 表示这是个秘密，但反正过程会比标准微调技术更具有鲁棒性。

因此，模型不太会容易“大面积失忆”，也就是在新任务上的继续微调不会丢失此前编进去的信息。

虽然自己骂自己，但它的语言偏见略低于 GPT-3

可能你也会说，Jurassic-1 在根本上也没啥大新奇之处。

但复刻了 GPT-3 的开源 AI 研究机构 EleutherAI 表示，这是一项工程壮举，而且他们毫不怀疑 Jurassic-1 能执行出与 GPT-3 相当的效果。

不过问题是此类服务能否在激烈的竞争中盈利，以及如何处理不可避免的安全问题，比如模型的语言偏见。

Jurassic-1 当然也没有解决模型输出潜在的性别、种族和其他形式的偏见。

但团队表示非常重视这个问题，目前正在限制在公开测试版中可以生成的文本数量，并且将人工审查每个微调模型的请求以防止滥用。

不知道能解决多少问题，反正 Jurassic-1 连自己人都骂

放话挑战 GPT-3：以色列推出参数多 30 亿、词条多 5 倍的新语言模型

！

就比如下面这个，Jurassic-1 生成了歧视犹太人的文本：

放话挑战 GPT-3：以色列推出参数多 30 亿、词条多 5 倍的新语言模型

最后团队只是“弱弱”地表示，通过 StereoSet（语言系统中与性别、职业、种族等相关的偏见评估基准）测试发现，Jurassic-1 模型的偏见略低于 GPT-3。

关于 AI21 Labs

以色列一家专注于自然语言处理的 AI 公司，2017 年成立，目前从以色列最大的创投机构 Pitango 等公司获得了 3450 万美元资金。

创始人包括斯坦福大学名誉教授 Yoav Shoham，CrowdX 创始人和以色列辅助驾驶系统 Mobileye 的创始人 Amnon Shashua ，目前有 40 多名员工。

放话挑战 GPT-3：以色列推出参数多 30 亿、词条多 5 倍的新语言模型

Jurassic-1“调教”地址：点击打开

本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/569/409.htm]

本文标签
人工智能 ai 语言模型自然语言

上一个文章：苹果新专利显示，MacBook Pro 有望支持手写笔并取消 Touch Bar

下一个文章：皮克斯华人 CG 老鸟深圳创业，低代码实现好莱坞大片特效

点了个评

Echo

最近回复

放话挑战 GPT-3：以色列推出参数多 30 亿、词条多 5 倍的新语言模型

对所有人开放，训练只需提供 50-100 个样本

虽然自己骂自己，但它的语言偏见略低于 GPT-3

关于 AI21 Labs

点击排行

没有找到这位爷的热门文章哦~

最新文章

华硕推出 Radeon RX 7900 XTX / XT 两款 DUAL OC 显卡

联想 MK9 有线机械键盘上架：98 键 + 红轴，售价 99 元起

思特威推出笔记本电脑与平板系列 5MP / 2MP 图像传感器 SC521PC / SC200PC

《八方旅人》官方手游《歧路旅人：大陆的霸者》网易国服公测开启，6 月 30 日正式上线

涉案 398 万元，警方提醒有不法分子利用苹果 FaceTime 视频电话进行网络诈骗活动

华为大模型发布会演示造假？官方回应称为真实代码并将在昇腾社区上公示

已知第二亮，“棉花糖”行星 WASP-193b 被发现：每立方厘米 0.059 克

谷歌 2 小时复仇硬刚 GPT-4o：Gemini 颠覆搜索，视频 AI 对抗 Sora

JDK 11 官方支持延至 2032 年 1 月，Oracle 公布 Java SE 2024 年春季路线图

比亚迪海豹 06 DM-i 车型配置曝光：CLTC 纯电续航 80/120 公里，有望本月底上市