Echo

关注TA

大家好，我是Echo！

普罗旺斯
自由职业
写了283,814,374字

小细节

在文章《长安 UNI 新车曝光：代号 C928，预计下半年上市》中回复：
```
CS75 PLUS算是我今年最期待的车型了
```
想念一个人

在文章《长安 UNI 新车曝光：代号 C928，预计下半年上市》中回复：
```
长安CS75P还是很不错啊，身边的人评价都可以，我对新车很有信心
```
蝴蝶的翅膀

在文章《长安 UNI 新车曝光：代号 C928，预计下半年上市》中回复：
```
cs75plus口碑怎么样，网上随便一搜就能搜到，不用多说，看新车表现吧
```
飞天小牛

在文章《长安 UNI 新车曝光：代号 C928，预计下半年上市》中回复：
```
如果还是现在的价格，必入一辆！
```
幸福小胖珠

在文章《长安 UNI 新车曝光：代号 C928，预计下半年上市》中回复：
```
我买车主要看口碑，cs75plus口碑不错，新我肯定会去试驾的
```
a崽

在文章《比亚迪腾势 N7 车型推出限时优惠政策，2000 元可抵 5.2 万元》中回复：
```
哇！现在这个价格太顶了吧！赶紧入手！
```

野人霸霸

终于看到关注的车型，改款了，这波颜值，是我喜欢的，如果上市后的价格给力，就冲了，腾势这波改款真棒！

我是萌萌萌萌哒

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：
```
从去年就开始关注，终于等到改款了，眼前一亮，颜值不错，期待上市价格
```

海绵小宝宝P

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：

希望将来公布的价格能给力一点，这次改款已经非常让我心动了，腾势还是懂车主的喜好的！

Wmx0819

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：
```
改的好，改的秒，改的呱呱呱。N7大麦大麦大麦
```

该文章投稿至Nemo社区资讯板块复制链接

让 ChatGPT 调用 10 万 + 开源 AI 模型，HuggingFace 新功能爆火：大模型可随取随用多模态 AI 工具

发布于 2023/05/15 12:07 268浏览 0回复 3,070字

只需和 ChatGPT 聊聊天，它就能帮你调用 10 万 + 个 HuggingFace 模型！

这是抱抱脸最新上线的功能 HuggingFace Transformers Agents，一经推出就获得极大关注：

让 ChatGPT 调用 10 万 + 开源 AI 模型，HuggingFace 新功能爆火：大模型可随取随用多模态 AI 工具

这个功能，相当于给 ChatGPT 等大模型配备了“多模态”能力 ——

不限于文本，而是图像、语音、文档等任何多模态任务都能解决。

例如告诉 ChatGPT“解释这张图像”，并扔给它一张海狸照片。ChatGPT 就能调用图像解释器，输出“海狸正在水里游泳”：

让 ChatGPT 调用 10 万 + 开源 AI 模型，HuggingFace 新功能爆火：大模型可随取随用多模态 AI 工具

随后，ChatGPT 再调用文字转语音，分分钟就能把这句话读出来：

当然，它不仅支持 ChatGPT 在内的 OpenAI 大模型，也支持 OpenAssistant 等免费大模型。

Transformer Agent 负责“教会”这些大模型直接调用 Hugging Face 上的任意 AI 模型，并输出处理好的结果。

所以这个新上线的功能，背后的原理究竟是什么？

如何让大模型“指挥”各种 AI？

简单来说，Transformers Agents 是一个大模型专属的“抱抱脸 AI 工具集成包”。

HuggingFace 上各种大大小小的 AI 模型，都被收纳在这个包里，并被分门别类为“图像生成器”、“图像解释器”、“文本转语音工具”……

同时，每个工具都会有对应的文字解释，方便大模型理解自己该调用什么模型。

让 ChatGPT 调用 10 万 + 开源 AI 模型，HuggingFace 新功能爆火：大模型可随取随用多模态 AI 工具

这样一来，只需要一段简单的代码 + 提示词，就能让大模型帮助你直接运行 AI 模型，并将输出结果实时返还给你，过程一共分为三步：

首先，设置自己想用的大模型，这里可以用 OpenAI 的大模型（当然，API 要收费）：

from transformers import OpenAiAgent

agent = OpenAiAgent(model="text-davinci-003", api_key="<your_api_key>")

也可以用 BigCode 或 OpenAssistant 等免费大模型：

from huggingface_hub import login

login("<YOUR_TOKEN>")

然后，设置 Hugging Transformers Agents。这里我们以默认的 Agent 为例：

from transformers import HfAgent

# Starcoder
agent = HfAgent("https://api-inference.huggingface.co/models/bigcode/starcoder")
# StarcoderBase# agent = HfAgent("https://api-inference.huggingface.co/models/bigcode/starcoderbase")# OpenAssistant# agent = HfAgent(url_endpoint="https://api-inference.huggingface.co/models/OpenAssistant/oasst-sft-4-pythia-12b-epoch-3.5")

接下来，就可以使用 run () 或者 chat () 两个指令，来运行 Transformers Agents 了。

run () 适合同时调用多个 AI 模型，执行比较复杂专业的任务。

可以调用单个 AI 工具。

例如执行 agent.run (“Draw me a picture of rivers and lakes.”)，它就能调用 AI 文生图工具帮你生成一张图像：

让 ChatGPT 调用 10 万 + 开源 AI 模型，HuggingFace 新功能爆火：大模型可随取随用多模态 AI 工具

也可以同时调用多个 AI 工具。

例如执行 agent.run (“Draw me a picture of the sea then transform the picture to add an island”)，它就能调用“文生图”和“图生图”工具，帮你生成对应图像：

让 ChatGPT 调用 10 万 + 开源 AI 模型，HuggingFace 新功能爆火：大模型可随取随用多模态 AI 工具

chat () 则适合以聊天的方式“持续完成任务”。

例如，先调用文生图 AI 工具，生成一个河流湖泊图片：agent.chat (“Generate a picture of rivers and lakes”)

让 ChatGPT 调用 10 万 + 开源 AI 模型，HuggingFace 新功能爆火：大模型可随取随用多模态 AI 工具

再在这张图片的基础上做“图生图”修改：agent.chat (“Transform the picture so that there is a rock in there”)

让 ChatGPT 调用 10 万 + 开源 AI 模型，HuggingFace 新功能爆火：大模型可随取随用多模态 AI 工具

要调用的 AI 模型可以自行设置，也可以使用抱抱脸自带的一套默认设置来完成。

已设置一套默认 AI 模型

目前，Transformers Agents 已经集成了一套默认 AI 模型，通过调用以下 Transformer 库中的 AI 模型来完成：

1、视觉文档理解模型 Donut。给定图片格式的文件（PDF 转图片也可以），它就能回答关于这个文件的问题。

例如问“TRRF 科学咨询委员会会议将在哪里举行”，Donut 就会给出答案：

让 ChatGPT 调用 10 万 + 开源 AI 模型，HuggingFace 新功能爆火：大模型可随取随用多模态 AI 工具

2、文字问答模型 Flan-T5。给定长文章和一个问题，它就能回答各种文字问题，帮你做阅读理解。

3、零样本视觉语言模型 BLIP。它可以直接理解图像中的内容，并对图像进行文字说明。

4、多模态模型 ViLT。它可以理解并回答给定图像中的问题，

5、多模态图像分割模型 CLIPseg。只需要给它一个模型和一个提示词，它就能根据这个提示分割出图像中指定的内容（mask）。

6、自动语音识别模型 Whisper。它可以自动识别一段录音中的文字，并完成转录。

7、语音合成模型 SpeechT5。用于文本转语音。

8、自编码语言模型 BART。除了可以自动给一段文字内容分类，还能做文本摘要。

9、200 种语言翻译模型 NLLB。除了常见语言外，还能翻译一些不太常见的语言，包括老挝语和卡姆巴语等。

通过调用上面这些 AI 模型，包括图像问答、文档理解、图像分割、录音转文字、翻译、起标题、文本转语音、文本分类在内的任务都可以完成。

除此之外，抱抱脸还“夹带私货”，包含了一些 Transformer 库以外的模型，包括从网页下载文本、文生图、图生图、文生视频：

让 ChatGPT 调用 10 万 + 开源 AI 模型，HuggingFace 新功能爆火：大模型可随取随用多模态 AI 工具

这些模型不仅能单独调用，还可以混合在一起使用，例如要求大模型“生成并描述一张好看的海狸照片”，它就会分别调用“文生图”和“图片理解”AI 模型。

当然，如果我们不想用这些默认 AI 模型，想设置一套更好用的“工具集成包”，也可以根据步骤自行设置。

对于 Transformers Agents，也有网友指出，有点像是 LangChain agents 的“平替”：

你试过这两个工具了吗？感觉哪个更好用？

参考链接：

[1]https://twitter.com/huggingface/status/1656334778407297027
[2]https://huggingface.co/docs/transformers/transformers_agents

本文来自微信公众号：量子位（ID：QbitAI），作者：萧箫

本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/692/656.htm]

本文标签
模型 ai

上一个文章：小米推出米兔儿童电话手表 C7A：支持 4G 全网通，内置小爱同学

下一个文章：横版动作游戏《非常英雄》上线任天堂国行 Switch，售 78 元

点了个评

Echo

最近回复

让 ChatGPT 调用 10 万 + 开源 AI 模型，HuggingFace 新功能爆火：大模型可随取随用多模态 AI 工具

如何让大模型“指挥”各种 AI？

已设置一套默认 AI 模型

点击排行

没有找到这位爷的热门文章哦~

最新文章

Devolver 宣布 6 月 8 日举行 Direct 2024 直面会，庆祝公司成立 15 周年

日产宣布推迟在美国开发电动汽车的计划，但仍将进一步扩充产品线

《战锤 40K：行商浪人》首个 DLC《虚空之影》预告发布：流程约 15 小时、8 月 8 日发售

9.69 万元起：吉利 ICON 玲珑上市，新增發灰、财粉两款车身配色

《攻壳机动队》TV 动画新作确认：士郎正宗原作改编，2026 年上映

4K 144Hz + Mini-LED：酷开 K6 电视 75 吋 4120 元京东秒杀 + 6 期免息

微软 Auto SR 自动超分辨率默认支持《无主之地 3》《战神》等 12 款游戏，仅适用于骁龙 X 系列处理器

波音星际客机氦气泄漏“不影响”飞行安全，预计 6 月 1 日首次载人试飞

能侦察能打击：中国机器狗亮相中柬“金龙-2024”联演，精准打击“恐怖分子”

Adobe 即将发布新版 Pr，可实现视频、电影“一键换人”