#模型#_标签文章_Nemo社区_LinkNemo_关于分享和探索的好地方

标签文章：#模型#

1760 亿参数、大小 281GB，Mixtral 8x22B 开源模型登场：可 Torrent 下载

IT之家4月11日消息，MistralAI公司近日推出了Mixtral8x22B开源模型，共有1760亿个参数，Context长度（上下文文本）为6.5万个token，可以通过Torrent下载。MistralAI公司自成立以来一直备受外界关注，“6人团队，7页PPT，8亿融资”不断缔造传奇，而且在得到微软的投资之后更是进入发展快车道。该公司今天发布的Mixtral8x22B开源模型是个开源模型，

Echo 2024.04.11 06:07 41浏览 0回复
阅读更多
谷歌推出 Cappy “打分”框架，可评估 AI 准确性“教模型更聪明”

IT之家3月17日消息，据谷歌官方新闻稿，谷歌近日推出了一项名为Cappy的模型打分框架，该框架以RoBERTa语言模型为基础，主要用于检测模型输出的内容，并为相关内容打分，之后相关分数将会作为参考基准让模型学习，从而让模型更聪明。▲图源谷歌官方新闻稿（下同）此外，Cappy框架也可以作为大语言模型的“候选机制”，该框架可以内置在模型中，并对模型预输出的内容生成分数，并选择分数最高的回应作为最终输

Echo 2024.03.17 16:25 78浏览 0回复
阅读更多
让 AI 模型互相教学，谷歌推出社会学习框架

IT之家3月11日消息，谷歌近日公开了一项名为“社会学习（SocialLearning）”的AI框架，该框架允许AI 语言模型能够通过自然语言互相学习，由于不需要直接交换敏感关键信息，因此训练出的AI模型更具隐私保护性。据介绍，在这款“社会学习框架”中，“学生模型”会向多个已知特定任务解法的“教师模型”学习各种问题的解决方案，研究人员设计了“垃圾短信检测”、“解决小学数学问题”、“根据特

Echo 2024.03.11 11:21 71浏览 0回复
阅读更多
KOALA AI 模型问世：8GB 内存就能运行，2 秒内生成高质量图片

IT之家3月1日消息，韩国科学团队近日研发了名为KOALA的新型人工智能图像生成模型，大幅降低了对硬件的需求，而且可以在2秒内生成高质量图片。该模型的关键在于采用了“知识蒸馏”（knowledgedistillation）的新技术，极大地压缩了开源图像生成工具StableDiffusionXL的大小。StableDiffusionXL目前共有25.6亿个参数，而韩国科学团队利用“知识蒸馏”技术，可

Echo 2024.03.01 09:37 78浏览 0回复
阅读更多
文生图模型 Stable Diffusion 推出商业付费订阅计划

IT之家12月21日消息，StabilityAI公司近日发布新闻稿，宣布旗下文本生成图片模型StableDiffusion推出会员订阅计划。IT之家基于新闻稿内容，附上订阅计划情况如下：免费：主要用于个人非商业研究用途Creator，月费20美元：适用于具有特定收入和资金上限的小规模创作者、开发人员和初创公司Enterprise：主要面向大型企业，可以为大规模运营量身定制，价格根据定制情况而定。S

Echo 2023.12.21 11:10 88浏览 0回复
阅读更多
10 分钟 Whisper 模型处理测试：苹果 M3 Max 比英伟达 RTX 4090 快 86 秒

IT之家12月14日消息，开发人员OliverWehrens近日测试了苹果M1Pro、M2Ultra和M3Max三款AppleSilicon芯片升级MLX框架后训练AI能力，并对比了英伟达的RTX4090显卡。Wehrens使用OpenAI的语音识别模型Whisper进行测试，主要测量转录10分钟音频文件所需时间。测试结果显示M1Pro处理音频时间需要216秒，英伟达RTX4090显卡处理时间需要

Echo 2023.12.14 07:08 142浏览 0回复
阅读更多
微软提出变色龙框架，让模型自带工具箱开挂，数学推理任务准确率 98%

教大模型调用工具，已经是AI圈关注度最高的话题之一了。这不，又有一项研究登上最新NeurIPS2023——它是一个叫作Chameleon（变色龙）的框架，号称能将大语言模型直接变成魔法师的工具箱，来自微软与加州大学洛杉矶分校（UCLA）。相比其它模型，Chameleon一方面能调用的工具丰富，包括大型语言模型、视觉识别模型、网络搜索引擎、Python编程功能以及基于规则的模块都能搞定。另一方面，性

Echo 2023.12.14 01:12 166浏览 0回复
阅读更多
27 亿参数，微软发布 Phi-2 模型：某些性能指标优于 Llama-2-7B

IT之家11月17日消息，微软Ignite2023大会已拉开帷幕，微软在本次活动中发布了旗下最小的语言模型Phi-2，共有27亿参数，相比较此前版本有明显提升。IT之家注：微软于今年6月发布Phi-1，只有13亿代码，适用于QA问答、聊天格式和代码等等场景。该模型完全基于高质量数据进行训练，在基准测试中的表现比同类模型高出10倍。微软今年9月更新发布了Phi-1.5版本，同样为13亿参数，可以写诗

Echo 2023.11.17 11:40 93浏览 0回复
阅读更多
中国科学院建立全球大气光学湍流预测模型，发表于天文顶级期刊

IT之家10月18日消息，据“科学岛在线”公众号消息，近日，中国科学院合肥物质院安光所建立了全球大气光学湍流预测模型，并首次实现了全球大气光学湍流强度时空分布预测及可视化表征（以大气相干长度衡量）。▲ 全球大气相干长度空间分布预测结果，图源“科学岛在线”公众号，下同该模型不仅丰富和提升了大气光学湍流全球变化的科学认知，还可为先进光电工程、天文光学观测、星地激光通信等应用提供支撑。据介绍，

Echo 2023.10.18 18:56 85浏览 0回复
阅读更多
电影《星球大战》经典 X 翼星际战机模型拍卖，成交价 313.5 万美元

IT之家10月17日消息，据《商业时报》报道，一架用于拍摄1977年《星球大战4：新希望》中最高潮战斗场景的X翼星际战机模型被成功拍卖，成交价为3135000美元（IT之家备注：当前约2291.7万元人民币），远超40万美元的开拍价，拍卖品由好莱坞资深模型制作人格雷格・金（GregJein）收集和制作。IT之家注意到，Jein于去年去世，享年76岁，他收集的藏品在达拉斯HeritageAuctio

Echo 2023.10.17 15:53 116浏览 0回复
阅读更多
代号 G3PO，消息称 OpenAI 正开发开源 AI 模型：对抗微软 Llama 2

IT之家7月26日消息，根据国外科技媒体TheInformation报道，OpenAI为了对抗微软和Meta合作开发的开源模型Llama2，目前内部正在开发代号为“G3PO”的新开源模型，尚不清楚何时才会发布。IT之家注：Llama2模型共有700亿个参数，不仅开源还支持商业许可证，允许任何个人和企业使用该模型赚钱。OpenAI目前采用闭源模型，因此感受到了Llama2模型带来的压力，因此在2个月

Echo 2023.07.26 11:38 100浏览 0回复
阅读更多
套娃不可取：研究人员证实用 AI 生成的结果训练 AI 将导致模型退化乃至崩溃

IT之家6月14日消息，IT之家的小伙伴们可能都有设想过，如果用AI生成的结果来训练AI，进行“套娃式训练”，能得到什么样的结果？目前还真有研究团队对此进行了观察记录，详细论文及得出的结果发表在了arXiv上。一句话总结——“在训练中使用模型生成的内容，将导致后续生成的模型出现不可逆转的缺陷”，说人话就是研究人员发现“用AI生成的结果训练AI，只会让模型变得越来越差”。▲图源arXiv据悉，研究人

Echo 2023.06.14 18:06 117浏览 0回复
阅读更多
LeCun 世界模型出场，Meta 震撼发布首个「类人」模型，理解世界后补全半张图，自监督学习众望所归

LeCun的世界模型终于来了，可谓是众望所归。既然大模型已经学会了理解世界、像人一样推理，是不是AGI也不远了？长久以来，LeCun理想中的AI，一直是通往人类水平的AI，为此他提出了「世界模型」的构想。而最近，LeCun在公开演讲中，再次批评了GPT大模型：根据概率生成自回归的大模型，根本无法破除幻觉难题。甚至直接发出断言：GPT模型活不过5年。今天，LeCun终于离自己的梦想又近了一步！Met

Echo 2023.06.14 16:39 120浏览 0回复
阅读更多
四个 00 后的疯狂开源计划：整个互联网转成大模型语料，1 亿 token 嵌入成本只需 1 美元

Arxiv上所有论文转成Token，加起来不过14.1GB而已。这是最新爆火开源计划亚历山大完成的壮举。事实上，这还只是第一步。他们最终是想要将整个互联网变成Tokens，换言之全都转化成ChatGPT等大模型理解这个世界的方式。一旦这样的数据集诞生，那岂不是为开发出GPT-4这样的大模型又新增一大利器，上知天文下知地理指日可待了？！消息一出，瞬间引发巨大关注。网友们赞叹，史诗般的。而这背后仅是四

Echo 2023.06.11 12:01 123浏览 0回复
阅读更多
基于 ChatGPT 的首个自然语言开发框架 PromptAppGPT 问世，可实现全自动编译开发

IT之家6月8日消息，一款自然语言开发框架PromptAppGPT现身GitHub，这是目前首个基于ChatGPT的自然语言开发框架。▲ 图源 PromptAppGPT的GitHub据悉，PromptAppGPT只需要使用提示语即可完成许多事项，例如直接进行应用开发、GPT文本生成、DALL-E图像生成、在线代码编辑器+编译器+运行器、自动用户界面生成、插件扩展等功

Echo 2023.06.08 11:28 259浏览 0回复
阅读更多
效果可达 OpanAI 同等模型 96%，国产开源 AI 语言模型 TigerBot 发布

IT之家6月8日消息，国产多模态大语言模型TigerBot近日正式发布，包含70亿参数和1800亿参数两个版本，目前已经在GitHub开源。▲图源TigerBot的GitHub页面据悉，TigerBot带来的创新主要在于：提出指令完成监督微调的创新算法提升模型可学习性运用ensemble和probabilisticmodeling的方法实现可控事实性和创造性在并行训练上突破deep-speed等主

Echo 2023.06.08 11:03 206浏览 0回复
阅读更多
算数能力接近满分，新加坡国立大学发布 Goat，仅用 70 亿参数，起步支持 16 位数乘除法

语言模型终于会乘除法了！大规模语言模型虽然在各大自然语言处理任务上都展现了优越的性能，不过算术类题目仍然是一大难关，即便是当下最强的GPT-4也很难处理基础运算的问题。最近，来自新加坡国立大学的研究人员提出了一个专供算术的模型山羊Goat，在LLaMA模型基础上微调后，实现了显著优于GPT-4的算术能力。论文链接：https://arxiv.org/pdf/2305.14201.pdf通过对合成的

Echo 2023.06.07 11:46 240浏览 0回复
阅读更多
MLC Chat 上架苹果 App Store，手机就能本地运行 AI 大语言模型

IT之家6月5日消息，目前绝大多数聊天机器人都需要通过云端处理消息并进行回复，而IT之家此前报道过一个名为MLCLLM的开源项目。可以在本地编译运行语言模型。近日CMU助理陈天其教授表示，独立的MLCChatApp目前已经上架苹果AppStore。感兴趣的小伙伴们可以下载进行尝试。▲ 图源陈天其据MLCLLM项目介绍称：“MLCLLM是一种通用解决方案，它允许将任何语言模型本地部署在一组

Echo 2023.06.05 16:39 153浏览 0回复
阅读更多
英伟达公布 Neuralangelo AI 模型，可将视频内容转换为高精 3D 模型

IT之家6月2日消息，英伟达公司于本周宣布推出一款名为Neuralangelo的AI模型，该模型能够将视频片段转化为细节层次丰富、具备贴图的3D模型。▲ 图源英伟达IT之家查询得知，此前也已经有数个基于视频内容生成3D模型的AI，但这些AI往往在面对低对比度视频时便无法着手。而英伟达的Neuralangelo模型采用了即时神经绘图（instantneuralgraphicsprimiti

Echo 2023.06.02 18:49 150浏览 0回复
阅读更多
DeepMind 推出 LATM 框架，可令 GPT-4 自己生成软件工具处理任务

IT之家5月31日消息，DeepMind、普林斯顿大学和斯坦福大学的研究人员近日提出了一项名为LATM（LLMsAsToolMakers）的创新框架，该框架可以将像GPT-4这样的大型语言模型转变为工具制造者（IT之家注：即让模型自己生成软件工具来处理新任务）。▲图源ArxivLATM的创新之处在于它为语言模型引入了工具制造和使用的概念，使得模型能够自主创建适用于不同任务的工具。这一框架不仅能够提

Echo 2023.05.31 14:17 138浏览 0回复
阅读更多

1 2 3 下一页