Echo

关注TA

大家好，我是Echo！

普罗旺斯
自由职业
写了279,911,310字

a崽

在文章《比亚迪腾势 N7 车型推出限时优惠政策，2000 元可抵 5.2 万元》中回复：
```
哇！现在这个价格太顶了吧！赶紧入手！
```

野人霸霸

终于看到关注的车型，改款了，这波颜值，是我喜欢的，如果上市后的价格给力，就冲了，腾势这波改款真棒！

我是萌萌萌萌哒

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：
```
从去年就开始关注，终于等到改款了，眼前一亮，颜值不错，期待上市价格
```

海绵小宝宝P

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：

希望将来公布的价格能给力一点，这次改款已经非常让我心动了，腾势还是懂车主的喜好的！

Wmx0819

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：
```
改的好，改的秒，改的呱呱呱。N7大麦大麦大麦
```
瘦瘦不瘦

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：
```
赵总主打就是一个听劝哈哈哈
```

栗子羊羊羊

在文章《前脸“胡子”车灯改了，比亚迪新款腾势 N7 亮相》中回复：

这车改款改的不错.眼前一亮的感觉，挺好看的，看来腾势去年认真听了车友的意见，2024大动作，够吸引人了

甜梦国的睡仙

在文章《东风纳米 01 纯电小车在襄阳量产下线：预售 7.98 万元起，明日上市》中回复：
```
这个设计很可以啊，比较符合当代人审美
```
追逐明天5555

在文章《科技昨夜今晨 0724：我国载人登月火箭主发动机已达到试验要求、国产核磁共振技术成功突破国外长期封锁、蔚来副总裁回应“部分充电桩不对其它车主开放”》中回复：
```
印度真的是有点无语，比亚迪成功躲过一劫
```

好好好看

在文章《因安全问题，印度拒绝比亚迪 10 亿美元建厂提案》中回复：

比亚迪公司提出了在印度合资建立新能源汽车工厂的计划，但遭到了印度的拒绝。

该文章投稿至Nemo社区资讯板块复制链接

读取大脑重建高清视频，Stable Diffusion 还能这么用

发布于 2023/05/25 11:46 170浏览 0回复 1,428字

现在，AI 可以把人类脑中的信息，用高清视频展示出来了！

例如你坐在副驾所欣赏到的沿途美景信息，AI 分分钟给重建了出来：

读取大脑重建高清视频，Stable Diffusion 还能这么用

看到过的水中的鱼儿、草原上的马儿，也不在话下：

读取大脑重建高清视频，Stable Diffusion 还能这么用

这就是由新加坡国立大学和香港中文大学共同完成的最新研究，团队将项目取名为 MinD-Video。

读取大脑重建高清视频，Stable Diffusion 还能这么用

这波操作，宛如科幻电影《超体》中 Lucy 读取反派大佬记忆一般：

读取大脑重建高清视频，Stable Diffusion 还能这么用

引得网友直呼：

推动人工智能和神经科学的前沿。

读取大脑重建高清视频，Stable Diffusion 还能这么用

值得一提的是，大火的 Stable Diffusion 也在这次研究中立了不小的功劳。

读取大脑重建高清视频，Stable Diffusion 还能这么用

怎么做到的？

从大脑活动中重建人类视觉任务，尤其是功能磁共振成像技术（fMRI）这种非侵入式方法，一直是受到学界较多的关注。

因为类似这样的研究，有利于理解我们的认知过程。

但以往的研究都主要聚焦在重建静态图像，而以高清视频形式来展现的工作还是较为有限。

读取大脑重建高清视频，Stable Diffusion 还能这么用

之所以会如此，是因为与重建一张静态图片不同，我们视觉所看到的场景、动作和物体的变化是连续、多样化的。

而 fMRI 这项技术的本质是测量血氧水平依赖（BOLD）信号，并且在每隔几秒钟的时间里捕捉大脑活动的快照。

相比之下，一个典型的视频每秒大约包含 30 帧画面，如果要用 fMRI 去重建一个 2 秒的视频，就需要呈现起码 60 帧。

因此，这项任务的难点就在于解码 fMRI 并以远高于 fMRI 时间分辨率的 FPS 恢复视频。

为了弥合图像和视频大脑解码之间差距，研究团队便提出了 MinD-Video 的方法。

整体来看，这个方法主要包含两大模块，它们分别做训练，然后再在一起做微调。

读取大脑重建高清视频，Stable Diffusion 还能这么用

这个模型从大脑信号中逐步学习，在第一个模块多个阶段的过程，可以获得对语义空间的更深入理解。

具体而言，便是先利用大规模无监督学习与 mask brain modeling（MBM）来学习一般的视觉 fMRI 特征。

然后，团队使用标注数据集的多模态提取语义相关特征，在对比语言-图像预训练（CLIP）空间中使用对比学习训练 fMRI 编码器。

在第二个模块中，团队通过与增强版 Stable Diffusion 模型的共同训练来微调学习到的特征，这个模型是专门为 fMRI 技术下的视频生成量身定制的。

如此方法之下，团队也与此前的诸多研究做了对比，可以明显地看到 MinD-Video 方法所生成的图片、视频质量要远优于其它方法。

读取大脑重建高清视频，Stable Diffusion 还能这么用

而且在场景连续变化的过程中，也能够呈现高清、有意义的连续帧。

读取大脑重建高清视频，Stable Diffusion 还能这么用

研究团队

这项研究的共同一作，其中一位是来自新加坡国立大学的博士生 Zijiao Chen，目前在该校的神经精神疾病多模式神经成像实验室（MNNDL_Lab）。

另一位一作则是来自香港中文大学的 Jiaxin Qing，就读专业是信息工程系。

除此之外，通讯作者是新加坡国立大学副教授 Juan Helen ZHOU。

据了解，这次的新研究是他们团队在此前一项名为 MinD-Vis 的功能磁共振成像图像重建工作的延伸。

MinD-Vis 已经被 CVPR 2023 所接收。

读取大脑重建高清视频，Stable Diffusion 还能这么用

参考链接：

[1]https://mind-video.com/
[2]https://twitter.com/ZijiaoC/status/1660470518569639937
[3]https://arxiv.org/abs/2305.11675

本文来自微信公众号：量子位（ID：QbitAI），作者：金磊

本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/695/120.htm]

本文标签
研究 stable-diffusion

上一个文章：机械师 F117-X 未来战舰 III 代上新：i7-13700K + RTX 4060 Ti 版本 9299 元

下一个文章：联想小新 Pad Pro 2022 迅鲲版平板开启 ZUI 14 OTA 内测招募：支持电脑模式及侧边栏

点了个评

Echo

最近回复

读取大脑重建高清视频，Stable Diffusion 还能这么用

怎么做到的？

研究团队

点击排行

没有找到这位爷的热门文章哦~

最新文章

日本警方为遏制支付卡诈骗，制作了“病毒木马清除卡”提醒用户

iOS 版谷歌 Chrome 浏览器将支持离线“阅读清单”

微软 Win11 创建 7z、TAR 压缩文件的功能已从 24H2 下放到 23H2/22H2 版本

《黑帝斯 2》登顶 Steam 愿望单，《黑神话：悟空》《空洞骑士：丝之歌》紧随其后

Win11 学院：如何开启文件资源管理器“复制选项卡”功能

消息称 SE 游戏《王国之心 4》将于明年 5 月发售

北京车展小米 SU7 车机演示出现卡顿，官方回应：网络环境不佳

华为联合设计，AITO 问界新 M5 车型单日大定 1250 台

永诺推出 150W 补光灯 YN150：小体积高亮度，259 元起

北汽蓝谷 2023 年营收 143.19 亿元，同比增长 50.5%，净亏损 54 亿元