目 录CONTENT

文章目录

有关影像的生成式AI

听故事的人别流泪
2024-06-06 / 0 评论 / 0 点赞 / 15 阅读 / 0 字

[(12) 【生成式AI導論 2024】第17講:有關影像的生成式AI (上) — AI 如何產生圖片和影片 (Sora 背後可能用的原理) - YouTube](https://www.youtube.com/watch?v=5H2bVEmYDNg)


Snipaste_2024-06-06_21-37-16.png

输入:视觉

Snipaste_2024-06-06_21-33-57.png

输入:Condition

Snipaste_2024-06-06_21-32-37.png

openai的sora, 根据文字生成影片,非常强大

Snipaste_2024-06-06_21-37-41.pngSnipaste_2024-06-06_21-40-06.png

影响生影像

Snipaste_2024-06-06_21-41-57.png

其他输入生成影像

Snipaste_2024-06-06_21-45-20.png

各式各样的condition都可以生成影像

Snipaste_2024-06-06_21-46-34.png

图片是像素所构成

Snipaste_2024-06-06_21-47-19.png

图片是像素构成,影片是一帧一帧图片所构成

Snipaste_2024-06-06_21-49-11.png

今天AI是怎么看影像的?

编码器和解码器都是类神经网络,如transformer

Snipaste_2024-06-06_21-51-52.png

Snipaste_2024-06-06_21-54-51.png

sora也是用类似技术

Snipaste_2024-06-06_21-56-39.png

文字生图

Snipaste_2024-06-06_21-57-11.png

已经有很多开源训练资料集

Snipaste_2024-06-06_21-58-44.png

文字接龙,一步一步生成patch

Snipaste_2024-06-06_22-01-26.png

同时生成patch

Snipaste_2024-06-06_22-02-08.png

实际上操作流程是

Snipaste_2024-06-06_22-03-34.png

怎么衡量影像生成的好坏

文字生图

Snipaste_2024-06-06_22-07-07.png

Snipaste_2024-06-06_22-05-24.png

文字生影片

Snipaste_2024-06-06_22-08-26.png

Snipaste_2024-06-06_22-09-52.png

所有的patch都两两做attention,则约35兆次

减少attention计算次数

Snipaste_2024-06-06_22-14-40.png

Snipaste_2024-06-06_22-15-15.png

Snipaste_2024-06-06_22-16-34.png

计算量减少千倍

低解析度迭代高解析度

Snipaste_2024-06-06_22-18-49.png

Snipaste_2024-06-06_22-20-15.png

多个模型串行迭代,不断提高上个模型的帧数

More

Snipaste_2024-06-06_22-21-10.png

0

评论区