AI is Life. We Are Empty.

累计撰写 452 篇文章
累计创建 137 个标签
累计收到 6 条评论

目录CONTENT

首页
/
人工智能
/
正文

人工智能

有关影像的生成式AI

听故事的人别流泪

2024-06-06 / 0 评论 / 0 点赞 / 58 阅读 / 0 字

06/06

[(12) 【生成式AI導論 2024】第17講：有關影像的生成式AI (上) — AI 如何產生圖片和影片 (Sora 背後可能用的原理) - YouTube](https://www.youtube.com/watch?v=5H2bVEmYDNg)

输入：视觉

输入：Condition

openai的sora, 根据文字生成影片，非常强大

影响生影像

其他输入生成影像

各式各样的condition都可以生成影像

图片是像素所构成

图片是像素构成，影片是一帧一帧图片所构成

今天AI是怎么看影像的？

编码器和解码器都是类神经网络，如transformer

sora也是用类似技术

文字生图

已经有很多开源训练资料集

文字接龙，一步一步生成patch

同时生成patch

实际上操作流程是

怎么衡量影像生成的好坏

文字生图

文字生影片

所有的patch都两两做attention，则约35兆次

减少attention计算次数

计算量减少千倍

低解析度迭代高解析度

多个模型串行迭代，不断提高上个模型的帧数

More

0

生成式AI导论2024

支付宝打赏
微信打赏

版权归属：听故事的人别流泪

本文链接： https://funkygod.vip/archives/you-guan-ying-xiang-de-sheng-cheng-shi-ai

许可协议：本文使用《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》协议授权

微信扫一扫
1. 支付宝打赏
2. 微信打赏

评论区

AI is Life. We Are Empty.

30 分类数

452 文章数

6 评论数

文章目录