媒体报道详情 龙猫数据  / 媒体报道详情

Stable Diffusion 3:引领视频生成新潮流

来源:龙猫数据作者:龙猫数据时间:2024-03-15

在数字化浪潮席卷全球的今天,视频内容已经成为了人们日常生活中不可或缺的一部分。最近Stability AI 有两个重磅动作发生,首先是发布了新一代 Stable Diffusion 3 文本生成图像模型;同时,视频生成平台Stable Video Diffusion(SVD)也正式开放公测,很可能是Sora的有力竞争者。快来跟着龙猫一起深入解析Stable Diffusion 3是如何支持视频生成的吧!


一、Stable Diffusion 3的技术革新

这款由 Stability AI 倾力打造的文本变图模型,可是迄今为止最强大的“黑科技”!无论你想生成多主题的奇幻场景,还是高精度的风景写真,统统不在话下!

链接:https://stability.ai/news/stable-diffusion-3

Stability AI 强调了该版本的几个亮点,其中首要的就是文字渲染能力,他们在其官网上一连给了三幅含有文字的图片,不仅文字清晰而且也没有任何拼写错误。

1710728654090-1.png

另一个亮点是“多主题生成”:用一句话,就能描绘出用户脑中的万千世界!

例如“一张照片,画面中有一个红色的球体放在一个蓝色的立方体上面。它们的后面有一个绿色的三角形,右边有一只狗,左边有一只猫。”👇

1710728790701-2.png


二、Stable Video Diffusion

与此同时,Stability AI 官方的视频生成平台开启了公测,支持上传图片和文字提示生成视频。

链接:https://www.stablevideo.com/

从官网提供的演示视频来看,质量非常高,很可能是Sora的强有力竞争者。支持通过相机运动来控制视频的生成过程,以下是视频:

1710728714465-3.gif

功能上SVD模型增加了镜头控制能力,让用户可以更灵活地生成视频。目前每天会有 150 的免费额度,可以生成 15 个视频。

1710728731709-4.gif

不难看出,无论是在图像还是在视频方面,随着模型的迭代,生成效果都有了明显的改进,可以预见的是,这个领域的竞争将会进一步加剧。Stable Diffusion 3以其强大的技术实力和广泛的应用前景,正引领着视频生成领域的发展潮流。我们期待着它在未来能够为我们带来更多惊喜和突破,为我们的生活增添更多色彩和活力。