Stable Diffusion 3：引领视频生成新潮流

媒体报道详情龙猫数据 / 媒体报道详情

上一篇龙猫数据3D点云实现多面体分割标注！下一篇 Midjourney角色人物形象一致性功能惊艳亮相！

来源：龙猫数据作者：龙猫数据时间：2024-03-15

在数字化浪潮席卷全球的今天，视频内容已经成为了人们日常生活中不可或缺的一部分。最近Stability AI 有两个重磅动作发生，首先是发布了新一代 Stable Diffusion 3 文本生成图像模型；同时，视频生成平台Stable Video Diffusion（SVD）也正式开放公测，很可能是Sora的有力竞争者。快来跟着龙猫一起深入解析Stable Diffusion 3是如何支持视频生成的吧！

一、Stable Diffusion 3的技术革新

这款由 Stability AI 倾力打造的文本变图模型，可是迄今为止最强大的“黑科技”！无论你想生成多主题的奇幻场景，还是高精度的风景写真，统统不在话下！

链接：https://stability.ai/news/stable-diffusion-3

Stability AI 强调了该版本的几个亮点，其中首要的就是文字渲染能力，他们在其官网上一连给了三幅含有文字的图片，不仅文字清晰而且也没有任何拼写错误。

另一个亮点是“多主题生成”：用一句话，就能描绘出用户脑中的万千世界！

例如“一张照片，画面中有一个红色的球体放在一个蓝色的立方体上面。它们的后面有一个绿色的三角形，右边有一只狗，左边有一只猫。”👇

二、Stable Video Diffusion

与此同时，Stability AI 官方的视频生成平台开启了公测，支持上传图片和文字提示生成视频。

链接：https://www.stablevideo.com/

从官网提供的演示视频来看，质量非常高，很可能是Sora的强有力竞争者。支持通过相机运动来控制视频的生成过程，以下是视频：

功能上SVD模型增加了镜头控制能力，让用户可以更灵活地生成视频。目前每天会有 150 的免费额度，可以生成 15 个视频。

不难看出，无论是在图像还是在视频方面，随着模型的迭代，生成效果都有了明显的改进，可以预见的是，这个领域的竞争将会进一步加剧。Stable Diffusion 3以其强大的技术实力和广泛的应用前景，正引领着视频生成领域的发展潮流。我们期待着它在未来能够为我们带来更多惊喜和突破，为我们的生活增添更多色彩和活力。

上一篇龙猫数据3D点云实现多面体分割标注！下一篇 Midjourney角色人物形象一致性功能惊艳亮相！