模型使用完全相同的提示创建

ujjal22 · Post by **ujjal22** » Tue Jan 07, 2025 6:26 am

虽然它清楚地传达了信息的要点，但这并不是一个特别引人注目的场景，并且牢牢地陷入了恐怖谷。男人的三只手，多块以令人难以置信的规模拼凑在一起的鲨鱼，女人驱魔人式的转头和尖叫……这一切都有点恐怖。

就像生成图像一样，您可能需要完善提示并做出妥协：您不会总是创造出完美的东西。

话虽这么说，让我们将上面的视频与使用 Runway 的 Gen-2 的示例进行比较：

正如你所看到的，它并没有特别捕捉到广告的背景，并且智利电话数据鲨鱼和一些相当毁容和无定形的人的位置很奇怪。相比之下，OpenAI 的 Sora 在场景创建方面比 Runway Gen-2 做得更好。

我们最近看到一位使用 Sora 制作音乐视频的导演的另一个令人印象深刻的 Sora 用例示例：

这可以说是 Sora 最完整的例子之一，展示了它作为未来工具的巨大潜力。它很有趣（而且有点迷幻），并且捕捉到了一种贯穿始终的独特氛围。

然而，这个创作有一些警告：

导演为 4 分钟的视频生成了 6 小时的剪辑（在 H100 GPU 上使用了 46 小时的渲染时间）。
例子大约1400字，相当详细、具体
导演仍然需要使用后期效果并清理一些过渡（有时看起来仍然不自然）。
因此，看起来我们确实正走在消费者使用这个工具的道路上，但考虑到 Sora 可供艺术家和创意人员试用的时间很短，进展是相当令人惊讶的。

索拉的局限性是什么？
本节介绍先前版本的 Sora 的一些限制。值得检查的是新版本是否解决了这些问题。一旦我们获得新版本，我们将立即更新此部分。

索拉对物理学没有隐含的理解，因此“现实世界”的物理规则可能并不总是被遵循。一个例子是模型不理解因果关系。例如，在下面的篮球筐爆炸视频中，篮筐爆炸后，网似乎重置了。