虽然它清楚地传达了信息的要点,但这并不是一个特别引人注目的场景,并且牢牢地陷入了恐怖谷。男人的三只手,多块以令人难以置信的规模拼凑在一起的鲨鱼,女人驱魔人式的转头和尖叫……这一切都有点恐怖。
就像生成图像一样,您可能需要完善提示并做出妥协:您不会总是创造出完美的东西。
话虽这么说,让我们将上面的视频与使用 Runway 的 Gen-2 的示例进行比较:
正如你所看到的,它并没有特别捕捉到广告的背景,并且 智利电话数据 鲨鱼和一些相当毁容和无定形的人的位置很奇怪。相比之下,OpenAI 的 Sora 在场景创建方面比 Runway Gen-2 做得更好。
我们最近看到一位使用 Sora 制作音乐视频的导演的另一个令人印象深刻的 Sora 用例示例:
这可以说是 Sora 最完整的例子之一,展示了它作为未来工具的巨大潜力。它很有趣(而且有点迷幻),并且捕捉到了一种贯穿始终的独特氛围。
然而,这个创作有一些警告:
导演为 4 分钟的视频生成了 6 小时的剪辑(在 H100 GPU 上使用了 46 小时的渲染时间)。
例子大约1400字,相当详细、具体
导演仍然需要使用后期效果并清理一些过渡(有时看起来仍然不自然)。
因此,看起来我们确实正走在消费者使用这个工具的道路上,但考虑到 Sora 可供艺术家和创意人员试用的时间很短,进展是相当令人惊讶的。
索拉的局限性是什么?
本节介绍先前版本的 Sora 的一些限制。值得检查的是新版本是否解决了这些问题。一旦我们获得新版本,我们将立即更新此部分。
索拉对物理学没有隐含的理解,因此“现实世界”的物理规则可能并不总是被遵循。一个例子是模型不理解因果关系。例如,在下面的篮球筐爆炸视频中,篮筐爆炸后,网似乎重置了。