Google的Smith Double会更好地吃意大利面AI …但是很松脆吗？

周二，Google启动了新的IA视频综合模型VEO 3，它可以做一些以前没有主要IA视频发电机可以做的事情：创建同步的音轨。从2022年到2024年，我们看到了一代人AI视频的第一阶段，每个视频都保持沉默，持续时间通常很短。现在，您可以在八秒钟的高清视频剪辑中听到声音，对话和声音效果。

新发布后不久，人们开始提出最明显的比较分析问题：VEO 3如何模拟奥斯卡史密斯演员吃意大利面？

首先，简要摘要。视频中的意大利面条基准在2023年3月介绍了其起源于2023年，当时我们使用了称为ModelCope的开源视频合成模型，介绍了AI生成的可怕视频的第一个示例。意大利面的例子后来众所周知，史密斯大约一年后的2024年2月被模仿。

这是原始病毒视频的样子：

人们忘记的一件事是，当时，史密斯并不是IA视频的最佳生成器 – 一种名为Gen -2的视频合成模型已经获得了更高的结果（尽管尚未公开访问公众）。但是，Modelscope的结果很有趣，而且很奇怪，可以留在人们的记忆中，例如第一个平庸的视频综合示例，这对于IA模型的发展进行了比较。

AI应用程序开发人员Javi Lopez本周早些时候首次以Weo 3的方式出现在好奇的意大利面条的粉丝中，进行了Smith测试并在X上发布结果。但是，正如您在下面看到的那样，您会在下面注意到，配乐具有好奇的质量：False Smith在Spaghetti上似乎很脆。

在X上，Javi Lopez在Google的VEO 3 AI视频发电机中指示“ Will Smith吃意大利面”，并收到了此结果。

这是VEO 3的实验能力的一个问题，可以在视频中应用声音效果，这可能是因为用于创建Google AI模型的培训数据包括许多具有声音效果的咀嚼口的示例。生成的AI模型是图案化的预测机，必须向它们展示足够的不同类型支持的例子，以产生令人信服的新郊游。如果一个概念在培训数据中的代表性过多或代表性不足，您将看到异常的生成结果，例如Jabberwockies。

来源链接