Google的Smith Double会更好地吃意大利面AI …但是很松脆吗?

周二,Google启动了新的IA视频综合模型VEO 3,它可以做一些以前没有主要IA视频发电机可以做的事情:创建同步的音轨。从2022年到2024年,我们看到了一代人AI视频的第一阶段,每个视频都保持沉默,持续时间通常很短。现在,您可以在八秒钟的高清视频剪辑中听到声音,对话和声音效果。
新发布后不久,人们开始提出最明显的比较分析问题:VEO 3如何模拟奥斯卡史密斯演员吃意大利面?
首先,简要摘要。视频中的意大利面条基准在2023年3月介绍了其起源于2023年,当时我们使用了称为ModelCope的开源视频合成模型,介绍了AI生成的可怕视频的第一个示例。意大利面的例子后来众所周知,史密斯大约一年后的2024年2月被模仿。
这是原始病毒视频的样子:
人们忘记的一件事是,当时,史密斯并不是IA视频的最佳生成器 – 一种名为Gen -2的视频合成模型已经获得了更高的结果(尽管尚未公开访问公众)。但是,Modelscope的结果很有趣,而且很奇怪,可以留在人们的记忆中,例如第一个平庸的视频综合示例,这对于IA模型的发展进行了比较。
AI应用程序开发人员Javi Lopez本周早些时候首次以Weo 3的方式出现在好奇的意大利面条的粉丝中,进行了Smith测试并在X上发布结果。但是,正如您在下面看到的那样,您会在下面注意到,配乐具有好奇的质量:False Smith在Spaghetti上似乎很脆。
在X上,Javi Lopez在Google的VEO 3 AI视频发电机中指示“ Will Smith吃意大利面”,并收到了此结果。
这是VEO 3的实验能力的一个问题,可以在视频中应用声音效果,这可能是因为用于创建Google AI模型的培训数据包括许多具有声音效果的咀嚼口的示例。生成的AI模型是图案化的预测机,必须向它们展示足够的不同类型支持的例子,以产生令人信服的新郊游。如果一个概念在培训数据中的代表性过多或代表性不足,您将看到异常的生成结果,例如Jabberwockies。