您可能听说过 Dall-E、Stable Diffusion 和Midjourney等文本到图像 AI 实现的惊人结果。正如您所预料的那样,这场革命正在向前推进,下一个目标是文本到视频的 AI 工具。
谷歌和 Meta 在其 AI 实验室的研究报告中戏弄了他们的文本转视频功能,但这项先进技术尚未向公众开放。如果您一直在急切地等待尝试使用简单的 AI 提示创建整个视频的机会,那么现在您的机会来了,感谢QuickVid 。
在您的期望攀升得太高之前,重要的是要意识到这并不等同于生成数千张 Stable Diffusion 静态照片并将它们组合起来制作视频或访问世界上最先进的 AI 系统以生成真正的视频。这是文本到视频解决方案竞赛的早期进入。
AI 流程的第一步是根据您的提示生成脚本。我用以下文字创建了一个 YouTube 短片来测试该系统:“一段 DJI 无人机飞过火星上宇航员的视频,以惊讶的宇航员的反应镜头结尾。”
人工智能根据我的提示写了一个完整的 79 字的叙述,然后用男性或女性的声音选择来合成语音。 TechCrunch指出,为生成的视频选择的背景视频取自素材库,显然有大量“火星上的宇航员”的镜头。
作为可疑的画龙点睛之笔,QuickVid 将脚本覆盖为标题,并添加了由 Dall-E API 生成的缩略图。上面看到的由此产生的 YouTube 短片……很有趣。也许,它会更好地处理更多地球视频。
在 TechCrunch 的采访中,QuickVid 的开发者表示改进即将到来,更多的个性化选项将在 1 月份到来。最终,QuickVid 还将包括字幕和支持头像。
明年可能会出现更多的文本到视频解决方案,以及其他视觉奇迹,例如 AR 眼镜和更先进的 VR 耳机。这应该是令人兴奋的。