忘记文本到图像；这个人工智能根据你的提示制作视频

您可能听说过 Dall-E、Stable Diffusion 和Midjourney 等文本到图像 AI 实现的惊人结果。正如您所预料的那样，这场革命正在向前推进，下一个目标是文本到视频的 AI 工具。

谷歌和 Meta 在其 AI 实验室的研究报告中戏弄了他们的文本转视频功能，但这项先进技术尚未向公众开放。如果您一直在急切地等待尝试使用简单的 AI 提示创建整个视频的机会，那么现在您的机会来了，感谢QuickVid 。

在您的期望攀升得太高之前，重要的是要意识到这并不等同于生成数千张 Stable Diffusion 静态照片并将它们组合起来制作视频或访问世界上最先进的 AI 系统以生成真正的视频。这是文本到视频解决方案竞赛的早期进入。

AI 流程的第一步是根据您的提示生成脚本。我用以下文字创建了一个 YouTube 短片来测试该系统：“一段 DJI 无人机飞过火星上宇航员的视频，以惊讶的宇航员的反应镜头结尾。”

人工智能根据我的提示写了一个完整的 79 字的叙述，然后用男性或女性的声音选择来合成语音。 TechCrunch指出，为生成的视频选择的背景视频取自素材库，显然有大量“火星上的宇航员”的镜头。

作为可疑的画龙点睛之笔，QuickVid 将脚本覆盖为标题，并添加了由 Dall-E API 生成的缩略图。上面看到的由此产生的 YouTube 短片……很有趣。也许，它会更好地处理更多地球视频。

在 TechCrunch 的采访中，QuickVid 的开发者表示改进即将到来，更多的个性化选项将在 1 月份到来。最终，QuickVid 还将包括字幕和支持头像。

明年可能会出现更多的文本到视频解决方案，以及其他视觉奇迹，例如 AR 眼镜和更先进的 VR 耳机。这应该是令人兴奋的。