DALL-E 3 可以将 AI 图像生成提升到一个新的水平

DALL-E 2DALL-E 2 OpenAI 上的图像。
开放人工智能

Decoder称,OpenAI 可能正在准备下一版本的 DALL-E AI 文本到图像生成器,并进行一系列 alpha 测试,这些测试现已向公众泄露。

Discord 上的一位匿名泄密者分享了他的经历的详细信息,访问了即将推出的 OpenAI 图像模型(称为 DALL-E 3)。他于 5 月份首次露面,告诉基于兴趣的 Discord 频道,他是 alpha 测试的一部分OpenAI,尝试新的AI图像模型。他分享了他当时生成的图像。

5 月份的 alpha 测试版本能够在图像模型内生成多种长宽比的图像。 YouTuber MattVidPro AI随后展示了几张以 16:9 长宽比生成的图像。该版本还展示了该模型在高质量文本生成方面的实力,这仍然是竞争对手模型的痛点,甚至对于稳定扩散和中途之类的顶级生成器也是如此。

一些示例展示了图像,例如融入砖墙的文本、霓虹灯字样、城市中的广告牌、蛋糕装饰以及蚀刻在山上的名字。该模型认为 DALL-E 擅长培养人才。其中一张图像从鱼眼角度展示了一位女士在聚会上吃意大利面的情景。

泄密者于 7 月中旬返回 Discord 频道,并带来了更多细节和新图片。他声称自己是“封闭 alpha”测试版本的一部分,该版本包括大约 400 名受试者。他补充说,他通过电子邮件受邀参加试用,并且还参与了原始 DALL-E 和DALL-E 2的测试。这就是得出的结论,即 alpha 测试可能适用于 DALL-E 3,尽管尚未得到证实。

OpenAI Dall-E 3 alpha 测试版图像。 OpenAI Dall-E 3 alpha 测试版图像。

该模型在五月至七月期间进行了相当大的更新。泄密者通过分享根据相同提示生成的图像来展示这一点,展示了 DALL-E 3 随着时间的推移变得多么强大。提示中显示一幅粉红色小丑在自行车比赛中向熊猫高五的画作。自行车是用奶酪做的,地面很泥泞。他们正行驶在一片有雾的森林里。熊猫很生气。

五月阿尔法产生了符合提示大部分要点的一般场景。连接的手有点变形,自行车的轮子是黄色的,而不是用奶酪制成的。然而,七月阿尔法的细节要丰富得多,粉红色小丑和熊猫明显击掌,自行车车轮是几代奶酪制成的。

与此同时,在《中途旅程》中,小丑从场景中消失了,熊猫们骑着摩托车而不是自行车。有路,而不是泥泞。熊猫们很高兴而不是生气。

有大量 DALL-E 7 月 3 日 alpha 图像示例展示了该模型的潜力。然而,由于 alpha 测试未经审查,泄密者指出,这也有可能产生“暴力和裸体或受版权保护的材料(例如公司徽标)”的场景。

一些例子包括血腥的动漫女孩、权力的游戏角色、侠盗猎车手 V封面、僵尸耶稣吃赛百味三明治(也暗示着轻微的血腥),以及从考古挖掘中被挖出来的怪物史莱克等。

MattVidPro AI 指出,图像模型生成的图像就好像它们应该具有特定的风格一样。

DALL-E 2 于 2022 年 4 月推出,但由于其受欢迎程度以及对道德和安全的担忧,受到严格监管,并处于等待名单中。 AI 图像生成器于 2022 年 9 月向公众开放


Posted

in

by

Tags: