2024 年最佳 AI 工具：您需要尝试的所有生成式 AI 应用程序

ChatGPT打开了闸门。但许多人并没有意识到，生成式人工智能工具和应用程序的世界还有待探索。

无论您是在努力克服写作障碍，还是缺乏艺术天赋来发挥您的想象力，或者只是需要手工编写高效的计算机代码，生成式人工智能都可以帮助增强和简化您的专业和创意工作。然而，在目前看似无穷无尽的人工智能助手中，找到适合您需求的助手可能是一项艰巨的任务。因此，让我们深入研究一些正在突破创新界限的最令人印象深刻的人工智能工具，包括最好的人工智能聊天机器人、最好的人工智能图像生成器等等。

用于图像生成的最佳人工智能工具

中途

Midjourney是 2022 年发布的首批 AI 图像生成器之一，事实证明，它非常受用户和艺术评论家的欢迎。它可以根据自然语言文本提示输出无数艺术风格的高清、逼真图像。

Midjourney 最初只能通过公司的 Discord 服务器访问，现在可以通过简化的门户网站访问。虽然该网站的生成艺术画廊可以免费浏览，但您需要订阅每月服务计划（从 10 美元到 120 美元不等）才能生成您自己的图像。

表意文字

虽然不像 Midjourney 那样具有强大的创造力——只能生成五种预设艺术风格之一的图像，但Ideogram确实提供了慷慨的免费套餐，允许用户每天生成最多 40 张图像。付费等级从每月 7 美元到 48 美元不等，并提供一系列好处，从额外的计算资源和优先访问到全质量图像下载。该公司还拥有一个 iOS 应用程序和一个 API，声称将“以比其他型号更低的成本提供卓越的图像质量”。

达尔-E 3

OpenAI Dall-E 3 alpha 测试版图像。 — MattVidPro人工智能

这是 OpenAI 的内部文本到图像生成器，运行在该公司的GPT-4模型之上。它最初于 2023 年 9 月发布，最初仅适用于付费订阅者。去年 8 月，OpenAI 将其可用性扩展到免费套餐用户，尽管您在该订阅级别每天只能生成两张图像。 Dall-E 3也可以通过 Microsoft 的 Copilot 聊天机器人获得。

图像3

如果您希望创建高质量图像而不受 ChatGPT 强制执行的严格生产限制，那么 Google 的Imagen 3是一个不错的选择。它可以通过Gemini 聊天机器人（包括免费套餐）使用，并提供更高质量的输出，并且比以前的版本更少的工件。但请注意，系统不会生成人物图像，无论名人与否，除非您订阅Gemini Advanced （每月花费 20 美元）。

格洛克2

Grok 2是一款文本到图像生成器，适合那些对遵守版权法不感兴趣的人。 Grok 2 是为埃隆·马斯克 (Elon Musk) 的 xAI 公司开发的，可在 X 上使用，不像其他图像生成器那样受到安全和法律护栏等轻微不便的限制。想观看米老鼠在 747 飞机上与达斯·维达 (Darth Vader) 战斗并飞入世界贸易中心吗？ Grok 会生成它，不问任何问题。然而，您需要支付 8 美元来订阅 X 的高级服务才能访问它。

Gen 3 Alpha 带框架

Runway 的Gen 3 Alpha是一款相对较新的型号，于 2024 年 6 月发布，能够根据用户的自然语言提示创建具有近乎照片级真实质量的静态图像和视频剪辑。该公司最近宣布将开始将一个名为Frames 的新基础模型集成到 Gen 3 平台中，该模型将为图像创建过程提供前所未有的控制，使用户能够生成多个图像变体，同时保持特定的审美风格，无论是模仿35 毫米一次性相机拍摄或复古动漫图案。订阅价格从每月 12 美元到 76 美元不等，尽管该公司也提供有限的免费套餐。

用于图像编辑的最佳人工智能工具

鲁米纳尔新

Skylum 的Luminar Neo是一款照片编辑套件，专为专业摄影师而设计。它提供了许多与 Adobe Photoshop 相同的强大工具，但将大部分功能外包给了 AI。这使用户只需单击一下即可完成许多常见任务，从调整色彩平衡和照明级别到调整天空、水和肤色的外观。 Luminar Neo 对于普通用户来说可能有点贵，年度订阅费用为 421 美元，终身订阅费用为 577 美元。它可在 Windows 和 Mac 上使用，并且还有 Photoshop、Photos 和 Lightroom 的插件。

画布专业版

Canva 是一个多功能创意平台，提供从数字白板、数据可视化、营销材料模板到照片、视频和 YouTube 编辑功能等一切功能。虽然您可以使用网站的免费编辑器轻松进行微调，例如裁剪、添加滤镜和调整纵横比，但Canva Pro还提供了许多额外的人工智能工具。

选择、移动、调整大小，甚至删除图像中的单个对象；提取和修改平面图像上的文本；甚至只需单击几下即可生成扩展图像的背景。 Canva Pro 单用户许可证每年的费用为 120 美元。

像素套房

这款在线照片编辑套件自 2008 年发布以来，一直作为 Photoshop 的免费且用户友好的替代品。去年 11 月，该公司推出了多项 AI 功能，包括图像生成、生成填充工具、AI 背景去除、AI 脸部交换和图像扩展有助于完善工具集的功能。虽然该界面更适合休闲用户，并且可能不如 Photoshop 提供的那么精确和精细，但您无法摆脱免费。

黄玉照片人工智能

如果您只需要对图像进行一些轻微修饰工作， Topaz Photo AI 套件提供八种增强工具：降噪、锐化、放大、恢复面部、删除对象、保留文本、调整照明和平衡颜色。它并不是 Photoshop 等全功能照片编辑器的真正替代品，但无需年度订阅即可使用，统一价格仅为 199 美元，版本升级费用为 99 美元。

萤火虫人工智能

Adobe 的Firefly AI不仅可以根据文本提示生成图像和视频，还为整个 Adobe 产品生态系统提供了许多 AI 功能。其中包括 Photoshop 中的生成填充工具、Adobe Express 中的文本效果、Illustrator 中的矢量和图案生成以及 Premiere Pro 中的生成扩展。您需要订阅 Adobe 的 Creative Cloud 套件才能访问这些功能，尽管它们可以单独购买（例如，图像生成器的费用为 5 美元/月，而 Photoshop 的费用为 23 美元），或者您也可以选择所有 20 多个功能Adobe 应用程序每月 60 美元。

视频生成的最佳人工智能

卢玛梦想机

虽然Luma Dream Machine 的设计可能考虑到了时尚、营销和电影制作专业人士的需求，但它是一种基于订阅的服务，同时考虑到了休闲和专业用户的需求。与传统的AI工具不同，Dream Machine不需要精确详尽的提示来产生所需的效果，而是直观地解释用户的自然语言请求。它还接受多图像提示和单图像字符参考，以便用户可以向人工智能展示他们的想法。 Luma 不提供免费套餐，但“爱好者”订阅费用仅为每月 10 美元。

克林

中国快手科技的Kling AI视频生成系统提供了与 OpenAI 的Sora相媲美的逼真输出，并且已经向世界各地的用户开放。它可以以每秒 30 帧和 720p 分辨率（略低于 Sora 的 1080p 输出）生成长度长达两分钟的高清视频（是 Sora 的两倍）。每个剪辑的起始长度仅为 5 秒，但可以通过购买额外的积分以 4.5 秒的增量延长。请注意，该系统无法生成政治敏感主题。

综合

Synthesia比我们迄今为止讨论的其他视频生成器更小众。它专门设计用于根据用户的文本提示生成视频头像，使其非常适合入职和培训视频、销售演示和内部通信等业务应用程序。用户可以从 130 多个讲 140 种不同语言的头像模型和 60 多个视频模板中选择一种。免费套餐允许您每月生成一个三分钟的视频并选择九个头像，而每月 30 美元的入门套餐和每月 90 美元的创作者套餐则提供更多好处。

维昂德

Vyond提供与 Synthesia 类似的功能，即根据用户的文本提示生成用于训练视频的 AI 头像，但该服务依赖于动画角色而不是真人演员。您还可以选择录制自己执行的特定动作或动作，Vyond 会将其动画与它们进行动作匹配。计划起价为每月 49 美元，其中还包括使用附加视频编辑器，不过您在该级别制作的任何内容都将带有 Vyond 徽标水印。

文本生成的最佳人工智能

聊天GPT

在米色 b 背景上显示 ChatGPT 主页的手机。 — 桑克特·米什拉 / Pexels

ChatGPT是在 2022 年掀起人工智能热潮的聊天机器人，目前仍处于行业前列，估计每周活跃用户达 2 亿。 ChatGPT经过大量书面内容（包括网站、书籍、社交媒体帖子和新闻文章）的训练，不仅擅长回答一般知识查询和编译计算机代码，还擅长生成创意散文。它也是第一个在高级语音模式下提供对话功能的聊天机器人，允许用户像人一样与聊天机器人交互，从而无需基于文本的提示。

ChatGPT 可在网络以及iOS和 Android 上使用。它可以免费使用，但订阅每月 20 美元的 ChatGPT-Plus 计划将使您能够更多地访问该公司最新的人工智能模型和功能。

副驾驶

微软

Copilot回答了“如果 ChatGPT 在 Microsoft 365 应用生态系统中本地运行会怎样？”的问题。这正是它的作用。微软已在 OpenAI 业务上投资了数十亿美元，因此，其 Copilot AI 运行在该初创公司的 GPT-4o LLM 之上。

然而，Copilot 不仅仅是重新设计的 ChatGPT。其一，Copilot 不会像 ChatGPT 那样限制用户在不付费订阅其高级计划的情况下生成图像。另一方面，它的功能可以集成到微软的产品中，帮助用户在Word中生成文本，在Excel中创建图形和表格，以及在Outlook中起草电子邮件。

谷歌双子座

谷歌的 Gemini 聊天机器人自 2 月份正式亮相以来，开局可能有些艰难，但这款人工智能助手很快就成长为 ChatGPT 的有力竞争对手，提供了许多相同的功能和特性。其中包括生成文本、图像、视频、音频和代码的能力，使用 Gemini Live 与用户进行口头交谈，以及与Google 的 Workspace应用程序套件集成的能力。它可以通过用户的自然语言提示在 Gmail 中回复电子邮件、在云端硬盘中搜索文件、为幻灯片创建内容以及在文档中起草文本。

Gemini 可以免费使用，可以在网络上以及通过其 iOS 和 Android 应用程序使用，但如果您想访问 AI 的更高级功能（和工作区集成），则需要订阅该公司每月 20 美元的费用Google One AI 高级服务。

困惑

Perplexity 的人工智能助手提供了传统搜索引擎的独特替代方案。该聊天机器人不像谷歌搜索那样简单地返回网站列表来响应用户的查询，而是在互联网上搜索相关信息，然后直接在聊天窗口中综合用户问题的答案。它基本上消除了点击各个网站来查找您要查找的信息的需要。

Perplexity基于 GPT-4 模型构建，可在 Android、iOS 和 Web 上免费使用。该公司还提供 Pro 订阅计划，价格为 20 美元/月（或 200 美元/年），让您可以访问其他 AI 模型，包括GPT-4 Omni和Claude 3 Sonnet和Haiku ，以及许多额外的好处。

碧玉

Jasper AI 的机器人吉祥物站在电脑旁边的桌子上。 — 贾斯珀人工智能 / 贾斯珀

与 ChatGPT 和 Gemini 等通用聊天机器人不同， Jasper AI专注于商业。它旨在为电子邮件、博客、社交媒体帖子和营销材料生成文本，同时保持公司独特的语气、声音和品牌风格。该平台包括 Jasper Chat，可协助完成研究任务并提供写作建议，还可以帮助最大限度地提高营销内容的 SEO 分数。 Jasper 仅以订阅方式提供，计划起价为每位用户每月 40 美元，不过该公司确实提供 7 天的试用期。

用于音频和语音生成的最佳人工智能

十一实验室

ElevenLabs Reader 应用程序支持 Judy Garland 阅读。 — 十一实验室

ElevenLabs知道如何让机器说话。该公司是生成语音技术的领导者，提供各种以音频为中心的服务，从自动语音配音和克隆到文本到语音和文本到 SFX。用户可以从数千种独特的声音（包括著名名人的声音）中进行选择，这些声音均经过公共领域和许可数据的训练，采用 32 种语言中的任意一种。该公司的产品非常适合播客、有声读物旁白和对话式人工智能应用程序，有多种定价等级，从免费到每月 99 美元不等。

语音化

当Speechify可以以四倍半的速度向您朗读文档时，为什么还要阅读文档呢？该公司的配音技术可以用 60 多种语言以 200 种声音（包括通过其语音克隆功能提供的您自己的声音）中的一种来背诵您呈现给它的几乎任何文档。 Speechify 可作为 Chrome 扩展程序、Mac 应用程序、Web 应用程序、iOS 或 Android 应用程序使用。移动应用程序还可以使用手机的相机扫描页面来读取物理文档。 Speechify 的免费套餐限制您只能使用 10 种声音进行简单的文本到语音转换，而每月 12 美元的高级套餐则可以解锁该服务的全部功能。

演讲者

Respeecher专门为名人、内容创作者、配音演员、游戏设计师和其他专业应用程序提供语音克隆。该公司的人工智能模型本质上使一个人能够用另一个人的声音说话。 “我们录制‘目标声音’（正在复制的声音），训练我们的系统，并将其应用到‘源说话者’（朗读台词的演员），”Respeecher 的常见问题解答解释道。 “它具有真实人类声音的所有情感、语调和细微差别。”

该公司提供克里斯·法利 (Chris Farley) 和理查德·尼克松 (Richard Nixon) 等众多名人的声音，后者在 2019 年为 Speechify 赢得了艾美奖。基本文本转语音订阅计划起价为每月 18 美元（每月最多 100,000 个字符和范围） Power 层每月最高 500 美元，提供 900 分钟的语音转语音和 300 万个字符的文本转语音生成超过 100 种声音和 13 种口音。

控制语音

如果您想成为一名音乐家但无法掌握曲调， Controlla Voice可以为您提供帮助。其生成模型可以根据 15-30 分钟的样本音频训练听起来像您的“AI 歌声”，然后将其应用到公司广泛目录中的歌曲中，或者将您的声音与他们授权的配音演员中的其他人混合产生独特的声音。您甚至可以将其他艺术家的现有歌曲中的人声转换为您的声音，以轻松翻唱。订阅价格从每月 12 美元到 30 美元不等。

最好的人工智能编码

克洛德

Anthropic 的Claude 聊天机器人可能无法生成图像或与您对话，但它在编码应用程序方面非常出色。其最新版本Claude 3.5 Sonnet在广泛的领先行业基准测试中远远优于Gemini 1.5 Pro和ChatGPT-4o等产品。 Claude 也是第一个提供协作窗口（称为Artifacts ）的聊天机器人，可以预览人工智能在聊天流之外生成的内容。该聊天机器人对网络、iOS 和 Android 上的所有用户免费提供，但订阅 20 美元/月的 Pro 或 30 美元/月的 Teams 套餐将让您优先访问 Anthropic 提供的最新、最好的模型。

GitHub 副驾驶

GitHub Copilot是通过 Github 和 OpenAI 合作开发的，充当 AI 自动完成功能，帮助 Visual Studio Code、Visual Studio、Neovim 和 JetBrains IDE 中的用户比自己更快地生成代码。用户可以向 Copilot 提出一个用自然语言表述的编码问题，助手将自动生成解决方案代码。相反，它还可以解释给定的代码片段的作用以及在各种编码语言之间转换片段。您可以免费使用 Github Copilot，不过升级到每月 4 美元的专业版或每月 21 美元的企业版当然会为您提供额外的资源和功能。

亚马逊代码耳语者

与 Copilot 类似，亚马逊的 CodeWhisperer是一款通用编码助手，它将根据您现有的输入实时自动生成建议和代码推荐。它可用于 JetBrains 和 Visual Studio IDE，还支持 Mac 命令行中的自然语言到 bash 的翻译。免费套餐仅提供对系统更高级功能的有限访问，因此如果您想解锁其全部功能，则必须每月支付 20 美元。

光标人工智能

Cursor AI是一款与 Codewhisperer 类似的编码助手，但可以根据您之前的输入跨多行代码提供自动完成建议。它还提供智能重写功能，自动更正拼写错误和语法错误，以便您在调试时花更少的时间追踪错误的引号和括号，以及光标预测功能，猜测光标接下来需要在哪里，使您能够导航您的项目更快、更高效。

它甚至提供了一个聊天机器人助手（利用 GPT-4、GPT-4o 和 Claude 3.5 Sonnet），可以回答有关整个活动文件或特定选定代码块的问题。聊天机器人甚至可以根据您的自然语言指令编辑突出显示的代码。 Cursor AI 适用于 Mac、Windows 和 Linux 操作系统。您可以免费试用两周，然后需要支付 20 美元/月的专业版或 40 美元/用户/月的商业版订阅。

与应用程序生态系统的其他部分集成的最佳人工智能

元人工智能

Facebook 的母公司 Meta 在过去几年中一直在人工智能领域进行了大量投资，最近开始将 Gemini 和 Copilot 等竞争对手的智能功能整合到自己的产品组合中。该公司在 9 月份的一篇博客文章中夸口道：“每月有超过 4 亿人使用 Meta AI，每周有 1.85 亿人在我们的产品中使用它。”

该公司现在在 Messenger、Facebook、WhatsApp 和 Instagram DM 中提供类似于高级语音模式的对话式人工智能。它可以回答有关群聊中共享照片的问题，为您从 Feed 转发到 Instagram Stories 的图像生成自定义背景，并自动翻译 Instagram Reels 的音频。它还可以生成图像以在您的动态、故事中分享，并设置为您的 Facebook 个人资料图片。因此，当你发现自己想知道为什么 Facebook 和 Insta 上有如此多的人工智能障碍时，请明白，这是 Meta 花费数十亿美元开发的一项功能，而不是一个错误。

365 副驾驶

微软已经在与 OpenAI 的合作中投入了超过 100 亿美元，因此它当然会将 ChatGPT 的生成能力强加到它可能的每一个产品中。除了 Copilot 聊天机器人本身之外，微软还开发并发布了 Copilot Pages，其功能很像 Claude 的 Artifacts 或 ChatGPT 的 Canvas。该公司还将其集成到 Outlook 中，通过确定首先回复哪些邮件的优先级并快速起草电子邮件回复来帮助您管理收件箱。

365 Copilot还可以根据自然语言提示生成完整的宣传文稿，从而保持一致的语气和品牌声音，从而帮助您在 PowerPoint 演示文稿中快速建立连贯的叙述。在 Excel 中，Copilot 再次根据用户的提示完成生成公式、图形和图表的繁重工作。在 Teams 中，Copilot 可以监控您的视频会议并提供所发生事件的摘要，并根据讨论的内容生成可操作的项目列表。

谷歌双子座

Gemini为 Google 的 Workspace 应用程序套件所做的工作就像 Copilot 为 Microsoft 的工作套件所做的那样。 AI助手可以帮助在Gmail中起草电子邮件，在Docs中编写文档，在Sheets中生成图形和图表，在Slides中创建和修改幻灯片，在Drive中查找文件，并在Meet中提供实时翻译的标题和做笔记。如果您还没有个人 Google One AI Premium 订阅，则必须请求您的 Workspace 管理员授予您访问权限。

苹果情报

Apple 的 Craig Federighi 在 2024 年全球开发者大会 (WWDC) 上讨论 Apple Intelligence。 — 苹果

Apple Intelligence可能是人工智能领域的新秀，但它有望比目前市场上的任何其他产品更深入地融入其产品生态系统。它旨在作为代表用户行事的总体代理，承诺简化单调的日常任务，使 Siri 成为更好的对话者，在公司的无数应用程序中自动校对和文本摘要，并提供闪电般快速的图像生成。目前，它适用于运行iOS 18 、 iPadOS 18和MacOS Sequoia 的所有设备——基本上是iPhone 15 Pro 和 15 Pro Max （及更新版本），以及配备 M1 或更新芯片的 iPad 和 Mac。