尽管OpenAI 推迟了 ChatGPT 的文本转语音功能,但人工智能音频初创公司 ElevenLabs 于周三发布了iOS 版 Reader 应用程序,该模型有望朗读几乎任何内容源的文字,包括新闻文章、PDF、ePub 和时事通讯— 甚至粘贴网络链接。
今天我们推出 ElevenLabs iOS 应用程序!
它可以让您使用我们的人工智能生成的声音收听任何文章、书籍或文档。
看看🚀 pic.twitter.com/zQ9ISG8NUn
—阿玛尔·雷希 (@ammaar) 2024 年 6 月 25 日
用户将能够从“高质量、类人声音”库中进行选择,并能够控制人工智能调制的语音将文本读回给他们的速度。 Reader 应用程序可在 iPhone、iPad 和 iPod Touch(任何运行 iOS 和 iPadOS 15 或更高版本的设备)上使用,供美国、英国和加拿大的用户使用。该公司计划“几周内”于 7 月 11 日左右在欧盟发布该软件。Android 版本目前正在开发中,该公司正在为感兴趣的用户提供候补名单。
ElevenLabs 已经在考虑对该服务进行更新,包括离线播放、RSS 提要访问、人工智能摘要以及与朋友分享片段的功能。该公司还希望将口语扩展到其多语言模型支持的所有 29 种语言。
“创建一流的人工智能音频模型还不够,”ElevenLabs 周三的声明中写道。 “创作者需要可以用来创作的工具。消费者需要可以消费音频的接口。”该公司最终将开始对该服务收费(鉴于其网站声明前三个月的使用是免费的),尽管目前还没有关于订阅费用的消息。
根据之前的数字趋势报告, ElevenLabs 的人工智能生成的语音模型接受了公共领域数据、与商业合作伙伴协议中获取的数据以及公开数据的训练。有了它们,该公司就能够提供各种服务,从配音和自动翻译到语音克隆和自动旁白,甚至为基于虚幻引擎构建的 NPC 生成人工智能语音。