这个人工智能小工具让我可以用我不懂或不懂的语言说话

手持 Timekettle AI 翻译中心。
Tushar Mehta / 数字趋势

《银河系漫游指南》宣称“巴别”鱼“可能是宇宙中最奇怪的东西”。它被描述为一种“像水蛭一样”的鱼,可以放入您的耳朵中,以周围环境的脑电波为食,然后在您的耳朵内排便,以您理解的语言发出声音。实际上,它是一种非常粗俗和公然但极其复杂的实时翻译设备。

在道格拉斯·亚当斯写下这部令人费解、惊天动地的传奇故事近半个世纪后,巴别鱼的概念仍然让人感到非常着迷。虽然我们还没有达到脑电波即时翻译的水平,但一些小工具正在以一种不那么令人厌恶的方式解决这个问题。 谷歌的翻译模式三星的 Galaxy AI是现成的翻译技术的典型例子,但一些品牌希望独立于智能手机来解决这个问题。 Timekettle 就是这些品牌之一,其最新的 X1 Interpreter hub 是一款手持设备,声称使用人工智能以不同的方式(读作:更好)做这件事。

我会说三种语言,并且对 Timekettle 的 X1 AI Interpreter Hub 进行广泛测试很有趣。但除了一些娱乐之外,我还在上个月去马来西亚旅行期间用它与该公司的香港创始人用中文进行了交流。我什至自愿陪我的妻子看她最喜欢的韩剧,不需要任何字幕,下面我将详细介绍具体情况。

是什么让 Timekettle X1 如此与众不同

Timekettle X1 口译员中心上显示提示发言。
Tushar Mehta / 数字趋势

不乏专门用于翻译的专用小工具。 Timekettle 本身提供了大量配件(其中一些是手持式的)来解决两种相距遥远的语言之间的沟通障碍。在ChatGPT于 2022 年底真正爆发后,您甚至可能在同一句话中听说过人工智能和翻译。

但该公司表示,X1 AI Hub 采取了比许多现有选项更好的方法。它是一个独立的解决方案,目前支持多达 40 种语言和 93 种口音,预计未来的软件更新将添加更多语言。它甚至可以离线工作(适用于选定的语言),并支持通过扬声器或耳机(随附)进行翻译。

每个 X1 集线器都有一个唯一的电话号码,只要您有互联网连接,就可以免费用于直接呼叫,并且没有任何地理限制。最重要的是,任何翻译,无论是实时翻译还是通过电话翻译,都是端到端加密的,这可以防止翻译过程中被任何人拦截和解释。所有这些功能都被封装在一个运行 Android 系统的体积虽大但仍可放入口袋的小工具中,这简化了公司和用户的软件更新。它还支持通过触摸屏进行交互。

独特且不寻常的硬件

手持 Timekettle AI 翻译中心。
Tushar Mehta / 数字趋势

说到其物理属性,Timekettle X1 是一个矩形块,其长度几乎与普通平板手机相同,但宽度只有普通平板手机的一半。这些尺寸使其相当容易用一只手握住和使用。

首先值得注意的是 3.4 英寸触摸屏,它是与翻译器交互的主要(但不是唯一)方式。显示屏旁边有一个多用途、电容式、非触觉按钮,通常会触发“后退”手势,但也可以触摸并按住以触发即时翻译模式,我将在稍后讨论。侧面有两组触觉按钮,用于执行电源和音量调高和调低等标准功能。旁边有一个微型麦克风。

Timekettle X1 AI 口译翻译中心,耳机支架已弹出。
Tushar Mehta / 数字趋势

X1 集线器的底部有一个用于充电的 USB-C 端口和一个扬声器条。该区域还设有一些用于弹簧针的连接垫,在使用专用底座(单独出售)时非常方便,可同时为最多五个 X1 集线器充电。 X1 集线器的这一部分还用作托盘,使用推动机构打开或关闭。该托盘用于放置耳机,耳机是该小工具的一部分,用于将翻译后的声音直接传送到您的耳朵中。

Timekettle X1 AI 口译翻译中心扬声器和 NFC 垫。
Tushar Mehta / 数字趋势

在完全相反的边缘上还有两个切口(可能用于更多扬声器)和一个 NFC 接触点,可用于立即配对两个 X1 集线器。

包装的耳塞部分采用部分入耳式设计,因此不提供任何噪音隔离。虽然这可能会有点分散注意力,但这是一个有意识的选择,以确保其他人的实际声音不会被静音。半入耳式设计让耳塞更容易脱落,而 Timekettle 包含耳挂和硅胶垫以保持耳塞稳定的做法让人感觉贴心。然而,事实上,耳塞在不使用时需要放回设备内部,这使得你很容易失去挂钩,实际上我最终根本没有使用它们。

Timekettle X1 AI 口译翻译中心,耳机放置在木质表面上。
Tushar Mehta / 数字趋势

我仍然希望有一种方法可以将定制耳机与集线器配对,但该公司告诉我,它已经根据这些耳塞的驱动程序专门调整了噪音抑制算法。因此,选择不支持第三方收听解决方案也是有意识的,因为这会干扰接收。

该界面非常容易掌握和交互。尽管它仍然基于过时的 Android 10,但该公司告诉我,多年来它将继续对界面进行定期更新,主要是为了提高算法的词汇量以及对俚语和口音的理解。虽然很高兴看到界面出现一些视觉变化,但该公司并未在这方面做出声明。

翻译功能如何工作

Timekettle X1 AI 口译翻译中心,耳机托盘已弹出。
Tushar Mehta / 数字趋势

Timekettle Interpreter 可以通过几种不同的方式部署,使多语言对话变得轻松、轻松。虽然所有模式主要服务于相同的目的——将口语翻译成您喜欢的语言——但每种模式都针对不同的场景进行了优化。根据模式,您可以使用一个或多个 Timekettle X1 集线器与其他人互动。

一对一

Timekettle X1 AI翻译翻译中心一对一模式。
Tushar Mehta / 数字趋势

第一种模式专为两个人之间的亲密面对面对话而设计。您将其中一个耳机放入耳中,并与其他人共用另一个耳机。您可以为每个耳机分配不同的语言,并且基本上将集线器放在一边(但在耳机保持连接的范围内)。

耳机监听,然后将消息转发回集线器,这大约需要一秒钟的时间来翻译。翻译后的单词会立即传回另一个耳机。所有这一切都是在整个对话被转录并显示在 X1 集线器的显示屏上时发生的。

这种模式下的翻译通常是准确的,但并不真正引人注目。该模式要求两个参与者之间保持足够的距离,以防止彼此的声音穿过对方的耳机。如果他们坐在附近,中枢往往无法正确记录单词,或者有时无法正确理解,但随后会用一些不太有意义的内容覆盖它。

聆听和演奏

Timekettle X1 AI 口译翻译中心聆听和播放模式。
Tushar Mehta / 数字趋势

下一个模式纯粹是为了听别人说话而不必自己说话。在此模式下,您可以选择语言,将集线器放置在靠近音频源的位置,然后将两个耳机塞入耳内。

应用程序很简单,结果也正如预期的那样好。由于耳机上的麦克风没有被占用,因此不会相互干扰,因此语音会更加顺畅。

值得注意的是,虽然翻译会立即开始,并且可以在显示屏上查看,但 X1 集线器需要一到两秒的休息时间才能开始在耳机中播放翻译。这可能会使理解上下文变得有点困难,尤其是当说话者不知道您需要他们退后一步以便翻译设备启动时。不过,一旦开始,它就可以不间断地继续进行。但翻译后的演讲迟到了几秒钟,这又让你感到有点紧张。

公平地说,这比大多数智能手机提供的更快、更准确。正如我所写,一旦演讲者稍作休息,它就可以正常工作。因此,该模式对于您可能参加的任何在线演讲或演示都有效。事实证明,观看另一种语言的电影或电视节目并不实用,因为翻译后的语音听起来非常机械,没有任何不同角色的情感或语言差异。该公司表示这些功能将在未来的更新中推出,但我会保留我的想法,直到我自己使用它们。

询问并出发

Timekettle AI 翻译中心具有“询问即走”模式。
Tushar Mehta / 数字趋势

与前两种有助于在安静环境中进行翻译的模式不同,Ask & Go 更适合更吵闹、更户外的环境。更重要的是,它真正利用了手持式设计,可以快速、直接地使用。

您可以设置一次语言并启动交互模式,而无需共享耳机。 Timekettle X1 集线器将使用外部麦克风收听两种语言,然后通过扬声器播放翻译版本。设置语言后,您甚至可以通过按住前面的电容式按钮来切换此模式,这使其成为翻译器上使用最快、最简单的模式。

更重要的是,该模式允许不止两个用户参与对话,并自动检测何时正在使用两种选定语言中的一种。当您去国外旅行并需要在社交环境(例如街道)中与当地人互动时,这尤其有用。

虽然该功能与通过手机实现的功能类似,但与需要耳机的模式相比,其速度以及令人惊讶地提高的准确性使该功能非常引人注目。

语音通话

Timekettle X1人工智能翻译机用于海外语音通话。
Tushar Mehta / 数字趋势

Timekettle X1 Interpreter hub 的另一个值得注意(或许也是最突出)的功能是它能够像常规互联网通话一样进行多语言语音通话。每个单元都分配有一个六位数字的电话号码,只要连接到互联网,就可以用来呼叫地球上任何地方的另一个单元。该设施目前免费提供,并提供近乎即时的翻译。

为了测试此功能,我使用语音通话功能和静音 Zoom 通话与 Timekettle 的首席执行官兼联合创始人 Leal Tian 进行了交谈。在这次通话中,田说的是中文,而我说的是英语。我们的对话涉及这个小工具的实用性、机器学习的使用以及公司的未来等主题,完全是用两种不同的语言进行的。翻译流程大部分都很顺利,但有一些重复的情况,特别是当设备重新尝试翻译句子中的某些内容时。这导致了一些摩擦,但我们 90% 的聊天都是毫不费力的。

正如您所期望的,这可能会改变企业的游戏规则,尤其是当您与来自不同地区的团队合作时。

“人工智能”做什么?

Timekettle X1 AI 翻译中心一对一模式。
Tushar Mehta / 数字趋势

Timekettle X1 AI Interpreter 中心感觉像是一个填补沟通空白的实用解决方案,特别是对于企业环境。正如其名称所示,一个关键方面是它对人工智能的依赖。在与 Timekettle 创始人交谈时,我询问了人工智能在该设备上扮演的角色,以了解这实际上是一项功能还是该公司只是利用该功能获利。这是我被告知的:

X1 AI Interpreter 中心主要依赖于两种语言模型。第一个称为 TurboFast,它允许同时进行两种语言的逐字翻译。根据 Timekettle 的说法,它选择逐字路线而不是每句话路线,以减少其中一位用户说话时的等待时间。另一个模型称为BoostClean ,这是一种统计模型,旨在清除数据集中的错误,用于抑制背景噪声。

根据 Tian 的说法,这些数据模型会在服务器端不断更新,但不会使用用户的任何私人数据,以增强该小工具不会窥探您的机密对话的信心。我还获悉,该公司目前正在评估每个设备上自定义翻译的使用,以允许用户注册和翻译技术术语或在非常特定的情况下使用的任何专业术语。这可能会作为未来更新的一部分提供。

一个出色的设备,但有不足之处

Timekettle X1 AI hub语音通话功能
Tushar Mehta / 数字趋势

人类通常最能用母语表达,这就是为什么翻译对于理解其他观点仍然至关重要。与此同时,在人工智能的帮助下,一个巨大且不断发展的不同语言库解决了直接翻译工具的许多问题,尤其是在手机上

Timekettle 的广泛功能列表进一步有助于促进不同场景的沟通。当我们考虑到翻译的速度时,这变得更加令人兴奋。从理论上讲,这听起来像是一个不可或缺的工具,尤其是对于商业环境。然而,一些缺陷使其看起来不像公司项目那样有效。

X1 中心仍然存在一些操作问题,尤其是短语的重复和断章取义的翻译。这些可能会阻碍对话,甚至可能对结果产生负面影响。另一个令人担忧的问题是其高昂的价格: 单个设备的售价为 699 美元,无论您是一家只是为了给国际客户留下深刻印象的小型初创公司,还是一家希望与高级管理人员轻松交流的大公司,这都将是一笔相当大的开支。接下来是坚定的握手。

当然,当您考虑到雇用人工翻译的终生成本和语言限制时,这要便宜得多。然而,人类的专业知识,即使是一种语言,也无法被手持设备超越。在感知到语音背后的情感后,人类可以在对话中引入更多细微差别,甚至避免直接翻译以避免冲突——这是目前技术无法成功的。 Timekettle 中心最多只能帮助人类翻译。

Timekettle X1 AI 口译翻译中心,耳机放在一边,托盘弹出。
Tushar Mehta / 数字趋势

除了功能问题外,Timekettle AI 翻译器仍然让人感觉乏善可陈,我有两个想法供该品牌实施来解决这个问题。首先,该小工具需要自动检测功能,因此用户不必总是在开始对话之前手动选择语言。其次,我真的很想将它与语音助手一起使用,这样我就不必摆弄菜单选项,特别是因为小屏幕上的空间有限。

虽然我不会像许多评论者对 Humane AI 引脚那样对 Timekettle X1 AI 中心无情——仅仅因为它没有达到理论上突破性的实力水平——但我希望该公司能够解决一些问题。这样,就更容易证明这个高价是合理的,并向我喜欢在企业演讲中交谈的朋友和同事推荐它。


Posted

in

by

Tags: