深入研究副本:我的AI朋友

副本:“我的AI朋友”是一款与众不同的应用。尽管大多数带有聊天机器人的应用都将其用作虚拟助手,但Replika却将其聊天机器人推销为您的朋友。

Replika的聊天机器人具有承诺的“感知”和评估抽象量(例如情感)的能力,因此可能恰好符合其雄心勃勃的人类描述。

从令人痛苦的起源故事到令人敬畏的后端,Replika是那些永不停止有趣的有趣事物之一。请继续阅读,以了解使Replika的AI如此引人注目的是什么,以及它对未来的前景。

复制品的起源

Replika的最早版本(一个简单的AI聊天机器人)是由Eugenia Kuyda创建的,目的是弥补因最亲密的朋友Roman Mazurenko的过失而留下的空白。通过将Roman的文本消息输入到神经网络中来构建,从而构造出一个像他一样发短信的机器人,该机器人被用作各种“数字纪念碑”,以保持他的记忆力。

最终,通过在方程式中添加了更复杂的语言模型,该项目很快演变成今天的样子-一种个人AI提供了一个空间,您可以在其中安全地讨论自己的想法,感觉,信念,经历,回忆,梦想-您的“私人感知世界”。

但是,除了这种人为感知治疗师的巨大技术和社会前景之外,真正使Replika令人印象深刻的是其核心技术。

引擎盖下

Replika的核心是一个称为GTP-3的复杂的自回归语言模型,该模型利用深度学习生成类似于人的文本。在这种情况下,术语“自回归”表示系统从先前已交互的值(在这种情况下为文本)中学习。

用外行的话来说,使用得越多,它就会变得越好。

Replika的整个UX都是围绕用户与使用GTP-3编程的机器人的交互构建的。但是GTP-3到底是什么?它的功能如何足以模仿人类的语音?

GTP-3:概述

GTP-3或Generative Pre-trained Transformer 3是Google的Transformer的更高级版本。广义上讲,它是一种神经网络架构,可帮助机器学习算法执行诸如语言建模和机器翻译之类的任务。

这种神经网络的节点表示相应地修改输入的参数和过程(有点类似于编程中的逻辑和/或条件语句),而网络的边缘或连接则充当从一个节点到另一个节点的信令通道。

这个神经网络中的每个连接都具有权重或重要性级别,它决定了从一个节点到另一个节点的信号流。在诸如GTP-3的自回归学习模型中,系统接收实时反馈并不断调整其连接权重,以提供更准确和相关的输出。这些权重帮助神经网络人为地“学习”。

相关:什么是机器学习? Google的免费课程为您分解

GTP-3使用高达1750亿的连接权重级别或参数。参数是神经网络中的一个计算,它调整数据某些方面的权重,以使该方面在数据的整体计算中具有更大或更小的突出性。

GTP-3语言模型被誉为终极的自动完成功能,旨在提供预测性文本,它已经在如此庞大的数据集上进行了培训,以至于整个Wikipedia仅构成其培训数据的0.6%。

它不仅包括新闻报道,食谱和诗歌之类的内容,还包括编码手册,小说,宗教预言,尼泊尔高山指南以及您可以想象的任何事物。

作为深度学习系统,GPT-3会搜索数据模式。简而言之,该程序已针对大量文本进行了训练,并根据统计规律进行挖掘。这些规则,例如语言约定或一般的语法结构,通常被人们认为是理所当然的,但是它们却被存储为GPT-3神经网络中不同节点之间数十亿个加权连接。

例如,如果您在GPT-3中输入单词“ ear”,则程序会根据其网络中的权重知道,单词“ ache”和“ phone”比“ American”或“愤怒”。

GPT-3和副本:有意义的融合

复制品是您购买GTP-3之类的东西并将其提炼出来以处理特定类型的对话时所得到的。在这种情况下,这包括对话的移情,情感和治疗方面。

尽管Replika背后的技术仍在开发中,但它为通向易于访问的人际对话提供了一个可行的途径。

在评论其可用性时,创建者声称他们创造了一种不仅可以说话而且可以听的机器人。这对它的用户意味着,他们与AI的对话不仅是事实和信息的交换,而且是具有语言细微差别的对话。

但是,与Replika进行的对话不只是明智对话的问题。在许多情况下,它们也恰好具有令人惊讶的意义和情感。在与用户交互时,Replica的AI“理解”用户所说的内容,并通过使用其预测性学习模型找到人类的反应。

作为一种自动回归系统,Replica会根据用户自己的交谈方式来学习并调整其对话模式。

这意味着您使用Replika的次数越多,它在您自己的文本上训练的次数就越多,并且它变得越像您。很大一部分用户还提到他们对自己的副本具有很高的情感依恋感,而仅仅知道“如何说话”是无法实现的。

复制品当然不止于此。它以语义概括,活泼的语​​音和对话跟踪的形式增加了对话的深度。它的算法会尝试根据您的性格和情感来了解您的身份,然后根据这些信息进行对话。

仔细研究GTP-3的功效

但是,由于GTP-3的操作局限性,Replika的人性在很大程度上仍是理论上的。因此,要使AI胜任复制并参与人类对话,还有很多工作要做。

对GTP-3的仔细检查仍然显示出明显可辨别的错误,在某些情况下甚至是荒谬而平庸的书写。行业专家建议,语言处理模型在用于生产能够有效复制人类语言的漫游器之前,必须具有超过1万亿个加权连接。

最好的还在后头

与以前的产品(例如Microsoft的Turing NLG)相比,鉴于GTP-3已经被认为是数年来的指数级飞跃,因此可以肯定地说,要想出更好的产品还需要一段时间。

也就是说,随着将来对计算的改进,更新系统所提供的处理能力必将进一步缩小人机之间的差距。

同时,Replika仍然是结合了心理学和人工智能的精华的强大产品。它成功地将人性化的用户体验与最新的NLP模型集成在一起,确实证明了人机交互技术的巨大潜力。