新技术照亮了AI系统的内部工作原理

时间：2021-11-21 09:58:04来源：

图像：切尔西·特纳/麻省理工学院

神经网络通过分析大量的训练数据来学习执行计算任务，一直是人工智能领域最令人印象深刻的最新进展，其中包括语音识别和自动翻译系统。

但是，在训练过程中，神经网络会以其创建者无法解释的方式不断调整其内部设置。计算机科学领域最近的许多工作都集中在确定神经网络如何完成其工作的聪明技术上。

在最近的几篇论文中，麻省理工学院计算机科学与人工智能实验室（CSAIL）和卡塔尔计算机研究所的研究人员使用了一种新近开发的解释技术，该技术已在其他领域应用，以分析经过训练可进行机器翻译和语音的神经网络认出。

他们找到了一些有关网络可能如何工作的常见直觉的经验支持。例如，系统似乎先专注于诸如语音识别或词性识别之类的较低级任务，然后再转向诸如转录或语义解释之类的较高级任务。

但是研究人员还发现翻译网络考虑的数据类型存在令人惊讶的遗漏，并且他们表明纠正这一遗漏可以提高网络的性能。改进是适度的，但它指出了对神经网络进行分析可以帮助提高人工智能系统准确性的可能性。

“在机器翻译方面，从历史上看，金字塔是不同层次的，” CSAIL资深研究科学家吉姆·格拉斯（Jim Glass）说，他与麻省理工学院电气工程与计算机科学研究生Yonatan Belinkov一起从事该项目。“在最低层次上，有一个单词，表面形式，而金字塔的顶部是某种语言间的表示形式，在语法，语义上您将具有不同的层次。这是一个非常抽象的概念，但是您的想法是，您在金字塔中往上走越高，越容易翻译成新语言，然后又往下走。因此，Yonatan正在做的部分工作是试图弄清该概念的哪些方面正在网络中进行编码。”

最近在国际自然语言处理联合会议上的两篇论文中介绍了机器翻译的工作。一方面，贝林科夫是第一作者，而格拉斯是高级作者，另一方面，贝林科夫是合著者。两者都由卡塔尔计算机研究所（QCRI）的研究人员参加，其中包括LluísMàrquez，Hassan Sajjad，Nadir Durrani，Fahim Dalvi和Stephan Vogel。Belinkov和Glass是论文分析语音识别系统的唯一作者，Belinkov在上周的神经信息处理研讨会上发表了论文。

降级

神经网络之所以如此命名是因为它们大致类似于人脑的结构。通常，它们被分成几层，每一层都由许多简单的处理单元（节点）组成，每个处理单元都连接到上下两层中的几个节点。数据被送入最低层，最低层的节点对其进行处理并将其传递到下一层。层之间的连接具有不同的“权重”，“权重”确定将任一节点ps的输出输出到下一个节点执行的计算中。

在训练过程中，节点之间的权重会不断调整。对网络进行训练后，其创建者可以确定所有连接的权重，但要确定数千个甚至数百万个节点以及它们之间的更多连接，因此推断这些权重编码的算法几乎是不可能的。

麻省理工学院和QCRI研究人员的技术包括采用训练有素的网络，并使用其每一层的输出以响应单个训练示例，以训练另一个神经网络来执行特定任务。这使他们能够确定优化每个层的任务。

在语音识别网络的情况下，别林科夫和格拉斯使用个人层的输出来训练系统来识别“电话”，即特定于口头语言的不同语音单位。例如，“ t”在单词“ tea”，“ tree”和“ but”中可能被分类为单独的电话，但是语音识别系统必须使用字母“ t”来转录所有电话。确实，Belinkov和Glass发现，较低的网络识别能力比较高的识别能力更好。

同样，在去年夏天在格拉斯计算语言学协会年会上发表的一篇早期论文中，贝林科夫及其QCRI同事表明，较低级别的机器翻译网络特别擅长识别语音和词法的组成部分-时态，数字和共轭等功能。

产生意义

但是在新论文中，他们表明，较高级别的网络在称为语义标记的方面更好。正如别林科夫所解释的那样，部分词性标注者将认识到“她自己”是代词，但是该代词的含义（其语义意义）在“她自己买书”和“她自己买书”这句话中有很大不同。这本书。语义标记器会为这两个“她自己”实例分配不同的标记，就像机器翻译系统可能会以给定的目标语言为它们找到不同的翻译一样。

性能最佳的机器翻译网络使用所谓的编码-解码模型，因此MIT和QCRI研究人员的网络也使用它。在这样的系统中，以源语言形式的输入经过网络的几层（称为编码器）以产生向量，即一串数字，以某种方式表示输入的语义内容。该矢量穿过网络的其他几个层（即解码器）以产生目标语言的翻译。

尽管编码器和解码器一起训练，但可以将它们视为独立的网络。研究人员发现，奇怪的是，编码器的较低层擅长区分形态，而解码器的较高层则不然。因此，Belinkov和QCRI研究人员对网络进行了重新培训，不仅根据翻译的准确性而且还根据目标语言的形态分析来对网络进行评分。本质上，他们迫使解码器在区分形态方面变得更好。

他们使用这种技术对网络进行了重新培训，将英语翻译成德语，发现其准确性提高了3％。这并不是一个巨大的进步，但是这表明，在神经网络的幕后看待不只是一项学术活动。

PDF文件复印件：

分析端到端自动语音识别系统中的隐藏表示评估基于词性和语义标记任务的神经机器翻译中的表示层了解和改进神经机器翻译解码器中的形态学