计算机学习常识真的很难

由:玛雅是个大好|

抽象的大脑"width=
常识包括对基本物理的直观理解——这是计算机所缺乏的。安德烈Onufriyenko /盖蒂图片社

想象一下,你邀请朋友来家里吃午饭,打算点一份意大利辣香肠披萨。你还记得艾米提到苏茜已经不吃肉了吗。你试着给苏茜打电话,但她不接,你决定谨慎点,就点了一份玛格丽特披萨。

人们想当然地认为有能力经常处理这样的情况。事实上,在完成这些壮举时,人类依靠的不是一种,而是一套强大的普遍能力,即常识。

作为一个人工智能研究员在美国,我的工作是一项广泛努力的一部分,目的是让电脑看起来有点常识。这是一项极具挑战性的工作。

广告

快速定义常识

尽管常识在人类理解周围世界和学习的过程中具有普遍性和重要意义,但它却没有一个单一的精确定义。英国哲学家和神学家切斯特顿,著名的写在20世纪之交,“常识是狂野的、野蛮的、超越规则的东西。”今天的现代定义同意,至少,它是一种自然的,而不是正式传授的,人类的能力,使人们能够驾驭日常生活。

常识非常广泛,不仅包括社会能力,如管理期望和对他人情绪的推理,而且还包括物理朴素感例如,知道一块重石头不能安全地放在一个脆弱的塑料桌子上。天真,因为人们知道这些东西,尽管没有有意识地通过物理方程。

常识还包括抽象概念的背景知识,如时间、空间和事件。这种知识允许人们不必太精确就可以计划、估计和组织。

广告

常识很难计算

有趣的是,常识一直是一个重要因素在人工智能前沿的挑战从20世纪50年代这个领域的早期开始。尽管人工智能取得了巨大进步,尤其是在玩游戏计算机视觉然而,机器的常识与人类丰富的常识相比,仍然是一种遥远的可能性。这可能就是为什么为复杂的、有许多相互交织部分的现实世界问题(如COVID-19患者的诊断和建议治疗)而设计的人工智能工作,有时失败

现代AI的设计目的是解决非常具体的问题,而常识是模糊的,不能用一套规则来定义。即使是最新的模型有时也会犯荒谬的错误,这表明缺少一些基本的东西在AI的世界模型中。例如,给定以下文本:

“你给自己倒了一杯蔓越莓,然后不经意地倒了一茶匙葡萄汁进去。它看起来好。你试着闻一下,但你得了重感冒,什么都闻不到。你很渴。所以你”

备受吹捧的人工智能文本生成器GPT-3提供

“喝它。你现在已经死了。”

最近的雄心勃勃的努力已经认识到,机器常识是我们这个时代的一个“登月”人工智能问题,需要跨机构多年协同合作。一个显著的例子是四年制机常识该项目于2019年启动美国国防高级研究计划局为了加速该领域的研究,该机构发布了一份论文概述了该领域存在的问题和研究现状

机器常识计划资助了许多目前在机器常识方面的研究工作,包括我们自己的,多模式开放世界基础学习和推理(无忌).MOWGLI是我们南加州大学的研究小组和麻省理工学院、加州大学欧文分校、斯坦福大学和伦斯勒理工学院的人工智能研究人员之间的合作。该项目旨在建立一个计算机系统,可以回答广泛的常识性问题。

广告

变形金刚救援?

最后裂解机常识乐观的一个原因是最近发展了一种先进的深入学习人工智能叫《变形金刚》。变形金刚能够以一种强大的方式对自然语言进行建模,并经过一些调整能回答简单的常识问题。常识问答是构建能像人类一样交谈的聊天机器人至关重要的第一步。

在过去的几年里,一个大量的研究已经发表在变压器上,直接应用于常识推理。作为一个群体,这种快速的进步迫使该领域的研究人员面对科学和哲学边缘的两个相关问题:到底什么是常识?我们如何确定人工智能是否有常识?

为了回答第一个问题,研究者将常识分为不同的类别,包括常识社会学、常识心理学和背景知识。a的作者最近出版的认为研究人员可以更进一步,将这些类别划分为48个细粒度的领域,如规划、威胁检测和情绪

然而,人们并不总是清楚这些区域能有多干净。在我们的最近的一篇论文在美国,实验表明,第一个问题的明确答案可能是有问题的。即使是我们小组中分析文本并对其组成部分进行分类的人类注释专家,也会就常识的哪些方面适用于一个特定的句子产生分歧。批注者在时间和空间等相对具体的范畴上达成了一致,但在更抽象的概念上却存在分歧。

广告

识别人工智能常识

即使你承认常识理论中的某些重叠和模糊是不可避免的,研究人员真的能确定人工智能有常识吗?我们经常问机器问题来评估它们的常识,但人类的日常生活方式要有趣得多。人类运用了一系列在进化中磨练出来的技能,包括识别基本因果关系的能力,创造性解决问题,评估,计划和基本的社交技能,如交谈和谈判.尽管这份清单可能很长,也不完整,但在它的创造者可以宣布在机器常识研究方面取得胜利之前,人工智能应该取得同样的成就。

很明显,就连变压器研究的回报也在递减。变形金刚越来越大了电力饿.一个最近的变压器由中国搜索引擎巨头百度开发的,有数十亿个参数。有效的训练需要大量的数据。然而,迄今为止,它被证明无法掌握人类常识的细微差别。

即使是深度学习的先驱似乎也认为新的基础研究在今天的神经网络能够实现这样的飞跃之前,可能是需要的。这条新研究线的成功程度取决于它,我们不知道机器常识是需要5年还是50年才能实现。

玛雅是个大好是南加州大学工业与系统工程研究助理教授。

本文转载自谈话在知识共享许可下。你可以找到原文在这里。

广告

广告

加载……