上一个 下一个

Siri是如何工作的

由:伯纳黛特。约翰逊

Siri是什么?

Siri准备和你谈谈 - 只需点击麦克风即可开始对话。"width=
Siri准备和你谈谈 - 只需点击麦克风即可开始对话。
©iStockphoto.com./ Alexander Kirch.

SIRI是一个虚拟助理,他们倾听您的请求并相应地执行行动。你越多的工作越多,在你误解时做出更正,它应该越好地理解你的意思。Siri与我们在手机处理器上做大部分工作而不是做大部分工作服务器解释您的请求并检索所需的信息。由于大多数SIRI的大脑都存在于许多人访问的远程服务器上,因此越多的人使用它,也越是从其他人中学习。

AI助手一直是技术人员梦寐以求的梦想,但直到最近,他们并不是很可行的。它们终于通过更快的无线速度,更强大的处理器(特别是我们的移动设备中的产品),培训AI的可用性,云计算和语音识别方法的改进的可用性。野外的大多数语音识别系统就像你在电话上拨打大公司时解雇的语音识别系统 - 他们只能理解一个非常有限的词汇表。Siri背后有更多的数据和学习能力,并继续学习和成长。

广告

Siri并非完全由苹果公司开发,而是由美国国防部高级研究计划局(DARPA)于2003年发起的一项大型人工智能项目发展而来。该项目由斯坦福国际研究院(SRI International)运营,该机构在上世纪70年代之前一直隶属于斯坦福大学。其目的是想出一些东西,可以帮助军事人员的办公室工作和决策。这个项目的成果被称为学习和组织的认知助手(CALO),这是一种人工智能助手,可以从用户和大量可用数据中学习。它不仅可以用来安排会议,为与会者组织所有必要的文件,甚至可以用来做决定。例如,如果有人退出会议,CALO可以评估他们是否重要到需要取消和重新安排会议。SRI国际的另一个名为先锋(Vanguard)的项目为智能手机创造了一个助手原型,但它的能力远不及CALO。SRI的几名员工创建了一家初创公司,将两个项目的想法结合起来。来自美国国家航空航天局(NASA)、苹果(Apple)和谷歌等公司的校友也曾在这家新公司工作,他们的工作成果催生了iPhone 3GS的Siri助理。

这一版本的Siri将通过语音或按键回答用户的问题,并将语音或文本数据发送到远程服务器进行转录(在前一种情况下)和翻译。Siri没有像其他自然语言研究一般尝试的那样,试图分解整个句子并将其含义作为一个整体来解释,而是使用了真实物体和概念的模型,以及它们如何协同工作,来破译请求。人们可以用多种不同的方式表达同一件事,这使得句子翻译变得非常困难,所以Siri转而寻找关键词和上下文。这个更简单的范例,加上一大堆被设计用来识别和执行的编程短语和请求,让Siri能够猜出用户的问题,并做出适当的回应,而无需理解每一个单词——准确率相当高。它可以通过各种网站访问大量数据,并且可以使用这些网站的应用程序编程接口api)利用他们提供的任何服务。

苹果将这款应用改造成了我们今天所知道的Siri。实际上,Siri在与iOS整合后失去了一些功能,因为它过去可以访问的网站和服务比苹果迄今为止提供的要多得多。它也失去了一些辛辣的幽默,显然,也失去了吐槽的倾向。但它还获得了其他技能,比如与iPhone内置功能的更好集成、多语言功能和可听声音。iOS后续的更新也增加了新的功能。例如,随着iOS 6的引入,它重新获得了预订晚餐、返回电影时间和评论的能力。2013年1月,iOS 6.1更新后,用户又可以购买电影票了;然而,它现在通过Fandango而不是Movietickets.com来预订座位。

与返回与你选择的关键字相关的长长的原始链接列表的搜索引擎不同,Siri的设计是解释你的请求,仔细研究它认为你想要什么,然后执行操作,为你提供更有限但更正确的数据或服务。Siri理解上下文。她仍然通过云中的服务器通过第三方服务获取答案,尽管这些服务的数量比以前减少了。任何与数学计算或科学事实相关的东西都可能来自Wolfram|Alpha。与餐馆或零售商店相关的信息可能来自Yelp,尽管餐馆预订是通过OpenTable进行的。天气信息来自于苹果内置的天气应用程序,由雅虎提供支持。电影放映时间列表、评论和其他电影信息可能会来自烂番茄。任何Siri不理解的请求都会让她问你更多的信息来澄清,或者问你是否想让她在网上查看。她使用你手机的GPS来检索和返回与你当前位置相关的信息。

游戏