上一页 下一个

语音识别的工作原理

由:Ed Grabianowski

语音识别的未来

语音识别的首次发展比现代计算机的发明早了50多年。亚历山大·格雷厄姆·贝尔受到他失聪的妻子的启发,开始了传播语言的实验。他最初希望发明一种设备,能将可听的文字转化为聋人可以理解的可见图像。他确实制作了声音的光谱图像,但他的妻子无法破译它们。这一研究方向最终导致了他的发明电话

几十年来,科学家们开发了计算机语音识别的实验方法,但当时可用的计算能力限制了这些方法。直到20世纪90年代,普通消费者才有了能够处理语音识别的强大计算机。目前的研究可能会导致目前在《星际迷航》(Star Trek)中更熟悉的技术。美国国防高级研究计划局(DARPA)有三个研究小组致力于全球自主语言开发(GALE)项目,该项目将从外国新闻广播和报纸中获取信息流并进行翻译。该公司希望开发出一种软件,能够即时翻译两种语言,准确率至少达到90%。Garofolo说:“DARPA也在资助一个名为TRANSTAC的研发项目,使我们的士兵能够更有效地与非英语国家的平民交流。”Garofolo补充说,这项技术无疑将发展为民用应用,包括通用翻译。

广告

然而,通用翻译器仍是遥远的未来,要建立一个结合自动翻译和语音激活技术的系统是非常困难的。根据美国有线电视新闻网最近的一篇文章,GALE项目“即使按照DARPA的极端标准,也很难”。为什么?其中一个问题是如何构建一个能够完美处理俚语、方言、口音和背景噪音等障碍的系统。语言使用的不同语法结构也会造成问题。例如,阿拉伯语有时会用单个单词来表达英语中整个句子的意思。

在未来的某个时候,语音识别可能会变成语音理解。统计模型允许计算机决定一个人刚刚说了什么,也许有一天可以让他们掌握词汇背后的含义。尽管就计算能力和软件复杂度而言,这是一个巨大的飞跃,但一些研究人员认为,语音识别的发展提供了从今天的计算机到真正的人工智能的最直接的途径。今天我们可以和我们的电脑对话。25年后,他们很可能会回嘴。

有关语音识别和相关主题的更多信息,请查看下面的链接。

HowStuffWorks相关文章

更大的链接

来源

  • Jelinke,弗雷德里克。“语音识别的统计方法”。麻省理工学院出版社,1998年1月16日ISBN 0262100665。
  • 雷蒙德·库兹韦尔。“HAL的遗产:2001年计算机的梦想和现实”,David G. Stork编辑,麻省理工学院出版社,1998年2月6日,ISBN 0262692112。
  • “钟。”PBS.org。http://www.pbs.org/wgbh/amex/telephone/peopleevents/mabell.html

游戏