关于SIRI 第(2/4)页

正文卷

一个更惊人的例子出现在Siri被苹果并购前的演示里。你说“IlikearomanticplaceforItalianfoodnearmyoffice”。

Siri回答:”IamlookingforaItalianrestaurantswhichreviewssayare

romanticnearyourwokinSanJose…“

这个回答说明Siri听懂了romantic是个形容词。并且知道nearmyoffice是个地方。并且,找到了以前存储的用户的工作地点。并且,他知道怎么判断一个餐馆是否romantic!(去搜索reviews)

把同样的话对着Android的VoiceAction或者Vlingo说一遍,你就知道Siri具有超越现有Apps的智能。

Siri和系统的整合更加紧密

Siri在并购前的版本整合了大量网络服务的APIs。比如OpenTable,Tickets,TaxiMagic等等。

而Siri被苹果收购了之后,

他已经被整合为系统的一部分了。

在iOS5的Siri视频中,出现新短消息之后,交互由Siri发起。说明他已经常驻系统后台并且可以接管重要的系统功能了。(除了短消息还有天气,时钟,Maps等等)[2]

Siri支持的语言

Siri目前支持三种语言:英文,法文,德文。其中英文分美式,英式,澳大利亚式。相关技术

Siri所用到的技术,很多人会回答,人工智能以及云计算,的确,总体来说,是这两样技术,不过,这种概述感觉几乎没有任何意义,何不直接说“计算技术”(注意,不是计算机技术)呢。因此,在本文,我将介绍下我了解Siri可能采用的技术(由于有个人猜测,不一定准确)。

首先,在前端方面,即面向用户,和用户交互(UserInterface,UI)的技术,主要是语音识别以及语音合成技术。语音识别技术是把用户的口语转化成文字,其中需要强大的语音知识库,因此需要用到所谓的“云计算”技术。而语音合成则是把返回的文字结果转化成语音输出,这个技术理论上本地就能完成,但不知道Siri是否如此,当然,在云端完成也并无不可,在当前无线带宽下,那点语音流量根本不算什么。[3]

其次,后台技术,这些其实才是真正的大角sè。这些技术的目的就是处理用户的请求,并返回最匹配的结果,这些请求类型很多,千奇百怪,要处理好并不简单。基本的结构猜测可能是分析用户的输入(已经通过语音转化),根据输入类型,分别采用合适的技术(合适的技术后台)进行处理。这些合适的后台技术包括,①以Google为代表的网页搜索技术;②以WolframAlpha为代表的知识搜索技术(或者知识计算技术);③以Wikipedia为代表的知识库(和WolframAlpha不同的是,这些知识来自人类的手工编辑)技术(包括其他百科,如电影百科等);④以Yelp为代表的问答以及推荐技术。

网页搜索技术[3]

这个我想没必要介绍,大家天天用的Google就是这个技术的代表。而国内的话,则以百度为代表。

知识计算(搜索)技术(Computational

Knowledge)[3]

这个技术的代表是Wolfram|Alpha。

不同于搜索互联网信息,Wolfram|Alpha将从公众的(包括公开的网页等)和获得授权的资源中,发掘、建立起一个异常庞大的经过组织的数据库,再利用高级的自然语言算法进行处理,最终构造出一个类似于谷歌搜索的工具。