我们为什么还不能和手机交谈?

2013-04-22 09:06:40  来源:投资者报

  四十多年前,专家们曾宣称,语音识别将在“五到十年内”发展为一项成熟的技术。可多年过后,他们依然重复着一模一样的说辞。

  语音识别的发展确实费了不少工夫——好在,时隔多年以后,我们总算开发出了一套质量过硬的识别技术。不仅如此,我们还把这玩意应用到了移动设备上(尽管还得靠服务器提供一大堆技术支持)。

  然后问题就来了——有了这样的技术,我们为什么还是得整天瞅着自己的手机屏幕鼓捣来鼓捣去,却无法直接开口跟自己的手机对话交谈?

  回答这个问题的关键,在于提供一个语音交互界面,远比理解一打单词来得复杂——尤其是对手机而言。我们还必须得理解用户的“意图”。要知道,除了语音技术本身以外,人机语音交流中还有其他因素在作怪——输出方式,互动形式还有语境。

  多元化的输出:既能秀,也能说

  如今投入使用的语音系统,识别的效果一般都过于极端化——要么一字不差,要么谬以千里。事实上,当我们查询一条去某大街的路线时,要是系统能精确无误地从数据库的上千个条目中识别出我们想要的那一条,还是挺令人称奇的。不幸的是,如果识别有误或者街名不准,我们的搜索就只能乖乖从头再来。

  要想在现有的语音技术上有所突破,我们必须得认识到一点:我们现有的系统,不过就是最原始的识别技术而已——识别技术本身没啥问题;但除了这套技术以外,我们的系统只是一个空壳罢了。而我们需要的,其实是创造一个语音交互界面——说白了,就是一整套基于语音的互动模式。

  理解用户的“意图”,意味着系统要判断出用户真正需要的事物,而这通常得依靠交谈来实现。这就是说,系统要了解用户为什么问这个问题——一般来说,这就要求系统去知晓对方在做什么;与此同时,这也要求系统根据用户所处的情形合理应答。这可决不是一项轻松的任务——毕竟,用户只是把移动设备握在手中而已,他们可能有着大把的事情,要忙着分神去处理。

  互动是一种双向的沟通,意味着我们在提供输入的同时还得留意输出;而这些能发声的应用是怎么回答我们的呢?最常见的方式,是直接向用户回复他们所想要的信息。那些提供实时驾驶指南的“杀手级应用”就是个典型的例子:用户双眼注视路况,双手把好方向盘,然后严格按照语音提示说的做就行——这种情况下,这样的应答方式也确实管用。

  但另一些时候,这招就不那么灵了。比如,当我们询问下班公交什么时候到站时,让系统自顾自地把整张时刻表背下来就是个不折不扣的馊主意。即使它只是回复一句“下班车9点12分到站”,效果也好不到哪去——这时候,说“下班车12分钟内到站”才是王道。

  这其中的关键在于,语音只是瞬时性的——一句话,说完就完了。要是我们一时不小心分神了,或者一下子没来得及把消息印到脑子里,我们就得再问一遍。说不定还得问上一遍又一遍。

  这就是我们不应该抛弃用户界面的原因:它好歹能帮我们少占用一些记忆容量。未来的语音技术所迫切需要的,是多元化的输出:既能秀,也能说。举个例子,如果我正忙着赶路的话,何不让移动设备既在屏幕上给我秀一下时刻表,也在耳边跟我说一声“下班车12分钟后到站”?

  理解背后的“意图”

  这也引出了未来的语音技术所需的第三个,也是最重要的一个因素:语境。人们的对话里包含着丰富的语境信息:词汇表达的意思,代词指代的对象,还有那些被重读的单词。这其中牵涉到一系列细微的语言模式(心理语言学家赫伯·克拉克称其为“定位”),使得一句像“你懂了没?”这样的短问句,就足以暗示一段微妙、共有的经历——因为对话中的另一方清楚你所暗指的是什么。

  而这些语境,正是手机可以大展身手的场合,尤其是考虑到语音技术发展的现状与未来的话:手机知道它自己身处何处;它能够识记我在不在上班、在哪里上班;它清楚我都跟谁打过电话,谁是对我更重要的人。

  如果我用的是清一色的安卓或者iOS应用的话,手机还能掌握我的邮件信息、日程安排,还有我的兴趣爱好。于是,当我问“公交是几点来着?”的时候,手机就会听懂我说的是哪趟车、哪一站、哪个方向,甚至还包括我要将花多久才能赶到车站。事实上,说不定在我发问之前,手机里的闹钟就会自动响起,提醒我该起身出门赶车去了,还能顺带一句“别忘带雨伞哦”——就像一个称职的管家一样。

  对语境的分析,不仅有助于我们理解一词一句,更能帮我们理解其背后的“意图”。尽管在一些手机应用中,我们多多少少已经体验到了这些功能;但就语音而言,相关技术还远未成熟。至少目前看来还言之尚早。毕竟,我们不能忽视社会因素的影响:在公共场合,我们未必会和手机“交谈”,可能是因为我们不想打扰他人,也可能是因为我们不愿暴露隐私。

  但事情总是在变化的。我是美国最早用上第一代手机(摩托罗拉MicroTac)的人之一。当年我打着大哥大走在马路上的时候,周围的人看我就像看个疯子一样——即使是在MIT这样遍地技术狂的校园里也毫不例外。而现在,看到那些戴着蓝牙耳机自顾自聊天的路人,我们都已经见怪不怪了——要知道,从前这可都是疯子的标志呢。

  (作者系麻省理工媒体实验室科学家,语言+移动项目组负责人,译者:北大西洋的龙猫)设计手段。这些地毯都是按照具有上百年传统的古老编织工艺,在手工作坊里一针一线地编织出来的,大部分的订单都是按照客户的要求完成并运往世界各地的。 所有的地毯都可按照客户对大小、规格和材料的不同要求进行编织。甚至所有的样品之间也可以根据积木式系统自由进行组合。有超过1200种颜色的毛线、丝线和荨麻线可供选择。

  开业后的第一个月真是门可罗雀,团队有些动摇,我对他们说:我已做好了两年不盈利的准备,我重庆还有一套房子,最差的情况是把房子卖了。实际上,之后不到一个月我们就开始销售,不到半年营收就持平了。

  我看过一段电视访谈,讲乒乓球奥运冠军邓亚萍在国家队的时候,曾说过如果我们每天起得比别人早,睡得比别人晚,练得比别人苦,对人比别人好,我有什么理由在赛场上的表现不如别人呢!?我们也经常拿这个鼓励我们的员工,如果我们不遗余力地做好每一件事情,还有什么让我们不如别人呢!?所谓自信就是来自这样的努力吧。

  《投资者报》:《大师系列》项目是什么机缘启动的?初衷是什么?

  张启: 我们公司2009年成立,最早的展厅开在燕莎附近。2010年3月的一天,宋涛老师给我打电话:“我叫宋涛,你的地毯不错,是否可以见面聊聊?”就这么简单,当时刚开始做,信心非常重要,有一个人主动来电话肯定了我们让我非常高兴。我去了他的办公室,才知道他在中国原创设计和现代艺术圈中所做的事情和影响力,当时他身边还有几个朋友,大家建议我做现代艺术在创造地毯。我对艺术圈设计圈接触很少,完全是一个听众,但我有自信他们所说的是可以用手工地毯工艺实现的。与宋老师的第一次见面为我打开了一扇门,由他牵线,达成了我们后来与《艺术财经》杂志的合作项目。就是由《艺术财经》杂志出品人于天宏、主编顾维洁代理7位中国当代最著名的艺术家(方力钧、周春芽、刘野、丁乙、谭平、杨少斌、李磊),与我们签约联合推出《大师系列》限量手织艺术地毯 。也因此,我们将展厅搬到了751设计广场宋老师的工作室自造社的隔壁。

  《大师系列》项目的初衷是,我们希望看一下在手织地毯领域可以实现的艺术高度是什么。其中有两个特别的意义,第一是在全世界地毯织造领域第一次有这么大规模的现代艺术家群体参与地毯的创意, 如杨少斌,专门为这个项目做了一个新作品,实际上是用油画的手段设计了一张地毯,对他来说原画已经没有地毯重要了,创作的最大享受是看到作品变成地毯的惊喜。第二是在艺术圈中,很多艺术家在遇到创作瓶颈时希望寻找到新的表达方法,这也是第一次现代艺术家群体同时以丝、毛、麻来做基础材料,以手工编织为基础手段的艺术创作,艺术家们也认为这是一个寻找突破的有益尝试。虽然项目还在进行中,他们已经完成的艺术地毯在2011年保利秋拍反响强烈并引起了许多艺术品收藏家的关注。

  《投资者报》:您对《大师系列》项目的机会和风险是怎样把握的?

  张启:《大师系列》项目我们只是初尝甜头,最后一张作品是丁乙老师的,将在8月份拿到。之后,我们会在北京、上海做地毯与原作对比的群体大展,艺术家要带原作出席。艺术家各自也会举办自己的个展。如:我们曾在成都举办过周春芽的艺术鉴赏会,他把他全世界的藏家都邀请过来了。其他艺术家也会在他们画室或者特殊的场合把“毯言织造”[中国]介绍给他们的藏家群体,甚至直接达成收藏意向,这对我们是非常好的推广渠道也是最大的机会。项目完成后,每个艺术家每个设计最终会推出5件作品,由艺术家认证后提供收藏证书,价格由艺术家按照自己的实际状况来制定,销售收入我们与艺术家按照合约来分成。之前打样的产品或者被艺术家收藏,或者与艺术家协商出售,但没有正式的收藏证书。

  最大的风险在于达不到艺术家的效果,如果做得不到位就把这条路断了。我相信这个项目一定不会亏,只是赚多赚少的差别,所以我们一点都不着急,沉下心来按部就班地做。艺术家们最好提出自己的要求,我们一个个去实现,如果达不到艺术家的满意度就继续做下去。由于是第一次尝试,有些作品可能不适合用地毯工艺来表达,有的效果又超乎艺术家想象的好,我们也是在不断尝试进行作品的调整。

  《投资者报》:“毯言织造”[中国]目前的客户群体是什么样的?

  张启:无论在阿拉伯的皇室、纽约媒体大亨鲁伯特·默多克 (Rupert Murdoch) 的顶层豪华公寓、开罗四季宾馆的私人套房、石油巨头的豪华游艇,还是巴黎最著名的时装设计公司的展示厅,人们都可以看到我们的艺术地毯。现在世界不缺有钱人,但是具有独立思考和生活方式的人真的很少,很多有钱人的生活选择是一样的,无非是买房买车买包,真的没有新意。我们喜欢对生活有自己的独立思考,希望有更丰富的选择和表达的客户。我们除了代理国际知名的手织地毯地毯品牌,推出和设计自己的品牌产品之外,还为许多高端会所、酒店及豪宅项目提供专业的高端地毯解决方案和定制服务。

  未来,我们希望通过百年精工的古老编织,用地毯把艺术和设计带给更多的收藏家。

责任编辑: 房小葵
三项金融改革加快推进 或释放最大红利
随着利率市场化改革进一步推进、人民币汇率进入均衡区间、人民币资本项目可兑换改革的进一步深化,以及存款保险制度的建立和实施,中国经济正步入对外开放的转型期。
大公资讯 中国 军事 言论 图片 财经 产经 金融 汽车 娱乐 明星 生活 科技 书画 报纸 香港在线 国际 社会 教育 副刊 食品 会展 宏观 体育 健康 女人 人物 历史 专题