搜索的未来:从僵硬学习到人机自然对话

2013-03-17 08:03:09  来源:新浪科技

谷歌研发主管约翰·博伊德在用户体验实验室中工作

  谷歌研发主管约翰·博伊德在用户体验实验室中工作

  导语:国外媒体今日撰文指出,“对话搜索”能够理解问题背景,并具有其他诸多“独门绝技”,正日益受到业界关注,可能会成为谷歌与微软争夺的下一个战场。也许一两年以后,用户在与搜索引擎对话时,感觉就像与人说话一样自然。

  以下为文章主要内容:

  让搜索更自然

  只要一谈到所谓的“对话搜索”(conversational search),谷歌搜索业务主管阿米特·辛格尔(Amit Singhal)总喜欢举这样的一个例子:掏出手机,然后说,“贾斯汀·比伯(Justin Bieber)多大了?”紧接着又问,“他有多高呢?”

  辛格尔最近在采访中透露,对于代词以及指代消解(Anaphora resolution)的使用,谷歌已经有了基本的思路。所以,辛格尔问完上述两个问题以后,Android机器人就会明白,第二个问题中的“他”,就是指第一个问题中的专有名词——贾斯汀·比伯。

  辛格尔表示:“过去,搜索总是一锤子买卖。但现在,‘他’指的就是‘贾斯汀·比伯’。除了谷歌,还没人能做到这一点。今天,你看到的是两句对话。在今后的一两年内,如果我们在搜索中出现更为宽泛的对话,我并不会感到吃惊。也就是说,用户在与搜索引擎对话过程中,感觉就像与人说话一样。”

  多年来,在线搜索一直在向用户灌输一种固有观念,学习老套生硬的语言:输入需要搜索的信息,将各个关键词分隔开,每次搜索都从头开始,用引号来表示一个短语。给人感觉这就像是在学习一门外语,即有些人所称的“Searchese”。谷歌和其他公司近来都在努力实现一个目标,那就是让搜索变得更为自然,让对话更多地出现在搜索当中。

  理解问题背景

  所谓“对话搜索”具有以下几个特点,让搜索能够理解问题的背景,做出合理的猜测;能够接受语音输入;能够解析同音异义词,适应移动环境;能够在不同的设备上识别出同一位用户。

  这些概念源于20世纪90年代,最早是在诸如AT&T实验室“沃森”(Watson)和麻省理工学院“木星”(Jupiter)等研究项目中提出的。“木星”项目是一种移动服务,能够明白用户有关天气的各种问题。

  表面看起来,对话搜索似乎属于界面之类的问题——只要找到能让人访问相同信息的更便捷途径即可,但实际上,技术人员仍需要深入理解人工智能技术,以及计算机以外的领域。另外,与谷歌“知识图谱”(Knowledge Graph)等其他最新搜索形式相比,对话搜索会更容易使用。

  微软必应搜索业务主管斯蒂芬·韦茨(Stefan Weitz)也表示,必应正在多个领域发力,试图让搜索变得更为自然。例如,在语义搜索项目Satori以及Local Scout等个性化应用中,微软一直在努力消除搜索问题的歧义。

  韦茨说,“当大家在讨论对话搜索时,其实是在讨论如何能理解你之前所说过的事情,或你赶赴的目的地。我们面临的真正挑战是,如何利用网页,来解构作为超高清晰度实体代理的数字世界。”

  韦茨举例说,必应现在可以回答一些高难度问题,如“汤姆·克鲁斯(Tom Cruise)和独角兽的电影”,“世界上最高的山”等,虽然它还需要一段时间思考,但最终会给出《黑魔王》(Legend)和“珠穆朗玛峰”这样的答案。

  十年磨一剑

  Google Suggest或许是谷歌发布的第一款对话搜索服务,该项目最早始于2004年,当用户在搜索引擎中输入关键字时,谷歌就会自动给出一些常用的建议词,Google Suggest是即时搜索Google Instant的前身,后者在2010年推出,能够为用户搜索的问题提供可能的答案。

  谷歌研发主管约翰·博伊德(John Boyd)目前正带领着一个团队,邀请用户体验谷歌的新产品,并根据用户反馈的结果,评估他们未来需要的服务。

  博伊德表示,他当前工作的一个特别之处是,那些受邀来谷歌园区配合他们研究和调查的志愿者,往往没有发现谷歌究竟是在测试什么东西。当这些人参与Google Instant测试时,他们甚至以为此次测试的新东西是位于左侧的老版导航栏,而不是就出现在眼前的搜索结果。

  由于没有前后对比,即使是在用户每天使用的网站上,他们也很难认出那些是新东西。不过,这也并不一定就是坏事。博伊德希望对谷歌搜索的功能循序渐进的改进,让人们逐渐从学习行为,转移到自然的对话中去。

  避免画蛇添足

  博伊德在5年前加盟了谷歌,之前曾在雅虎担任搜索部门主管。他说,“谷歌真的很神奇,但由于我们之前一直秉承顺其自然的原则,结果却让人们形成了一些坏习惯。”例如,有人认为完全以大写输入关键词时,搜索结果可能会更贴近用户需要,但事实并非如此。

  据博伊德介绍,这就是心理学家斯金纳(B.F. Skinner)提出的“盲目性学习”(superstitious learning)的典型例证。一些用户往往输入双引号,试图让谷歌搜索引擎明白他们真正想要找的东西。但这其实是画蛇添足,引号在搜索中是多余的,在一些情况下,甚至会将重要结果排除在外。

  搜索引擎需要能够更好地了解我们的思维,而不是每一次搜索都要从零开始。

  去年,谷歌曾对150人进行了调查,通过一款定制化移动应用,在一天的不同时段对他们进行提问,问他们想要知道什么事情。一位女性参与者想要知道的信息包括,“我怎样才能在8天里赚200美元?”、“起诉一个人需要多长时间?”、“什么是弦理论?”、“怎样做才能消除牙齿的疼痛感?”、“如何才能找到保释代理人?”与此同时,一位男性参与者则表示,他的汽车出现了故障、小狗身上有跳蚤,烟雾警报器需要重新安装,想给孙女买一辆车。

  这些问题都事关生活的琐碎事情,但无论大小,都能帮助谷歌更好地理解搜索机制,进而更好地帮助用户。例如,上面那位女士问的问题都围绕“监狱”这个主题,这样谷歌搜索起来更为方便;而那位男士的问题主题则相当繁杂,但或许谷歌能帮他理顺各种关系并付诸实施。

  谷歌两大利器

  在搜索领域,谷歌目前正专注于两个方面:语音搜索,以及面向Android平台打造的智能个人助理Google Now。语音搜索在用户驾车或双手忙碌时尤其有用。博伊德认为,语音是一种自然的对话形式。

  与此同时,Android版Google Now应用能帮助用户记录他们的生活习惯,基于用户搜索历史,向他们显示一些信息,如比赛比分、天气和路况等。该应用最近又增加了新的功能,当用户在指定时间进入某家电影院或飞机场,他们之前购买的的电影票以及登机牌就会显示出来。

  Google Now产品主管巴利斯·古尔特金(Baris Gultekin)最近在接受采访时表示,“我们的用户在需要帮助时,面临的情况各不相同。我们的目标是能够预测出用户所有的需求,并在他们需要时给出这些结果。这是一项艰巨的任务。我们现在基本上专注于向用户获得他们需要的信息,一旦用户需要这些问题的答案,还没等他们问,我们就会呈现出来。”

  对于一部分用户而言,这些都是重大而令人兴奋的技术进步,但若想实现与电脑之间真正随意的对话,恐怕还有很长的路要走。Google Now理解的信息还非常有限,对世界的感知仍需要进一步加深。

  业内人士指出,尽管语音识别相比以前已有了很大进步,但他们仍会不断陷入“Searchese”的困局当中。在这种情况下,他们不得不清楚地发出每一个字母的音,同时大声说出标点符号。所以说,我们距离世界上最自然的搜索方式还十分遥远。

责任编辑: 房小葵
三项金融改革加快推进 或释放最大红利
随着利率市场化改革进一步推进、人民币汇率进入均衡区间、人民币资本项目可兑换改革的进一步深化,以及存款保险制度的建立和实施,中国经济正步入对外开放的转型期。
大公资讯 中国 军事 言论 图片 财经 产经 金融 汽车 娱乐 明星 生活 科技 书画 报纸 香港在线 国际 社会 教育 副刊 食品 会展 宏观 体育 健康 女人 人物 历史 专题