阿里玩大数据:从“淘数据”到两条腿走路

2013-04-25 11:14:00  来源:经济和信息化

阿里“玩”大数据:从“淘数据”起步 两条腿走路

  500多年前哥伦布做环球航行时,最想得到的就是航海地图,要不然他不会把美洲大陆当成印度。

  当大数据开启一个时代时,阿里巴巴集团(下称阿里)从海量交易数据中挖掘有价值的数据,犹如在大海中航行,马云的鸿鹄之志也是那张航海地图。只是哥伦布的目的地是印度,马云的目标是大数据。

  马云宣称平台、金融和数据是阿里未来的三大战略方向。其实,“阿里未来本质上是一个数据公司”,电商越来越离不开数据,金融的核心也是数据。阿里设立首席数据官,并把首席数据官陆兆禧升任CEO,传闻将收购移动APP数据公司友盟等,这些都显示马云的大数据战略萌动生芽。

  在几乎全球所有公司都还徘徊在大数据门前时,马云纵然有大数据的宏韬伟略,在具体操作层面也只能摸着石头过河。

  完成25个事业部战略调整后,阿里巴巴成立了数据委员会,由淘宝网商业智能部负责人车品觉出任首任会长。这位曾经在微软、ebay出任产品经理,在支付宝、淘宝主管数据业务的香港人,大半生都痴迷于数据迷宫。

  “我之所以来淘宝就是喜欢它的数据,就希望好好梳理下数据。”车品觉谈到数据时异常兴奋,在接受《中国经济和信息化》记者3个小时采访后,他还要给同事做有关大数据的培训。此时,已经是晚上10点多。

  车品觉是马云大数据战略棋局中已经过了河的卒子,他肩负着为阿里寻找开启大数据之门钥匙的重任。马云给了他异常宽松的工作环境,甚至没有具体的KPI考核。在接受《中国经济和信息化》记者采访时,他对所谓大数据赢利模式之类的问题并不看重:“阿里跟别人不一样的地方就是愿意尝试不同的产品,连领导都不能控制手下人到底玩什么。一帮很爱数据的人玩一堆产品出来,偶尔能出现如阿里金融这样的产品就很好,允许他们玩就是允许差异化,做数据如果急于现在赚钱就会失去机会。”

  “玩数据”其实并没有这么简单,特别是车品觉出任阿里数据委员会的安全责任人之后,他每时每刻都处在忐忑不安中。他认为,今后一段时间,数据质量、数据安全以及数据化运营将是阿里必须翻越的三座“大山”。

  从“淘数据”起步

  2003年的淘宝还是个“小朋友”,一个不起眼的购物平台,远不如当时的易趣(eBay)名气大,甚至还有人预言淘宝会在18个月内夭折。

  18个月后,淘宝让预言夭折了,淘宝交易量几乎呈指数增长,在2006年上半年注册用户数超过了易趣。从某种程度上看,易趣的存在是淘宝数据业务起步的外部动力。为了与易趣的销售额对比,淘宝开始搜集每天的成交额、用户访问数等数据,从起步就增强了对数据的粘性。

  淘宝严格意义上的第一个数据产品是“淘数据”,说白了这就是一个经营数据报表。“每个公司都需要了解经营业务状况,淘宝业务大了也需要看经营状况做未来决策,‘淘数据’就是为内部报表服务的一个工具,大约是淘宝成立两年后的2005年开发的。”淘宝商业智能部一名元老级数据分析师告诉《中国经济和信息化》记者。

  这一年,淘宝迎来第一个数据分析师。半年后,淘宝建立第一批数据分析师队伍,并成立第一个数据部门——商业智能部(BI)。他们每天的工作就是把日成交额、访问用户数等数据统计之后放入报表,让淘宝决策层能够清楚了解业务状况。

  此时的淘宝不再是一个卖家挂货、买家购物的购物平台,开始关注数据产生出来的意想不到的价值。当然,马云当时还不至于把数据提升到公司战略高度,但他敏锐地发现,“数据非常重要,未来的世界是数据的世界”。

  外界广为流传这样一个故事:2008年,中国众多企业受国际金融危机重创,而阿里根据买家询盘数急剧下滑,及时向中小制造商提供预警信息,为应对国际金融危机做好准备。虽然车品觉把这次经济预警归结为偶然事件,但阿里确实在数据分析中尝到了甜头。

  随着数据越来越多,原来的处理方式已不能进一步扩展,淘宝在用传统数据库方法处理数据问题时遇到了麻烦。

  “我们早上9点上班要看数据,但传统数据处理技术很难在9点之前让所有人看到结果,数据处理的时间成本非常高。再这样发展下去,就扛不住了。”前述分析师告诉《中国经济和信息化》记者。

  这一问题触发了淘宝第一次技术层面的架构变迁,把以Oracle为主的传统数据库迁到了大数据技术Hadoop数据库上,正式开启阿里的大数据实践应用。

责任编辑: 岩实
三项金融改革加快推进 或释放最大红利
随着利率市场化改革进一步推进、人民币汇率进入均衡区间、人民币资本项目可兑换改革的进一步深化,以及存款保险制度的建立和实施,中国经济正步入对外开放的转型期。
大公资讯 中国 军事 言论 图片 财经 产经 金融 汽车 娱乐 明星 生活 科技 书画 报纸 香港在线 国际 社会 教育 副刊 食品 会展 宏观 体育 健康 女人 人物 历史 专题