遨游网是如何构建数据支撑体系的?

来源:未知
引言
 
如今的遨游网在出境游、国内游市场均位居三甲之列,连续几年成长速度超100%。除了业务和经验的积累,遨游网多年来搜集用户需求和交互行为变化数据,为线下提供一套智能的生产经营决策体系。遨游网张晓磊将在这里解读遨游网是如何构建这套数据支撑体系的。
 
 
一位正在筹划旅游的消费者,在访问一家在线旅游网站时,它希望获得哪些信息呢,旅游网站又该怎么打动消费者呢?是高性价比的度假旅游产品、还是高品质高保障的旅游服务,还是透明规范的价格说明和省心便捷的预订流程等。中青旅旗下在线旅游网站遨游网多年来一直思考如何更好地满足消费者的这些需求。
 
遨游网于2005年正式上线,属于较早切入在线旅游行业的一家旅行社。依托中青旅30多年的行业优势,遨游网可提供遍及全球100多个国家和地区的旅游产品预订及度假服务,目前已拥有百万数量级的会员。对于中青旅来说,遨游网正扮演着引领中青旅整体业务从传统旅游向新形势的旅游业转型升级的先锋角色。
 
3月20日,遨游网宣布打造在线旅游从O2O平台到“遨游网+”的旅游新生态。目前,遨游网在出境游、国内游市场均位居三甲之列,挺进中国OTA领域的第一阵营,连续几年以超过100%的速度在成长。遨游网之所以这么自信地打造“旅游新生态”,除了多年在旅游业的积累与运营以及优秀的业务,还依托于遨游网能够紧密围绕大数据时代用户需求和交互行为变化,为线下各方提供更易用的技术解决方案和更智能的生产经营决策体系。
 
在主题为“数造未来”的永洪科技2015年度用户大会上,中青旅遨游网运营管理部执行总经理张晓磊为记者解读了遨游网是如何构建这套数据支撑体系。
 
中青旅遨游网运营管理部执行总经理张晓磊
 
 
1.决策层和业务人员共同的痛点
 
“包括网站、APP、门店销售、导游领队等各个前端的数据采集点,以及遨游网内部的业务系统,构成了遨游网数据中心的数据输入源,各种数据在数据中心接受清理和整合。BI是数据中心上层的应用出口,最终面向业务人员提供可视化的报表呈现和分析工具,这是一个最理想的架构。”张晓磊如是说。
 
但是,遨游网数据产出的源头多且复杂。比如,遨游网后台系统包含有很多的子系统,每个子系统都会提供一些报表,这些报表中会包含很多数据。因为隶属中青旅旗下,遨游网也要处理来自中青旅门店的数据,每个中青旅门店都会有人专门整理所在门店的数据。此外,遨游网内部各个部门也都在产生数据,比如遨游网的市场部门、销售部门、各个分公司和子公司等都在收集数据。
 
对决策层而言,最开始时在决策层那里没有一个完整的数据视图,决策层拿到的数据格式不一致,数据通常也只是局部的、片面的。对业务人员而言,他们通常并不了解数据之间的逻辑关系,日常工作也只是导出一部分数据或导出一些报表来有限度地使用数据。
 
另外,遨游网的数据库里包含有几百万的会员数据,遨游网希望能将这些会员数据通过与外部数据源的交互,补充上一些标签,这有利于对这些会员用户进行更深层次的细分。而内部数据与外部数据交互前,需要先在内部进行整合。
 
最初,张晓磊用SSRS(SQL Server Repotring Services)附带的数据报表、鉴定报表、数据展示的功能和一部分数据分析的功能,把之前散落在各个系统中的报表整合到同一个系统中。这让决策层感到惊喜,终于有一个统一的数据出口了。
 
但是不久,决策层在这个基础上又产生了新的需求,那就是希望数据报表的生成更科学、使用体验更优秀。“比如,遨游网拥有大量的客户数据和来自不同业务的订单数据,决策层希望这些数据能够根据任意分析需求进行展示。所以遨游网在搭建自己的旅游数据库和分析系统时,需要根据分析需求范围,清晰地梳理客户的分析指标。”张晓磊举例说。
 
此外,运营人员和营销人员希望更方便地查看网站的日报和周报,也希望通过业务目标和实际达成数的对比实时洞悉业务状况。同时,他们也希望包括酒店、机票、签证等单项报表的数据在后台能够一目了然,以准确分析自己所在领域的数据,报表的响应速度也最好能控制在10秒以内。
 
 
2.敏捷BI的机会来了
 
当张晓磊第一次接触到国内一家敏捷BI产品——永洪BI时,完全被吸引到了。在试用阶段,张晓磊的体验是,永洪BI的联动展示功能会让用户感觉非常好。通过使用永洪BI,遨游网的业务人员将数据源整理好后,再通过简单的拖拖拽拽动作就能生成可媲美Excel,甚至超越Excel体验的报表。
 
张晓磊几乎是一气呵成地述说了对永洪BI的感受:永洪BI上可以自定义很多筛选条件,业务人员想看自由行的、想看团购的、想看机票或者酒店、想看各个部门或销售渠道的报表都可以,一个报表就能实现多条件下的展示效果。
 
还有一点,就是用永洪BI生成报表的速度非常快,遨游网数亿条数据几乎可以说是秒级响应,性能非常强大。以前用SSRS做报表,如果是一个很复杂的报表,比如一个报表里包含三个表格,很久都显示不出来。现在,业务人员在报表里面放七、八个表格,甚至设置了多纬度的交叉,也能很快生成出来。
 
2014年年底,在试用了很短的一段时间之后,遨游网很快决定引进永洪BI。目前,遨游网的一些业务部门已经在使用永洪BI了,员工使用之后的反馈说,用了这个之后,再也不想用SSRS做报表了。”张晓磊补充说,“用SSRS做报表,第一不能联动,第二在导出成Excel时,数据格式非常不规范,展现形式也不美观。但永洪BI不一样,在永洪BI上你可以直接截图,也可以直接导出成Excel,从永洪BI导出到Excel,格式就非常规整。”
 
同时,永洪BI已经实现了分析报表的移动端阅览,支持所有主流移动设备和操作系统,能让决策层和业务人员可以随时随地在移动终端上查看数据报表。这是一个非常重要的需求,因为遨游网的决策层或业务人员都喜欢在开会时,直接打开移动终端查看数据。
 
 
3.构建一体化的大数据平台
 
在张晓磊看来,“数据支撑体系”这个词的重点是“支撑”二字。一期的BI项目建设给张晓磊很大的信心,但对于张晓磊构想的“数据支撑体系”来说,这还不够完整。
 
张晓磊认为,整个数据支撑体系中,支撑任务还要由一个大数据平台来承担,因此,遨游网正计划构建一个统一的大数据平台。而这恰与永洪科技近期发布一站式大数据分析平台Yonghong Z-Suite V6.0的初衷不谋而合。
 
等到大数据平台建成后,遨游网可以基于这个平台更容易地构建更多的应用系统。大数据平台的核心是数据中心,数据中心将支撑两部分工作,一部分是非结构化的数据存储,一部分是结构化的数据存储(数据仓库)。目前,遨游网搜集的数据有非结构化数据也有结构化数据。不过,张晓磊认为结构化数据更有用,遨游网也会基于结构化数据存储延伸出各种应用,比如CRM系统。
 
CRM可以与数据中心进行直接交互,也能与永洪BI实现直接交互。比如通过BI的分析,遨游网会给CRM中的客户打上流失客户、高价值客户、容易流失的客户等标签,然后返回给数据中心,数据中心再把这些数据和标签传送给CRM。
 
“在没有数据中心时,BI需要从各个系统中去拿数据,这个过程要通过接口去解决,解决的过程非常痛苦,因为要写很多数据整合的脚本。但有了数据中心,BI就不需要从各个业务系统中去拿数据,只对接数据中心就可以了。”张晓磊如是说。
 
遨游网的业务人员在使用CRM系统选择数据时,有了两个可以选择的应用场景。一种应用场景是选择单一客户,销售人员和呼叫中心的客服人员,输入某个客户的手机号,就会出现“高价值的”、“很快就要流失了”、“特别喜欢海岛旅游”、“经常两人结伴出行”等这样的一些标签,这些标签就会让销售人员和呼叫中心的客服人员对这个客户有一个立体的感觉,也更容易让销售人员成单,让客服人员提供更合适的服务。比如,通过标签,销售人员会很容易判断这名客户是个年轻人、经常两人出行,所以就可以附加提问是不是要订双人间的房间?要不要送花服务等,以提供个性化的服务和实现销售额增加。
 
另外一个应用场景是批量的选择用户,这个场景营销人员应用较多。营销人员在不同的时间,会对客户进行一定的维护工作。比如,一些客户已经6个月没来遨游网浏览和交易了,遨游网就会从这类用户中先选择高价值的客户有针对性的进行精准营销。
 
此外,永洪科技也可以提供一些基本的数据挖掘算法。虽然一些客户公司的技术人员可以自己去开发数据挖掘算法,但这对开发者的要求很高,比如要求开发者要懂统计学、R语言,还要对业务流程有足够了解。进行数据挖掘后出来的结果也要从各个角度去评估可用性,这又是一个很复杂的过程,需要大量人力的投入。而客户通过使用永洪BI集成的聚类、回归等基本算法,再通过一段时间对算法进行训练后,基本就能实现数据挖掘结果的可用。

永洪BI
更敏捷、更快速、更强大

申请试用
Copyright © 2012-2023开发者:北京永洪商智科技有限公司版本:V10.0
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限