banner

大数据技术方案:运营商如何玩转大数据

作者: 大数据观察来源: 大数据观察时间:2016-12-20 10:19:090

如果说大数据在之前仅仅是人们口头上热炒的一个词的话,今年春节时央视《晚间新闻》启用百度地图定位可视化大数据播报的春节人口迁徙新闻,随后“百度迁徙”的上线通过春运线路、热门迁移城市等海量数据在线服务为“大数据”上演的一幕幕生动情景剧,则形象地说明了大数据走入各行各业的现实。

在盘活大数据价值这一个方向上,互联网企业已经显现出决心和速度,而拥有巨大用户资源和各类海量数据的运营商,显然也早已在大数据概念出现后就开始投入研究,但到底该怎么玩?如何基于庞大的用户数据资源优化产品结构,推出更加个性化的服务?已是运营商的当务之急。

怎么运用大数据?

对于运营商如何真正利用起大数据,思特奇大数据专家于佳琪接受CWW记者采访时提出了两个关键过程,一是运营商如何运用大数据实现有效分析,二是通过企业数据资产的归集建设企业级数据中心。

分析,恰恰是现阶段大数据发展的重中之重。

为何这样说?于佳琪解释,如果说以往的传统小数据能反映用户行为是“为什么”,那么,所有小数据集合起来的大数据反映的则是更为重要的“是什么”。

“业界现在提到大数据往往是指大数据分析,大数据出现的目的,就是为了处理现有软件架构不能完成的采集数据处理任务而产生的。数据采集、处理、存储、应用恰恰是传统数据分析的一系列过程。”

在谈到大数据分析时,也有很多业内人提到了人工智能决策支持系统。对于二者的区别,于佳琪表示,传统的数据挖掘,数据来源是数据抽样的过程,通过抽样算法进行分析,得出“为什么”结论;而大数据是通过庞大数据量,分析单元数据之间的联系,发现一定的趋势或者它们之间更深层的联系,得出“是什么”结论,而这样的结论对于大数据来说才是真正的目的。

“在大数据分析的基础上,大数据还应该是数据资产集合和应用的概念。”在不断深入研究大数据运营以及与三大运营商总部、省分公司充分沟通后,思特奇得出更精准的结论。

于佳琪解释,和电信运营商相比,互联网企业数量庞大,提大数据的思想更早一些,但除了百度、阿里巴巴、腾讯拥有庞大自身数据的企业,其他互联网企业业务垂直,数据较为单一,量也不够大,他们在做大数据分析时的劣势是数据源不够、多样性不够丰富,而数据源的量和多样性恰恰是运营商最有优势的地方。

随着手机在生活和工作中的深入应用,运营商的先天优势很明显,即可以探索到所有客户通过移动终端产生了什么样的行为,包括互联网行为和语音通话的行为。这些行为恰恰为运营商提供了庞大的、客观的数据。这样的整体数据资产归集在一起,逐步发展为应用与数据分离的状态,则是软件行业一直追求的目标。

“这样集中的目的,是最终让每一个运营商有在业务域、管理域、网络域等不同域的数据资产都能对上层应用以数据服务的方式开放,上层可以利用数据中心的管理对数据进行应用开发,而不限于某个域的开发。比如流量经营、智能管道,都可以利用这样开放的架构,对数据进行利用,进而对产品和服务进行提升。”于佳琪形象地总结了运营商玩转大数据的第二个关键阶段。

数据分析的关键在哪?

数据采集、数据处理、数据导入导出被认为是大数据做好分析的关键,但这几个基本过程也并非意味着轻松。

与传统的技术平台(小型机+存储阵列)数据采集不同,大数据中心的基础架构基本上都是分布式的架构(x86服务器),相比之下,传统技术平台带来的数据采集瓶颈一时半会还较难突破。另外,传统数据源系统的数据结构和数据库,还不能提供源源不断地实现分布式的数据导出。“但这样的问题已有了一定的解决办法,”于佳琪称, “例如在数据归集和采集上,大数据中心可以同时向很多数据源进行采集,这也是分布式架构的优势。而下一步需要解决的则是,从现有的关系型数据库里更高效地采集数据。”

谈及大数据的处理,不能不谈结构化数据和非机构化的数据的区别,几乎像男性和女性天生就特别理性和特别感性一样,可以被计算机轻松识别的结构化数据(往往可以破解为0101……代码)处理起来并不难,而大量增长的非机构化数据(以文件、图片、视频等等形式存在的,很难被破解为规律代码的数据)则有较大处理难度(是啊,人类如果能明白女人到底在想什么就可以把很多事情变简单)。

对付这样难搞的非结构化数据,通过技术将其转换为计算机能够读懂的数据,让其“束手就擒”并被有效分析,又是一项大数据发展中的重要课题。

“赋予数据生命”

无论好搞还是难搞,“数据导出的意义,是为了有效应用”,于佳琪总结数据导出的关键:一方面是把数据打包给大数据平台,赋予数据生命,让上层更好地使用它;另一方面,使用数据的最终用户是人,而不是计算机,所以让人来读懂数据分析结果是最重要的。

试想一下一个有千百行数据的报表摆在你的面前,这是大数据最终应该呈现的效果吗?NO!数据报表体现不出来数据的意义,把经过汇集、分析、导出的“理性男人”的结构化数据,最终又变为容易被理解被看懂的以图形、图像等可视化结论为主的“感性女人” 非结构化数据,才是大数据运用的最终目的。

如果你是运营商你可能会问:“我们的很多业务系统都是彼此独立的,这样怎么来应用大数据?”

于佳琪对此称,运营商一个个相对封闭且独立的“烟囱式”业务系统,是数据统一协调应用的难点,也正是大数据在运营商中应用的驱动。一个办法是,运营商建大数据中心,把这些数据都归集在大平台上进行挖掘和处理,但目前这一方面还存在一次性投资大、建设效益形成慢等风险;另一个办法是,在运营商已做好相关数据规划的前提下,把数据先归集好,采取小步快跑的方式先把大数据体系架构搭建起来,通过弹性扩展,根据需求不断扩充架构,通过应用的迁移,基于应用和数据的分离,把数据逐步归集进来,而后通过开放的数据服务平台提供给上层应用和开发者。

“两种方式各有优劣。不过小步快跑可以避免大数据投资带来的风险,数据运用从小变大,应用价值可以逐步衍伸。”

1.腾讯大数据之TDW计算引擎解析——Shuffle

2.大数据带来了什么样的本质性改变?

3.大数据是什么?为什么要使用大数据?

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限