banner

从“百度迁徙”浅谈GIS分析大数据(附下载)

作者: 大数据观察来源: 大数据观察时间:2017-02-19 15:24:390

作者:李勇单位 : 华中农业大学资源与环境院 GIS 1202

    摘要:“春运”被誉为人类历史上规模最大的人口大迁徙。百度公司在2014 年春运期间推出了百度迁徙项目,首次启用百度地图定位可视化大数据播报了国内春节人口迁徙情况,引发了巨大关注。该项目利用百度 LBS(基于位置的服务)定位数据进行计算分析,展现春节前后人口大迁徙轨迹与特征。“百度地图春节人口迁徙大数据”是 LBS与大数据概念结合产生的产品,对中国卫星导航与位置服务产业的发展具有启示作用。【1】GIS空间分析方法可以提供基于位置的服务,合理利用并发展GIS空间分析,这必定推动这一服务产业的发展。本文将浅谈百度迁徙地图中涉及到的空间分析,以及空间分析在大数据中的应用。    一、百度迁徙百度公司2014年1月26日凌晨推出百度迁徙服务项目,并且被央视栏目多次报道。百度迁徙是运用大量数据分析计算并创新可视化的方式,可以让人们直观的看到中国春节期间人口迁徙的特点轨迹。其实对于这种创新可视化方式是指针对大数据的可视化,传统的大数据分析计算结果是以表格或者文字方式呈现出来,而对于大众百姓来说,这并不够直观,而百度地图通过结合地图的形式将大数据分析结果基于地理空间位置进行可视化,同时实时动态更新,在时间和空间上都有所显示,使人们更加清楚的了解数据分析结果,在全国整体上来看,我们是可以看到人们人口的来源以及人口主要的去向动态的。

【2】 百度迁徙    图 1    百度通过云计算平台数据处理能力,加上精准定位,能实现全面、即时反映人口迁徙状况。网民访问“百度迁徙”主页,可以直接看到全国包括铁路、公路和航空在内的线路,当前全国春运最热的线路,最热门的迁出城市、迁入城市。用户还可以输入一个城市名,查看到这个城市最近 8个小时的迁徙情况,看到这个城市迁入、迁出最热城市的排行榜。这些数据可为相关部门提供参考,并帮助这些部门对资源进行优化配置。“百度迁徙”的 LBS大数据来自于百度地图 LBS开放平台,该平台为数十万款APP提供免费、优质的定位服务,是中国 LBS数据源最广的数据和技术服务平台。2013年3月份统计,国内移动通讯用户达到了 11.46亿,而基于百度 API的应用程序位置信息请求数量达到每日 35亿次(截至 2013年 8月统计),也就是说平均到每一个用户,我们每天都会请求差不多 3次位置数据,这样庞大 的数据量为百度迁徙提供了基础。“百度迁徙”的定位原理即为百度定位SDK,当应用程序向定位SDK发起定位请求时,定位SDK会根据应用的定位因素(GPS、基站、WiFi信号)的实际情况(如是否开启GPS、是否连接网络、是否有信号等)来生成相应定位依据进行定位。

    如此大量的定位数据积累之后,“百度迁徙”中每一天都可以积累相当的位置信息。百度迁徙本身就是基于地理空间位置的大数据可视化的一个新面貌。作为一项创新项目,“百度迁徙”可以通过对大数据的创新应用服务于政府部门帮助其科学决策,赋予社会学等科学研究以新的观察视角和方法,同时,为公众创造近距离接触大数据的机会,科普数据价值。【3】    二、 GIS空间分析与大数据时代百度这种结合定位系统与大数据平台的结合对于海量地理空间信息的商业应用以及支持政府决策做了一次很好开端,GIS的发展也必将促进基于地理空间位置的大数据时代的发展。麦肯锡将大数据定义为:无法在一定时间内用传统数据库软件工具对其内容【4】进行抓取、管理和处理的数据集合。较为统一的认识是大数据有四个基本特征 :数据规模大(Volume),数据种类多(Variety),数据要求处理速度快(Velocity),数据价值密度低(Value),即所谓的四 V特征。【5】可以说是继云计算,物联网之后 IT行业又一次颠覆性的技术革命,大数据未来对于大数据的方向不在于数据挖掘技术本身,而在于数据应用的商业化,从数据背后挖掘盈利模式、嫁接整合数据和商业资源成为关键。正如百度地图这次推出“百度迁徙”一样取得成功一样。而地理空间分析可以提供对基于地理位置的空间分布数据进行存储、管理、分析、处理等功能,GIS的奠基人之一 Goodchild M F曾指出”地理信息系统真正的功能在于其利用空间分析技术对空间数据的分析”。GIS空间分析使 GIS超越一般空间数据库、信息系统和地图制图系统,不仅能进行海量空间数据管理,信息查询检索与量测,而且可以通过图形操作和数学模拟运算分析出地理空间数据中隐藏的模式、关系和趋势,挖掘出对科学决策具有指导意义的信息,从而解决复杂的地学应用问题,进行地学综合研究。之所以说 GIS的核心是空间分析,从 GIS的功能定义中我们就可以看出,GIS的一半功能是分析数据,甚至可以说,GIS处理地理数据的目的也是为了分析数据,空间分析使得 GIS区别于一般的信息系统,不仅仅是简单的数据存储,管理等功能,也是评价一个地理信息系统的主要指标(郭仁忠,2001)。对于空间分析与大数据的结合,主要体现在分析数据集拓扑、几何或地理编码性能技术的统计方法。数据通常来源于采集地址或地理坐标等位置的地理信息系统。

    应用实例包括空间数据的空间回归(例如,消费者是否愿意购买与位置相关的产品或者说特产)或模拟(例如,如何将制造业的供应链网络分布到不同的地点)等等。简单的 GIS与大数据的结合可以是基于地理位置数据的空间分布可视化显示、海量地理空间位置数据的分布式存储、大范围的地理空间数据的采集等等,以及与地理位置有关的大数据挖掘技术。因此我们可以看出,GIS空间分析技术与大数据的结合点就是定位数据,这也是 GIS的特点-处理与地理空间位置有关的数据。海量的定位数据中隐藏着大量信息等待挖掘,结合云计算、海量数据处理技术,把数以亿级甚至数以千亿级的数据实时、安全存储下来,再结合地理空间以可视化的方式展现给用户,这种直观的感受带给用户的冲击力是显着的。对于政府和公共机构而言,这些定位数据可以做地铁站流量图分析,通过数据分析掌握人群密度,查看哪个出口人多,哪个出口人少;可以应用到商圈和旅游景点分析,了解哪些超市、购物中心、电影院、旅游景点等人非常多,哪些人流量不是很大,这些数据可以帮助政府和公共机构优化资源配置。而头脑敏锐的商人通过“百度迁徙”这个产品会充分挖掘隐藏在其背后的巨大商机。最近在全国流行的“快的打车”和“嘀嘀打车”就是阿里巴巴公司和腾讯公司将定位导航结合移动支付创造的的两个成功的商业应用案例。    大数据时代地理信息系统数据极大丰富数据已经成为一种类似水电气等立等可取的基础设施,研究人员也会发现在 GIS中集成空间分析程序将会有助于揭示空间分析的一些基本问题,同样未来还会有更多的空间分析功能会被开发成软件模块以便自如地进行空间点线面格网数据的分析和计算,大数据时代,空间分析的应用方式也会有很大改变,如面对 PB级别的大数据,数据本身无法全部下载到本地进行分析处理,因此需要发展一种”数据不动软件动“的处理方式进【6】行在线空间分析。    三、总结    大数据时代数据的精度越来越高空间数据也越来越丰富,这对与 GIS的空间分析应用的发展是一个难得的机遇。在实际应用中空间分析对于交通建模,位置建模,商业地理学,土地利用规划,城市规划,经济社会发展规划等有着重要的应用价值,可用于区域空间综合评价、资源空间优化配置、突发事件优化管理以及空间决策支持等。大数据的应用将显着促进地理信息技术的发展和应用,【5】空间大数据更多的需要处理数据的空间性,时间性,流动性,多元性等多种因素混合导致的复杂大数据,未来通过空间分析大数据充满了挑战,也充满了机遇,作为一个 Giser,任重而道远。

    此文是中国大数据读者李勇的投稿!转载请注明出处!

点击免费下载:从“百度迁徙 百度迁徙 ”浅谈 GIS分析大数据

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限