banner

要重视医药大数据的质量

作者: 大数据观察来源: 大数据观察时间:2016-12-31 19:59:210

现在是大数据时代了!都这么说。

因为云计算,云存储......因为各种新的计算方法、网络抓取工具、信息碎片化的格局,因为自媒体,因为医药大健康......品牌,需要更多、更大、更广泛的覆盖。

参加过很多次的医药健康大数据相关的论坛、研讨之类的活动,台上的很多发言者不是谈他们的技术如何先进,如何鹤立鸡群,就是谈他们的大数据监测、分析的如何准确、如何预言成真,感觉跟药品推介会有点相似,广告成分的居多。可听来听去,很多事情都还是云里雾里,真应了“云计算”这个概念。医疗机构信息化建设、医药企业的数据化管理、各种“云”的流动......处方数据化,各种“G*P”的运行,电商和物流管理.....大数据,真的很管用。

医药界国际上有IMS,用大数据或者用很多数据库的数据,单纯卖卖行业分析报告,就不得了了,于是乎,国内诞生了诸多公关、咨询、科技服务类的公司来拷贝IMS的经营模式,弄一大堆数字,然后按照某些要求开始做分析,做报告......数字,真的很吃香。

值得注意的是,不管怎么计算、怎么分析、怎么出报告......数据这东西,不用就是一堆散在的数字,硬要拉郎配,也能有一些所谓的关联结果,但这些关联,仅仅是数据上的一种运算结果而已,没有什么现实意义。

有数有据,才是数据。如今,网络上的信息海量,通过很多抓取方法将各种关键词、数字等搜集起来,按照某种组合排列方式进行叠加,或是某种算式进行归类、梳理和计算,似乎可以得出很多的N多结果。搜索引擎就是一个典型的范例,可你要真的就依赖于搜索引擎,不管你搜索网页、还是搜索新闻,或是学术,在关键词不是绝对的唯一,或是多个关键词的搜索结果,就会给你一个错觉,那显示有多少条的数字,其实已经饱含了水分。

在医药行业,在健康领域,用大数据做行业排名、产品排名、学术排名......已经是一种时尚,单纯的搜索,就得出排名结果,或是所谓能从论坛、BBS里或是电商数据中巴拉巴拉出大量数据来的排名,似乎就可以挂上全网数据的大数据应用来头了,可,真的能巴拉巴拉出多少论坛、多少电商、多少时间段、多大的网站范围,他们之间的数字或关键词的含义是否一致,如何挑选合适的和剔除无用的干扰?

做统计分析的人都知道要用于分析的数字,是有特定定义的。不管什么统计分析方法,都有对数据的假设前提和数字采集的基本框架要求。而云计算时代,似乎都可以忽略不计。这样的大数据分析、大数据分析结果,你信吗?数字大到你无法想象,就可以弥补和填平数字之间的一些差异?如果你是这么看待大样本,那还真不是这样的概念哦。样本,就是样本,多大的样本也必须符合样本的定义。不然,大数据就是一大堆、很大一堆的数字,不是样本,不能分析。

金杯银杯,不如口碑,在媒体覆盖面越来越广、影响力越来越深的情况下,自媒体成为“手机一族”几乎形影不离的今天,口耳相传,已经被微信朋友圈子给拓展了,朋友圈子里的口碑影响力越来越大,而基于朋友圈的大数据来反映的口碑,更是一种新的品牌塑造、评价和变化的重要因素。

2014年底,我国《广告法》的修订进入倒计时,企业和产品的广告传播将发生大幅度调整,传统的广告代言,利用明星和社会公众人物的影响力来影响口碑的情形会有很大变化;政府部门、社会组织主办的各种金杯银杯奖项,各媒体、企业自行设置的各种杯、各种奖,也在新形势下有了诸多限制,其市场地位的影响和传播功效也大打折扣。在网民时代,在移动互联网时代,人们认识和购买产品,了解企业和认可品牌,一方面更加重视熟人之间的口耳相传(微信营销),另一方面就是网络口碑。

不管数据如何纷繁复杂,不管大数据分析如何时髦创新,但运算方法、数据资源和质量、考虑的维度以及分析的视界高度,都是值得非常仔细仔细的研究和实践的。

大数据加自媒体时代,各种分析和各种结果都甚嚣尘上,数据质量,反而容易被忽视。就跟淘宝上商品极为丰富,在家点点键盘就可以轻松收到购买的物件非常方便一样,它的问题也是方便,是造假的方便和监管的不方便。在国家工商总局的调查结果显示其正品率不到40%。大数据分析的质量过硬结果,有这个比例吗?

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限