作者: 大数据观察来源: 大数据观察时间:2017-03-12 12:11:500
什么是Big Data?
Big Data,一般称为“大数据”,这已经不是一个新鲜的概念,是一把可以适用于各行各业的万能钥匙。但现在,这个名词可以说已经到了“滥用”的地步,“大数据分析”似乎正在从一个高大上的名词变成了一个没什么新意的“噱头”。
2001年,当时在美国Gartner咨询公司担任市场分析师的Doug Laney用3个V阐述了现在主流的关于Big Data的定义,3个V指的是volume(量),velocity(速)和variety(样)。
Volume,顾名思义指的是数据的数量。许多因素都会导致数据量的增加。比如来自社交媒体中的各种杂乱无章的数据,越来越多的身体健康的数据通过传感器和可穿戴设备得到收集。在过去,对大量数据的存储是一个问题,随着数据存储成本的降低,这个问题得到了很好的解决,但其他的问题也随之出现,比如如何在大量的数据中找到自己需要的相关数据,以及如何对这些相关的数据进行分析,得出有价值的结论。
Velocity,即数据更新的速度。现在,各种数据正在以一种前所未有的速度流动着,并且需要即时的反应和处理。快速的处理数据的变化更新是大多数机构面临的一个挑战。
Variety,数据的多样性。现在,数据的类型可谓是多种多样。传统的数据库中有大量的结构化数据,非结构化的文本、邮件、音频、视频等现在出现得更多。怎样整合、处理各种类型的数据正是现在许多机构需要应对的问题。
而具体到互联网医疗领域,Big Data指的是利用相关技术来捕获和分析大量而复杂的数据,以便于改善患者的治疗效果,优化医疗服务流程。
事实上,虽然Big Data这个词从字面意思上看似乎只是与数据的数量有关,Doug Laney的定义中也提到了关于数据的数量、种类等问题,事实上并不仅限于此。Big Data同时也意味着一个机构要存储和处理巨量的数据信息所需要的技术和工具。
尤其是在医疗健康行业,临床、财政、管理、基因等各方面都会产生大量的数据,并且非常需要“Big Data”的技术来进行处理。
Big Data在互联网医疗领域的主要强调一下6大类信息:
1、网络和社交媒体的数据。比如来自Facebook、Twitter、Linkedln、博客、医疗健康论坛和智能手机APP的用户交互数据。
2、机器设备中的数据。比如来自传感器、测量仪器以及其他设备的数据。
3、相关事务数据。比如在各种半结构化和非结构化的表格中关于医保索赔和支付的相关数据信息。
4、生物特征辨识数据。比如指纹、遗传基因、笔迹、视网膜扫描、X光以及其他医学图像。
5、人类记录的数据。比如EMRs(关于EMR的详细介绍可戳这里)、医生的笔记、邮件、纸质文件等。
6、与药物作用机制相关的药品研发数据,在人体中的目的和副作用。
永洪科技
致力于打造全球领先的数据技术厂商