banner

企业管理的挑战:非结构化数据分析

作者: 大数据观察来源: 大数据观察时间:2017-06-22 12:02:240

北京8月23日消息,据国外媒体报道,超市内部怎么设计才能最大限度地提高销售额?表面上,这个问题似乎与数据科学家挨不上边。消费者行为难以量化:因为不可预测并且似乎没有理由。为什么一些购物者在某些通道里呆了比其他人更多的时间?为什么每个购物者在店内行走的路线都不相同?为什么有些商品在上午畅销,但在下午根本卖不出去?

寻找这些问题的答案要靠非结构化数据分析--由于非结构化,这些数据无法整齐划一地输入到数据库或电子表格的行列中。绝大多数商业信息都是以非结构化数据形式存在。这些数据可能来自电子邮件、备忘录、视频、客户来电、推文、Facebook的消息和博客,本身就难以量化。因为非结构化,这些数据也更难以大量分析,但实际上,部分因为对大数据兴趣的日益浓厚,非结构化数据量最近也在激增。

对于企业来说,处理这一堆混乱的新信息可能遇到挑战,但也是巨大的机会。据凯捷咨询与《经济学人》信息部最近联合进行的研究显示,大部分高管人员(58%)依赖非结构化数据分析做出业务决策。企业分析的数据越多,就越能获得有价值的见解。技术供应商谈论的是非结构化数据的隐藏价值。他们认为,理解非结构化数据是数据分析的最新前沿课题。

找到一种利用所有这些谈话、PowerPoint演示稿和推文获得信息的途径,企业可从大数据中获取真正的价值。但很多供应商是从错误的地方开始。业务项目不应从从访问数据开始,首要任务应是确定要回答的问题。谁是我最好的客户?该产品为什么会失败?这些都是业务问题。但技术供应商却在寻找技术问题如:我们如何挖掘数据?我们怎样才能大海捞针式地找到有用数据?的答案。

理解非结构化数据只有一部分与搜索有关。真正的价值来自将非结构化数据与其他结构化信息联系起来分析。怎么做呢?想想一家公司会如何利用所有员工的知识。一个组织中会发生数以百万计的不同交流,这些交流包含了大量的有价值资料,但你怎么集中在最相关的信息上,并将其转化为真正见解?

第一步是要找出你要解决的问题,这可能决定销售流程的效率。我们如何利用更少的资源做销售?在你分析PB级数量的非结构化数据,从电子邮件、职员博客到语音通话时,首先你必须确定其中重要的结构化元素,目的是确定可说明问题的特定交流。但为了确定谁和谁谈论哪些话题,你需要从准确标注“主动谈话人”、“谈话内容”和“被动谈话人”开始。

确定“主动谈话人”要知道其用户名、登录名和其他与具体职员有关的ID。如果在现实中这些信息都来自同一个人,获取5个不同人的数据没有用。第二,你必须能理解你分析的话题。要成功分析必须使内容结构化。第三,你的客户是谁?你是否使用了正确的词条获取与该客户有关的所有信息?您必须确保能获得每个部门、缩写和控股公司的所有参考资料。如苏格兰皇家银行和国民西敏寺银行?英国天空广播、天空或新闻集团?

然后将这个完整的结构化框架与从你选择群组中大量不同对话收集的非结构化信息结合。可能出现这种情况:销售额最大的公司也是该公司员工谈论最多的公司,在这种情况下,内部沟通是良性的。但同样,人们谈论最多的客户并不能带来足够的收入,在这种情况下,你就能发现销售流程中导致低效率的关键。

目前很多厂商将非结构化数据作为单独的技术挑战对待。但只有在确定了相关的重要结构化信息时,才能理解非结构化数据。如果一个职员是负责某个特定话题95%的沟通,无疑将使他或她成为这个问题的核心信息中心。但如果这个模式不能找出证明各种不同的登录信息和身份信息属于同一个人的基础结构化信息,你可能无法看到这个事实。

如果数据等同于噪音,就不可能准确做出决策。因此,我们应如何使用非结构化数据为超市设计最好的布局?零售公司、主题公园甚至警察部门使用的是群体分析,预测人群在某些情况下可能的反应。在超市中,分析视频确定购物者狂商店的路线,记录他们在哪停过,什么地方将商品放入篮子,在遇到人多或死角时如何应对。

然后将非结构化信息与结构化数据结合--例如,某些商品在货架上的位置或收银台--制作一个购买者行为的完整数据驱动图。一旦这个信息就位,就可能根据各种不同情况对未来销售进行预测。是否将山羊奶酪换个位置,买酒的人会更多?如果将更便宜的啤酒移到通道后面,人们会购买更多高价啤酒吗?如果面包房附近出现拥堵,超市会出售更多的面包吗?

使用这种结构化和非结构化数据组合,可以找到这些问题的答案,而这些问题又是成功预测分析的基础。但只有建立完整的可用数据图,才能做出准确的决策。

(责任编辑:蒙遗善)

banner
看过还想看
可能还想看
热点推荐

永洪BI
更敏捷、更快速、更强大

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.1
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限