banner

从百度视频看大数据与人工智能

作者: 大数据观察来源: 大数据观察时间:2017-01-18 19:37:040

近日,了解到百度视频在升级迭代上利用大数据做了很多事情,这让我真实的感受到了大数据的价值。其中我将大数据的应用决策拆解成两种层面,第一种是利用个体数据为个体进行决策,第二种是利用群体数据为群体进行决策。

以下,结合百度视频已经实现以及将要实现的案例,来看下大数据与人工智能是具体如何应用的。

大数据个性化决策

个性化决策无疑是难度最高的,因为个性化决策是根据用户行为记录来为用户做出相应的推荐。

百度在无线端有大量的产品,其中用户数过亿的 APP 就多达 14 款。百度内部有专门的团队,分析用户在这些 APP 中的行为,利用算法估算用户的年龄、性别、职业、兴趣等特征。

这一技术在百度工程师那里称为用户建模,这些数据来自于用户手机里安装的百度应用如“百度地图”、“百度贴吧”、“百度魔图”外加一些使用百度开放接口的应用诸如“糗事百科”等等,百度是能够通过这些数据进而来为用户建立动态模型。

百度视频的个性化推送是典型的利用群体智慧来解决个体需求的例子。传统的视频 APP 通常以广播的方式为用户推送视频,即每个用户收到的消息内容是一样的,无法满足用户个性化的需求。百度视频的做法是,分析用户的历史观看记录,同时结合用户的性别、年龄、地域等特征,为用户建立兴趣模型,将用户可能感兴趣但却未观看过的视频推送给用户。

比如一个经常上动漫贴吧的用户,百度通过搜集大数据后判断其是 20 岁左右的大学生,在个性化推送上就和其他人群就有所不同,可能就会推送一些大学生圈子里比较流行的动漫以及韩剧之类。

简而言之,用户使用的百度系以及带有百度接口产品的产品越多,百度就能越能为用户建立个人模型,所有使用过的产品的数据会汇聚到百度云端,人工智能最后再绘制出一个人的画像,百度再根据这个画像再为每个应用进行大数据决策推送,再根据用户的反馈结果进行迭代试错,当然这是机器学习的部分,不必要再深入讨论下去。我画了一个简单的百度个性化推荐原理。

大数据群体化决策 个体与群体的价值思辨

之前我对百度个性化推送提出过缺陷的质疑,一旦当用户更换手机之后,百度就无法再次为其建立个人画像模型,进而也就失去了对于个人的意义,百度又要重新建立个人数据,十分麻烦。

而深入了解百度的大数据之后让我感到更有一番深度,百度的大数据并非只为个体用户服务,更重要的是建立群体宏观行为模型,通过这一整套模型为群体进行宏观决策,而群体决策部分的重要战略意义远远大于个体意义。

我对此的理解为:如果我们将人类整体行为看做为个体行为,那么同样的作为个人总有一些误操作,一些随机的非主流的边缘操作,而这些边缘操作对于机器学习来说只是噪声而非信号,是需要进行过滤的,那么机器就需要过滤掉这些没有价值的数据,将有价值的信号数据沉淀与固定下来,为整体行为进行决策。

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限