banner

大数据为什么不能预测电影票房

作者: 大数据观察来源: 大数据观察时间:2017-03-28 14:48:580

声明:本人绝不是攻击任何人,我也在优酷呆过,真切的喜欢那些小伙伴,也知道他们做过预测票房的事情。我批评的行业诟病,因此读我文章的程序猿可以免疫,你们也是按照命令行事,苦逼何必为难苦逼呢?何况我也是程序猿。

”这年头真的是猪站在风口上都能飞上天“ 雷老板的名言。 随后好多人,就开始了各种概念炒作,例如“互联网思维”(看到这个词你们一定想吐,在各种新闻中,被小编毫无节操的使用)。

没有多久,大数据不知道从哪个缝里面冒出来了。最开始就是big data ,这代表了海量数据处理的一些问题和解决方法。后来,“大数据”这个词也是在各种新闻中被小编糟蹋的够呛。到现在大数据最准确的含义,我也不知道。确切的说这个词的准确含义,没有一个人知道。

去年(2013)的时候,Netflix利用大数据的方法拍摄了电视系列剧纸牌屋(House of Card)。接着,小时代在续集中也咨询了一个大数据公司。郭敬明紧随国际步伐,既然利用了最先进的技术,怎么你的电影还是那么烂。虽然小时代票房还是过亿,但是和大数据预测没有什么关系吧?

崔老师(本人)作为数据挖掘工程师(aka:大数据工程师。。。。)认为用大数据预测电影票房就是鸡叫和天亮的关系。更准确的表达是目前的大数据技术预测电影票房是完全扯淡的。未来我就不做预测了,免得你们骂我。

电影是一种追求细节的艺术。从人物的着装到每一个场景设计和对白,都是经过无数人呕心沥血弄出来的。看上去非常合情合理的镜头,背后蕴藏着的是无数次Cut Off。这仅仅是电影前期摄制 ,接下来就是后期制作(包括特效和音乐,还有最重要的剪辑)。制作完成以后,接下来就是电影发行。什么样的档期应该发什么样的电影,发行公司都很清楚,我也是外行就不多说了。

当电影发行以后,咱们就可以去电影院观影了。如果一部好电影,观众看过之后,就会有水花效果,一个人可以鼓动周围的所有人去看。如果是一部烂电影,就没有这种水花效果。对于这种效果模型,你可以想象为一个东西扔到水里的效果。好电影就是一个巨大的石头,扔下去水花四溅久久不能平静。烂电影就是一坨屎,扔下去马上就沉了。(暂时不考虑物理定律)

大数据是怎么预测电影票房的呢?他们要做特征提取,把一部电影里面的所有特征全部提取出来。例如,演员,导演,监制。。。。。。。,然后根据这些特征去找数据。这里面用的算法模型大部分都是计算广告学的点击率预测模型,如果把观众是否观看电影抽象为0和1的话,计算广告学的理论很容套进去。理想情况是每一个特性下面的数据量足够,不稀疏。然后他们编写各种代码,各种调试。最后,他们给出了一个报告,中间有各种图表。好的团队,会在结尾的时候标注在多大概率下,票房是多少。

其实细心的人都会问,大数据预测的这些人他们看过这个电影么??

bingo,bingo。。。。。。

我告诉你们,这些人都没有看过他们要预测电影。那么问题来了,“没有看过能预测个啥啊?有没有基本的常识啊?”

真让您说对了,中国就是缺乏这种最基本的常识,一群工程师连电影都没有看过,就跑过去预测电影票房。

您又要说“真是悲哀”。崔老师认为一点也不悲哀,投资人拿钱、工程师干活、促进GDP、哪里悲哀都是赢家。这是一个win-win的生意了。如果长期看的话,这种是对未来创新有毁灭性的,虽然中国的天使都是PE。

顺便喷一下豆瓣。豆瓣做为一个盈利性机构,其实他的影评都有一部分就是挂着羊头卖狗肉。韩寒的后会无期在没有上映的时候,就评分8.0了,你们还有节操么?还能要点脸么?

之所以大数据不能衡量电影票房,最重要的是电影是一个最感性的东西,是不能用理性的指标来衡量的。

通常一个电影没有任何巨星,但是它有感人的剧情、真实的场景、能与你共鸣的对白。上面这些都不能通过指标来量化。例如感人的剧情,0.5是感人还是不感人??

还有在电影宣传期那些出色的营销手段,你怎么量化?眼花撩换的海报你能量化么?

读到这里你会说,“就是嘛,这么感性的东西怎么能用冷冰冰的数字来衡量”。

以上就是我从一个大数据专业人员的角度,为你解读为什么电影票房不能用大数据预测。

所有的打赏收入,都作为捐款cover一位美女的医疗费用(这美女是我大学时的小伙伴,现在因为得了骨癌,需要大家的帮助)。

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限