banner

研究发现:大数据在我国出版业的实现条件并不成熟

作者: 大数据观察来源: 大数据观察时间:2017-04-14 18:37:550

(图为:活字印刷)

大数据对传统出版业来说更大的价值不在于技术本身,而在为出版业提供一种思维方式和思考模式,大数据强调相关关系,重视总体数据,宽容数据中的“噪音”,实时地发现其中从未被了解过的相关性现象和趋势,挖掘并创造意想不到的价值,改变了传统数据时代一味追求因果关系和精致化数据处理的思维习惯。

自2012年底起,在众声沸腾之中,“大数据”成了被广泛讨论的概念之一。这股热潮似乎意味着,一个预示着思维方式和商业模式变革的大数据时代已然到来。而2012年也是我国传统出版业向数字化转型的高速发展期,大数据潮流和我国传统出版业的数字化进程息息相关,二者正面合流,必然会给我国传统出版业带来一定冲击。 然而,大数据到底是什么?它会如何影响传统出版,带来怎样的思维方式和商业模式的变革?它又会给我国传统出版业带来哪些问题和挑战?对于上述问题,传统出版业需要做好思想和行动上的准备。

一、大数据是一种思维:相关关系取代因果关系

大数据经常被认为是“巨大、海量的数据”,这并不十分准确。在维克托·迈尔-舍恩伯格和肯尼斯·库克耶所著的《大数据时代:生活、工作与思维的大变革》一书中,大数据的概念得到了较为权威的辨析。所谓大数据,更接近于“全数据”。与传统分析抽样的、部分的数据的方法不同,大数据分析近乎总体的、所有的数据。

实际上,有关数据处理的实践早已存在于历史之中。比如,零售业巨头沃尔玛在20世纪90年代就开始分析销售和存货的数据以降低风险和成本。但是,受计算能力和数据资源的限制,关于数据处理的大规模实践仅局限于零售、金融等专业圈子。如今,随着电子商务、社交网络和移动设备的普及和兴盛,规模数以亿计的用户都在网络中留下了自己的“痕迹”。这些“痕迹”形成了海量的数据资源。有了这样庞大的数据资源,再加上云计算的出现突破了过去计算条件的限制,使得大数据分析成为可能。潜藏在其中的商业模式和巨大的利润空间开始被不断地挖掘出来,展现在人们面前。这一切成为推动大数据实践前进的源源不断的动力。

因此,大数据并不是空泛的概念,而是与实践息息相关。大数据对传统出版业来说更大的价值不在于技术本身,而在为出版业提供一种思维方式和思考模式,大数据强调相关关系,重视总体数据,宽容数据中的“噪音”,实时地发现其中从未被了解过的相关性现象和趋势,挖掘并创造意想不到的价值,改变了传统数据时代一味追求因果关系和精致化数据处理的思维习惯。对传统出版业来说,大数据思维带来的应该是商业和整个行业赢利模式的变革,这种思维已经开始并正在影响着传统出版业的现状和未来发展方向。如同等待挖掘的大数据一般,传统出版在大数据时代也潜藏着许多变革的可能性和机遇等待探索和发现。

二、大数据对传统出版业的影响 1.出版的数字化并不等于“大数据化”

近年来,我国传统出版业迅速向数字化转型。据统计,2012年我国数字出版全年收入规模达1935.49亿元,较2011年增长了40.47%;占全行业营业收入的11.6%,较2011年提高2.1个百分点。其中,电子书、互联网期刊、数字报纸的营业收入增长52.6%,超过数字出版整体增长速度【[i]】。这表明,我国传统出版业的数字化进程势头正猛。但需要注意的是,出版的数字化并不等于“大数据化”。

首先,如果说数据化是把现象进行量化的表现,那么关于数据化的实践在数字化进程之前就已经广泛存在。比如,古代的计数工具如算盘的出现就是为了更好地量化现实现象的尝试。但是,数据化也不等于“大数据化”。只有通过数字化,将不同形式的复杂数据转换为数字计算机可以处理的数字数据,才使得大数据分析得以实现。所以,数字化是大数据分析的基础和必要条件。加快传统出版业向数字化转型,是出版业迎接并实现“大数据化”的必要条件。

然而,出版的“大数据化”并不仅仅是数字化。出版业要实现大数据化,需要将大数据思维贯穿于传统出版业产业链上的各个环节中,用大数据思维变革传统出版业的商业运作逻辑。目前,我国出版业或许由于现有条件限制,还不足以充分实现“大数据化”。但是在大数据时代到来的前夕,我们需要先充分做好思维上变革的准备。

2.大数据变革传统出版产业链的做点

广义的传统出版的产业链主要可以分为出版、复制(印刷)、发行、物资供应等环节。在出版数字化进程不断加快的今天,不少产业链环节仍处在传统思维的运作下,这与数字化的趋势相违背,更与大数据化的方向相背离。我们需要将大数据的思维应用于各个环节,变革其中的运作逻辑,探索效率提升和价值创造的可能性。

(1)选题:大数据确定市场需求

传统文化生产组织(如书籍、杂志、电影生产商)由于面临着市场需求的不确定性,往往需要生产过剩的文化产品,再重点推广其中某些产品,以期望这些产品能够满足消费者的需求。这种传统的生产模式不仅增加了成本,还造成了一定程度上的资源浪费。

出版业在出版一本书之前,往往会经过市场调研,以了解市场需求。在“小数据时代”的思维主导下,市场调研往往采用随机抽样问卷调查的形式。通过市场调研,到出版编辑提出内容选题,再经过层层论证,最终到审批通过。一套流程走下来,无论在调研环节中的随机抽样,还是在论证环节中对因果关系的讨论,都费时费力,更可能落后于瞬息多变的市场环境。

大数据思维要求我们抛弃以随机抽样和因果推论为典型代表的小数据思维。通过大数据分析,可以更实时、准确、小成本地分析现有市场的潜在需求和趋势。这样,出版社不必再忙于传统市场调研的随机抽样问卷调查,也不必再受制于调查得出的滞后的市场数据,更不必再通过过剩生产的方式来满足受众需求。出版社通过对用户数据的分析,可以了解到用户的产品偏好,这样就可以相对定向地策划、生产出符合用户潜在需求的文化产品。 例如,美国电视剧《纸牌屋》的制作就是利用大数据分析进行生产的典型例子。其制作方Netflix每天都会对其海量用户的行为数据进行分析。通过分析,Netflix知道其用户喜欢哪个导演,喜欢哪个演员,偏好搜索什么类型的内容,把三者结合,就产生了一炮而红的《纸牌屋》。这种模式同样可以用于出版业。比如,出版社可以和掌握相关用户数据的网站(如豆瓣)合作,分析用户使用搜索和“想读”功能而积累起的海量数据,从中挖掘出用户的偏好趋势和书籍市场的潜在需求。社交网站和搜索引擎也掌握着庞大的数据。例如,可以通过对微博上与书籍相关的关键词进行排序,挖掘出近期热门的内容题材和作家。

因此,大数据分析可以让出版社将生产流程的标准化和产品内容的个性化统一起来。出版社可以通过对用户偏好的组合(如《纸牌屋》的案例),将用户喜欢的作家、风格、题材类型组合起来,创造出一系列畅销书。这在一定程度上类似于传统大工业的流水线标准化生产,只需要将不同的原始“零件”拼接在一起再进行深加工,就能生产文化产品。这不仅缩短了一本书从策划到出版的时间周期,减少了生产成本,还极大降低了传统出版社之前所面临的需求不确定性和风险。

而且,这种生产流程的“标准化”并不一定会导致大量重复文化产品的出现。通过大数据分析,出版社可以相对清楚地了解到各个细分市场的偏好,针对不同目标市场进行偏好组合,就可以生产出符合不同目标市场需求的书籍。有着专业市场定位的出版社通过大数据分析,也可能获得比传统市场调研更的结果。

(2)营销:有的放矢、精准营销

传统的文化产品生产商在制定营销策略时,由于用于营销的资源是有限的,往往将资源重点分配于几个选定产品,通过广告宣传和联系评论人(如书评人、影评人、乐评人)等造势手段,展开对新产品的营销活动。由于文化产品的过量生产,营销资源并不能平等地分给所有的产品。因此,在传统的文化产品营销活动中,一些产品由于缺少营销甚至而刚上市就“退市”,甚至,一些被投入大量资源重点推广的产品,也可能因为不符合充满不确定性的市场需求而遭遇“滑铁卢”。

传统的营销方式——对评论人的公关及广告的全面铺开耗费了极大的成本。而大数据的分析方式,可能会使得这样的营销策略逐渐式微。亚马逊就是典型的例子。最初,亚马逊作为在线售书商,专门成立了一个由20多名书评家和编辑组成的团队。这个团队通过撰写书评、推荐新书的形式,承担起传统评论人的角色,对书籍销量产生了巨大的影响。然而,当亚马逊意识到数据的作用后,通过对用户的大数据分析,建立起亚马逊的购书推荐系统。这个系统能够自动向用户推荐经数据分析后其最有可能会买的书籍,最终,推荐系统起到了比书评团队更好的效果,书评团队也走向解散。

另外,淘宝根据对自身用户数据的分析而发布的《2012年全国县域地区网购发展报告》指出,全国一、二线城市用户的人均购书花费虽然高,但县域用户在人均购买次数上却更高。比较来说,县域用户更喜欢励志和创业的书。在他们的购书偏好中,教育、考试类书籍占了较大比重。这些来自电子商务的数据分析,都可以为出版社在制定图书营销策略和渠道时提供极为重要的参考。

社交网站上的用户关系也可用于大数据分析。利用社会网络分析法对社交网站用户间关系进行分析,可以辨别出有着不同属性、兴趣爱好和消费能力的“小圈子”。这些小圈子就是典型的细分的目标市场。专业出版物往往只符合小众市场的需求,而在这些小圈子进行专业出版物的营销活动,利用社交网络强关系和弱关系的连结,可以取得良好的营销效果。在大数据分析的帮助下,对不同的用户进行定向的新书推荐和广告投放,也可以使营销更有效、更富有针对性。

北京磨铁图书有限公司最近通过“众筹”模式出版《社交红利》一书就是利用社交网络进行营销的先例:这本书在首印前就在众筹网上展开营销活动,在用户中预售了3300本,募集到10万元书款,收回了成本。此后,在社会化营销的影响下,《社交红利》成为一个月发行5万本的热门畅销书籍。此例一开,继磨铁后,更多的书籍开始登陆众筹网尝试这种新的社会化营销。例如,乐嘉的新书《本色》通过众筹网,在一天时间内就获得了330位网友的支持,筹资超过15000元。

虽然磨铁的案例并没有用到多少大数据分析,但是,这种利用社交网络营销的模式为大数据分析可能带来的营销效果提供了预见和有力的证明。传统出版物的预售与征订工作耗时良久,且成本较高。专业化书籍更是面临着更大的需求不确定性。通过将新书在出版前就在社交网络上预售,既可以在出版前验证一本书的潜在需求,又可以在出版后利用用户社交关系之间的相互影响展开书籍的营销活动。而且,《社交红利》作为涉及微博、微信、社会化营销等内容的书籍,其市场定位在一定程度上也符合社交网络用户的需求。其单本较低的定价,也特别适合用“众筹”的方式进行出版和营销。

因此,可以将大数据分析和社会化营销结合起来,将其用于制定新书的营销策略中:前期,通过大数据分析潜在的市场需求和目标市场受众的特征,减少琐碎的市场调研,选定营销的目标圈子;后期,基于大数据的分析结果制定不同的营销策略,利用社交关系进行社会化营销。这种方法特别适用于专业化书籍,因为在越是深层次的细分领域,随机抽样的问卷调查可能越不可取。

大数据分析既可以减少耗时,降低成本,还减少了小众书籍面临的需求不确定性的风险。另外,传统出版对新书首印数的判断往往依赖于经验和简单的历史数据断,有很大风险。利用大数据分析加上社会化营销,也可以在最大程度上降低这种风险。

(3)商业模式:改变传统基因

大数据的思维不仅仅可能影响传统出版业的各个产业链环节,还可能为出版社提供新的商业赢利模式。在传统出版业,出版是主要环节,带动其他环节形成出版业的生产链条。在大数据时代,数据本身就是重要的资产。这种资产就像冰山一角,没有深入挖掘就不能发现其潜藏的巨大价值。出版社需要认识到,自身所拥有的庞大内容资源,本身就可以是一个巨大的数据库。

将自身的内容资源数据化,并不仅仅是将纸质版书籍扫描转变成电子版这么简单。将内容资源数据化,是要将内容资源变成可以被检索、计算、分析的数据库。例如,谷歌于2010年推出的图书数据库就包括了从1500年到2008年间出版的各类图书的5000亿个单词,大约有2000万图书被扫描成了数字图书。用户可以在电脑上输入单词,查看这些单词历年的使用频率。这样的数据库对于人文社科研究有着巨大的价值。因此,拥有较多内容资源的出版社可以通过对内容的数据化,创建自己的数据库,展开数据库营销。大学、图书馆、相关研究机构对这类型的数据库都存在一定的需求。

当然,出版社的内容资源并不仅仅于此。如果出版社拥有自己的电子阅读器用户,那么出版社就可以对电子阅读器用户的阅读习惯和阅读行为进行量化。例如,亚马逊不仅仅拥有大量的数据化书籍,还说服了众多出版社在它的电子阅读器Kindle上发布图书。这样,亚马逊就能够掌握电子阅读器用户的各类数据,比如,用户喜欢阅读什么格式的电子书,喜欢在书中的哪些地方划重点、做笔记,喜欢重复阅读书中的哪些段落,跳过了书中的哪些章节,阅读一页需要多少时间,喜欢用什么搜索词。这些碎片化的数据信息可以作为一项重要资产卖给出版社。经过大数据分析,出版社可以从中了解电子书读者的阅读偏好,从而改善自己电子书的内容、结构、风格和销售渠道。

巴诺书店就利用自己的Nook电子阅读器收集用户的阅读行为数据。通过数据分析,巴诺发现非小说的阅读,尤其是篇幅较长的书的阅读,总是断断续续,往往容易较早被放弃。这些数据促使巴诺推出“Nook快照”,加入了从减肥到“占领华尔街”运动等一系列与健康和时事有关的短小作品,鼓励读者阅读非小说类作品和长篇的新闻作品。甚至,数据还能帮助出版社在电子书中合适的地方加入多媒体功能,让读者继续保持兴趣。出版社还能通过读者的阅读速度或放弃阅读的比例来判断读者对此书是否还有兴趣。

因此,出版社本身就可能成为大数据的拥有者。通过对自身内容的数据化和深度挖掘,出版社可以利用自己的数据库创造新的商业盈利模式。通过与其他数据拥有者的合作,出版社可以获得更多来自读者的原本潜藏着的反馈,以改善自己的产品和服务。

三、大数据给传统出版带来的挑战 1.谁掌握着大数据

当数据成为资产时,谁拥有这份资产就成了至关重要的问题。在大数据的产业链上,拥有数据本身的公司和拥有大数据分析技术的公司占据着最为重要的位置。然而,传统出版社可能既没有足够的数据,也没有分析大数据的技术水平和硬件设备,从而处于一个极为尴尬的位置。

若要实行大数据策略,出版社先要获得数据拥有者如社交网站、搜索引擎、电子阅读器等公司授予的数据使用权,再需要和数据分析者合作,使得数据得到二次挖掘获得新的价值。由于数据资产本身的价值难以准确衡量,这种多方博弈可能会经历重重的困难,有着更多的不确定性。某些在出版产业链上已经实现纵向一体化的公司可能会出于自身利益考虑或其他原因,不向出版社提供数据使用权。例如,拥有电子阅读器Kindle的亚马逊就没有把用户数据信息卖给出版社或作者。

2.大数据能否代替一切

在大数据时代,传统出版确实能有更多的发展机遇和空间。但是,大数据是否是万能的呢?

答案是否定的。首先,虽然大数据推崇采用近乎总体的数据,但由于种种客观条件的限制,大数据并不会囊括整个市场。这在互联网、电子商务和移动设备不够普及的国家尤其显著。而且,大数据并非绝对准确,而是充满“噪音”和混杂性。大数据反映的是概率问题,而非客观关系。过于依赖大数据制定策略而失去个人本身的主观思考,容易走入“数据决定一切”的误区。

其次,如果过于依赖大数据,在一定程度上会导致非常规性创新的缺失。大数据思维是依赖于机器计算的思维,由于计算过分复杂,计算过程也无法被解释得明晰。如果人们过于依赖大数据分析,可能会渐渐失去自己的思维能力。虽然,通过大数据分析可以发现以往未曾发现的现象,但是基于大数据分析而制定的策略,是否是一种对人的创新能力的扼杀?人们是否会陷入迎合市场需求的忙碌中而失去艺术创造的灵感和热情?这一点值得文化产业深思。创意之所以为创意,是因为在产生之前,创意并不存在于这个世界上。对当前的大数据的分析无法挖掘出非常规性创意,也无法代替创意,更无法代替文化产业属于人的精神创造活动。

3.大数据在我国出版业的实现条件并不成熟

目前,我国的传统出版业是否有条件实现大数据?条件可能还不太成熟。我国传统出版业正处于向数字化的转型时期,要谈大数据化,得先彻底地数字化。目前,传统出版业的数字化转型尚未成功,进行大数据化实践也只是纸上谈兵。从数字化到数据化,从数据化再到运用大数据思维,还需要经历相当漫长的过程。但是,即使我国传统出版业的大数据时代还未到来,我们也要做好思想上变革的准备,充分认识到大数据能给传统出版产业的发展带来哪些机遇和潜力。

(作者单位:李彪:中国人民大学新闻学院副教授,陈璐瑶,中国人民大学新闻学院硕士研究生,

参考文献 [1] Paul M. Hirsch. Processing Fads and Fashions: An Organization-set Analysis of Cultural Industry Systems. American Journal of Sociology [J],Vol. 77,No. 4 (Jan., 1972),pp. 639-659. The University of Chicago Press. [2](英)维克托·迈尔-舍恩伯格. 肯尼斯·库克耶. 大数据时代:生活、工作与思维的大变革 [M]. 杭州:浙江人民出版社,2013.

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限