当电影碰到大数据:该怎么玩
张梦依 -----

海量数据的新时代正在改变电影业原有的游戏规则,如何应用大数据提升行业运营效率,开始成为关键。

什么是大数据?

今年大获成功的美剧《纸牌屋》是美国视频网站Netflix基于大数据投资拍摄的电视剧。随着这个经典案例被越来越频繁地提及,人们开始意识到数据分析对于影视创作的价值,无论从剧本选择、导演演员选择,还是拍摄、后期制作乃至营销,都会产生深刻的影响,近期谷歌也发布了基于搜索大数据的票房预测报告。当然也有反方的声音,比如梦工厂CEO卡森伯格就表示,电影创作要靠创造力,不能仅靠数据分析。

那么,“大数据”能否成为中国电影新的驱动力呢?

事实上,数据挖掘和数据调研一直是中国电影的短板。

好莱坞工业体系下,一部电影从研发、创作生产到发行,几乎每一步都能看到数据的身影。在影片策划阶段,如选演员时,会提出十多种组合,请数据公司去作抽样调查,看哪个组合对于这个类型的影片来说是最受欢迎的。好莱坞在数据库建设方面基础工作做得很早,也做得非常扎实。

新丽传媒副总裁张文伯说,今天我们频繁地提起大数据,首先是因为已经可以从互联网上获得海量数据了。此时不能把目光仅仅局限在“大”上,而更应该看到“数据”对于行业的价值。“中国电影产业对于数据一直是忽视的,作决定的时候多是拍脑门凭经验,因为连最基本的数据都没有,过去连每周票房的实际数据都拿不到,更不要说其他精确数据了。”

那么,到底什么是大数据?简单来说,大数据有4个特点:第一,数据体量巨大,从TB级别跃升到PB级别;第二,数据类型繁多,网络日志、视频、图片、地理位置信息等。第三,价值密度低,商业价值高。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。这和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume、Variety、Value、Velocity。

物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式。而跟电影有关的大数据又在哪里?主要集中在以下几个地方:第一是搜索平台,如百度、谷歌、搜狗;第二是社交平台,如微博、人人网、豆瓣、时光网;第三是电商平台,如网票网、美团网、淘宝网等;第四是视频网站,如优酷土豆、爱奇艺等。

新影数迅创始人Water认为,电影大数据分析会有交叉,比如分析电影,不仅分析观众曾在哪家影院购票,或微博上对某部电影有什么评价,还可以看到更多相关信息,比如这位观众看不看电视,看不看《中国好声音》,对某位明星是否感兴趣,他平常是什么样的人。大数据可以分析用户的性格特点、消费习惯、行为特点,这样才能更好地理解用户为什么会选择观看某部电影。

数托邦创意分析工作室的杨玥认为:大数据分析不仅是一种工具,也提供了一种观察世界的维度。“在影视行业,有传统的影视剧制作、投资、营销的分析视角,大数据能提供一种更深入的视角,相当于显微镜和放大镜。它能够提供更多的信息,有助于更好地决策。”

当电影碰到大数据

大数据对电影产业的价值是什么?艺恩咨询总裁郜寿智向记者介绍,他们对于电影大数据的应用方向目前还在探索中,具体来说,一是电影剧本优化,二是电影营销策划,三是电影宣发评估,四是票房预测。

怎么根据大数据做剧本优化?目前的做法是,利用语义分析实现文字评价、内容评估,根据评估结果为编剧提供素材。郜寿智认为,剧本创作当然是一个创意性工作,需要有专业性的编剧能力,但也可以借助大数据,捕捉观众对某些题材、故事的兴趣方向。“因为在中国,如果不是一个市场经验特别丰富、观众意识特别强的编剧,可能会在剧本里带有很强烈的个人色彩。”

剧本优化的大数据分析,包括语义分析,包括综合各种社区热门内容,也包括对历史成功项目的讨论。以《泰囧》为例,大家对这部电影的故事、题材是如何评价的,可以系统归类成一套关于电影质量层面的分析。未来会逐步形成一个受观众欢迎的类型片模板,作为同类题材在剧本创作优化参照的依据。

谈起电影营销策划,张文伯认为,百度指数或者谷歌指数预测,本身就可以被视为一种数据挖掘的工具,它们是最简易的,而且是公开的,不仅可以找到直接的答案,还可以看到相关性和趋势。现在不仅有百度指数,新浪微博也有微指数,视频网站则有优酷指数等。虽然它们还是较浅层次的数据分析,但对于电影营销是有指导性的。

通过上述工作,在过去的电影营销经验里就可以得出一些结论。张文伯介绍,第一,有高粉丝量的明星,往往在宣传前期对于影片的传播能起到重要作用。第二,在各种营销活动中,落地活动的传播效果最好,一般做完一个发布会之后,百度指数会有明显上升,表明主动搜索的人增多了。第三,影片临近上映前一周,尤其前三天,营销价值最大,越临近影片上映,这个时候的营销动作对于首周末票房越会产生直接影响。

通过数据趋势判断,可以帮助调整电影营销策略,比如投放哪个物料是有效果的,什么样的话题在口碑传播中容易爆发,什么样的渠道媒体平台对于宣传是更有价值的。每一次重要的电影营销活动之后,都可以通过这些大数据获得及时反馈,这些反馈对于指导下一步的营销工作是非常重要的。在张文伯看来,电影营销本身就是一个试错过程,就像在雷区排雷一样,要不停地尝试,才有可能引爆地雷,或找到惊喜。

一部电影的营销工作,需要花费长达半年甚至更长时间,要不断让观众有印象,产生兴趣,进而才能有消费冲动。在这个过程中,要不断试错。作为《失恋33天》的营销负责人,张文伯一开始并没有想到集中力量推广“失恋物语”这个视频。在发布会上,这只是他们正常发布的一个物料,但放到网上一个月后,他发现优酷播放量居然高达200多万,而且没有做任何推广。这200万的播放量是怎么来的?优酷指数会显示播放来源,原来是来自人人网、开心网、微博等,说明它产生了自发传播的效果,产生了在朋友间主动分享的效果。那证明这个视频比同时期投放的其他物料有效,所以他们开始调整预算,接下来的效果非常好,说明方向是对的。在作决策的过程中,优酷200多万播放量的数据结果以及来源判断,给电影营销提供了重要指引。

《小时代》与大数据

在2013年的暑期档,有关《小时代》的话题一直在发酵,截至8月17日,由乐视影业投资并发行的影片《小时代》创下4.83亿元票房成绩,《小时代:青木时代》上映两周已达到2.65亿元票房。目前推算,《小时代》及《小时代2:青木时代》两集预计票房8亿元左右。

乐视影业总裁张昭在8月12日举行的《小时代》案例分享会上,介绍了乐视影业基于数据的商业模式,简单来说是“一定三导”系统。“一定”就是用数据定位,当准备投资或发行一部影片的时候,首先要做数据分析,比如《小时代》在文学网站上有多少点击量,是什么人在点击;要知道这个电影可能存在的核心以及第二圈、第三圈观众在哪里。由于《小时代》定在暑期上映,要分析同档期竞争对手,分析过去一年消费者看过的同类型或相似的影片,是否形成了差异化定位等。

有了数据定位后,要通过各种平台做导航。导航就是产品与消费者之间的社会化沟通。经过长时间社会化发酵导航以后,才有了导流。导流就是把各种互联网平台上部落里的网民们想办法导入电影院。

张昭称,要用做市场的态度做内容,要用做内容的态度做市场。“大数据的作用是让我们一面做,一面看数据,不断激荡思维,然后把很多东西反馈到跟消费者的沟通上。电影的创作和营销过程是一体的,电影不再是个封闭的产品,整个营销和与消费者沟通的过程是期待的一部分,也是最后的观影体验的一部分。”

张昭在接受采访时曾反复提起,“我们现在要做的,最核心的就是互联网时代的电影”。业内人士分析,《小时代》对于电影市场的作用,不仅是依靠网络传播推广电影,而是以大量数据为基础,对观众需求进行深入分析后生产和推广电影,是以市场为目标进行一切开发行为。以来自观众和市场的数据为依据,它提供了一种崭新的电影操作范式。

数托邦创意分析工作室团队从大数据的角度独立分析了《小时代》这部电影最近在业内引起的关注。杨玥介绍,他们的数据采集取样时间为6月27日至7月1日,即《小时代》上映之日起连续5天。微博抽样每天抽取2万余条原发提及微博(即微博中包含“小时代”关键词),共采集到106,674篇微博。用户抽样即从106,674篇微博中抽取原发作者用户,去重后得到100,815位用户。用户筛选工作为采用数托邦工作室的核心算法,去除高度疑似水军账号8,670个,去除机构账号945个,共保留91,200位用户。群体微博采集9万余位用户近期共约900万条有效微博。

从微博提及量的数据统计图可以看到,《小时代》上映第五天时,新浪微博上有关“小时代”的当日提及量达195万。相比之下,《致青春》、《中国合伙人》、《西游·降魔篇》这几部话题影片,上映期间最高单日提及量都没有超过50万,仅相当于《小时代》的四分之一。值得注意的是,微博提及量只是电影在微博上舆情热度的体现,和实际的市场票房并不呈现完全的正相关性,《西游·降魔篇》最终票房12亿元,但微博提及量却为4部影片中最低的。

从数据显示的年龄构成来看,《小时代》的观影人群平均年龄20.3岁。在“小时代”的9万多位微博原发作者中,女性占八成以上,接近半数还是微博达人。数托邦分析,《小时代》的年轻女观众们同时也是微博上比较活跃的人群,她们在微博上的能量很大,积极地参与了《小时代》的观影、评论、分享、传播甚至争论,甚至自己在大量搜索有关《小时代》的文章,用铺天盖地拉票的方式给影片背书。她们既是《小时代》的主要观众群体,也对这部电影的传播和营销起到了至关重要的作用。

在关于《小时代》话题讨论的地区分布上,同样也有一些有趣的现象。湖北、四川、浙江、江苏、江西、湖南、辽宁、广西、重庆、河南、贵州等地区的观众舆情参与度指数排在前十位。北京、上海、广东的参与度指数则垫底。一般而言,北上广的微博舆情最为活跃,但有关《小时代》的微博舆情体现了完全相反的状况。这从一定程度上反映了《小时代》观影人群的地区分布向二三线城市和地区倾斜,同时受到这些地区年轻观众的追捧,而北上广地区的观众对《小时代》的讨论热度相对较低。

从微博提及量图上还可以看到,在《小时代》上映的第十二天,其微博话题还出现了一次“断崖式”的下跌,这说明用户可能对话题的热情程度转换得非常快,粉丝们在微博表达观点、进入电影院支持观看后,热情迅速消退,可能会迅速转移到下一个新鲜话题。

的确,伴随着微博话题的下跌,《小时代》的票房在首周高开后,第二周出现了明显回落。张昭解释,这是因为他们在第一部映前的营销做到了极致,才导致第一周的票房达到令人吃惊的高度。这不是一个正常类型片的做法,因为正常类型片的票房基本上会保持一个稳定下滑的曲线,三周内每周下降50%左右。而《小时代》是一个粉丝电影,需要把影响力做到最大。到第二部《小时代2:青木时代》,比第一部在一线城市的票房低得多,但在二三线城市特别是三线城市则比第一部高得多。这意味着在两部电影上映的中间时间,电影的品牌影响力、热度是向二三线城市下沉的。张昭认为,粉丝电影有与传统电影不一样的表现和数据。

在互联网时代,大数据很重要的特质就是不追求精准性,因为样本太庞大,它追求的是一个趋势。它不追求因果性,而更追求相关性,比如看到某个结果,不需要知道是什么造成的,只需要知道这个结果有价值。杨玥认为,一部电影在艺术水平上有什么样的评价,这是数据分析无法预测的。数据分析更多是站在市场角度看待电影,研究哪些人可能成为观众,他们喜欢什么,他们愿意为此掏钱的概率有多大。它提供了一种尊重市场的操作模式。

预测与洞察

近期谷歌也发布了基于搜索大数据的票房预测报告,在影片上映前一个月预测,准确率高达94%。谷歌票房预测主要基于三个指标,一是预告片播放量,二是同系列电影此前几部的成绩,三是电影档期的季节特征。

国内也有一些公司开始尝试预测票房和指导投资,可能在具体建模过程当中指标会有差异,但大思路是一样的。比如2012年9月艺恩咨询启动了“艺恩电影营销指数”,而“艺恩电影票房指数”也在筹划测试中。

但目前电影票房预测还存在较大的风险性。张文伯分析,美国电影市场相对成熟,类型片的发展、观众口味的选择也是相对成熟的,谷歌可以基于一个相对稳定的市场进行票房预测;但是中国的电影市场变化太大,每年票房增长超过20%,观众对于影片的选择判断是基于话题性,而不是基于影片本身的品质,而且中国也缺乏可参考的系列电影。基于目前的市场情况,中国电影的票房预测能否做到准确?张文伯认为这很难说,但是现在可以开始尝试了,因为市场会一步步走向成熟。“生产工具对于生产力的指导,也应该是比生产力发展更前置的。”

此外,谷歌票房预测是基于英文环境的,而中文的语义很多元,处理中文更为复杂。比如,中文的切词就比英文更难分辨。比如“读报纸”,到底是表达“读报”多一些,还是“报纸”多一些?此外,还有网络用语的含义、网友的情绪捕捉等,这就需要结合上下文,也要结合一些词库作分析,语义分析的深度和广度目前还在探索阶段。

大数据是否包括微信?杨玥分析,广义上讲包括微信,但现在微信的数据很难拿到。“数托邦创意分析工作室”团队在名字上有类似“乌托邦”的意思,分析主要基于公有数据,很多企业有大量私有数据,也能做处理,但是他们更希望运用公有公开的数据分析,实际上很多公有数据已经很有价值,然后在一些分析结果上加上私有数据来印证。“公有数据像是一面镜子,私有数据也是一面镜子,很多面镜子组合起来,能让大家看得更清楚。你可以拿显微镜看,可以拿放大镜看,可以拿哈哈镜看,从不同的角度能够看到以前没看到过的世界。”

在郜寿智看来,大数据对于电影产业的驱动力可以这样理解:在电影的工业化链条上,不管是剧本创作还是营销跟踪,到最后对市场前景的评估以及票房预测,都可以直观地跟市场对接,让工业化体系更加完善。但是大数据不可能代替创作,不可能代替艺术成分,这些并不冲突。

在2013年上海国际电影节上,郜寿智感叹,两三年前在电影节,大家讨论时根本不讲数据方面的事。2008~2009年他常跟人说自己是做电影数据服务的,人家回道“电影行业要数据干嘛用?”直到近两三年,他可以跟大家讨论大数据对电影行业的驱动作用了,发展是非常迅速的。

对于大数据分析来说,目前最为缺乏的是优秀的数据分析师,要既懂行业又懂数据。郜寿智认为,大数据分析不是迎合用户,也不会忽视用户,而是去洞察用户。

在张昭眼里,大数据这个概念是对于电影行业的解放,中国电影行业近百年的历史,需要这样一种启蒙式的风暴,这是一个把理性、感性、思辨融合起来的过程。目前来说,大数据最大的意义还是在于对思考的激荡。

CIO之家 www.ciozj.com 公众号:imciow
关联的文档
也许您喜欢