周毅:媒体大数据在电视节目网络传播效果方面的应用

2018-03-16 15:21:13来源:ccbn2018 热度:
一、引 言
中央电视台春节联欢晚会,简称为央视春晚或春晚,是中国规模最大,最受关注,收视率最高,影响力最大的综合性文艺晚会。随着互联网时代的到来,作为传统电视文艺晚会的春晚也面临着转型和升级的问题,这其中的一个重要方面就是充分运用大数据、云计算等新兴信息技术,以融媒体方式实现多屏互动、多元传播。
 
大数据分析既是当前学术科研的热门课题,也是商业服务领域的朝阳产业,其价值在于从庞杂的数据背后挖掘、分析用户的行为习惯和喜好,找出更符合用户“口味”的产品和服务,并结合用户需求有针对性地调整和优化。因此,将大数据技术与广播电视节目网络传播的收视情况、用户行为习惯和偏好,以及反馈和评价等因素相结合会产生传统收视率统计所不及的效果。广播电视的核心在于优质内容的生产,而互联网的核心在于数据。媒体大数据则是促进传统媒体与新兴媒体融合发展的新引擎。
 
本报告基于多节点分布式网络爬虫,实时采集全网春晚相关信息和用户数据,按照播前、播中、播后为分野,通过数据处理、情感语义分析和深度挖掘,从节目热点、演员热度、用户画像、实时收视、社交传播、情感评价等多维度,深刻分析展现本届春晚的收视率、满意度以及用户特征,凭借数据统计和可视化分析,观察春晚网络舆情的变化过程以及传播效果。
 
二、说明
 
2.1 数据来源
 
本次春晚大数据分析具有全程、全网、全样本、多维度的特点。数据监测时间周期为2017年12月12日至2017年1月29日,监测范围及内容如下:
 
 
本项目共调集全网服务器设备200余台,获取微博逾千万条,门户新闻83630篇,微信公众号文章704782篇,论坛贴吧帖子61876篇。
 
本报告重点呈现的是春晚播中、播后共计48小时(2017年1月27日12时至2017年1月29日12时)的网络交互情况。经清洗后共计取得有效数据600余万条,其中微博6195483条,微信308条,新闻门户4893条,论坛420条。从节目、演员、分会场、热点、用户、互动趋势、视频播放、媒体传播影响等方面进行深度分析,精准、客观、翔实地反映网民对于2017鸡年春晚的身份特征、话题讨论、情感倾向等多方面内容。
 
2.2 数据抓取及清洗原则
 
春晚播出期间共计抓取关键词300余个,涵盖了春晚名称、节目、演员、分会场、节目内容等范围,力求全面捕捉春晚期间爆发的网民评论消息。数据采集完毕后,系统会进行反向清洗,剔除如“辽宁春晚”“春晚红包”等无关的信息,确保最后分析的数据准确有效。
 
2.3 演员热议微博归类依据
 
本报告中演员相关的微博消息聚类的原则是,包含所有与该演员相关的姓名、昵称、参演的节目相关关键字的微博。例如:“王凯”的关键字设定为:王凯、凯凯王、靖王、KKW、在此刻;“TFBOYS”的关键字设定为:TFBOYS、三小只、王源、王俊凯、易烊千玺、加油男孩、小凯、俊俊、源源、源儿、一哥、火羊宝、千千、千总、玺子哥、玺宝、美丽中国年。
 
2.4 节目热议微博归类依据
 
本报告中与节目相关微博消息聚类的原则是,包含所有与该节目相关的演员、昵称、节目内容相关关键字的微博。例如:“歌从漓江来”的关键字设定为:歌从漓江来、黄婉秋、张信哲、情歌王子、邓紫棋、金鱼、铁肺公主、小LuLu;“姥说”的关键字设定为:姥说、高晓攀、尤宪超、嘻哈包袱铺、姥姥、叨逼叨、怂的很走心、呼噜呼噜毛、明明有钱、行而上学不行别上、姥姥说的话。
 
2.5 网民热议指数计算说明
 
网民热议指数是依据某一主题(节目、演员等)归类后的所有相关新浪微博原发消息的转发、评论、赞数加权累加计算得到,计算公式如下:
 
热议指数=∑(转发数×0.6+评论数×0.3+赞数×0.1)
 
2.6 网民喜爱指数计算说明
 
网民喜爱指数是依据某一主题(节目、演员等)归类后的所有相关新浪微博原发消息的情感倾向加权累加计算得到,计算公式如下:
 
喜爱指数=∑积极+∑(中性×0.5)-∑(消极×0.8)
 
考虑数量累加而非比例是为了首先突出关注度,避免部分节目讨论量很少但是情感倾向集中,导致排名靠前。“中性×0.5”系数主要的原因是,考虑到部分中性词汇(如明星姓名、“啊啊啊”等语气词)在本次语境中实际表达了强烈的情感,需加以修正。(消极×0.8)系数的原因是部分消极词汇如“哭”“尴尬”等在本次语境中实际表达的非消极情感,故加以修正。
 
三、节目数据分析
 
3.1 节目热度分析
 
 
图1网民热议节目TOP10
 
从图1可以看出,网友热议前三名是《美丽中国年》、《爱你一万年》、《在此刻》,热议度分别为4886901.1、2357718.8、1136010.9。从此可以看出“小鲜肉”的歌舞类节目备受关注。其中,《美丽中国年》由“欢乐颂五美(刘涛、蒋欣、王子文、杨紫、乔欣)”和TFBOYS(王俊凯、王源、易烊千玺)作为开场舞共同表演;《爱你一万年》歌曲由鹿晗和陈伟霆演唱;《在此刻》则是胡歌和王凯合唱的歌曲。而紧随其后排在第四名的《健康动起来》仍是由“小鲜肉”井柏然、张艺兴表演的歌舞类节目。TOP10中只有姜昆、戴志诚的《新虎口遐想》,冯巩、傅园慧等的《信任》和潘长江、蔡明、潘斌龙的《老伴》三个语言类节目,其他均为歌舞类节目。由此可见,歌舞类节目撑起了热议度的绝大部分,而一向被视作春晚重头戏的语言类节目总体热议度有限。图2很清楚的表明了这点。
 
 
图2 节目类型热议度
 
歌舞类节目热议指数高达11983496,占比为所有节目的近90%,网友对于今年春晚的歌舞类节目关注度颇高。语言类和其他类型的关注度明显过低。
 
 
图3网民热议节目情感分布
 
图3反应的网民热议节目的情感分布状况。需要说明的是,部分由“男神”主演的节目,网友的评论中“中性”情感比例都较高,如《爱你一万年》《在此刻》《满城烟花》等。仔细分析微博,主要是由于演员出场时,粉丝高呼演员名称或发出“啊啊啊”的呼喊。此类词汇在情感判定中被界定为中性,但实际上却表达了强烈的感情色彩。
 
3.2 用户画像
 
为了更准确的分析用户的目标、行为和喜好的差异,我们按照年龄和性别两个指标对用户进行画像分析。年龄的划分标准为:1980前、1980—1990、1990—2000、2000后。
 
3.2.1 不同年龄段观众最喜爱的节目TOP3
 
图4表明《爱你一万年》《健康动起来》《在此刻》《美丽中国年》四个节目受到了各个年龄段的普遍喜爱。
 
 
     图4 不同年龄段观众最喜爱的节目TOP3
 
通过分析我们发现“90后”是最重要的数据贡献者,《爱你一万年》的喜爱指数为31344.6,《健康动起来》为13927.2,《在此刻》为11533.2,在四个年龄段中的占比分别为62.8%、63.5%、53.3%。另外“00”后的关注度紧随其后,三项指标的占比基本维持在20~30%左右。可见本届春晚的网络关注人群和传播群体非常年轻化。
 
3.2.2不同性别观众最喜爱的节目
 
通过数据分析,我们发现女性最喜爱的节目是《爱你一万年》,男性最喜爱的节目是《美丽中国年》。但是女性对《爱你一万年》的喜爱度是男性《美丽中国年》的八倍之多。
 

 
图5 男女观众最喜爱的节目
 
图6和图7中分别给出了女性与男性观众热议节目TOP10。男性和女性讨论节目最多的均为《爱你一万年》《美丽中国年》和《在此刻》。男性网友中,讨论《美丽中国年》和《爱你一万年》最多,均为17%左右;女性网友中,讨论《爱你一万年》最多,为29%,其次为《美丽中国年》,为18%。
 
 
图6 女性观众热议节目TOP10

 
图7 男性观众热议节目TOP10
 
四、演员数据分析
 
4.1 演员热度top10
 
 
图8 演员热议指数TOP10
 
演员热度top10中,TFBOYS成为热议度最高的演员,热议指数高达3432156[1],其次为鹿晗,热议指数为1427929,张艺兴、陈伟霆、胡歌三人均在75000以上。其后依次为张杰、王凯、井柏然、刘涛和姜昆。总体而言,网友对于演员的讨论主要集中于“小鲜肉”。
 
4.2 演员讨论热度变化趋势
 
接下来的三幅图分别给出了TFBOYS、胡歌、陈伟霆在整个春晚期间讨论量的变化趋势。
 
 
图9  TFBOYS讨论量变化趋势

 
图10 胡歌讨论量变化趋势

 
图11 陈伟霆讨论量变化趋势
 
从图中可以看出,伴随着明星上场,网络的讨论量呈爆发式的增长,此后的讨论量一般呈逐步下降趋势。但TFBOYS的讨论曲线比较特殊,从图9中可以看到,第一个节目结束后,关于TFBOYS的讨论依然维持在较高水平,基本贯穿了整个晚会。持续的互动与讨论,对于留住年轻观众,提升节目粘性起到了很大作用。
 
4.3 用户画像
 
4.3.1 男性、女性最喜爱的演员
 
 
图12 男性、女性最喜爱的演员
 
鹿晗、TFBOYS成为男性网友与女性网友最喜欢的演员top2,而男性网友对喜欢的演员第三名为王凯,女性网友则为陈伟霆。
 
4.3.2 不同年龄段最喜爱的演员
 
总体而言,各个年龄阶段喜爱演员top3 集中在王凯、鹿晗、TFBOYS、陈伟霆四位“小鲜肉”。其中,80前和80后最喜欢的演员为王凯,90后和00后最喜欢的演员为鹿晗。
 
 
图13 不同年龄段最喜爱的演员
 
五、分会场数据分析
 
5.1 四地分会场热度
 
本届春晚除了央视主会场,还在上海、凉山、桂林和哈尔滨设置了四个分会场。四地处于祖国的东南西北四方,分别以“光、水、火、冰”为创意源点。
 
[1] 该数据为王源、王俊凯、易烊千玺三位演员相加所得。
 
 
图14分会场热议度
 
在四个分会场中,上海分会场的热议程度最高,热议值为206787,其次由高到低分别是是桂林的115836、凉山的41160和哈尔滨的19278。结合网友热议内容以及四个分会场的节目形式可以分析得出如下结论:1.网友对分会场的关注度与参与分会场表演的明星数量、知名度、人气等密切相关;2.网友对杂技、舞蹈节目的讨论热度较低;3.明星发微博能够迅速引起网友讨论,带动所在分会场的热度明显升高。
 
5.2 四地热议词云
 
5.2.1 上海“光舞台”
 
 
图18上海分会场热议词云
 
作为明星嘉宾最多的分会场,上海的节目形式包括歌曲、杂技、旗袍秀等,表演嘉宾包括李玟、林俊杰、廖昌永、黄豆豆、平安、韩雪、吴敏霞、邹市明、姚明、霍尊等。网友讨论中出现频率最高的词分别为春晚、林俊杰、平安、好、大家、希望、新年、幸福、健康、CoCo等。
 
5.2.2 凉山“火舞台”
 
 
图15凉山分会场热议词云
 
作为晚会进行中的第一个分会场,四川凉山的节目形式包括舞蹈、歌曲等,表演嘉宾有吉克隽逸、蔡卓妍、李克勤等。网友讨论中出现频率最高的词分别为春晚、蔡卓妍、李克勤、吉克隽逸、凉山、好、阿Sa、Twins等。
 
5.2.3 桂林“水舞台”
 
 
图16桂林分会场热议词云
 
广西桂林分会场的表演嘉宾有黄婉秋、张信哲、邓紫棋、马天宇、关晓彤、王嘉等。网友讨论中出现频率最高的词分别为马天宇、春晚、邓紫棋、关晓彤、好、桂林、张信哲等。
 
5.2.4 哈尔滨“冰舞台”
 
 
图17哈尔滨分会场热议词云
 
哈尔滨分会场的节目形式包括歌曲、舞蹈、杂技等,主要表演嘉宾为玖月奇迹。网友讨论中出现频率最高的词分别为玖月奇迹、春晚、哈尔滨、冰雪大世界、王小玮等。
 
5.3 用户画像
 
 
图19 四地分会场参与讨论网民分布情况
 
从四地分会场的用户画像可以很明显的看出,当地分会场可有效带动当地网友与春晚的互动。具体比例如下:上海分会场:北京11.35%、广东8.44%、海外7.39%、江苏7.07%、上海6.04%;凉山分会场:广东17.70%、四川11.15%、北京10.00%、海外7.05%、江苏5.57%;哈尔滨分会场:黑龙江20.88%、北京18.82、山东6.76%、海外5.29%、广东4.12%;桂林分会场:北京12.72%、广东7.80%、江苏6.70%、海外6.50%、广西5.93%。其中有关哈尔滨分会场的评议中,黑龙江网友最多;有关凉山分会场的评议中,四川网友排名第二。
 
此外,值得注意的是,海外网友对于具有明显特色和地域特征的四地分会场关注度普遍较高。
 
六、热点分析
 
6.1 热议词云
 
 
图20 热议词云
 
图20是本次春晚的热议词云。从词云中可以看到,TFBOYS、鹿晗、胡歌、王凯、陈伟霆等“小鲜肉”成为提及最多的热词,另外“好”、“哈哈哈”、“爱”、“喜欢”等情感词汇被网民提及的次数也较多。还有就是“微博”词汇被提及的次数很高,可见该社交媒体在网络传播中的重要作用。
 
6.2 情感词云

图21、22分别给出了本届春晚的积极情感和消极情感词云。

 
图21 积极情感词云

 
图22 消极情感词云
 
积极情感词云中,“喜欢”、“开心”、“可爱”、“好”、等词成为春晚积极评价中出现最多的词,“努力”、“期待”、“希望”等词也被频繁提及。
 
消极情感词云中,“悲伤”、“尴尬”、“不行”、“不好”、“无聊”等被提及的次数均很高,其中“尴尬”一词被提及次数最多,部分原因是小品《老伴》中台词“好尴尬啊”在网络中有一定讨论量,而情感算法中“尴尬”被判定为消极情感,故在一定程度上影响了“尴尬”的词频。
 
6.3 热议话题分析
 
春晚48小时期间,受到网友热议的春晚相关话题top5如下:
 
 
图23 春晚热议话题
 
其中,前三个热议话题均与“小鲜肉”歌舞类节目相关,“致敬老红军”话题由节目《继往开来军旗红》引发,网友纷纷表示对革命老英雄的崇高敬意。“董卿口红”话题意外走红,成为唯一一个与节目不相关的话题。
 
七、用户画像总体分析
 
7.1 年龄
 
春晚48小时期间,参与春晚互动的网民中1980年以后出生的占96.10%。其中,90后最多,为67.12%,其次为00后,为19.47%,80后与80前的比例分别为9.5%和3.90%。
 
 
图24 互动网友年龄分布
 
7.2 性别
 
女性网友成为与春晚互动的主力军,比例高达79%,分析认为这与本次春晚“小鲜肉”节目较多有很大关系。
 
 
图25 互动网友性别分布
 
7.3 地域
 
地域分布中,互动最多的地域top10 分别为广东、海外、北京、江苏、浙江、上海、山东、四川、福建、河南、湖北,分布较为广泛,并无明显地域化倾向,排在前列的均为经济、人口大省。
 
 
图26 互动网友地域分布
 
7.4 使用终端
 
网友使用终端中,苹果手机成为评议春晚的主流移动终端,比例高达50.83%,其次为华为、oppo、小米、vivo,三星、魅族等也占有一定比例。
 
 
图27 网友使用终端
 
八、互动趋势分析
 
 
图28 春晚互动及情感趋势
 
图28是春晚播出期间的网络评论及情感变化趋势。通过将微博讨论量及情感倾向细化到分钟级别,可以明显的看出,网络讨论的热烈程度与节目播出有直接的对应关系。图中几个讨论高峰点,分别对应了“美丽中国年”、“在此刻”、“爱你一万年”、“健康动起来”等热门节目的播出时间,可见热门节目及明星对网络传播的带动作用。
 
图29是网络交互趋势与收视率变化曲线的对比图。[1]
 
 
图29 网络互动与收视率对比
 
从传统收视率的观众净获得数据变化来看,20点到22点春晚观众呈增加趋势,净获得为正;22点之后,观众开始流失,净获得为负。
 
对比网络讨论量的曲线图,可以发现:
 
一、在晚会前期的观众积累期,每一次讨论波峰,都会对应收视率曲线中观众净获得的波峰,证明网络交互行为对于吸引观众有积极作用。
 
二、在晚会后期的观众流失期,每一次的讨论波峰,都会对应收视率曲线中观众净获得的波谷,证明网络交互行为会对留住观众产生积极影响。
 
经过分析可知,合理利用互联网/移动互联网社交传播手段,进行节目宣发及舆论引导,特别是在重点节目播出期间,通过社交化的手段实时引发网络讨论热点,可以有效获取观众并提升粘性,体现了媒体融合的重大价值。将媒体大数据及互联网社交互动手段与传统媒体的“制播宣”深度结合,值得进一步深入探索。
 
九、视频播放数据分析
 
9.1 视频网站播放总体数据
 
春晚48小时期间,视频网站中相关视频播放总量9.09亿次(其中完整版3.61亿次),国内总互动参与次数(含评论、赞等)共计71.9万次。[2]
 
 
图30 视频网站播放量
 
9.2 视频网站节目播放量统计
 
 
图31 节目网络播放量统计
 
9.3 视频网站节目总播放量TOP10
 
视频网站中,播放量与好评率排名中歌舞类节目最多,《在此刻》《美丽中国年》《爱你一万年》《健康动起来》等歌舞类节目在播放量和好评率的两个榜单均有出线。语言类节目中,《一个女婿半个儿》《老伴》等在两个榜单均有出线。
 
 
图32视频网站节目总播放量TOP10
 
9.4 视频网站节目好评率TOP10
 
 
图33视频网站节目好评率TOP10
 
十、传播影响分析
 
10.1 春晚官微
 
2016年10月31日,春晚官微发出第一条微博,拉开鸡年春晚网络宣传的序幕。此后,春晚官微陆续发布了大量春晚相关消息,持续引发网络讨论。截止2017年1月28日,春晚官微共发布微博消息198条,引发的总体互动(转发、评论、赞)次数为3640986次。
 
 
图34春晚官微微博数量趋势
 
其中,2017年1月26日发布的“中央电视台2017年春节联欢晚会节目单火热出炉啦”消息,转发数最多,达到659487次。
 
2017年1月25日,“春晚”官方微博启动了「春晚进行时」的移动直播,开创了春晚新媒体宣传的全新模式。本次移动直播播出了最全的独家春晚探班,各路“女神”,“小鲜肉”,“小花儿”一网打尽,齐聚央视春晚的最后一次彩排,引发了微博用户的极大关注。庞大的粉丝群推动了此次直播的传播,特别是当红明星,比如:胡歌、王凯、鹿晗、陈伟霆等被采访的时候,直播的讨论量达到了峰值状态。截止26日上午,「春晚进行时」移动直播观看量达582万次,转发59111人次,评论125175人次,点赞349655人次,掀起了春晚播出预热的高峰。也成为春晚官微发布微博中评论、点赞数量最高的微博消息。
 
在春晚播出期间(2017-01-27 12:00——2017-01-29 12:00的48小时内),系统监测的微博官方帐号中,春晚官微以117条的发帖数量,以及388934次的转发次数,名列所有的官方微博帐号之首。
 
 
图35 春晚期间10家新闻微博活动状态
 
10.2 微博媒体
 
本次春晚大数据项目组,从2016年12月起,开始对新浪微博中涉及春晚的消息进行监控,记录了播前、播中、播后社交媒体的热度趋势。

 
图36 微博热度趋势
 
从新浪微博的热度来看,在2017年1月15日之前,热度不高,呈比较平稳趋势。自“春晚将开始第一次彩排”的消息传出后,微博反映非常强烈,微博热度开始出现上升。随着春晚的临近,热度逐步攀升,主要热点集中在明星参加春晚相关的微博。在春晚播出当日,微博热度大幅攀升,呈几何级数增长趋势。播出之后,热度又开始呈大幅下降趋势。
 
在2016年10月01日至2017年01月28日之间,系统还重点监控了“中国新闻周刊”“新浪娱乐”“今日头条”“ papi酱”等大V账号213个。这些帐号共发微博8843条,其中与春晚相关1307条,累计转发8694970次,评论3232215次,点赞16867776次。
 
转发最多的微博为易烊千玺1月27日22:48分发布的一条微博,共计转发133万余次。评论最多的微博为1月27日18:53分“央视网艾特春晚”发出的一条微博,共计评论25万余次。点赞最多的微博为1月28日02:14分张艺兴的一条微博,共计获赞117万余次。
 
10.3 新闻媒体
 
本次鸡年春晚大数据项目总共监控百度、搜狐、微信公众号、百度贴吧等传播媒体共8个。在2016年10月01日至2017年01月28日之间,共发新闻/帖子55827条,其中与春晚相关4755条。
 
 
图42 微博热度趋势
 
从门户网站的热度来看,在2017年元旦前后,关于春晚的热度呈波浪变化趋势,高点主要出现在“央视春晚拒绝问题明星”、“杨东升担任春晚总导演”、“《琅琊榜》、《欢乐颂》齐聚鸡年”等新闻发布后。随着2017年1月15日第一次春晚彩排后,关于春晚的热度出现较大上升,随后略有下降。在春晚播出前几天,新闻热度逐步升高,主要集中在春晚节目及演员的相关新闻,随着春晚的播出,相关新闻热点在除夕达到顶峰,此后逐步回落。
 
十一、小结
 
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶的《大数据时代》一书中,将大数据与传统的随机分析法(抽样调查)区分开来,大数据需要对全部数据进行分析处理,而抽样调查仅限于部分数据。并且他们总结了大数据的四个重要特点(4V):Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。前三点是大数据在数据本身的特性,而最后一点所强调的是它的独特价值。具体来说,大数据的价值不在于掌握庞大的数据信息,而在于对这些具有特殊意义的数据进行专业化处理。
 
在前现代社会,决策的基础来源于经验和直觉,进入工业社会以后,科学的数据统计与分析技术成为人类决策行为的基本来源,而随着互联网时代的到来,大数据在商业、经济和其他各个领域的应用将成为人类最可靠的决策依据。在本项目的实施过程中,我们通过对2017年央视春晚播前、播中和播后的大数据统计和可视化分析,来观察本届晚会的舆情变化过程及网络传播效果,以便为国内外同行、相关机构、学者在研究我国网络传播、媒体融合、大数据分析与应用,尤其是媒体大数据等相关问题时提供借鉴与帮助。

责任编辑:付海龙