数据机构指水军炒热了马蜂窝“注水”新闻

2018-10-25 14:15:45 来源:澎湃新闻

打印 放大 缩小

大水冲了龙王庙?数据机构指水军炒热了马蜂窝“注水”新闻

近日有关马蜂窝评论数据涉嫌造假的事件持续发酵,在舆论质疑马蜂窝的网络“水军”刷评论行为同时,10月23日,商业情报分析机构知微数据发布报告显示,在该事件的网络传播过程中同样也出现了明显的网络“水军”助推痕迹。

工商资料显示,知微数据所属的北京宏博知微科技有限公司成立于2012年,大股东于霄拥有72.28%股权,其经营范围包括技术开发、技术咨询、技术服务、市场调查、经济贸易咨询、投资咨询等等多方面。

据知微数据官网,其主要业务板块中便有“传播分析”一项,具体包括:对单条微博的传播进行总体评价和多维度分析,从传播趋势、传播路径、参与人群、引爆点、短链和水军和内容属性等多个维度探索一条信息在微博平台中的来龙去脉等。

10月24日,知微数据方面向澎湃新闻(www.thepaper.cn)表示,针对该事件传播情况的报告内容是基于客观数据进行分析,与案例中相关各方不存在利益关系。

水军传播马蜂窝“注水”新闻:大水冲了龙王庙

知微方面称,该机构从2012年开始“水军分析”的数据研究,对于网络热点事件的传播情况都会进行案例分析。目前,知微数据的数据库已经积累了2014年以来社会各个领域热点事件分析5000余件。

澎湃新闻通过官方电话联系到知微数据,一名接受采访的分析员介绍,判断某网络热点事件是否有较大规模的“水军”助推,一般有几个标准:

“第一,是对该消息转发的用户账号的特征,比如这些账号是否是事件发生前后才注册的新号、账号的日常活跃程度是否明显过低或明显过高、账号的粉丝数量是不是很少,用户名是否多为‘用户+数字’或‘汉字+数字’等。

第二,在转发行为的模式方面,同一账号是否就内容相同的同一事件多次转发,多账号的转发文本是否雷同或明显无意义、和原发微博不相关等。

第三,大规模集中转发的时间是否出现在午夜等大家都应该休息的时间段,转发量是否在某一个时间点急剧上升之后却又断崖式回落等等。

在马蜂窝事件发生后,知微数据也就此网络热点事件做了分析,结果却发现,该事件的水军助推的特征非常明显,具有上述“水军”特征中的多种。

知微数据表示,

在对传播脉络进行数据分析之后,知微数据将其总结为:大水冲了龙王庙,水军传播马蜂窝‘注水’”。

针对这一案例具体而言,10月20日23时许,自媒体作者“小声比比”的独家稿件《独家|估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》发布后,先在微信朋友圈开始了首轮传播,10月21日早间,有媒体加入传播,事件热度小幅上升,至22日早间,大量媒体参与报道,事件热度迅速上升,达到峰值。

报告称,从10月22日至今,事件中互动量最高的三条微博分别来自@中国新闻周刊 (互动量超过16万)、@财经网 (互动量超13万)、@新浪科技(互动量过5万),对转发列表进行分析,可以发现非常明显的水军参与特征。

点击进入下一页

马蜂窝与“小声比比”对峙时间轴

4万多个转发用户中粉丝数小于等于10个的占比近半

以转发量最高的@财经网微博为例,10月21日12点47分,@财经网发布微博“#马蜂窝抄袭#【马蜂窝被指数据造假:85%的点评不真实 充斥僵尸和水军】”,截至报告抓取数据时,@财经网微博约有4.7万条转发量,共有41177个用户参与。

分析结果显示,这些用户中有高达八成以上昵称为“用户+数字”、“汉字+字母/数字”,昵称为“用户+数字”的占全部转发用户的48%,粉丝数小于等于10的占比43%,微博数小于等于10的占比35%。

知微数据分析称,@中国新闻周刊、@财经网、@新浪科技就马蜂窝事件发布的三条微博都有着高度相似之处,都有近半数转发者昵称为“用户XXXX”形式。从转发文本情况看,三条微博中90%以上的转发都仅为“转发微博”,并未包含有意义的文本。

点击进入下一页

大批昵称为“用户+数字”、“汉字+数字”的转发者

“自然的转发情况下,包含文本的转发情况还是较多的。但马蜂窝事件的传播过程中,超过90%以上的转发都是仅‘转发微博’,这非常不正常。”该分析员解释。

另外,分析报告还称,在这三条微博中,总计超过6.8万用户参与了转发,其中有6000余位用户同时转发了两条及以上,占比近10%。与高达90%的“转发微博”一同来看,就显得有些耐人寻味了。

点击进入下一页

凌晨突现转发量爆发式增长

报告还指出:马蜂窝事件在微博的传播过程中几乎没有引爆点,但在微博上却获得了大量传播,本身就十分不正常。而多出现在水军转发的情况下,转发趋势更是诡异。

例如,@财经网就该事件微博发布后的首个转发高峰出现在10月22日0点整,凌晨也一直持续着不低的转发量;而从清晨5点起,转发趋势更是一路飙升,最高峰出现在7点半;12点40分还有400+转发,随后就瞬间断崖式下跌。

“比如,某个微博大V转发了这一消息,并拥有一定数量的二次转发,我们就把这个情况计做一个引爆点。”知微数据分析员介绍,同样以@财经网微博为例,该微博转发量超过4.7万条,而传播最大深度仅6层,带来最多二次转发的为@财经网本身的再度转发,但也仅仅只带来85个二次转发。二次转发量排名第十的账号更是只有4次二次转发。

“即使二次转发量很少,但我们还是把二次转发量排名一至十名的账号发布微博时间都算成一个引爆点,并用黄色圆圈在分析图中标注,我们可以看到,这一事件的传播轨迹极为不正常。”该分析员解释,在自然传播的情况下,代表引爆点的黄色圆圈一般出现在传播量开始急剧上升的时刻。但在马蜂窝事件的传播过程中,三个转发高峰出现的时间点居然都不存在任何引爆点。

点击进入下一页

没有引爆点的情况下凌晨突显转发高峰(黄色圆圈为引爆点)

点击进入下一页

马蜂窝事件微博传播中的引爆点

无法判断“水军”来自何方

“另外我们看到,在没有引爆点的情况下,首次转发高峰出现在22日0点左右。”该分析人员称,在绝大多数人都开始睡觉的时间点骤然出现大批用户集中转发,属于明显的“水军”特征。

该分析人员解释,“正常的微博传播,转发热度走势和用户的活跃时段有关,如夜间和午饭期间不活跃,转发热度也走低。非用户活跃时段转发热度上升的微博也有,但一般跟微博的发布时间有关,比如在夜间发布了微博,那么夜间的热度也会上升,另外KOL(意见领袖)在夜间转发,也会带动微博热度上升。但马蜂窝事件的传播不符合上述情况。”

在10月22日12点40分该事件经历了第三轮集中转发之后,转发量呈现断崖式下滑。“这也是‘水军’特征,自然情况下转发量从最高峰降温都会有一个过程。”分析人员说。

知微数据的分析人员表示,虽然数据能够证明该事件传播过程中出现了明显的“水军”助推痕迹,但数据无法显示这些“水军”来自何方,也无法判断其是否和稿件发布人或者做出报告的数据机构有关。

责任编辑:ERM523