关于小十七(SEVENTEEN)人气排名的实践记录
这事儿得从我那个外甥女说起,她最近迷上了这个叫SEVENTEEN的男团,每天在家叽叽喳喳的,跟她那帮小姐妹争论谁是队里最火的。我一个快四十的人,耳朵都快听出茧子了,什么“本命”“墙头”,听得我脑仁疼。有一天晚上,她们为到底谁才是路人盘(非粉丝基础)第一名吵得面红耳赤,我火气上来了,直接把我的笔记本电脑打开,说:“别吵了,老舅给你们扒个最客观的排名出来,数据说了算。”
我这人干什么都喜欢讲究个流程和证据,既然要排“路人盘”的人气,那光看粉丝投票没用,粉丝数据只会骗自己。我得去抓那些普通老百姓,或者说,那些只在热搜上见过他们的人,最关注谁。于是我花了整整一个下午,把自己关在书房里,硬是给他们整了一套“社会热度评估体系”。

确定数据源和评估方法
我决定主要抓两个维度的数据,因为这两个维度最能反映“路人”的兴趣:搜索热度和媒体曝光的讨论量。
- 第一步:百度指数和微信指数抓取。我直接把十三位成员的名字,用各种组合方式,包括中文名、韩文音译名,挨个丢进去了。我特意把时间跨度设成了最近三个月。我主要看趋势图,谁的波峰最高,谁的平均值最稳。这个过程贼费劲,因为很多成员的名字搜索量会被别的同名事物盖住,我得手动筛选,排除干扰词。
- 第二步:微博话题阅读量比对。我知道微博大部分是粉丝在玩,但我要看的是“非营销号”或者“官方活动”下,单个成员名字的话题阅读量。我把所有成员的个人Tag都拉出来,对比了近一周的阅读增量和讨论增量。这个数据我只看增量,不看总量,因为总量容易被刷。
- 第三步:抓取综艺和个人资源讨论。我重点去B站和几个视频平台搜“SEVENTEEN”这个大词,然后看那些非团体性质的、专门针对某个成员的单人综艺或者CF(广告)片段,它们的播放量和弹幕密度。如果一个片段播放量高,评论区里路人发言多,那说明这个人对圈外人的吸引力大。
实践中的难点与数据修正
最让我头疼的是数据的“污染”问题。有些成员刚巧发了什么新歌,或者突然闹出点八卦,搜索量会暴涨,但那不是稳定的路人缘。我得把这种短期波动的数据踢出去,只保留那些相对稳定的,靠日常媒体曝光堆起来的流量。

比如在百度指数里,有那么两三个成员(我就不点名了,粉丝别打我)的数据几乎是“平躺”状态,偶尔被新闻带起来一下,很快就下去了。而有几个成员,数据一直稳稳地保持在一个高位,尤其是在年轻群体聚集的平台(比如B站和微博)上,他们的名字出现频率非常高,而且讨论的内容很宽泛,不是单一的应援口号,而是实打实的外貌或者综艺表现的评价。
我把所有数字扒下来,扔进我那个破旧的Excel表格里,给百度热度设置了最高的权重(占40%),因为那代表了最广阔的社会搜索基础。其他数据作为辅助,加起来凑够一百分。我来来回回调整了几遍,确保数据不是在“黑”谁,也不是在“捧”谁,就是冷冰冰的数字说话。

最终的结果和我的总结
经过一整个下午的折腾,我这套“路人盘人气”排名新鲜出炉了。结果出来后,我外甥女她们看完就傻眼了,因为跟她们心里想的完全不一样,但又不得不承认,这个排名很符合她们在学校里听到的路人评价。
最终数据显示:
- 第一梯队(社会认知度极高,长期霸榜):只有一两个人长期占据搜索高峰,他们的名字几乎可以单独作为圈外的代名词被提及。
- 第二梯队(国民好感度高,综艺常客):有两三个成员,他们虽然搜索峰值不如第一梯队,但胜在平均值高,主要是靠着比较频繁的综艺露脸和幽默感圈了一批路人粉。
- 第三梯队(粉丝忠诚度高,路人认知偏低):剩下的成员,他们的各项指标都偏低,但他们的粉丝社区活动量巨大,说明他们的人气是集中在核心粉群里的。
我把那个Excel表往桌子上一砸,说:“看见没,数据是不会骗人的。你们吵架前,先去给我学学怎么抓数据,别老凭感觉。”她们立马安静了。就是见不得这种没依据的瞎吵吵,既然要比,咱就用事实说话。这一下午,虽然累得够呛,但至少证明了我这套土办法,对付这种“人气玄学”还是挺管用的。
我算是明白了,所谓的“路人缘”,拼的不是粉丝的爱有多深,拼的是你在大众媒体上滚动的频次和话题的延展性。就跟我们做项目一样,你做得再没人知道,那也白搭。

