今天跟大家唠唠我最近搞的“消失的她豆瓣”这个事儿。一开始我就是好奇,想看看这部电影在豆瓣上的评价到底咋样,是不是真像网上说的那么两极分化。
我打开豆瓣,直接搜“消失的她”。这步简单,没啥技术含量。
然后,我就开始一条一条地翻评论。我还挺认真地看长评,想看看有没有啥深度解读或者特别独到的见解。结果发现,长评里水军和喷子都不少,真正有价值的信息不多。
我就把目标转向了短评。短评虽然短,但是数量多,能更快地了解大众的真实感受。我主要关注了打分和评论内容,特别是那些既没打高分也没打低分的,感觉这种评价会更客观一些。
为了更高效地筛选信息,我还手动做了个简单的分类。比如,觉得电影反转不错的,我就记下来,觉得剧情有bug的,我也记下来。这纯粹是手动的,没用啥高级的工具。
在看评论的过程中,我发现一个挺有意思的现象:很多人都在讨论剧情的反转。有人觉得反转很精彩,出乎意料;也有人觉得反转很生硬,为了反转而反转。还有人说这电影像《看不见的客人》和《误杀》的结合体,我当时就有点好奇,想着回头也去看看这两部电影。
后来我还尝试着用一些简单的文本分析方法,比如关键词提取,想看看大家都在讨论哪些关键点。不过因为我的数据量不大,而且豆瓣的评论内容也比较随意,所以效果一般,没啥特别有价值的发现。
这回“消失的她豆瓣”实践,让我对这部电影的评价有了一个更全面的了解。虽然豆瓣上的评论鱼龙混杂,但是只要用心筛选,还是能找到一些有价值的信息的。而且这回实践也让我意识到,要想做好舆情分析,光靠手动是不行的,还得学习更多的数据分析工具和方法才行。