
数据分析案例
|
409
对排序结果做逆序,再次取出前
10
行,得到的则是男性观众更喜欢的电影:
如果只是想找出分歧最大的电影,不考虑性别因素。分歧可以用方差或标准差测量。要
这么做,首先计算按照电影名的评分标准差,然后对电影名进行过滤:
接着,进行降序排列并选取前
10
行,这大概就是分歧最大的
10
部电影:
可能你已经注意到了,电影分类是以管道分隔(|)字符串形式给出的,因为一部电影可
能属于多个分类。如果按电影分类对评分数据进行分组的话,可以在
DataFrame
上使用
explode 方法。来看看如何使用。首先,在
Series
上使用 str.split 方法将分类字符串
分割为分类列表: