
454
14
章 データ分析の実例
title
Dumb & Dumber (1994) 1.321333
Blair Witch Project, The (1999) 1.316368
Natural Born Killers (1994) 1.307198
Tank Girl (1995) 1.277695
Rocky Horror Picture Show, The (1975) 1.260177
Eyes Wide Shut (1999) 1.259624
Evita (1996) 1.253631
Billy Madison (1995) 1.249970
Fea
r and Loathing in Las Vegas (1998) 1.246408
Bicentennial Man (1999) 1.245533
Name: rating, dtype: float64
このデータでは映画のジャンルがパイプ区切り(
|
)で与えられていることに気付いたでしょうか。も
しジャンルに関する分析をもっと進めたかったとしたら、もう少しデータの変形が必要となっていたで
しょう。
14.3
アメリカの赤ちゃんに名付けられた
名前リスト(
1880-2010
)
次に用いるデータ例は、アメリカ合衆国社会保障局(
Social Security Administration, SSA
)の提供す
る赤ちゃんの名前データです。
1880
年から現在まで、毎年継続して集計されています。このデータは
データ分析の入門によく用いられるもので