5章pandas入門

 この本の残りの部分ではpandasに注目していき、pandasを主要なツールとして扱います。pandasは高度なデータ構造を持ち、また、Pythonでデータの整理や分析を素早く便利に行うために設計された分析ツールも持っています。pandasは、SciPyやNumPyなどの数値計算ツールや、statsmodelsやscikit-learnなどの分析用ライブラリ、また、Matplotlibなどの可視化ライブラリと連携して使われることが多いです。pandasは、NumPyのような配列ベースの計算スタイルや配列ベースの関数を採用しています。また、NumPyと同様にforループを使わないデータ処理を好みます。

 pandasは、多くのコーディング用法をNumPyから採用していますが、その中で最も大きな違いは、pandasはテーブル形式のデータや異種のデータを扱うために設計されているというところにあります。NumPyは、等質の数値データの扱いに最も適しています。

 2010年にオープンソースプロジェクトになって以来、pandasは非常に大きなライブラリに成長し、現実世界の広範なユースケースに適用できるものになりました。開発者コミュニティも成長して2,500人以上の貢献者がいます。彼らは、日々のデータ問題を解決するためにpandasを使いながら、プロジェクトの構築を手伝ってくれています。活気あるpandasの開発者コミュニティとユーザコミュニティが、その成功の重要な部分を担っています。

多くの人は、2013年以降は私が日々のpandasの開発に参加していないことを知りません。それ以降は、完全にコミュニティによって運営されるプロジェクトになっています。コア開発者と貢献者の皆様にぜひ感謝の気持ちを伝えましょう! ...

Get Pythonによるデータ分析入門 第3版 ―pandas、NumPy、Jupyterを使ったデータ処理 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.