Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
by Jake VanderPlas, 菊池 彰
訳者まえがき
2018年に出版した本書第1版の訳者まえがきでは、PythonがIEEEの選ぶプログラミング言語ベスト10 で1位を獲得したことをお伝えしました†1。それ以来現在までPythonは1位を堅持しています。プログラミング言語の人気を表すTIOBE Indexでも2023年時点でPythonは1位を維持しています†2。ChatGPTやGPT-3.5がPythonで開発されたと言われているように†3、データサイエンスや機械学習など注目度の高い分野で活用が広がり続けている点が大きな要因だと思います。
[†3] 開発言語について尋ねたところ、ChatGPTはPythonであると回答した。
本書はJake VanderPlas氏による『Python Data Science Handbook, Second Edition』の邦訳です。Python言語自体を解説したものではありません。データサイエンス分野におけるPythonエコシステムの中で重要な位置を占めるJupyter、NumPy、pandas、Matplotlib、scikit-learnについて、Pythonを学ぶための「1つで済む解決策」としてそれぞれを解説しています。特にⅤ部は3分の1以上のページ数を占め、scikit-learnのさまざまな機能について実例と共に解説した本書の中心とも言える内容です。第1版の翻訳時には0.19であったscikit-learnは、今や1.3がリリースされているなど、この分野が活発に利用されていることを伺わせます。Pythonは進化が速く、いくつかの機能は原書第2版の出版時から変更されていたため、本書のコードにはDeprecationWarningの出るものがありました。翻訳時には、macOS版のAnaconda ...