12章現場に学ぶ

12章を読めば以下の問いに答えられるようになる
  • 成功しているスタートアップ企業における大規模データと機械学習の使い方は?
  • どのような監視技術やデプロイ技術を使えばシステムを安定化できるのか?
  • 成功しているCTOは、技術や開発チームからどのような教訓を得ているのか?
  • PyPyはどれくらい広範に適用できるのか?

 本章では、Pythonを大規模データとスピード重視の場面に利用して成功した会社の物語を集めました。すべて各組織の重要人物に寄稿してもらいました。採用した技術だけでなく、苦労して手にした知恵も共有してくれています。第2版では、初版の内容に加えて、4つのすばらしいストーリーも加わりました。本書の初版に掲載された内容には、タイトルに「(2014)」と記しています。

12.1 Feature-engineによる特徴エンジニアリングパイプラインの合理化

Soledad Galli(trainindata.com)

Soledad GalliはTrain in Dataのリードデータサイエンティストであり創業者でもあります。彼女は金融・保険業界での経験があり、2018年にはData Leadership Awardを受賞、2019年にはLinkedInのデータサイエンスと分析分野の「Top Voices」に選出されました。Soledadは、知識を共有し、ほかの人がデータサイエンスで成功するのを助けることに情熱を注いでいます。

 Train in Dataは、経験豊富なデータサイエンティストとAIエンジニアが率いる教育プロジェクトです。プロがコーディングやデータサイエンスのスキルを向上させ、機械学習のベストプラクティスを取り入れることを支援します。機械学習やAIソフトウェアエンジニアリングに関する高度なオンラインコースや、Feature-engine( ...

Get ハイパフォーマンスPython 第2版 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.