Book description
データ分析における一連の作業(データ収集、データクレンジング、モデリング)をコマンドラインで自由自在に進めるための考え方やツールの使い方を解説します。データの多様化、大規模化に伴い効率的にデータ分析を行う上でコマンドラインツールはかかせません。本書では、データ分析作業における各フェーズでのコマンドラインツールの使い方から、効率化のためのワークフローの管理や並列処理などまでを幅広く紹介します。日本語版では監訳者による本書のテクニックを利用する時に壁になるであろう「日本語処理」と、実務で利用する場合の「ケーススタディ」を収録。
Table of contents
- 監訳者まえがき
- はじめに (1/4)
- はじめに (2/4)
- はじめに (3/4)
- はじめに (4/4)
- 1章 イントロダクション
- 2章 さあ始めましょう
- 3章 データの獲得
- 4章 再利用可能なコマンドラインツールの作り方
- 5章 データのクレンジング
- 6章 データワークフローの管理
- 7章 データの精査
- 8章 並列パイプライン
- 9章 データのモデリング
- 10章 総まとめ
- 付録A コマンドラインツール一覧 (1/5)
- 付録A コマンドラインツール一覧 (2/5)
- 付録A コマンドラインツール一覧 (3/5)
- 付録A コマンドラインツール一覧 (4/5)
- 付録A コマンドラインツール一覧 (5/5)
- 付録B 日本語処理
- 付録C ケーススタディ
- 付録D 参考文献
- 索引 (1/2)
- 索引 (2/2)
Product information
- Title: コマンドラインではじめるデータサイエンス ―分析プロセスを自在に進めるテクニック
- Author(s):
- Release date: September 2015
- Publisher(s): O'Reilly Japan, Inc.
- ISBN: 9784873117416
You might also like
book
デザインスプリント ―プロダクトを成功に導く短期集中実践ガイド
本書はGV(旧Google Ventures)およびGoogleで提唱しているデザイン思考「デザインスプリント」の概念とその手順を実践的に解説。デザインスプリントではプロダクトやサービスのアイデアを短時間で作り上げ、ユーザーに示して評価してもらい、アイデア創出からプロトタイピング、ユーザーテストと評価までをわずか5日間で完了させるためのプロセスが定められています。本書では組織でデザインスプリントを実践するために必要な事柄を紹介し、多くのリソースを投入する前にプロダクトやサービスのアイデアを検討し、チームメンバー、ステークホルダー、そしてユーザーを巻き込みながら短期間でより良いユーザー体験を作り上げる方法を伝授します。
book
プログラミング文体練習 ―Pythonで学ぶ40のプログラミングスタイル
レーモン・クノーの『文体練習』から着想を得て執筆された本書は、1つの課題を異なるプログラミングスタイルで実装し、さまざまなスタイルの特性やスタイルが生まれた歴史的経緯などを解説します。本家の『文体練習』は、「バスの中で起きた諍いと、その張本人を後で目撃した」という内容を、公的文書風、宣伝風、業界用語風など、99の異なる文体で表現したものですが、本書は、「単語の出現頻度をカウントして多いものから出力する」という課題を、40のスタイルで実装しています。リソース制約が大きかった時代の方法から、オブジェクト指向、純粋関数型、リフレクション、並行処理、ニューラルネットワークまで幅広いスタイルを扱い、マルチパラダイム言語Pythonの威力と魅力を感じられる構成となっています。
book
ハイパフォーマンス ブラウザネットワーキング ―ネットワークアプリケーションのためのパフォーマンス最適化
現代のアプリケーションエンジニアは、UIやデータ処理、開発言語、プラットフォームの仕様や癖だけでなく、サーバやネットワークについても、上から下まで、表から裏まで広く知ることを求められます。本書は「ブラウザ」に関連し、インターネットで使用されるさまざまなネットワーク技術をまとめたものです。HTTP/2.0やWebRTCなどの最新技術、WebSocketやXMLHttpRequestなどのブラウザAPI、そしてそれらの土台となるTCPやUDPやトランスポート層についてまでを幅広くカバーします。また改善前後の性能・速さを可能な限り具体化し、それぞれの場面においてのパフォーマンス改善幅を示します。
book
プロダクトマネジメント ―ビルドトラップを避け顧客に価値を届ける
本書は、顧客に価値を届けるプロダクトを作り出すプロダクトマネジメントについて学ぶ本です。プロダクトマネジメントを理解することで、企業がビジネス目標を達成しながら、顧客の課題を解決する方法を解説します。はじめにプロダクトマネージャーの役割と責任を定義し、優れた意思決定を促す戦略の立て方を紹介します。実験と最適化によって作るべきプロダクトを決めるプロセスを解説し、最後にプロダクト主導の組織を支えるための文化や方針を紹介します。ビルドトラップを避け、顧客の課題にフォーカスするプロダクトマネジメントの原則を解説する本書は、規模の大小を問わずすべてのプロダクトチーム、マネージャー、プログラマ、アーキテクト、デザイナ、マーケターに必携の一冊です。