Book description
本書では、Twitter、Facebook、LinkedIn、Google+、GitHubなどのソーシャルウェブサイトを取り上げて、データマイニングを行うために必要な技術知識や手法を解説しています。本書の前半では基礎概念を学び、後半ではソーシャルウェブサイトをマイニングするためのツールやテクニックを広く紹介しています。データサイエンティストやアナリスト、あるいは新しいビジョンを描き出す思想家として新たな段階に踏み出したいエンジニアにおすすめします。
Table of contents
- はじめに (1/4)
- はじめに (2/4)
- はじめに (3/4)
- はじめに (4/4)
-
1部 ガイド付きのソーシャルサイトツアー
- プレリュード
- 1章 Twitterをマイニングする: トレンドの話題の調査、人々が話題にしていることの発見など
- 2章 Facebookをマイニングする: ファンページの分析、友達の解析など
- 3章 LinkedInをマイニングする: 職種情報の正規化、同僚のクラスタリングなど
- 4章 Google+をマイニングする: 文書の類似度の訇算、コロケーションの抽出など
-
5章 ウェブページをマイニングする: NLPによる自然言語理解のための処理、ブログポストの要約作〰㜐など
- 5.1 概要
- 5.2 ウェブのスクレイピング、パーシング、クローリング
- 5.3 構文を解読してセマンティクス'意味)を見つける (1/5)
- 5.3 構文を解読してセマンティクス'意味)を見つける (2/5)
- 5.3 構文を解読してセマンティクス'意味)を見つける (3/5)
- 5.3 構文を解読してセマンティクス'意味)を見つける (4/5)
- 5.3 構文を解読してセマンティクス'意味)を見つける (5/5)
- 5.4 エンティティ中心の分析: データのより深い理解 (1/2)
- 5.4 エンティティ中心の分析: データのより深い理解 (2/2)
- 5.5 自然言語データ処理分析の品質
- 5.6 この章を締めくくるに当たって
- 5.7 練習問題
- 5.8 オンラインリソース
-
6章 メールボックスをマイニングする: 誰が誰に何について話しているかの分析、頻度分析など
- 6.1 概要
- 6.2 メールコーパスを手に入れて処理する (1/4)
- 6.2 メールコーパスを手に入れて処理する (2/4)
- 6.2 メールコーパスを手に入れて処理する (3/4)
- 6.2 メールコーパスを手に入れて処理する (4/4)
- 6.3 Enronコーパスを分析する (1/4)
- 6.3 Enronコーパスを分析する (2/4)
- 6.3 Enronコーパスを分析する (3/4)
- 6.3 Enronコーパスを分析する (4/4)
- 6.4 時系列的なトレンドを見つけてビジュアライズする
- 6.5 自分のメールデータの分析 (1/2)
- 6.5 自分のメールデータの分析 (2/2)
- 6.6 この章を締めくくるに当たって
- 6.7 練習問題
- 6.8 オンラインリソース
- 7章 GitHubをマイニングする: ソフトウェアコラボレーションの習慣の調査、インタレストグラフの構築など
- 8章 セマンティックウェブをマイニングする: マイクロフォーマットの抽出、RDFによる推論など
-
2部 Twitterクックブック
-
9章 Twitterレシピ集
- 9.1 開発目的でTwitter APIにアクセスする
- 9.2 本番稼働用のアプリケーションのためにOAuthダンスを実行してTwitter APIにアクセスする
- 9.3 何が話題になっているのかを調べる
- 9.4 ツイートを検索する
- 9.5 便利な関数呼び出しを組み立てる
- 9.6 JSONデータをテキストファイルに保存する
- 9.7 MongoDBにJSONデータを保存する
- 9.8 ストリーミングAPIでTwitter Firehoseをサンプリングする
- 9.9 時系列データを集める
- 9.10 ツイートエンティティを抽出する
- 9.11 一群のツイートのなかでもっとも人気の高いツイートを見つける
- 9.12 一群のツイートのなかでもっとも人気の高いエンティティを見つける
- 9.13 頻度分析を表にまとめる
- 9.14 ツイートをリツイートしたユーザーを見つける
- 9.15 リツイートの引用元を抽出する
- 9.16 頑健なTwitterリクエストを発行する
- 9.17 ユーザープロフィール情報を取得する
- 9.18 テキストからツイートエンティティを抽出する
- 9.19 あるユーザーのすべての友人またはフォロワーを取得する
- 9.20 ユーザーの友達やフォロワーを分析する
- 9.21 ユーザーのツイートを集める
- 9.22 友達のグラフをクローリングする
- 9.23 ツイートの内容を分析する
- 9.24 リンク先の情報を要約する
- 9.25 ユーザーのお気に入りのツイートを分析する
- 9.26 この章を締めくくるに当たって
- 9.27 練習問題
- 9.28 オンラインリソース
-
9章 Twitterレシピ集
- 3部 付録
- 索引 (1/3)
- 索引 (2/3)
- 索引 (3/3)
Product information
- Title: 入門 ソーシャルデータ 第2版 ―ソーシャルウェブのデータマイニング
- Author(s):
- Release date: June 2014
- Publisher(s): O'Reilly Japan, Inc.
- ISBN: 9784873116792
You might also like
book
Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理
NumPy、SciPy、pandas、Matplotlib、Jupyterをはじめ、高機能で使いやすい数学・科学計算用ライブラリが充実しているPythonは、科学計算、統計解析、機械学習のみならず、金融や経済分野でも広く利用されています。本書はPythonの代表的なデータ分析ツール、pandasの開発者Wes McKinneyによる、データ分析を行うための基本を網羅しています。すべてのサンプルコードはダウンロード可能で、Jupyter Notebookで対話的に試し、実際に手を動かしながら知識を確実なものにすることが可能です。Python 3に対応した待望の改訂版です。
book
ハイパフォーマンス ブラウザネットワーキング ―ネットワークアプリケーションのためのパフォーマンス最適化
現代のアプリケーションエンジニアは、UIやデータ処理、開発言語、プラットフォームの仕様や癖だけでなく、サーバやネットワークについても、上から下まで、表から裏まで広く知ることを求められます。本書は「ブラウザ」に関連し、インターネットで使用されるさまざまなネットワーク技術をまとめたものです。HTTP/2.0やWebRTCなどの最新技術、WebSocketやXMLHttpRequestなどのブラウザAPI、そしてそれらの土台となるTCPやUDPやトランスポート層についてまでを幅広くカバーします。また改善前後の性能・速さを可能な限り具体化し、それぞれの場面においてのパフォーマンス改善幅を示します。
book
行動を変えるデザイン ―心理学と行動経済学をプロダクトデザインに活用する
深津貴之氏推薦!「行動経済学、データ分析、サービス設計のエッセンスが高度に統合された行動変容デザインの良書です」 本書は、行動経済学と心理学をもとに、人々の行動、日常習慣を変える“行動変容”を促すプロダクトをデザインするための書籍です。主にヘルスケア(健康管理)、金融(資産管理)など、これまでITプロダクト(サービス、アプリなど)がなかなか使われてこなかった分野を対象に、ユーザーがやりたいと思っていたものの実行できなかった行動の実現を助けるプロダクトを作り出すための、実践的な視点や知識を提供します。
book
入門 監視 ―モダンなモニタリングのためのデザインパターン
本書は、システムのどの部分をどのように監視すべきか、また監視をどのように改善していくべきかについて解説する書籍です。前半で監視のベストプラクティス、デザインパターン/アンチパターンを示して、監視の基本原則を詳しく説明し、後半でフロントエンド、アプリケーション、サーバ、ネットワーク、セキュリティの各テーマで強力な監視の基盤を設計して実装するための方法を示します。監視対象が変化し、システムアーキテクチャが進化する中で、従来から変わらない監視の基本を示しながら、時代に合った監視の実践を解説する本書は、監視についての理解を深めたいエンジニア必携の一冊です。