book

現代のビジネス分析

Name: 現代のビジネス分析
Author: Deanne Larson
ISBN: 9798341633674

by Deanne Larson

March 2025

Beginner to intermediate

470 pages

7h 29m

Japanese

O'Reilly Media, Inc.

Read now

Unlock full access

序文
この本を読むべき人この本を書いた理由本書のナビゲーション本書で使用されている慣例コード例を使うオライリー・オンライン・ラーニング問い合わせ先謝辞
1.ビジネスアナリストとアナリティクスの役割
ビジネスアナリストの役割とは何か？スキルレスポンスアナリストの種類なぜビジネスアナリストはアナリティクスを知る必要があるのか？データの爆発ビジネス・コンテクストアナリティクスアナリティクスの価値に貢献するビジネスアナリストアナリティクスが解決するビジネス課題他チームとのコラボレーションアナリティクスで使われるスキルセットPythonとRアナリティクス・プロジェクトのライフサイクル概要
2.ビジネスアナリストとアナリティクス・プロジェクトの方法論
ビジネス理解ビジネス・オブジェクトを決定する状況を把握する目標を決めるアプローチと計画を確立するツールとテクニックの評価データの探索と準備データの内容と質を評価するデータの選択とクリーニングデータの構築と統合モデル開発のためのデータセットをプロデュースするモデリングと評価分析テクニックを選択するモデルの構築と評価デプロイモデルの性能を評価する評価間隔を決めるモデル演算子モニタリング・モデルモデルの人生再訓練概要
3.RとPython入門
RとPythonのインストールとセットアップのオプションなぜRとPythonを学ぶのか？一度に両方を学ぶのと、一度に一つを学ぶのとでは、どちらが良いだろうか？さまざまな学習戦略の長所と短所RインストレーションPythonのインストールRとPythonスクリプティングR言語スクリプトPython言語スクリプティングオブジェクト指向概念OOPの構造OOPの原則RとPythonのデータ型Rデータ型R構造Pythonのデータ型Pythonデータ構造リレーショナルデータベースとの相互作用なぜリレーショナルデータベースなのか？R リレーショナルデータベースへの接続Rとリレーショナルデータベースの例SQLitePythonとリレーショナルデータベースとの接続Pythonとリレーショナルデータベースの例概要
4.RとPythonによる統計解析
分析プロジェクトの例テレコム・チャーンA/Bテストマーケティング・キャンペーン財務予測医療診断問題提起から始める分析的問題にたどり着く分類回帰何を測定したいのか？分析アプローチ電子データ処理教師なし学習回帰のための統計分析分類のための分析仮説検証の役割アナリティクスにおける可視化EDAをサポートするRとPythonによる可視化回帰の可視化分類の可視化概要
5.RとPythonによる探索的データ分析
データの質データ品質の特徴データ・プロファイリングクラスタリングと教師なし学習教師なし学習の目的教師あり学習に影響を与えるクラスタリングの例K平均クラスタリング階層的クラスタリングEDAで使用されるその他の教師なしメソッド外れ値を特定する回帰における外れ値分類における外れ値モデリングのためのデータ準備サンプリングトレーニングとテストデータ変換データ操作機能の選択と削減フィーチャー・セレクション特徴削減テクニック概要
6.RとPythonによるモデリングの応用と評価
モデリングのステップモデルの選択とトレーニングモデル評価モデルの最適化モデルのデプロイモデルのモニタリングとメンテナンス適切なアルゴリズムを選択する回帰一般的な使用例線形回帰式Rで線形回帰を行うPythonで線形回帰を行う線形回帰のユースケースその他の回帰の種類回帰モデルの課題回帰の他のアルゴリズム回帰のための決定木線形回帰の評価分類一般的な使用例分類アルゴリズムRでの分類Pythonで分類する分類の使用例：テレコム解約格付け評価分類ユースケースの評価概要
7.モデリングとアルゴリズムの選択
アルゴリズムアルゴリズム基準問題の種類インタプリタ・モデル予測精度トレーニングのスピード予測速度ハイパーパラメーターのチューニング小さなデータセットを扱う大規模データセットを扱うフィーチャー・インタラクションデータの特徴例適切なアルゴリズムを選択する売上予測に適切なアルゴリズムを選択する基準を評価する決定と実装概要
8.モデル演算子
モデル運用の概要モデル・オペレーション・プロセスモデル採点Rでモデル採点：リアルタイムスコアリングのためにシャイニーアプリを使うPythonでモデル採点：Streamlitでモデルをデプロイするモデル・モニタリングモデル・パフォーマンス・モニタリングの主要業績評価指標モデル自動モニタリングのテクニックモデルの再トレーニングモデル再トレーニングのためのトリガーイベントモデルの再トレーニングを自動化するテクニックRでの実装：スケジュールされた再トレーニングのためにcronジョブを使用するPythonでの実装：ワークフロー管理にAirflowのようなツールを活用するレポートを作成する最終報告書の内容と構成レポート自動生成のテクニックRでの実装：R Markdownとknitrでレポートを作成するPythonでの実装：Jupyterノートブックとnbconvertでレポートを作成するバージョン管理とモデルの再現性コラボレーションとドキュメンテーションの実践ModelOpsの使用例小売業の売上予測：スコアリングとモニタリングの自動化不正検知：動的なモデルの再トレーニングとレポーティング顧客解約予測：スケジュールされたモデルの再トレーニングと最終レポート作成既存のシステムやインフラとの統合MLOpsの今後の方向性概要
9.高度なビジュアライゼーション
Rシャイニーによる高度な可視化Rシャイニーとは何か？Rシャイニーの主な特徴と機能環境をセットアップする初めてのシャイニー・アプリを作る高度なUI開発例リアルタイムの売上を監視するダッシュボードの作成Pythonビジュアライゼーションを学ぶPythonによる可視化の概要共通ライブラリ：Matplotlib、Seaborn、Plotly、DashMatplotlib：Pythonによる可視化の基礎スタイルと色でプロットをカスタマイズする統計プロット：散布図、ヒートマップ、バイオリンプロットPlotlyを使ったインタラクティブなプロットMatplotlibとPlotlyで3Dプロットする地理空間データの可視化ダッシュボード作成：Plotly Dashを使うケーススタディ高度な可視化プロジェクトにPythonを使うRシャイニーとPythonビジュアライゼーションの選択概要

10.アナリティクスで最新のデータ型を扱う
半構造化データ（JSON）JSONデータにPythonを使うJSONデータにRを使うソーシャルメディア・データソーシャルメディア・データの種類ソーシャルメディアのデータ分析にPythonを使うソーシャルメディアのデータ分析にRを使う画像データPythonによる画像処理Rによる画像処理ビデオデータビデオデータにPythonを使うビデオデータにRを使う概要
11.アナリティクスによるビジネス価値の測定とAIの役割
アナリティクスにおけるビジネス価値とは何か？戦略的インパクトオペレーションの効率化顧客満足とロイヤルティビジネス価値を測定するメトリックとKPI財務メトリックオペレーショナル・メトリクス顧客メトリック組織との連携メトリックと組織目標・オブジェクトとの連携メトリックを活用して価値を示すメトリックとKPIの実際アナリティクスの価値を示すビジネスケースの例ステップ1：問題の定義と測定可能な成果のセットステップ2：成功と失敗を測るメトリックを特定するステップ3：分析ソリューションの実装ステップ4：価値の測定と実証ステップ5：報告と継続的改善ビジネス・アナリティクスにおけるAIとジェネレーティブAI生成AI入門製品デザインへの応用コンテンツ制作における応用マーケティングへの応用カスタマー・エクスペリエンスの向上オペレーションの効率化今後の展望と課題ビジネス・アナリティクスにおけるAIとジェネレーティブAIの使用例ユースケース1：AI主導の顧客インサイトとレコメンデーションユースケース2：コンテンツ制作におけるジェネレーティブAIユースケース3：AIによるサプライチェーンの最適化ユースケース4：AIによる意思決定の強化ユースケース5：ヘルスケア分析におけるAIユースケース6：パーソナライズされた顧客体験のための生成AIユースケース7：小売分析におけるAI事実の矛盾への対処と人間とAIのコラボレーション将来の展望課題と考察AIソリューションのデプロイにおける統合の課題とスケーラビリティAI主導の意思決定におけるバイアスの緩和と公平性の確保AIデプロイにおける技術的・組織的課題コストとリソースの検討将来を見据えたAI投資概要
インデックス
著者について

Content preview from 現代のビジネス分析

第5章. RとPythonによる探索的データ分析

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

探索的データ分析は、ビジネスアナリティクスサイクルの後続のすべてのステップに影響を与える重要な準備ステップであり、よく理解され適切に処理されたデータの強固な基盤の上にモデルが構築されることを保証する。EDAは、データの特性を理解し、エラーや矛盾を特定し、特徴間の関係を明らかにし、仮定を検証し、どのモデルが最良のパフォーマンスを発揮するかについて、情報に基づいた意思決定を行うために使用される。この章では、EDAに関わる主要な各ステップについて説明する。

ジョン・テューキー（John Tukey）、先駆的な統計学者であり、データを理解するために視覚的メソッドを用いることの重要性を強調し、EDAの発展において重要な役割を果たした。Tukeyは、正式な統計モデルを適用する前に、根本的なパターンを明らかにし、異常を発見し、仮定をテストする方法としてEDAを提唱した。彼のアプローチは、分析者が可視化と要約統計を通じてデータと対話し、その構造と関係性について洞察と直観を得ることを奨励している。Tukeyの研究は現代のデータ分析の基礎を築き、データ理解の初期段階におけるEDAの価値を強調した。EDAプロセスの最初のステップは、分析プロジェクトで使用されるデータの質を調査することである。

データの質

データ品質とはデータセットの条件付きである。さまざまなデータ点の価値はデータ内容の質に依存するため、EDAでは特に重要である。

データ品質の特徴

データ品質の評価は、多くの理由からEDAの重要な側面である。第一に、結果の精度に影響する。低品質のデータは、たとえ洗練されたモデルやアルゴリズムであっても、不正確な結果や誤解を招く結果を招く可能性がある。次に、質の低いデータのクリーニングと管理には時間とコストがかかるため、リソースを最大限に活用することが重要である。最も重要なことは、機械学習モデルの性能は学習データの質に大きく依存するということだ。不正確なデータや一貫性のないデータは、モデルのパフォーマンス低下につながる。

質の高いデータには通常、正確性、完全性、一貫性、信頼性、関連性といった特徴がある。重複エントリ、関連性のない情報、不正確さ、欠落値がない。適時性、つまりデータが最新であり、それゆえにまだ有用であることも重要な変数である。

以下のリストでは、それぞれの特徴を定義している：

完全性: この、データセットに欠損値があるかどうかをチェックする。欠損データは、不正確なマシン学習モデルにつながる可能性がある。
一貫性: 一貫性データセット全体のデータの均一性を指す。データの形式のばらつきや冗長性エントリなどのデータの不整合は、結果を歪める可能性がある。
精度: 正確さ（Accuracy）チェックでは、データがモデルとして想定される現実世界の構成要素を正しく表していることを確認する。これらのチェックには、データのエラーを特定し、修正することが含まれる。
関連性: このでは、データが問題文に対処するのに適切で十分なものかどうか、あるいは無関係なデータ列を削除する必要があるかどうかを評価する。
独自性: 、一意性のチェックには、データセットに重複レコードがないことを確認することが含まれる。重複レコードは、機械学習アルゴリズムのパフォーマンスに影響を与える可能性があるからだ。
妥当性 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341633674

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design