book

現代のビジネス分析

Name: 現代のビジネス分析
Author: Deanne Larson
ISBN: 9798341633674

by Deanne Larson

March 2025

Beginner to intermediate

470 pages

7h 29m

Japanese

O'Reilly Media, Inc.

Read now

Unlock full access

序文
この本を読むべき人この本を書いた理由本書のナビゲーション本書で使用されている慣例コード例を使うオライリー・オンライン・ラーニング問い合わせ先謝辞
1.ビジネスアナリストとアナリティクスの役割
ビジネスアナリストの役割とは何か？スキルレスポンスアナリストの種類なぜビジネスアナリストはアナリティクスを知る必要があるのか？データの爆発ビジネス・コンテクストアナリティクスアナリティクスの価値に貢献するビジネスアナリストアナリティクスが解決するビジネス課題他チームとのコラボレーションアナリティクスで使われるスキルセットPythonとRアナリティクス・プロジェクトのライフサイクル概要
2.ビジネスアナリストとアナリティクス・プロジェクトの方法論
ビジネス理解ビジネス・オブジェクトを決定する状況を把握する目標を決めるアプローチと計画を確立するツールとテクニックの評価データの探索と準備データの内容と質を評価するデータの選択とクリーニングデータの構築と統合モデル開発のためのデータセットをプロデュースするモデリングと評価分析テクニックを選択するモデルの構築と評価デプロイモデルの性能を評価する評価間隔を決めるモデル演算子モニタリング・モデルモデルの人生再訓練概要
3.RとPython入門
RとPythonのインストールとセットアップのオプションなぜRとPythonを学ぶのか？一度に両方を学ぶのと、一度に一つを学ぶのとでは、どちらが良いだろうか？さまざまな学習戦略の長所と短所RインストレーションPythonのインストールRとPythonスクリプティングR言語スクリプトPython言語スクリプティングオブジェクト指向概念OOPの構造OOPの原則RとPythonのデータ型Rデータ型R構造Pythonのデータ型Pythonデータ構造リレーショナルデータベースとの相互作用なぜリレーショナルデータベースなのか？R リレーショナルデータベースへの接続Rとリレーショナルデータベースの例SQLitePythonとリレーショナルデータベースとの接続Pythonとリレーショナルデータベースの例概要
4.RとPythonによる統計解析
分析プロジェクトの例テレコム・チャーンA/Bテストマーケティング・キャンペーン財務予測医療診断問題提起から始める分析的問題にたどり着く分類回帰何を測定したいのか？分析アプローチ電子データ処理教師なし学習回帰のための統計分析分類のための分析仮説検証の役割アナリティクスにおける可視化EDAをサポートするRとPythonによる可視化回帰の可視化分類の可視化概要
5.RとPythonによる探索的データ分析
データの質データ品質の特徴データ・プロファイリングクラスタリングと教師なし学習教師なし学習の目的教師あり学習に影響を与えるクラスタリングの例K平均クラスタリング階層的クラスタリングEDAで使用されるその他の教師なしメソッド外れ値を特定する回帰における外れ値分類における外れ値モデリングのためのデータ準備サンプリングトレーニングとテストデータ変換データ操作機能の選択と削減フィーチャー・セレクション特徴削減テクニック概要
6.RとPythonによるモデリングの応用と評価
モデリングのステップモデルの選択とトレーニングモデル評価モデルの最適化モデルのデプロイモデルのモニタリングとメンテナンス適切なアルゴリズムを選択する回帰一般的な使用例線形回帰式Rで線形回帰を行うPythonで線形回帰を行う線形回帰のユースケースその他の回帰の種類回帰モデルの課題回帰の他のアルゴリズム回帰のための決定木線形回帰の評価分類一般的な使用例分類アルゴリズムRでの分類Pythonで分類する分類の使用例：テレコム解約格付け評価分類ユースケースの評価概要
7.モデリングとアルゴリズムの選択
アルゴリズムアルゴリズム基準問題の種類インタプリタ・モデル予測精度トレーニングのスピード予測速度ハイパーパラメーターのチューニング小さなデータセットを扱う大規模データセットを扱うフィーチャー・インタラクションデータの特徴例適切なアルゴリズムを選択する売上予測に適切なアルゴリズムを選択する基準を評価する決定と実装概要
8.モデル演算子
モデル運用の概要モデル・オペレーション・プロセスモデル採点Rでモデル採点：リアルタイムスコアリングのためにシャイニーアプリを使うPythonでモデル採点：Streamlitでモデルをデプロイするモデル・モニタリングモデル・パフォーマンス・モニタリングの主要業績評価指標モデル自動モニタリングのテクニックモデルの再トレーニングモデル再トレーニングのためのトリガーイベントモデルの再トレーニングを自動化するテクニックRでの実装：スケジュールされた再トレーニングのためにcronジョブを使用するPythonでの実装：ワークフロー管理にAirflowのようなツールを活用するレポートを作成する最終報告書の内容と構成レポート自動生成のテクニックRでの実装：R Markdownとknitrでレポートを作成するPythonでの実装：Jupyterノートブックとnbconvertでレポートを作成するバージョン管理とモデルの再現性コラボレーションとドキュメンテーションの実践ModelOpsの使用例小売業の売上予測：スコアリングとモニタリングの自動化不正検知：動的なモデルの再トレーニングとレポーティング顧客解約予測：スケジュールされたモデルの再トレーニングと最終レポート作成既存のシステムやインフラとの統合MLOpsの今後の方向性概要
9.高度なビジュアライゼーション
Rシャイニーによる高度な可視化Rシャイニーとは何か？Rシャイニーの主な特徴と機能環境をセットアップする初めてのシャイニー・アプリを作る高度なUI開発例リアルタイムの売上を監視するダッシュボードの作成Pythonビジュアライゼーションを学ぶPythonによる可視化の概要共通ライブラリ：Matplotlib、Seaborn、Plotly、DashMatplotlib：Pythonによる可視化の基礎スタイルと色でプロットをカスタマイズする統計プロット：散布図、ヒートマップ、バイオリンプロットPlotlyを使ったインタラクティブなプロットMatplotlibとPlotlyで3Dプロットする地理空間データの可視化ダッシュボード作成：Plotly Dashを使うケーススタディ高度な可視化プロジェクトにPythonを使うRシャイニーとPythonビジュアライゼーションの選択概要

10.アナリティクスで最新のデータ型を扱う
半構造化データ（JSON）JSONデータにPythonを使うJSONデータにRを使うソーシャルメディア・データソーシャルメディア・データの種類ソーシャルメディアのデータ分析にPythonを使うソーシャルメディアのデータ分析にRを使う画像データPythonによる画像処理Rによる画像処理ビデオデータビデオデータにPythonを使うビデオデータにRを使う概要
11.アナリティクスによるビジネス価値の測定とAIの役割
アナリティクスにおけるビジネス価値とは何か？戦略的インパクトオペレーションの効率化顧客満足とロイヤルティビジネス価値を測定するメトリックとKPI財務メトリックオペレーショナル・メトリクス顧客メトリック組織との連携メトリックと組織目標・オブジェクトとの連携メトリックを活用して価値を示すメトリックとKPIの実際アナリティクスの価値を示すビジネスケースの例ステップ1：問題の定義と測定可能な成果のセットステップ2：成功と失敗を測るメトリックを特定するステップ3：分析ソリューションの実装ステップ4：価値の測定と実証ステップ5：報告と継続的改善ビジネス・アナリティクスにおけるAIとジェネレーティブAI生成AI入門製品デザインへの応用コンテンツ制作における応用マーケティングへの応用カスタマー・エクスペリエンスの向上オペレーションの効率化今後の展望と課題ビジネス・アナリティクスにおけるAIとジェネレーティブAIの使用例ユースケース1：AI主導の顧客インサイトとレコメンデーションユースケース2：コンテンツ制作におけるジェネレーティブAIユースケース3：AIによるサプライチェーンの最適化ユースケース4：AIによる意思決定の強化ユースケース5：ヘルスケア分析におけるAIユースケース6：パーソナライズされた顧客体験のための生成AIユースケース7：小売分析におけるAI事実の矛盾への対処と人間とAIのコラボレーション将来の展望課題と考察AIソリューションのデプロイにおける統合の課題とスケーラビリティAI主導の意思決定におけるバイアスの緩和と公平性の確保AIデプロイにおける技術的・組織的課題コストとリソースの検討将来を見据えたAI投資概要
インデックス
著者について

Content preview from 現代のビジネス分析

第6章. RとPythonによるモデリングの応用と評価

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

データを視覚化し、理解し、前処理を行う探索的データ分析の綿密なプロセスの後、我々はデータサイエンスのライフサイクルで最も重要な段階の一つであるモデリング段階に移行する。この段階は、理論的な知識と実践的な応用が出会う場所である。EDAから得られた洞察を活用して、データサイエンティストは未知の結果を予測または分類するモデルを選択、設計、訓練する。クリーニングされ、変換されたデータをアルゴリズムに送り込み、生の情報を実用的な洞察に変える段階である。モデリング段階をより深く掘り下げながら、モデルが正確でインタプリタブルであることを保証するために、様々なアルゴリズム、テクニック、ベストプラクティスを探求していく。

モデリングのステップ

モデリングの段階に深く入る前に、モデリングの目的を考えてみよう。モデリングは、新しい未知のデータに対して正確な予測や分類を行うために、データを使って予測モデルを構築し、トレーニングすることに焦点を当てる。モデルには教師あり、教師なしがあるが、このセクションでは両方を取り上げる。

モデルの選択とトレーニング

モデルの選択とトレーニングの最初のステップの一つは、アルゴリズムを選択することである。アルゴリズムとは、、コンピュータ・プログラムがデータからパターンや関係を学習し、その学習に基づいて予測や決定を行うために従う、明確に定義された規則や手順のセットである。マシン学習アルゴリズムは、入力データ（学習データ）を分析してパターンや特徴を特定し、その理解を応用して新しい未見のデータに対して予測や分類を行う。例えば、教師あり学習では、アルゴリズムは入力（特徴）から出力（ラベル）へのマッピングを、予測と実際の結果の誤差を最小化することによって学習する。一般的な機械学習アルゴリズムには、決定木、線形回帰、ニューラルネットワーク、サポートベクターマシン（SVM）などがある。あなたが解決しようとする問題（例えば、連続的またはカテゴリー的な結果の予測）とデータの特徴に基づいて選択すべきである。

アルゴリズムの例としては、決定木や線形回帰がある。決定木はグラフィカルな表現であり、決定とその潜在的な結果を木のような構造でモデル化するマシン学習アルゴリズムである。分類や回帰のタスクに使われ、予測や決定を行うために、特徴条件付きに基づいてデータをサブセットに分割する。もう一つの例は線形回帰である。線形回帰は 、観測されたデータに一次方程式を当てはめることで、従属変数と1つ以上の独立変数の関係をモデル化するために使われる統計手法であり、マシン学習アルゴリズムである。主に連続的な数値結果の予測や変数間の線形関係の理解に使われる。

アルゴリズムが選択されると、データに対するアルゴリズムの適用に基づいてモデルが作成される。これは、トレーニングとテストの2つのステップで行われる。トレーニングとテストのステップは、モデリングプロセスの基本である。訓練とテストは、モデルが訓練されたデータに適合するだけでなく、新しい未知のデータに対してもうまく一般化することを保証する。トレーニングでは、選択したアルゴリズムにトレーニングデータを投入する。次にアルゴリズムは、予測値と実際の結果の差を最小化するように内部パラメータを調整することで、データから学習する。このステップの目標は、訓練データに最も適合するモデル・パラメータを発見することである。予測値と実際の結果の差は、 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341633674

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design