book

機械学習とセキュリティ

Name: 機械学習とセキュリティ
ISBN: 9798341651500

by Clarence Chio, David Freeman

May 2025

Beginner to intermediate

386 pages

6h 6m

Japanese

O'Reilly Media, Inc.

Read now

Unlock full access

序文
この本には何が書かれているのか？この本は誰のためのものか？本書で使用されている慣例コード例を使うオライリー・サファリ問い合わせ先謝辞
1.なぜマシン学習とセキュリティなのか？
サイバー脅威の状況サイバー攻撃者の経済ハッキング・スキルのマーケットプレイス間接的収益化アップショットマシンラーニングとは何か？機械学習とは何か？機械学習を利用する敵セキュリティにおけるマシンラーニングの実際の使用例スパムとの戦い：反復的アプローチセキュリティにおけるマシンラーニングの限界
2.分類とクラスタリング
マシンラーニング問題とアプローチ機械学習の実践：実例学習アルゴリズムのトレーニングモデル・ファミリー損失関数最適化教師あり分類アルゴリズムロジスティック回帰決定木意思決定フォレストサポートベクターマシンナイーブ・ベイズk-最近傍ニューラルネットワーククラス分けにおける実践的な考察モデルファミリーを選ぶトレーニングデータの構築フィーチャー・セレクションオーバーフィットとアンダーフィット閾値の選択とモデルの比較クラスタリングクラスタリング・アルゴリズムクラスタリング結果を評価する結論
3.異常検出
教師あり学習と異常検出を使い分けるタイミングヒューリスティックによる侵入検知データ主導のメソッド異常検出のための特徴工学ホスト侵入検知ネットワーク侵入検知ウェブアプリケーション侵入検知まとめデータとアルゴリズムによる異常検出予測（教師ありマシンラーニング）統計メトリック適合性教師なし機械学習アルゴリズム密度に基づくメソッドまとめ異常検出におけるマシン学習の課題レスポンスと軽減策実用的なシステム設計の懸念説明しやすいように最適化する異常検出システムの保守性人間のフィードバックを統合する逆境を緩和する結論
4.マルウェア解析
マルウェアを理解するマルウェア分類の定義マルウェア：舞台裏フィーチャー・ジェネレーションデータ収集機能を生成するフィーチャー・セレクション特徴から分類へマルウェアのサンプルとラベルを入手する方法結論
5.ネットワークトラフィック分析
ネットワーク防御の理論アクセス制御と認証侵入検知ネットワーク内の攻撃者を検知するデータ中心のセキュリティハニーポット概要機械学習とネットワークセキュリティキャプチャからフィーチャーへネットワークにおける脅威ボットネットとあなたネットワーク攻撃を分類する予測モデルの構築データを探るデータの準備分類教師あり学習半教師付き学習教師なし学習上級アンサンブル結論
6.コンシューマ・ウェブを守る
コンシューマ・ウェブの収益化虐待の種類とそれを阻止するデータ認証とアカウントの乗っ取りアカウント作成金融詐欺ボット活動虐待問題のための教師あり学習ラベリングデータコールドスタートとウォームスタートの比較偽陽性と偽陰性複数のレスポンス大型攻撃クラスタリングの悪用例スパムドメインをクラスタリングするクラスターを生成する得点クラスタークラスタリングのさらなる方向性結論
7.本番システム
機械学習システムの成熟度とスケーラビリティの定義セキュリティ機械学習システムにとって何が重要か？データの質問題：データセットの偏り問題：ラベルの不正確さソリューションデータ品質問題：データの欠落ソリューションデータの欠落モデル・クオリティ問題：ハイパーパラメータの最適化ソリューションハイパーパラメータの最適化特集フィードバックループ、モデルのA/Bテスト特徴再現可能で説明可能な結果パフォーマンス目標：低遅延、高スケーラビリティパフォーマンスの最適化分散コンピューティング・フレームワークによる水平スケーリングクラウドサービスを利用するメンテナンス性問題：チェックポイント、バージョン管理、モデルのデプロイ目標：グレースフル・デグラデーション目標：簡単に調整・設定可能モニタリングとアラートセキュリティと信頼性特集逆境における堅牢性特集データ・プライバシーの保護と保証フィードバックとユーザビリティ結論
8.敵対的機械学習
用語解説敵対的MLの重要性マシン学習アルゴリズムのセキュリティ脆弱性攻撃移譲性攻撃テクニックモデル・ポイズニング例バイナリ分類器ポイズニング攻撃攻撃者の知識毒物攻撃に対する防御攻撃テクニック回避攻撃例バイナリ分類器回避攻撃回避攻撃に対する防御結論
A.第2章補足資料
メトリックの詳細ロジスティック回帰モデルのサイズロジスティック回帰コスト関数を実装するコスト関数を最小化する

B.オープンソースインテリジェンスの統合
セキュリティ・インテリジェンス・フィードジオロケーション
インデックス

Content preview from 機械学習とセキュリティ

第2章. 分類とクラスタリング

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

この章では、セキュリティアプリケーションに最も有用な機械学習テクニックについて述べる。機械学習の基本原理をいくつか取り上げた後、セキュリティ問題に取り組む際に選択できる機械学習アルゴリズムのツールボックスを提供する。各テクニックについて、いつ、どのように使うべきかを知ることができるように、十分な詳しさを盛り込むように努めたが、アルゴリズムのニュアンスや複雑さをすべて網羅しようとはしていない。

この章は、本書の他の部分よりも数学的な詳細が多い。詳細を飛ばしてテクニックを試したい場合は、「実践におけるマシン学習」のセクションを読むことをお勧めする：実践例 "と"分類における実践的考察 "のセクションを読んでから、最も一般的な教師あり・教師なしのアルゴリズムである、ロジスティック回帰、決定木とフォレスト、k-meansクラスタリングを見ることをお勧めする。

マシンラーニング問題とアプローチ

あなたが会社のコンピューター・セキュリティを担当しているとしよう。ファイアウォールを設置し、フィッシング・トレーニングを実施し、安全なコーディングの実践を保証する。しかし、一日の終わりにCEOが気にするのは、情報漏えいを起こさないことだけだ。そこであなたは、あらゆる攻撃対象への悪質なトラフィックを検知しブロックできるシステムを構築することにした。最終的に、これらのシステムは以下を決定しなければならない：

ネットワークを通じて送信されるすべてのファイルにマルウェアが含まれているか？
ログインを試みるたびに、誰かのパスワードが漏洩していないか？
受信したすべてのEメールについて、それはフィッシングの試みなのだろうか？
サーバへのすべてのリクエストに対して、それはサービス拒否（DoS）攻撃なのだろうか？
ネットワークからのアウトバウンドリクエストごとに、ボットがコマンド＆コントロールサーバを呼び出していないか？

これらのタスクはすべて分類タスクであり、観測された事象の性質に関する二項対立的な決定である。

したがって、あなたの仕事は次のように言い換えることができる：

ネットワーク上のすべてのイベントを悪意あるものか正当なものかに分類する。

このような言い方をされると、ほとんど絶望的な仕事に思える。しかし恐れることはない！データという秘密兵器があるのだ。

具体的には、バイナリファイル、ログイン試行、受信メール、受信リクエスト、送信リクエストの履歴ログがある。場合によっては、過去の攻撃を知っていて、その攻撃とログの対応するイベントを関連付けることができるかもしれない。さて、問題を解決するために、過去のデータから悪意のある攻撃を示すと思われるパターンを探す。例えば、1つのIPアドレスが5分間に1秒間に20回以上サーバにリクエストしている場合、それはおそらくDoS攻撃であることを観察する。(過去にそのような負荷でサーバがダウンしたのかもしれない）。

つまり、分類しようとしているものに関するデータを入力として受け取り、バイナリ・レスポンスを出力する関数である：「悪意がある "か "正当な "かである。この例では、このアルゴリズムは非常に単純である：¹リクエスト前の5分間におけるIPアドレスからのリクエスト数を入力とし、その数が6,000未満であれば "正当"、6,000以上であれば "悪意ある ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341651500

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

機械学習とセキュリティ

by Clarence Chio, David Freeman

第2章. 分類とクラスタリング

マシンラーニング問題とアプローチ

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.