book

機械学習とセキュリティ

Name: 機械学習とセキュリティ
ISBN: 9798341651500

by Clarence Chio, David Freeman

May 2025

Beginner to intermediate

386 pages

6h 6m

Japanese

O'Reilly Media, Inc.

Read now

Unlock full access

序文
この本には何が書かれているのか？この本は誰のためのものか？本書で使用されている慣例コード例を使うオライリー・サファリ問い合わせ先謝辞
1.なぜマシン学習とセキュリティなのか？
サイバー脅威の状況サイバー攻撃者の経済ハッキング・スキルのマーケットプレイス間接的収益化アップショットマシンラーニングとは何か？機械学習とは何か？機械学習を利用する敵セキュリティにおけるマシンラーニングの実際の使用例スパムとの戦い：反復的アプローチセキュリティにおけるマシンラーニングの限界
2.分類とクラスタリング
マシンラーニング問題とアプローチ機械学習の実践：実例学習アルゴリズムのトレーニングモデル・ファミリー損失関数最適化教師あり分類アルゴリズムロジスティック回帰決定木意思決定フォレストサポートベクターマシンナイーブ・ベイズk-最近傍ニューラルネットワーククラス分けにおける実践的な考察モデルファミリーを選ぶトレーニングデータの構築フィーチャー・セレクションオーバーフィットとアンダーフィット閾値の選択とモデルの比較クラスタリングクラスタリング・アルゴリズムクラスタリング結果を評価する結論
3.異常検出
教師あり学習と異常検出を使い分けるタイミングヒューリスティックによる侵入検知データ主導のメソッド異常検出のための特徴工学ホスト侵入検知ネットワーク侵入検知ウェブアプリケーション侵入検知まとめデータとアルゴリズムによる異常検出予測（教師ありマシンラーニング）統計メトリック適合性教師なし機械学習アルゴリズム密度に基づくメソッドまとめ異常検出におけるマシン学習の課題レスポンスと軽減策実用的なシステム設計の懸念説明しやすいように最適化する異常検出システムの保守性人間のフィードバックを統合する逆境を緩和する結論
4.マルウェア解析
マルウェアを理解するマルウェア分類の定義マルウェア：舞台裏フィーチャー・ジェネレーションデータ収集機能を生成するフィーチャー・セレクション特徴から分類へマルウェアのサンプルとラベルを入手する方法結論
5.ネットワークトラフィック分析
ネットワーク防御の理論アクセス制御と認証侵入検知ネットワーク内の攻撃者を検知するデータ中心のセキュリティハニーポット概要機械学習とネットワークセキュリティキャプチャからフィーチャーへネットワークにおける脅威ボットネットとあなたネットワーク攻撃を分類する予測モデルの構築データを探るデータの準備分類教師あり学習半教師付き学習教師なし学習上級アンサンブル結論
6.コンシューマ・ウェブを守る
コンシューマ・ウェブの収益化虐待の種類とそれを阻止するデータ認証とアカウントの乗っ取りアカウント作成金融詐欺ボット活動虐待問題のための教師あり学習ラベリングデータコールドスタートとウォームスタートの比較偽陽性と偽陰性複数のレスポンス大型攻撃クラスタリングの悪用例スパムドメインをクラスタリングするクラスターを生成する得点クラスタークラスタリングのさらなる方向性結論
7.本番システム
機械学習システムの成熟度とスケーラビリティの定義セキュリティ機械学習システムにとって何が重要か？データの質問題：データセットの偏り問題：ラベルの不正確さソリューションデータ品質問題：データの欠落ソリューションデータの欠落モデル・クオリティ問題：ハイパーパラメータの最適化ソリューションハイパーパラメータの最適化特集フィードバックループ、モデルのA/Bテスト特徴再現可能で説明可能な結果パフォーマンス目標：低遅延、高スケーラビリティパフォーマンスの最適化分散コンピューティング・フレームワークによる水平スケーリングクラウドサービスを利用するメンテナンス性問題：チェックポイント、バージョン管理、モデルのデプロイ目標：グレースフル・デグラデーション目標：簡単に調整・設定可能モニタリングとアラートセキュリティと信頼性特集逆境における堅牢性特集データ・プライバシーの保護と保証フィードバックとユーザビリティ結論
8.敵対的機械学習
用語解説敵対的MLの重要性マシン学習アルゴリズムのセキュリティ脆弱性攻撃移譲性攻撃テクニックモデル・ポイズニング例バイナリ分類器ポイズニング攻撃攻撃者の知識毒物攻撃に対する防御攻撃テクニック回避攻撃例バイナリ分類器回避攻撃回避攻撃に対する防御結論
A.第2章補足資料
メトリックの詳細ロジスティック回帰モデルのサイズロジスティック回帰コスト関数を実装するコスト関数を最小化する

B.オープンソースインテリジェンスの統合
セキュリティ・インテリジェンス・フィードジオロケーション
インデックス

Content preview from 機械学習とセキュリティ

第8章逆説的機械学習敵対的機械学習

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

機械学習がクリティカルなシステムでユビキタスにデプロイされ始めると、その信頼性は当然精査されるようになる。警戒心を抱かないことが重要だが、敵対的エージェントがマシン学習システムにもたらす脅威は現実のものとなっている。ハッカーがファイアウォールの脆弱性を利用してウェブサーバにアクセスするのと同じように、機械学習システム自体も攻撃者の目的を達成するために狙われる可能性がある。従って、このようなソリューションを戦線に投入する前に、その弱点を考慮し、ストレス下でどの程度可鍛性があるかを理解することが極めて重要である。

敵対的機械学習とは、敵対的環境におけるマシン学習の脆弱性に関する研究である。セキュリティと機械学習の研究者は、機械学習アンチウイルスエンジンに対する実用的な攻撃に関する研究を発表している、¹スパムフィルター、²ネットワーク侵入検知器、画像分類器、感情分析器、スパムフィルタに対する実用的な攻撃に関する研究を発表している、³センチメントアナライザーなどである、⁴^,⁵などがある。このような攻撃が実際に観測されることはほとんどないにもかかわらず、この分野の研究は近年ますます活発化している。情報セキュリティ、国家主権、人命が危機に瀕しているとき、機械学習システム設計者は、攻撃を先取りし、これらのシステムに安全装置を組み込む責任がある。

マシン学習システムにおける脆弱性は、システム設計の欠陥、アルゴリズムの基本的な限界、あるいはその両方の組み合わせから生じる可能性がある。本章では、マシン学習アルゴリズムの脆弱性と、それに対する攻撃を検証する。そして、得られた知識を用いて、攻撃に対してよりレジリエンスなシステム設計の動機付けを行う。

用語解説

敵対的機械学習の初期の研究では、機械学習システムに対する攻撃を3つの次元の特性に基づいて定性的に分析するための分類法が定義されていた：⁶

影響力

原因攻撃とは、訓練データや訓練段階のパラメータを改ざんすることで、敵対行為者が訓練プロセスに影響を与えようとする試みを指す。敵対者がオフラインで作成されたトレーニングセットを操作することは困難であるため、この種の攻撃は主にオンライン学習者に関連する。オンライン学習者は、ユーザ対話または予測に対するフィードバックを直接利用して学習済みモデルを更新することで、変化するデータ分布に自動的に適応する。適応性のために定常性を犠牲にすることで、このような学習システムは、観測されたばかりのデータで統計モデルをインクリメント学習することで、継続的に進化する。オンライン学習の典型的な使用例としては、ユーザの修正と強化から学習する画像分類サービスや、頻繁にバイラル・トラフィック・スパイクを経験するWebサイトでの悪意あるトラフィック検出などがある。

探索的攻撃は、純粋にマシン学習システムとの学習後の相互作用に基づいている。この攻撃モードでは、行為者は訓練されたデータマニホールドに対して影響力を持たないが、その代わりに敵対的なスペースを発見して利用し、モデルに設計されていないミスを犯させる。探索的攻撃の素朴な例としては、機械学習分類器の入力空間を総当たりでファジングし、誤って分類されたサンプルを発見することである。

特異性

標的型攻撃とは、モデルの予測を意図的にシフトさせ、別の焦点を絞った結果へと導く試みを指す。例えば、マルウェアファミリー分類器に対する標的型攻撃は、マルウェアファミリーAに属するサンプルをマルウェアファミリーBとして確実に誤分類させる可能性がある。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341651500

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

機械学習とセキュリティ

by Clarence Chio, David Freeman

第8章逆説的機械学習敵対的機械学習

用語解説

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.