Skip to Content
セキュリティエンジニアのための機械学習 ―AI技術によるサイバーセキュリティ対策入門
book

セキュリティエンジニアのための機械学習 ―AI技術によるサイバーセキュリティ対策入門

by Chiheb Chebbi, 新井 悠, 一瀬 小夜, 黒米 祐馬
November 2021
Beginner to intermediate
312 pages
4h 3m
Japanese
O'Reilly Japan, Inc.
Content preview from セキュリティエンジニアのための機械学習 ―AI技術によるサイバーセキュリティ対策入門

5章データセットの作成

新井 悠

本章は日本語版オリジナルの記事である。これまで既存のデータセットを使用することで、さまざまな情報セキュリティ領域に役立つ分類器などを開発する手法について紹介してきた。一方で、ある仮説を立証するためにデータセットが必要な場合は、その仮説に応じたデータセットを1から作り上げる必要がある。ほかにも、企業の中にだけに存在するデータを機械学習を使用して解決したり、その組織固有の問題を解決するならば、そうしたデータをデータセットに仕立て上げなくてはならない。そこで、本章ではデータセットの作成方法について紹介していく。本章で紹介する内容は次のとおりである。

  • サイバー脅威インテリジェンスとその自動化
  • Twitterのスクレイピング
  • PigeonXTを使ったラベリング

5.1 サイバー脅威インテリジェンスとは

サイバー脅威インテリジェンス(Cyber Threat Intelligence)とは、一般にサイバー空間における有害事象を緩和する目的のために役立つ、脅威自体、あるいは脅威行為者(Attribution)に関する情報を指す。今般、こうしたサイバー脅威インテリジェンスをサービスとして提供している組織や企業が存在している。企業などはこれらのサイバー脅威インテリジェンスサービスを購入することで情報を入手し、情報セキュリティ対策に役立てられるようになっている。それらの情報の、より具体的な内容はたとえば次のようなものだ。

  • 脆弱性に関する情報。CVSS(Common Vulnerability Scoring System)や脆弱性の悪用を可能にするPoC(Proof-of-Concept)コードを含むツール
  • IoC(Indicators of Compromise)情報。特定の攻撃者の使用していたIPアドレスやマルウェアのファイル名・ハッシュ値、通信先URLなど ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

並行プログラミング入門 ―Rust、C、アセンブリによる実装からのアプローチ

並行プログラミング入門 ―Rust、C、アセンブリによる実装からのアプローチ

高野 祐輝
バイオインフォマティクスデータスキル ―オープンソースツールを使ったロバストで再現性のある研究

バイオインフォマティクスデータスキル ―オープンソースツールを使ったロバストで再現性のある研究

Vince Buffalo, 片山 俊明, 川島 秀一, 鈴木 治夫, 山本 泰智, 酒匂 寛, 山村 吉信

Publisher Resources

ISBN: 9784873119076Other