2章フィッシングサイトと迷惑メールの検出

ソーシャルエンジニアリングは、現代のあらゆる個人や組織が直面している、最大の脅威のひとつである。よく知られているソーシャルエンジニアリングを悪用した手口のひとつに、フィッシングがある。攻撃者は偽装したメールやWebサイトを使い、企業に攻撃を仕掛ける。膨大な数のメールを受信する企業では、それらすべてを検出することはできない。それゆえに、フィッシングに対する防御のために新しい手法と保護策が必要なのだ。この章では、まずは機械学習の手法に読者が慣れるために、フィッシングサイトおよび迷惑メールの検出器の開発を通して、データセットのロード方法、データセットの分割、ハイパーパラメータのチューニング、訓練、結果の評価という一連のステップについて解説していく。

本章では、次の内容を取り扱う。

  • ソーシャルエンジニアリングの概要
  • フィッシングサイト検出器の開発
    • ロジスティック回帰を使ったフィッシングサイト検出
    • 決定木を使ったフィッシングサイト検出
  • 迷惑メール検出器の開発
    • NLP概論
    • tf-idfを使った迷惑メール検出

2.1 ソーシャルエンジニアリングの概要

ソーシャルエンジニアリングとは、その定義では、有用かつ機密性の高い情報を入手するために行う、他者への心理的操作である。言い換えるならば、犯罪者はソーシャルエンジニアリングを使用し、他者を騙すことで機微な情報を手に入れるのだ。

ソーシャルエンジニアリングの手法は複数ある。たとえば次のようなものだ。

誘惑
対象者に報酬や贈り物をすることを約束し、情報を明らかにするよう説得する。
なりすまし
関係者のふりをする。
ゴミ箱漁り
ゴミ箱から(住所や電子メールアドレスなどの記載された紙といった)有用な情報を集める。 ...

Get セキュリティエンジニアのための機械学習 ―AI技術によるサイバーセキュリティ対策入門 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.