
5
−
3
—
メールソフトによるスパムメールの振り分け
■ 統計的にスパムメールを判定する
送信者を認証する技術は進化を続けていますが、スパムメールを送信する業
者はなくなりません。このため、多くのメールソフトでは受信したメールの中
身を見て、自動的にスパムメールかどうかを振り分ける機能を備えています。
スパムメールの内容はそれぞれのメールで異なるため、受信者にとってどの
メールが迷惑であるかを正確に判定することは容易ではありません。
そんな中で、スパムメールを自動的に検出するために、現在使われている代
表的な方法は統計的な処理によるものです。よく使われている例として、ベイ
ジアンフィルタを使った方法について解説します。
ベイジアンフィルタは、統計学で使われるベイズの定理をもとにした方法で、
メールに含まれる単語などの特徴を使ってスパムメールを判別します。
過去に受信したメールを使って、「スパム」と「非スパム」のどちらに分類
されるかを学習し、新しいメールが受信されたときに、そのどちらに分類され
るべきかを統計的に判断することが特徴です。たとえば、単語を使う場合は、
そのメールに含まれる単語の登場頻度などを調べ、それがスパムメールである
確率を計算します。そして、スパムメールである確率が通常のメールである確
率よりも大きいとき、そのメールを迷惑メールフォルダに格納します。
ベイジアンフィルタは、次の手順で処理されます。
5
3
メールソフトによるスパムメール
の振り分け
・ベイジアンフィルタによるスパムメールの判別のしくみを知りたい方 ...