
This is the Title of the Book, eMatter Edition
Copyright © 2005 O’Reilly & Associates, Inc. All rights reserved.
72
|
Kapitel 4: SpamAssassin
Links
Max.
Linie
Max.
Linie
Die Summe der auf diese Art entdeckten verdächtigen Anzeichen bestimmt die
Wahrscheinlichkeit, dass eine E-Mail Spam sein könnte, wobei die verschiedenen
Kriterien unterschiedlich gewichtet sind.
Der Rest dieses Abschnitts beschreibt, welche Anzeichen zur Spam-Erkennung her-
angezogen werden und wie die Spam-Wahrscheinlichkeit berechnet wird.
Tests und Punkte
SpamAssassin kodifiziert die verschiedenen Spam-Anzeichen in so genannten Tests.
Ein Test ist eine Prüfungsvorschrift, die auf eine E-Mail angewendet wird und ent-
weder erfolgreich ist oder nicht. Die meisten Tests prüfen, ob ein regulärer Aus-
druck in der E-Mail vorkommt, aber es gibt auch andere Testarten. Zu jedem Test
gehört eine Punktzahl (englisch: score). Die Summe der Punkte aller erfolgreichen
Tests ist die Spam-Punktzahl der E-Mail.
Für die Bedeutung der Spam-Punktzahlen gilt Folgendes: E-Mails mit negativer
Punktzahl sind eher nicht Spam; E-Mails mit positiver Punktzahl enthalten tenden-
ziell Spam. Je höher die Punktzahl in der jeweiligen Richtung, desto wahrscheinli-
cher ist die Einstufung. Von den SpamAssassin-Entwicklern ist vorgegeben, dass
eine E-Mail ab der Punktzahl 5 als Spam angesehen werden kann. Dies ist aber letz-
ten Endes Geschmackssache. Nach der Lektüre dieses Kapitels kann der Leser
selbst entscheiden, wie aggressiv oder konservativ die eigene SpamAssassin-Installa-
tion konfiguriert werden soll.
Die meisten Tests in SpamAssassin sind positive Tests, das heißt, sie testen auf
Anzeichen von Spam. Es gibt jedoch auch einige negative Tests, die auf Anzeichen
prüfen, dass eine E-Mail eher nicht Spam ist. Beide Arten von Tests funktionieren
vollkommen identisch.
Statische Tests
Der Großteil der Tests in SpamAssassin sind so genannte statische Tests. Sie prüfen
einen bestimmten Aspekt der vorliegenden E-Mail und sind genau dann erfolgreich,
wenn dieser Aspekt aufzufinden war. Diese Tests sind also unabhängig von frühe-
ren Läufen oder externen Datenbanken.
Die Zusammenstellung der statischen Tests hat sich im Laufe der Jahre aus den
Beobachtungen und Erfahrungen der SpamAssassin-Entwickler und -Anwender
ergeben. Viele Tests könnte der Gelegenheitsanwender selbst erstellen, zum Bei-
spiel die zahlreichen Tests, die nach Werbephrasen in den E-Mails suchen, wie
»Make money fast«, »Extra Cash« oder auch »Click to be removed«. Dazu kommen
zahlreiche Phrasen, in denen Medizin, Drogen oder pornografisches Material ange-
boten wird. Einige Tests »bestrafen« E-Mails, die HTML enthalten. Dies mag kon-
trovers sein, Tatsache ist aber, dass E-Mails, die HTML enthalten, öfter Spam sind