Funktionsweise des Spamschutzes

Für eine zeitgemäße Kommunikationslösung ist ein effizienter und weitestgehend automatisierter Umgang mit Spam-Nachrichten unumgänglich. GREYHOUND bietet mit seinem Spamfilter-Modul eine leistungsfähige Lösung. In diesem Abschnitt gehen wir auf die technischen Grundlagen und Hintergründe ein, deren Verständnis hilfreich ist, um die Antispam-Technologie in GREYHOUND optimal für sich ausnutzen zu können.

HILFE – Warum tauchen bei mir so viele Nachrichten im Spamverdacht auf?
Hast Du aktuell ein Problem mit Deiner Spamerkennung und willst wissen, wie Du schnell Abhilfe schaffen kannst? Dann findest Du hier in den FAQ eine Antwort auf Deine Frage.

Spamschutz in GREYHOUND

Unterschiedliche Ansätze zur Spambekämpfung haben auch verschiedene Vor- und Nachteile. GREYHOUND vereint in seinen Spamfiltern deshalb gleich mehrere Antispam-Technologien, um deren Stärken zu potenzieren und die Schwäche gegeneinander auszugleichen.

Selbstlernende Filter passen sich ständig an

Kernstück des Antispam-Moduls sind selbstlernende Filter. Diese lernen aus den Aktionen des Anwenders, was sie falsch oder richtig gemacht haben. Wenn z. B. eine Werbe-E-Mail eintrifft, die der Filter nicht als solche erkennt, korrigiert der Anwender ihn, indem er die Nachricht manuell als Spam kennzeichnet. Der Filter analysiert diese Nachricht dann erneut und aktualisiert sich selbst mit diesen Daten. So erlernt er Textmuster, die als Indizien für Spam zu bewerten sind. Folgen später weitere Nachrichten mit diesen oder ähnlichen Textmustern, so wird er diese entsprechend anders bewerten und dann treffsicherer agieren.

Bayes und Hash analysieren den Inhalt

Es gibt zwei integrierte Mechanismen in GREYHOUND, die den Inhalt und den Aufbau einer Mail analysieren: Bayes und Hash. Bayes ist stark darin, Mails aufgrund ‘verdächtiger’ Begriffe auszusortieren. Hash ist besondern stark darin, Mails, die die Anwender bereits als Spam markiert hat, in seinem Aufbau und seinen technischen Besonderheiten zu analysieren und diese Schlüsse für die weitere Spam-Erkennung heranzuziehen.

Fuzzy Logic verbessert die Erkennung

Zusätzlich zu den selbstlernenden Filtern setzt GREYHOUND auf Fuzzy Logic, also eine „unscharfe Logik“. Sie dient dazu, verschiedene Varianten von Wörtern oder Textmustern besser bewerten zu können. Wenn es z. B. statt „Viagra“ mal „Viagar“ oder „Vlagra“ oder auch „V!@gr@“ heißt, weiß das menschliche Auge sofort, was gemeint ist. Dank unscharfer Fuzzy Logic durchschaut auch der digitale Spamfilter solche Tricks.

Blackhole-Listen reagieren schnell auf neue Spamquellen

Ein weiteres Standbein der Spambekämpfung sind Echtzeit-Listen von Mailservern, die als Spam-Versender bekannt sind oder eben als spamsicher gelten. Solche Listen sind im Internet verfügbar und können jederzeit in Millisekunden abgefragt werden (deshalb „Echtzeit“).

Goodwords/Badwords erlauben dem Nutzer individuelle Eingriffe

Als einfache manuelle Steuermöglichkeit kann man Listen von Schlüsselwörtern festlegen. Goodwords umfassen Begriffe, bei denen es sich der Definition des Anwenders nach grundsätzlich nicht um Spam handelt. Badwords kennzeichnen Nachrichten hingegen eindeutig als Spam. Trifft der Spamfilter in einer Nachricht auf ein Goodword oder Badword, dann klassifiziert er diese sofort entsprechend und setzt die restliche Spamfunktionen für diese Nachricht außer Kraft.

Irrtümer des Spamfilters: “False positives” und “False negatives”

Eines haben alle Spamfilter gemeinsam, gleich welche Prinzipien und Techniken sie letztlich verwenden: Sie können und werden sich mit ihren Einschätzungen auch mal irren. Hierbei sind zwei Fälle zu unterscheiden: “False negatives” sind unerwünschte Spam-Nachrichten, die nicht als solche erkannt werden und dem Anwender deshalb als reguläre Mails zugestellt werden. In solchen Fällen war der Spamfilter nicht streng genug. “False negatives” sind weniger problematisch. Sie erhöhen lediglich den Aufwand für den Anwender, da er solche Nachrichten selbst erkennen und aussortieren muss. “False positives” sind erwünschte reguläre Nachrichten, die vom Filter irrtümlicherweise als Spam erkannt und deshalb aussortiert wurden. In solchen Fällen ist der Spamfilter zu streng bzw. hat nicht genügend Informationen, um bei einem fragwürdigen Inhalt zu erkennen, dass der Absender durchaus vertrauenswürdig ist. Solche “False positives” sind wesentlich kritischer als ihre Pendants, weil sie stets bedeuten, dass eine reguläre, erwünschte Nachricht erstmal dem normalen Kommunikationsablauf entzogen wird. Da es sich bei “False positives” um eigentlich erwünschte und womöglich sogar sehr wichtige Informationen handelt, muss ihre Rate so gering wie möglich gehalten werden.