von Chactory » 23. Dez 2012, 14:31
Hallo Dominik, hallo Anbuva!
Wir sind noch gar nicht richtig auf die Anfangsfrage eingegangen: enn ich entscheiden muss, ob Spam oder nicht, nehme ich folgende Informationen:
Absenderadresse
Return-to-Adresse
Mail-Inhaltstext
Ziel-URLs von Links im Inhaltstext
Die meisten Mail-Clients zeigen im Postfach an:
Absender/Absenderadresse
Betreff
Empfangsdatum
Größe/Anhänge
An diesen wenigen Angaben im Posteingangsfach des Mail-Clients kann ein Mensch meist schon gleich erkennen, ob es sich um Non-Spam oder Spam handelt. Michels
genialer (!) Mail-Textformat-Reader erlaubt aus dem Trainingsfenster heraus das Öffnen einer Mail in einem reinen Textformat,
ohne oder
mit Quelltext-/Headerdaten. In diesem Reader wird kein aktiver Code ausgeführt, wie z.B. Webbugs (Tracker-Pixel) – inzwischen sperren auch fast alle Mail-Clients solche Webbugs über die Nachladenfunktion für Bilder.
(Nebenbei: Aus diesem Grund ist der Image-Filter des Spamihilators meines Erachtens obsolet, weil er bei nachzuladenden Signatur-Images gleich die gesame Mail als Spam-Mail aussiebt. Leider verwenden manche Firmen solche Signatur-Images immer noch, vermutlich weil die IT-Abteilungen es einfacher finden, ggf. geänderte Signaturbilder nur noch auf dem Server ändern zu müssen.)
Wiederholt vom gleichen Absender
ausgehender Spam kann natürlich mit der Blockierten-Liste auch vom Spamihilator ausgesiebt werden.
Die Returnadresse
findet sich im Mailheader und erfordert somit bereits genaueres Hinschauen. Leider ergab eine einfache Regel im Regel-Filter, alle Mails als Spam zu betrachten, wenn die Returnadresse ungleich Absenderadresse ist, einige falsch-positive Erkennungen und mußte deshalb wieder aufgegeben werden. Viele Webshops verwenden darin unterschiedliche Einträge – wozu auch immer das gut sein soll.
Im Mailkörper
befinden sich die entscheidenden Details zur Erkennung von Non-Spam oder Spam. Nicht immer handelt es sich jedoch um Text, da manche Spammer nur noch eine URL mit einem Bild oder einem Hyperlink verknüpft haben. Mit dem Mailtext beschäftigen sich bei Spamihilator v.a. der Spamwortfilter und der Lernende (Bayesian) Filter.
Um Ziel-URLs im Mailkörper
zu untersuchen, muß man den Quelltext anzeigen lassen. Spamihilator enthält einen von Michel nach einem Vorläuferfilter von S3bast1an selbst programmierten URL-Filter, der sich spammige URLs merken kann.
Meiner Ansicht nach ist auch der Betreff
ein besonders wichtiges Unterscheidungsmittel. Der Regel-Filter kann den Betreff untersuchen, wie auch der Lernende (Bayesian) Filter, aber (
noch) nicht der Spamwortfilter.
Obwohl Michels sicherer Mailreader also nicht gezielt die von Dominik gefragten Informationen anzeigt, ist er für jeden, der eine Mail genauer untersuchen möchte, ein seltenes und wichtiges Tool! Meine wichtigsten benötigten Daten sind nicht mit denen von Dominik identisch, daher könnte es für Michel problematisch werden, wenn er eine individuelle auszugsweise Anzeige miteinprogrammieren sollte – und sehr, sehr aufwendig.
Gruß,
Chactory