IMP-Filter für die Non-Spam Erkennung

Alles, was mit Plugins für Spamihilator zu tun hat. (Keine Plugin-Hilfe, Plugin-Bugs oder Plugin Feature Requests, siehe jeweils dort.)

Moderator: Forum-Team

IMP-Filter für die Non-Spam Erkennung

Beitragvon anbuva » 6. Feb 2009, 12:40

Hallo,

ich möchte doch mal eine kleine Idee von mir posten:

Der neue IMP-Filter hatte mich inspiriert, eine Non-Spam-Erkennung für den Maileingang bei direkten Antworten auf die eigenen Mails zu erstellen. Damit es nicht gleich auffällt, habe ich mir eine unsichtbare Signatur (mehr oder weniger) ausgedacht und in Outlook erstellt. Diese wird jetzt automatisch in all meine neu erstellten Mails eingefügt. Sofern dann also jemand auf den O-Text antwortet, wird diese Signatur später im Maileingang vom IMP-Filter erkannt, als Non-Spam erkannt und entsprechend ausgefiltert.
(Als Signatur sollte man natürlich eine Kombination aus Zahlen und Buchstaben wählen: z. B. H34K765GGB80; nicht dass mit dem Wort Haus z. B. jede Mail mit genau diesem Wort als Non-Spam durchgeht)
Ist eine (wie ich zugeben muss) zwar sehr, sehr simple, aber dafür umso effektivere Lösung, wenn man nicht jeden Adressaten gleich in die Liste der Freunde beim Spamihilator eintragen möchte und der Absender ohne eine Veränderung auf die Mail antwortet. So wird die Mail jedenfalls später nicht mehr falsch (durch einen obszönen Witz z. B.) herausgefiltert. Manchmal geht es ja auch nur um einfache Anfragen bei Firmen u. ä..
Das einzige Problem was hierbei entstehen könnte und was man sicherlich schon erkannt hat, ist folgendes. Sofern sich jemand die Mail im Nur-Text ansieht, nur ansehen kann oder wie auch immer, wird er die Signatur natürlich erkennen. Wenn man diese Signatur löscht, ist die Mail dann leider wieder wie jede andere auch und wird dann auch so entsprechend behandelt.

Gerade unbedarfte User bekommen hier aber eine einfache und schnelle Möglichkeit geboten.

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause

Re: IMP-Filter für die Non-Spam Erkennung

Beitragvon Chactory » 6. Feb 2009, 12:51

Hallo Anbuva!

Tolle Idee!

Geht eigentlich unter Vista der Signature Filter noch? Ich habe ihn noch in Betrieb, unter XP läuft er auch mit Spamihilator 0.9.9.44 weiterhin.

Ich könnte mir vorstellen, daß man auch einen anderen Weg finden könnte, um seine Signatur in einer versandten Mail unverwechselbar zu gestalten, aber wenn man keine solche Möglichkeit findet, dann scheint mir eine solche Buchstaben-Zahlen-Kombination eine gute Lösung.

Warum nicht so (in der Mailsignatur):
Mit freundlichen Grüßen,
Chactory
- - - -
Chactory
Firma Superduper
Unfindbarstraße 1
Nichtstadt
(Unsere Signatur: 25XY294615)


Gruß, Chactory
HilfeHelp «en»TippsAnbuva's FAQBob's FAQ «en»SpamwortlisteRegelfilterScreenshotsSSL/TLSSpami 1.6.0
Vostro 3450, Intel Core i5 2410M 2,3 GHz, 4 GB DDR3 SDRAM 1333 MHz, Windows 7 Pro 64 Bit SP1

Bild
Benutzeravatar
Chactory
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 9593
Registriert: 9. Jan 2004, 23:19
Wohnort: Kiel (D)

Re: IMP-Filter für die Non-Spam Erkennung

Beitragvon anbuva » 6. Feb 2009, 13:19

Hallo Chactory!

Deine Möglichkeit ist natürlich auch eine schöne und elegantere. :)

Teilweise sende ich aber auch nur ohne Inhalt, wenn es um Anhänge geht oder ein eingeblendeter Text ein eingebettes Bild z. B. stören würde. Kommt also darauf an, wie man es in einer Mail nutzt oder nutzen möchte.
Als offizielle Signatur bei wichtigen Anschreiben etc. würde ich daher natürlich auch Deine Lösung empfehlen. Wie man es auch macht, auf jeden Fall eine für mich tolle Möglichkeit den Spamihilator nun auch wieder als direkte Non-Spam-Erkennung zu benutzen.
(BTW und bevor jetzt andere dazwischenrufen: Es gibt ja noch den Whitestring, der funktioniert aber leider nicht korrekt in einer Mehrbenutzerumgebung bzw. man kann ihn nur als Admin nutzen.

Ja, der Signature-Filter geht auch noch. Da hat Michel ja Sorge für getragen :wink: ; für die Betreffzeile auch immer noch die beste Lösung!

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause

Re: IMP-Filter für die Non-Spam Erkennung

Beitragvon dme » 6. Feb 2009, 17:59

Hallo anbuva,


zunächst freut es mich riesig, dass Du den IMP-Filter richtig ausprobierst und dann auch gleich noch mit einer neuen guten Idee.
Auch der Vorschlag von Chactory, die Signatur explizit anzugeben als "(Unsere Signatur: 25XY294615)" gefällt mir.

Ich frag mich, ob man sie nicht gleich als eine Art Aktenzeichen an den Kopf einer Mail stellen sollte und den Adressaten explizit aufforden sollte sie in seiner Antwort anzugeben. Man könnte sie auch durch einen Regex erkennen lassen, und z.B. einen Zähler oder andere Merkmale einbauen.

Bitte zitieren sie folgende Signatur in Ihrer Antwort: Signatur2


Der reguläre Ausdruck hiefür wäre: Signatur\d+
Man könnte den Regex auch so gestalten, dass er nicht so leicht zu durchschauen ist und hätte dann die Möglichkeit später bestimmte Signatur-Instanzen als Spam ausschließen, wenn sich das als nötig erweisen sollte.

Das ist bereits eine Teilantwort auf das von Dir beschriebene Problem. Du scheinst die Gefahr zu sehen, dass so eine Signatur später von Spammern misbraucht werden könnte.
Ich selbst bin bisher immer von der Annahme ausgegangen, dass Spammer Massenemails an unbekannte Adressaten verschicken. Die werden sich kaum die Mühe machen, speziell Dich auszutricksen. Anders wäre es, wenn man persönliche Feinde hat. Damit hab ich glücklicherweise bisher noch keine Erfahrungen.

Wenn man diese Feinde nicht hat, dann braucht man die Signatur in Deiner Version eigentlich nicht. Um in Chactorys Beispiel zu bleiben, würde es ausreichen z.B. "Chactory" oder
"Firma Superduper" als Nicht-Spamkriterium zu nehmen.

Das bringt mich auf noch eine Idee: man könnte einen Parser bauen, der checkt, ob die Mail Zitate enthält und/oder ob die Originalmail angehängt ist. Es scheint allerdings vom Mailprogramm des Benutzers abzuhängen, wie solche Zitate gemacht werden. Z.B.

-----Ursprüngliche Nachricht-----
...

oder

--- On Fri, 30/1/09, ... wrote:
...


Das muss ich weiter überlegen, bzw. die möglichen Ziterweisen sammeln. Vielleicht wäre es möglich alle Antwotmails als Nicht-Spam zu klassifizeiren.

Gruß
dme
Benutzeravatar
dme
Spam-Terminator
Spam-Terminator
 
Beiträge: 71
Registriert: 28. Dez 2008, 23:45

Re: IMP-Filter für die Non-Spam Erkennung

Beitragvon anbuva » 6. Feb 2009, 18:40

Hallo dme!

das klingt alles sehr interessant und lässt noch Spielraum für weitere Ideen :wink:

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause

Re: IMP-Filter für die Non-Spam Erkennung

Beitragvon Chactory » 6. Feb 2009, 18:59

Hallo dme und anbuva,

interessante Diskussion. Hier kommt neben überlegener Technik auch noch ein wenig brain.exe zum Einsatz. :wink:
Gegen persönliche Feinde hilft natürlich kein Spamfilter mehr.
Doch die Signaturenmethode finde ich eigentlich witzig. Ich würde allerdings niemanden damit belästigen, daß er aufgefordert würde, mit Zitat oder mit Nennung meiner Signatur zu antworten. Wenn mein Korrespondenzpartner es von selber tut, umso besser und sicherer.
Die Idee mit dem Erkennen von Antwortmails finde ich auch sehr überzeugend. Spammails schreiben zwar oft "Re: ..." ins Subjekt, haben aber kaum einmal einen echten Antwortenblock im Text.

Gruß, Chactory
HilfeHelp «en»TippsAnbuva's FAQBob's FAQ «en»SpamwortlisteRegelfilterScreenshotsSSL/TLSSpami 1.6.0
Vostro 3450, Intel Core i5 2410M 2,3 GHz, 4 GB DDR3 SDRAM 1333 MHz, Windows 7 Pro 64 Bit SP1

Bild
Benutzeravatar
Chactory
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 9593
Registriert: 9. Jan 2004, 23:19
Wohnort: Kiel (D)

Re: IMP-Filter für die Non-Spam Erkennung

Beitragvon michel » 6. Feb 2009, 19:00

Hallo,

ich finde die Idee auch sehr gut. Manchmal schreibe ich meine Antworten aber auch direkt in den Text rein, der schon da steht. Und wenn ich dann alle Punkte bearbeitet habe, lösche ich meistens mit Strg+Shift+Ende und Entf den restlichen Text, was i.d.R. auch die Signatur betrifft. :-/ Gut, ... man könnte jetzt sagen, das liegt an mir, aber es wäre cool, wenn man die Signatur irgendwie noch besser verstecken könnte.

Gruß
Michel
Chuck Norris doesn't kill Spam. He uses Spamihilator! ;-)
Benutzeravatar
michel
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
Plugin-Programmierer
 
Beiträge: 4335
Registriert: 22. Mär 2003, 01:16
Wohnort: Buseck

Re: IMP-Filter für die Non-Spam Erkennung

Beitragvon anbuva » 6. Feb 2009, 19:11

Hallo michel!

es wäre cool, wenn man die Signatur irgendwie noch besser verstecken könnte.

das wäre dann wirklich optimal! Dafür habe ich jetzt aber noch keine Lösung finden können; außerdem kommt es dann ja auch noch auf das benutzte Email-Programm an. Auf jeden Fall funktioniert es so schon mal ganz gut. Ich habe so schon einige Mails durchlassen können, welche sonst als Spam markiert worden wären.

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause

Re: IMP-Filter für die Non-Spam Erkennung

Beitragvon Chactory » 6. Feb 2009, 19:55

Hallo zusammen,

michel hat geschrieben:wenn ich dann alle Punkte bearbeitet habe, lösche ich meistens mit Strg+Shift+Ende und Entf den restlichen Text, was i.d.R. auch die Signatur betrifft
anbuva hat geschrieben:Dafür habe ich jetzt aber noch keine Lösung finden können

für diese Überlegung wäre möglicherweise der Betreff geeignet, den übernehmen die meisten Leute beim Antworten unverändert. Der Signature-Filter liest leider die Betreffzeile nicht! Wie ist das eigentlich beim Whitestring-Filter?

Gruß, Chactory
HilfeHelp «en»TippsAnbuva's FAQBob's FAQ «en»SpamwortlisteRegelfilterScreenshotsSSL/TLSSpami 1.6.0
Vostro 3450, Intel Core i5 2410M 2,3 GHz, 4 GB DDR3 SDRAM 1333 MHz, Windows 7 Pro 64 Bit SP1

Bild
Benutzeravatar
Chactory
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 9593
Registriert: 9. Jan 2004, 23:19
Wohnort: Kiel (D)

Re: IMP-Filter für die Non-Spam Erkennung

Beitragvon anbuva » 6. Feb 2009, 20:17

Hallo Chactory!

dann müsste im Betreff immer automatisch etwas eingetragen sein, damit es auch komfortabel funktioniert. Ich weiß nicht, ob Outlook so etwas unterstützt.

Der Whitestring hatte eine ähnliche Funktion, ist aber nicht mehrbenutzerfähig. Man kann ihn unter Vista installieren und er funktioniert dort sogar, aber Einstellungen vom Admin betreffen dann alle anderen User ebenso; fällt daher für mich aus der Reihe der funktionsfähigen PlugIns unter Vista(XP).

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause

Re: IMP-Filter für die Non-Spam Erkennung

Beitragvon dme » 7. Feb 2009, 00:33

Ich hab mir den Spaß gemacht und bin meine E-Mails durchgegangen, um zu sehen, welche Formen von Antworten es gibt. Daraus habe ich ein kleines TextTransformer-Projekt gemacht. Es besteht aus einer Regel (Produktion) und vier regulären Ausdrücken (Token):


Code: Alles auswählen
{{
int iResult = 0;
}}
(
    SKIP
  | SCHRIEB   {{ iResult = 1; }}
  | WROTE     {{ iResult = 1; }}
  | "You" ( "wrote:" {{ iResult = 1; }} )?
  | RE_QUOTE  {{ iResult = 1; }} 
  | RE_BEGIN
    (
       "Original"? ( "Message" {{ iResult = 1; }} )?
       "Ursprüngliche"? ( "Nachricht" {{ iResult = 1; }} )?
    )   
)*   
{{
out << iResult;
}} 

RE_BEGIN ::= \r?\n-+        // Reihe von '+'-Zeichen am Zeilenanfang
RE_QUOTE ::= \r?\n[ \t]>+   // nach möglichen Leerzeichen Reihe von '>'
SCHRIEB  ::= Am[^\r\n]+schrieb[^\r\n]+:\r?\n
// erkennt z.B. Am 13.03.2008 um 12:14 schrieb [Name]:
// oder Am 13.03.2008 um 12:14 schrieben Sie:
WROTE    ::= On[^\r\n]+wrote:
// erkennt z.B. On Tue, 14 Feb 2006 11:46:01 +0100, [Name] wrote:


Die größte Ausbeute erziehlt RE_QUOTE, also Zeilen wie:

>Die größte Ausbeute erziehlt RE_QUOTE, also Zeilen wie:



Auch Michel wird bei seiner Antwortmethode vielleicht die eine oder andere zitierte Zeile stehen lassen. Ich hab das Projekt auch auf meine Spamsammlung angewendet und kein Non-Spam-Resultat erhalten.

Dies Projekt wäre eines, dass sich tatsächlich von allen Anwendern ohne individuelle Anpassung benutzen ließe. (Siehe Diskussion in "Language file, Filterungsgrund, Etikette".

Aber ich wüßte gern von Euch, ob ihr noch andere Formen von Antwortschreiben kennt? Mir ist so, als hätte ich eine andere Weise des Zitierens schon einmal gesehen.

Gruß
dme
Benutzeravatar
dme
Spam-Terminator
Spam-Terminator
 
Beiträge: 71
Registriert: 28. Dez 2008, 23:45

Re: IMP-Filter für die Non-Spam Erkennung

Beitragvon dme » 7. Feb 2009, 12:08

Da war ein Fehler im Code.

Code: Alles auswählen
  | RE_BEGIN
    (
         "Original"? ( "Message" {{ iResult = 1; }} )?
         "Ursprüngliche"? ( "Nachricht" {{ iResult = 1; }} )?
    )


ist zu ersetzen durch:

Code: Alles auswählen
  | RE_BEGIN
    (
         "Original" ( "Message" {{ iResult = 1; }} )?
       | "Ursprüngliche" ( "Nachricht" {{ iResult = 1; }} )?
    )?



D.h. auf die Reihe von '-' Zeichen folgt entweder "Original" oder "Ursprüngliche" oder es geht weiter mit der Schleife. Wenn auf "Original" das Wort "Message" folgt wird eine Mail zitiert und ebenso wenn auf "Ursprüngliche" das Wort "Nachricht" folgt.

Das Projekt kann downgeloadet werden:

http://www.texttransformer.org/IsResponse.ttp
Benutzeravatar
dme
Spam-Terminator
Spam-Terminator
 
Beiträge: 71
Registriert: 28. Dez 2008, 23:45

Re: IMP-Filter für die Non-Spam Erkennung

Beitragvon anbuva » 7. Feb 2009, 12:15

Hallo dme!

Vielen Dank für das neue Projekt :)

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause


Zurück zu Plugins: Allgemein

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron

 industrious-southeast