Regelfilter: Mails nicht vom Server herunterladen

Alles, was mit Plugins für Spamihilator zu tun hat. (Keine Plugin-Hilfe, Plugin-Bugs oder Plugin Feature Requests, siehe jeweils dort.)

Moderator: Forum-Team

Re: Regelfilter: Mails nicht vom Server herunterladen

Beitragvon anbuva » 27. Mai 2012, 18:42

Hallo Chactory!

soweit ich das bei Bayes richtig verstanden habe, gibt es einen Schwellwert bei der Wahrscheinlichkeit. Dieser Wert liegt wohl schon recht hoch, um Fehlfilterungen zu vermeiden. Die Filterung funktioniert ja auch normal recht gut (wenn der User im TB gut immer trainiert hat) und gibt eigentlich kaum Anlass zur Beschwerde. Ich würde hier aber noch ein Anpassung des Grenzwertes (nehmen wir mal an, dieser würde jetzt bei 98% liegen) vornehmen können/wollen.

Ein paar krasse Beispiele (mit einer Formel aus der Wahrscheinlichkeitsrechnung):
1.)
Gesamt 300 Mails, davon 200 Spams. In 50 von diesen kam das Wort V..... vor, aber auch in einer Non-Spam (war z. B. ein Witz von einem Freund) kam das Wort einmal vor.
Die Spam-Wahrscheinlichkeit wäre hier bei einer neuen Mail mit diesem Wort zu 98% zu sehen und würde damit als Spam aussortiert werden.
Das wäre okay und auch verständlich.

2.)
Gesamt 300 Mails, davon 100 Spams. In 30 von diesen kam V..... vor, was bisher auch in 30 NonSpams vorkam. Fifty, fifty also.
Die Spam-Wahrscheinlichkeit bei einer neuen eingehenden EMail mit diesem Wort wäre hier dann bei nur noch 50% zu sehen. Wäre diese Mail in Wirklichkeit Spam, würde die Mail also durchgelassen werden.
Ich für meinen Teil würde hier also strenger bewerten wollen und die Schwelle (nach anfänglicher Kontrolle) nach unten setzen wollen.

Bitte meine Gedanken, die ich mir hier mache, nicht so groß aufhängen, aber ich versuche nur immer nach neuen Möglichkeiten oder Verbesserungen Ausschau zu halten und beim Bayes denke ich immer, dass hier die Möglichkeiten noch nicht erschöpft sind oder sein sollten; für mich eben :wink: (auch wenn ich hier alleine damit dastehen würde).

Man könnte natürlich auch die Reinigungsfunktion vom LF nutzen, das erscheint mir aber noch nicht das Ende der Weisheit zu sein.

Hier noch die benutzte Formel anhand des ersten Beispiels zum Nachvollziehen (ich hoffe, dass ich richtig gerechnet habe und die Formel halbwegs hier auch passt):

Ps = 50 (Mails, in denen das Wort vorkam)
Pw = 0,25 (0,%-Anteil der Spams mit dem Wort vom Gesamtspam) * 200 (Gesamtspam) + 1 (Anzahl der Nonspams mit dem Wort) = 51
Pspam = Ps / Pw = 50 / 51 = 0,98 = 98%

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause

Re: Regelfilter: Mails nicht vom Server herunterladen

Beitragvon Chactory » 27. Mai 2012, 20:25

Hallo Anbuva!

Das wäre dann so eine Art Lernender-Spamwort-Filter. Das ist eine sehr interessante Idee für Wörter, die in einem Graubereich liegen. Jedes Wort würde seine Wahrscheinlichkeit für Spammingkeit erhalten. Eine Mail würde dann abgewogen, ist sie mehr als 50% spammig, dann wird sie ausgesiebt. Tja, mein Lieber, wir sollten uns mal treffen und vier Wochen bei Wein und Delikatessen in einen Keller sperren lassen - und zusammen ein solches Plugin programmieren! :D

Gruß,
Chactory
HilfeHelp «en»TippsAnbuva's FAQBob's FAQ «en»SpamwortlisteRegelfilterScreenshotsSSL/TLSSpami 1.6.0
Vostro 3450, Intel Core i5 2410M 2,3 GHz, 4 GB DDR3 SDRAM 1333 MHz, Windows 7 Pro 64 Bit SP1

Bild
Benutzeravatar
Chactory
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 9593
Registriert: 9. Jan 2004, 23:19
Wohnort: Kiel (D)

Re: Regelfilter: Mails nicht vom Server herunterladen

Beitragvon anbuva » 27. Mai 2012, 20:29

Hallo Chactory!

das wäre eine Weiterführung meiner Idee; so weit war ich noch nicht, hatte das aber auch schon im Kopf.
Im Grunde geht es mir jetzt aber eigentlich nur um den Schwellenwert beim LF, so dass der LF zu seiner Einschätzung kommt, ob die Mail nun Spam oder NonSpam ist.
Wie hoch liegt der denn beim Spamihilator (meine erste Frage, eher an michel) und würde/könnte der sich nicht nachträglich durch Usereingabe verändern lassen (meine zweite Frage, auch in Richtung michel)?

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause

Re: Regelfilter: Mails nicht vom Server herunterladen

Beitragvon anbuva » 28. Mai 2012, 09:28

Hallo zusammen!

ich führe das Thema hier weiter fort: viewtopic.php?f=4&t=8766

Ich möchte diesen Thread nicht mit meinen Überlegungen kaputt machen, da es hier ja um ein ganz anderes Thema geht.

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause

Vorherige

Zurück zu Plugins: Allgemein

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron

 industrious-southeast