DCC FIlter Grund unpräzise: "Viele" oder "[Anzahl] User"

Alles, was mit Plugins für Spamihilator zu tun hat. (Keine Plugin-Hilfe, Plugin-Bugs oder Plugin Feature Requests, siehe jeweils dort.)

Moderator: Forum-Team

DCC FIlter Grund unpräzise: "Viele" oder "[Anzahl] User"

Beitragvon eagle21 » 8. Mär 2008, 19:25

Mir ist aufgefallen, daß im Trainingsbereich der DCC Filter als Aussortiergrund angibt:

- Viele User haben diese Mail erhalten
oder
- [Anzahl] User haben diese Mail erhalten.

Wieso einmal präzise und das andere Mal nur ein "Viele" bzw. auf englisch "Many users" ?
Was heißt also "Viele" !?

Weiß da jemand etwaszur Funktionsweise bzw. dieser Aussagen ?
eagle21
Spam-Jäger
Spam-Jäger
 
Beiträge: 27
Registriert: 27. Feb 2008, 12:20

Re: DCC FIlter Grund unpräzise: "Viele" oder "[Anzahl] User"

Beitragvon michel » 8. Mär 2008, 19:31

Hallo,

das ist die Antwort, die der Filter vom DCC-Netzwerk erhält. Was genau das heißt, wird nicht gesagt, aber "viele" heißt auf jeden Fall "sehr sehr viele" :-)

Gruß
Michel
Chuck Norris doesn't kill Spam. He uses Spamihilator! ;-)
Benutzeravatar
michel
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
Plugin-Programmierer
 
Beiträge: 4335
Registriert: 22. Mär 2003, 01:16
Wohnort: Buseck

Re: DCC FIlter Grund unpräzise: "Viele" oder "[Anzahl] User"

Beitragvon anbuva » 9. Mär 2008, 19:55

Hallo Michel,

in diesem Zusammenhang muss ich einmal unwissend nachfragen: Übermittelt Spami auch das Ergebnis der Prüfung, also die Checksumme, an den Server oder ruft er nur das Ergebnis nach dem Vergleich der Checksumme ab?
Ich frage mich nämlich, ob man als User das DCC auch selber mit unterstützt, indem man seine Ergebnisse (hier die Checksummen von den Spams, welche man als Spam markiert und von Spami lernen lassen hat) an die Server sendet.... :?

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause

Re: DCC FIlter Grund unpräzise: "Viele" oder "[Anzahl] User"

Beitragvon MichiD » 11. Mär 2008, 11:35

Mal ganz doof dazwischen geantwortet:
DCC sagt ja nicht automatisch, daß eine e-mail Spam sei. Es gibt nur eine Auskunft, wie oft sie gemeldet worden ist.

Sobald ein DCC-Client eine e-mail(Checksum) beim DCC-Server anfragt, wird diese vermutlich auch in die Statistik aufgenommen. Würde jedenfalls Sinn machen.

Somit wäre die Unterstützung im Augenblick der Anfrage implizit bereits erfolgt.
MichiD
Power-User
Power-User
 
Beiträge: 10
Registriert: 10. Jan 2008, 09:53

Re: DCC FIlter Grund unpräzise: "Viele" oder "[Anzahl] User"

Beitragvon Chactory » 11. Mär 2008, 14:53

Hallo Anbuva, hallo MichiD,

MichiD hat geschrieben:Mal ganz doof dazwischen geantwortet:
das war jetzt wirklich nicht doof, sondern betrifft den Kern der Wirkungsweise des DCC-Filters (so wie ich es verstanden habe :mrgreen:). Der DCC-Filter ist nicht im eigentlich Sinne ein Spam-Filter, sondern ein Filter von Massenmails, darunter können z.B. auch Newsletter fallen. Deinen weiteren Überlegungen möchte ich mich anschließen, abwohl ich mich nicht mehr an die konkrete Verfahrensweise erinnere ... Das Verfahren ist ja auf der Rhyolite-Website jederzeit nachzulesen.

Gruß, Chactory
HilfeHelp «en»TippsAnbuva's FAQBob's FAQ «en»SpamwortlisteRegelfilterScreenshotsSSL/TLSSpami 1.6.0
Vostro 3450, Intel Core i5 2410M 2,3 GHz, 4 GB DDR3 SDRAM 1333 MHz, Windows 7 Pro 64 Bit SP1

Bild
Benutzeravatar
Chactory
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 9593
Registriert: 9. Jan 2004, 23:19
Wohnort: Kiel (D)

Re: DCC FIlter Grund unpräzise: "Viele" oder "[Anzahl] User"

Beitragvon anbuva » 11. Mär 2008, 17:59

Hallo,

Warten wir doch mal ab, was Michel antworten wird.... :wink:

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause

Re: DCC FIlter Grund unpräzise: "Viele" oder "[Anzahl] User"

Beitragvon eagle21 » 11. Mär 2008, 18:38

"Sobald ein DCC-Client eine e-mail(Checksum) beim DCC-Server anfragt, wird diese vermutlich auch in die Statistik aufgenommen. Würde jedenfalls Sinn machen."

Scheint mir auch logisch.
eagle21
Spam-Jäger
Spam-Jäger
 
Beiträge: 27
Registriert: 27. Feb 2008, 12:20

Re: DCC FIlter Grund unpräzise: "Viele" oder "[Anzahl] User"

Beitragvon michel » 21. Mär 2008, 10:59

MichiD hat geschrieben:Sobald ein DCC-Client eine e-mail(Checksum) beim DCC-Server anfragt, wird diese vermutlich auch in die Statistik aufgenommen.

Genau so ist es. Spamihilator unterstützt das Netzwerk also auch aktiv. Es ist auch klar, woher die Antwort "many" kommt: Wenn sehr sehr viele Anfragen mit der gleichen Checksumme zur gleichen Zeit eingehen, zählt das Netzwerk wohl nicht mehr mit. Wahrscheinlich weil die exakte Summe nicht mehr bestimmt werden kann.

Gruß
Michel
Chuck Norris doesn't kill Spam. He uses Spamihilator! ;-)
Benutzeravatar
michel
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
Plugin-Programmierer
 
Beiträge: 4335
Registriert: 22. Mär 2003, 01:16
Wohnort: Buseck

Re: DCC FIlter Grund unpräzise: "Viele" oder "[Anzahl] User"

Beitragvon anbuva » 21. Mär 2008, 11:34

Hallo,

entschuldigt meine Verwirrung, vielleicht habe ich auch ein Brett vor dem Kopf :lol: , aber mir ist immer noch nicht klar, ob diese bei dem Server eingehenden Checksumme nun von einer Spam oder Non-Spam herrührt. Wenn die Abfrage vorher stattfindet, kann es da nicht zu Problemen kommen, wenn ich z. B. diese Mail gar nicht als Spam sehe, weil sie auch definitiv (was man später im TB dann ja auch sieht bzw. kennzeichnet) harmlos ist.

Als Beispiel:
Wenn z. B. mehrere Anfragen bzgl. einer Mail (hier nun mal eine richtige harmlose Non-Spam :wink: ) als Checksumme eingehen, wertet der Server diese dann immer nur als Spam, nur weil es verstärkt dsbzl. dieser (vielleicht auch mit zufällig einer Spam übereinstimmenden) Checksumme "Anfragen" gab? :?

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause

Re: DCC FIlter Grund unpräzise: "Viele" oder "[Anzahl] User"

Beitragvon michel » 21. Mär 2008, 11:40

anbuva hat geschrieben:Wenn z. B. mehrere Anfragen bzgl. einer Mail (hier nun mal eine richtige harmlose Non-Spam :wink: ) als Checksumme eingehen, wertet der Server diese dann immer nur als Spam, nur weil es verstärkt dsbzl. dieser (vielleicht auch mit zufällig einer Spam übereinstimmenden) Checksumme "Anfragen" gab? :?

Das ist korrekt. Die Checksumme ist jedoch entsprechend lang, sodass es möglichst wenige Kollisionen gibt. Eine einzigartige Mail sollte also auch eine *einigermaßen* einzigartige Checksumme erzeugen. Für alle anderen Fälle gibt es den Schwellenwert im DCC-Plugin, der ja auch noch geprüft wird.

Gruß
Michel
Chuck Norris doesn't kill Spam. He uses Spamihilator! ;-)
Benutzeravatar
michel
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
Plugin-Programmierer
 
Beiträge: 4335
Registriert: 22. Mär 2003, 01:16
Wohnort: Buseck

Re: DCC FIlter Grund unpräzise: "Viele" oder "[Anzahl] User"

Beitragvon anbuva » 21. Mär 2008, 12:01

Hallo Michel,

danke für Deine aufschlußreiche Antwort; ich habe wieder was dazugelernt. :)
Nun verstehe ich noch mehr, warum ich den Schwellenwert bei mir zum Teil auf "ziemlich" hoch setzen muss, damit die Non-Spams bei mir nicht gleich als Spam vom DCC gewertet werden.
Ich hatte immer gedacht, dass wirklich nur die reinen Spams beim Server auflaufen, dort dann erst registriert werden und mich teilweise (s. o.) eben schon gewundert.
Ist aber auch klar, dass man (wenn man hier exakt zwischen Non-Spam und Spam unterscheiden würde) Manipulationen seitens Spam-Versendern "zulassen müsste".

Ich überlege jetzt, ob man so etwas ähnliches nicht als PlugIn für den Spami entwickeln könnte, was aber einen Schritt weitergehen würde: Jede eingehende Spam-Mail und Non-Spam erzeugt durch das PlugIn eine Art Checksumme, welche bei der Filterung abgeglichen wird. Durch den Lerneffekt (was u. U. bedingt durch die Checksumme erst sehr, sehr viel später auftreten wird) lassen sich die Mails dann gleich zu Anfang besser sortieren.

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause

Re: DCC FIlter Grund unpräzise: "Viele" oder "[Anzahl] User"

Beitragvon michel » 22. Mär 2008, 13:58

anbuva hat geschrieben:Nun verstehe ich noch mehr, warum ich den Schwellenwert bei mir zum Teil auf "ziemlich" hoch setzen muss, damit die Non-Spams bei mir nicht gleich als Spam vom DCC gewertet werden.

Keine Ahnung. Das ist bei mir nicht so. Wahrscheinlich ist es vom individuellen Mail-Aufkommen abhängig.

anbuva hat geschrieben:Ich überlege jetzt, ob man so etwas ähnliches nicht als PlugIn für den Spami entwickeln könnte

Eigentlich eine gute Idee! Die Checksummen im DCC-Netzwerk haben eine gewisse Verfallszeit, da Massenmails ja meist nur innerhalb eines bestimmten Zeitraums auftauchen. Wenn man so etwas lokal als Plugin implementiert, nützt es evtl. nicht viel, da man ein und die selbe Spam-Mail gar nicht oft genug bekommt, um sie als "Massenmail" zu erkennen. Und wenn man die Verfallszeit weglässt, hat man wahrscheinlich zu hohe False-Positives, wie du sie nun auch schon hast.

Gruß
Michel
Chuck Norris doesn't kill Spam. He uses Spamihilator! ;-)
Benutzeravatar
michel
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
Plugin-Programmierer
 
Beiträge: 4335
Registriert: 22. Mär 2003, 01:16
Wohnort: Buseck

Re: DCC FIlter Grund unpräzise: "Viele" oder "[Anzahl] User"

Beitragvon anbuva » 23. Mär 2008, 11:30

Hallo Michel,

wenn man die Checksumme etwas ungenauer erstellen würde, könnte man evtl. dieses Manko vielleicht ausgleichen. Leider fehlen mir momentan die Grundlagen (wüßte jetzt auch nicht, wie und in welcher Art ich eine Checksumme von einer Mail erstellen würde), um da jetzt weiter einzutauchen, aber grundsätzlich würde mich so ein PlugIn schon sehr reizen. :roll:

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause

Re: DCC FIlter Grund unpräzise: "Viele" oder "[Anzahl] User"

Beitragvon reichemi » 23. Mär 2008, 12:33

Hallo *mich-mal-hier-mit-einklink* :wink:

anbuva hat geschrieben:wenn man die Checksumme etwas ungenauer erstellen würde, könnte man evtl. dieses Manko vielleicht ausgleichen.

Du meinst sicher damit, dass im Endeffekt mehrere Spam-Mails auf die gleiche Checksumme abgebildet werden, und zwar häufiger als die bisher üblichen Kollisionen? Das würde dann quasi eine Art Klassifikation ergeben (die einzelnen Checksummen entsprechen den unterschiedlichen Spam-Klassen).
Wäre nur das Problem rauszubekommen, wodurch sich solche Klassen definieren lassen bzw. erst einmal: welche Klassen es überhaupt gibt...

Ich lese gerade bei bei Wikipedia:
Wikipedia hat geschrieben:Eine Besonderheit der Prüfsumme ist, dass sie auch auf eine E-Mail zutrifft, wenn sich kleine Teile dieser geändert haben.


wäre vielleicht ganz interessant näher zu beleuchten, wie deren Algorithmus arbeitet, um dann evtl. auf eine bessere Idee zu kommen :roll:
Micha Bild Bild
reichemi
Spam-Terminator
Spam-Terminator
 
Beiträge: 74
Registriert: 27. Feb 2008, 11:24

Re: DCC FIlter Grund unpräzise: "Viele" oder "[Anzahl] User"

Beitragvon anbuva » 23. Mär 2008, 18:30

Hallo reichermi,

ja, so in der Art würde das den Kern treffen. Wir gehen da wohl konform. Diesen Algorithmus etwas näher zu durchleuchten, ggfl. dann für ein PlugIn einen eigenen zu entwickeln, könnte tatsächlich interessant werden....

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause

Nächste

Zurück zu Plugins: Allgemein

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron

 industrious-southeast