Link-Filter: "Zuletzt gefunden"

Alles, was mit Plugins für Spamihilator zu tun hat. (Keine Plugin-Hilfe, Plugin-Bugs oder Plugin Feature Requests, siehe jeweils dort.)

Moderator: Forum-Team

Link-Filter: "Zuletzt gefunden"

Beitragvon Herman » 25. Sep 2008, 21:31

Der Link-Filter hat nun fleißig gelernt,
und hat auch, wie eingestellt und erwartet, Einträge zusammen gefasst:
Beispiel:
pages.ebay.de, payments.ebay.de und cgi.ebay.de
wurden zusammen gefasst zu ebay.de.
Wenn nun eine neue Mail mit den Links pages.ebay.de, payments.ebay.de und cgi.ebay.de (und weiteren Links)
ankommt, wird sie korrekt vom Link-Filter als "NoSpam" erkannt,
"Link Filter", "cgi4.ebay.de, cgi.ebay.de, pages.ebay.de, payments.ebay.de", 1.00
aber das Datum "Zuletzt gefunden" für den Eintrag ebay.de wird nicht aktualisiert.
Das Datum für payments.ebay.de wird aktualisiert;
Die Links pages.ebay.de und cgi.ebay.de "kennt" der Link-Filter gar nicht...
Ist das Verhalten so gewollt, oder ist das ein Bug, oder mache ich einen Denkfehler?

Gruß
Hermann
Herman
Spam-Killer
Spam-Killer
 
Beiträge: 34
Registriert: 13. Nov 2004, 01:21

Re: Link-Filter: "Zuletzt gefunden"

Beitragvon Andreas_Z » 26. Sep 2008, 08:15

Hallo Herman!

Ich habe gerade einen kleinen Test gemacht. Ich konnte das Verhalten auch nicht nachvollziehen. Leider ist die Hilfe in dieser Hinsicht nicht hilfreich. Daher sollten wir einfach mal auf Michel warten. Mich würde auch interessieren, wie diese Zusammenfassung arbeitet, was genau zusammengefasst wird, welches Datum dann relevant wird und wie das dann hinterher aussieht. Werden die "alten" Einträge gelöscht oder bleiben die noch in der Liste. In meinem Test sendete ich mit einfach eine Mail mit den drei Einträgen: www.test.de, test.test.de, naund.test.de. In der Liste tauchte zum Schluss aber nur www.test.de auf :shock: .Das wundert mich schon ein wenig.

Gruß
Andreas_Z
Core i7 3,4 GHz, 8 GB RAM, Win7 64bit SP1, GDATA Bussiness 11.0
Exchange-Server 2003, VM mit WinXP Pro SP3.
Spami-Online-Hilfe, Spami-FAQ, Anbuva's FAQ
Benutzeravatar
Andreas_Z
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 4380
Registriert: 6. Nov 2003, 08:10
Wohnort: Schwielowsee, Germany

Re: Link-Filter: "Zuletzt gefunden"

Beitragvon anbuva » 26. Sep 2008, 17:50

Hallo Andreas_Z!

Interessant..!
Ansonsten muss ich sagen, dass der neue Filter bei mir (mit Lernphase) mit 20%iger Beteiligung Spam-Mails schon herausfischt und mit 25%iger Beteiligung gute Mails... Klasse!

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause

Re: Link-Filter: "Zuletzt gefunden"

Beitragvon Herman » 26. Sep 2008, 17:54

Hallo.

Ja, da muss der Michel mich mal aufklären, wie der Link-Filter arbeitet...

Ich schreibe hier noch mal in anderen Worten, was mir nicht ganz logisch ist:

1. Der Link-Filter identifiziert Mails anhand von Links (z.B. contact.ebay.de), die in ihrer langen Form gar nicht in seiner Datenbank sind. Ich schließe daraus, dass der Filter hier den in der Datenbank vorhandenen Link "ebay.de" erkannt hat. Allerdings wird der Zeitstempel für diesen Eintrag "ebay.de" nicht aktualisiert.

2. In der Datenbank des Link-Filters gibt es neben dem Eintrag "ebay.de" weitere Einträge, z.B. "cgi.ebay.de". Ich hätte erwartet, dass der Filter merkt, dass es schon einen "übergeordneten" Eintrag gibt, und keinen neuen anlegt.

@ Michel:
Bitte nicht als Kritik verstehen, mir gefällt der Link-Filter sehr gut, und in ein paar Wochen wird er dem URL-Filter den Rang abgelaufen haben...
Auch die Speicherung der Link-Filter-Daten als SQLite-Datenbank gefällt mir sehr gut.
In dem Zusammenhang eine Frage: Hat die Spalte "locked" eine Funktion (wenn ja: welche?),
oder ist die für zukünftige Erweiterungen vorgesehen?

Gruß
Hermann

P.S.: Noch 'ne Kleinigkeit: Irgendwie hat das Forum eine Stunde Zeitversatz... Mein um 18:54 geposteter Beitrag wird als "17:54" angezeigt...
P.P.S.: OK, OK, das mit der falschen Forum-Uhr nehme ich zurück. In meinen persönlichen Forums-Einstellungen war die Sommerzeit nicht angehakt...

Zusatz: Nachdem ich nun die "Hilfe" zum Link-Filter mal mit Verstand gelesen habe,
ziehe ich die Frage nach der Bedeutung der Spalte "locked" auch wieder zurück...
Herman
Spam-Killer
Spam-Killer
 
Beiträge: 34
Registriert: 13. Nov 2004, 01:21

Re: Link-Filter: "Zuletzt gefunden"

Beitragvon michel » 5. Okt 2008, 07:01

Hallo,

sorry für die späte Antwort. Ich ziehe gerade um und habe nicht immer Zugriff aufs Internet.

Der Link-Filter aktualisiert das Datum von ebay.de tatsächlich nicht. Ob das ein Fehler ist oder Absicht sei mal dahingestellt. Auf jeden Fall könnte ich dieses Verhalten ändern, falls gewünscht... :?:

cgi.ebay.de wird deshalb zur Liste hinzugefügt, obwohl es ebay.de gibt, weil es ja sein könnte, dass der Benutzer für ebay.de und cgi.ebay.de verschiedene Einstufungen festlegen möchte (Spam und Non-Spam). Bei manchen Domains trifft das sogar zu, bei ebay weniger. Im Grunde belasten diese doppelten Einträge den Filter kaum, sodass man sie einfach ignorieren kann.

Um deine andere Frage zu beantworten: Ja, es wird auch beim Link-Filter noch Weiterentwicklungen geben. Der Filter ist Teil des Spamihilator-Pakets und wird dementsprechend aktualisiert und gepflegt.

Gruß
Michel
Chuck Norris doesn't kill Spam. He uses Spamihilator! ;-)
Benutzeravatar
michel
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
Plugin-Programmierer
 
Beiträge: 4335
Registriert: 22. Mär 2003, 01:16
Wohnort: Buseck

Re: Link-Filter: "Zuletzt gefunden"

Beitragvon Herman » 5. Okt 2008, 10:05

Hallo Michel.

Danke für die Antwort.

Zum "Zusammenfassen" bzw. "nicht Zusammenfassen":
Einerseits kann ich nachvollziehen, warum "neue" Links, wie in meinem Beispiel "cgi.ebay.de", zusätzlich zum vorhandenen Eintrag "ebay.de" angelegt werden,
andererseits widerspricht das der Logik des "Zusammenfassens":
Wenn ich einstelle, dass ab drei Einträgen zusammengefasst werden soll, dann gehe ich davon aus, dass auch der vierte und folgende zum "übergeordneten" Eintrag gehören (entsprechend der Einstellung "gleicher Typ" usw.).
Werden denn diese "neuen" Subdomains zu "ebay.de" hinzugefügt und damit "gelöscht", sobald die eingestellte Anzahl zum Zusammenfassen erreicht ist?

Zum Zeitstempel "zuletzt gefunden":
Der Zeitstempel sollte dann aktualisiert werden, wenn der Eintrag zur Entscheidung des Filters beigetragen hat.
An meinem Beispiel: Ich empfange eine Mail mit dem Link "contact.ebay.de", und sehe im Trainingsbereich (und auch in der filter.log), dass der Link-Filter diesen Link für seine Einstufung berücksichtigt hat. In der Link-Filter-Datenbank gibt es aber gar keinen Eintrag "contact.ebay.de", also gehe ich davon aus, dass der Link-Filter sich auf den "übergeordneten" Eintrag "ebay.de" gestützt hat. Also muss, meiner Ansicht nach, der Zeitstempel für "ebay.de" aktualisiert werden.

Komischerweise wird dieser Link "contact.ebay.de" aber nicht zusätzlich zu "ebay.de" angelegt, womit wir wieder beim Thema "Zusammenfassen" sind...

Gruß
Hermann
Herman
Spam-Killer
Spam-Killer
 
Beiträge: 34
Registriert: 13. Nov 2004, 01:21

Re: Link-Filter: "Zuletzt gefunden"

Beitragvon Andreas_Z » 7. Okt 2008, 07:54

Hallo Herman!

Ich schliesse mich Deiner Meinung komplett an.

@Michel: die von Hermann beschrieben Verhaltensweisen sind eigentlich die, die ich aufgrund der Beschreibung ebenfalls erwarten würde. Die Zusammenfassen-Funktion sollten wir im Zusammenhang mit dem Beitrag viewtopic.php?f=36&t=7542#p47777 nochmal überdenken. Die könnte im Falle der Beibehaltung des www. kontraproduktiv sein.

Gruß
Andreas_Z
Core i7 3,4 GHz, 8 GB RAM, Win7 64bit SP1, GDATA Bussiness 11.0
Exchange-Server 2003, VM mit WinXP Pro SP3.
Spami-Online-Hilfe, Spami-FAQ, Anbuva's FAQ
Benutzeravatar
Andreas_Z
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 4380
Registriert: 6. Nov 2003, 08:10
Wohnort: Schwielowsee, Germany

Re: Link-Filter: "Zuletzt gefunden"

Beitragvon michel » 8. Okt 2008, 16:56

Herman hat geschrieben:Wenn ich einstelle, dass ab drei Einträgen zusammengefasst werden soll, dann gehe ich davon aus, dass auch der vierte und folgende zum "übergeordneten" Eintrag gehören (entsprechend der Einstellung "gleicher Typ" usw.).
Werden denn diese "neuen" Subdomains zu "ebay.de" hinzugefügt und damit "gelöscht", sobald die eingestellte Anzahl zum Zusammenfassen erreicht ist?

Nach dem Zusammenfassen hast du nur noch einen Eintrag. Ein neuer darf deshalb in der List auftreten, weil dadurch die Anzahl von maximal 3 ähnlichen Subdomains noch nicht überschritten ist.

Herman hat geschrieben:Zum Zeitstempel "zuletzt gefunden":
Der Zeitstempel sollte dann aktualisiert werden, wenn der Eintrag zur Entscheidung des Filters beigetragen hat.

Ja, du hast recht. Das ist wohl ein Bug. Ich werde das beheben.

Gruß
Michel
Chuck Norris doesn't kill Spam. He uses Spamihilator! ;-)
Benutzeravatar
michel
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
Plugin-Programmierer
 
Beiträge: 4335
Registriert: 22. Mär 2003, 01:16
Wohnort: Buseck

Re: Link-Filter: "Zuletzt gefunden"

Beitragvon Herman » 8. Okt 2008, 18:27

Hallo Michel.
michel hat geschrieben:Nach dem Zusammenfassen hast du nur noch einen Eintrag. Ein neuer darf deshalb in der List auftreten, weil dadurch die Anzahl von maximal 3 ähnlichen Subdomains noch nicht überschritten ist.
Hmmm. Wenn ich eingestellt habe, dass Subdomains zusammengefasst werden sollen, dann brauche ich eigentlich keinen neuen Eintrag, wenn (entsprechend der gewählten Einstellung "gleicher Typ") eine neue Subdomain gleichen Typs passend zur bereits vorhandenen zusammengefassten Domain aufgetreten ist.
Andererseits schadet das ja auch nicht...
michel hat geschrieben:Ja, du hast recht. Das ist wohl ein Bug. Ich werde das beheben.
Vielen Dank!

Gruß
Hermann
Herman
Spam-Killer
Spam-Killer
 
Beiträge: 34
Registriert: 13. Nov 2004, 01:21

Re: Link-Filter: "Zuletzt gefunden"

Beitragvon Herman » 23. Dez 2008, 16:16

Hallo Michel.

Vielen Dank für die neue Spamihilator-Version 0.9.9.44.
Damit ist mein "Problem" ja behoben. Nettes Weihnachtsgeschenk :D

Ich wünsche Dir und allen anderen Helfern des Forums,
aber auch "allen, die das lesen",
ein frohes Fest.

Gruß
Hermann

P.S.: Auch die Anzeige im Trainingsbereich, welchen Eintrag der Linkfilter als Entscheidungskriterium herangezogen hat, ist chic...
Herman
Spam-Killer
Spam-Killer
 
Beiträge: 34
Registriert: 13. Nov 2004, 01:21

Re: Link-Filter: "Zuletzt gefunden"

Beitragvon anbuva » 23. Dez 2008, 17:20

Hallo Herman!

Mist, neue Version und ich darf arbeiten..... freu mich schon auf morgen :D

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause


Zurück zu Plugins: Allgemein

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron

 industrious-southeast