Werbung in Non-Spam-Mails

Hier kann über alles diskutiert werden, was mit Spam zu tun hat.

Moderator: Forum-Team

Werbung in Non-Spam-Mails

Beitragvon Chactory » 17. Dez 2006, 03:33

Hi zusammen,

neuerdings erhalte ich zunehmend öfter reguläre Non-Spam-Mails von Accounts bei Freemailern, die Werbung enthalten, etwa so:

Die neue MSN Suche Toolbar mit Windows-Desktopsuche. Suchen Sie gleichzeitig im Web, Ihren E-Mails und auf Ihrem PC! Jetzt neu! htt'p://desktop.msn.de/ Jetzt gratis downloaden!

oder so:

"Ein Herz für Kinder" - Ihre Spende hilft! Aktion: ww'w.deutschlandsegelt.de. Unser Dankeschön: Ihr Name auf dem Segel der 1. deutschen America's Cup-Yacht!

Ob das für den Lernenden Filter und den URL-Filter gut ist? ...

Gruß, Chactory
HilfeHelp «en»TippsAnbuva's FAQBob's FAQ «en»SpamwortlisteRegelfilterScreenshotsSSL/TLSSpami 1.6.0
Vostro 3450, Intel Core i5 2410M 2,3 GHz, 4 GB DDR3 SDRAM 1333 MHz, Windows 7 Pro 64 Bit SP1

Bild
Benutzeravatar
Chactory
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 9593
Registriert: 9. Jan 2004, 23:19
Wohnort: Kiel (D)

Re: Werbung in Non-Spam-Mails

Beitragvon Andreas_Z » 18. Dez 2006, 08:05

Hallo Chactory!

Tja. Ich bin da gnadenlos. Einfach rein. Dazu is er ja da. Mal sehen, was passiert.

Gruß
Andreas_Z
Core i7 3,4 GHz, 8 GB RAM, Win7 64bit SP1, GDATA Bussiness 11.0
Exchange-Server 2003, VM mit WinXP Pro SP3.
Spami-Online-Hilfe, Spami-FAQ, Anbuva's FAQ
Benutzeravatar
Andreas_Z
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 4380
Registriert: 6. Nov 2003, 08:10
Wohnort: Schwielowsee, Germany

Re: Werbung in Non-Spam-Mails

Beitragvon Quellcore » 18. Dez 2006, 15:39

Hallo Chactory!

Du scheinst Dir ja wirklich Sorgen um Deinen verhunzten lernenden Filter zu machen. ;-)

Natürlich gibt es Passagen in bestimmten Mails, von denen man lieber nicht lernen sollte. Leider sehe ich hier aber keinen Lösungsansatz, denn die manuelle Durchsicht aller Mails vor dem Lernen, um eben diese Mails vom Lernvorgang ausschließen zu können, ist wohl nicht praktikabel.

Außerdem scheint der lernende Filter ja auch bei Dir effektiv filtern, oder :?:
Der lernende Filter, der ideale Lebenspartner: verzeiht, hilft viel, immer offen für Neues.
Ich würde mir da nicht so viele Gedanken machen, obwohl das ja generell lobenswert ist.
Genau diese Werbepassage kann Dir auch einmal helfen, wenn 3 Tage später wieder eine Non-Spam von dem gleichen Freemailer kommt und diese am Ende die gleiche Werbenachricht enthält.
Zusätzlich kann man vor den lernenden Filter auch noch möglichst viele andere Spam-Filter setzen, dies könnte die Anzahl der false-negative Erkennungen, die durch Deine Problemstellung ausgelöst werden, minimieren.

Beim Url-Filter ist das natürlich auch unschön.
Solltest Du dann doch einmal eine Spam-Mail mit eben dieser URL aus dem Werbeteil der Non-Spm erhalten, wird es wahrscheinlich ein false-negativ geben.
1x als Spam gelernt und schon ist das Problem mit dem URL-Filter dann behoben.
Das ist wohl der Lauf der Dinge und läßt sich meines Erachtens auch nicht anders in den Griff bekommen.

Beispielsweise kenne ich niemanden mit einem Yahoo-Account, der Link zu dieser Webseite ist bei mir deshalb auf der schwarzen Liste des URL-Filters.
Irgendwann wird es dann aber bei mir knallen, wenn eine neue Bekanntschaft (Bob's neue Freundin ;-) ) dann Nachrichten an mich von einem Yahoo-Account verschickt.
Die erste Non-Spam von einem Yahoo-Account wird dann zu einer false-positive Erkennung führen, da der URL-Filter bei mir auch eine hohe Priorität hat

Gruß
Quellcore
CPU:Intel Core i7-2700K Processor (@ 45*100 = 4500 MHz)
Board:ASRock P67 Extreme4 Gen3
Ram: 16GB G.SKILL Ripjaws X Series (4 x 4GB) DDR3 2133 (Timings 10-10-10-28 2T @ 1866 MHz)
SSD: Samsung 128GB 2.5-inch SSD 830 Series (Desktop)
HDD-1: WD Caviar® SE16 640 GB, SATA2, 16 MB Cache, 7200 RPM
HDD-2: SAMSUNG EcoGreen F4 ST2000DL004 2TB 32MB Cache
Graphic: ATI Radeon HD 5850 ASUS EAH5850/G/2DIS/1GD5

Win 7 Ultimate 64-Bit / ESET NOD32 Antivirus 8.0 / Firefox 34 / Thunderbird 31
Spamihilator 1.6.0
Benutzeravatar
Quellcore
Assistent
Assistent
 
Beta-Tester
 
Beiträge: 1706
Registriert: 8. Mai 2004, 13:03
Wohnort: Long Island / USA

Re: Werbung in Non-Spam-Mails

Beitragvon Chactory » 18. Dez 2006, 16:37

Hallo Andreas_Z und Quellcore,

danke für Eure Antworten! Ja, aufgrund der merkwürdigen Wortlisten (Abbildung in diesem Thread) bin ich ein wenig verunsichert.

Allerdings finde ich Eure Tipps hilfreich, natürlich können der Lernende Filter und der URL-Filter trotzdem richtig arbeiten. Der Lernende Filter hat auch im Prinzip richtig gearbeitet, mit nur gelegentlichen Fehlern.

Gruß, Chactory

PS: Soweit ich weiß, dürfte Andreas_Z die älteste noch ungelöschte Statistik hier in diesem Forum haben. Vielleicht auch die älteste funktionierende Wortliste? Würdest Du villeicht einmal Deine Wortliste posten, wie mit dem Wortlist Extractor von S3bast1an erstellt und mit Excel sortiert? C.
HilfeHelp «en»TippsAnbuva's FAQBob's FAQ «en»SpamwortlisteRegelfilterScreenshotsSSL/TLSSpami 1.6.0
Vostro 3450, Intel Core i5 2410M 2,3 GHz, 4 GB DDR3 SDRAM 1333 MHz, Windows 7 Pro 64 Bit SP1

Bild
Benutzeravatar
Chactory
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 9593
Registriert: 9. Jan 2004, 23:19
Wohnort: Kiel (D)

Re: Werbung in Non-Spam-Mails

Beitragvon Andreas_Z » 21. Dez 2006, 11:59

Hallo Chactory!

mach ich doch glatt....

good_wordlist.txt (59492 Worte)
Code: Alles auswählen
dec   86216
isakmpd   38428
event   26963
suse   23073
die   20853
sie   20703
der   19322
the   19077
fwlog   18806
match   18773
rule   18766
block   18619
for   17327
timer   17198
http   17033
vlan0   16296
und   14802
tcp   14643
exchange   13950
connection   12400
server   12277
mit   12169
pure   11834
ftpd   11795
rpm   11726
message   10931
ist   10890
www   10731
linux   10206
email   10026
interface   10011
lmtp   9863
update   9795
added   9516
state   9280
and   9273
checker   9171
info   9005
ich   8988
link   8763
add   8726
this   8634
expiration   8589
das   8562
before   8423
you   8337
nicht   8280
i386   8212
handle   8100
den   7859

Hier ist ca. die hälfte der Wörter nur ein oder zwei mal aufgetaucht.

bad_wordlist.txt (157621; mein Excel hat bei 65536 aufgehört zu importieren)
Code: Alles auswählen
Header-Reserved:   17774080
block   1210084
icmp   823174
timer   344554
you   334554
udp   259932
for   233835
connection   200387
before   191844
debug   178950
add   178114
Header-Words:      157621
Header-Emails:     145177
heartbeat   142643
failed   141461
warn   140909
domain   130243
from   120131
module   118490
leak   100985
all   92206
more   71929
command   58270
time   57518
get   56725
www   53983
state   53359
may   52744
finalize   52505
dst   50097
changed   48940
interface   48583
about   45192
they   43346
info   43047
attempt   41892
its   41847
done   41500
statements   41467
ipv4   40995
email   40622
run   40598
doi   39700
check   39657
msgid   39448
spi   38742
which   38344
web   38188
over   37562
some   37190

Auch hier der Trend zu extrem vielen Spamwörtern, die nur ein- oder zweimal auftauchen.

Gruß
Andreas_Z
Core i7 3,4 GHz, 8 GB RAM, Win7 64bit SP1, GDATA Bussiness 11.0
Exchange-Server 2003, VM mit WinXP Pro SP3.
Spami-Online-Hilfe, Spami-FAQ, Anbuva's FAQ
Benutzeravatar
Andreas_Z
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 4380
Registriert: 6. Nov 2003, 08:10
Wohnort: Schwielowsee, Germany

Re: Werbung in Non-Spam-Mails

Beitragvon Chactory » 21. Dez 2006, 14:37

Hallo Andreas_Z!

Vielen Dank!

Worüber sich Vulkanier so schreiben ... isakmpd suse die sie der the fwlog rule http vlan0 tcp connection www ... :mrgreen: :wink:
Daran kann man mal wieder sehen, daß es eben beim Bayesfilter nicht einfach auf die Wörter, sondern auf deren Verteilung und Gewichtung ankommt.

Anscheinend hat das niemand außer mir, dieses Auftreten von Nonsense-Strings in beiden Wortlisten. Werde mal forschen müssen, welche Mails das sind. Könnte das auch ein Zeichensatzproblem sein? ...

Gruß, Chactory
HilfeHelp «en»TippsAnbuva's FAQBob's FAQ «en»SpamwortlisteRegelfilterScreenshotsSSL/TLSSpami 1.6.0
Vostro 3450, Intel Core i5 2410M 2,3 GHz, 4 GB DDR3 SDRAM 1333 MHz, Windows 7 Pro 64 Bit SP1

Bild
Benutzeravatar
Chactory
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 9593
Registriert: 9. Jan 2004, 23:19
Wohnort: Kiel (D)

Re: Werbung in Non-Spam-Mails

Beitragvon anbuva » 21. Apr 2007, 17:50

Hallo Chactory!

Nonsense habe bzw. hatte ich aber auch; warum sollte das ungewöhnlich sein :? Einige Mails enthalten ja auch nur Unsinn....

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause

Re: Werbung in Non-Spam-Mails

Beitragvon Chactory » 22. Apr 2007, 01:08

Hi Anbuva,

anbuva hat geschrieben:Einige Mails enthalten ja auch nur Unsinn....
:wink:

Gruß, Chactory
HilfeHelp «en»TippsAnbuva's FAQBob's FAQ «en»SpamwortlisteRegelfilterScreenshotsSSL/TLSSpami 1.6.0
Vostro 3450, Intel Core i5 2410M 2,3 GHz, 4 GB DDR3 SDRAM 1333 MHz, Windows 7 Pro 64 Bit SP1

Bild
Benutzeravatar
Chactory
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 9593
Registriert: 9. Jan 2004, 23:19
Wohnort: Kiel (D)

Re: Werbung in Non-Spam-Mails

Beitragvon anbuva » 22. Apr 2007, 10:41

Hallo Chactory!

Ab und wann schaue ich da auch mal rein; schon interessant was sich dort für Wörter ansammeln. Manche Sachen wie Arschrhabarberkuchenlöffel u. ä. sollte man ins Museum stellen :lol:

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause


Zurück zu Spam

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

 industrious-southeast