Regelfilter: RegEx für Casino

Hier sollen Ideen und Anregungen für den neuen Regelfilter gesammelt werden.

Regelfilter: RegEx für Casino

Beitragvon Quellcore » 11. Apr 2010, 18:52

Ein Großteil meines Spamaufkommens dreht sich rund um das Online-Kasino.
Speziell der Absendername ist häufig ausreichend, um eine Mail als Online-Kasino Mail zu identifizieren.

Häufig folgt der Absendername der Regel, dass das Wort "Kasino" und dessen Variationen wie "Vegas", "Club" usw. am Ende des Absendernamens steht:
Code: Alles auswählen
"777 Golden Casino" <avyauuxjvy@didama
"Best Gold Casino" <tfonauvyytimn@mashable.com>
"Club Casino" <elickyvgaluu@politico.com>
"Club Reel Vegas" <yhcacjy@jstor.org>
"Gold Casino" <hiomojrodmq@redhatmagazine.com>
"Gold Mummy Cazino" <pewelylpuviun@sacbee.com>
"Gold Stars Casino" <hwtqgdusow@presidentiallife.com>
"Golden 777 Casino" <wpupvuxsfq@boardermail.com>
"Golden Mummy Casino" <kkuga@glay.org>
"Golden Mummy Club" <tquseakewfel@linuxmail.org>
"Golden Mummy Games" <zeoiipxipsq@redhatmagazine.com>
"Golden Mummy Gaming" <ahuaokpzagin@nationalgeographic.com>
"Golden Online Casino" <sbefybgynpuan@schneier.com>
"GoldenMummyCasino" <aowogqisoduyw@corfield.org>
"King Spin 777" <qedycolbvnbb@dariajazz.com>
"KingSpin Casino" <dibef@smart.com.ph>
"Net Casino Stars" <vmhwufewumbic@netsiam.com>
"Online Casino Club" <zxwypjoj@garzagarcia.com>
"Online Prime Play" <btjasynuvie@gizmodo.com>
"Online Reel Vegas" <uszkiml@intellicast.com>
"Online Stars Casino" <ulvtetojvwama@democraticunderground.com>
"Prime Casino" <wilfedi@merriam-webster.com>
"Prime fortune" <zpufoa@notimexico.com>
"Prime Gamble Club" <qepsnqkeaaoxyk@animail.net>
"Prime Game Casino" <quvapivduceqiq@atlaswebmail.com>
"Prime Play Club" <anquazaojximux@foundmagazine.com>
"Real Vegas Club" <aiihikkoxn@doneasy.com>
"Real Vegas Games" <fopkdeciua@jstor.org>
"Reel Casino©" <OliverHewitt@bjorn-berge.com>
"Reel Vegas" <vneruxie@artesmarciales.com>
"Reel Vegas Casino©" <RosanneCrouch@bk21land.com>
"Reel Vegas Cazino" <pisnplldyqibue@reuters.com>
"Reel Vegas Club" <didsolexoac@celineclub.com>
"Royale-Casino" <bqgvnwpgxi@crocereweb.com>
"RubyRoyale cazino" <oygqqwjhuhs@elpatiodeltoro.com>
"Stars 777 Casino" <zeyjisywjgneyc@mail2world.com>
"Stars Casino Online" <onqeva@aguascalientes.com>
"Stars Cazino" <xxivgickiv@life.com>
"Stars Club" <sicaysydnegu@jalopnik.com>
"Stars-Casino" <wlanuiauelodq@merriam-webster.com>
"StarsCasino" <yatzayvzypt@jojomail.com>
"VIP Casino" <aqoicapoioh@nicolastse.com>
"Web Prime Play" <yaoxakag@tuaw.com>
"Web Stars Gaming" <humaego@intellicast.com>

Meine RegEx für alle o.g. Fälle dazu lautet:
Code: Alles auswählen
(Gold(en)?|Stars|Web|[o0]nline|Prime|Re[ea]l|Net|Best|Royale?|VIP|Club|King[\W\s_]?S?pin|King)[\W\s_]?((777|Mummy|Prime|VIP|Play|Gamble|Time|Fortune|Re[ea]l|Vegas)[\W\s_]?)?([kc]a([sz][iL1]|[iL1][sz])n[o0]|gam(ing|es?)|club|play|Vegas|Fortune|Spin[\W\s_]?777|Gambl(e|ing))

Gelegentlich gibt es auch den Fall, dass das Wort "Kasino" am Anfang des Absendernamens steht:
Code: Alles auswählen
"Casino Club" <mquqauruii@icqmail.com>
"Casino Golden Mummy" <zogutyyviuduq@smashingmagazine.com>
"Casino King Spin" <eywrjgvbjkkwv@surfwriter.com>
"Casino No1" <ziiulus@boston.com>
"casino on-line" <aeugiilehoiem@corfield.org>
"Casino Prime" <oawaijitosyn@joystiq.com>
"Casino Real Vegas" <tdaruvyacqyji@graffiti.net>
"Casino RubyRoyale" <bgkulwypolcj@santelmo.org>

Folgende RegEx nimmt sich diesen Fällen an:
Code: Alles auswählen
([kc]a([sz][iL1]|[iL1][sz])n[o0]|club)[\W\s_]?(Gold(en)?|Stars|Web|[o0]n[\W\s_]?line|Prime|Re[ea]l|Net|Best|(Ruby)?Royale?|VIP|Club|King[\W\s_]?S?pin|King|No\.?1)

Hier wurde im Unterschied zu ersten RegEx hauptsächlich die Reihenfolge der Begriffe geändert und ein paar Begriffe ausgelassen.
Sehr vereinzelt gibt es auch das einzelne Wort "Casino" das man mit folgender RegEx erkennen könnte:
Code: Alles auswählen
^"[\W\s_]*?[kc]a([sz][iL1]|[iL1][sz])n[o0][\W\s_]*?"


Nun könnte man diese drei Regulären Ausdrücke als durch ODER-verknüpfte Bedingungen (entspricht der Option "Mindestens eine Bedingung erfüllen") zu einer Regel für den Regelfilter kombinieren:
Casino (Forum).png
Casino (Forum).png (3.64 KiB) 5039-mal betrachtet


Für die, die sich trauen: Viel Spaß beim Ausprobieren :mrgreen:

Gruß,
Quellcore
CPU:Intel Core i7-2700K Processor (@ 45*100 = 4500 MHz)
Board:ASRock P67 Extreme4 Gen3
Ram: 16GB G.SKILL Ripjaws X Series (4 x 4GB) DDR3 2133 (Timings 10-10-10-28 2T @ 1866 MHz)
SSD: Samsung 128GB 2.5-inch SSD 830 Series (Desktop)
HDD-1: WD Caviar® SE16 640 GB, SATA2, 16 MB Cache, 7200 RPM
HDD-2: SAMSUNG EcoGreen F4 ST2000DL004 2TB 32MB Cache
Graphic: ATI Radeon HD 5850 ASUS EAH5850/G/2DIS/1GD5

Win 7 Ultimate 64-Bit / ESET NOD32 Antivirus 8.0 / Firefox 34 / Thunderbird 31
Spamihilator 1.6.0
Benutzeravatar
Quellcore
Assistent
Assistent
 
Beta-Tester
 
Beiträge: 1706
Registriert: 8. Mai 2004, 13:03
Wohnort: Long Island / USA

Re: Regelfilter: RegEx für Casino

Beitragvon Chactory » 12. Apr 2010, 08:33

Hallo Quellcore!

Sehr cool, das werde ich ausprobieren! :)

Gruß, Chactory
HilfeHelp «en»TippsAnbuva's FAQBob's FAQ «en»SpamwortlisteRegelfilterScreenshotsSSL/TLSSpami 1.6.0
Vostro 3450, Intel Core i5, 8 GB RAM, Windows 7 Pro 64 Bit
Neu: Inspiron 14 5000, Intel Core i7, 16 GB RAM, Win 10 Pro 64 Bit
Bild
Benutzeravatar
Chactory
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 9612
Registriert: 9. Jan 2004, 23:19
Wohnort: Kiel (D)

Re: Regelfilter: RegEx für Casino

Beitragvon anbuva » 12. Apr 2010, 19:04

Hallo Quellcore!

cool 8) ; klar traue ich mich. Das muss man einfach testen. Tolle Arbeit! :D

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause

Re: Regelfilter: RegEx für Casino

Beitragvon Andreas_Z » 13. Apr 2010, 07:10

Hallo Quellcore!

Super Sache das. Aber irgendwie werde ich Gefühl nicht los, dass hier der lernende Filter arbeitslos gemacht wird. Eigentlich soll der ja die Hauptarbeit leisten..... :wink:

Gruß
Andreas_Z
Core i7 3,4 GHz, 8 GB RAM, Win7 64bit SP1, GDATA Bussiness 11.0
Exchange-Server 2003, VM mit WinXP Pro SP3.
Spami-Online-Hilfe, Spami-FAQ, Anbuva's FAQ
Benutzeravatar
Andreas_Z
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 4380
Registriert: 6. Nov 2003, 08:10
Wohnort: Schwielowsee, Germany

Re: Regelfilter: RegEx für Casino

Beitragvon anbuva » 13. Apr 2010, 14:05

Hallo Andreas_Z!

das wird der bestimmt nicht. Er steht bei mir ganz am Ende und sorgt auch immer noch für Filterungen :wink:

Gruß
anbuva
Benutzeravatar
anbuva
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 8403
Registriert: 1. Sep 2004, 12:58
Wohnort: Zuhause

Re: Regelfilter: RegEx für Casino

Beitragvon Quellcore » 14. Apr 2010, 03:44

Andreas_Z hat geschrieben:Aber irgendwie werde ich Gefühl nicht los, dass hier der lernende Filter arbeitslos gemacht wird. Eigentlich soll der ja die Hauptarbeit leisten..... :wink:

Mir graut immer davor, dass der lernende Filter eine Mail klassifiziert.
Beim täglichen Durcharbeiten des TB lasse ich immer gerne nach Filterungsgrund sortieren und schaue mir dann dann die durch den Lernenden Filter verursachten Fälle ganz genau an.

Einen weiteren Grund kennst Du ja bereits: Irgendwann einmal werde ich von den erweiterten Optionen im Regelfilter Gebrauch machen wollen und mir einen Großteil des klassifizierten Spam nicht mehr im Trainingsbereich anzeigen lassen.

Ich habe noch einen triftigeren Grund, der aber eine ziemlich ausladende Erklärung erfordert und letztendlich auf ein Feature Request bzw. eine Bug Report für den Spami hinausläuft.
Kurz gesagt: Ein Grossteil meines Mailaufkommens lässt sich nur über Daten aus dem Header korrekt klassifizieren, da der Mailtext für den Spami nicht sichtbar ist.
Filter wie der lernende Filter, der Spamwortfilter, DCC koennen also nciht zur Klassifizierung beitragen.
Ich werde für dieses Problem aber noch einmal ein neues Thema in einem passenderem Unterforum erstellen, ich bin ja sozusagen nur auf Bewährung draussen, da ja immer noch drei ausgebrochene Themen von mir in der freien Wildbahn umhergeistern und noch nicht wieder eingefangen werden konnten.

Gruß,
Quellcore
CPU:Intel Core i7-2700K Processor (@ 45*100 = 4500 MHz)
Board:ASRock P67 Extreme4 Gen3
Ram: 16GB G.SKILL Ripjaws X Series (4 x 4GB) DDR3 2133 (Timings 10-10-10-28 2T @ 1866 MHz)
SSD: Samsung 128GB 2.5-inch SSD 830 Series (Desktop)
HDD-1: WD Caviar® SE16 640 GB, SATA2, 16 MB Cache, 7200 RPM
HDD-2: SAMSUNG EcoGreen F4 ST2000DL004 2TB 32MB Cache
Graphic: ATI Radeon HD 5850 ASUS EAH5850/G/2DIS/1GD5

Win 7 Ultimate 64-Bit / ESET NOD32 Antivirus 8.0 / Firefox 34 / Thunderbird 31
Spamihilator 1.6.0
Benutzeravatar
Quellcore
Assistent
Assistent
 
Beta-Tester
 
Beiträge: 1706
Registriert: 8. Mai 2004, 13:03
Wohnort: Long Island / USA

Re: Regelfilter: RegEx für Casino

Beitragvon Andreas_Z » 14. Apr 2010, 06:44

Hallo Quellcore!

Hmmm... Du machst mich Neugierig.....

ich habe zwei Deiner Themen ins Forum "Ideen zum Regelfilter" verschoben. Ich hoffe, dass war in Deinem Sinne. Das dritte habe ich nicht gefunden auf die schnelle. Wenn irgendwas nicht geht, einfach melden.

Gruß
Andreas_Z
Core i7 3,4 GHz, 8 GB RAM, Win7 64bit SP1, GDATA Bussiness 11.0
Exchange-Server 2003, VM mit WinXP Pro SP3.
Spami-Online-Hilfe, Spami-FAQ, Anbuva's FAQ
Benutzeravatar
Andreas_Z
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 4380
Registriert: 6. Nov 2003, 08:10
Wohnort: Schwielowsee, Germany

Re: Regelfilter: RegEx für Casino

Beitragvon Quellcore » 15. Apr 2010, 04:04

Hallo Andreas_Z!

Dankeschön, der fehlende dritte Beitrag ist der zum RegEx-Alphabet


Gruß
Quellcore
CPU:Intel Core i7-2700K Processor (@ 45*100 = 4500 MHz)
Board:ASRock P67 Extreme4 Gen3
Ram: 16GB G.SKILL Ripjaws X Series (4 x 4GB) DDR3 2133 (Timings 10-10-10-28 2T @ 1866 MHz)
SSD: Samsung 128GB 2.5-inch SSD 830 Series (Desktop)
HDD-1: WD Caviar® SE16 640 GB, SATA2, 16 MB Cache, 7200 RPM
HDD-2: SAMSUNG EcoGreen F4 ST2000DL004 2TB 32MB Cache
Graphic: ATI Radeon HD 5850 ASUS EAH5850/G/2DIS/1GD5

Win 7 Ultimate 64-Bit / ESET NOD32 Antivirus 8.0 / Firefox 34 / Thunderbird 31
Spamihilator 1.6.0
Benutzeravatar
Quellcore
Assistent
Assistent
 
Beta-Tester
 
Beiträge: 1706
Registriert: 8. Mai 2004, 13:03
Wohnort: Long Island / USA

Re: Regelfilter: RegEx für Casino

Beitragvon Andreas_Z » 15. Apr 2010, 06:16

Hallo Quellcore!

Ähh ja.... und wo ist der?

Gruß
Andreas_Z
Core i7 3,4 GHz, 8 GB RAM, Win7 64bit SP1, GDATA Bussiness 11.0
Exchange-Server 2003, VM mit WinXP Pro SP3.
Spami-Online-Hilfe, Spami-FAQ, Anbuva's FAQ
Benutzeravatar
Andreas_Z
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 4380
Registriert: 6. Nov 2003, 08:10
Wohnort: Schwielowsee, Germany

Re: Regelfilter: RegEx für Casino

Beitragvon Quellcore » 15. Apr 2010, 22:28

Hallo Andreas_Z!

Kurzzeitgedächtnis im Beamer hängen geblieben :?: :mrgreen:
Das ist der Thread in dem Du hoch und heilig versprochen hast, Deinen Spami-Papierkorb nach weiteren Ergänzungen für das RegEx-Alphabet zu durchsuchen.

http://www.spamihilator.com/forum/viewtopic.php?f=56&t=8252

Gruß
Quellcore
CPU:Intel Core i7-2700K Processor (@ 45*100 = 4500 MHz)
Board:ASRock P67 Extreme4 Gen3
Ram: 16GB G.SKILL Ripjaws X Series (4 x 4GB) DDR3 2133 (Timings 10-10-10-28 2T @ 1866 MHz)
SSD: Samsung 128GB 2.5-inch SSD 830 Series (Desktop)
HDD-1: WD Caviar® SE16 640 GB, SATA2, 16 MB Cache, 7200 RPM
HDD-2: SAMSUNG EcoGreen F4 ST2000DL004 2TB 32MB Cache
Graphic: ATI Radeon HD 5850 ASUS EAH5850/G/2DIS/1GD5

Win 7 Ultimate 64-Bit / ESET NOD32 Antivirus 8.0 / Firefox 34 / Thunderbird 31
Spamihilator 1.6.0
Benutzeravatar
Quellcore
Assistent
Assistent
 
Beta-Tester
 
Beiträge: 1706
Registriert: 8. Mai 2004, 13:03
Wohnort: Long Island / USA

Re: Regelfilter: RegEx für Casino

Beitragvon Andreas_Z » 16. Apr 2010, 06:45

Hallo Quellcore!

So verschoben. Auch wenn er eigentlich recht allgemeingültig ist und nicht nur für den Regelfilter interessant.

Ansonsten hast Du recht. Ich hatte es versprochen. Das Problem ist immer wieder die Zeit. Daher suche ich gleich mal kurz durch....

Gruß
Andreas_Z
Core i7 3,4 GHz, 8 GB RAM, Win7 64bit SP1, GDATA Bussiness 11.0
Exchange-Server 2003, VM mit WinXP Pro SP3.
Spami-Online-Hilfe, Spami-FAQ, Anbuva's FAQ
Benutzeravatar
Andreas_Z
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 4380
Registriert: 6. Nov 2003, 08:10
Wohnort: Schwielowsee, Germany

Re: Regelfilter: RegEx für Casino

Beitragvon Quellcore » 16. Apr 2010, 22:59

Andreas_Z hat geschrieben:So verschoben. Auch wenn er eigentlich recht allgemeingültig ist und nicht nur für den Regelfilter interessant.

Vielen Dank!
Ich war der Meinung, wir hätten uns für einen etwas allgemeineren Titel für dieses Unterforum entschieden, so dass hier auch Reguläre Ausdrücke im allgemeinen (z.B. für den Spamwortfilter) ihren Platz gefunden hätten.
Wie dem auch sei, im Beta 0.9.9.52 Bereich hatte der Beitrag natürlich nichts zu suchen.
Andreas_Z hat geschrieben:Ansonsten hast Du recht. Ich hatte es versprochen. Das Problem ist immer wieder die Zeit. Daher suche ich gleich mal kurz durch....

Ich wollte damit keinen Druck aufbauen, da hätte wohl ein Smiley am Ende meines Kommentars Not getan. :oops:
Vielmehr war es meine Intention, dass Du Dich wieder an den Thread erinnerst, da Du ja dort selbst mit Beiträgen geantwortet hast.

Gruß,
Quellcore
CPU:Intel Core i7-2700K Processor (@ 45*100 = 4500 MHz)
Board:ASRock P67 Extreme4 Gen3
Ram: 16GB G.SKILL Ripjaws X Series (4 x 4GB) DDR3 2133 (Timings 10-10-10-28 2T @ 1866 MHz)
SSD: Samsung 128GB 2.5-inch SSD 830 Series (Desktop)
HDD-1: WD Caviar® SE16 640 GB, SATA2, 16 MB Cache, 7200 RPM
HDD-2: SAMSUNG EcoGreen F4 ST2000DL004 2TB 32MB Cache
Graphic: ATI Radeon HD 5850 ASUS EAH5850/G/2DIS/1GD5

Win 7 Ultimate 64-Bit / ESET NOD32 Antivirus 8.0 / Firefox 34 / Thunderbird 31
Spamihilator 1.6.0
Benutzeravatar
Quellcore
Assistent
Assistent
 
Beta-Tester
 
Beiträge: 1706
Registriert: 8. Mai 2004, 13:03
Wohnort: Long Island / USA

Re: Regelfilter: RegEx für Casino

Beitragvon Andreas_Z » 19. Apr 2010, 07:12

Hallo Quellcore!

Hey, keine Sorge. Ich fand es gut, dass mich erinnert hast. Ich hatte es vergessen und versprochen und versprochen. Suchst Du nach solchen Buchstabenersetzungen auch im Mailtext oder nur in Betreff?

Gruß
Andreas_Z
Core i7 3,4 GHz, 8 GB RAM, Win7 64bit SP1, GDATA Bussiness 11.0
Exchange-Server 2003, VM mit WinXP Pro SP3.
Spami-Online-Hilfe, Spami-FAQ, Anbuva's FAQ
Benutzeravatar
Andreas_Z
Administrator
Administrator
 
Administration
Beta-Tester
Forum-Team
 
Beiträge: 4380
Registriert: 6. Nov 2003, 08:10
Wohnort: Schwielowsee, Germany


Zurück zu Ideen zum Regelfilter

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron

 industrious-southeast