Textfilter mit regulären Ausdrücken
iQ.Suite Tipps & Tricks für Lotus Notes Domino
Wenn Sie nicht Wörter suchen, sondern Zeichenketten, wie z.B.
Kontonummern, Bankleitzahlen finden wollen, die nach einem festen Muster
definiert sind, können Sie in der iQ.Suite mit „Regulären Ausdrücken“
nach Mustern in Zeichenketten suchen.
Beschrieben wird die Verwendung der „Regulären Ausdrücke“ am Beispiel der „International Bank Account Number“ [IBAN].
Die deutsche IBAN ist z.B. nach folgendem Muster aufgebaut:
DExx xxxx xxxx xxxx xxxx xx
(DE steht für Deutschland, p für die Prüfziffer, b für die Bankleitzahl und k für die Kontonummer)
In den meisten Ländern ist der Ländercode der einzige Buchstabencode in
der IBAN, aber es gibt auch Länder, wie etwa Frankreich, in denen sowohl
Bankleitzahl als auch Kontonummern Buchstaben enthalten.
In diesem Beispiel wird davon ausgegangen, dass die Bankleitzahl und
Kontonummer aus Ziffern besteht. Durch die unterschiedlichen Regeln kann
die IBAN zwischen 18 und 32 Zeichen lang sein.
Step by Step:
- Erstellen eines „iQ.Suite Utilities Dictionary“ Dokumentes

Bild: Dictonary-Dokument (Wall - Utilities -Dictonary)
Sie geben eine Kategorie (hier „Bank“) und eine Gewichtung des Ausdruckes (hier 1) und den „Regulären Ausdruck“ (hier „[A-Za-z]{2}[0-9]{2}[0-9s]{11,30}“) selbst ein.

- Erstellen eines „Wall Mail Job Advanced“ Dokumentes

I: Stellen Sie in „Operations“ die „vorbereitenden“ Tools (Unpacker/Konvertierer/Textnormalisierer) ein
II: Wählen Sie das Analysetool für „Regulär Expressions“ (Unicode Analyzer for Regular Expressions) aus
III: Wählen Sie die zu prüfenden Teile der E-Mail aus
IV: Wählen Sie die von
Ihnen erstellte Textliste/Dictonary (Kategorie „Bank“) aus und
definieren Sie mit dem Schwellenwert, wie häufig das Textmuster in der
E-Mail erkannt werden muss.
Die restlichen Einstellungen nehmen Sie wie gewohnt vor.
Dieser Job filtert jetzt alle E-Mails heraus, die eine IBAN enthalten.
Sehen Sie dazu den Auszug aus der iQ.Suite Quarantäne.

