Zum Inhalt springen
Der Guide für ein smartes Leben.
VG Wort Pixel
Reguläre Ausdrücke

Richtiger Umgang mit Zeichenketten

Beim Umgang und Vergleich von Zeichenketten spielen reguläre Ausdrücke eine zentrale Rolle. Im folgenden Artikel stellen wir Ihnen verschiedene Wege vor, mit denen Sie die Syntax prüfen und neue Ausdrücke einfach definieren können.

Autor: Andreas Hitzig • 16.2.2011 • ca. 3:05 Min

internet, webdesign, zeichenketten, syntax, regex
internet, webdesign, zeichenketten, syntax, regex
© Andreas Hitzig, Daniela Schrank

Reguläre Ausdrücke beschreiben eine Zeichenkette mithilfe einer formalen Sprache. Die einmal definierte Syntax ist die Basis für eine spätere Überprüfung des Aufbaus.Eine E-Mail Adresse besitzt beispielsweise immer das gleiche Muster: eine beliebig lange Kette aus Zahlen und Buchstaben, anschl...

Reguläre Ausdrücke beschreiben eine Zeichenkette mithilfe einer formalen Sprache. Die einmal definierte Syntax ist die Basis für eine spätere Überprüfung des Aufbaus.Eine E-Mail Adresse besitzt beispielsweise immer das gleiche Muster: eine beliebig lange Kette aus Zahlen und Buchstaben, anschließend ein AT-Zeichen, eine zweite Zeichenkette mit mindestens zwei Zahlen oder Buchstaben, einem Punkt und einer Zeichenkette aus zwei bis vier Buchstaben. Natürlich gibt es noch zahlreiche weitere Ausprägungen, beispielsweise wenn es sich um die E-Mailadresse aus einer Subdomain handelt.

Regex - Kurzüberblick

Wenn Sie einen Blick auf den Regex-Ausdruck werfen, der den Aufbau einer E-Mail Adresse beschreibt, zeigt sich der große Nachteil der doch recht kryptisch anmutenden Beschreibungssprache: die Syntax.

^([0-9a-zA-Z]+([_.-]?[0-9a-zA-Z]+)*@
[0-9a-zA-Z]+[0-9,a-z,A-Z,.,-]*(.){1}
[a-zA-Z]{2,4})+$

Das obige Beispiel, realisiert für JavaScript, zeigt die Komplexität der Sprache. Wiederholungen sind durch verschiedene Klammersymbole realisiert und Operatoren beschreiben Verkettungen, Wiederholungen oder Platzhalter.Bei einer solchen Anreihung von Symbolen kann es schnell einmal zu Fehleingaben bei der Definition kommen. Damit schlägt anschließend unter Umständen die komplette Überprüfung fehl. Dies vermeiden Sie am besten, indem Sie ein Programm zur Kontrolle Ihres Regex-Ausdrucks verwenden.Im Internet gibt es auf zahlreichen Webseiten Online-Anwendungen, bei denen Sie Ihre Regex eingeben und in einem weiteren Feld eine Zeichenkette.

Regex Tester

Ein Beispiel ist der Regex Tester (www.regextester.com), bei dem Sie zwischen verschiedenen Dialekten auswählen können. Bevor Sie den Ausdruck definieren, legen Sie über die Kennzeichen (Flags) noch fest, ob

  • nur der erste Ausdruck oder alle Ausdrücke gesucht werden sollen (Flag: g)
  • zwischen Groß- und Kleinschreibung unterschieden werden soll (Flag: i)
  • Zeilenumbrüche berücksichtigt werden sollen, wobei $ dem Anfang und ^ dem Ende einer Zeile entspricht (Flag: m)
  • ein Punkt gleichbedeutend mit einem Zeilenumbruch (\n) interpretiert werden soll (Flag: s).
Anschließend fügen Sie im Feld Type regex Ihren Ausdruck ein und überprüfen diesen durch eine entsprechende Zeichenkette im Feld Test on Text. Das Ergebnis der Überprüfung finden Sie in der Zeile matches. Ist die Anzahl größer null, entspricht mindestens ein Ausdruck dem definierten Muster.

Regexpal

Ein weiteres Testskript, das jedoch lediglich JavaScript Zeichenketten überprüfen kann, ist Regexpal (www.regexpal.com ). Auch bei diesem können Sie, wie beim Regex-Tester die bekannten Flags i, m und s einsetzen. Regexpal bietet zusätzlich einige Darstellungsoptionen, die für eine bessere Übersichtlichkeit sorgen sollen.

internet, webdesign, zeichenketten, syntax, regex
Mit dem JavaScript Regex Generator stellen Sie online reguläre Ausdrücke zusammen.
© Andreas Hitzig, Daniela Schrank

Darüber hinaus finden Sie auf der Webseite auch eine kompakte Übersicht der zur Verfügung stehenden Syntax. Geben Sie in das obere Feld Ihre Regex ein und in den unteren Eingabebereich eine beliebige Anzahl an Wörtern oder Zeichenketten.Abhängig von den gesetzten Optionen sind die Regex-Ausdrücke sowie die korrespondierenden Treffer farblich hervorgehoben. Haben Sie zusätzlich dazu noch die Option Invert results markiert, findet eine Umkehrung der Ergebnismenge statt, es wird also geprüft, ob diese Bedingung nicht erfüllt ist.

Mischform

Eine Mischform aus Überprüfung und Generierung ist der JavaScript Regular Expression Validator (tools.netshiftmedia.com/regexlibrary/# ). Dieser bietet drei Felder, in denen Sie manuell den regulären Ausdruck sowie zwei Testeingaben hinterlegen, darüber hinaus bietet das Skript auch eine recht gut sortierte Bibliothek an Standard-Prüfungen.Klicken Sie dazu den Link Show/Hide Library an und wählen Sie aus der Bibliothek den passenden Ausdruck aus. Für einen ersten Test kopieren Sie diesen entweder und fügen ihn in die Zeile Regular Expression ein oder Sie klicken auf den Link Test. Anschließend können Sie das Beispiel nach Ihren Bedürfnissen anpassen.

Ausdrücke zusammenstellen

Ist Ihnen die manuelle Zusammenstellung von Ausdrücken und auch der Zwischenschritt über die Bibliothek des Validators zu mühsam, greifen Sie einfach auf eines der zahlreich vorhandenen Tools zurück. Unterstütz werden Sie dabei von folgenden Online- und Offline-Varianten.

JavaScript Regex Generator

Auf der Webseite von JSLab finden Sie den JavaScript Regex Generator (www.jslab.dk/tools.regex.php ), ein Skript, mit dem Sie einen Ausdruck zusammenstellen können. Die aktuelle Beta-Version ist auf sieben Gruppen beschränkt und zeigt im IE leichte Stabilitätsprobleme. Bei unseren Test im aktuellen Firefox Browser fand die Generierung der Ausdrücke ohne Probleme statt.Als Erstes wählen Sie aus, welcher Teil der Zeichenkette überprüft werden soll:

  • der Anfang (... which starts with ...)
  • das Ende (... which ends in ...)
  • beides (... which starts and ends in ...)
  • der Inhalt (... which contains ...)
Nächste passende Artikel
captcha, sicherheit, internet
Der richtige Umgang mit Burnout
Strings in PHP verarbeiten
E-Mail Internet eMail Aufmacher
Gesetzliche Unfallversicherung gibt Überlebenstipps für den Büroalltag 7 Mail-Tipps für "gesunden Umgang mit dem Tyrannen"