Movatterモバイル変換

[0]ホーム

Aller au contenu

Expression régulière

Modifier les liens

Un article de Wikipédia, l'encyclopédie libre.

(Redirigé depuisExpression rationnelle)

Pour les articles homonymes, voirrégulier etrationnel.

Surlignage du résultat de la recherche des lettres r suivies d'une voyelle au moyen d'une expression rationnelle:`/r[aeiou]+/g` (la lettre minusculer suivie par une ou plusieurs voyelles latines).

Stephen Cole Kleene, dont les travaux ont fondé le concept d'expression régulière.

Eninformatique, uneexpression régulière ouexpression rationnelle^[1] ouexpression normale^{[note 1]} oumotif est unechaîne de caractères qui décrit, selon une syntaxe précise, unensemble de chaînes de caractères possibles. Les expressions régulières sont également appeléesregex (unmot-valise formé depuis l'anglaisregular expression). Les expressions rationnelles sont issues des théories mathématiques deslangages formels des années 1940. Leur capacité à décrire avec concision desensembles réguliers explique qu’elles se retrouvent dans plusieurs domaines scientifiques dans les années d’après-guerre et justifie leur adoption eninformatique. Les expressions régulières sont aujourd’hui utilisées pour programmer des logiciels avec des fonctionnalités de lecture, de contrôle, de modification, et d'analyse de textes ainsi que dans la manipulation des langues formelles que sont leslangages informatiques.

Les expressionsrégulières ont la qualité de pouvoir être décrites par des formules ou motifs (en anglaispatterns) bien plus simples que les autres moyens^[2].

Expression régulière	Mots décrits	Mots non décrits
détecté	« détecté »	« détect », « détecta », « détectés », « »
ex (a?e\|æ\|é)quo	« ex équo », « ex equo », « ex aequo » et « ex æquo »	« ex quo », « ex aiquo », « ex aeko », « ex æéquo »
^Section .+	« Section 1 », « Section 22 », « Section A », …	« voir Section 1 », « Sectionner »
6,66*$	« 6,6 », « 6,666 », « 6,6666 », …	« 6,66667 »,
[1234567890]+(,[1234567890]+)?	« 2 », « 42 », « 0,618 », « 49,3 », …	« 3, », « ,75 » , « »

Opérateurs	Description	Exemples
Opérateurs	Description	Expression régulière	Chaînes décrites	Chaînes non décrites
expr₁ expr₂	Opérateur de concaténation de deux expressions (implicite).	ab	« ab »	« a », « b », chaîne vide
.	Un caractère et un seul	.	« a », « b », etc.	chaîne vide, « ab »
expr?	Ce quantificateur correspond à ce qui le précède, présentzéro ou une fois. Si de multiples correspondances existent dans un texte, il trouve d’abord ceux placés en tête du texte et retourne alors la plus grande longueur possible à partir de cette position initiale.	a?	chaîne vide, « a »	« aa », « b »
expr+	Ce quantificateur correspond à ce qui le précède, répétéune ou plusieurs fois. Si de multiples correspondances existent dans un texte, il trouve d’abord ceux placés en tête du texte et retourne alors la plus grande longueur possible à partir de cette position initiale.	a+	« a », « aa », « aaaaa », etc.	chaîne vide, « b », « aaab »
expr*	Ce quantificateur correspond à ce qui le précède, répétézéro ou plusieurs fois. Si de multiples correspondances existent dans un texte, il trouve d’abord ceux placés en tête du texte et retourne alors la plus grande longueur possible à partir de cette position initiale.	a*	chaîne vide, « a », « aaa », etc.	« b », « aaab »
expr₁\|expr₂	C’est l’opérateur de choix entre plusieurs alternatives, c’est-à-dire l’union ensembliste. Il peut être combiné autant de fois que nécessaire pour chacune des alternatives possibles. Il fait correspondrel’une des expressions placées avant ou après l’opérateur. Ces expressions peuvent éventuellement être vides, et donc (x\|) équivaut à x?.	a\|b	« a », « b »	chaîne vide, « ab », « c »
[liste]	Un des caractères entre crochets (« classe de caractères »)	[aeiou]	« a », « e », « i », etc.	chaîne vide, « b », « ae »
[^liste]	Un caractère n’étant pas entre crochets (« classe de caractères »)	[^aeiou]	« b », etc.	chaîne vide, « a », « bc »
(expr)	Groupement de l’expression entre parenthèses	(détecté)	« détecté », « détectés »	« détect », « détecta »
expr{n}	Exactementn occurrences de l’expression précédant les accolades	a{3}	« aaa »	« aa », « aaaa »
expr{n,m}	Entren etm occurrences de l’expression précédant les accolades	a{2,4}	« aa », « aaa », « aaaa »	« a », « aaaaa »
expr{n,}	Au moinsn occurrences de l’expression précédant les accolades	a{3,}	« aaa », « aaaa », « aaaaa », etc.	« aa »
^	Ce prédicat ne correspond à aucun caractère mais fixe une condition nécessaire permettant de trouver un accord sur ce qui le suit en indiquant que ce doit être audébut d’une ligne (donc être au début du texte d’entrée ou après un saut de ligne). Il ne peut être considéré ainsi qu’au début de l’expression régulière, ailleurs il est considéré littéralement. Il s’applique comme condition à la totalité du reste de l’expression régulière (et concerne donc toutes les alternatives représentées).	^a trouve « a » en début de ligne mais pas dans « ba ».
$	Ce prédicat ne correspond à aucun caractère mais fixe une condition nécessaire permettant de trouver un accord sur ce qui le précède en indiquant que ce doit être àla fin d’une ligne (donc être à la fin du texte d’entrée ou juste avant un saut de ligne). Il ne peut être considéré ainsi qu’à la fin de l’expression régulière, ailleurs il est considéré littéralement. Il s’applique comme condition à la totalité du reste de l’expression régulière (et concerne donc toutes les alternatives représentées).	a$ trouve « a » en fin de ligne mais pas dans « ab ».

POSIX	Non-standard	perl, Python	Vim	Java	Unicode^[7]^,^[8]	ASCII	Description
				`\p{ASCII}`		`[\x00-\x7F]`	CaractèresASCII
`[:alnum:]`				`\p{Alnum}`		`A-Za-z0-9`	Caractèresalphanumériques
	`[:word:]`	`\w`	`\w`	`\w`		`A-Za-z0-9_`	Caractères alphanumériques, et « _ »
		`\W`	`\W`	`\W`		`^A-Za-z0-9_`	Caractères ne composant pas les mots
`[:alpha:]`			`\a`	`\p{Alpha}`	`\p{L}` ou`\p{Letter}`	`A-Za-z`	Caractères alphabétiques
`[:blank:]`			`\s`	`\p{Blank}`		`\t`	Espace et tabulation
		`\b`	`\< \>`	`\b`		`(?<=\W)(?=\w)\|(?<=\w)(?=\W)`	Positions de début et fin de mots
		`\B`		`\B`		`(?<=\W)(?=\W)\|(?<=\w)(?=\w)`	Positions ne correspondant pas à un début ou une fin de mot
`[:cntrl:]`				`\p{Cntrl}`	`\p{Cc}` ou`\p{Control}`	`\x00-\x1F\x7F`	Caractères de contrôle
`[:digit:]`		`\d`	`\d`	`\p{Digit}` ou`\d`	`\p{Nd}` ou`\p{Decimal_Digit_Number}`	`0-9`	Chiffres décimaux
		`\D`	`\D`	`\D`	`\P{Nd}` ou`\P{Decimal_Digit_Number}`	`^0-9`	Autre chose qu'un chiffre décimal
`[:graph:]`				`\p{Graph}`		`\x21-\x7E`	Caractères visibles
`[:lower:]`			`\l`	`\p{Lower}`	`\p{Ll}` ou`\p{Lowercase_Letter}`	`a-z`	Lettres en minuscule
`[:print:]`			`\p`	`\p{Print}`		`\x20-\x7E`	Caractères imprimables
`[:punct:]`				`\p{Punct}`	`\p{P}` ou`\p{Punctuation}`	][!"#$%&'()*+,./:;<=>?@\^_`{\|}~-	Caractères de ponctuation
`[:space:]`		`\s`	`\_s`	`\p{Space}` ou`\s`	`\p{Z}` ou`\p{Separator}`	`\t\r\n\v\f`	Caractères d'espacement
		`\S`	`\S`	`\S`	`\P{Z}` ou`\P{Separator}`	`^ \t\r\n\v\f`	Autre chose qu'un caractère d'espacement
`[:upper:]`			`\u`	`\p{Upper}`	`\p{Lu}` ou`\p{Uppercase_Letter}`	`A-Z`	Lettres capitales
`[:xdigit:]`			`\x`	`\p{XDigit}`		`A-Fa-f0-9`	Chiffres hexadécimaux
		`\A`					Début de chaîne de caractère
		`\Z`					Fin de chaîne de caractère

Opérateur étendu (non POSIX)	Description	Exemple
`\{m,n\}`	Dans la notation étendue, cela crée un quantificateur borné personnalisé, permettant de faire correspondre exactement dem àn occurrences de ce qui précède,m etn étant deux entiers tels quem < n. Chacun des deux paramètres peut être omis : si le premier paramètrem est omis, il prend la valeur par défaut 0 ; si le second paramètren est omis, mais la virgule est présente, il est considéré comme infini ; si le second paramètren est omis ainsi que la virgule séparatrice, il prend la valeur par défaut égale au premier paramètrem.	Voir exemples ci-dessous.
`\( \)`	Dans la notation étendue, les parenthèses de groupement (dans une séquence d’échappement) permettent de délimiter un ensemble d’alternatives, ou toute sous-expression régulière (à l’exception des conditions de début et fin de ligne) pour leur appliquer un quantificateur. De plus, ces parenthèses délimitent un groupe de capture numéroté qui peut être utilisé pour les substitutions (on référence alors les groupes capturés dans la chaîne de substitution avec`$n` oùn est le numéro de groupe de capture entre 1 et 9, la totalité de la chaîne trouvée étant représentée par`$&`).	Voir exemples ci-dessous.

v ·m Automates finis et langages réguliers
Articles généraux	Théorie des automates Automate fini Machine abstraite
Automates finis	Automate fini déterministe Automate fini inambigu Automate fini non déterministe Construction par sous-ensembles Automate sur les mots infinis
Automates finis particuliers	Automate alternant Automate bidirectionnel Automate pondéré Automate probabiliste Automate quantique Automate temporisé Automate de Büchi Automate de Muller Modèle de Markov caché Système de transition d'états Structure de Kripke Machine à états abstraits Machine de Mealy Machine de Moore Transducteur fini Automate séquentiel
Langages réguliers	Langage rationnel Langage sans étoile Langage local Langage congruentiel Langage stochastique Lemme de l'étoile Lemme d'Arden ω-langage rationnel
Des automates aux langages	Expression régulière Algorithme de Conway Algorithme de McNaughton et Yamada Méthode de Brzozowski et McCluskey
Des langages aux automates	Dérivée de Brzozowski Algorithme de Thompson Construction de Glushkov Complexité en états
Minimisation	Théorème de Myhill-Nerode Équivalence de Nerode Minimisation d'un automate fini déterministe Algorithme de Moore Algorithme de Brzozowski Algorithme de Hopcroft
Équivalences	Théorème de Kleene Étoile de Kleene Monoïde syntaxique Théorème des variétés d'Eilenberg

v ·m Informatique théorique
Codage	Codage de l'information Compression de données Chiffrement Cryptanalyse Cryptographie Théorie de l'information
Modèles de calcul	Calculabilité Décidabilité et indécidabilité Ensemble récursif Problème de l'arrêt Ensemble récursivement énumérable Machine de Turing Thèse de Church Automate cellulaire Réseau de neurones artificiels Réduction polynomiale Problème NP-complet Principe de Church-Turing-Deutsch
Algorithmique	Algorithmique Algorithme glouton Algorithme probabiliste Algorithme génétique Complexité algorithmique Analyse d'algorithme Diviser pour régner Heuristique Programmation dynamique Géométrie algorithmique Algorithmes de tri Algorithmique du texte Exploration de données Science des données Apprentissage profond Test de primalité Structure de données Arbre enraciné Concurrence Parallélisme
Syntaxe	Réécriture Compilation Expression régulière Grammaire formelle Langage rationnel Ensemble rationnel Théorie des langages Théorie des automates Automate fini Automate sur les mots infinis Automate d'arbres Automate à pile Hiérarchie de Chomsky Linguistique informatique
Sémantique	Interprétation abstraite Méthodes formelles Vérification de modèles Sémantique des langages de programmation Sémantique dénotationnelle Sémantique axiomatique Sémantique opérationnelle
Logique mathématique	Assistant de preuve Calcul des prédicats Correspondance de Curry-Howard Fonction récursive Lambda-calcul Théorèmes d'incomplétude de Gödel Théorie des types
Mathématiques discrètes	Combinatoire Algorithme du simplexe Optimisation combinatoire Théorie des graphes Algorithmes de la théorie des graphes Recherche opérationnelle Théorie de la décision Analyse numérique

Movatterモバイル変換

Histoire

Utilisation

Principes

Opérateurs

Standards

Classe de caractères

Standardisation et application

Classe d'équivalence

Fonctions avancées

Notations : implémentations et standardisation

Standard POSIX

Expressions régulières basiques

Expressions régulières étendues

Séquences d’échappement

Notation étendue dans vim et emacs

Python

Bibliothèque BSD

Tcl

Perl

PHP

ICU

Expressions régulières et Unicode

Implémentations et complexité algorithmique

Notes et références

Notes

Références

Voir aussi

Articles connexes

Bibliographie

Liens externes