Espressioni regolari (regex)

Le espressioni regolari sono insiemi di simboli che identificano un insieme di stringhe.

OPERATORESIGNIFICATOREGEXSTRINGHE CERCATENOTE
(nessuno)Stringa esattaabcabc 
[]Uno tra i caratteri inclusi[abc]a, b, cCorrisponde ad un OR fra tutti i caratteri inclusi nella cornice
Set di caratteri0-9Un carattere numerico 
a-zUn carattere alfabetico minuscolo 
A-ZUn carattere alfabetico maiuscolo 
\\dUn carattere numericoCorrisponde a [0-9]
\wUn carattere alfabetico maiuscolo, minuscolo o underscoreCorrisponde a [a-zA-Z0-9_]
\sSpazio, tab o newlineCorrisponde a [ \t\r\n]
\DQualsiasi carattere non numericoCorrisponde a ^\d
\WQualsiasi carattere non alfabeticoCorrisponde a ^\w
\SQualsiasi carattere diverso da Spazio, tab o newlineCorrisponde a ^\s
.Tutto tranne newline.Qualsiasi carattere diverso da newlineUtile per delimitare i paragrafi, è dipendente dalla piattaforma (il newline non è uguale su tutte le piattaforme)
\.Carattere ‘punto’\.. 
?0 oppure 1 (car. prec.)abc?ab, abcServe anche a togliere l’”avidità” a * e +, scrivendolo immediatamente dopo: “*?”, “+?”.
     
*0 o più (car. prec.)abc*ab, abc, abcc, abccc, … 
\*Carattere ‘asterisco’\** 
+1 o più (car. prec.)abc+abc, abcc, abccc, abcccc, … 
{n}Esattamente n volte (car. prec.)abc{2}abcc 
{n, m}Da n a m volte (car. prec.)abc{2, 3}abcc, abccc 
^Not[^a]b, c, d, e, …Si applica a tutta la cornice che lo contiene
\\Carattere ‘backslash’\\\ 
|Ora|b|ca, b, cCorrisponde ad [abc]
()Raggruppamento(a|b)cac, bcCorrisponde ad [ab]c
^Inizio del testo^aQualunque stringa che inizia per ‘a’È uguale al “not”, ma a differenza di questo è usato al di fuori di una cornice.
$Fine del testoa$Qualunque stringa che finisce per ‘a’ 
\bConfine di parola\bword\bOgni occorrenza di ‘word’