Expresiones regulares

Enero 22nd, 2009 | by admin |

Una expresión regular es un conjunto de caracteres y símbolos que definen una cadena según un patrón y no por sus elementos; por ejemplo, si queremos representar una cadena de caracteres que sólo puede estar formada por las letras a, b, c y los números del 1 al 3, utilizaremos el siguiente patrón: ^([a,b,c,1,2,3]+)$.

Ahora veamos los signos básicos en las expresiones regulares y su significado:

^ Inicio de la cadena
$ Fin de la cadena
[] Cualquier caracter del conjunto, por ejemplo [xyz] representa el conjunto formado por las letras x,y,z y encontrará cualquiera de esos caracteres.
[^] Cualquier caracter no incluido en el conjunto, por ejemplo[^xyz] representa cualquier caracter no incluido en el conjunto formado por las letras x,y,z
? Cero o una ocurrencia de lo que precede al símbolo, por ejemplo para encontrar cero o una ocurrencia de www. utilizaremos el patrón (www.)?
+ El caracter que le precede debe aparecer al menos una vez, por ejemplo Google, Gooogle, Gooooooogle se representa con la siguiente expresión regular: Goo+gle
* El caracter que le precede debe aparecer cero, una o más veces, utilizando el ejemplo anterior, Gooo*gle representa Google, Goooogle, Goooooogle.
{x} x ocurrencias del caracter que lo precede, por ejemplo www. podría ser representado con el patrón w{3}.
{x,z} Entre x y z ocurrencias del caracter que lo precede, con el ejemplo de Google, si quisiéramos que hubieran mínimo 2 letras o y máximo 5, utilizaríamos el patrón Go{2,5}gle
{x,} x o más ocurrencias de lo que lo precede, con el ejemplo de Google, para tener 2 o más letras o usaríamos la expresión regular Go{2,}gle

Esos son los signos básicos de las expresiones regulares, también tenemos la barra invertida, que se utiliza como caracter de escape en ciertos casos, cuando se desea incuir un caracter especial como ., * o ?, y para definir tipos de caracteres en otros, vemos algunos casos.

. Un punto dentro del patrón, como definimos en uno de los ejemplos anteriores, la expresión w{3}. define la cadena www.
s Representa un espacio en blanco
d Un dígito numérico
w Un caracter alfanumérico
n Un salto de línea
r Representa el caracter de retorno de carro
t Tabulador
S Cualquier caracter excepto un espacio en blanco
D Cualquier caracter excepto un dígito numérico
W Representa cualquier caracter no alfanumérico

Esta es una introducción muy básica al uso de expresiones regulares, simplemente hemos visto algunos de los signos más básicos, en la próxima parte de este artículos veremos como crear algunas expresiones un poco más complejas. Mientras tanto pueden ir probando algunas expresiones en regexpal.com, un intérprete online de expresiones regulares.

Visto aqui

Compartelo:
  • BarraPunto
  • del.icio.us
  • Facebook
  • TwitThis
  • Live
  • Google Bookmarks
  • Digg
  • Meneame
  • Technorati
  • Bitacoras.com
  • Yahoo! Bookmarks
  • LinkedIn

Post relacionados

¿Alguna duda?¿Alguna aclaración?

Escribe un comentario!