Wiki Python Fr   ExpressionsReguliere UserPreferences
 
HelpContents FindPage Diffs Info Edit Subscribe XML Print View

Le module re (expressions régulières) est un moyen simple et rapide pour extraire des informations précises d'une chaine.

Remarque : en bon français Regulars Expressions se traduit par Expressions Rationnelles

  1. Compilation d'une regex
  2. Les fonctions du module re
    1. match
    2. search
    3. findall
    4. split
    5. sub
    6. subn
  3. Exemple de regex
    1. Extraire les liens HTML
  4. Outils

1. Compilation d'une regex

import re

re.compile(EXPRESSION, DRAPEAUX)

Les drapeaux sont optionnelles

2. Les fonctions du module re

2.1. match

Recherche une expression qui matche seulement si elle en debut de chaine

2.2. search

Recherche une expression qui matche dans toute la chaine

2.3. findall

La fonction findall vous donnera toutes les chaînes de caractères qui correspondent à votre expression régulière.

2.4. split

La fonction split permet de decouper une chaine de caractere en fonction d'une regex

2.5. sub

La fonction sub permet de remplacer ce qui match l'expression reguliere

2.6. subn

Idem mais effectue n remplacements

3. Exemple de regex

3.1. Extraire les liens HTML

import re, urllib

htmlSource = urllib.urlopen("http://sebsauvage.net/index.html").read()
listeDeLiens= re.findall('<a href="(.*?)">',htmlSource)
for lien in listeDeLiens:
    print lien 

4. Outils

Kodos vous permet de déboguer vos expressions régulières et de générer du code Python. * http://kodos.sourceforge.net/

PythonPowered