Sujet sur Discussion utilisateur:Cunegonde1

Sauter à la navigation Sauter à la recherche
Seudo (discussioncontributions)

Bonjour,

Quelques remarques après avoir testé partiellement avec Notepad++ :

- je crois qu'il faudrait mettre un \b avant et après "parle" (pour ne pas matcher des mots tels que "parlement" et les formes conjuguées). De même, \b permettrait de rendre l'expression plus robuste (c'est mieux qu'un espace pour délimiter un mot)

- attention aux negative lookbehind (?<! : beaucoup de moteurs de regexp ne leur permettent pas d'avoir une taille variable, comme c'est le cas dans "(?<!travail|sérail|détail)" qui peut avoir 6 ou 7 lettres. Tu as donc de la chance si ça marche avec ton éditeur de texte, mais pour beaucoup de gens (dont moi avec Notepad++, qui se base sur les regexp de Perl), ça ne fonctionnera pas.

En tout cas bravo pour cette initiative.

Cunegonde1 (discussioncontributions)

Merci beaucoup pour tes encouragements. Je suis plutôt débutant en regex avancé et surtout, j'ai découvert que l'on pouvait les combiner et les enchaîner sans problème. Je commence juste utiliser les negative lookbehind et lookahead, qui sont très puissantes et permettent d'éviter nombre de faux positifs. Je vais multiplier les tests sur ce que tu as repéré en utilisant également Notepad++ avec wine (j'utilise normalement Sigil sous linux).

Pour les espaces, il y a en début et en fin de la regex une séquence d'espace et de ponctuation, mais j'ai essayé ta suggestion d'encadrer parle avec des \b et cela ne pose pas de problème, je vais le généraliser quand nécessaire.

Pour ce qui me concerne, les faux positifs ce sont surtout les formes conjuguées qui peuvent avoir des formes correspondant à des mots non conjugués. Par exemple pour traquer les a sans accent, je cherche pour les exclure les verbes à partir de leur terminaison, mais cela match aussi a encore qui est un faux positif. L'équilibre entre trop de match et pas assez est assez délicat. Cela dit j'ai repassé l'ensemble des mes contributions et cela m'a permis de corriger pas mal d'erreurs.

Répondre à « Expression régulière pour coquilles »