Utilisateur:Sicarov/AWB Regex
1.L'éditeur semi-automatisé AutoWikiBrowser AWB
2.Expression régulière Cherche-Remplace, [1] + aide de ChatGPT si besoin
3.pour faire des clics Actiona
4.Code du bouton T pour typographie + Gadget Caractères spéciaux raccourcis clavier
Mémo des Regex fréquentes regex101.com[modifier]
[abc]
Correspond à un caractère a, b ou c ([^abc]
= non [abc])[a-z]
Correspond à tout caractère entre a et z, en incluant a et z.a|b
Matches either what is before the | or what is after it - in this case `a` or `b`.
You can use alternates locally as part of a capturing/non-capturing group. For example: /I love (?:cats|dogs) but hate snakes/
\s
correspond à un espace, une tabulation ou un caractère "nouvelle-ligne" (\S
= non\s)\d
Matches any decimal digit. Equivalent à [0-9]. (\D
= non \d)a{3,6}
Correspond à entre 3 et 6 caractères consécutifs (bornes incluses).^
Matches the start of a string without consuming any characters. If /m multiline mode is used, this will also match immediately after a newline character.$
Correspond à la fin d'une chaîne sans consommer de caractères. Si le mode multiligne est utilisé, cela correspondra aussi juste avant un caractère d'une nouvelle ligne.\n
correspond au caractère nouvelle-ligne(?:...)
A non-capturing group allows you to apply quantifiers to part of your regex but does not capture/assign an ID. For example, repeating 1-3 digits and a period 3 times can be done like this:/(?:\d{1,3}\.){3}\d{1,3}/
(?=...)
Affirme que le sous-modèle donné peut être mis en correspondance ici, sans consommer de caractères/foo(?=bar)/ foobar foobaz
(?!...)
Starting at the current position in the expression, ensures that the given pattern will not match. Does not consume characters./foo(?!bar)/ foobar foobaz
(?<=...)
Garantit que l'expression donnée correspondra, tout en finissant à la position actuelle dans l'expression. Celle-ci doit avoir une longueur fixe. Cela ne consomme aucun caractère./(?<=foo)bar/ foobar fuubar
(?<!...)
Garantit que l'expression donnée ne correspondra pas, tout en finissant à la position actuelle dans l'expression. Celle-ci doit avoir une longueur fixe. Cela ne consomme aucun caractère./(?<!not )foo/ not foo but foo
$1
This will return a string with the contents from the first capture group. The number, in this case 1, can be any number as long as it corresponds to a valid capture group
Des formules regex utiliser pour le travail sur des dictionnaires[modifier]
Pour travail avec AWB (sélection des pages, choix des remplacements) et Actiona (permettant d’automatiser la recherche et le remplacement).
- description :
expression de recherche//expression de remplacement//
- nettoie les chiffres romains se finissant par m suivi d’une virgule :
([clvix]{0,10})m,// $1iii,//
- nettoie les chiffres romains finissant par un ou h suivi d’une virgule en excluant les chaines pour le mot "vu,":
(?<!ons|est|sera) ([clvix]{0,10})[uhn], // $1ii,//
- encapsule les chiffres romains propres avec un espace avant, excluant des mots se finissant par une virgule:
(?!civil|vil|ici)([clvix]{1,10}),// {{rom|$1}},//
- encapsule RomMaj :
([CLVXI]{1,10}),// {{rom-maj|$1}},//
- retrait des césures cad un tiret suivi d’un espace finissant par un saut de ligne :
- \n//vide//
- un espace après une virgule :
(?<=[^0-9 {]) *,(?![\s &])(?!<br)//, //
- un A dans un mots par v :
([a-z])A([a-z])//$1v$2//
Remplace les i avant un chiffre par 1 dans une date :i(\d)//1$1//
- Remplace les i après un chiffre par 1 dans une date :
(\d)i//${1}1//
- Remplace les o dans une date par 0 :
(\d)o//${1}0//
- Supprime les caractères suivant:
[■•]//vide//
- Remplacement très fréquent :
celte//cette//
- conversion en apostrophes courbes des apostrophes droites :
([^'])'([^'])//$1’$2//
- DAC mise en italique des ref.:
(Eccli|ibid|Sap|Ad Eph|Mand|Sim|Mach|Dan|Strom|In Ps|P\. G|Epist|Esd|In Joa|In Agg|In Zach|In Jer|Apol|Concil|Dial\. adv\. Pelag|In Dan|P\. L|Cor|Ad Smyrn|Th|Tim|Thess|Jac|Am|Is|Jer|In Ez|Sam|Deut|Reg|Zach|Num|Jud|l\. c|Dict|Hab|Introd|sqq|Compend|Par|Mich|op\. cit|Matt|Ps|Lc|Mt|Mc|Io|Luc|Act|Heb|Ap|In Ioan|Hom|Mal|Jo|Serm|Ignat|Barn|Polyc|Gal|Denz|Vulg|Ib|Ep|homil|Quodlib|De\.princ|loc\.cit|Sent)\.//$1.
- Encapsule
{{nr ||}}
2 lignes NOINCLUDE (chiffre de quatre saut de ligne, caractère majuscule sur une ligne saut de ligne chiffre de quatre et insertion dans le noinclude :<\/noinclude>(\d{1,4})(\n\n)([A-ZÀ-ÖØ-Þ—\- ()Œ\.]{2,})(\n\n)(^\d{1,4})//{{nr|$1|$3|$5}}
- Encapsule
{{nr ||}}
2 lignes NOINCLUDE:<\/noinclude>(\d{1,4})(\n\n)([A-ZÀ-ÖØ-Þ—\- ()]{2,})(\n\n)([A-ZÀ-ÖØ-Þ—\- ()Œ\.]{2,})(\n\n)(^\d{1,4})//{{nr|$1|$3 — $5|$7}}
- Repérage du grec : û avec des caractère avant ou après et £ avec des caractère avant ou après, ajouter le repère
{{grec}}
- Encapsule DTC
{{sc|I. Titre}}
titre I. suivi du tiret saut de ligne :^(I|II|III|IV|V|VI|VII|VIII|IX|X)\. ([A-Za-zÀ-ÖØ-öø-ÿ\- ]+)(\. — )//$1. $2.\n\n
- Encapsule et section DTC TITRE gras et ## TITRE ## (versionBeta):
(\n\n|\n\n\d\. )([A-ZÀ-ÖØ-Þ]{4,}[A-ZÀ-ÖØ-Þ\-’ ()]{2,}[A-ZÀ-ÖØ-Þa-zà-öø-þ()\- ’]{0,})(?=(\.|,))//\n##$2##\n\n$1$2
- Mise en exposant : Sum. theol Ia IIae :
((I a II »)|(I a II\*)|(I » II »)|(1\*11\*)|(Ia II ae)|(Ia IIae)|(I a II\*)|(I 1 - II")|(I a II »)|(I a II »)|(I » II\*)|(I 1 H")|(I a -I I æ)|(I a -II æ)|(I&-II »)|(I a ll æ)|(F-II\*)|(I\* II »)|(I’II\*)|(I a\.II æ)|(I » ll’\^)|(I » II®)|(I a - II æ)|(l’II"’)|(I a II »|l’II")|(l" II*))//I{{e|a}}-II{{e|æ}}
- "e remplace c" (les clhqytxvr après n avant sont exclu) ex fonction, manuscrit, turcs, leclercq, hycsos ((?<=regarde si c'est entouré par):
(?<=[bdfghjklmpqtvwz])c(?=[b dfgjmnpswz])//e