« Aide:AutoWikiBrowser » : différence entre les versions
→Équation de recherche : Relecture |
|||
Ligne 87 : | Ligne 87 : | ||
* Quand on a plusieurs modifications impliquant des expressions régulières, on a intérêt à les sauvegarder : « Menu files > Save settings ». On peut les enregistrer sous différents noms, pour différents types de modifications. Les fichiers « settings » conservent la liste des modifications, ainsi que la dernière équation de recherche et la liste des pages non traitées. |
* Quand on a plusieurs modifications impliquant des expressions régulières, on a intérêt à les sauvegarder : « Menu files > Save settings ». On peut les enregistrer sous différents noms, pour différents types de modifications. Les fichiers « settings » conservent la liste des modifications, ainsi que la dernière équation de recherche et la liste des pages non traitées. |
||
<div style="clear:both" /> |
<div style="clear:both" /> |
||
* Pour éviter d’avoir à cliquer sur « skip » pour les pages ne comportant pas de corrections à effectuer, cocher « skip if no replacement » dans l'onglet « Options ». |
|||
==Précautions à prendre== |
==Précautions à prendre== |
||
Version du 2 mai 2021 à 09:11
Chasse aux scanilles avec AWB
Recherche d’une scanille dans l’ensemble des pages corrigées
Autres astuces et précisions bienvenues !
Équation de recherche
La première choses à faire est de constituer une équation de recherche dans l’espace « Page » qui se déclinera en :
- équation_de_recherche
incategory:
"page validée" - équation_de_recherche
incategory:
"page corrigée"
Utiliser d’abord l’équation dans le moteur de recherche afin de la tester et de l’affiner.
Exemple : « différons » mis à la place de « différens » dans des textes utilisant une orthographe ancienne.
"différons" -"nous différons" -"ne différons" -"différons nous" incategory:"page corrigée"
- Le signe moins devant un mot ou une expression (mise entre guillemets droits) indique au moteur d'AWB d’ignorer ces passages.
Recherche dans AWB
- Dans la colonne de gauche (« make list »), liste déroulante « Source » : Choisir « Wikisearch (text) (all NS) »
- Entrer une des deux équations
- Cliquer sur « make list » : on obtient la liste des pages potentiellement à corriger.
- Répéter l’opération pour l’équation suivante (sauf si on ne s’occupe que des pages validées)
- Dans le menu du haut, « lists », on peut choisir « keep alphabetized », pour regrouper les pages des mêmes ouvrages.
Entrer les corrections à effectuer
Dans la colonne centrale, onglet « Options », cocher « Find and replace », et cliquer sur « Normal settings » pour entrer les remplacements à effectuer.
Pour une coquille de ce type, on entrera par exemple les deux lignes suivantes dans le formulaire :
Find | Replace with | Case Sensitive | Regex | Multi line | Single Line | Minor | After fixes | Enabled | Comment |
---|---|---|---|---|---|---|---|---|---|
\bdifférons\b | différens | ||||||||
\bDifférons\b | Différens |
La colonne de gauche contient une expression régulière. Les caractères \b
autour de « différons » indiquent qu’on recherche uniquement un mot entier et pas une partie de mot. (Dans le cas cité, il n’est pas absolument nécessaire d’utiliser une expression régulière, mais cela peut être indispensable pour des mots plus courts. Dans tous les cas, on a intérêt à cocher « case sensitive ».)
Puis cliquer sur OK.
Lancer les corrections
Passer ensuite dans l’onglet « Start ».
- Vérifier le contenu du champ « Default Summary », qui sera inclus dans le résumé de modification (avec une description de la correction générée automatiquement). Le résumé par défaut est « clean up », mais on peut souhaiter mettre un texte plus approprié tel que « nettoyage » ou « scanilles ».
- Cliquer sur « Start ».
- On voit s’afficher le texte de la page dans la partie supérieure de l’interface, avec en surbrillance la modification prévue par AWB.
- Si cela correspond à ce que l’on souhaite, on clique sur « Save » (ou Ctrl-S) ; dans la fenêtre en bas à droite, on peut également effectuer d’autres modifications directement dans le code wiki, si l’on repère d'autres erreurs.
- Si on a un doute, clic droit dans la liste à gauche pour ouvrir la page dans le navigateur, pour afficher le fac-similé.
- S’il s’agit d’un faux positif, on clique sur « Skip » pour ne pas modifier la page.
Recherche de scanilles dans un ouvrage
Le mode d’emploi est le même ; ce qui diffère :
- L’interrogation : Dans la colonne en base à gauche, source : « Transclusions on page » ; on entre le nom de l’ouvrage (exemple : Livre:Revue des Deux Mondes - 1915 - tome 28.djvu) puis sur « make list ». On clique sur « filter » pour ne conserver que les pages et non les textes transclus)
- La liste des modifications sera généralement plus importante, mais on peut ajouter autant de lignes que l’on veut, semble-t-il. En sélectionnant une ligne, on peut la déplacer ou la supprimer. On peut aussi la conserver et la désactiver temporairement en décochant « enabled ».
- Quand on a plusieurs modifications impliquant des expressions régulières, on a intérêt à les sauvegarder : « Menu files > Save settings ». On peut les enregistrer sous différents noms, pour différents types de modifications. Les fichiers « settings » conservent la liste des modifications, ainsi que la dernière équation de recherche et la liste des pages non traitées.
- Pour éviter d’avoir à cliquer sur « skip » pour les pages ne comportant pas de corrections à effectuer, cocher « skip if no replacement » dans l'onglet « Options ».
Précautions à prendre
- Tester d’abord l’interrogation dans le moteur de recherche
- Consulter le texte affiché, page par page : il y a toujours des faux positifs
- En cas de doute, même très léger, consulter le fac-similé de la page
- Attention en particulier aux textes anciens et aux retranscriptions de textes manuscrits, qui peuvent conserver une orthographe considérée comme fautive (exemple : sur cette page, « il y à » est une particularité orthographique du manuscrit qui a été conservée, alors que presque partout ailleurs, ce serait une scanille)
- Tester les expressions régulières dans l’outil dédié d’AWB : Menu « Tools → Regex tester »