Bonjour. Il y a des centaines de </ref> immédiatement suivis d'un caractère alphabétique comme par exemple sur Page:Boisacq - Dictionnaire etymologique grec - 1916.djvu/12. Je ne vois pas trop comment ça peut être correct, sauf si le </ref> clôt un <ref follow> ? Мишоко (d) 16 octobre 2023 à 07:05 (UTC)
Sujet sur Discussion utilisateur:Acélan/Structured Discussions Archive 1
Apparence
Je vais me pencher sur la question. À mon avis, pour les textes à partir du XIXe siècle, c'est à peu près nécessairement une erreur. Pour les textes plus anciens, c'est sans doute plus compliqué, vu les pratiques typographiques un peu erratiques.
Et au passage, merci pour tes recensements d'erreurs, qui permettent des corrections nombreuses.
@Мишоко Effectivement, à part les ref follow et quelques cas particuliers (Page:Dufour - Le Testament de Jean-Jacques Rousseau, 1907.djvu/19, par exemple), cela permet de déceler pas mal d'erreur.
Bonjour. J'obtiens des centaines de résultats (plus de 500 sur les pages validées) avec peu de faux positifs mais apparemment beaucoup de coquilles (erreurs dans le facsimilé) avec :
/ (afin|pour|quoi|sans|avant|fallait|faudrait|fallu|fallut|voul[^ ]*|voudr[^ ]*) qu’(il|elle|on) [^ ]*[aiu]t[ ,\.…]/
mais il faut exclure, et je ne sais pas si cela vous sera facile :
/qu’(il|elle|on) (ait|soit|[lmnt]’ait)/
Il s'agit de détecter l'absence à tort d'accent circonflexe sur le subjonctif imparfait comme par exemple :
Page:Œuvres complètes de Frédéric Bastiat, Guillaumin, 4.djvu/543 /// Il le faudrait pour qu’elle méritat d’être assimilée à Page:Revue des Deux Mondes - 1837 - tome 9.djvu/740 /// fond de l’entrée, avant qu’elle l’aperçut. Elle s’élança à Page:Revue des Deux Mondes - 1841 - tome 28.djvu/145 /// à sa mère, avant qu’il naquit, les grandeurs de
NB : [^ ]* n'est pas idéal, mais je ne vous apprends rien
Je n'ai pas recherché tous les verbes qui sont suivis de que + subjonctif, il y en a d'autres, par exemple :
Page:Driant,_Histoire_d’une_famille_de_soldats_1,_1901.djvu/170 /// Bernadieu avait même exigé qu’il apprit l’allemand. L’enfant continua Page:Yonge - L'héritier de Redclyffe, Vol 2, 1855.djvu/149 /// si bouleversée, qu’il craignit qu’elle n’eut reçu de plus
Il doit aussi y avoir de nombreuses locutions telles que :
Page:Revue des Deux Mondes - 1829 - tome 1.djvu/283 /// à son cou jusqu’à ce qu’il fut vengé, l’amour avait
On peut insérer ne :
Page:Tolstoï_-_Souvenirs.djvu/216 /// entêtement, en partie pour qu’on ne put pas l’accuser d’inconstance.
etc.
@Мишоко Merci pour la suggestion. J'ai intégré ça à AWB, avec le "ne" facultatif, et pour le moment, uniquement les verbes indiqués (j'ajouterai les autres ultérieurement). Pour ne pas avoir à vérifier à tous les coups (ça enlèverait tout l'intérêt du traitement avec AWB), j'ai fait le choix de tout traiter comme des coquilles ; par expérience de la correction sur Wikisource, je sais que c'est une coquille extrêmement courante, de toute façon.
Par contre, pour le moment, je ne vois pas comment exclure "ait" et "soit", donc je commence par les -at et les -ut.
J'ai trouvé comment traiter les -it, c'est bon. Il faut aussi que j'ajoute "vint", "parvint", etc.
Reste le problème de l'interrogation, vu que je ne travaille pas sur un dump. Mais j'en ai déjà traité pas mal.