Aller au contenu

Sujet sur Discussion utilisateur:Acélan/Structured Discussions Archive 1

Cunegonde1 (discussioncontributions)

Bonjour Acélan, j'ai vu que tu avais corrigé un certain nombre de scanilles a/à sur des ouvrages que j'ai corrigé, y compris récemment. Cela m'interpelle sur la regex que j'utilise pour détecter ces fautes en amont de l'import du livre (je corrige hors ligne).

Pour le a fautif : \ba (celle|cette|ne|[mts]on|[nv]os|leurs?|part|([a-zà-ÿ]+er))

et je me rends compte que je ne retrouve plus le passage pour la détection du à fautif dans ma regex globale que tu peux trouver sur une de mes pages personnelles. Peux-tu si cela ne t'ennuie pas m'indiquer quelle regex tu utilises pour cette faute ? cela me permettra d'éviter d'en ajouter de nouvelles au fur et à mesure de mes imports. Merci par avance et merci du travail formidable que tu fais avec AWB.

Acélan (discussioncontributions)

Bonjour,

Récemment, ma dernière sauvegarde de mes Regex AWB a crashé ; j'en ai récupéré une légèrement plus ancienne, mais j'ai dû refaire quelques expressions, de façon non exhaustive.

Je commence tout juste, en fait, à traiter les "à" fautifs, donc je n'ai rien de systématique. Je vais continuer sur ma lancée, et je te donnerai la regex complétée, mais pour le moment, j'ai juste ça à te proposer (c'est bien maigre, même si le rendement est bon).

\bà(?=\s+(été|donné|pris)\b)

Mon problème, pour traiter ces erreurs, c'est, comme je l'ai indiqué sur le scriptorium, qu'il s'agit assez souvent de coquilles et non de scanilles, c'est donc assez délicat à traiter avec AWB, je pense que c'est pour cela que je n'ai pas davantage travaillé sur la question ; suivant les sources et les correcteurs, je dois assez souvent vérifier le FS (quand je n'oublie pas) : certains correcteurs font beaucoup d'erreurs, et certains textes comportent peu de fautes, donc je pars du principe que ce sont des scanilles ; certains textes sont truffés de coquilles, donc c'est plus délicat à traiter.

Je comptais justement t'envoyer un message à ce propos : j'ai trouvé dans des pages que tu as corrigées, des occurrences de "à été" qui sont des coquilles. Comme je sais que tu ne corriges pas forcément les coquilles dans ces textes à l'orthographe peu rigoureuse (ce que je comprends très bien), je te laisse décider ce que tu fais pour ces pages ("à été" "cunegonde1" incategory:"page corrigée") : modèle sic2 ou corr, ou rien du tout.

Amicalement,

Cunegonde1 (discussioncontributions)

Merci pour ton ébauche. Je vais la tester sur les textes en cours de correction et te ferai un retour, si j'arrive à l'améliorer.

Pour ta question, ça dépend du soin apporté par l'éditeur, certaines éditions sont faite avec les pieds par des correcteurs dyslexiques, cf. ici. De plus, je n'ai pas une rigueur absolue avec le temps. J'ai de plus en plus tendance à respecter le texte d'origine dans les éditions d'avant ~ 1830 et de corriger davantage après.

Ce qui m'inquiète, c'est que même avec une lecture attentive, je laisse passer ce type de scanille (le pire étant quand je commence à me laisser prendre par la lecture), c'est pourquoi je fais davantage confiance aux regex, qui attirent mon attention sur le problème. Pour répondre à ta question sur les "à été"  : dans mes choix éditoriaux, j'indique corriger les à/a et les ou/où, si ce n'est pas ou bien marqué avec sic2 ou bien corrigé avec corr, c'est que je suis passé à côté. Malgré le soin que je prends cela me désespère de voir que je laisse du travail au valideur derrière moi.

Acélan (discussioncontributions)

Ça motive les valideurs, de trouver quelques éléments à corriger ; c'est désespérant de passer derrière quelqu'un comme *j*jac, parce qu'on a l'impression de ne servir qu'à changer la couleur des pages ; et c'est le seul, à ma connaissance, qui ne laisse (presque) rien passer. Pour ne parler que des contributeurs qui travaillent soigneusement et qui ont un peu de bouteille, tout le monde laisse passer des erreurs, je le vois bien avec AWB puisque le nom de l'utilisateur qui a corrigé ou validé la page apparaît ; et franchement, tu n'en laisses pas beaucoup, par rapport au nombre de pages que tu corriges Clin d'œil

Acélan (discussioncontributions)

@Cunegonde1 Je n'ai pas avancé sur la regex en question, parce que les a/à c'est bien long, pour les raisons indiquées ci-dessus ; mais si tu souhaites des regex sur des modifs en cours, n'hésite pas à me les demander.

Cunegonde1 (discussioncontributions)

Merci @Acélan, je rajoute au fur et à mesure les scanilles que je ne connaissais pas et qui apparaissent dans ma liste de suivi : "je tous" et "foutes" (encore que dans ce dernier cas je peux avoir pas mal de faux positif dans la littérature que je corrige habituellement).

Acélan (discussioncontributions)

@Cunegonde1 J'ai un peu enrichi ma regex sur les à fautifs :

\bà(?=\s+(été|[a-zàâéèêôîç]{3,15}é|dû|[belpsv]u|(com|ap)?pris|encore|voulu)\b)(?!\s+(côté|maturité|moitié|perpétuité|proximité|satiété|volonté)\b)

(c'est encore bien sûr tout à fait améliorable)

Cunegonde1 (discussioncontributions)

Merci, @Acélan, je vais la tester sur les livres que je compte importer.

Répondre à « Scanille a/à et à/a »