Utilisateur:Мишоко/Pages validées à corriger

La bibliothèque libre.

Archives :

Ouverts :

Quelques idées pour améliorer la qualité des pages validées (1)[modifier]

1. ne pas valider quand on ne maîtrise pas la langue

Voir par exemple :

  • 8 mots espagnols, 1 fautif : RDDM.
  • 5 mots polonais, 3 fautifs : Korwin-Milewski
  • l'incontournable "bave been", etc.

Utiliser plutôt les "Catégorie:Mots manquants en" (via un modèle générique à créer ?), faire appel aux bonnes volontés sur les bistrots des Wikipedias correspondantes, etc.

2. vérifier ses diff

Voir par exemple :

  • ajout à tort d'accents sur les A majuscules dans une page précédemment validée : Hugo
  • idem, lors de la validation : Tinayre
3. faire des diff vérifiables...

...et surtout ne pas concaténer les lignes d'une page lors de la validation :

  • disparition du mot "récompense" lors de la validation : Bastiat
  • apparition des mots "ensuiteconnaissance" et "deprendre" lors de la validation Poincaré
4. vérifier la continuité avec la page précédente avant de valider une page

Par exemple :

5. utiliser le correcteur orthographique d'un traitement de texte

Par exemple :

  • texte validé en juin 2022 : "constitution assez fréle", "fils ainé"
  • texte validé en octobre 2022 : "en t’indiquanl", "la moindre satisfaclion"
6. prêter attention aux césures des mots composés
  • dans Les Merveilles de la science/Le Télégraphe électrique, on trouve 49 fois le mot "électro-aimant(s)" mais aussi 3 fois le mot "électroaimant(s)", chacune de ces 3 fois correspond à une page où le mot est coupé en fin de ligne, par exemple p.148
  • "long-temps" (graphie correcte) et "longtemps" (incorrect) se trouvent conjointement dans les pages validées de dizaines (centaines ?) d'ouvrages : Austen p.229 et Austen p.238 (avec une césure dans le deuxième cas)
  • inversement : dans le même ouvrage on trouve "quelquefois" (graphie correcte) et "quelque-fois" (incorrect, césure dans le facsimilé)

Voir aussi Utilisateur:Мишоко/Césures des mots composés 2107.

7. normaliser les noms propres

Par exemple sur Le Vagabond des étoiles/Texte entier, une liste triée des mots commençant par une majuscule avec leurs nombres d'occurrences contient entre autres :

000000001 Castlelon
000000003 Castleton
000000023 Cecil
000000001 Cécil
000000034 Chong-Mong-ju
000000001 Chong-Mong-Ju
000000001 Face-à-Tourte
000000006 Face-de-Tourte
000000006 Francisco
000000001 Françisco
000000001 Hasting
000000001 Hastings
000000006 Hendrick
000000019 Hendrik
000000001 Hendrîk
000000001 Ilalie
000000001 Keije
000000013 Keijo
000000004 Morrel
000000063 Morrell
000000001 Oppenheigner
000000061 Oppenheimer
000000002 Pyeng-yang
000000001 Pyen-Yang
000000001 Windwood
000000032 Winwood
8. vérifier les mots apparaissant une et une seule fois sur l'ensemble des pages validées

Par exemple :

Quelques idées pour améliorer la qualité des pages validées (2)[modifier]

9. comparer les textes Wikisource avec des versions des mêmes textes trouvées ailleurs sur le Net

De nombreux textes de Wikisource sont disponibles ailleurs sur le Net. On peut donc faire des comparaisons et analyser les différences pour déceler d'éventuelles erreurs. J'imagine qu'il existe de nombreux logiciels gratuits permettant de comparer deux textes similaires. Comme les différences entre deux éditions d'un même texte sont souvent liées à la ponctuation, je recommande lors d'une première passe de supprimer la ponctuation et de mettre tous les mots en minuscules.

Notes du chapitre XLIX de HDCER sans ponctuation ni majuscules (Wikisource /// autre version)

  • p.268 siége d’édesse en 640 assemani t i /// siége d’édesse en 540 assemani t i
  • p.288 conciles les deux épitres de grégoire ii /// conciles les deux epîtres de grégoire ii
  • p.307 muratori ann d’ital l vi p 232 /// muratori ann d’ital t vi p 232
  • p.322 de fribourg 1775 istorla d’italia t i /// de fribourg 1775 istoria d’italia t i
  • p.331 grec legat ad nicephorem in script rerum /// grec legat ad nicephorum in script rerum
  • p.331 quia ex uno capitula ab errore reversis /// quia ex uno capitulo ab errore reversis
  • p.331 errore perseverantiâ décernemus epist adriani papæ /// errore perseverantiâ decernemus epist adriani papæ
  • p.337 par muratori annali d’italla t vi p /// par muratori annali d’italia t vi p
  • p.335 meilleure foi unus et oculus paululum est /// meilleure foi unus ei oculus paululum est
  • p.344 par valois notitia gallarium relativement à l’italie /// par valois notitia galliarum relativement à l’italie
  • p.356 pas persuadé qu’il descendit de wilikind voyez le traité /// pas persuadé qu’il descendît de witikind voyez le traité
  • p.361 enim vos non imperatorum id est βασιλεα /// enim vos non imperatorem id est βασιλεα

Marx, Le Capital, chapitre 27 avec ponctuation et majuscules (Wikisource /// autre version)

  • p.-318 ecclésiastiques fut tacitement confisqué[9] « Pauper ubique /// ecclésiastiques fut tacitement confisqué[9]. « Pauper ubique
  • p.-320 ressortir la situation d’alors Dans un grand /// ressortir la situation d’alors. Dans un grand
  • p.-320 maint endroit, les centaines de demeures /// maint endroit, des centaines de demeures
10. ne pas faire de match&split sur une édition différente

Et peut-être faudrait-il, quand un texte a été créé par match&split, afficher un message en rouge à l'usage des correcteurs/validateurs :

Attention : ce texte a été créé par match&split.
L’absence de fautes d’orthographe et de grammaire
ne garantit pas la conformité avec le facsimilé.

Dix pages validées du fort mal nommé Emmeline (RDDM) (facsimilé RDDM /// texte Wikisource) :

  • p.305 défiait tout le monde, elle courait, grimpait /// défiait tout le monde ; elle courait, grimpait
  • p.305 sortait ainsi du parc que la rivière /// sortait ainsi du parc, que la rivière
  • p.305 grimpait sur les épaules, et jusqu’à quel /// grimpait sur les épaules ; et jusqu’à quel
  • p.305 âge ? C’est ce que je /// âge ? c’est ce que je
  • p.305 quel galimatias, et l’enfant de rire à /// quel galimatias, et l’envie de rire à
  • p.306 Elle voulait gravir les pics, ou descendre /// Elle voulait gravir des pics, ou descendre
  • p.306 pierres, arrachait la mousse ; entrée un jour dans /// pierres, arrachait la mousse. Entrée un jour dans
  • p.306 un châlet, elle n’en voulait /// un chalet, elle n’en voulait
  • p.306 l’enlever de force, et lorsqu’elle fut remontée /// l’enlever de force, et, lorsqu’elle fut remontée
  • p.306 encore paru en elle, lorsqu’elle entra dans /// encore paru en elle lorsqu’elle entra dans
  • p.306 ? Je ne sais ; d’autre part n’arrive-t-il pas souvent /// ? Je ne sais. D’autre part, n’arrive-t-il pas souvent
  • p.306 (car du vivant même de sa mère /// (car du vivant de sa mère
  • p.306 rôle, éclatait de rire, réponse décisive qu’on /// rôle, éclatait de rire ; réponse décisive qu’on
  • p.307 tout le soir, et, pour la première /// tout le soir, et pour la première
  • p.307 fois, on la trouva /// fois on la trouva
  • p.307 triste. M. de Marsan arrivait /// triste. Monsieur de Marsan arrivait
  • p.307 la terre fut vendue ; et on prétendit /// la terre fut vendue, et on prétendit
  • p.307 maison du faubourg Saint-Honoré la petite Duval /// maison du faubourg Saint-Honoré, la petite Duval
  • p.308 passaient les enfantillages journaliers ; c’était à l’hôtel /// passaient les enfantillages journaliers, c’était à l’hôtel
  • p.308 à marier, mais elle était très bonne /// à marier, mais était très bonne
  • p.308 ne savent pas que si la plupart /// ne savent pas que, si la plupart
  • p.308 lorsqu’elle est née avec et qu’elle n’a /// lorsqu’elle est née avec, et qu’elle n’a
  • p.308 la contrarier ; mais quant à la /// la contrarier ; mais, quant à la
  • p.308 jeune fille ; et comme une gaieté /// jeune fille ; et, comme une gaieté
  • p.308 elle que lui, et quand elle lui /// elle que lui, et, quand elle lui
  • p.308 on les vit très peu l’un et l’autre. /// on les vit très-peu l’un et l’autre.
  • p.308 ; il y a, dans cet endroit, deux ou trois /// ; il y a dans cet endroit deux ou trois
  • p.309 duquel est une faisanderie. Un parc immense entoure /// duquel est une faisanderie ; un parc immense entoure
  • p.309 bois de la Rochette. Vous connaissez ce /// bois de la Rochelle. Vous connaissez ce
  • p.309 ne vous semble niaise, si je vous /// ne vous semble niaise si je vous
  • p.309 comme un oiseau, et avant que vous /// comme un oiseau, et, avant que vous
  • p.309 n’eussiez le temps de /// eussiez le temps de
  • p.309 milieu des rochers ; c’était un vrai /// milieu des rochers : c’était un vrai
  • p.309 en lisant les oraisons funèbres de Bossuet, /// en lisant les Oraisons funèbres de Bossuet,
  • p.309 autre ouvrage aussi grave ; si là encore vous /// autre ouvrage aussi grave. Si là encore vous
  • p.310 point emmener sa femme, et la confia /// point emmener sa femme et la confia
  • p.310 de sa main, et dès que l’éventail /// de sa main, et, dès que l’éventail
  • p.310 dame en faisaient autant ; sa façon de voir /// dame en faisaient autant. Sa façon de voir
  • p.310 car avec son étourderie Mme de Marsan /// car avec son étourderie, Mme de Marsan
  • p.310 dire qu’elle l’aima beaucoup. La nièce y vint /// dire qu’elle l’aima beaucoup ; la nièce y vint
  • p.310 par complaisance ; ce fut là qu’à /// par complaisance. Ce fut là qu’à
  • p.310 de Marsan faisait sa cour à Mlle /// de Marsan faisait la cour à Mlle
  • p.310 avant le contrat, enfin, comment la passion /// avant le contrat, enfin comment la passion
  • p.311 doux à la comtesse, car quel homme /// doux à la comtesse ; car quel homme
  • p.311 desœuvré, à douze lieues /// désœuvré, à douze lieues
  • p.311 qu’en rentrant du bois, elle vit précisément /// qu’en rentrant du bois elle vit précisément
  • p.311 deux ou trois figurantes à cent écus /// deux ou trois figurantes, à cent écus
  • p.311 forçait de se plier ; dire par quels motifs /// forçait de se plier. Dire par quels motifs
  • p.311 lui plaisait moins, c’est malheureusement ou heureusement /// lui plaisait moins, c’était malheureusement ou heureusement
  • p.312 d’une autre nature. Qui suis-je donc, /// d’une autre nature. Qui suis-je donc,
  • p.312 pas un beau monsieur, pour me faire /// pas un beau monsieur pour me faire
  • p.312 ses yeux doux ? — M. de /// ses yeux doux ! — M. de
  • p.312 brusquement la porte, et s’approchant d’Emmeline sans /// brusquement la porte, et, s’approchant d’Emmeline sans
  • p.312 bonnes fortunes, comprit aussitôt, et se sauva. /// bonnes fortunes, comprit aussitôt et se sauva.
  • p.312 comtesse qu’une curiosité insatiable ; la marquise avait eu, /// comtesse qu’une curiosité insatiable. La marquise avait eu,
  • p.312 déjà très divertissante, et, avec sa nièce, /// déjà très divertissante, et avec sa nièce,
  • p.313 les confidences se multipliaient, en sorte que, /// les confidences se multipliaient ; en sorte que,
  • p.313 dame. Enfoncée dans son grand fauteuil, Emmeline /// dame. Enfoncée dans un grand fauteuil, Emmeline
  • p.313 ; elle vit que pour faire mouvoir /// ; elle vit que, pour faire mouvoir
  • p.313 innocemment des faiblesses d’autrui, elle a renoncé /// innocemment des faiblesses d’autrui elle a renoncé
  • p.313 la jeune mariée turbulente, et presque toujours /// la jeune mariée turbulente et presque toujours
  • p.313 eut pas de plaisirs sans elle. On /// eut pas de plaisir sans elle. On
  • p.314 de longues souffrances, et elle pensa /// de longues souffrances, ; et elle pensa
  • p.314 au retour ; mais de vive et /// au retour ; mais, de vive et
  • p.314 chez elle et enfermée, elle passait quelquefois /// chez elle et renfermée, elle passait quelquefois
  • p.314 une loge aux Italiens qu’elle fit tendre /// une loge aux Italiens, qu’elle fit tendre

Un exemple de page validée contenant plus de 10 "différences" avec son facsimilé :

Quelques idées pour améliorer la qualité des pages validées (3)[modifier]

11. pouvoir faire un diff sur le texte transclus

Comparer les versions d'un même texte transclus à 2 dates différentes permettrait de détecter d'éventuelles régressions : vandalismes, grosdoigtilles, impact des modifications des modèles, impact des modifications du logiciel, etc.

Exemple : Livre:Flaubert - Madame Bovary, Conard, 1910.djvu (27 avril 2021 /// 20 octobre 2022) on trouve entre autres :

  • p.XXV air « gendarme » écrit Mme Roger des Genettes /// air « gendarme » écrit Me Roger des Genettes
  • p.130 ce n’était pas vous demander trop…, /// ce n’était pas trop vous demander trop…,

(le premier point n'est pas conforme au facsimilé et est clairement incorrect, le deuxième est conforme au facsimilé mais me semble être une coquille)

Exemple : Livre:Sand - Consuelo - 1856 - tome 1.djvu (20 mai 2021 /// 22 octobre 2022) on trouve entre autres :

  • p.286 pour accomplir des /// s1 ## pour accomplir des
  • p.286 et le secourir. XXXII. Le comte /// et le secourir. s2 ## XXXII. Le comte

(je ne sais pas ce que cet utilisateur essayait de faire, mais a priori ça n'a pas marché)

Dans ce cas, c'est tout à fait correct : il s'agissait d'ajouter des sections pour séparer les différents chapitres. La syntaxe est correcte, la transclusion est bonne. --Acélan (d)
Notification Acélan : Non, je ne crois pas, d'ailleurs c'est vous qui avez corrigé ! On parle de cette version de la page. Il me semble que ça correspond à la situation dont je parlais sur le bistro dans ma deuxième remarque, à savoir ajout de sections alors que le gadget Easy LST est désactivé. Comme Page:Deulin - Contes d’un buveur de bière, 1868.djvu/321.
Puisque vous êtes là : j'ai remarqué récemment qu'il y a un paquet de / [tT]out a fait/ dans les pages validées (et autres), je pensais que ça pourrait vous intéresser. Мишоко (d) 3 mars 2023 à 11:23 (UTC)
Ah oui, en effet, j'ai mal regardé l'historique.
Tout a fait : c'est fait ; 51 pages, en effet ! (un seul faux positif ; les autres non corrigées sont des pages à l'orthographe ancienne) --Acélan (d)