Wikisource:Noter la qualité

La bibliothèque libre.

Idées et projets
    Légende des icônes : état d'avancement des projets et des portails
   Image:00%.png   En projet     Image:25%.png   Commencé     Image:50%.png   En cours     Image:75%.png   Avancé     Image:100%.png   Terminé  







Projet n° 8 -- Noter la qualité

Sommaire

[modifier] Proposition de départ

Source : Revision as of 19:13, 11 September 2005 by Zhaladshar (Talk | contribs)


Début de la traduction :
On peut utiliser les icônes ci-dessous pour marquer l'état d'avancement de n'importe quel texte. On peut les trouver sur des pages-auteur, des listes, des sommaires, toute page où l'information peut s'avérer utile, y compris les pages de discussion.

  • Image:25%.png (Image:25%.png): Aucune portion du texte n'est garantie fiable, ni relue, ni correctement formatée.
    Le texte peut ne pas être complet.
  • Image:50%.png (Image:50%.png): Le texte est apparemment complet et en grande partie formaté, mais peut encore recéler des erreurs de contenu et de formatage. À utiliser dans les cas suivants :
    • Texte océérisé par un contributeur, mais non relu.
    • Texte importé d'une source connue pour ne pas être tout à fait fiable.
  • Image:75%.png (Image:75%.png): Texte raisonnablement sûr, correctement formaté, accompagné de toutes indications sur la source. À utiliser dans les cas suivants :
    • Texte relu et corrigé par un contributeur qui l'a confronté à une édition de référence.
    • Texte importé d'une source fiable (par exemple Gutenberg ou Gallica), formatage et OCR ayant été vérifiés par [au moins] [1]deux contributeurs.
  • Image:100%.png (Image:100%.png): Texte relu et corrigé par plusieurs contributeurs, chacun disposant d'une édition de référence. Texte très fiable. Protection contre le vandalisme.

L'utilisation de ces icônes permet au lecteur de suivre la progression de la qualité du texte, et au contributeur de repérer quels textes nécessitent des améliorations, grâce au lien « Pages liées » de la boîte à outils [du menu de gauche] dans la page de l'icône.
Fin de la traduction.



Résumé


Icones : À rechercher Image:00%.png | À compléter Image:25%.png | À formater Image:50%.png | À relire Image:75%.png | À valider Image:100%.png | Mettre dans la bibliothèque Texte validé|


    * inexistant (0%) Article manquant
    * incomplet (25%) Texte incomplet
    * contenu complet mais non corrigé (50%) Non formaté
    * complet et corrigé (75%) Complet et formaté ; corrigé signifierait alors : formaté et les erreurs d'OCR ont été corrigées.
    * relu par un deuxième contributeur, ou précédemment par un site fiable (100%) Relu et corrigé
    * validé par au moins deux contributeurs (étoile) Texte validé


Qualité et communication


[modifier] Noter la qualité : discussion du 20-5-06

Bonjour, Wikisource a maintenant plusieurs milliers de livres (pas trop mal vu le nombre de personnes actives, mais une infime partie de ce qu'on pourrait publier). Je pense qu'il est important de se consacrer aussi à la qualité, en notant la source des textes, et s'ils ont été vérifiés ou pas. Je pense qu'on peut noter comme étant vérifiés les textes venant de Gutenberg ou de Ebooksgratuits, car ces groupes vérifient leurs textes avant leur publication. J'ai l'impression que cette information n'est pas toujours donnée, aussi nous perdons une information précieuse si nous transférons un texte ici sans noter la source et s'il a été vérifié. Qu'en pensez-vous ? Yann 19 mai 2006 à 21:07 (UTC)

Tout à fait d'accord. Si Wikisource peut viser une excellente qualité, ce serait vraiment dommage de ne pas le faire ; sans compter que les Wikipédiens nous regarderaient de haut, nous renieraient peut-être ! --Zephyrus 19 mai 2006 à 21:51 (UTC)
Oui, il est important de noter la source. Et effectivement, pour les sites où une vérification a été effectuée, on peut considérer que le texte est de bonne qualité. Il est cependant important dans ce cas de vérifier la typographie, notamment sur les spécificités françaises (accent sur les majuscules, apostrophes et guillemets français, tirets de dialogue en cadratin) et de vérifier également la bonne transposition de la présentation (paragraphage, italique, gras, ...). Aussi, je conseillerai d'ajouter en remarque dans la page discussion des textes si les points ci-dessus ont été fait ou pas. Dans le premier cas, il est possible de mettre 100%, dans le second cas, ou si une partie seulement des vérifications a été faite, de ne pas dépasser les 75%.
Pour les textes provenant d'autres sources, je pense qu'il n'est pas possible de mettre 100% tant que cela n'a pas été vérifié par rapport à une édition de référence, par exemple un PDF Gallica. François 20 mai 2006 à 06:48 (UTC)
La page Wikisource:Qualité des textes indique que l'icone 100% correspond à un texte « relu par plusieurs contributeurs ». Mais est-ce bien réaliste ? Yann 20 mai 2006 à 15:58 (UTC)
Il y a contradiction entre les textes dans la boite de présentation, et les explications dans la page Wikisource:Qualité des textes. Personnellement, je souhaiterais garder
Image:25%.png Texte incomplet
Image:50%.png Non formaté
Image:75%.png Complet et formaté
Image:100%.png Relu et corrigé (qui est au singulier)
sachant qu'une validation multiple (qui n'a pas encore été réalisée) serait repérée par un icone spécifique, et la page serait en semi-protégée (ou protégée). Voir aussi Wikisource:Validation des textes. En effet, je pense que l'icone de validation ne devrait pas pouvoir être ajouté par un inconnu, car on risque alors d'avoir du vandalisme qui décrédibiliserait cet icone. François 20 mai 2006 à 19:18 (UTC)
Ça me semble mieux en effet. Il faudrait changer tous les 75% en 100% avec un bot. Yann 21 mai 2006 à 10:16 (UTC)
Euh ! moi j'ai déjà mis des 75% selon ce critère. Peut-être que d'autres ont fait la même chose. Le bot ne pourrait-il pas plutôt lister ceux qui sont en 75%, et que l'on fasse une passe "manuelle" pour vérifier (je veux bien faire ce travail manuel). En effet, je ne mets 100% que si la typo a également été vérifiée (en plus du texte). François 21 mai 2006 à 10:30 (UTC)
Ah ok. En fait, il faudrait en profiter pour changer le modèle Textquality pour inclure une catégorie suivant l'état du document. Le problème est qu'il y a aussi pas mal de textes avec une typographie correcte, mais non vérifié par rapport à une édition originale. Yann 21 mai 2006 à 10:44 (UTC)

[modifier] Avancement : Discussion du 27-1-07

…jusqu'à présent les ouvrages issus de e-book obtenaient 75% car ils sont complets ... tu a passé Ivanhoé à 50%, pourquoi ? il y a de nombreux livres issus de e-book qui non seulement non pas les italiques mais en plus n'ont pas les notes correctement reprises ... est ce ton objectif de tous les faire passer à 50.

Sapcal22 4 janvier 2007 à 12:23 (UTC)

C'est en discussion actuellement (voir projet 8) et les solutions s'élaborent petit à petit, nous n'en sommes pas encore aux réponses définitives à ce sujet. On peut en effet trouver qu'il vaut mieux considérer qu'avec les sites qui relisent leurs documents, comme EBG, les 3/4 du travail sont réalisés (75%), ou que tant qu'il manque les enrichissements du texte (pour moi ce serait plutôt l'emploi incohérent des tirets qui me gêne dans Ivanhoé), la qualification de Non formaté (50%) est plus exacte. (Les notes, je les considèrerais à part, dans la mesure du moins où elles ne font pas directement partie de l'œuvre.) Pour l'instant, je recopie cette discussion sur le scriptorium ; ensuite sur la feuille de projet n° 8 ; et enfin dans l'aide quand nous saurons sur quoi nous nous serons mis d'accord… Par ailleurs, nous avons commencé à créer des catégories de maintenance comme Maintenance --> Orthographe à corriger --> E ou É ; Apostrophe à rectifier ; Majuscules manquantes ; et enfin, nos dresseurs de robots réussiront peut-être à prendre en charge une partie des améliorations utiles. En attendant, ou bien on en reste à 50%, ou bien (la solution que je préfèrerais quant à moi) on met 75% pour les EBG mais on ajoute les catégories de maintenance : manque italiques, tirets à reprendre etc. Qu'en pensez-vous ?--Zephyrus 4 janvier 2007 à 13:48 (UTC)
Pour moi, en plus de l'utilisation incohérente des tirets, c'est l'absence des italiques ou gras qui me gêne le plus, car ces caractères peuvent exprimer une volonté particulière de l'auteur. Le fait qu'il y ait absence de ces caractéristiques devrait, à mon avis, bloquer le niveau de qualité à 50%. Pour le reste, je suis aussi d'accord avec Zephyrus, à savoir qu'une typo encore imparfaite ne devrait pas empêcher un 75% pour des oeuvres provenant de ELG, à condition que la catégorisation proposée par Zephyrus ait été effectuée. Le 100% peut-être mis dès que le contributeur principal a relu le texte ET que le reste est complètement terminé (typo, sourçage, ...) François 4 janvier 2007 à 16:33 (UTC)

Je tombe par hasard sur cette discussion.Je m'étonne toujours, sauf quelques rares cas, que personne ne nous signale s'il y a un problème sur un texte, surtout au vu du nombre de textes présents sur Wikisource qui proviennent de notre site... Pour «Ivanhoé», je signale qu'il a été repris par un membre qui a fait la relecture seul, à partir de la BEQ (http://jydupuis.apinc.org/index.htm). Donc, pas de scan... et de possibles incertitudes, même si j'avais fait des contrôles par rapport au travail de ce membre. Avez-vous un scan? (il n'y a rien sur Gallica) et puis-je y avoir accès? Quels sont les problèmes rencontrés pour les tirets et les italiques? est-il possible d'avoir des exemples? Par contre, j'ai beaucoup de mal à comprendre comment le "gras", qui est un truc typographique de certains éditeurs, banni par la grande majorité des éditeurs sérieux, et évidemment absent du manuscrit de l'auteur... peut poser un problème quelconque.

Autre chose. Même si nous scannions très peu à nos débuts (surtout quand nous étions 2...), la situation a changé peu à peu, et maintenant nous scannons pas mal (je parle donc de livres absents de Gallica). Je dois avoir 4 DVD de sauvegardes d'images, ce qui en fait un certain nombre. Or, personne de Wikisource (sauf une personne) ne m'a demandé s'il était possible d'avoir ces scans. Comment faites-vous la relecture dans ces conditions? Je ne dis pas que je vais m'amuser à uploader tous ces Go sur vos serveurs. Mais, si on me demande le scan d'un livre, que je l'ai, et qu'on me donne une adresse pour l'upload, je le fais...

Cordialement --Coolmicro 27 janvier 2007 à 04:11 (UTC)

Coolmicro, voilà une offre des plus précieuses et dont nous ne saurions assez te remercier. Pourrais-tu nous donner la liste de ces scans ?
Quant à la typographie, ce n'est pas en soi un problème ; mais depuis que Wikisource nous a donné l'habitude du luxe, distribuer correctement " " et «  » mais aussi et si ce n'est et - ou -, ce luxe, il nous est devenu difficile de nous en passer… (Le comble étant que je continue à ne distinguer que malaisément les ' des , mes correcteurs peuvent assez me le reprocher !) --Zephyrus 27 janvier 2007 à 08:40 (UTC)
P.S. Roland furieux est maintenant à 75 %, servez-vous.
Coolmicro,
Je me suis mal exprimé, et je parlais en plus d'un point de vue général, et non vis à vis d'Ivanhoé uniquement : le problème des italiques ou gras (je parle du gras car c'est une manip particulière à faire sur l'éditeur médiawiki, je sais qu'il y en a très peu voire pas du tout) ne vient pas de ELG, mais du transfert de ELG vers wikisource, puisque ce dernier gère les italiques (et gras) différemment. Lors du transfert, les italiques sont perdus - sauf à utiliser des macros préalablement, ce qui n'est pas toujours le cas - et il faut que le contributeur qui effectue le transfert refasse une passe par rapport à la version ELG (ou un scan de Gallica) par exemple) pour remettre ces italiques.
Pour les tirets, il m'est arrivé (sans doute une mauvaise manip de ma part) de récupérer des tirets de césure de mot en récupérant des textes en provenant d'une version Word (pour les Misérables). Si cela m'est arrivé, cela peut aussi arriver à d'autres. Donc, il est nécessaire d'effectuer une vérification là aussi ...
Enfin, toujours concernant les tirets de dialogue, nous préférons les tirets cadratins aux tirets demi-cadratins ; il est possible - mais je n'ai pas vérifié - qu'ELG utilise plutôt le demi-cadratin et qu'il faille alors faire éventuellement un changement.
En aucun cas donc je ne critiquais le travail réalisé par ELG, qui est quasiment toujours d'une très grande qualité. En clair, il s'agit de vérifier si rien n'a été perdu au transfert, en non si ce qui est sur ELG est correct ou non.
Bien cordialement. François 27 janvier 2007 à 13:24 (UTC)

Merci pour ces explications. En qui concerne la qualité de nos textes, il faut toujours regarder la date de publication à la fin du livre. Au début, j'étais seul, puis nous étions 2 ou 3, et nous ne connaissions pas bien le travail. Donc, les textes de 2003 et 2004, par exemple, sont très loin d'être parfaits... Ensuite, nous avons mis en place des protocoles de contrôle de plus en plus poussés, et la qualité s'est nettement améliorée, jusqu'à donner, à l'heure actuelle, des textes acceptables (je suis assez sévère en tant que lecteur...). A partir de 2005, c'est nettement mieux.

Pour la liste des scans, cela serait pas mal de boulot de la dresser, car il y en a sur les DVD, d'autres en possession de membres, etc. Par ailleurs, il y a des cas où je n'ai pas de scan, mais où un de nos membres possède l'édition papier (notamment pour des saisies clavier antérieures à 2006) et peut aider votre relecteur en cas de doute. De plus, cette liste n'aurait pas trop de sens, sans mise à jour régulière, ce qui serait un travail supplémentaire. Il serait plus simple que les personnes de Wikisource qui reprennent nos textes me contactent - contact@ebooksgratuits.com. Ainsi, non seulement je pourrai leur dire s'il y a un scan, mais leur donner des indications sur l'origine du texte, sur ce qu'il faut plus particulièrement regarder, etc (je connais «l'histoire» de tous nos textes, puisque j'interviens sur chacun, au minimum à l'une des phases de travail); pour prendre un exemple, le fait de savoir que «Ivanhoé» vient de la BEQ, et connaissant la maniaquerie de JYD pour l'italique, j'aurai conseillé de prendre le PDF de la BEQ pour vérifier les italiques, en l'absence de version papier ou de scan. Il y a même une trentaine de livres pour lesquels j'ai des corrections à faire, communiquées par PGDP ou des lecteurs, mais que je n'ai pas encore eu le temps de publier. Par ailleurs, il faudra me dire où je mets le scan quand je peux le fournir.

Pour les tirets, nous n'utilisons effectivement que le demi-cadratin (cela provient du fait que je n'aime pas trop le cadratin, visuellement, sur les petits écrans de PDA), les deux solutions étant acceptable sur le plan de l'orthodoxie typographique.

Enfin, j'en profite pour signaler que je scanne pas mal de textes actuellement, au rythme d'un ou deux livres par semaine. Ainsi j'ai une dizaine de textes en attente d'un correcteur de phase 1 chez nous, et ce stock risque d'augmenter (Hope, Le Rouge, Leblanc, Orczy, Leroux, Rosny aîné, Zévaco, par exemple). Si certains d'entre vous avez envie de travailler sur un ces textes pour une parution commune ELG - Wikisource (je l'ai déjà fait avec DPEU-PGDP), cela serait possible.

Cordialement --Coolmicro 27 janvier 2007 à 19:07 (UTC)

Merci pour ces précisions sur la qualité des documents en provenance de ELG.
Une collaboration entre Wikisource et ELG est non seulement possible, mais je dirais souhaitable, notamment sur l'étape de relecture par rapport à ce que nous appelons "l'édition de référence" (édition papier accessible au format image de préférence).
Nous pouvons ainsi offrir à ELG les textes de Roland furieux (que notre très sérieux contributeur Zephyrus a mis en ligne à partir du scan Gallica) et bientôt de La Case de l’oncle Tom (quand j'arriverai à avoir du temps pour le terminer), qui sont donc deux scans wikisource de bonne qualité tant au niveau typographique qu'au niveau de la relecture par rapport au document d'origine. Si vous souhaitez sortir des textes littéraires, il y aura le Dictionnaire raisonné de l’architecture française du XIe au XVIe siècle, actuellement en cours de finition.
Inversement, nous pouvons travailler sur la mise en ligne de scans réalisés par des membres de ELG, ce qui peut éviter un travail en double de la part des deux équipes. François 27 janvier 2007 à 19:54 (UTC)
Pour Roland Furieux, il est déjà noté comme "à faire" dans mon (très long) fichier personnel des tâches à faire pour ELG, ainsi que dans notre base de données. Ce ne sera pas tout de suite car je donne toujours la priorité aux textes inédits, pour des raisons évidentes: quand je reprendrai ce texte, ce sera essentiellement pour le fournir à nos formats, «en un seul tenant téléchargeable», même si nous ferons également une relecture et que nous reporterons la correction des erreurs éventuellement trouvées sur le wiki. L'essentiel est qu'il soit déjà disponible sur le Web.
Pour ce qui est de l'avoir en un seul tenant, je viens de créer la page (clique sur le lien vert juste au-dessous de l'image de la première page) ; quant à la relecture que tu proposes, elle nous sera bien utile et on vous en remercie d'avance ! --Zephyrus 28 janvier 2007 à 20:49 (UTC)
Si des membres de Wikisource sont intéressés par les auteurs que j'ai cités ci-dessus, les scans sont déjà disponibles, il suffit de m'écrire à contact@ebooksgratuits.com. Parmi ces auteurs, je signale que nous allons notamment publier de nombreux livres de Michel Zevaco (l'objectif étant d'avoir publié la grande majorité de son oeuvre fin 2008), comme nous l'avons déjà fait pour Leroux ou Leblanc.

[modifier] Proposition : les sept (ou huit ou neuf ou plus) wagons

Chemin de fer : liste des actions à exercer depuis la « naissance » du document jusqu'à sa « parution dans le monde ».


Tout texte nouvellement apparu sur WS parcourrait un «train» composé de wagons successifs, et son voyage imaginaire nous servirait d'aide-mémoire. Ce voyage imaginaire laisserait des traces bien réelles dans l'historique et celui-ci nous renseignerait avec précision sur les étapes franchies et le travail restant à fournir.


Comprendre mieux et plus vite, c'est plus facile avec les métaphores : quitte à chagriner ceux qui nagent dans les abstractions avec bonheur comme un poisson dans l'eau, je persisterai à appeler cette proposition : les sept wagons.

Rassurez-vous, on n'introduira pas les fruits du pommier, les moutons de Panurge, les crabes du panier pour faire de l'image une nouvelle source d'obscurités ... (Ce projet aura d'ailleurs plus de sept wagons, mais gardons-lui son nom).


I. Arrivée des enfants

Donc, représentez-vous un hall de gare. Vous et moi, nous allons être les parrains des enfants qui arrivent de toutes parts. Nous les attendons dans un kiosque marqué : Accueil Wikisource. Ces enfants qui nous arrivent de toutes parts, ce sont les textes que nous allons prendre en charge pour leur permettre de continuer leur voyage. Beaucoup d'entre eux sont menacés et courent de graves dangers. Ils ont besoin de nous. Leur histoire jusqu'à leur arrivée chez nous devrait figurer dans Wikipédia.

Dès leur arrivée, nous serons obligés -- malheureusement -- d'écarter un certain nombre d'entre eux. (Le wagon marqué jj, wagon des juristes mais pas seulement des juristes, fait le tri). Page correspondante : catégorie:w_jj. Sur la page affectée à cette catégorie, on pourra trouver des listes : textes publiables sur WS, textes non publiables sur WS. Intervenir sur la page de discussion de cette page. Marquer en catégorie w_jj les textes qui relèvent de ce wagon.

Ensuite, le processus du parrainage commence. Librement, quand on le veut, on choisit de parrainer un ou plusieurs de ces enfants : on prend la responsablité d'organiser son voyage de wagons en wagons, de surveiller comment il se déroule. Plus il y a de parrains pour chaque texte, mieux c'est. Un seul parrain, ou des parrains tous d'accord entre eux, cela m'inquiète. On s'occupe de l'enfant jusqu'à ce qu'on puisse l'autoriser à poursuivre son voyage sans nous -- mais avec notre label, qui aura de la valeur. (Ce sera la validation). Nous aurons veillé à la ressortie d'un texte nu (sans publicité ni commentaire ni déformation d'aucune sorte), entier, exact, lisible.

Une traduction éventuelle de ces parrainages pourrait être, dans nos outils, nos Listes de suivi.


II. Comment prendre nos textes en charge ?

Certains sont déjà en mode texte, déjà prêts pour le prochain wagon.
D'autres ont été numérisés et attendent d'être OCRisés (prononcer : o-cé-hé-ri-zé)
D'autres, sur papier, doivent être numérisés puis OCRisés.

Voilà qui relève du wagon des Numérisateurs. Catégorie : w_nn, textes en cours de numérisation.


III. Comment passer d'un texte illisible à un texte lisible ?

Il faut d'abord qu'il passe par le wagon Orthographe. Où on s'efforcera de comprendre le texte AVANT d'en corriger l'orthographe  :-)

Ensuite ? Voici la série des wagons, dans un ordre approximatif et discutable :

numérisation questions légales orthographe informaticiens
relecture timoniers - navigation dans le texte mise en page wagon des aiguilleurs

--Zephyrus 23 août 2006 à 16:48 (UTC)


  1. Wagon nn = wagon des numériseurs et des recenseurs d'éditions de référence ou de sources fiables. Le code n-n ou nn dans le résumé signifiant que la source ou l'édition de référence est indiquée et acceptable.
  2. Wagon jj = wagon des juristes. Le code j-j ou jj dans le résumé indiquerait qu'on a vérifié que le texte est « libre de droits »
  3. Wagon oo = wagon des vérificateurs d'orthographe. Le code o-o ou oo dans le résumé signifierait « orthographe correcte »
  4. Wagon ii = wagon des informaticiens. Le code i-i ou ii dans le résumé indiquerait que « les macros ont été passées ».
  5. Wagon rr = wagon des relecteurs. Le code r-r ou rr dans le résumé : «orthographe et typographie correctes»
  6. Wagon tt = wagon des timoniers. Le code t-t ou tt dans le résumé : «découpage du texte et navigation harmonieux»
  7. Wagon pp= wagon des mises en page - non, non, pas pour ceux qui veulent aller se coucher, c'est pour ceux qui veulent harmoniser les proportions, placer des illustrations etc. Le code p-p ou pp dans le résumé signifierait «jolie présentation»
  8. Wagon ww = wagon des aiguilleurs, ils ajouteraient des catégories et pourraient placer les textes dans le ou les portail(s) qui leur conviendraient. Code w-w ou ww dans le résumé : «texte aiguillé».

Ces sept ou huit wagons suffisent-ils pour que notre texte soit prêt à poursuivre son voyage dans le vaste monde ? --Zephyrus 18 juillet 2006 à 0g:c9 (UTC)

ça à l'air intéressant, mais je n'ai pas bien compris l'utilisation ? Marc 19 juillet 2006 à 1e:d0 (UTC)
Par exemple, j'ouvre Œuvre de Tchoang-tzeu - Chapitre 21. Action transcendante, je relis et corrige (traits d'union manquants, quelques coquilles) En sauvegardant quand j'ai terminé je mets dans le résumé oo, vous savez en relisant l'historique que selon Zephyrus l'orthographe de cette page est correcte. En haut de la page de discussion, au-dessus d'Infoedit, les «sept wagons» de la page se présenteraient ainsi :
nn-j -oo-i -rr-tt-pp-w
En lisant cette suite de lettres vous voyez instantanément
  • Que le j initial n'est pas doublé : il reste donc à vérifier que le texte est bien libre de droits. Si oui, on remplace le j par jj, ce qui donne : nn-jj-oo-i -rr-tt-pp-w - et on met jj dans le résumé.
  • Que le i n'est pas doublé : il faut décider de passer ou non une macro (i). Si vous jugez que c'est inutile ou si vous passez la macro vous mettez ii à la place du i, ce qui donne nn-jj-oo-ii-rr-tt-pp-w - et vous mettez ii dans le résumé.
  • Que le w n'est pas doublé : il reste à ajouter des catégories (w). Quand c'est fait, vous remplacez le w par ww, ce qui donne
jj-oo-ii-rr-tt-pp-ww - et vous mettez ww dans le résumé.
Ceux qui passent ensuite voient que les «sept wagons» sont à jour. --Zephyrus 19 juillet 2006 à 17:10 (UTC)
Autres « wagons » à ajouter :
  • Besoin de markup LaTeX (ou : wagon des mathématiciens ?)
  • Scans complets (wagon des numériseurs ?)
Je remplace les chiffres par des lettres pour les wagons (26 au lieu de 10, ce qui permet d'ajouter des wagons), et on pourrait re-réfléchir à l'ordre dans lequel il faudrait les mettre. --Zephyrus 19 août 2006 à 14:22 (UTC)
Les idées de wagons facultatifs :
  • LaTeX
  • Grec
  • Autres langues spéciales, je ne pense pas que l'on puisse séparer un wagon pour chaque (chinois, hébreu, japonais) Si si, je vous assure, il y en a aussi dans les vieux livres
  • Tableaux énormes. Enfin là il n'y a pas de version texte prévu donc peut-être que c'est plus simple. Pas besoin de faire de l'ASCII Art
  • Manipulation d'images (éclaircir, réduire, enfin manipuler quoi, tout ce qui dépasse la mise en page qui a déjà son wagon)
  • Édition de musique avec Lylipond. C'est assez spécialisé mais le Projet GutenbergG a des bouquins qui en avaient besoin par exemple
Koxinga 19 août 2006 à 16:50 (UTC)
Voyager dans ce train devient de plus en plus intéressant ! --Zephyrus 20 août 2006 à 16:52 (UTC)
Je pense qu'il est nécessaire de formaliser un peu l'édition pour savoir dans quel état sont les textes présents. En ce sens, la proposition de Zephyrus est une très bonne idée. Bon, on peut éventuellement discuter de la forme... Yann 19 juillet 2006 à 17:31 (UTC)
Je comprends mieux maintenant, et je trouve aussi que c'est une bonne idée. Marc 22 juillet 2006 à 07:43 (UTC)
L'idée est bonne, et les wagons en plus sont jolis, mais...
  • j'ai peur que cela soit trop complexe à utiliser pour le commun des contributeurs. Le complexe ne signifie pas compliqué à comprendre, mais la nature humaine est ainsi faite qu'elle se limite au strict minimum ; ainsi, il n'y a pas suffisamment de contributeur qui indique la source et surtout l'édition de référence du document mis en ligne.
Je les ajoute dans le premier wagon : numérisation et référencement. --Zephyrus 23 août 2006 à 16:48 (UTC)
Et ce, à mon avis, tout simplement parce qu'il faut modifier la page discussion. Aussi, je pense qu'il faudrait que le paramétrage des wagons se fassent dans la page édition via par exemple un modèle (même si les wagons sont affichés dans la page discussion)
Oui ! Tout à fait d'accord. --Zephyrus 23 août 2006 à 16:48 (UTC)
Pour faciliter le travail et réduire l'effort, ne pourrait-on prévoir une série de boutons ou de cases comme pour les icones d'avancement, et dont le cochage ferait apparaître un icone spécifique, en plaçant du même coup la page dans la catégorie correspondante ? --Zephyrus 23 octobre 2006 à 11:57 (UTC)
  • justement, il manque le wagon signalant la présence des informations ci-dessus (édition de référence). Sans doute peut-on squatter le wagon des juristes ?
J'ai mis le premier wagon mais on peut changer. --Zephyrus 23 août 2006 à 16:48 (UTC)
  • il y a une discussion en cours entre Koxinga et moi-même concernant le Guide typographique (voir nos pages de discussion). Koxinga pense qu'il faudrait mieux ne pas modifier l'oeuvre d'origine, c'est-à-dire ne faire aucune correction autre que les erreurs d'OCR. Bien que je ne sois pas de son avis, il pourrait être intéressant de changer l'ordre des wagons, pour que la typo et les macros soient faites séparemment de la relecture (et après). Ce qui peut concilier les deux points de vue. A voir. François 21 août 2006 à 20:36 (UTC)

[modifier] Noter la qualité : Conclusions du 27-7-07

Transclusion :
Insertion :
Source de la transclusion
Il faudrait donc peut-être juste changer la terminologie, en gardant les niveaux actuels - on ne va pas refaire le monde - comme :
  • inexistant (0%)
  • incomplet (25%)
  • contenu complet mais non corrigé (50%)
  • complet et corrigé (75%)
  • relu (100%)
  • validé (relu par deux personnes) (étoile)
corrigé signifierait alors : formaté et les erreurs d'OCR ont été corrigées.
Pour les codes couleur, je suis moi aussi pour, mais j'approuve entièrement Thomas lorsqu'il met en garde l'abus de couleur et les problèmes pour les daltoniens. J'en suis un, et même si j'arrive à distinguer les différences entre les couleurs proposées par Thomas lorsqu'elles sont l'une à côté de l'autre, je ne suis pas sûr de voir la bonne couleur lorsqu'elle sera isolée. Pour le symbole utilisant les carrés, ce n'est pas avec la couleur que je connais le niveau de qualité d'un texte, mais avec le nombre de carrés dessinés.
Thomas indique qu'une signalétique avec une sémantique à deux dimensions est difficile à mettre en place. Dans ce cas, il faudrait, en plus des liens colorés, conserver les symboles actuels sur l'onglet "page" ou "texte" afin que des daltoniens comme moi puissent, au moins lorsque la page est affichée, être sûr du niveau de qualité de celle-ci. François 27 juillet 2007 à 20:45 (UTC)
pour les daltoniens, il sera possible de choisir entre l'affichage de liens en couleur et l'affichage de liens suivis d'un icone. c'est configurable par css, il suffit de créer des classes de liens en fonction de la qualité du texte. voici un exemple : Accueil, Accueil, Accueil. il est même possible d'afficher icones et couleurs à la fois, ou bien rien du tout. ThomasV 27 juillet 2007 à 20:53 (UTC)
lire tout

L'exemple de Thomas rétabli avec ses couleurs originelles (qui ne passent pas en transclusion) :

  • inexistant (couleur actuelle)
  • incomplet
  • complet
  • lu et formaté
  • relu et corrigé (couleur actuelle pour les pages existantes)
Transclusion :
Insertion :
Il y a quelque chose de pas clair :
Catégorie:75% est définie par "Textes complets et formatés, mais non validés.", donc à valider.
Alors, quelle différence y a-t-il entre 75% et 100% ?
J'avais cru comprendre que 75% = "relu 1 fois et formaté", 100% = "relu 2 fois" = validé. Éclaircissement please ;-) Kipmaster 26 septembre 2007 à 12:28 (UTC)
Salut Kip,
Les textes à 75 % ne sont pas validés avec une source. Les textes à 100 % le sont. Les textes relus 2 fois sont marqués avec Texte validé. Il y a effectivement une confusion dans la page. Yann 26 septembre 2007 à 12:35 (UTC)

[modifier] Fiche projet

8.1 Proposer une marche à suivre et des étapes Texte incomplet


8.2 Donner son avis sur des propositions Non formaté


8.3 Recenser les pratiques sur d'autres wikisources, d'autres wikis, d'autres sites, des livres, d'autres documents Non formaté

Se référer aux pages Wikisource:Qualité des textes et Wikisource:Validation des textes. --Zephyrus 31 juillet 2006 à 15:02 (UTC)

Wagon 1 : Wikisource:Numérisation en cours - Wikisource:Numérisation

Wagon 2 : Wikisource:Documents à relire- Wikisource:Signaler une erreur - et aussi : Catégorie:Fautes Catégorie:Texte oublié

Wagon 3 : Macros

Wagon 4 : Wikisource:Documents à valider - Catégorie:Wikifier les notes

Wagon 7 : Wikisource:Pages à protéger

Les catégories ci-dessous concernent ou non les «wagons» ? (Si oui, lesquels ?) :

--Zephyrus 10 août 2006 à 19:46 (UTC)

8.4 Boîte à idées sur le projet8 Non formaté
  • Paragraphier devrait figurer dans la todolist du «wagon 4» (relecture, orthographe et typographie), à moins qu'on puisse concocter une macro pour cela, dans ce cas ce serait le «wagon 3» (macros). Mais on pourrait imaginer un autre classement : activités les plus faciles dans une première série, pour les contributeurs timides ou débutants ? --Zephyrus 23 juillet 2006 à 08:02 (UTC)
  • Autre wagon que l'on pourrait ajouter : le wagon des bibliothécaires. Des procédures pour guider celui qui ne sait quel livre choisir. On pourrait y trouver entre autres des indications sur « La bibliothèque de ... », par exemple de Proust : les livres que Proust dit avoir aimés. Cela suppose cependant une technique rigoureuse de nommage pour l'identification des textes. Cf la page ouverte par Koxinga à propos de Fermat. --Zephyrus 24 août 2006 à 06:40 (UTC)
  • Organisation ; suivi des éditions (recopié du Scriptorium - août 2006)

Bonjour,

J'ai fait quelques modifications dans le modèle Modèle:Maintenance. Ce serait bien que d'autres contributeurs regardent ceci de près, et proposent des améliorations pour la navigation dans l'ensemble de ces pages.

Il faudrait aussi penser à se servir des pages Wikisource:Documents à relire et Wikisource:Documents à valider, pour avoir un véritable suivi de l'édition dans son ensemble, et, dans ce but, la proposition de Zéphyrus pourrait être utilisée systématiquement, au moins en page de discussion. Ces points seraient à ajouter dans les pages d'aide pour les débutants. Peut-être ces dernières pages devraient-elles également être un peu complétées. Marc 10 août 2006 à 10:28 (UTC)


8.5 Réalisations projet8 Non formaté


[modifier] Propositions de Pibewiki

Source de la transclusion
Insertion

[modifier] Propositions du TeXnicien de surface

Source de la transclusion
Insertion

[modifier] Les Rustiques

Toutes les nouvelles ont été saisies d’après la source indiquée. J’ai apporté quelques corrections orthographiques et typographiques. J’ai vérifié l’orthographe avec un correcteur (aspell).

Reste à faire une relecture d’où la deuxième icône pas encore à 100%.

Le TeXnicien de surface 11 août 2006 à 11:11 (UTC)

pourquoi deux icônes? ThomasV 11 août 2006 à 11:54 (UTC)
La première pour la quantité (tout le texte est tapé) la deuxième pour la qualité (orthographe vérifiée, une relecture faite) C'est comme ça que j'avais compris les icônes sur la page d'accueil. Le TeXnicien de surface 13 août 2006 à 20:42 (UTC)

[modifier] Discussion du 15-10-2007

Source de la transclusion
Insertion

Suite à une conversation avec Thomas, il apparaît que la notation de la qualité a été changée à un moment (d'après les discussions que j'ai relues, il semblerait que cela se soit fait comme cela, après une proposition, puis une modification de fait de la page de notation). Comme cela peut poser problème, et qu'il serait intéressant de rendre les choses un peu plus claires (je suis assez tenté de refaire déjà la présentation des pages sur la qualité et la validation, mais sans rien changer au contenu), je rappelle ce qui semble être les deux conceptions principales qui ont été énoncées :

Ancienne :

  • Image:25%.png (Image:25%.png) : le texte est en cours d'édition ; il n'y a pour le moment aucune garantie sur sa conformité à une quelconque édition scientifique, et il n'est sans doute pas complet.
  • Image:50%.png (Image:50%.png) : texte complet, mais qui peut comporter quelques erreurs (par exemple de numérisation).
  • Image:75%.png (Image:75%.png) : texte relu par un contributeur disposant d'une édition de référence ; cette catégorie inclut les textes copiés d'un autre site sérieux.
  • Image:100%.png (Image:100%.png) : texte relu par plusieurs contributeurs.

Nouvelle :

  • Image:25%.svg (Catégorie:25%) : le texte est en cours d'édition ; il n'y a pour le moment aucune garantie sur sa conformité à une quelconque édition scientifique, et il n'est sans doute pas complet.
  • Image:50%.svg (Catégorie:50%) : texte complet, mais non formaté, et qui comporte probablement des erreurs (par exemple de numérisation).
  • Image:75%.svg (Catégorie:75%) : texte complet et formaté (y compris l'entête, la typographie, les catégories, etc.).
  • Image:100%.svg (Catégorie:100%) : texte relu par un contributeur disposant d'une édition de référence ; cette catégorie inclut les textes copiés d'un autre site sérieux.
  • Texte validé (Catégorie:Textes validés) : texte ayant passé le processus de validation avec succès.

Donc, qu'est-ce que vous utilisez en fait, qu'est ce que vous jugez plus adéquate ? Est-ce que l'étoile peut apparaître comme une simple validation du Relu et corrigé du premier système d'évaluation, ou est-elle un niveau à part ? Faut-il la supprimer ?

Il y avait eu je crois une discussion récente sur la notation, à propos de précisions à apporter aux différents niveaux. Je ne la retrouve pas, est-ce que quelqu'un sait où elle est, car il faudrait peut-être la poursuivre, et rendre la page Wikisource:Qualité des textes plus détaillé et précise. Marc 15 octobre 2007 à 17:10 (UTC)

Pour ce qui est du système de notation, je pense qu'il est à revoir pour tenir compte du mode page. Pour ce qui est des symboles utilisés, je trouve que l'étoile n'est pas un symbole facile à comprendre car il n'y a pas de suite logique entre Relu et corrigé et Texte validé. Ajouter des niveaux n'est pas une solution. Plus il y aura de niveaux et plus il y aura de risque que chacun en fasse une interprétation différente de celle des autres. ThomasV 16 octobre 2007 à 08:38 (UTC)
J'utilise le deuxième système. Je le trouve plus valorisant que le premier car tout seul je peux atteindre 100% et l'étoile c'est le bonus. La validation me semble pour le moment infaisable étant donné que je m'occupe d'un sujet qui n'intéresse pas grand monde et que ce sont des livres de 200-300 pages. Pyb 16 octobre 2007 à 09:43 (UTC)
J'utilise aussi le 2e système, et je le trouve plutôt bien. Attention en proposant des améliorations qu'elles n'obligent pas à revoir toutes les pages déjà notées. Ce serait à mon avis un surcroit de travail et un retour en arrière. Le but c'est aussi de se donner des outils pour se faciliter le travail, pas le contraire. Pour moi, le symbole de l'étoile est assez clair : c'est la bougie sur le gateau. Je pense que c'est c'est aussi une erreur de privilégier les scans comme méthode de validation. C'est seulement une parmi d'autres. Nous recopions déjà des textes validés par d'autres personnes qui font un excellent travail (Distributed Proofreaders, ELG, etc.). C'est un peu présomptueux de croire que nous pouvons faire mieux qu'eux.
Il faut aussi faire attention à la complexité du processus de validation. Personne ne l'utilise aujourd'hui, à part quelques admins, car il est trop complexe. Si en plus on ajoute la gestion des scans dans le processus, ça devient impossible. C'est pourquoi il faut que la gestion des scans soit un processus séparé de la notation de qualité. Yann 16 octobre 2007 à 21:11 (UTC)
Si nous décidons, comme le suggère Yann, de séparer la gestion des scans et celle de la qualité (ce qui me paraît une très bonne idée avec laquelle je suis pleinement d'accord), on pourrait utiliser pour cela l'espace en haut à droite des pages où nous n'avons encore mis aucun icône. --Zephyrus 16 octobre 2007 à 21:44 (UTC)
Les précédentes discussions ont plus ou moins été regroupées dans le projet n° 8 mais il reste peut-être des éléments non encore inclus. --Zephyrus 16 octobre 2007 à 11:25 (UTC)
Il y a cette discussion qui vaut la peine de ne pas être oubliée : Wikisource:Scriptorium#Hello ThomasV 16 octobre 2007 à 13:33 (UTC)
Faut-il intégrer cette discussion dans le projet 8 : Noter la qualité, ou dans le projet 5 : Numérisation ? --Zephyrus 16 octobre 2007 à 14:11 (UTC)
Je vois qu'il y a des avis différents. En attendant, je propose une esquisse de nouvelle présentation de la page Qualité des textes pour ce qui concerne la première section (Indicateur de niveau de fiabilité d'un texte) : Utilisateur:Marc/Discussions qualité. La notation que j'y présente ne préjuge pas du contenu final. Je voudrais simplement avoir des avis sur la lisibilité et sur les descriptions des différents niveaux que j'ai essayées de détailler un peu plus en utilisant une des deux notations. Marc 16 octobre 2007 à 12:57 (UTC)
Voici ma suggestion:
Texte incomplet incomplet, ou complet sans scans (Modèle:Tsss)
Non formaté texte complet et scans disponibles, mais non paginé Modèle:Paginer
Complet et formaté en mode page
Relu et corrigé en mode page, relu et corrigé
Par complet, j'entends que le texte n'est pas une bouillie brute d'OCR. Par exemple, les pages de Fermat avant correction seraient à classer Texte incomplet
Par relu et corrigé, j'entends par une seule personne. Comme le montre la remarque de Pyb, il est souvent illusoire de s'attendre à ce que plusieurs personnes relisent le même texte. Il ne faut pas pour autant se priver d'accorder la note Relu et corrigé puisque les scans sont là. L'idée de faire relire par plusieurs personnes était justifiée quand on n'utilisait pas le mode page, elle ne l'est plus à mes yeux.
ThomasV 16 octobre 2007 à 13:15 (UTC)
Je trouve que cela prend trop en compte l'outil, au détriment de la qualité effective du texte. Marc 16 octobre 2007 à 14:31 (UTC)




  1. Entre crochets : ajout par rapport au texte traduit