Wikisource:Jeu des mille pages

La bibliothèque libre.
Sauter à la navigation Sauter à la recherche
Raccourci [+]
WS:J1000P

Présentation[modifier]

Objectif

Améliorer la qualité de Wikisource en convertissant 1000 pages de textes préexistant dans l’espace principal.

Le but est de faire diminuer la masse de textes sans mode page (dits textes nus) qui se trouve sur Wikisource ; leur formatage n'est pas demandé dans le cadre du jeu.


Déroulement

Chaque participant s'engage à créer sa part des pages ; pour une dizaine de participants cela équivaut à une centaine de pages. Faites attention à utiliser des éditions similaires afin que la page scannée corresponde exactement au texte découpé.


Où trouver les textes à convertir ?

Lancement[modifier]

Transclusion

Source : Wikisource:Scriptorium/Janvier 2011

ok, je vous propose d'organiser le 2e jeu des mille pages du 31 janvier au 13 février. Pour trouver des œuvres sans scans, vous pouvez consulter :

Pyb (d) 19 janvier 2011 à 12:31 (UTC)

Je me suis inscrit, je compléterai ma liste de textes d’ici le 31 janvier. Zaran (d) 19 janvier 2011 à 13:06 (UTC)
Je m’inscrit aussi avec les Lettres écrites d'Egypte et de Nubie de Champollion : il y a 482 pages, j’aurais le temps d’en faire une centaine au minimum. Tpt (d) 28 janvier 2011 à 19:31 (UTC)
Participations au jeu des mille pages
31 janvier - 13 février
Utilisateur Textes Pages Faits
Pyb Thérèse Raquin 32
Théorie de la propriété 9
L’Origine de la famille, de la propriété privée et de l’État 14
Études socialistes 8
De l’Esprit 78
total 141
Zaran La Colline inspirée 20 20
Le Temps retrouvé 3 3
Parallèlement 45 45
La Cathédrale 16
La Légende des siècles, nouvelle série 20
total 104 68
Zyephyrus Des ouvrages de l’esprit 35
Du mérite personnel 19
Des femmes 30
Du cœur 16
total 100
VIGNERON Finir Vingt mille lieues sous les mers 9
Leconte de Lisle ?
Tpt Lettres écrites d’Égypte et de Nubie en 1828 et 1829 100
Nimbus3d Livre:Blanc - Histoire de dix ans, tome 2.djvu 100 ou plus 66
Correction et ajout des gravures Vingt mille lieues sous les mers +200 230
?
?
total 900


Questions et réponses[modifier]

Transclusion

Source : Wikisource:Scriptorium/Janvier 2011

Bonjour,

Vous trouverez un lien vers ce jeu dans les infos de la page d’accueil. Les joueurs ont jusqu’au 13 février pour couvrir mille pages à faire passer de l’espace Principal à l’espace Page (afin de pouvoir les comparer aux fac-similés et les corriger de façon parfaitement fidèle avant de les retransclure. Si j’ai bien compris, le jeu ne porte pas sur la correction des pages, à laisser pour plus tard, mais uniquement sur leur transfert d’un espace à l’autre.) Bon courage et bonne chance aux participants ! --Zyephyrus (d) 31 janvier 2011 à 09:21 (UTC)

Précision : remplir, à nous tous, d’ici le 13 février, mille pages de l’espace page, lesquelles mille pages font face à mille fac-similés de pages physiques en papier ; et pour remplir ces mille pages on n’est pas tenus de tout retaper manuellement... Il s’agit plus simplement de découper le texte qui est disponible par ailleurs afin de l’adapter aux pages. On peut faire ce découpage à la main et copier-coller les morceaux (c’est ce que je fais par exemple pour Bleak-House), ou bien on peut aussi utiliser l’outil Match et Split après l’avoir activé dans ses préférences, onglet Gadgets. --Zyephyrus (d) 4 février 2011 à 09:40 (UTC)
Je ne comprends pas très bien quelle est la différence de travail à effectuer avec d'autres ouvrages qui sont en statut "A corriger" (comme celui-ci Livre:Blanc - Histoire de dix ans, tome 2.djvu sur lequel je travaille). En effet, même si on va plus loin dans le travail de correction (correction du texte, mise en page), on part du même fichier; pourquoi dans ce cas, tous les ouvrages marqués "à découper" ne sont-ils pas pas marqué "A corriger"?
De plus, est-ce une bonne idée de tous "picorer" dans des ouvrages différents, ce qui, à mon avis, ne modifiera pas tellement le nombre d'ouvrage "à découper" après l'opération… Ne devrais pas-t-on se concentrer sur quelques ouvrages pour avoir une chance d'en avoir quelques-uns de terminés? --Nimbus3d (d) 31 janvier 2011 à 11:25 (UTC)

1. Différence de travail à effectuer, compare ces deux textes :

Texte 1 (facile à travailler) Texte 2 (à remplacer si possible)
partis s’agitaient, sinon pour diriger les passions de

la multitude, au moins pour en mettre à profit l’explosion et c’est à peine si, durant plusieurs heures d’attente mortelle, quelques gouttes de sang avaientcoulé. L’histoire n’om-e peut-être pas de plus étonnant spectacle. Pour le comprendre, il faut se rappeler qu’en France les destinées du peuple avaient toujours été subordonnées à celles de la bourgeoisie.Toujours, si ce n’est en 1793, époque exceptionnelle, époque subUme, effroyable et sans nom, les hommes du peuple avaient combattu pour le compte de la bourgeoisie et à sa suite. La révolution de juillet elle-même n’avait été que l’effet de cette alliance tacite et sans conditions. Ici, pour la première fois, les deux puissances se rencontraient face à face, et elles s’arrêtaient, étonnées de se trouver ennemies. Cependant la nuit est venue. Des feux s’allument dans les rues et sur les places. La garde nationale bivouaque comme sur un champ de bataille. Soit crainte, soit prévoyance, la plupart des habitants

·asi Les Canacrnrtns honorentjles familles, mais qui tendent au bie}: Gt â la cdnfcrvation de. la machine de l’E.tat le du gouvernement. D’aurres maux renverfent des Etats , 8: fur leurs ruines en élevent de nou- veaux. On en _¢a‘vû enlîn qui ont fappé prrles fondemens de grands En=¤pires,8t quiles ont fait éyanoüir cle deifus la terre, pour variertt renou- veller la Face de l’Univcrs. - ( Qu‘importe â l’l.·.tat u’ Brpajlo fait riche, qu’il ait des chiens qui arrétent bien, qu’il crée les modes fur les équipages lt fut les habits, qu’il abonde en fuperüurtez l? Où il s’agit de l‘i¤terêt Gt des eommoditez de tout le publie, le particulier ell- il compté ? La eonfolatron des peuples dans les elxofes qui lui pcfcnt un peu, · elt de (çavoir u°ils foulagent le Prince , ou qu’ili`n‘enriel1i2’e¤t que lm ; ils ne fe croient . point gdevables ai Brgafte de l’embelliIeme¤r` de fa rtttrne. ` Q La erre a r elle Panviquité, elle a été dans Édu: les iiîglesz on l’a toujours vùë remplir le monde de veuves É cïôrplselins, épuifer les familles d’beritiers , Gt faire petit les freres à une même bataille. leurre S o 1 n- e 0 Il A ! je regrette ta vertu, ta pudeur , ton efprit déia meut , penetrant , élevé , (ociables je plains cette mort prématurée gui te joint â ton intrepide Frere , lr t’enleve à une Cour ou tu ¤’as fait que te montrer : malbcur déplora- ble, mais ordinaire 2 De tout temps les hom- Iles pnur quelque morceau de terre de lus ou de moins font convenus entr’eux de le dépouil- ler’, R brûler, fe tuer , fégorger les uns les antresg It pour le faire plus ingenieufement ce avec plus de fenreté , ils ont inventé de belles regles qu’on appelle Part militaires ils ont aga- clté zi la ratique de ces regles la gloire , ou la plus blidz reputation , 8: xls ont depuis eneberi


Le premier est rapide à corriger tandis que le second serait très long tant l’OCR est médiocre. Mais si on l’a, déjà lisible quoique sans scan, dans l’espace Principal, on peut découper ce texte déjà lisible et le répartir face aux pages, ce qui permettra ultérieurement de finir de le corriger beaucoup plus vite. C’est de ce travail de couper/coller qu’il s’agit dans le jeu actuel.

Pour moi, le premier texte a déjà été corrigé, même s'il n'a pas été mis en forme, effectivement, il ne reste plus beaucoup de travail. Ce que je voulais dire, c'est que la plupart des ouvrages qui sont dans la partie "à corriger" (dont l'ouvrage dont je m'occupe) n'ont qu'une couche (médiocre) d'OCR qu'il faut souvent reprendre (en partie ou totalement) et qu'à mon avis, le travail est identique aux ouvrage de la section "à découper". Alors, peut-être que la plupart des ouvrages présents dans la section "à corriger" devraient plutôt être dans la section "A découper"…--Nimbus3d (d) 31 janvier 2011 à 15:21 (UTC)

Pour répondre à ta deuxième question, un des objectifs de Wikisource est d’héberger une large variété de textes. Or chacun a de bonnes raisons (toujours différentes d’ailleurs) d’exclure ceci ou cela. À mon avis on a tout à fait le droit de choisir les textes qu’on veut selon ce qu’on vise ; mais je fais partie de ceux qui ont toujours objecté à fixer des règles qui excluraient des textes selon tels ou tels critères, même décidés par une majorité, si ces règles ont pour résultat d’exclure des textes, et par suite d’exclure des contributeurs et d’appauvrir la bibliothèque. Par exemple, obtenir des livres terminés est un des objectifs de Wikisource mais certainement pas le seul. Si on prend le Dictionnaire de Trévoux, l’Encyclopédie, la série complète des Lettres de Madame de Sévigné, ce sont des projets à juger autrement que sur leur seule longueur ;-) ...en fait je n’ai peut-être pas répondu à ta question : tu parlais sans doute seulement du jeu ? --Zyephyrus (d) 31 janvier 2011 à 14:13 (UTC)

Je comprends tout à fait ton point, mais je pense qu'il y a un fort risque que certains contributeurs s'attaquent à un ouvrage, fassent 10-12 pages pour participer au jeu et laissent tomber (C'était un peu mon approche à l'origine quand j'ai attaqué le tome V de l'Histoire de dix ans; mais heureusement je l'ai terminé et attaqué les autres, dans l'ordre tant qu'à faire!). Au final, on risque d'avoir de nombreux ouvrages commencés qui resterons en souffrance très longtemps. Ne serait-il pas judicieux de faire une sélection d'ouvrages plus restreinte, avec 1 ou 2 livres par thèmes?
Autre question pendant que j'y suis: qui dit jeu, dit compétition. Y aura-t-il des stats de publiés? Quels seront les ouvrages pris en compte : seul ceux de la catégorie "à découper" ou toutes les pages qui passent de la couche OCR à une couche de texte (éventuellement formatée) comme c’est le cas pour mon ouvrage en cour?--Nimbus3d (d) 31 janvier 2011 à 15:21 (UTC)
Stats : je ne sais pas si ceux qui organisent le jeu cette fois-ci ont prévu d’en faire. On t’accueillera sans doute à bras ouverts (je suppose) si tu proposes ton aide à ce sujet. Pour la sélection de textes, comment verrais-tu les choses ? Quelle serait la méthode à suivre ? --Zyephyrus (d) 31 janvier 2011 à 18:41 (UTC)
Je n’avais pas l'intention de proposer une méthode, je voulais juste savoir si mon travail actuel (et celui d'autres) faisait partie du jeu ou s'il fallait que je le mette en sommeil pour corriger quelques pages dans la sélection des livres à découper. Quant à proposer mon aide, j'en serais bien incapable, il vaut mieux pour Wikisource que je m'en tienne à corriger des pages! :) --Nimbus3d (d) 31 janvier 2011 à 19:22 (UTC)

Nimbus3d a tout à fait raison. Franchement, quel besoin a Wikisource de compter encore 1000 pages non corrigées ? Leur nombre a encore augmenté de 28000 en un mois !!! Et on atteint le chiffre ahurissant de 400000 pages non corrigées... (ce chiffre diminue chez les autres wikisources)
Il vaudrait bien mieux lancer un "jeu des livres découpés et laissés tels quelq à corriger", ou des "1000 pages à valider". Enmerkar (d) 31 janvier 2011 à 22:52 (UTC)

Enmerkar, je suis assez d’accord avec toi, mais comme l’expliquait ThomasV dans une discussion précédente, les deux travaux sont complémentaires : passer les textes existants en mode page, et corriger les pages ; l’un accompagne l’autre. En effet, il est plus facile de corriger un texte quand celui-ci est en mode page, car alors la vérification de la conformité avec une édition de référence est immédiate. Il est vrai que nous en sommes déjà au deuxième « Jeu des 1000 pages », alors que jusqu’ici les projets visant à la validation de pages ont été plus timides. Je pense cependant à la fameuse « Guirlande de validations » qui a eu un effet plutôt bénéfique (même si je n’ai pas de statistiques précises à citer). Je propose donc que, une fois ce jeu des 1000 pages terminé, nous réfléchissions à la mise en place d’un projet de validation de pages. Yann a déjà commencé une discussion en ce sens ici au sujet des livres « presque » validés. Zaran (d) 31 janvier 2011 à 23:11 (UTC)
@Enmerkar : Quel besoin a Wikisource de compter encore 1000 pages non corrigées ? — C’est pour une raison simple : le jour où quelqu’un veut corriger une de ces pages, cette page est là : il, ce quelqu’un, prend, corrige. Tu sais aussi bien que moi que si cette page a disparu, les chances de la retrouver peuvent fort bien être nulles, quelle que soit la bonne conscience des bibliothécaires qui ont laissé se perdre irrémédiablement tous ces trésors dont ils croyaient à tort que de toutes façons ils seraient toujours accessibles, ou bien dans certains cas qui pouvaient être le dernier de leurs soucis. Je me soucie des textes auxquels des gens tiennent, je cherche comment leur faire traverser les siècles sous de nouvelles formes numériques ou autres en les gardant accessibles au commun des mortels ; je fais ce que je peux pour qu’ils ne se perdent pas. Je te soutiendrai, tu le sais bien aussi, si tu lances l’un de ces autres jeux dont tu parles.
@Nimbus3d : Il me semble qu’un certain nombre de wikisourciens (dont je fais partie) travaillent sur plusieurs textes à la fois et diversifient leurs activités, un bout de théâtre repose d’un bout d’encyclopédie qui repose d’un bout de programmation qui repose d’un bout de poésie qui repose d’un bout de découpage qui repose d’un petit échange sur le scriptorium ou sur irc qui repose de...bref ! D’autres préfèrent une activité et une seule. Pourquoi pas ? Il y a beaucoup de façons d’avancer Wikisource et chacun le sert comme cela lui convient. Je pense que tu peux ne pas hésiter à choisir les manières de faire où tu es à l’aise.
@Zaran : je trouve que tu as très bien exprimé le sens de notre travail. --Zyephyrus (d) 31 janvier 2011 à 23:43 (UTC)
Hum… Pour moi, je conçois le jeu des mille pages comme un déplacement vers l’espace page + une correction. Simplement déplacer des pages vers l’espace page, c’est simple, une personne seule peut facilement faire les 1000 en 10 jours. Ou alors j’ai loupé quelque chose. -- Sloonz (d) 2 février 2011 à 12:03 (UTC)
Sinon, pour les pages non corrigées, ne serait-ce pas consécutif aux téléversements de la BNF ? -- Sloonz (d) 2 février 2011 à 12:05 (UTC)
Je ne crois pas qu’il soit interdit de corriger les pages, ni non plus interdit de dépasser les cent pages et d’en découper dix fois plus. Au contraire, je pense que ce serait tout à fait apprécié ;-) Pour les téléversements de la BnF il me semble que tu as raison.--Zyephyrus (d) 2 février 2011 à 13:58 (UTC)
Je crois qu’il y a une confusion sur le mot « page » qui peut signifier sur wikisource ou bien une page d’un livre dans l’espace Page ou bien une page de l’espace principal. Ainsi, une page de l’espace principal peut être obtenue par transclusion de plusieurs pages de l’espace livre. Je pense qu’il faudrait peut-être songer à terminologie plus claire pour être sûr qu'il n’y ait pas de confusion. Dans le jeu des « 1000 pages », il s’agit de pages de l’espace principal : faire que 1000 pages de l’espace principal non appuyées par des scans le deviennent et non (comme tu sembles le penser) transclure dans l’espace principal l’équivalent de 1000 pages de l’espace page. Dans le premier cas, les 100 pages de l’espace principal à convertir pour le « joueur » peuvent représenter jusqu’à 10000 pages de l’espace page (si chacune des pages de l’espace principal est obtenue par transclusion de 100 pages de l’espace Page) et il ne semble pas qu’il soit possible d’envisager une correction de l’intégralité des pages dans ce cas Clin d'œil. Dans le second cas (qui est celui que tu as l’air d’envisager), il s’agirait uniquement de relire 100 pages de l’espace Page, ce qui est, je te l’accorde, très faisable en 15 jours. J’espère avoir clarifié la situation. Zaran (d) 2 février 2011 à 23:41 (UTC)
Effectivement, j’avais pris le jeu des mille pages comme l’espace Page:. Du coup, mon compte n’est pas bon dans la guirlande. Et définitivement pas atteignable, vu la taille que fait une seule page (au sens page de l’espace principal) de l’unique et sa propriété (le livre entier doit être découpé en 3 ou 4 pages). Désolé, mais je vais me retirer du jeu, du coup… -- Sloonz (d) 3 février 2011 à 11:54 (UTC)
Je comptais en ce qui me concerne 100 pages de livres physiques (donc 100 pages en fac-similés), cela m’a paru plus comparable (car il me semble que sur les pages web, une seule page de Wikisource peut regrouper 500 poèmes, ou ces mêmes poèmes peuvent occuper chacun une page, rendant les performances difficiles à évaluer). Ai-je mal compris votre conversation ? --Zyephyrus (d) 3 février 2011 à 14:50 (UTC)
Tu as parfaitement compris la conversation, mais visiblement chacun comprend à sa façon le mot « page » dans le jeu des 1000 pages. Le cas que tu mentionnes (un page regroupant plusieurs poèmes) n’est pas si fréquent il me semble : la plupart du temps, il y a une page par poème (cela me semble préférable en tout cas). Dans le cas des romans, une page de l’espace principal correspond souvent à un chapitre et donc à un grand nombre de pages physiques (pages en fac-similés). C’est, je crois, le cas le plus fréquent. Zaran (d) 3 février 2011 à 15:39 (UTC)
Bon, après avoir vu le tableau, j’ai l’impression que moi, Zyephyrus et Tpt avons compris page dans le sens page physique (espace page), tandis que Zaran, Pyb et Vigneron l’ont compris dans le sens page de l’espace principal :). On recommence, ou chacun fait ce qu’il a compris des règles ? -- Sloonz (d) 3 février 2011 à 15:56 (UTC)
Précisions ajoutées ci-dessus : on peut aussi créer une équivalence, par exemple en nombre de lignes, si le travail accompli n’est pas autrement mesurable. Mais ne peut-on plus simplement, en cas de page de l’espace Principal, compter le nombre de pages transcluses ? Il me semble que dans ce cas les comparaisons redeviennent valides, je me trompe ? --Zyephyrus (d) 4 février 2011 à 09:40 (UTC)


Sessions[modifier]

  1. 4-11 juin 2010 ; résultat : 892 pages
    Wikisource:Scriptorium/Mai_2010#Proposition_:_le_jeu_des_mille_pages., Wikisource:Scriptorium/Juin_2010#Jeu_des_1000_pages
    listes des pages par participants
  2. 31 janvier - 13 février 2011