« Wikisource:Scriptorium/Février 2019 » : différence entre les versions

Ajouter un sujet
La bibliothèque libre.
Dernier commentaire : il y a 5 ans par Wuyouyuan dans le sujet Match & split
Contenu supprimé Contenu ajouté
Ligne 79 : Ligne 79 :
:{{merci|Le ciel est par dessus le toit}} ; en l'occurrence, non, ce n'est pas toi. --[[Utilisateur:Acélan|Acélan]] ([[Discussion utilisateur:Acélan|d]]) 6 février 2019 à 15:28 (UTC)
:{{merci|Le ciel est par dessus le toit}} ; en l'occurrence, non, ce n'est pas toi. --[[Utilisateur:Acélan|Acélan]] ([[Discussion utilisateur:Acélan|d]]) 6 février 2019 à 15:28 (UTC)
:::J'arrive en retard, juste pour insister: le but de Wikisource n'est pas de produire des constructions cachères, texte parfait appuyé sur un fac-simile indiscutable ; le but est de proposer aux lecteurs des textes lisibles. Il m'arrive de tomber sur un texte qui était parfaitement lisible, que le Match et Split a transformé en bouillie, fusionnant les titres de chapitre ou de paragraphe avec le texte de la fin du chapitre précédent et créant des démarcations arbitraires. J'essaie alors de réparer. C'est ce que celui qui avait fait l'opération aurait dû faire aussitôt après. Ou alors il aurait mieux fait de placer le [[Modèle:Index]] ( <nowiki>{{Index|... nom du fichier FS ...}}</nowiki> qui crée l'onglet ''source'', et d'attendre d'avoir le temps de faire l'opération en entier. Mais bon, on dirait que faire baisser le chiffre des pages "sans FS" est un but, pas un moyen. --[[Utilisateur:Wuyouyuan|Wuyouyuan]] ([[Discussion utilisateur:Wuyouyuan|d]]) 7 février 2019 à 09:54 (UTC)
:::J'arrive en retard, juste pour insister: le but de Wikisource n'est pas de produire des constructions cachères, texte parfait appuyé sur un fac-simile indiscutable ; le but est de proposer aux lecteurs des textes lisibles. Il m'arrive de tomber sur un texte qui était parfaitement lisible, que le Match et Split a transformé en bouillie, fusionnant les titres de chapitre ou de paragraphe avec le texte de la fin du chapitre précédent et créant des démarcations arbitraires. J'essaie alors de réparer. C'est ce que celui qui avait fait l'opération aurait dû faire aussitôt après. Ou alors il aurait mieux fait de placer le [[Modèle:Index]] ( <nowiki>{{Index|... nom du fichier FS ...}}</nowiki> qui crée l'onglet ''source'', et d'attendre d'avoir le temps de faire l'opération en entier. Mais bon, on dirait que faire baisser le chiffre des pages "sans FS" est un but, pas un moyen. --[[Utilisateur:Wuyouyuan|Wuyouyuan]] ([[Discussion utilisateur:Wuyouyuan|d]]) 7 février 2019 à 09:54 (UTC)
::::Je me disais aussi : "c’est étonnant que Wuyouyuan ne soit pas encore intervenu"… je commençais à m’ennuyer. --[[Utilisateur:Le ciel est par dessus le toit|<span style="letter-spacing:0.2em; font-variant: small-caps; color:gray">Le ciel est par dessus le toit</span>]] [[Discussion_Utilisateur:Le ciel est par dessus le toit|<sup>Parloir</sup>]] 7 février 2019 à 10:20 (UTC)
::::Je me disais aussi : "c’est étonnant que Wuyouyuan ne soit pas encore intervenu"… je commençais à m’ennuyer. --[[Utilisateur:Le ciel est par dessus le toit|<span style="letter-spacing:0.2em; font-variant: small-caps; color:gray">Le ciel est par dessus le toit</span>]] [[Discussion_Utilisateur:Le ciel est par dessus le toit|<sup>Parloir</sup>]] 7 février 2019 à 10:20 (UTC) Oh, pertinent et bienveillant (surplombant, même). --[[Utilisateur:Wuyouyuan|Wuyouyuan]] ([[Discussion utilisateur:Wuyouyuan|d]]) 7 février 2019 à 10:48 (UTC)
:::::Pensée de l'escalier: si un expert peut faire que le [[Modèle:Index]] alimente une catégorie "Fac-simile à exploiter" ou autre. Ca aiderait à voir où on peut intervenir. --[[Utilisateur:Wuyouyuan|Wuyouyuan]] ([[Discussion utilisateur:Wuyouyuan|d]]) 7 février 2019 à 10:48 (UTC)

Version du 7 février 2019 à 10:48

Questions
Raccourci [+]
WS:S


Choix éditoriaux
Contenu des livres, mise en page, typographie, etc.


Questions techniques
Utilisation de Wikisource, de la syntaxe d'édition, de l'interface.


Questions légales
Droits d'auteurs sur les livres et questions juridiques.


Questions sur les Glyphes & caractères
Codage et représentation des glyphes et caractères.


Scriptorium
(Mois en cours, Archives, discussion générale en anglais)
Pour laisser un message qui ne concerne pas les cas cités.
Communauté : Forum des nouveaux - Annonces - Projets - Actualités - Newsletter technique - Pages à supprimer


Février 2019

Bravo pour ce premier mois du Défi 5000

Bonjour à tous... Je tenais à féliciter la communauté pour la participation et les résultats obtenus lors de ce premier mois de Défi 5000... Plus de 135% de l'objectif atteint, pour ce défi lancé à la dernière seconde, sans être annoncé très longtemps, c'est un résultat plus qu'intéressant... En comparaison, pour ceux qui ont connu le Défi 100 wikijours où nous devions faire un livre entre 70 et 125 pages par jours, cela représentait en moyenne 3023 pages corrigées pour un mois de 31 jours... En ce mois de janvier 2019, c'est 6795 pages qui auront été complétées et parmi celles-ci, 3209 de ces pages ont été validées (plus de 47% des pages du défi), pour un total de 10004 pages en tout... Les résultats parlent d'eux même! Bravo à tous!

Petit résumé du défi de janvier:

  • 6795 pages traitées (135.90%), dont 3209 validées — une moyenne générale de 219 pages par jour.
  • 2 objectifs atteints: 100% et 125%.
  • 18 ouvrages publiés sur les 27 présentés, dont 5 entièrement validés.
  • Meilleure journée du mois: 549 pages (341% de la moyenne quotidienne requise).
  • 6 jours dans le mois où la moyenne de pages requises (161 pages pour un mois de 31 jours) a dépassé 200%
  • 9 jours dans le mois où la moyenne n'a pas été atteinte.

Les 9 ouvrages non complétés ont été rejoindre les 12 nouveaux titres de février actuellement présentés. De nouveaux ouvrages, sélectionnés parmi la liste des textes suggérés sur la page prévue à cette fin dans le défi seront ajoutés d'ici quelques jours pour atteindre environ 7500 pages présentées. Février n'a que 28 jours, alors la moyenne quotidienne de pages traitées passe de 161 à 179... Il faudra travailler un peu plus fort ce mois-ci pour réaliser le défi, et si nous voulons battre notre résultat de janvier, cela impliquera une moyenne quotidienne de 243 pages... Mais chaque chose en son temps...

J'espère que le défi de janvier vous aura plu, que vous vous serez amusé, et que vous aurez découvert de nouveaux auteurs... c'est ce qui compte! Comme j'ai dit à Vienne à la première conférence de Wikisource: "Make it simple and keep it fun!"...

--Ernest-Mtl (d) 1 février 2019 à 12:53 (UTC)Répondre

Défi février...

Juste une remarque : le djvu de Artaud le Mômo se trouve sur Wikisource et pas sur Commons. Une raison particulière pour cette localisation ? Cobalt~frwiki (d) 1 février 2019 à 20:07 (UTC)Répondre
probablement éviter un effaçage sur Commons dû à URAA... --Hélène (dite ''le bot de service'') (d) 2 février 2019 à 10:54 (UTC)Répondre
Et maintenant que l'auteur est dans le domaine public ? Sur Commons, l'outil Croptool est bien pratique pour traiter les images correctes, et là elles sont plutôt propres. Après, si on peut les récupérer en format HD sur la bnf, il n'y a pas de soucis. (ps : n'y aurait-il pas un petit problème d'affichage du mois de février sur le scriptorium ?) Cobalt~frwiki (d) 2 février 2019 à 11:03 (UTC)Répondre
mmm... oui, j'avais un problème d'affichage de ton message... résolu par une purge du cache ^^ j'en ignore la cause.
pour Croptool... c'est vrai qu'il est commode ! je n'ai jamais récupéré des images en résolution maximale sur Gallica. Je crois qu'il existe des outils construits par la communauté pour ça https://medium.com/@seeksanusername/astuce1-r%C3%A9cup%C3%A9rer-de-la-hd-sur-gallica-bef0a6cc7f89 (mais je n'ai jamais testé), en particulier pour du téléchargement HD d'images individuelles http://www.geobib.fr/tool/iiif/ qui est très simple d'emploi.
Bon courage @Cobalt~frwiki --Hélène (dite ''le bot de service'') (d) 2 février 2019 à 11:14 (UTC)Répondre
Finalement pas si propre : scan en deux couleurs (blanc et noir) et les dessins ont visiblement été faits sur des feuilles de cahier quadrillées, elles ne sont pas aussi bien définies qu'on pourrait l'espérer. Pour les images haute résolution sur Gallica, j'utilise simplement l'outil wget en script dans un fichier de traitement par lot sous linux. Cobalt~frwiki (d) 2 février 2019 à 11:27 (UTC)Répondre

Un mois de janvier productif sur fr.ws !

Je voulais souligner le travail exceptionnel de la communauté wikisourcienne francophone en ce premier mois de 2019... Les résultats parlent d'eux-mêmes:

  • Pages corrigées: 27 317 pages (une moyenne de 881 pages par jour) — dont seulement 6 795 pages (24.87%) étaient dans le défi.
    • Décembre: 20 248 pages, une augmentation de 34.91% par rapport au mois précédent
  • Pages validées: 7 774 (une moyenne de 251 pages par jour) — dont seulement 3 209 pages (41.27%) étaient dans le défi.
    • Décembre: 4 757 pages, une augmentation de 63.42% par rapport au mois précédent

Au delà du défi, le projet est vraiment actif! Bravo à tous! --Ernest-Mtl (d) 5 février 2019 à 16:32 (UTC)Répondre

Match & split

Bonjour,
Il faudrait vraiment que les gens qui utilisent cette fonction fassent attention à la conformité des éditions. Cela n'a pas de sens de faire des M&S lorsque les éditions sont trop différentes, et cela comporte pas mal de risques :

  • risque d'incompréhension de la part de contributeurs débutants ;
  • risque d'erreurs importantes pas faciles à détecter ;
  • risque de décalages, de rupture de mise en forme, etc.

Parfois, cela ne correspond tellement à rien, qu'il faut lancer l'OCR sur la page plutôt que d'essayer de corriger le texte censé correspondre au fac-similé.
Je suis tout à fait d'accord pour dire qu'il est important de mettre en rapport les scans et les textes ; mais y a-t-il tellement urgence à le faire, qu'on soit prêt à faire parfois n'importe quoi pour faire baisser le nombre de livres sans scan ? Je suis en train de corriger un texte qui est une vraie catastrophe sur ce point, et je viens de tomber sur quelques exemples récents particulièrement problématiques. Je ne les citerai pas, pour ne blesser personne, mais j'aimerais bien un peu plus de discernement à l'avenir (ou alors, que ceux qui se livrent à ces opérations corrigent les textes en question, mais c'est sûr que ça prend plus de temps qu'un M&S.
J'espère sincèrement que ce message ne sera pas mal pris ; je reconnais le travail que font les wikisourciens, mais un peu de recul sur certaines pratiques serait parfois souhaitable.
Cordialement, --Acélan (d) 5 février 2019 à 21:38 (UTC)Répondre

Bonjour Notification Acélan :... Voici ma réponse en toute amitié et sans animosité, surtout que je ne suis même pas visé dans le texte dont tu fais référence en ce moment... Mort de rire Mais pour avoir moi-même été instigateur de tels M&S dans le passé, je peux comprendre que certains textes d'éditions différentes ont pu glisser entre les doigts des manipulateurs du M&S... Mais je comprends aussi qu'en 2015, il y avait plus de 24659 textes sans source ici... Hier, on en était à 9784... Donc un différence nette de 14875 textes maintenant sourcés qui ne l'était pas avant. Et n'oublions pas que ces chiffres ne tiennent pas compte de tous les nouveaux textes qui ont paru sans source au fil de ces trois ans et demi... Donc 15000, 15500, 16000? Je crois que c'est une bonne approximation. Selon moi, il aurait été impensable que 100% des textes soient parvenus à 100% de correspondance des scans trouvés... Les wikisourciens ayant passés plusieurs centaines d'heures à chercher des sources ne sont pas des dieux, mais des humains, comme nous tous. Attendu qu'on peut toujours se fier sur des bonnes gens de la communauté pour nous pointer rapidement des cas comme celui-ci — sûrement pour s'assurer de nous permettre de s'améliorer!!! —, je ne pense pas qu'il y ait eu des milliers de cas cependant, sinon ma page de discussion aurait sûrement dépasser la quantité de textes qu'il y a sur Wikisource... Je ne dis pas non plus que tous ces M&S se sont fait sans heurts... Cependant, je ne crois pas non plus qu'on puisse parler de ce que tu qualifies de manque de discernement, ou encore certaines pratiques... je ne crois pas que ton intention était d'attaquer avec ces termes l'intégrité de ceux qui ont effectué toutes ces recherches... Sûrement voulais-tu parler d'une meilleure pratique de contre-vérification dans le projet, ce à quoi les gens intéressés auraient aussi pu participer. Sur ce point, ayant effectué plusieurs M&S personnellement, je prends volontiers ma part du blâme car je sais que c'est arrivé que je fasse un M&S et m'aperçoive une fois le M&S terminé que l'édition, bien que proche de celle que nous avions, possédait des différences qui ne nous étaient apparues avant. Mea culpa... Après 5 ans sur le projet, je ne m'offusque plus comme à l'époque de mes premiers edit où j'avais reçu comme on dit au Québec, un char de marde de la part de gens s'étant auto-proclamés demi-dieux de la WS parce que j'avais oublié de mettre un nowiki ou un {{Tiret}} sur une page... J'étais loin d'être parfait à mon arrivée sur le projet, et 5 ans plus tard, je ne pense pas pouvoir me qualifier autrement que d'expérimenté mais jamais je n'aurai la prétention de me croire parfait. Ferai-je attention à l'avenir? Je crois pouvoir sincèrement affirmer que j'ai toujours fait attention. Ferai-je à nouveau un texte sur lequel certaines variations pourraient me passer entre les doigts sans que je m'en aperçoive? Aucun doute là-dessus! Vais-je m'en vouloir lorsque je m'en apercevrai? Affirmatif! Vais-je être blessé, insulté, si quelqu'un me reproche de l'avoir fait... Oh que non! L'erreur humaine est de ce monde et comme je ne ferai jamais, sciemment, une telle action, jamais personne ne pourra me faire sentir coupable d'avoir fait ce que je croyais la bonne chose à faire en toute bonne foi. À mon tour, j'espère sincèrement que mon explication en réponse à ton message ne sera pas mal pris... Je reconnais et comprends tes inquiétudes, mais un peu de recul et compréhension envers ceux qui ont fait une action en toute bonne foi serait parfois souhaitable. Amicalement et sincèrement, --Ernest-Mtl (d) 6 février 2019 à 01:48 (UTC)Répondre
Je le répète, Ernest-Mtl, je reconnais que c'est un travail utile que de mettre en rapport les textes et les FS, et je salue particulièrement le travail de recherche et d'import de FS manquants. Mais le M&S est un outil à manipuler avec beaucoup de précautions, et mon message ne visait qu'à inciter ceux qui l'utilisent à prendre davantage de précautions en l'utilisant.
Comme il n'y a pas d'urgence (on peut oublier de temps en temps les statistiques) :
  • Pourquoi pas remplacer une édition par une autre, mais en ce cas, sans faire de M&S : proposer simplement le FS en lien, et remplacer le texte par la transclusion après la correction des pages
  • Quand on M&S du théâtre non formaté, on perd (on fait perdre) un temps précieux ensuite à mettre les modèles de personnages page par page ; si on n'est pas à l'aise pour faire le formatage, ou si on n'a pas le temps, ou pas envie de formater la pièce en question, on peut proposer cela à la communauté, ou simplement attendre...
Bref, même si on est de toute bonne foi (et je n'ai jamais pensé autre chose), je répète qu'un peu de recul sur la question est une bonne chose, et qu'il est important de mieux penser au travail de correction qui vient après. C'est donc une critique à visée constructive : même si le travail de vérification est fait, il faudrait sans doute mieux le faire.
Ce qui me fâche, en revanche, dans ton message, c'est ce que tu dis du « char de marde » reçu lors de tes premières contributions. Comme ce n'est pas du tout dans les usages de Wikisource, j'ai eu la curiosité d'aller voir. Là, il y a un truc qui m'échappe. --Acélan (d) 6 février 2019 à 07:51 (UTC)Répondre
Notification Acélan et Ernest-Mtl : Je me permets d’intervenir à ce sujet, faisant beaucoup de recherches de sources ; Oui le M&S qui ne correspond pas est problématique ; Oui il y a des erreurs, oui il y a des éditions qui ne correspondent pas. Mais si les contributeurs de pages sans fac-similé citaient leurs sources, mettaient un lien qui pointe vers un fac-similé plutôt que vers un site non exploitable (Pour le théâtre par exemple où on a eut des imports en masse pendant plusieurs périodes avec des contributeurs qui ne répondaient pas à nos demandes de source), on ne se poserait pas la question et il n’y aurait sans doute pas d’erreur. Maintenant la question de fond n’est-elle pas plutôt : "un texte non sourcé, qui ne revoie pas à un fac-similé doit-il figurer sur Wikisource ?" Et "doit-on passer des heures à faire une recherches pour en trouver la provenance ?" Si la réponse est non, il nous faut supprimer toutes les pages sans source exploitable et je me ferai un plaisir, n’en déplaise à certains qui veulent tout garder, de le faire. C’est moins de boulot pour moi. Maintenant quand j’ai un livre qui correspond au texte sans fs, je fais 3 à 4 sondages pour voir si ça correspond, et malgré mon attention et ce travail, il y a des textes qui varient beaucoup entre les parties recherchées et que mon sondage n’a pas permis de trouver. Maintenant pour le théâtre, il n’y a pas si longtemps que ça, on m’a demandé de faire un M&S sur un texte non formaté, je pensais que celui qui me le demandait, ferait la mise en forme après, et bien non ! Et là le M&S ne change rien, un texte mal foutu sans fac-similé, reste un texte mal foutu avec fac-similé en passant par le M&S, mais il à une valeur ajoutée : il a une source certaine. Et cette valeur ajoutée me suffit. De plus les textes sont mis "à corriger" donc 2 relectures devraient normalement résoudre le problème. Pour le reste, on a aussi énormément de texte mal ficelés, même passer en corrigé et validé et qui ne sont pas issus de M&S, que dans la masse, ceux que l’on rajoute me semble quelques cacahuètes fraiches sur un tas déjà bien pourri avant notre travail. Mais on fait ce qu’on peux et on continuera à faire ce qu’on pourra, tant qu’on acceptera des textes sans sources et sans fac-similé. --Le ciel est par dessus le toit Parloir 6 février 2019 à 09:37 (UTC)Répondre
Notification Acélan : En effet, pour le théâtre, au début, on faisait les M&S, mais Notification Hsarrazin : nous a gentiment mis au courant des problèmes que ça causait, d'où la création d'une section spécifique aux pièces, Wikisource:Facsimilé_à_intégrer#Pièces_de_théâtre, afin que le jour venu, nous puissions faire un match manuel avant de faire le split pour s'assurer de ne pas briser les personnages des répliques, etc... Si on avait continué malgré les avis, je comprendrais... ce n'est pourtant pas le cas.
Et comme toi, j'étais allé vérifier ma page d'archive également afin de m'assurer que je ne ferais pas du flame talk contre quiconque au cas où certains des commentaires que j'avais reçu y étaient et donc aurait pointé directement quelqu'un et repartir de vieilles guerres qui sont actuellement dans les limbes (ou le purgatoire, c'est selon! Mort de rire). Mais pourquoi risquer de laisser des traces sur un wiki quand on peut tout simplement apostropher, en personne, le coupable et le traiter d'incompétent, au lieu de lui demander gentiment comment on peut l'aider à partir ses contribution du bon pied? Je peux te confirmer cependant que si Notification Aristoi : n'avait pas été là et ne m'avait pas si patiemment renseigné sur les méthodes, les modèles, la mise-en-page, etc, j'aurais fini par faire la même chose que sur Wikipédia, c'est-à-dire quitter à cause d'une communauté qui, à mon arrivée, me semblait aussi fermée que sur WP. Mais je vais restreindre mes discussions, mes envolées et me terrer dans le défi où j'ai moins de chance de fâcher les gens... --Ernest-Mtl (d) 6 février 2019 à 12:42 (UTC)Répondre
Tu n'as vraiment pas eu de chance pour ton arrivée, parce que pour ce que j'en sais, c'est rare de se faire mal recevoir ici. Surtout que tes premières interventions étaient tout à fait acceptables, et qu'Aristoi n'a pas tardé à t'expliquer les choses.
Pour le théâtre, ça me fait bien plaisir que la question soit intégrée (elle l'est visiblement depuis très peu de temps, à peine plus d'un mois, si j'en crois l'historique des M&S effectués, mais si elle l'est, c'est parfait, merci Notification Hsarrazin :), parce que je trouve très fastidieux de faire des copier-coller des modèles de personnages quand il est tellement plus rapide de faire des remplacements en lots sur l'ensemble du texte — à condition, bien sûr, de ne pas se mélanger les pinceaux.
Tout cela me rassure beaucoup sur la future qualité des M&S effectués, je n'en demandais pas davantage. --Acélan (d) 6 février 2019 à 13:09 (UTC)Répondre

Notification Acélan : si c’est moi qui ait fait la boulette, il suffit de me le dire et je m’occuperai de la mise en forme pour le théâtre. --Le ciel est par dessus le toit Parloir 6 février 2019 à 14:15 (UTC)Répondre

Merci Le ciel est par dessus le toit !Merci ! ; en l'occurrence, non, ce n'est pas toi. --Acélan (d) 6 février 2019 à 15:28 (UTC)Répondre
J'arrive en retard, juste pour insister: le but de Wikisource n'est pas de produire des constructions cachères, texte parfait appuyé sur un fac-simile indiscutable ; le but est de proposer aux lecteurs des textes lisibles. Il m'arrive de tomber sur un texte qui était parfaitement lisible, que le Match et Split a transformé en bouillie, fusionnant les titres de chapitre ou de paragraphe avec le texte de la fin du chapitre précédent et créant des démarcations arbitraires. J'essaie alors de réparer. C'est ce que celui qui avait fait l'opération aurait dû faire aussitôt après. Ou alors il aurait mieux fait de placer le Modèle:Index ( {{Index|... nom du fichier FS ...}} qui crée l'onglet source, et d'attendre d'avoir le temps de faire l'opération en entier. Mais bon, on dirait que faire baisser le chiffre des pages "sans FS" est un but, pas un moyen. --Wuyouyuan (d) 7 février 2019 à 09:54 (UTC)Répondre
Je me disais aussi : "c’est étonnant que Wuyouyuan ne soit pas encore intervenu"… je commençais à m’ennuyer. --Le ciel est par dessus le toit Parloir 7 février 2019 à 10:20 (UTC) Oh, pertinent et bienveillant (surplombant, même). --Wuyouyuan (d) 7 février 2019 à 10:48 (UTC)Répondre
Pensée de l'escalier: si un expert peut faire que le Modèle:Index alimente une catégorie "Fac-simile à exploiter" ou autre. Ca aiderait à voir où on peut intervenir. --Wuyouyuan (d) 7 février 2019 à 10:48 (UTC)Répondre