Discussion utilisateur:John Vandenberg

La bibliothèque libre.
Sauter à la navigation Sauter à la recherche

Bienvenue sur la Wikisource francophone


Wikisource est un projet collaboratif de la fondation Wikimedia visant à la mise à disposition du patrimoine écrit. La version francophone a vocation à accueillir les textes en langues françaises, y compris anciens français et la plupart des langues régionales.

Image logo
▷ Qu’est-ce que la Wikisource ; qu’est-ce qu’elle n’est pas ; comment fonctionne-t-elle : pour trouver des réponses à ces questions, une visite sur Qu’est-ce que Wikisource et Introduction à Wikisource vous est proposée.

Image logo
▷ Avant toute contribution, lisez le Guide du nouveau contributeur, les Conventions typographiques et Conventions de nommages des œuvres.
Si vous souhaitez insérer un nouveau texte, n’oubliez pas d’indiquer la source de celui-ci, ou mieux, un lien vers un fac-similé.
Vous devez également respecter le droit d’auteur.

Image logo
▷ Pour tout problème, un lien vers l’aide est disponible dans le menu de gauche et le Memo à l’usage des (nouveaux) contributeurs rassemble les principaux « trucs et astuces ».
Vous pouvez aussi demander de l’aide à la communauté des Wikisourciens sur le Forum des nouveaux ou le Scriptorium, ou en temps réel sur le chat IRC, ou encore en demandant à être parrainé.

Image logo
▷ Vous pouvez indiquer, sur votre page utilisateur, les langues que vous parlez, vos centres d’intérêt et/ou une brève description. Vous pouvez aussi l’utiliser pour organiser vos outils personnels, vos contributions, etc. Vous pouvez vous entraîner à utiliser les outils en vous créant une sous-page de brouillon à cet effet en cliquant ici. Un mode d’emploi est disponible sur la syntaxe Wiki.
Sur les pages de discussions, pensez à signer vos contributions en cliquant sur l’icône Signature icon april 2018 - 2.png de la barre d’outils.


Bonne continuation parmi nous, John Vandenberg !

Les contributeurs de Wikisource
Zephyrus 28 novembre 2007 à 12:28 (UTC)

Templates[modifier]

Hi, Jayvdb. Is this {tl|Supprimer}} the same template as our {{m|Supprimer}} ? The result is this : {{Supprimer}}, is it the same result ?[1] - --Zephyrus 29 avril 2008 à 16:41 (UTC)


  1. Traduction : Salut, Jayvdb. Est-ce que ceci {tl|Supprimer}} représente le même modèle que notre {{m|Supprimer}} ? Voici ce qu'il donne : {{Supprimer}}, est-ce la même chose que l'autre ?



Oui! merci. John Vandenberg 30 avril 2008 à 11:29 (UTC)

Bot[modifier]

Hi John, do all the proposed djvu files get as good a quality as this one?[1] --Zyephyrus 29 juillet 2008 à 09:16 (UTC)


Those images and the OCR come from archive.org. The images are usually that quality. Their OCR is not so good at French. I will avoid uploading bad OCR [2]. John Vandenberg 29 juillet 2008 à 09:21 (UTC)




  1. Traduction : est-ce que les fichiers djvu dont il s'agit atteignent la même qualité que celui-ci ?
  2. Fac-similé et OCR viennent du site archive.org. Les fac-similés sont en général de ce niveau de qualité. Leur OCR ne vaut pas celui des Français, j'éviterai le chargement d'OCR médiocres.

Bots uploading djvu files (an English summarized version) :)[modifier]

Hi John,

I'm sorry if you feel that I'm saying you are not useful for fr.ws, but it's not what I'm saying, really. I hope you don't feel like that because I'm sure you can help very much on all the ws and your bot can do a pretty job making a very good OCR. I want to explain you what I think about that:

On fr.ws we have speak (even argue) several times about quality. We have sometimes very different points of view about how to reach a good level of quality and about the stage where we could reach it. I for my part think that a good level of quality starts at the very beginning of the process, that is, when we make the djvu file we are going to upload.

To ensure that we begin correctly, we should be able to make the best djvu file we can from as many sources as we find. In fact, that means:

  • if we have several different facsimiles, choosing the one that has the better text quality (in order to have an easy OCR),
  • if the selected one has missing pages, trying to recover the pages from another facsimile; and if that's not possible, adding an empty page where needed,
  • to check the order of the pages,
  • to crop the pages properly.

A bot cannot do that, for sure. We need human contributors for that.

I understand you when you say "time is gold" and you don't want to waste your time doing that. But there are people who is inclined to do that: me, for example :) ; and we need to have time to do that before the uploading process, before the creation of the index page and, above all, before the start of the transclusion process.

A bot, on Commons, doing massively uploadings, doesn't leave us the opportunity of doing the file inspection. It's for this reason that I have said on the fr.ws Scriptorium that uploading a djvu file is a job to do by a human contributor, and not by a bot.

Responses from the people:

  • Zephyrus thinks that, perhaps, this means that we are going to ban the texts that don't have a good djvu file.
    • Not at all, if we have no good file, we are going to upload the one we have (with blank pages, with bad quality, anyway).
  • In general, it seems that you (Yann, Zeph, and you) think that is better to have many djvu files available, without worrying about its quality, in order to attract more contributors.
    • This is more difficult to argue because, in fact, we don't know why people is coming or leaving. I feel you are not right, but I cannot prove anything. However, I can do a proposal: we are thinking (a Philippe's idea) about setting up a workshop in order to organize the creation of the djvu files. We could set up this workshop with two objectives: not only to make the djvu files demanded by a contributor, but to search everywhere for new books (demanded or not). It's not as quick as a bot, but it can increase the number of books in djvu format available for future contributors, keeping in mind the idea of giving the best djvu file we can.

In short, this is what I have said and what I have understood from others. Feel free to make me all the remarks you wish.

Anyway, I think we can arrive to the best solution (even, perhaps, using the massive uploaders as you use now).

Regards, [1]

--LaosLos 30 juillet 2008 à 14:21 (UTC)


  1. Salut John, Je suis désolée si vous pensez que je dis vous n'êtes pas utile pour fr.ws, mais ce n'est pas ce que je dis, vraiment. J'espère que vous ne vous sentez pas comme ça parce que je suis sûre que vous pouvez aider beaucoup sur tous les aspects et votre bot peut faire un joli travail d'une très bonne reconnaissance. Je tiens à vous expliquer ce que je pense à ce sujet: Sur fr.ws nous avons parlé (et même argumenté) plusieurs fois sur la qualité. Nous avons parfois très différents points de vue sur la façon d'atteindre un bon niveau de qualité et sur le stade où nous pourrions atteindre. J'ai, pour ma part, pensé que un bon niveau de qualité commence au tout début du processus, c'est lorsque nous faisons les djvu fichier, nous allons transférer. Pour faire en sorte que nous commencions correctement, nous devrions être en mesure de tirer le meilleur parti des fichiers djvu tant que nous pouvons, d'autant de sources que nous trouvons. En fait, c'est-à-dire:
    • Si nous avons plusieurs fac-similés, en choisissant celui qui a le meilleur texte de qualité (afin d'avoir un facile OCR),
    • Si l'un a pages manquantes, en essayant de récupérer les pages d'un autre fichier, et si ce n'est pas possible, en ajoutant une page vide en cas de besoin,
    • Pour vérifier l'ordre des pages,
    • Recadrer les pages correctement.
    Un robot ne peut pas le faire, c'est certain. Nous avons besoin de contributeurs humains. Je vous comprends quand vous dites «le temps est d'or" et vous ne voulez pas perdre votre temps à faire cela. Mais il ya des gens qui sont enclins à le faire: moi, par exemple:) et nous devons avoir le temps de le faire avant le chargement, avant la création de la page d'index et, par-dessus tout, avant le début de la transclusion. Un robot, sur Commons, en faisant massivement des téléchargements, ne nous laisse pas la possibilité de faire l'inspection. C'est pour cette raison que je l'ai dit sur le scriptorium fr.ws que l'envoi d'une djvu fichier est un travail à faire par un contributeur humain, et non par un bot. Les réponses :
    • Zephyrus pense que, peut-être, cela signifie que nous allons interdire les textes qui n'ont pas une bonne djvu fichier.
      • Pas du tout, si nous n'avons pas de bon dossier, nous allons transférer à celle que nous avons (avec des pages blanches, de mauvaise qualité, de toute façon).
    • En général, il semble que vous (Yann, Zeph, et vous) pensez que c'est préférable d'avoir de nombreux djvu fichiers disponibles, sans se soucier de leur qualité, afin d'attirer plus de contributeurs. (Mise au point de Zephyrus : ce n'est pas exactement ce que j'ai voulu dire ; il s'agit pour moi de rassembler et de conserver des textes. Les contributeurs viennent nombreux parce qu'ils ont le même but, ce n'est pas l'inverse).
      • C'est plus difficile d'argumenter parce que, en fait, nous ne savons pas pourquoi les gens décident de venir ou de partir. Je pense que vous n'avez pas raison, mais je ne peux pas prouver quoi que ce soit. Toutefois, je peux faire une proposition: nous pensons (une idée de Philippe) à la mise en place d'un atelier en vue d'organiser la création des djvu fichiers. Nous pourrions mettre en place cet atelier avec deux objectifs: non seulement de faire les djvu fichiers demandés par un contributeur, mais partout à la recherche de nouveaux livres (demandés ou non). Il n'est pas aussi rapide comme un robot, mais il peut augmenter le nombre de livres en format djvu disponibles pour les futurs contributeurs, en gardant à l'esprit l'idée de donner le meilleur djvu fichier que nous le pouvons.
    En bref, c'est ce que j'ai dit et ce que j'ai compris des autres. N'hésitez pas à me faire toutes les remarques que vous souhaitez. Quoi qu'il en soit, je pense que nous pouvons arriver à la meilleure solution (même, peut-être, en utilisant les téléchargeurs massifs que vous utilisez actuellement). Amicalement,