Aide:Publier un livre

La bibliothèque libre.
Aller à : navigation, rechercher

Vous êtes ici : accueil >Aide >Publier un livre


Aide : Manuel de Wikisource

Le texte est-il publiable ?[modifier]

Explications détaillées : Qu’est-ce que Wikisource ? et Droit d’auteur

Si le texte n’a pas été publié ailleurs sur papier, si l’auteur est toujours vivant, s’il s’agit d’un texte trouvé sur un blog ou un autre site sans informations sur sa licence d’utilisation, ou encore s’il s’agit d’un texte que vous avez écrit vous-même et que vous souhaitez diffuser, ce texte n’est très probablement pas publiable sur Wikisource et sera supprimé.

Si, en revanche, le texte a déjà été publié, que son auteur (et son éventuel traducteur) est mort il y a plus de 70 ans (ou une autre durée pour les auteurs francophones non français), si vous êtes l’ayant-droit et en autorisez la publication sous licence libre (voyez Autorisation de publication), alors le texte est vraisemblablement publiable, et le processus d’édition peut commencer.

Quelle édition du texte veux-je publier ?[modifier]


Présenter des informations sur un texte, voir : Qualité des textes et {{Infoédit}}

Pour commencer l’édition d’un texte dans Wikisource, le nom de l’auteur et de l’œuvre sont bien sûr indispensables, mais ils ne sont pas suffisants pour savoir ce que vous allez publier. Il existe généralement de nombreuses éditions d’une même œuvre, et le texte peut ne pas être le même d’une édition à l’autre, soit parce que l’auteur a remanié son texte, soit pour diverses raisons éditoriales.

Il est donc conseillé de se renseigner sur l’histoire du texte, afin de pouvoir en faire l’édition en connaissance de cause : s’agira-t-il d’une édition originale, d’une édition relue et corrigée par l’auteur, d’une édition éventuellement définitive, d’un article repris en recueil, d’une édition censurée, etc. ? Les cas sont très nombreux et un texte n’est pas nécessairement une entité immuable.

Ces questions montrent l’importance de disposer de fac-similés qui sont des repères objectifs pour comparer les éditions d’un texte et choisir celle qui vous intéresse. Votre choix de l’édition peut dépendre de plusieurs facteurs : souhait de publier le texte original, ou de publier le texte au sein d’une édition des œuvres complètes, ou de publier une version particulière d’un texte ou une version complète non censurée, etc. De plus, si Wikisource a vocation à éditer toute édition d’un texte, rien n’interdit à un contributeur de délaisser des éditions jugées fautives.

En fin de compte, quels que soient les facteurs déterminant votre choix, l’important est d’avoir une idée précise de l’édition à publier, car sans cela vous ne savez pas ce que vous allez éditer. En outre, cette identification d’une édition facilite la recherche d’un fac-similé. Une édition bien identifiée sur Wikisource comportera donc au moins deux éléments :

  • un texte correspondant à une certaine édition ;
  • un fac-similé de cette édition permettant de vérifier le texte.

Remarque: À défaut de fac-similé, il reste possible de publier un texte seul. Mais, quoi qu’il en soit, il est indispensable de donner les informations bibliographiques suivantes : Titre de l’œuvre, nom de l’auteur, éditeur, date et lieu de l’édition.

Exemples[modifier]

Des explications détaillées comme celles données ci-dessus sont nécessaires pour être conscient, avant de publier un livre, des problèmes qui vont peut-être se poser, mais bien souvent les choses restent assez simples. Exemples :

Acquérir et importer un fac-similé[modifier]


Voir : Gallica, Ressources libres de droit

L’édition précise du texte étant déterminée, vous savez maintenant ce que vous voulez publier ; reste à savoir comment acquérir le texte et le bon fac-similé pour l’éditer. Deux types de sources sont possibles, pour les fac-similés comme pour les textes : Internet ou vous-mêmes. Avant de fournir un travail qui se révélerait ensuite inutile, mieux vaut d’abord chercher sur Internet.

Nous allons nous occuper surtout de la recherche et de l’importation d’un fac-similé, car, dans de très nombreux cas, le texte n’aura pas été édité ailleurs sur une autre bibliothèque numérique. Le fac-similé pourvu d’une couche texte et converti au format DjVu suffira donc à l’édition. Mais nous verrons par la suite comment importer un texte déjà édité par une autre bibliothèque numérique.

Bibliothèques numériques[modifier]

La méthode la plus simple et la plus rapide est d’effectuer des recherches dans plusieurs bibliothèques numériques. Trois gros sites proposent des fichiers téléchargeables qui se comptent en millions :

Ressources disponibles[modifier]

Gallica et Google Livres fournissent des pdf qu’il faudra convertir en DjVu. Internet Archive fournit des DjVu, et propose parfois les fichiers de Google Livres dans ce format.

Certains livres numérisés par Google ne sont accessibles que par un proxy, d’autres sont republiés par HathiTrust et peuvent être récupérés image par image à l’aide d’un script (voir HathiTrust).

Si ces trois sites sont importants par la quantité de fac-similés proposés, il ne faut pas négliger des sites moins fournis et spécialisés qui proposent parfois des ressources de qualité. Quelques-uns de ces sites sont mentionnés dans la page de ressources.

Choix et qualité des fac-similés[modifier]

L’Internet Archive propose des fac-similés de très bonne qualité, en couleurs, mais dans certains cas la conversion au format DjVu dégrade très fortement les images d’origine. Il reste que, dans l’ensemble, les livres de ce site sont très bien faits et directement importables à l’aide d’un outil dédié.

Gallica propose des fac-similés de très bonne qualité, en couleurs, que l’on peut récupérer avec gallica.ml. Les fac-similés en noir et blanc sont également de bonne qualité quand ils sont nets, propres et bien taillés, mais il arrive souvent que les images présentent de grandes marges et de nombreux parasites. Gallica ne propose en outre que des fichiers pdf ou jpg qu’il faut convertir.

Google se soucie très peu de la qualité des fac-similés proposés. Des images manquent souvent et il n’est pas rare d’avoir le fac-similé des doigts des employés. Les fichiers pdf sont difficiles à manipuler et sont marqués d’un logo « Google » sur toutes les pages. Ils contiennent néanmoins une OCR souvent très bonne.

En résumé, on aura intérêt à se tourner d’abord vers l’Internet Archive pour voir s’il existe déjà un fichier DjVu d’un livre ; sinon, on pourra récupérer un pdf ou des images sur Gallica. En dernier recours, on pourra essayer Google Livres, en vérifiant que le livre souhaité est bien complet et les pages lisibles. Si le fichier de Google Livres est de mauvaise qualité, on peut essayer de trouver le même dans HathiTrust.

Utilisation d’une couche texte[modifier]

L’OCR contenue dans le fichier est automatiquement extraite dans la boîte d’édition pour y être relue et corrigée.
Voir Demander une OCR

Une OCR (en anglais optical character recognition) est une reconnaissance optique de caractères (ROC). C’est une traduction d’images de textes en fichiers de texte. Cette traduction n’est jamais parfaite et elle doit être relue et corrigée par un être humain pour obtenir un texte bien édité.

Le texte reconnu peut être ajouté sous les images d’un fac-similé (on parle alors de couche texte), afin d’avoir en un seul fichier des images et un texte correspondant que l’on importe ensuite sur Commons.

Une OCR peut vous faire gagner beaucoup de temps : comme le montre l’image ci-contre, l’OCR sera extraite dans l’espace de relecture de Wikisource, d’où l’intérêt d’importer un fichier toujours avec une couche texte. On verra plus loin que la présence de cette couche texte permet aussi d’importer des textes déjà corrigés, ce qui fait gagner encore plus de temps.

Sites fournissant des OCR[modifier]

Les fichiers de l’Internet Archive et de Google Livres contiennent déjà une OCR, et c’est le cas aussi, très souvent (mais pas toujours), pour les fichiers de Gallica. Quand on importe un fichier de l’Internet Archive, on a donc toujours une couche texte, et quand on l’importe de Gallica ou Google, il suffit de faire attention à conserver cette couche texte en convertissant les fichiers au format DjVu.

Numériser soi-même un livre[modifier]

Une dernière possibilité est de numériser soi-même le livre voulu, en suivant les étapes suivantes :

Conversion au format DjVu[modifier]

Aide détaillée : Créer un fichier DjVu

Wikisource utilise un format d’image appelé DjVu. Ce format permet de se servir d’un seul fichier peu volumineux pour toutes les images des pages d’un livre.

Une fois que vous possédez un fichier fac-similés (pdf, tif), il faut le rendre utilisable pour Wikisource, avant de l’importer, c’est-à-dire qu’il faut convertir le fichier d’origine en fichier au format DjVu.

C’est sans doute l’une des parties les plus difficiles à réaliser dans l’édition d’un livre pour un débutant. Si vous ne savez pas comment créer un fichier DjVu, ou si vous avez des difficultés à le faire, vous pouvez faire une demande ici :

Importer un fichier[modifier]

Voir l’assistant de versement de Wikimedia Commons et Conventions de nommages des œuvres pour le choix du nom de votre fichier

Quand vous avez votre fichier DjVu, il vous faut le rendre disponible pour l’édition. Les fichiers DjVu sont généralement importés sur le site Commons, site qui permet de rendre des fichiers multimédias accessibles depuis tous les projets Wikimedia.

Pour cette importation, vous devez tout d’abord disposer d’un compte. Une fois enregistré, vous devez suivre le lien importer le fichier et donner toutes les informations nécessaires.

En utilisant le modèle Book sur Commons, vous faciliterez l’étape de création de la page d’index sur Wikisource. - vous pouvez copier le modèle ci-dessous… les données indiquées entre parenthèses sont à renseigner en fonction des indications, les données entrées normalement sont à laisser telles-quelles (en particulier le champ "Wikisource" qui crée le lien vers Wikisource (et l'icône Wikisource permettant l'accès direct).

{{Book
|Author={{Creator:(Prénom Nom)}}
|Translator=
|Editor=(Editeur scientifique ou intellectuel, le cas échéant)
|Illustrator=
|Title=(Titre du livre)
|Subtitle=
|Series title=
|Volume=(le cas échéant)
|Edition=(n° d'édition)
|Publisher=(Maison d’édition)
|Printer=
|Date=(Année d’édition)
|City=Paris (ou Ville d'édition si différente)
|Language= {{language|fr}}
|Description=(obligatoire - description du document)
|Source=(lien vers le FS d'origine - si Gallica {{ARK-BNF|+ark du livre sur Gallica}})
|Permission=
|Image=
|Image page=(Numéro de la page de "couverture")
|Pageoverview=(Nb de pages du livre)
|Wikisource=:s:fr:Livre:{{PAGENAME}}
|Homecat=
|Other_versions=
|ISBN=
|LCCN=
|OCLC=
}}

Télécharger sur Commons directement depuis Internet Archive[modifier]

Vous pouvez aussi essayer l’outil ia-upload qui permet d’importer directement un djvu depuis Internet Archive sur Commons, sans passer par votre ordinateur, et de renseigner directement le modèle "Book".

Exemple : Vous voulez importer le fichier DjVu de Cinq semaines en ballon qui est accessible à l’adresse suivante : http://archive.org/details/cinqsemainesenba00vernuoft. Dans le champ « Id of the file in Internet Archive: » de l’outil d’import vous mettrez « cinqsemainesenba00vernuoft » et dans « File name on Commons » vous indiquerez comment nommer le fichier en suivant les conventions de nommages des œuvres. Cliquez ensuite sur le bouton bleu « Get metadata » et complétez et corrigez les données de la description. Cela étant fait, lancez l’import en cliquant sur le bouton bleu « upload » en bas de la page.

Prenez garde toutefois au problème des premières pages (Google et Gallica) qui doivent avoir été retirée du scan avant l'import sur Internet Archive, car elles ne doivent pas figurer sur Commons.

Cet outil a déjà été testé, mais pour tout problème de fonctionnement, contacter Tpt (d · c).

Comment utiliser un fac-similé dans Wikisource ?[modifier]

Vous avez maintenant importé un fac-similé avec une OCR, il vous reste, avant de passer à la relecture, à organiser l’édition, ce qui se fait dans les espaces « Livre » et « Page ».

Créer l’index d’un fichier[modifier]

Aide détaillée : Espace « Livre »
L’espace « Livre » annoté (cliquer pour agrandir)

Quand le fichier DjVu est sur Commons, il peut être consulté à partir de tous les projets de Wikimedia. On accède au fichier par un lien du type :

Fichier:Lewis Caroll - Alice au pays des merveilles, traduction Henri Bué.djvu

Pour l’édition sur Wikisource, un index des pages du fichier devra correspondre à chaque fichier image de livre de la manière suivante :

Au fichier sur Commons : Fichier:Lewis Caroll - Alice au pays des merveilles, traduction Henri Bué.djvu
correspond l’index dans Wikisource : Livre:Lewis Caroll - Alice au pays des merveilles, traduction Henri Bué.djvu

Un index est un tableau qui regroupe des liens vers toutes les pages d’un livre, comme l’illustration de droite le montre. Ainsi, lecteurs et contributeurs peuvent accéder à toutes les pages de ce livre à partir de ce seul index. Les pages des livres sont quant à elle rangées dans un autre espace appelé l’Espace « Page ».

Les pages d’index sont rangées dans l’espace Livre. Pour accéder à cet espace et créer un nouveau livre, on se rend, sur Wikisource, sur la page du fichier importé, et on clique sur le lien :

Lien vers la page d’index

On crée ensuite la page index en remplissant les champs « Titre », « Auteur », etc. La plupart de ces champs peuvent être remplis automatiquement avec les données du modèle {{Book}} rempli sur Commons, en activant un gadget : ce gadget se trouve dans la section Livre de l’onglet Gadgets dans vos préférences :

« Remplit les champs lors de la création d’un Livre: à partir des informations contenues dans le modèle Book de Commons. »

La partie la plus complexe de la création de l’index consiste à bien configurer la balise <pagelist /> dans la boîte page, afin d’obtenir l’affichage de la pagination réelle du livre. Ceci est expliqué dans Espace « Livre », mais la documentation reste à développer pour être compréhensible.

Utiliser l’espace page[modifier]

Aide détaillée : Espace « Page »
PageExemple1.JPG

Dans le tableau qui va servir d’index à l’édition, chaque numéro de page est un lien vers une nouvelle page composée de deux éléments : d’un côté le fac-similé de la page, situé à droite, de l’autre une boîte d’édition où placer le texte correspondant au fac-similé. Ce type de pages constitue un espace de Wikisource distinct d’autres espaces (Auteur pour les auteurs par exemple), et se nomme espace page. Concrètement, une page dans cet espace porte toujours un titre commençant par Page :, et c’est dans cet espace que les textes sont relus et corrigés.

Améliorer le texte avant de commencer la relecture[modifier]

Vous avez maintenant un livre éditable, avec une couche texte que vous pourrez relire dans l’espace « Page » où elle sera extraite automatiquement. Il est cependant possible d’améliorer encore un peu le texte à corriger et, selon les cas, de gagner beaucoup de temps.

Comment importer un texte déjà édité ailleurs ?[modifier]

Voir : Match et Split

Le cas le plus évident se présente lorsque le texte existe déjà dans une autre bibliothèque numérique, et qu’il a déjà été corrigé ou qu’il est au moins dans un état meilleur que celui de l’OCR.

Les œuves dans le domaine public peuvent être librement recopiées, et vous trouverez dans la page Ressources libres de droit une liste de sites publiant des textes. Une autre méthode, souvent efficace, consiste à utiliser un moteur de recherche avec une phrase simple mais caractéristique de votre livre.

Par politesse, dans tous les cas, pensez à mentionner en page de discussion la source du texte copié.

Si vous trouvez votre texte, au lieu de le recopier manuellement page par page dans Wikisource, vous allez pouvoir l’importer dans l’espace « Page » grâce à Match et Split.

Différentes méthodes d’utilisation d’une OCR[modifier]

Si vous ne trouvez pas le texte dans une autre bibliothèque numérique, et que vous ne disposez donc que de l’OCR de votre fichier, vous pouvez essayer d’appliquer à l’ensemble de cette OCR des corrections automatiques, au lieu de le faire page par page. Cette technique demande néanmoins de savoir bien identifier les corrections à faire et d’être bien certain que le résultat sera profitable.

Il est possible d’extraire une OCR sur une page à part avec un gadget qui ajoute un onglet « Extract text » dans l’espace « Livre ». On peut alors traiter tout le texte, par exemple la typographie et la suppression de certains éléments (comme les en-têtes), puis d’utiliser Match et Split.

Une autre astuce, si votre OCR est très mauvaise, est d’en récupérer une sur le site Google Livres (la qualité de ces OCR étant souvent très bonne), et de traiter le texte comme indiqué ci-dessus, pour ensuite le réimporter avec Match et Split ou le recopier page par page au fur et à mesure de la relecture.

Corriger et publier un texte[modifier]

Tout est maintenant en place pour commencer le travail d’édition. Trois étapes de ce travail : éditer, évaluer et publier.

Comment éditer ?[modifier]

L’édition et la mise en forme des textes et certaines conventions sont expliquées dans les pages données en liens ci-dessous. On peut conseiller de lire au moins une fois ces pages en entier, puis, au cours de la relecture d’un livre, de se servir de leur table des matières pour trouver des explications sur tel ou tel point.

Évaluer vos contributions[modifier]

Voir Qualité des pages et Qualité des textes

Au cours de votre travail d’édition, il est important de conserver les traces de vos corrections, ce qui se fait à l’aide des boutons situés sous la boîte d’édition :

Page validée

Si vous débutez l’édition sur Wikisource, et que vous n’êtes pas encore très certain de la qualité de vos relectures, vous pouvez ne pas utiliser ces boutons pour le moment, en attendant d’avoir un peu plus d’expérience : cela ne vous empêche pas de sauvegarder votre travail.

Comment publier le texte corrigé ?[modifier]

Voir les explications détaillées : Transclusion

Le texte à corriger se trouve dans l’espace « Page », découpé selon le découpage physique du fichier, c’est-à-dire présenté en vis-à-vis de chaque image. Pour reconstituer la division logique du texte (par chapitre par exemple), on va inclure les pages de chaque chapitre dans de nouvelles pages destinées à contenir le texte de ces chapitres.

Exemple : L’index Livre:Verne - Cinq Semaines en ballon.djvu affiche la liste des pages du livre. L’œuvre elle-même est divisée en 44 chapitres. Chaque chapitre aura sa propre page, dans laquelle le texte des pages correspondantes de l’index s’affichera. Ainsi, le Chapitre I va de la page 5 du fichier (et non de l’œuvre) à la page 11. Dans « Cinq Semaines en ballon/Chapitre 1 », on affichera le texte contenu dans ces pages avec le code suivant :

<pages index="Verne - Cinq Semaines en ballon.djvu" from=5 to=11 />

et pour afficher automatiquement un navigateur :

<pages index="Verne - Cinq Semaines en ballon.djvu" from=5 to=11 header=1 />

Enfin, la page Cinq Semaines en ballon contiendra la liste des chapitres.

Créer une table des matières[modifier]

Une façon de commencer la création des chapitres est de débuter par la table des matières. Il y a deux cas possibles. Le livre comporte une table des matières, et il est possible qu'elle s'étale sur plusieurs pages. Ou alors le livre n'en a pas. Si le livre comporte une table des matières on peut commencer par la mettre en forme avec des hyperliens vers les futurs chapitres. Cela constitue une structure de départ qui peut être ensuite utiliser pour créer les chapitres. Ensuite on pourra créer un lien vers cette page ou ces pages de table des matières créées dans la boite Sommaire de l'index. Si le document ne comporte pas de table des matières, on peut en créer une directement dans la boite Sommaire de l'index, avec les hyperliens vers les futurs chapitres.

Diffuser un livre[modifier]

Visibilité des textes[modifier]

Un livre doit être accessible à partir d’une page « Auteur », il doit contenir autant de catégories pertinentes que possible (date, genre notamment) et il peut être ajouté à l’un des portails thématiques de Wikisource.

Lorsqu’un livre est corrigé, vous pouvez l’ajouter dans {{Nouveautés}} afin de le rendre accessible par la page d’accueil.

Format epub[modifier]

L’exportation au format epub est en développement (Wsexport), mais, après relecture et vérification de la qualité de l’export, vous pouvez ajouter la catégorie Bon pour export dans la première page d’un texte.

Récapitulatif des pages d’aide par étape[modifier]

Étapes Pages d’aide
Scanner ou télécharger un livre complet Comment numériser et Ressources libres de droit
Convertir le résultat au format DjVu Créer un fichier DjVu
Si possible, ajouter une couche texte d’OCR au fichier s’il n’en possède pas. Demander une OCR
Importer votre fichier sur le site Wikimedia Commons, dans la catégorie DjVu files in French Importer un fichier, Commons:Up! pour les fichiers de plus de 100 Mo, ia-upload pour les DjVu de l’Internet Archive.
Créer une page d’index Page d’index
Créer les chapitres, une option étant de commencer par la création de la Table des Matières Transclusion
Importer le texte s’il est disponible Match et Split
Corriger et valider le texte dans l’espace page Éditer un texte dans l’espace « Page »
Publier le texte dans l’espace principal, en effectuant une transclusion. Transclusion
Si possible, vérifier que le texte s’exporte bien au format epub (expérimental) Wsexport, Bon pour export et outil d’exportation.

Demander de l’aide[modifier]

Certaines de ces étapes ne sont pas très simples, vous pouvez donc demander de l’aide, par exemple en passant par Wikisource:Questions ; vous pouvez également demander à être parrainé en ajoutant {{Utilisateur Parrainez-moi}} dans votre page utilisateur.