Aide:Créer un fichier DjVu

La bibliothèque libre.
Aller à : navigation, rechercher

Vous êtes ici : accueil >Aide >Publier un livre >Créer un fichier DjVu


Aide : Manuel de Wikisource

En bref[modifier]


Présentation[modifier]

Voir l’article DjVu sur Wikipédia.

DjVu (prononcé « déjà-vu ») est un format de fichier libre destiné à l’archivage de documents numériques.

Intérêts :

  • tous les fac-similés d’un livre sont disponibles en un seul fichier ;
  • tous les fac-similés sont consultables à partir de la page du fichier DjVu ;
  • les fac-similés sont utilisables dans l’espace page ;
  • la taille du fichier DjVu est très petite ;

Défauts :

  • la numérotation des fac-similés n’est pas configurable.
  • Perte de qualité variable.
  • Conversion complexe à configurer.
  • Documentation obscure ou inexistante.

Conversion d’images en DjVu[modifier]

À partir de fac-similés au format jpg, pdf, tif, etc., obtenus sur Internet ou scannés, comment créer un fichier au format DjVu :

À partir de votre ordinateur[modifier]

Conversion en ligne[modifier]


Lorsque vous avez des images ou des fichiers à convertir, il n’est pas nécessaire de posséder un logiciel de conversion. Vous pouvez utiliser Convertir en DjVu avec Internet Archive :

  • Aide pour obtenir un DjVu en indiquant à l’OCR que le texte est en français. (nouvelle procédure depuis été 2013) :
  1. Créer un compte[1] et/ou Se connecter.
  2. Adresse : http://archive.org/upload/
  3. Sélectionner sur votre ordinateur le fichier à importer (comme sur Commons) - Attention, il est important de choisir un nom court, sans blancs, sans caractères accentués, et ne risquant pas de déjà exister…
  4. renseigner ensuite soigneusement la description (en indiquant le site et le lien d’où vient le fichier s’il a été récupéré en ligne)
  5. mettre un ou deux "tags" en anglais sur la thématique du livre
  6. indiquer l’auteur sous la forme nom, prénom, date de naissance-date de mort (dans la mesure du possible)
  7. sélectionner la collection "Community texts" si ça n’est pas déjà fait
  8. sélectionner la langue "French" et la licence "Public domain" (très important pour l’OCR)
  9. add additional metadata taper "date" et mettre en valeur l’année d’édition, plus éventuellement "publisher" et le nom de l’éditeur
  10. cliquer sur "Upload"
c’est fait… il ne reste plus qu’à attendre que tous les fichiers soient dérivés pour pouvoir éditer les métadonnées (et mettre un titre "lisible") et récupérer le fichier djvu…
pour suivre l’avancement du fichier : liste des fichiers en cours de traitement votre email est surligné en jaune
le fichier apparaît également dans la liste [2] avec votre email surligné en jaune…
http://www.us.archive.org/catalog.php?history=1&identifier=HugoBugJargal1876BNF : il suffit de remplacer l’identifiant par celui de votre fichier pour savoir où vous en êtes…
  • il ne reste plus qu’à attendre que la dérivation se termine (cela peut prendre plusieurs heures, selon la taille du fichier)
  • quand le fichier disparaît de la liste, vous pouvez retourner sur la page principale du fichier
  • Récupération du fichier djvu :
  • Pour récupérer le fichier DjVu : cliquer sur All Files:HTTP, ensuite télécharger le fichier qui se termine par .djvu, ou utiliser le torrent et un logiciel de téléchargement de torrent (si vous savez comment faire).
  • pour le nommer, respecter les conventions de nommage


  • Avantage de ce système : si vous avez un PDF sans OCR, Internet Archive fera l’OCR pour vous (généralement de bonne qualité), à condition de bien préciser la langue.
  • Inconvénient : s’il y en avait un, vous perdez l’OCR d’origine…


  • Any2DjVu : fournit un service en ligne de conversion au format DjVu. Il est possible de récupérer l’adresse ftp d’un fichier pdf de Gallica et de l’entrer directement dans Any2DjVu Server. Cependant, lorsque le fichier pdf a été obtenu sur Gallica, il est souvent préférable de commencer par retravailler les fac-similés, afin d’obtenir un meilleur cadrage dans l’espace page. Voir plus haut pour la procédure à suivre.

Trouver des fac-similés sur Internet[modifier]

Plusieurs sites offrent des fichiers d’images, aux formats pdf ou tif par exemple. C’est le cas de Gallica et de Google Livres. Pensez à conserver les informations exactes relatives à l’édition (éditeur, date d’édition, etc.) et à donner la source du fichier.

Voir

Cas des images au format JPEG 2000[modifier]

L’Internet Archive fournit les scans bruts et retaillés qui servent à créer les fichiers djvu et pdf qui sont aussi téléchargeables sur ce site. Pour diverses raisons, on peut vouloir utiliser ces images (refaire l’OCR, images mal découpées), mais elles sont souvent dans le format JPEG 2000 (extension .jp2) qui est difficile à manipuler[1].

Leur manipulation sous GNU/Linux[modifier]

Sous Linux, on peut utiliser ImageMagick, ou d'autres programmes.

Avec ImageMagick[modifier]

ImageMagick est un logiciel, en ligne de commande, de manipulation d'images dans pratiquement tous les formats existants[2].

Pour afficher l'image (ensuite, clic ou clic droit sur l'image pour accéder aux menus) :

display image.jp2

Pour convertir une image :

convert image.jp2 image.jpg

Pour convertir tout un dossier :

mogrify -format jpg *.jp2
Avec d'autres programmes[modifier]

On peut aussi installer openjpeg-tools, qui permettra de convertir au format pnm toutes les images .jp2 d’un même dossier avec la commande j2k_to_image.

j2k_to_image -ImgDir dossier-images-jp2/ -OutFor pnm

Gimp peut lire les images jp2 avec le plug-in JPEG 2000[3]. Le délai de conversion reste relativement long, cependant.

Enfin, pour une seule image et avec une interface graphique, on peut utiliser le visionneur d’images de Gnome (eog) et le définir par défaut pour ce type d’images. Ce visionneur est capable de convertir les images jp2 : faire « Image », puis « Enregistrer sous… », et choisir un format de sortie.


  1. Pour plus de choix, voir le recensement sur la Wikipedia anglophone w:en:JPEG_2000#Application_support.
  2. Voir, pour les commandes de base ubuntu-fr.
  3. Téléchargez-le, décompressez-le et copiez-le dans ~/.gimp-2.8/plug-ins/


Leur manipulation sous Windows[modifier]

Sous Windows, l’utilitaire gratuit (mais non libre) Xnview contient un plugin pour ce format, ce qui permet de faire des conversions directes vers de nombreux autres formats.

Utilisation du format DjVu en mode page[modifier]

Voir Importer un fichier
Voir Espace « Page » et Espace « Livre » pour l’utilisation d’un djvu dans Wikisource

Une fois le fichier DjVu copié sur Commons ou Wikisource, il faut créer une page d’index, qui permet la navigation entre pages. Pour accéder à la page d’index d’un fichier Djvu, il suffit de cliquer sur Lien vers l’index., depuis la page Fichier:Le titre du livre.djvu, ou en anglais File:Le titre du livre.djvu.

Convention de nommage des fichiers djvu[modifier]

Syntaxe des nommages, emploi des virgules et du tiret : voir Guide typographique.

Il est recommandé de nommer ainsi les fichiers djvu :

« Auteur - Titre.djvu » ou « Auteur - Titre, Tome.djvu »

En cas d’éditions successives :

« Auteur - Titre, date, tome.djvu »

Exemple : [[Fichier:Hugo - Les Misérables, 1890, tome I.djvu]]

En résumé, les indications se mettent dans l’ordre suivant :

ESPACE:AUTEUR - TITRE, ANNÉE, TOME.DJVU

Ressources[modifier]

Conversion en ligne

Utilitaires de conversion

Visualiseurs :

Liste de ressources sur dvju.org

Voir aussi[modifier]