Aide:Créer un fichier DjVu
Aide
Publier un livre
Créer un fichier DjVu
| En résumé : Cette page explique comment créer un fichier au format DjVu, format utilisable dans l’espace page, et qui permet de réduire la taille et le nombre des fichiers à copier (voir un exemple).
Si vous rencontrez des difficultés, vous pouvez demander de l’aide sur le scriptorium ou demander l’importation d’un livre. Liste des fichiers DjVu disponibles : DjVu en français sur Commons. |
Sommaire |
En bref [modifier]
| Vous avez un fichier PDF et vous voulez rapidement le convertir en DjVu : |
- Sous Windows, téléchargez et installez pdf2djvu GUI (freeware basé sur pdf2djvu) ; sous Linux, utilisez pdf2djvu en ligne de commande.
- ou déposez le fichier PDF sur http://www.archive.org ; ce site crée automatiquement un fichier djvu. Pas-à-pas : voir mode d'emploi détaillé..
Présentation [modifier]
- Voir l’article DjVu sur Wikipédia.
DjVu (prononcé « déjà-vu ») est un format de fichier libre destiné à l’archivage de documents numériques.
Intérêts :
- tous les fac-similés d’un livre sont disponibles en un seul fichier ;
- tous les fac-similés sont consultables à partir de la page du fichier DjVu ;
- les fac-similés sont utilisables dans l’espace page ;
- la taille du fichier DjVu est très petite ;
Défauts :
- la numérotation des fac-similés n’est pas configurable.
- Perte de qualité variable.
- Conversion complexe à configurer.
- Documentation obscure ou inexistante.
Conversion d’images en DjVu [modifier]
À partir de fac-similés au format jpg, pdf, tif, etc., obtenus sur Internet ou scannés, comment créer un fichier au format DjVu :
À partir de votre ordinateur [modifier]
- Créer un fichier DjVu sous Windows
- Créer un fichier DjVu sous GNU/Linux
- Créer un fichier DjVu sous MacOS : pour le moment, le plus simple est de passer par la "conversion en ligne" (voir section suivante)
Conversion en ligne [modifier]
Lorsque vous avez des images ou des fichiers à convertir, il n’est pas nécessaire de posséder un logiciel de conversion. Vous pouvez utiliser :
- Convertir en DjVu avec Internet Archive : Aide pour obtenir un DjVu en indiquant à l’OCR que le texte est en français.
- Créer un compte[1] et/ou Se connecter.
- Création de la page d’identification du fichier sur Internet Archive :
- Cliquer sur Upload
- Mettre le curseur de la souris sur Share, puis choisir not use flash.
- Remplir le formulaire d’informations sur le fichier (en utilisant pour titre le nom du fichier - sans pdf), puis Share my file(s). Patientez.
- Une barre de progression apparait. Patientez.
- Cliquer sur le lien qui apparait. Patientez encore.
- Importation du fichier :
- Une fois sur la page "Internet Archive Item Editing Tool" - cliquer sur le bouton "Share"
- Sélectionner votre fichier. Patientez pendant le téléversement.
- Une fois l’importation terminée « Complete » Cliquer sur Update item, puis cliquer sur le lien qui apparait.
- Remplissage de la fiche de catalogage et réglage des paramètres :
- Cliquer sur Submit text.
- Compléter le formulaire avec :
- le titre (réel, pas le nom du fichier),
- le lien du fichier d’origine (Google, Gallica, etc.) en zone de note - impératif pour pouvoir compléter ensuite l’import sur WS) : syntaxe html standard
ex : <a href="http://gallica.bnf.fr/ark:/12148/btv1b86263193">http://gallica.bnf.fr/ark:/12148/btv1b86263193</a>
- l’éditeur,
- la date de publication du livre, etc. - plus vous mettez d’informations, plus il sera facile d’identifier le livre…
- au champ language, écrire French (ou fre) - c’est ce qui va permettre une bonne reconnaissance optique du texte.
- en cas de besoin, créer de nouveaux champs (bouton "Add another field" en bas d’écran, par exemple pour un 2e auteur)
- cliquer sur Submit
- Un message s’affiche, « "nom du fichier" queued for operation ». - « Succesfull » avec plusieurs liens,
- "history" permet de suivre les modifications du fichier
- le dernier lien permet de revenir sur la page principale du fichier, renseignée avec les éléments que vous venez d’ajouter - ne pas chercher à modifier la page principale page tant que la dérivation n’est pas terminée
- le fichier apparaît dans la liste [2] avec votre email surligné en jaune…
- il ne reste plus qu’à attendre que la dérivation se termine (cela peut prendre plusieurs heures, selon la taille du fichier)
- quand le fichier disparaît de la liste, vous pouvez retourner sur la page principale du fichier
- Récupération du fichier djvu :
- Pour récupérer le fichier DjVu : cliquer sur All Files:HTTP, ensuite télécharger le fichier qui se termine par .djvu.
- pour le nommer, respecter les conventions de nommage
- Internet Archive - Nouvelle interface d’upload
- Depuis peu, Internet Archive a installé un nouvel utilitaire pour télécharger les fichiers, beaucoup plus simple… mais il est important de ne rien oublier :
- Adresse : http://archive.org/upload/
- Sélectionner sur votre ordinateur le fichier à importer (comme sur Commons) - Attention, il est important de choisir un nom court, sans blancs, sans caractères accentués, et ne risquant pas de déjà exister…
- renseigner ensuite soigneusement la description (en indiquant le site et le lien d’où vient le fichier s’il a été récupéré en ligne)
- mettre un ou deux "tags" en anglais sur la thématique du livre
- indiquer l’auteur sous la forme nom, prénom, date de naissance-date de mort (dans la mesure du possible)
- sélectionner la collection "Community texts" si ça n’est pas déjà fait
- sélectionner la langue "French" et la licence "Public domain" (très important pour l’OCR)
- add additional metadata taper "date" et mettre en valeur l’année d’édition, plus éventuellement "publisher" et le nom de l’éditeur
- cliquer sur "Upload"
- c’est fait… il ne reste plus qu’à attendre que tous les fichiers soient dérivés pour pouvoir éditer les métadonnées (et mettre un titre "lisible") et récupérer le fichier djvu…
- pour suivre l’avancement du fichier : liste des fichiers en cours de traitement votre email est surligné en jaune
- http://www.us.archive.org/catalog.php?history=1&identifier=HugoBugJargal1876BNF : il suffit de remplacer l’identifiant par celui de votre fichier pour savoir où vous en êtes…
-
- Avantage de ce système : si vous avez un PDF sans OCR, Internet Archive fera l’OCR pour vous (généralement de bonne qualité), à condition de bien préciser la langue.
- Inconvénient : s’il y en avait un, vous perdez l’OCR d’origine…
- Any2DjVu : fournit un service en ligne de conversion au format DjVu. Il est possible de récupérer l’adresse ftp d’un fichier pdf de Gallica et de l’entrer directement dans Any2DjVu Server. Cependant, lorsque le fichier pdf a été obtenu sur Gallica, il est souvent préférable de commencer par retravailler les fac-similés, afin d’obtenir un meilleur cadrage dans l’espace page. Voir plus haut pour la procédure à suivre.
Trouver des fac-similés sur Internet [modifier]
Plusieurs sites offrent des fichiers d’images, aux formats pdf ou tif par exemple. C’est le cas de Gallica et de Google Livres. Pensez à conserver les informations exactes relatives à l’édition (éditeur, date d’édition, etc.) et à donner la source du fichier.
- Voir
-
- Ressources libres de droit : sites proposant des fac-similés.
- Créer un fichier DjVu à partir d’un pdf de Google Books
Cas des images au format JPEG 2000 [modifier]
L’Internet Archive fournit les scans bruts et retaillés qui servent à créer les fichiers djvu et pdf qui sont aussi téléchargeables sur ce site. Pour diverses raisons, on peut vouloir utiliser ces images (refaire l’OCR, images mal découpées), mais elles sont souvent au format JPEG 2000 (extension .jp2) qui est difficile à manipuler, notamment sous Gnu/Linux.
Sous Linux, on peut installer openjpeg-tools, qui permettra de convertir au format pnm toutes les images .jp2 d’un même dossier avec la commande j2k_to_image. Pour une seule image, on peut utiliser le visionneur d’images de Gnome et le définir par défaut pour ce type d’images. Ce visionneur est capable de convertir les images jp2 : faire « Image », puis « Enregistrer sous… », et choisir un format de sortie.
Sous Windows, l’utilitaire gratuit (mais non libre) Xnview contient un plugin pour ce format, ce qui permet de faire des conversions directes vers de nombreux autres formats.
Utilisation du format DjVu en mode page [modifier]
- Voir Importer un fichier
- Voir Espace « Page » et Espace « Livre » pour l’utilisation d’un djvu dans Wikisource
Une fois le fichier DjVu copié sur Commons ou Wikisource, il faut créer une page d’index, qui permet la navigation entre pages. Pour accéder à la page d’index d’un fichier Djvu, il suffit de cliquer sur Lien vers l’index., depuis la page Fichier:Le titre du livre.djvu, ou en anglais File:Le titre du livre.djvu.
Convention de nommage des fichiers djvu [modifier]
- Syntaxe des nommages, emploi des virgules et du tiret : voir Guide typographique.
Il est recommandé de nommer ainsi les fichiers djvu :
En cas d’éditions successives :
Exemple : [[Fichier:Hugo - Les Misérables, 1890, tome I.djvu]]
En résumé, les indications se mettent dans l’ordre suivant :
Ressources [modifier]
Conversion en ligne
Utilitaires de conversion
- pdf2djvu gui
- DjVu Solo
- DjVu Libre
Visualiseurs :
- WinDjView
- STDU Viewer
Liste de ressources sur dvju.org
Voir aussi [modifier]
- Importer un fichier
- iaUploadBot pour importer les DjVu de l’Internet Archive.
- Espace « Page »
- Espace « Livre »
- Comment numériser
- Demander l’importation d’un livre
- Insérer une image