Utilisateur:SyB~Anicium/Tutoriel DjVu/4

La bibliothèque libre.
Sauter à la navigation Sauter à la recherche

Objectif : être en mesure de téléverser dans Wikimedia Commons un fichier complet, unique, au format DjVu, intégrant à la fois les scans de qualité et une couche de texte (caché) !


Préparation : téléchargez puis installez DjVu Toy (disponible ici).

Note : ce logiciel n’a pas besoin d’installation, vous devez extraire les fichiers de l'archive zip dans un dossier accessible, que vous appellerez par exemple « DjvuToy » (je suis très imaginatif).
Préalable nécessaire : vous devez également installer un ancien logiciel Microsoft, que DjVu Toy mettra à profit pour la partie Reconnaissance optique des caractères. Suivez les instructions en anglais — mais rien de bien sorcier — fournies par cette page. Cette étape est cruciale pour permettre à Djvu Toy d’ajouter une couche de texte (souvent très convaincante !) au DjVu.


Réalisation : Enfin !

  1. Lancez DjvuToy en cliquant sur le fichier DjVuToy.exe
  2. Choisissez l’onglet « Maker » (repérable par son logo DjVu violet).
  3. Indiquez le dossier source ( « source folder or file » ) : en principe c’est le dossier « out » que ScanTailor a rempli précédemment. N’oubliez pas de cocher le format que vous avez utilisé : JPG, TIFF, etc.
  4. Dans le 3e champ, « Target Djvu file », vous pouvez modifier le nom du fichier qui va être produit. Dans un 1er temps « out.djvu » est parfait.
  5. Cochez OCR et sélectionnez French.
  6. Cliquez sur 4. Options pour changer quelques paramètres : par exemple, pour un résultat de haute qualité, choisissez une compression « lossless », Color Image à 100%, Content sur « Photo (1 layer) », tout en bas « Just Text layer » et « 1 ».
  7. Cliquez sur 5. Go ; cela vous laisse le temps de boire un thé, et à cette étape c’est plus que mérité !


À votre retour, le DjVu est prêt Sourire.

Vous pouvez à présent :

  • Vérifier la qualité du texte en utilisant l’onglet « Hidden Text » de DjvuToy → vous pouvez ainsi obtenir un fichier .txt contenant le texte caché
  • Lire le DjVu (et faire une recherche plein texte !) en utilisant un logiciel tel que DjvuLibre

Enfin, vous pouvez renommer le fichier en suivant les consignes, le charger sur Wikimedia Commons, et apporter la lumière de ce texte fondamental à tout Internet. Bravo ! Bravo !


Et si vous avez l’âme d’un(e) aventurier/ère, vous pouvez pousser plus loin l’apprentissage avec les étapes suivantes… Ou peaufiner les étapes, procéder à quelques tests de qualité avec DjVuToy, dont je n’ai présenté qu’une seule fonctionnalité mais qui permet de bricoler un DjVu de nombreuses manières, par exemple pour réparer un fichier incomplet : voir ci-dessous.

Étape BONUS — Réparer un fac-similé DjVu avec l’outil DjVuToy

En utilisant DjVuToy (téléchargé en début d’étape), vous pouvez réorganiser les pages sans avoir à retourner aux images brutes et sans perdre la couche texte :

  1. Cliquez sur l’onglet Editor
  2. Sélectionnez le fichier DjVu à réparer/réorganiser
  3. Cliquez sur Go…
  4. Un avertissement de sécurité peut survenir, ignorez-le.
  5. Dans la fenêtre Page Editor qui s’est ouverte, examinez les différentes actions possibles dans la barre supérieure (une info-bulle apparaît au passage de la souris) : Insert a file before current page pour insérer une page que vous aurez pris soin de transformer en DjVu ; plusieurs triangles vers le haut ou vers le bas permettent de déplacer les pages (et leur couche texte) à l’intérieur du fichier. Vous pouvez aussi procéder à des rotations, suppressions, etc.
  6. Une fois les déplacements/insertions/rotations/suppressions de pages effectuées, vous pouvez sélectionner Save as (petite disquette) pour éviter d’écraser le fichier original.