Discussion utilisateur:SyB~Anicium/Tutoriel DjVu

Commentaires

Dernier commentaire : il y a 5 ans1 commentaire1 participant à la discussion

Merci pour ce tutoriel, qui m'a permis (après beaucoup d’efforts…) de parvenir pour la première fois à faire un traitement de fichier DjVu jusqu’au bout, avec traitement du contraste, réorientation, rognage des marges...

Deux points qui m’ont bloqué tout particulièrement (outre l'inévitable courbe d'apprentissage) concernent ScanTailor :

à l’étape "Définir les marges", il ne faut pas oublier de décocher l’option "Faire correspondre la taille avec les autres les pages" (sic) si on a un document dont toutes les pages n'ont pas la même taille (ex. si certaines ont été orientées en mode paysage), sans quoi il ne rogne pas vraiment les marges autour du texte (il se cale sur la page la plus grande et tend donc même à élargir les marges) ;
surtout (et à mon avis ce point mériterait d’être mieux précisé dans le tutoriel), lors de l’étape "Sortie" il faut absolument prendre l’option "Noir et blanc" pour les pages ne contenant que du texte : sinon on obtient un fichier DjVu énorme qui dépasse facilement la limite de 100 Mo sur Commons. Je parle d'un fichier de 160 pages environ, donc pas plus grand que ce qu'on traite habituellement dans Wikisource. Je suis ainsi passé d'un fichier de 200 méga-octets à seulement 11 méga-octets grâce à cette option…

Par ailleurs TTRPDFtoJPG plantait sur mon fichier PDF pris sur Gallica (tous les fichiers générés étaient vides sauf les 3 ou 4 premiers), ce que j'ai contourné en utilisant DjVuToy qui a une commande pour découper le PDF. Et comme l’OCR de DjVuToy ne produisait pas un résultat satisfaisant sur ce fichier, j'ai fait des manipulations spéciales assez complexes pour récupérer la couche texte du fichier d’origine et la transférer sur le nouveau fichier…

Bref, ce n’est pas de tout repos mais j’irai plus vite la prochaine fois. Seudo (d) 4 mai 2019 à 11:49 (UTC)Répondre