Sujet sur Discussion utilisateur:Stamlou

Denis Gagne52 (discussioncontributions)

Bonsoir, je suis curieux de savoir de quelle façon le fichier djvu a été obtenu. Il semble provenir du pdf car il possède les mêmes caractéristiques mais ne ressemble pas du tout à ceux que je produis.

Stamlou (discussioncontributions)

Bonsoir, j'ai travaillé le pdf avec le logiciel gscan2pdf sur linux. Toi quels logiciels utilises-tu? J'ai fait beaucoup de recherches avant d'arriver à cette solution.

Denis Gagne52 (discussioncontributions)

Je n’ai jamais utilisé linux. Je ne pourrai donc pas pousser plus loin mes recherches. Sous windows, pdf2djvu fonctionne bien. La seule difficulté est de choisir le DPI (habituellement on y va au double de celui du pdf). Ton djvu avec gscan2pdf indique 72 dpi ce qui correspond au pdf. Pour obtenir un résultat équivalent avec pdf2djvu, je dois exiger 200dpi et j’obtiens un fichier de la même taille que le tien. C’est ce qui m’intrigue. J’ai remarqué qu’il n’y avait pas d’OCR dans le fichier de Gallica. Tesseract n’est pas très compliqué à utiliser si jamais tu veux te lancer, n’hésite pas à me faire signe.

Stamlou (discussioncontributions)

Merci de ton offre. Il est possible d'utiliser la fonction Tesseract avec gscan2pdf. Mais quand j'ai essayé avec "Le oui..." l'affichage à l'écran était un peu bizarre. J'ai aussi essayé pdf2djvu, mais avec linux je suis seulement arrivée à le faire fonctionner avec les commandes du terminal. Vraiment pas évident. Je vais me coucher. Cette conversation m'intéresse, à demain. Bonne nuit.

Répondre à « Le oui et le non des femmes »