Bonjour Cunégonde, je m'adresse à toi parce que tu m'avais aidé voici quelques mois avec un livre de Stendhal à uploader et OCRiser. Tu m'avais alors donné quelques conseils, et j'ai tenté d'en suivre au moins quelques-uns cette fois, mais le résultat n'est pas complètement au rendez-vous. L'idée était d'uploader ce livre à partir de la version Gallica, sur wikisource même et non sur commons vu la date d'édition. Le problème est aussi que je travaille en ce moment sur un ordi pro où je ne peux pas installer de programmes ou faire tourner du pythoon, me rendant dépendant des outils en ligne. Je me suis donc contenté du téléchargement pdf gallica de base, et l'ai fait passé par l'outil PDFtoDjVu. Le fichier DjVu obtenu était trois fois moins lourd que le PDF, je l'ai téléversé comme prévu. Ce n'est qu'après avoir commencé de construire l'index que j'ai réalisé qu'un bon tiers des pages avait sauté ! J'imagine que cela s'est produit à la création du DjVu et non plus tard.
Je viens donc à toi implorer de me sauver (ou plutôt ce pauvre livre) de ce mauvais pas. J'imagine qu'il faut reprendre depuis le départ, et que tes outils et ton savoir-faire te permettront d'éviter les écueils où j'ai sombré... Rien d'urgent, j'ai encore bien du travail sur d'autres volumes des OC de Péguy, sans compter Flaubert et les autres... J'ai quelques autres volumes sur Gallica ou IA dans ma liste pour plus tard, si tu pouvais aussi m'aider avec eux à un moment ou à un autre, dis-moi, je le ferais bien moi-même, mais j'ai un gros doute sur mes capacités en la matière. Dis-moi, je peux te faire une petite liste au cas où. Merci en tout cas infiniment si tu peux déjà m'aider à réparer le bazar que j'ai créé malgré moi sur ce livre-ci...