Désolé, je suis parti en vacances, et je viens donc après la bataille. Juste pour y aller de mon petit commentaire : en fait, le problème ne consiste pas tellement en la conversion en DjVu, mais en tout le travail fait auparavant pour redresser, rogner, décoloriser, etc. les pages une à une. Malheureusement, les bibliothèques ne fournissent de plus en plus que des fichiers en couleurs ; mais pour nous qui utilisons le fac-similé non pas pour le donner directement à lire comme image, mais seulement pour en extraire la couche texte et la donner à la lecture comme texte, il vaut mieux que le fac-similé soit retravaillé pour faciliter la tâche des logiciels de reconnaissance de caractères, qui préfèrent le noir et blanc, les lignes bien horizontales, la suppression des accrocs et annotations dans les marges, etc.
On peut passer par des logiciels avec interface graphique (pas en ligne de commande).
Pour générer des DjVu à partir de fichiers PDF noir et blanc de bonne qualité et déjà océrisés, tout est très simple avec PDF 2 DjVu Converter ou WinPDF2DjVu (solution en deux-trois clics).
Pour générer à partir de plusieurs images ou de PDF en couleurs, le mieux pour le prétraitement est de passer par ScanTailor. En désactivant le rognage des marges et en gardant les paramètres par défaut pour les autres étapes, cela va très vite ; un travail soigné de rognage ou de redressement à la main, par contre, prend du temps. Le seul vrai problème dans ce cas est la couche texte : Tesseract ne se trouve pas avec une interface sympathique. Je me suis codé un algorithme en Python pour utiliser Tesseract, dans lequel il suffit de rentrer les emplacements des fichiers à traiter, mais je crains que cela ne suffise pas pour beaucoup de monde (il faut télécharger Python, un environnement pour Python et Tesseract). Heureusement, on a depuis quelque temps la possibilité de passer par Tesseract ou Google en mode édition.