Discussion Livre:Fréchette - L'Art d'être une bonne mère, 1923.djvu

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Ajouter un sujet
La bibliothèque libre.
Dernier commentaire : il y a 14 jours par Nivopol dans le sujet Qualité du fac-similé

Qualité du fac-similé[modifier]

J’ai découvert {{dpagelist}}, mais pour un petit nombre de page il me semble encore très perfectible, alors pour la retrouver facilement, voici la page sur laquelle la discussion avait débuté : Discussion Page:Fréchette - L'Art d'être une bonne mère, 1923.djvu/161. Ajout de Nivopol (d) 9 mai 2024 à 19:09 (UTC)Répondre

@Lorelelily, @FreeCorp : je ne sais pas exactement pour quelle raison, mais le fichier importé sur Commons est très dégradé par rapport au pdf proposé sur le site de la BAnQ. Peut-être les paramètres de la conversion en DjVu l’ont surcompressé ? Ou la BAnQ a mis une meilleure version en ligne ?

Par pitié, arrêtons de nous crever les yeux sur cette version, je vais voir demain si je peux téléverser une meilleure copie. Nivopol (d) 7 mai 2024 à 22:32 (UTC)Répondre

Et la réponse n’est pas si évidente. Enfin, si, avoir une meilleurs copie, lisible, c’est évident. Laquelle est la plus adaptée à téléverser sur Commons ça l’est moins. J’avais eu moins de soucis pour mes premières conversions en DjVu, mais là, je ne sais pas à quelle caractéristique du PDF ça tient, c’est difficile de maintenir une petite taille sans dégradation de la qualité visible. Les DjVu faits naïvement qui sont vraiment du niveau du PDF original sont plus gros.
Pour donner les détails aux lecteurs, le PDF originel semble avoir des images JPEG à 150 dpi, et d’environ 750×1030 pixels, pour un total de 11,6 Mio (~12,2 Mo), et le fichier final 13,0 Mio. Et il est lisible.
Le DjVu disponible fait 7,1 Mio et présente une dégradation vraiment particulière : il y a un gros effet « collage » ou « aplat de peinture », faute de meilleure description, qui semble indiquer qu’il a été converti avec un logiciel tirant parti d’un découpage avant-plan/arrière-plan, bref, vu les explications et les exemples sur Aide:Créer un fichier DjVu/Linux, probablement Didjvu, ça ressemble. Je n’ai pas pu l’essayer, arriver à le faire tourner sur un système actuel est une épreuve en soi. Il y a aussi un effet plus étrange de perte du contraste (voir d’inversion !) qui se produit sur le côté intérieur des pages, et qui est le vrai souci supplémentaire qui en rend certaines totalement illisibles. En tout état de cause, le contraste des images initiales a peut-être été trop faible pour une séparation correcte de l’avant-plan à la conversion.
J’ai tenté essentiellement du Pdf2djvu (et un peu de conversion image par image avec C44) pour voir. Et j’ai joué sur les paramètres dpi (par défaut 300), qualité d’encodage de C44 (bg-slices, par défaut 72+11+10+10, soit 103 pour simplifier) et échantillonnage de l’arrière-plan (bg-subsample, par défaut 3 sur une échelle de 1 au mieux à 12 au pire).
Une conversion en DjVu à 150 dpi sans se poser d’autre question descend à 2,8 Mio pour un fichier dégradé à la limite de l’illisible (mais pas de la même dégradation que celui qui est déjà là).
La conversion par défaut est assez lisible pour 8,7 Mio, mais quand même suffisamment plus floue que l’original pour que ça ne soit pas très satisfaisant. Nivopol (d) 8 mai 2024 à 15:26 (UTC)Répondre
Bon, je pense que je vais aller aussi parler de ça de manière plus générale un jour (quels formats de fichier et comment les produire), mais a priori, j’ai arrêté un choix, alors expliquons un minimum le raisonnement ici.
Techniquement, passer par une extraction de chaque image puis une compression et enfin la recomposition du DjVu devrait donner les meilleurs résultats, mais comme on part d’image déjà bien compressées dans le PDF, je ne suis pas certain que ça aurait beaucoup amélioré le résultat pour ce cas.
Notons tout d’abord que le DjVu disponible de 2019 contient quelques pages de moins, sa taille n’est donc pas immédiatement comparable. Pour mes essais, je n’ai pas édité chaque fichier pour les retirer, je ne le fais que sur celui que je téléverse.
Comme je disais au-dessus, j’ai fait mon étude sur Pdf2djvu. En gros, à partir du PDF original, j’ai fait un script pour produire toutes les combinaisons possibles avec :
  • dpi de 150, 300, 450 ou 600 (ça paraît étrange partant d’un PDF à 150, mais « sur-résoudre » donne un bon résultat, en terme de compromis taille-qualité),
  • bg-subsample de 1, 2 ou 3,
  • bg-slice de 70, 80, 90, 103, ou 120 (sans utiliser le système de niveaux multiples, la qualité finales semble dépendre du total de toute façon).
Là dessus, j’ai sélectionné les fichiers qui étaient correctement lisibles et plus légers que le PDF original, ce qui me donne une vingtaine de combinaisons, de la (450, 1, 70) qui fait 4,5 Mio à la (600, 2, 90) qui fait 10,8 Mio.
Même les meilleures de ce lot n’atteignent pas le piqué du PDF original, à ma vue ça réclamerait de monter au moins vers les versions qui font plus de 17 Mio.
Dans la sous-sélection, en me fondant sur les détails de lettres floues des premières pages, à mon écran et au zoom, j’ai pris comme compromis le fichier (450, 1, 80) de 7,9 Mio, qui me semble reproduire les traits les plus fins mal scannés du PDF et ne pas montrer de dégradation visible par rapport à ses compères plus lourds.
J’en ai donc refait un exemplaire en changeant le paramètre bg-slices à 60+10+10, pour tirer profit du système de chargement progressif des DjVu. Effectivement je ne vois pas la différence avec l’exemplaire à 80 de base une fois chargé. Très exactement : 
pdf2djvu -j0 -d 450 --bg-subsample=1 --bg-slices=60+10+10 -o Frechette_art_une_bonne_mere_exportb1-d450-60-10-10.djvu 5018260_frechette.pdf
Et j’ai retiré les mêmes pages de couverture et de la bibliothèque (les 6 premières et les 3 dernières) pour refaire un fichier équivalent à celui sur Commons, qui est maintenant à 7,8 Mio, c’est à peine plus que le précédent donc.
En pratique, j’ai considéré que l’aide disponible semble demander de privilégier des fichiers lisibles aussi léger que possible, ce qui est logique, d’où mon compromis. Et qu’en cas d’erreur, il valait mieux avoir téléverser pour rien un petit fichier pour en remettre un plus gros ensuite que le contraire. Nivopol (d) 9 mai 2024 à 14:10 (UTC)Répondre

Corrections[modifier]

Les informations relatives aux pages (numéro, libellé) correspondent à ceux de la balise <pagelist/> provenant de l’index.
La liste des corrections est dressée à partir des modèles {{corr}} utilisés.

Page 151 :Correction  : « raisonnée » → « raisonné » (coquille)