Utilisateur:Cunegonde1

La bibliothèque libre.
PrésentationContributionsBrouillonsBandeauxOutilsDiscussion


*Honny ſoit qui mal y penſe !
 (Edouard III d’Angleterre)
[modifier]

Un jour Cunégonde en ſe promenant auprès du Château, dans le petit bois qu’on appellait parc, vit entre des brouſſailles le Docteur Pangloſs qui donnait une leçon de phyſique expérimentale à la femme de chambre de ſa mère, petite brune très-jolie & très-docile. Comme Mademoiſelle Cunégonde avait beaucoup de diſpoſition pour les ſciences, elle obſerva, ſans ſoufler, les expériences réitérées dont elle fut témoin ; elle vit clairement la raiſon ſuffiſante du Docteur, les effets & les cauſes : & s’en retourna toute agitée, toute penſive, toute remplie du deſir d’être ſavante ; ſongeant qu’elle pourrait bien être la raiſon ſuffiſante du jeune Candide, qui pouvait auſſi être la ſienne. (Voltaire, Candide.)

Présentation[modifier]
Je contribue en français sur Wikisource depuis l'été 2015.
150 000+
voir statistiques du compte

Centres d’intérêt : Littérature, histoire, textes philosophiques et curiosa des XVIIIe, XIXe et début XXe siècles.

Contributions :

  • imports de fac-similés sur Commons ou WS avec préparation et réalisation d’OCR :
    • méthode pour imports en masse avec ordinateur sous linux :
  1. téléchargement du fichier pdf.
  2. si nécessaire rognage des marges avec briss ou mieux préparation des images de pages avec scantailor
  3. si nécessaire réalisation d'un OCR avec Tesseract en méthode rapide avec ocrmypdf en ligne de commande (utilisation de tous les cœurs ocrmypdf -j0 -l fra --force-ocr MonOriginal.pdf MonFichierAvecOcr.pdf (paramètre -j0 correspond à l'utilisation de tous les cœurs disponibles, ce qui est extrêmement rapide ; paramètre -l pour préciser la langue). Nota : si le livre comporte des s longs, j'utilise le langage Fraktur à la place de fra (frm fonctionne très mal).
  4. conversion du pdf en djvu avec pdf2djvu avec les paramètres suivants qui fonctionnent bien dans la majorité des cas : pdf2djvu -o FichierOutput.djvu -j0 --fg-colors=black --dpi=300 --lines FichierInput.pdf
  5. édition du fichier djvu avec djvutoxml de DjVuLibre pour faire une pré-correction de la couche texte (utile pour les livres avec s longs) et réinsertion du fichier xml modifié avec djvuxmlparser.
  • méthode pour imports soignés avec pré-correction sur Abby finereader 15 (avec ordinateur sous windows) :
  1. récupération des images dans leur meilleure qualité possible avec Gallica.py, quand le fichier provient de Gallica, sinon toujours privilégier la meilleure source possible dans un résolution égale ou supérieure à 300dpi. Sur Internet Archive récupérer les fichiers d'image jp2 plutôt que le pdf.
  2. préparation des images avec ScanTailor
  3. deuxième préparation des images et OCR avec Abbyy Finereader 15
  4. Pré-correction de l’OCR sur Finereader avant création du djvu.
  5. Export du fichier au format djvu, en s'assurant que l'option "plusieurs couches" soit sur "toujours désactivée", sans quoi il y a risque de décalage de la couche texte par rapport aux images de page.
  6. Test de l'absence de corruption du fichier djvu en exportant le fichier xml avec la commande djvutoxml MonFichier.djvu MonFichier.xml, si l'export du fichier xml s'interrompt, avec un message d'erreur, cela veut dire que le fichier djvu est corrompu et que les pages seront mélangées. Dans ce cas faire un export au format pdf depuis Finereader et convertir le pdf en djvu avec la méthode vue au point 4 ci-dessus (pdf2djvu).
  • création ou réparation de djvu si nécessaire, Imports de fac-similés sur Commons,
  • transcription, corrections et mise en page[1].


  1. Correction et mise en page hors ligne sur Sigil qui est très personnalisable et qui permet d'assister le processus de correction (scannilles, s longs etc.) et de mise en page grâce à des expressions régulières (regex).