Aller au contenu

Utilisateur:Seudo/Outils

La bibliothèque libre.
AntiquitéAvant les modernesLes modernesOutils

Wikisource de base

[modifier]

Fonctionnement de Wikisource

[modifier]

Modè/ules

[modifier]

Accès Wikidata

[modifier]

Scripts ou gadgets personnels

[modifier]

Wikidata

[modifier]

Wikisource:Projet Wikidata

Petcan :

SPARQL :

Maintenance de Wikisource

[modifier]
  • le script ../doublons.py cherche, dans un dump Wikisource, tous les cas où deux ou plusieurs pages de l’espace principal assurent la même transclusion d'un ouvrage. Le résultat est dans ../doublons

Modifications de masse

[modifier]
  • Voir ce message pour récupérer le code wiki d’un ensemble d’articles (par exemple les pages d'un livre), afin de les passer ensuite à un traitement de texte. Toutefois il y a plus simple (cf. Module:TestDG) : dans la console d’un module, lancer ceci :

Gallica

[modifier]
  • Récupérer des scans en haute définition (autres méthodes sur Wikisource:Gallica) :
    • d'après ce tutoriel, si l’URL d’un document est http://gallica.bnf.fr/ark:/12148/btv1b53084829z/, alors l'URL de la version en haute définition est http://gallica.bnf.fr/iiif/ark:/12148/btv1b53084829z/f1/full/full/0/native.jpg
    • pour une utilisation plus courante, installer le plugin iiif dans Firefox ou Chrome. Il rajoute une icône en haut à droite du navigateur, sur laquelle il suffit de cliquer pour récupérer la version en haute définition d'une page de Gallica affichée dans le navigateur ;
    • pour récupérer l’ensemble des pages en haute définition d'un livre, utiliser le programme Python Pyllica ; je ne l'ai pas encore essayé.
  • Wikisource:Gallica/gallica.py : suite à une discussion sur le Scriptorium, j'ai mis au point rapidement ce script Python qui permet de télécharger un livre de Gallica en haute définition.
Gallica2djvu
[modifier]

Idée de faire un script qui, pour un document Gallica (voire pour tout document disponible sur un serveur IIIF) :

  • récupère la couche texte de Gallica ;
  • récupère les images du document (comme le fait gallica.py ci-dessus) et les stocke en local ;
  • améliore ces images en les passant en noir et blanc (ou laisse l’utilisateur utiliser ScanTailor) ;
  • constitue un DjVu en incluant la couche texte.

En plus, une option pourrait être ajoutée pour passer Tesseract, si la couche texte est insuffisante.

Ressources :

Intelligence artificielle

[modifier]