« Utilisateur:MarcBot » : différence entre les versions

La bibliothèque libre.
Contenu supprimé Contenu ajouté
Marc (discussion | contributions)
mAucun résumé des modifications
Marc (discussion | contributions)
Aucun résumé des modifications
Ligne 3 : Ligne 3 :


Tâches :
Tâches :
*Import de textes dans l'espace ''page'' ;
*Interwikis (je vérifie les modifications des liens, notamment quand le robot en supprime ; si erreur, me l'indiquer).
*Interwikis (je vérifie les modifications des liens, notamment quand le robot en supprime ; si erreur, me l'indiquer).
*Copier sur le serveur :
*Copier sur le serveur :
Ligne 17 : Ligne 18 :
*découper le texte : <nowiki>== Page: ==</nowiki>
*découper le texte : <nowiki>== Page: ==</nowiki>
*<nowiki>[[Page:Nom]]</nowiki> > <nowiki>{{Page|Nom de l'image}}</nowiki>
*<nowiki>[[Page:Nom]]</nowiki> > <nowiki>{{Page|Nom de l'image}}</nowiki>


Marche à suivre Images + OCR :
*Copier sur le serveur ;
*Créer pages ?
*OCRBot.


OCRBot, marche à suivre :
*[[:Catégorie:OCR requested]]
*Ligne os.system :
**os.system("C:\Progra~1\ScanSoft\OmniPage.exe "+filename+" > result.txt") : fait.
**autre ligne : fichier d'actions.
*automatiser la fin du processus.

Version du 9 mai 2007 à 21:30

Robot de Marc. Si le robot fait des erreurs, laisser un message sur ma page de discussion.


Tâches :

  • Import de textes dans l'espace page ;
  • Interwikis (je vérifie les modifications des liens, notamment quand le robot en supprime ; si erreur, me l'indiquer).
  • Copier sur le serveur :
    • Découper les images (Gallica) ;
    • (df) cd /cygdrive/c/pywikipedia
    • (avec PATH défini) for i in pages/*.jpg; do python upload.py -keep -noverify "$i" "commentaire"; done;


Marche à suivre pour l'import du texte :

  • Importer dans Firefox (supprimer formatage + séparateur)
  • conversion html > wiki
  • supprimer br
  • remplacer ---- par == Page:Nom - Titre ==
  • découper le texte : == Page: ==
  • [[Page:Nom]] > {{Page|Nom de l'image}}