« Utilisateur:MarcBot » : différence entre les versions
Apparence
Contenu supprimé Contenu ajouté
mAucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 3 : | Ligne 3 : | ||
Tâches : |
Tâches : |
||
*Import de textes dans l'espace ''page'' ; |
|||
*Interwikis (je vérifie les modifications des liens, notamment quand le robot en supprime ; si erreur, me l'indiquer). |
*Interwikis (je vérifie les modifications des liens, notamment quand le robot en supprime ; si erreur, me l'indiquer). |
||
*Copier sur le serveur : |
*Copier sur le serveur : |
||
Ligne 17 : | Ligne 18 : | ||
*découper le texte : <nowiki>== Page: ==</nowiki> |
*découper le texte : <nowiki>== Page: ==</nowiki> |
||
*<nowiki>[[Page:Nom]]</nowiki> > <nowiki>{{Page|Nom de l'image}}</nowiki> |
*<nowiki>[[Page:Nom]]</nowiki> > <nowiki>{{Page|Nom de l'image}}</nowiki> |
||
Marche à suivre Images + OCR : |
|||
*Copier sur le serveur ; |
|||
*Créer pages ? |
|||
*OCRBot. |
|||
OCRBot, marche à suivre : |
|||
*[[:Catégorie:OCR requested]] |
|||
*Ligne os.system : |
|||
**os.system("C:\Progra~1\ScanSoft\OmniPage.exe "+filename+" > result.txt") : fait. |
|||
**autre ligne : fichier d'actions. |
|||
*automatiser la fin du processus. |
Version du 9 mai 2007 à 21:30
Robot de Marc. Si le robot fait des erreurs, laisser un message sur ma page de discussion.
Tâches :
- Import de textes dans l'espace page ;
- Interwikis (je vérifie les modifications des liens, notamment quand le robot en supprime ; si erreur, me l'indiquer).
- Copier sur le serveur :
- Découper les images (Gallica) ;
- (df) cd /cygdrive/c/pywikipedia
- (avec PATH défini) for i in pages/*.jpg; do python upload.py -keep -noverify "$i" "commentaire"; done;
Marche à suivre pour l'import du texte :
- Importer dans Firefox (supprimer formatage + séparateur)
- conversion html > wiki
- supprimer br
- remplacer ---- par == Page:Nom - Titre ==
- découper le texte : == Page: ==
- [[Page:Nom]] > {{Page|Nom de l'image}}