Aller au contenu

Sujet sur Discussion utilisateur:Hsarrazin

Pages à supprimer suite au remplacement du fac-similé

22
SyB~Anicium (discussioncontributions)

Coucou ! Je viens de téléverser une nouvelle version du Tome 5 du RHGF, mais le nouveau FS compte 3 pages de moins. Du coup, cela crée un bug quand je construis le nouveau pagelist, et surtout, les 3 pages n'existant plus sont toujours là... Je pense que les 2 soucis seraient réglés en supprimant les 3 pages, à partir de Page:Bouquet_-_Recueil_des_Historiens_des_Gaules_et_de_la_France,_5.djvu/945. Merci d'avance :)

Hsarrazin (discussioncontributions)

fait ! si tu as besoin d'autres suppressions (pour récupérer un meilleur ocr, par exemple), n'hésites pas

SyB~Anicium (discussioncontributions)

Trop rapide ! Bravo ! Je vais retenter de faire le pagelist correctement. Ensuite je risque de te demander quelques pages ^^

Hsarrazin (discussioncontributions)

ok, je t'attends... je suis en train de corriger le tome 3 de Créquy

SyB~Anicium (discussioncontributions)

Alors, je ne sais pas ce que tu "préfères" : supprimer toutes les séries de pages rouges et bleues du Tome 5 ou bien (cela économiserait grandement ton temps je pense), seulement les pages à problème, qui ne le sont plus désormais . C'est un exercice gratifiant car tu vas faire baisser du même coup le compteur des pages à problème !

Hsarrazin (discussioncontributions)

comme tu préfères... pour ce que j'en ai vu, les pages "roses" ne sont pas terribles... comment est ton ocr ?

SyB~Anicium (discussioncontributions)

Modestement, je dirais qu'il est exceptionnel bien entendu :D

Hsarrazin (discussioncontributions)
SyB~Anicium (discussioncontributions)

Tu peux laisser les pages vierges avec la couche d'OCR bilingue de base, souvent je travaille les deux langues sur la même page ici, pour pouvoir utiliser la fonction Regex :)

Hsarrazin (discussioncontributions)

ok.... je ne l'avais créé que pour tester...

SyB~Anicium (discussioncontributions)

Hé bien je t'adresse tous mes remerciements car je m'en sers au quotidien. Elle est même fondamentale pour le RHGF car sur Vicifons, les signes de saut de ligne ne sont pas interprétés. De même pour les remplacements des ligatures ae et oe, qui sont une plaie (il n'y a pas non plus de gadget Typo sur Vicifons... en fait il n'y a RIEN là-bas). Et je m'en sers même pour automatiser l'insertion des modèles de notes marginales !

Hsarrazin (discussioncontributions)

Il existait un gadget, dans le temps, qui permettait de faire "remonter" la couche text d'un ocr modifié... il a disparu : j'ai contacté @Tpt pour voir s'il pouvait le remettre en route.... ça faciliterait ce travail qui ne nécessiterait plus la suppression des pages ^^

Hsarrazin (discussioncontributions)

Bon, j'ai terminé la suppression. Les quelques pages roses qui restent sont des pages que j'ai recréées (en français). Bonne correction !

Je vais essayer de voir comment utiliser certains scripts d'ici sur vicifons... :)

SyB~Anicium (discussioncontributions)

Merci Hélène :) Je vois que tu es parvenue à trouver la petite partie francophone de l'ouvrage ! Je serais totalement preneur si on trouvait quelques améliorations sur Vicifons, où la communauté est... faible.

Hsarrazin (discussioncontributions)
SyB~Anicium (discussioncontributions)

C'est tout à fait top, et je salue la réactivité et la gentillesse de Tpt : ainsi que la tienne ! Il reste dans mon OCR le défaut du signe ¬ (césure de mot en bout de ligne) qui se retrouve tel quel sans doute parce qu'il est suivi d'un espace, mais c'est du détail comparé au gain de lisibilité ! Et pour certains tomes il est automatiquement transformé lorsque la page n'est pas encore créée... C'est bien mystérieux mais pas insurmontable :) Bonne soirée !

(pour ce mystère du « ¬ », comparer par exemple, sur le Tome 1, une page déjà créée où l'on applique le gadget TI et une page du même Tome qui prend directement la couche texte)

Hsarrazin (discussioncontributions)

le nettoyage automatique de ces « ¬ » est fait par le gadget "MediaWiki:Gadget-MiseEnPage.js" (pas par Typo.js).

Mais il y a moyen de se créer un Typo "perso", qui permet de gérer des regexp de nettoyage (voir le mien). Je pense qu'il doit être tout à fait possible d'y injecter le remplacement automatique en question... je ne suis pas la reine des regexp, mais je pense que toi, nettement plus

et après test ceci devrait marcher....

   str = str.replace(/¬\n/g, "");
SyB~Anicium (discussioncontributions)

C'est précisément l'observation que je venais de me faire en voyant que le remplacement de ¬\n par rien produisait un résultat appréciable ^^ Ce serait risqué de faire de même avec le tiret simple et le long tiret, autant rester humain dans la correction ! Je vais me pencher rapidement sur cette personnalisation de l'outil Typo, ça m'intéresse grandement ! Par contre, pour l'export de l'outil dans mon common.js latin, ça n'a rien produit... Je ne maîtrise pas encore tout.

Edit : et puis, l'étape de suppression des retours de ligne, je l'effectue en dernier, car la correction ligne par ligne est tout de même précieuse :)

Hsarrazin (discussioncontributions)

il faut purger ta page (comme indiqué en haut). Ensuite, quand tu vas en édition, tu devrais avoir le bouton T (ça marche pour moi).

Hsarrazin (discussioncontributions)

autre bonne nouvelle : @Tpt vient d'adapter typo.js pour pouvoir l'utiliser sur les autres projets... il suffit de coller

mw.loader.load( 'https://fr.wikisource.org/wiki/MediaWiki:Gadget-Typo.js&action=raw&ctype=text/javascript' ); // Typo de frws

dans ton common.js sur le site où tu veux l'utliser....

pour le gadget d'aide à la mise en page... (celui qui recolle les césure de fin de ligne), il va falloir tester un peu...

Bonne soirée !

Hsarrazin (discussioncontributions)

Bon, c'est normal que le gadget pour la couche texte ne fonctionne pas sur laws... je suis en train d'essayer d'y remédier, mais il va falloir un peu de temps... :)

edit : normalement, en copiant cette ligne dans ton common.js, ça devrait fonctionner... (n'oublie pas de purger ta page common.js comme indiqué en haut) importScript('Usor:Hsarrazin/tl.js') // récupération de couche texte (en test)

SyB~Anicium (discussioncontributions)

Ca marche ! Le bouton Typo n'apparaît toujours pas, mais déjà je peux retrouver la couche texte, merci !!

Répondre à « Pages à supprimer suite au remplacement du fac-similé »