Discussion utilisateur:Phe/2014

La bibliothèque libre.
Sauter à la navigation Sauter à la recherche

Archive 2008-2010 -- Archive 2011 -- Archive 2012 -- Archive 2013 -- Archive 2014

Sommaire

Auteurs de l'Encyclopédie[modifier]

Bonjour, et bonne année,
J’avance tout doucement sur les auteurs, en me réservant le plus difficile pour la fin (Diderot). J’ai quelques bouquins qui vont m’aider.
Du coup, je continue à modifier quelques sections par-ci par-là, ce qui explique quelques liens rouges qui traînent dans les listes d’articles par auteur (mais le passage du bot peut attendre, j’en aurai forcément d’autres à modifier. —-Acélan (d) 3 janvier 2014 à 09:08 (UTC)

Fichier avec pages manquantes à réinsérer, stp[modifier]

Bonjour Phe,

le livre La Mirlitantouille, récupéré à la Bodleian Library se trouve avoir 16 pages manquantes (entre la page 112 et 129 - page 130 et 131 du djvu) - en réalité, c'est le livre scanné qui était fautif.

Grâce à un charmant bibliothécaire anglais, qui a trouvé un autre exemplaire et m'a scanné et envoyé les pages manquantes, je les tiens à ta disposition ici.

Si tu pouvais avoir la gentillesse de les réinsérer dans le djvu, et de décaler en conséquence la couche de texte, ça me permettrait de finir la correction/split du livre. Je n'ai malheureusement pas d'outils me permettant de manipuler les djvu, car je suis sur Mac :(

Merci d'avance, --Hélène (d) 4 janvier 2014 à 13:59 (UTC)

Fait Yes check.svgPhe 4 janvier 2014 à 14:49 (UTC)
Merci ! merci - t'es un crack Phe !! --Hélène (d) 4 janvier 2014 à 14:59 (UTC)
Au secours, aidez-moi !au secours phe, en insérant les pages de La Mirlitantouille, hier, tu as accidentellement fait sauter la page 130 (pagination - "entre la page 146 et 147 du djvu") - peux-tu la remettre à sa place ? dois-je te refournir l'image ?
Merci d'avance pour ton aide, --Hélène (d) 5 janvier 2014 à 21:21 (UTC)
Merci ! merci de nouveau… il n'y a pas ici de cookies, comme sur Commons, mais le coeur y est :) --Hélène (d) 6 janvier 2014 à 20:36 (UTC)

Index dont j'ai fait l'OCR[modifier]

Bonjour,

Voila les index dont j’ai fait l’OCR, pour les plus anciens :

Plus généralement, quand je fais un OCR je marque l'index comme à corriger (C) [1]. Cordialement, Yann (d) 6 janvier 2014 à 16:57 (UTC)

Je rature ceux qui sont fait, les résultats ne sont vraiment pas bons... — Phe 6 janvier 2014 à 19:16 (UTC)
Voilà, c'est fini. — Phe 8 janvier 2014 à 17:25 (UTC)

Merci pour la Morale d'Aristote[modifier]

Merci !


Splendide travail, et combien rapide !
Des chocolats en remerciement ?

Maruru (Gauguin)


à moins que tu préfères celui-ci,
plus beau mais plus austère ?
Merci encore !

--Zyephyrus (d) 6 janvier 2014 à 22:42 (UTC)


Renommage[modifier]

Bonjour, Phe, avant de commencer à travailler sur ce livre, ne faudrait-il pas commencer par renommer le fichier djvu, dans WikiSource et dans Commons, en Delbeuf_-_Ferrure_du_bœuf.djvu, pour avoir partout l'orthographe correcte utilisée sur la page de titre de la thèse ? Si c'est bien le cas, quelle est la procédure à employer (ou peux-tu le faire ...) ?

J'avais commencé à créer des pages et je me suis rendu compte de ce problème. D'avance merci pour ta réponse --Didieram (d) 25 janvier 2014 à 13:51 (UTC)

J'ai procédé au renommage du Fichier:, Livre: et des Page: déjà créées. — Phe 25 janvier 2014 à 14:00 (UTC)
Merci beaucoup pour ta vitesse de réaction ! --Didieram (d) 25 janvier 2014 à 16:26 (UTC)

Erreur JS[modifier]

Salut,

Depuis 2 jours, WS est très lent chez moi. Il semble que ce soit dû à Javascript. Je ne suis pas sûr que ce soit un problème dû à Wikisource, mais j’ai vérifié ma console JS, et j’ai trouvé un message d’erreur : Uncaught Error: JavaScript parse error: Parse error: Missing operand in file 'MediaWiki:Monobook.js' on line 256 load.php?debug=false&lang=fr&modules=site&only=scripts&skin=monobook&*:28 [blocked] The page at 'https://fr.wikisource.org/w/index.php?title=Page:S%C3%A9gur_-_Les_vacances.djvu/238&diff=prev&oldid=4436791' was loaded over HTTPS, but ran insecure content from 'http://fr.wikisource.org/w/index.php?title=User:Phe/Auteur%20v2.js&action=raw&ctype=text/javascript&dontcountme=s': this content should also be loaded over HTTPS.

index.php?title=Page:S%C3%A9gur_-_Les_vacances.djvu/238&diff=prev&oldid=4436791:1

event.returnValue is deprecated. Please use the standard event.preventDefault() instead. Cordialement, Yann (d) 16 février 2014 à 06:26 (UTC)

J'ai réparé l'erreur de syntaxe dans le Mediawiki:monobook.js mais je ne suis pas sur que ton pb viennent de là. — Phe 16 février 2014 à 10:05 (UTC)

Contributeurs ayant des droits sur les projets de wikimedia[modifier]

J’ai créé cette page, peux-tu t’y inscrire stp, cordialement --Le ciel est par dessus le toit (d) 19 février 2014 à 09:05 (UTC)

Non affichage de pages[modifier]

Bonjour Phe,

Pourrais-tu vérifier si ce que j'ai fait ici est correct : faut-il enlever les deux pages en doublon ou suffit-il de ne pas les afficher ? Merci de ton aide ! --Zyephyrus (d) 20 mars 2014 à 09:20 (UTC)

J'ai supprimer les pages du DjVu et corriger la transclusion dans Polyeucte/Édition Masson, 1887Phe 20 mars 2014 à 16:13 (UTC)
Merci ! merci , Phe, de cette aide immédiate. --Zyephyrus (d) 20 mars 2014 à 17:17 (UTC)

Amélioration du gadget "Mise en page"[modifier]

Salut phe, une proposition d’amélioration : il serait intéressant qu’en plus de propager le header, ton gadget propage aussi le modèle {{manchette}} (avec ses paramètres) s’il existe. Ce modèle sert à afficher une marge (à droite ou à gauche) dans l’espace page pour les notes latérales. Tu peux voir un exemple sur le livre que je suis en train de traiter : Page:La Pérouse - Voyage de La Pérouse, Tome 1.djvu/337 et suivantes. Aristoi (d) 6 avril 2014 à 12:09 (UTC)

Fait Yes check.svg. — Phe 6 avril 2014 à 15:43 (UTC)

Remplacer les s par ſ avec un bot ?[modifier]

Bonjour,

Serait-ce possible de remplacer les s par ſ (anciens s) avec ton bot ? La règle est : partout, en minuscules, sauf à la fin d’un mot, i.e. sauf quand s est suivi de [espace, apostrophe, virgule, point, fin de ligne], par exemple dans tous les volumes de cette collection. Par avance, merci. Cordialement, Yann (d) 14 avril 2014 à 18:04 (UTC)

Merci pous le Disciple de Pantagruel ![modifier]

Tout est dans le titre ! Je me remets à bosser dessus bientôt. Zythème (d) 28 mai 2014 à 22:31 (UTC)

Un petit pb de numérotation automatique de l'entête...[modifier]

Salut Phe,

Je l'avais déjà remarqué avant, mais j'avais oublié de te le signaler... la propagation automatique de la numérotation de l'entête pose un petit problème lorsqu'il y a un chiffre dans le titre, comme ici : [2] - est-ce soluble ? ou bien est-ce que cela empêcherait de numéroter au centre, comme c'est nécessaire pour certains livres sans entête... ?

Peut-on envisager d'ajouter une balise qui dirait au script... "pas touche, ici c'est le titre, le numéro est plus loin" ? --Hélène (d) 1 juin 2014 à 08:17 (UTC)

PS : vu la fréquence plutôt rare de ce genre de cas, ne passe pas trop de temps à essayer de le résoudre, ça n'en vaut pas la peine ;)

Ça devrait mieux marcher. — Phe 1 juin 2014 à 11:26 (UTC)
effectivement, ça a l'air de marcher - Merci ! merci --Hélène (d) 1 juin 2014 à 21:38 (UTC)

Metchnikoff, La Civilisation et les grands fleuves historiques, carte du Hoang Ho[modifier]

Vous aviez corrigé la page Page:Mechnikoff - La civilisation et les grands fleuves historiques.djvu/375 en 2011, et créé l'image de la carte Fichier:Mechnikoff - La civilisation et les grands fleuves historiques, page 375.png qu'elle contient. En validant la page, j'ai remarqué que la carte n'était pas rectangulaire, mais plus large à droite, alors que l'original est bien rectangulaire. Croyant à une erreur de manipulation, j'ai recréé l'image à l'aide de GIMP et je l'ai chargée sur Wikisource en remplacement. L'élargissement qui n'était pas dans l'image téléchargée est réapparue sur le fichier de Wikisource. Je viens de créer le fichier sur Commons https://commons.wikimedia.org/wiki/File:Metchnikoff_-_La_Civilisation_et_les_grands_fleuves_historiques_-_hoangho.png avec la même image .PNG , et l'élargissement a disparu. Insérée dans la page, l'image est rectangulaire. L'élargissement à droite semble être un artefact propre à Wikisource. Je n'ai pas d'explication mais je ne suis pas un grand technicien. Pas d'urgence, mais il serait peut-être intéressant de savoir d'où ça vient. --Wuyouyuan - discuter 11 juin 2014 à 14:33 (UTC)

Je ne suis pas sur de ce que je dois regarder Fichier:Metchnikoff_-_La_Civilisation_et_les_grands_fleuves_historiques_-_hoangho.png fait 1788*976 pixel, ça me donne un ratio de 1.83, l'image sur la page est en 480px × 262px, ce qui me donne aussi un ratio de 1.83. L'élargissement à droite ne serait pas une mauvaise prise en compte du paramètre |center| de l'image sur la Page: 375 ? — Phe 11 juin 2014 à 14:47 (UTC)
J'ai obtenu un meilleur centrage, au moins dans main:, le pb dans les Page: est que le bandeau de qualité est plus large que la vrai largeur de la Page: (c'est très visible sur la page suivante), du coup, même si le centrage est correcte, il parait faux car on se fie à la largeur du bandeau de qualité pour apprécier le centrage ;( — Phe 11 juin 2014 à 15:06 (UTC)
J'ai modifié le css pour forcer le bandeau de qualité à la même largeur que le texte d'une Page, maintenant on voit que toutes les versions de la page étaient correctes :)Phe 11 juin 2014 à 15:06 (UTC)
Suite du même. Fichier:Mechnikoff - La civilisation et les grands fleuves historiques, page 375.png s'affiche déformée. Si on demande l'affichage du fichier d'origine https://upload.wikimedia.org/wikisource/fr/d/d6/Mechnikoff_-_La_civilisation_et_les_grands_fleuves_historiques%2C_page_375.png, on voit que l'image stockée n'est pas déformée. Le phénomène ne se produit pas sur Commons. Je n'ai pas trouvé d'autre exemple pour l'instant. --Wuyouyuan - discuter 12 juin 2014 à 01:23 (UTC)
Je ne vois pas de déformation, sur le Fichier j'ai « Taille de cet aperçu : 800 × 437 pixels. Autres résolutions : 320 × 175 pixels | 640 × 349 pixels | 1 024 × 559 pixels | 1 788 × 976 pixels. Fichier d'origine ‎(1 788 × 976 pixels, taille du fichier : 661 Kio, type MIME : image/png) » et sur commons j'ai « Size of this preview: 800 × 437 pixels. Other resolutions: 320 × 175 pixels | 640 × 349 pixels | 1,024 × 559 pixels | 1,788 × 976 pixels. » Les tailles correspondent et me donnent toutes un ratio de 1.83. Mes préférences/Apparences sont en « Taille maximale des images : (pour les pages de description de fichier) 800x600px » à la fois ici et sur commons. Peut-être que tes préférences sont différentes sur wikisource et commons (mais ça ne peut expliquer que des tailles différentes, pas une déformation). — Phe 12 juin 2014 à 13:37 (UTC)
J’ai essayé de faire réapparaître l’artefact, pour en faire une copie d’écran. Pas moyen, tout a disparu. Entretemps j’avais regénéré mon système (Ubuntu 14.04), Firefox et Chrome en même temps. C’est donc bien chez moi que ça se passait. --Wuyouyuan - discuter 25 juin 2014 à 14:06 (UTC)

RDDM - quand tu auras un peu de temps...[modifier]

Bonjour Phe,

un petit problème (pas urgent)... : il manque deux images à Livre:Revue des Deux Mondes - 1890 - tome 102.djvu - j'ai mis les liens directs vers les mêmes pages sur Gallica...

Si tu pouvais avoir la gentillesse, quand tu auras un peu de temps, d'insérer les images à leur place, ça éviterait de bloquer ce volume... mais ça n'a rien d'urgent, je suis juste tombée dessus en mettant à plat les Sommaires, pas en faisant la correction :)

Merci d'avance, --Hélène (d) 12 juin 2014 à 07:15 (UTC)

Fait Yes check.svgPhe 12 juin 2014 à 13:16 (UTC)

Gadgets[modifier]

Salut,
A force de désactiver et de réactiver des gadgets et des options diverses, j'ai fini par récupérer un affichage normal et les gadgets disparus.
Apparemment, c'est le gadget "hotcats multi" qui coince.
Il me manque juste l'onglet "diff" ; je l'ai peut-être désactivé par erreur, mais je ne trouve plus comment l'activer ???
--Acélan (d) 27 juin 2014 à 09:29 (UTC)

Diff fait partie du gadget Match and Split. — Phe 27 juin 2014 à 11:31 (UTC)

Doublon de texte non transclus[modifier]

Alors que je m'occupais de l'ouvrage Les Cathédrales de France, j'ai repéré que deux de ses pages, Les Cathédrales de France/La Nature, et Les Cathédrales de France/Les Cathédrales/Texte entier figurent dans la liste en question. Je n'ai pas trouvé de différence entre ces deux pages et les autres du même ouvrage. Pure curiosité et désir de m'instruire : à quoi cela correspond-il ? --Wuyouyuan - discuter 25 juin 2014 à 13:44 (UTC)

Normalement cette page ne devrait pas contenir de /Texte entier, c'est une manière correcte d'obtenir un doublon. Ici je présume que ces deux pages sont listés car le nom ne suit pas la convention habituelle <page principal>/Texte entier mais utilise page principal/Introduction/Texte entier et page principal/Les Cathédrales/Texte entier, ce n'est pas vraiment un problème. — Phe 25 juin 2014 à 14:32 (UTC)

Hi Phe![modifier]

Hi Phe, here I am to learn more about fr.source while proofreading a difficult equitation book: Livre:Cavendish - L’Art de dresser les chevaux, 1737.djvu. While learning your settings and policies about wiki markup ando formatting (I'll ask Hsarrazin for basic help), I'd like to test some of our it.source js edit tools; one of them, newRi(), automatizes your Tl|Nr, but I felt the need to edit a little bit the template Nr, and I don't know if such edits by a unknown user are appreciated here. Feel free to fix/to revert my edits if they hurt anyone from you. --Alex brollo (d) 27 juin 2014 à 15:00 (UTC)

Fine for me, used this way it doesn't break MediaWiki:Gadget-MiseEnPage.js which propagate nr template when a page is created and if the (djvu_page_nr - 2) contains this template. I updated the documentation. By the way, I restarted to work on hocr on wmflabs, it'll provide only word location and the associated javascript to allow word higlighting, I hope it'll ready in a few weeks, at worst in a few month. The last js version is Utilisateur:Phe/hocr.js and works. Now it's a matter of processing all books, mostly done for fr and it, a lot left for en: and all books for other wikis. — Phe 27 juin 2014 à 15:40 (UTC)
I've lots of things to explore here, as I see.... :-) Our it.source newRi() uses exactly the same trick, I'm very interested to study its code.
Just a fast mention to my new idea: to build a word-by-word djvu text editor, saving the result of text editing into djvu file with no coordinate derangement. The goal is, to test advantages, if any, of splitting proofreading in two steps, fixing text and formatting it, just as Distributed Proofreaders do; the first step being indipendent (optionally) from mediawiki environment. Obviously the better the djvu text layer, the better your word highlighting. :-) But... Cavendish is waiting for me, from a long time. --Alex brollo (d) 27 juin 2014 à 19:27 (UTC)

It.source tl|Pt[modifier]

Do you know it.source template Pt? It's one of most used templates into our project, that solves most issues when there's a difference between nsPage and ns0 (it's name is mnemonic for PageText), but is maily used for hyphenated words at the end of page and at beginning of next page, with identical syntax in two cases.

The idea is very simple: {{{1}}} is only shown in nsPage, and it's not transcluded into ns0; {{{2}}} is not shown into nsPage, but it is transcluded and shown in ns0. So the template can used in almost any case, when the user needs to transclude something different from what is shown in nsPage.

In the case of hyphenated words, imagine "some-" "thing", at the end of Page the user writes {{Pt|some-|}} (nothing into param 2 since the user doesn't know anything about the end of the word), and at the beginning of next page he writes {{Pt|thing|something}}. Really he don't writes the code if it uses a "autoPt" tool, he simply selects "some-" and clicks the tool, and into the following page he selects "thing" and clicks the same tool. The engine of the tool "feels", at the first click, that the selection is near the end of page and replaces "some-" with {{Pt|some-|}}; in the following page, the tool "knows" that former page contains a Pt template near its end, and "knows" that the content of param 1 is "some-", and "feels" too that selection is placed near the beginning of the page, so it "knows" all what needed to replace selection with {{Pt|thing|something}}.

It this "rediscovering the wheel" once more? If it isn't: would you like that I add here a copy of Pt template, just to test it? --Alex brollo (d) 1 juillet 2014 à 06:41 (UTC)

I tested Tiret and Tiret2, and I appreciate a lot the automation linked to Tiret2: a smart idea! So far, I only see one advantage of it:Template:Pt automation, t.i. it is not necessary to "guess" or to search for the latter part of an hyphenated word, while editing the former one. --Alex brollo (d) 9 juillet 2014 à 07:17 (UTC)
tiret and tiret2 has one other advantage, I can use a script to check they are correctly used as the two parameters on the first and second page are identical, except in some corner case, it allow to catch some mistake, but it:template:Pt seems useful too. — Phe 9 juillet 2014 à 13:01 (UTC)

Diff[modifier]

Salut,
J'ai vu que l'outil Diff avait évolué ; c'est bien qu'il prenne en compte les majuscules et la ponctuation, mais l'ennui, ce sont les apostrophes ; n'y aurait-il pas moyen d'éviter cela ? c'est plutôt long à comparer, du coup. --Acélan (d) 5 juillet 2014 à 09:54 (UTC)

Fait Yes check.svg. — Phe 5 juillet 2014 à 12:47 (UTC)
Merci ! merci --Acélan (d) 5 juillet 2014 à 13:19 (UTC)
C'est beaucoup mieux ; mais s'il était possible de supprimer également les tirets de fin de ligne, ça diminuerait beaucoup la masse de relecture. --Acélan (d) 6 juillet 2014 à 07:07 (UTC)
Je les ai tous retirer, dans l'ensemble c'est mieux mais ça introduit quelques erreurs inexistantes. — Phe 6 juillet 2014 à 12:19 (UTC)
Oui, c'est nettement mieux comme cela, ça m'a permis de repérer des erreurs qui m'avaient échappé, perdues dans la masse. --Acélan (d) 7 juillet 2014 à 08:37 (UTC)

A test editing of Module:Table[modifier]

I posted a simple edit of Module:Table, adding class="tableItem" to main container. This makes simpler to retrieve & parse table items by jQuery to search for links inside item by item. The idea is to add data from Summary parsing into the variable currentIndexData, caming from localStorage["currentIndexData"] built by User:Alex brollo/GetIndexData.js. Please rollback if you wonder that this edit could be disturbing/wasting anything. --Alex brollo (d) 9 juillet 2014 à 07:14 (UTC)

Seems ok, even if I don't see any use at the moment but there is surely some. — Phe 9 juillet 2014 à 13:07 (UTC)
It makes simpler for me to fill the "data container" localStorage["currentIndexData"]]: see User:Alex brollo/GetIndexData.js. --Alex brollo (d) 9 juillet 2014 à 13:28 (UTC)

Going back to it.source...[modifier]

I got a very interesting result here: User:Alex brollo/GetIndexData.js runs without any dependency, and gets Index page data - as the name suggests: all data from pagelist tag; all data from summary field of Index page, t.i. the list of pairs of links chapter - djvu page where chapter begins.

These data are stored into two localStorage variables: localStorage.currentIndexdata and localStorage.currentIndexSummaryData as JSON-encoded objects. They are refreshed only when a page logically linked to a different Index page is opened - both in edit or in view mode. An AJAX trick finds the logical link with Index page too when a new ns0 page is created.

So far, I use these formidable set of data into two ways:

  1. to self-compile tl|pli2, t.i. a script finds param 1 from param 2 of pli2 (param2 being the book "page number", arabic, roman or "exotic", it's seen simply as a string);
  2. to self-compile an excellent approximation of pages tag when creating a new ns0 page listed into an Index page summary: a script self-compiles index, from and to parameters, you have only to compile fromsection and tosection if needed.

It.source already uses a "autoNs0" script doing the same, but it works in a complex way, and it has lots of dependencies and needs a particular set of templates into Index page summary field; it needs too a "root" ns0 page containing the whole set of subpages. Fr.source solution needs nothing but a well compiled Index summary field (both locally written or transcluded) where "elements" contain a link to a ns0 subpage, and a link to the djvu page where ns0 subpage begins.

You can test the whole thing simply adding a

importScript("Utilisateur:Alex brollo/GetIndexData.js");

to your vector.js or common.js.

I'm going back to it.source to test the same script; please give me some feedback if you'll appreciate the idea and feel free to fix/develop it if you like. --Alex brollo (d) 12 juillet 2014 à 15:02 (UTC)

Liens au choix ?[modifier]

Bonjour Phe,

Si on voulait obtenir le choix afficher/masquer les liens de la page par défaut (et pas seulement en gadget) est-ce qu'on pourrait mettre ceci dans le common.js collectif ou est-ce que cela présenterait des inconvénients ? Pourrait-on tester cela pendant quelques jours ? Et pourrait-on proposer la même chose sur la Wikisource multilingue ou est-ce que cela demanderait des adaptations dans les autres langues ? Feu vert, feu orange, feu rouge ? --Zyephyrus (d) 25 juillet 2014 à 07:41 (UTC)

Je ne comprends pas, sur Messer Guido Cavalcanti, j'ai déjà un Liens vers les pages dans le menu Options d'affichage qui fait déjà ça ? — Phe 25 juillet 2014 à 13:59 (UTC)
Ce serait pour gérer les liens internes quand ils sont, pour certains types de textes, acceptés : est-ce que cela rendrait possible d'avoir en un clic le texte avec ses liens, en un clic le texte seul ? --Zyephyrus (d) 25 juillet 2014 à 19:26 (UTC)
Ah oui, je vois, mais le problème est que ça remplacerait tout les liens par le texte, y compris dans l'entête, et ce script fait référence un gadget MediaWiki:Gadget-AffMasLiens.js qui n'existe pas. — Phe 25 juillet 2014 à 19:38 (UTC)

Typo pour un livre[modifier]

Salut Phe,
et merci pour le fichier de diff, il m'est très utile.
Je viens de tomber sur un livre qui aurait grand besoin du passage de ton bot, la typo laisse pas mal à désirer. Livre:Rabelais ou imitateur - Le Disciple de Pantagruel, éd. Lacroix 1875.djvu
à+, --Acélan (d) 5 août 2014 à 08:52 (UTC)

Fait Yes check.svgPhe 5 août 2014 à 12:13 (UTC)

Modernisation[modifier]

Bonjour Phe !

Merci pour tes modifications sur La mort d'Agrippine.

Néanmoins je m'étais dit que je laisserais le vocabulaire modernisé en doublon du dictionnaire générique, pour éviter des problèmes lorsqu'un mot est retiré pour problème de faux-positif (comme ça vient de se produire avec sui). J'ignore si c'est une bonne pratique mais j'ai appliqué le même système sur d'autres textes (et je vois que tu es passé avec Phe-bot pour les corriger également Clin d'œil).

Par ailleurs, pour contrer ces problèmes serait-il possible de connaître les textes qui utilisent un mot spécifique du dictionnaire, pour pouvoir les lister lorsqu'il faut retirer un mot pour cause de faux-positif ? J'ignore si c’est même techniquement possible.

Merci à toi ! Cordialement. --M0tty (d) 2 septembre 2014 à 20:54 (UTC)

C'est en projet mais pas encore disponible, mais ça sera restreint au texte contenant déjà un {{modernisation}}. Pour les autres textes qui ne sont pas encore modernisé je vais essayer de faire un script d'aide au remplissage du modèle. — Phe 2 septembre 2014 à 21:00 (UTC)
Merveilleux ! Et un script qui assisterait le remplissage du dictionnaire (parce que ranger par ordre alphabétique 200 mots dans une liste pareille, ça prend trop de temps), pourrais-tu le rajouter dans ta to-do list ? Clin d'œil Un grand merci ! Cordialement. --M0tty (d) 2 septembre 2014 à 21:10 (UTC)
J'ai déjà une liste provenant des dictionnaires locaux, je ne sais pas si ça vaut la peine de le faire automatiquement car il y a beaucoup de faux positifs, il y a d'ailleurs des ſ dans cette liste, il ne me semble pas utile. Ne sont listés que les mots présents dans aux moins cinq pages. J'aimerai aussi pouvoir faire le contraire, virer des mots du dictionnaire global pour les reporter dans les dico locaux quand le nombre d'utilisation est faible, pour éviter l'inflation du dico globale.
Impressionnant ! Je ne sais pas s'il faut faire dégonfler le dictionnaire principal. Si on a effectivement une assistance pour le remplir, il vaut mieux centraliser les mots. Plus le dictionnaire sera complet, plus la modernisation sera efficace et rapide sur les nouveaux textes, y apposer simplement le modèle {{modernisation}} sera suffisant et il n'y aura plus de mots à rajouter ou presque... Cordialement. --M0tty (d) 2 septembre 2014 à 21:34 (UTC)
Par ailleurs, bon jour peut créer des faux positifs : aujourd'hui est un bon jour. Il faudrait un modèle supplémentaire en complément de {{modernisation}} à l'image de {{corr}} qui permettrait de moderniser une seule occurrence d'un mot à l'intérieur d'un texte qui contient plusieurs occurrences de ce mot, lorsque la modernisation est fonction du contexte. Faisable ? Cordialement. --M0tty (d) 2 septembre 2014 à 21:41 (UTC)
Je crois que l'on peut continuer comme l'on fait aujourd'hui en augmentant le contexte suffisamment "*bon jour monsieur:bonjour monsieur" dans le dico local pour éviter l’ambigüité. C'est pour cette raison que "bon jour" et d'autre ne sont pas dans le dico global. Je n'ai jamais encore vu de cas ou augmenter le contexte ne suffit pas. Actuellement la séquence maximale permise est de trois mots.
D'accord, ça me semble juste, je ne sais plus pourquoi, j'avais été confronté à un cas où ce modèle aurait été utile, mais je ne retombe plus dessus, et peut-être qu'en élargissant le contexte, ça aurait fonctionné.
Par ailleurs, autre faux-positif : ouy qui peut se moderniser en oui (contraire de non) et en ouï (du verbe ouïr)...
Merci quoiqu'il en soit pour ton travail ! Cordialement. --M0tty (d) 2 septembre 2014 à 22:03 (UTC)
Flûte ouy est dans le dico local, je vais le garder pour l'instant mais il faudra le virer plus tard.
peu prés peu près 232
bon jour bonjour 221
lors que Lorsque 134
par tout partout 76
prés près 73
long temps longtemps 64
la bas là-bas 53
françois français 53
dés que Dès que 49
si tôt Sitôt 47
des demain dès demain 46
des aujourd dès aujourd 46
bien tôt bientôt 43
nôtre homme notre homme 40
seur sûr 35
t il t-il 34
à dire à-dire 33
est à est-à 33
surs sûrs 32
mal gré malgré 32
conseillez conseillés 32
aussi tost aussitôt 32
president Président 31
dés dès 31
comptez comptés 31
écoulez écoulés 30
bled blé 30
vôtre haine votre haine 29
peche pèche 29
nôtre ami notre ami 29
modérement modérément 29
lôt lot 29
entre nous entre nous 29
vostre cour votre Cour 28
trouvez trouvés 28
celebree célébrée 28
pate patte 27
nôtre avare Notre Avare 27
a son à son 27
ſ s 26
sui suis 26
philippes Philippe 26
isle Île 26
frequentez fréquentés 26
envy envi 26
a monſeigneur À monseigneur 26
vôtre cenſure votre censure 25
mary fort Mari fort 25
le mari Le Mari 25
recüeilloient recueillaient 24
quelque temps quelques temps 24
empedocle Empédocle 24
mélèse mélèze 23
flatez flattés 23
étonnez étonnés 22
& et 22
portez portés 21
et bien Eh bien 21
appointez appointés 21
vôtre votre 19
obligez obligés 19
placez placés 18
nôtre agasse notre Agasse 18
bien dîné bien dîné 18
venus Vénus 17
sont nez sont nés 17
sa lire sa Lyre 17
pres du près du 17
hay haï 17
acquittez acquittés 17
éludoit éludait 16
appren Apprends 16
éloignez éloignés 15
plus tost plutôt 15
paroisse paraisse 15
la haut là haut 15
conviez conviés 15
touchez touchés 14
soupé souper 14
sceus sus 14
quoi qu Quoiqu 14
oubliez oubliés 14
nôtre compagne Notre compagne 14
mélèse mélèse 14
moquez moqués 14
fonds fond 14
traitez traités 13
quebec Québec 13
exposez exposés 13
composez composés 13
a la À la 13
élevez élevés 12
madrez madrés 12
françoise française 12
considérez considérés 12
aussi tôt Aussitôt 12
appliquez appliqués 12
un a un à 11
attachez attachés 11
passez passés 10
frappez frappés 10
tracez tracés 9
prés du près du 9
opposez opposés 9
fut tombé fût tombé 9
formez formés 9
aussi tost Aussitôt 9
affirmez affirmés 9
ça çà 8
à vôtre à votre 8
usitez usités 8
sures sûres 8
persuadez persuadés 8
contoit comptait 8
émeut émut 7
tirez tirés 7
imaginez imaginés 7
hai haï 7
etes pas êtes pas 7
engagez engagés 7
employez employés 7
destinez destinés 7
assûrez assurés 7
accoûtumez accoutumés 7
a qui À qui 7
a l À l 7
tirez de Tirés de 6
séparez séparés 6
sacrez sacrés 6
renfermez renfermés 6
préjugez préjugés 6
privez privés 6
nôtre renard notre Renard 6
nez nés 6
lire Lyre 6
les françois les français 6
laisse là laisse là 6
façonnez façonnés 6
fatiguez fatigués 6
dît dit 6
différent diffèrent 6
destituez destitués 6
bien tôt Bientôt 6
alterez altérés 6
a ses À ses 6
veillay je Veillé-je 5
trompez trompés 5
seurs sûrs 5
regardez regardés 5
pres de près de 5
paẞant Passant 5
occupez occupés 5
là dessus là-dessus 5
leu lu 5
grevez grevés 5
encore encor 5
déterminez déterminés 5
donnez donnés 5
cà Çà 5
créez créés 5
aux prez aux prés 5
autorisez autorisés 5
articulez articulés 5
accoûtumez accoûtumés 5

Bouton typo[modifier]

Bonjour Phe,

Une fois de plus je me tourne vers toi, car mon message sur le scriptorium est resté sans réponse. Voià mon bouton typo a disparu, je ne comprends pas pourquoi, et de toute façon je n’ai pas les capacités techniques pour comprendre, aurais-tu une solution ? La case du gadget est pourtant bien cochée. Merci déjà.

--Le ciel est par dessus le toit (d) 3 septembre 2014 à 09:30 (UTC)

S'il s'agit bien de Typo : crée un bouton qui formate le texte conformément aux conventions définies ... je l'ai réparé hier, mais il apparaît maintenant dans le menu Aide à la relecture, sa nouvelle position est provisoire, dès que possible je le remettrais dans le menu Avancé. Est-ce que c'est bon maintenant ? — Phe 3 septembre 2014 à 13:57 (UTC)

Merci Phe. --Le ciel est par dessus le toit (d) 3 septembre 2014 à 16:14 (UTC)

Gadget changecat pour l'Encyclopédie[modifier]

Salut Phe,
J'ai toujours le gadget, mais il ne fonctionne plus. Il a l'air de marcher comme avant : je peux voir les catégories, les choisir ; quand j'appuie sur OK, ça mouline, mais rien n'est enregistré. --Acélan (d) 4 septembre 2014 à 08:33 (UTC)

Ça devrait marcher maintenant. — Phe 4 septembre 2014 à 13:40 (UTC)
Merci ! merci --Acélan (d) 4 septembre 2014 à 15:20 (UTC)

Cours d’agriculture[modifier]

Salut Phe,
Quand tu auras le temps (je sais que tu es pas mal pris), est-ce que tu pourrais te pencher sur le cas de ce livre ?
Il est bien sûr trop tôt pour commencer la mise en place des articles, mais il faudrait au moins un modèle du type {{Tr6L}} pour les liens internes, et mes compétences techniques sont trop limitées pour ça. --Acélan (d) 13 septembre 2014 à 09:28 (UTC)

Auteurs[modifier]

Bonsoir Phe,
Acélan et moi nous posons des questions sur la manière dont ton robot pourra trouver les auteurs des articles du cours d'agriculture de Rozier. Pour ce que nous en avons vu, pour l'instant les indications d'auteurs sont rares. Rozier doit être l'auteur principal. Quand elles existent, elles sont généralement placées en fin d'article, parfois entre parenthèses, parfois non. Des exceptions existent. Les auteurs de l'article ABEILLES sont placés au début, pour celui sur l'ACIDE, sur 5 §, le 4ème est de Jean-André Mongez ; les 4 autres ne possèdent pas de mentions. L'article ADOUCISSANT contient 2 paragraphes, le 1er est signé M. B. (Bailièvre), le 2nd non. Ton robot est-il capable de trouver les auteurs figurés de manière aussi disparate ? Faut-il les identifier sur une page comme celle-ci et si oui, comment la formater ? D'avance merci. Gtaf (d) 15 septembre 2014 à 23:08 (UTC)

Je n'ai pas eu le temps de regarder en détail mais je ne crois pas que ce soit un problème, les signatures commencent toujours pas un M.<espace> suivi d'une ou plusieurs lettres en majsucules suivi par un point. Ce qu'il va falloir trouver ce sont toutes les pages listants les signatures et retrouvés les complets noms des auteurs. — Phe 16 septembre 2014 à 02:16 (UTC)
Une chose qu'il faudrait faire rapidement c'est créer la page principal Cours complet d’agriculture (Rozier) pour avoir une page de discussion ou regrouper toutes les discussions, elles commencent à être dispersé sur plusieurs pages différentes et on va en oublier des morceaux. — Phe 16 septembre 2014 à 02:20 (UTC)

A new exotic idea[modifier]

Here a brief explanation of our new itsource idea. If I'll need some help to do some reverse engineering of your marvellous frsource gadget code, I'll ask you, can I? --Alex brollo (d) 18 septembre 2014 à 09:22 (UTC)

Robot et typo[modifier]

Salut Phe,
À l'occasion, pourras-tu passer ton robot pour corriger la typo sur Livre:Jaurès - Histoire socialiste, I.djvu et les autres volumes de la série ? Même ceux qui sont marqués comme validés ne sont pas franchement impeccables du point de vue de la correction, mais on peut au moins améliorer la typo. --Acélan (d) 20 septembre 2014 à 07:25 (UTC)

NB : les virgules sont utilisées comme séparateurs pour les chiffres, mais j'imagine que ton robot sait prendre ça en compte ?
Pour les chiffres ça devrait aller, de toute façon il va falloir que je surveille chaque édit. Est-ce qu'il faut faire Etat --> État, Eglise - > Église, etc. ?
Oui, aussi. --Acélan (d) 20 septembre 2014 à 17:08 (UTC)
Fait Yes check.svg. — Phe 21 septembre 2014 à 02:18 (UTC)
Merci ! --Acélan (d) 21 septembre 2014 à 06:08 (UTC)

Loading Aide-LangConverter.js[modifier]

Hi!

Wouldn't be better to check for a userjs preference or a cookie on on MediaWiki:Gadget-modernisation.js, and let the users who want to load the code to set that preference/cookie? This could help in case the list of users will keep changing. Helder 21 septembre 2014 à 11:26 (UTC)

Unsure how user preference works, but it look like it'll need an user interface. The way Aide-LangConverter.js is loaded is a temporary hack for test purpose only. the plan is to integrate it to LangConverter.js after tweaking the ui, doing at least some part of the TODO and fixing some trouble on the server side. When ready perhaps adding an optout throuhg a gadget or adding a list of lang not accepting it if some wiki decide it's not enough good. Actually it's not ready for real use. It'll need also test on a wiki with multiple variant, there is support for multiple variant but completely untested. userjs preference seems a good step in the right direction, but what need end-user is a simple interface with checkbox/edit field for each config var for each gadget supporting some sort of configuration. A lot of works ;( — Phe 21 septembre 2014 à 12:06 (UTC)

Robot et encyclopédie[modifier]

Salut,
J'ai fait quelques modifs touchant les sections récemment ; à l'occasion, il faudrait que tu repasses ton robot remettre tout ça en ordre. Aucune urgence.
Merci d'avance, --Acélan (d) 21 septembre 2014 à 14:17 (UTC)

Fait Yes check.svgPhe 21 septembre 2014 à 17:43 (UTC)

Nouveau gadget pour les texte anciens...[modifier]

Bonsoir Phe,

J'expérimente depuis peu le nouveau gadget que tu as mis en place pour faciliter la correction du Trévoux, et des autres textes anciens...

Je voulais te signaler deux petites anomalies de remplacement - actuellement, il me remplace

  • "délire" par "désire"
  • "accuser" en "aceuser"

si je trouve d'autres remplacements anormaux, je te les ajouterai. Si tu peux y faire quelque chose, tant mieux.... sinon, Sourire --Hélène (d) 1 octobre 2014 à 19:55 (UTC)

Fait Yes check.svgPhe 1 octobre 2014 à 20:20 (UTC)

Et il remplace "mois" par "mots" ; dans le Trévoux, ça a sûrement son utilité, mais dans le Rozier, c'est embêtant... --Acélan (d) 2 octobre 2014 à 07:56 (UTC)

Fait Yes check.svgPhe 2 octobre 2014 à 12:05 (UTC)
Au singulier aussi : il remplace moi par mot. --Zyephyrus (d) 12 octobre 2014 à 11:34 (UTC)

A new adventure: EditInView.js[modifier]

Another fuzzy idea for you :-)

Helene is kindly testing for me User:Alex brollo/EditInView.js and a couple of other scripts, one of them (User:Alex brollo/Gadget-Typo.js) being simply a copy a copy of Typo.js gadget, with a very light edit that allows to use it in view mode too.

As name suggests, EditInView allows to edit current Page in view mode. As soon as a page is loaded, its wikicode id uploaded, parsed into a mediaWiki.contenuto object with key fields (header, body, footer, user, level), then an edit invironment is built, so that these data can be edited and saved.

The advantage is, that such an edit job is really very fast, and that proofreading can be done into a neat, simplified view environment. Presently scripts are written at my best (t.i. into an horrible slang for a decent programmer), but I'm using them as an exercise - and I learned a lot from Typo.js, thank you. --Alex brollo (d) 4 octobre 2014 à 18:01 (UTC)

M&S bot[modifier]

Hi, your M&S bot is down for maintenance or it crashed randomly and no one noticed until now? Best, 555 (d) 11 octobre 2014 à 09:28 (UTC)

It crashed, I restarted it. — Phe 11 octobre 2014 à 18:39 (UTC)
Apparently it broke again =/
[3] reports pt:A Carne/XVI as splitting/split but no action is performed. 555 (d) 12 octobre 2014 à 02:05 (UTC)
Hmm, I got some error on the server side I don't understand. It worked for me on fr a few hours ago, and on pt: up around midnight, but now fail to save any page. I'll answer on your talk page on pt, unsure if I'll have time to fix it this night. — Phe 12 octobre 2014 à 02:34 (UTC)
Broked again lol, this time on pt:A Relíquia/Prefácio+pt:A Relíquia/I.
FIY, my first report (11 octobre 2014 à 09:28) was based on en:The Fortune-Teller.
Don't worry about fixing it sooner or later, there's lot of stuff to do both on Wikisources and on Wikidata in the meanwhile =). Best, 555 (d) 12 octobre 2014 à 04:40 (UTC)
Hello 555, I think Phe-bot is not at fault, but the problem is M&S can't work if there is no text in the pages-sources, an OCR [1] is needed first in these pages-sources (not in the pages-feuilles in Main where the text is correct already). Sorry I don't know how to translate pages-sources and pages-feuilles (pages in Page ns and pages in Main ns). Regards --Zyephyrus (d) 12 octobre 2014 à 07:34 (UTC)
There is a text layer in it. — Phe 12 octobre 2014 à 09:38 (UTC)
Oh right: it's weird, it appears and disappears immediatly. Is it on purpose or is it a bug? --Zyephyrus (d) 12 octobre 2014 à 11:22 (UTC)
Text came back when I stopped WikiEd. --Zyephyrus (d) 12 octobre 2014 à 11:29 (UTC)
WikiEd have tons of issues with Wikisource. Fortunately bots don't parse javascript
Replying to your message on my pt.ws Usertalk, FlaggedRevs is enabled on ptwikisource many years ago. I think this extension isn't malfunctioning your bot (unless some recent code change caused that issue). We have some abusefilter rules to stop some spambots, but I've checked carefully and none edit was flagged or stoped due to it. Maybe it's some sort of session/cookie issue? Something with encoding on text content/page name (our NS:Page is Página)...? o.O 555 (d) 12 octobre 2014 à 21:27 (UTC)
Tried match on pt:A Relíquia/II 3 times; match_and_split.php have reported all as in progress, but with no results on wiki.
Tried also to split pt:A_Relíquia/I. Right now match_and_split.php reports it as in progress, but with no edits on pt.ws. Next queued page to split is Voyages, aventures et combats/Chapitre 9. 555 (d) 12 octobre 2014 à 22:11 (UTC)
I'm following all of these in the log of the server side, yes, after each restart of the bot it works a first time on pt: then it always fail to save due to an invalid edit token, weirdly this occur only on pt: I've modified yet again a bit the bot to try to workaround the trouble. The current M&S is in progress let see later if the second will work... — Phe 12 octobre 2014 à 22:54 (UTC)
All pages from A Relíquia were done. But I've propositaly waited circa of two hours before starting any new M&S task and... pt:Uma Tragédia no Amazonas/I split didn't worked o.O 555 (d) 13 octobre 2014 à 02:38 (UTC)
  1. not a good one but good enough for the bot being able to find it

Mise en valeur des livres de wikisource sur wikipedia[modifier]

Bonsoir Phe,

Comme tu es administrateur sur wikipedia, je me tourne vers toi puisque tu dois connaître mieux que moi les coutûmes et usages de l’encyclopédie.

Je me demandais comment rendre plus visible les livres de wikisource sur wikipedia et j’avais cette idée : il existe la bas aussi des articles sur des auteurs, historiens, philosophe etc. et dans celle-ci une section Oeuvres. Je sais qu’il existe aussi un petite fenêtre "Autres projets" qui permet de signaler la présence de ceux-ci sur wikisource. mais je me demandais comment signifier quelles oeuvres exactement se trouvent sur ws.

Je pense qu’on devrait se limiter aux livres corrigés et validés

Est-ce réalisable, est-ce que la communauté de wikipédia accepterait cela. Merci de me dire ce que tu en penses, car je trouve notre visibilité sur celle-ci très peu visible.

Cordialement,

--Le ciel est par dessus le toit (d) 15 octobre 2014 à 18:57 (UTC)

Il existe trois modèle sur wp: pour faire cela, dans l'ordre de préférence: w:modèle:Ouvrage (paramètre wikisource), w:modèle:wikisource et w:modèle:Lire en ligne. Souvent wp: utilise le modèle ouvrage dans les listes de livres, la modification à faire est minimale quand il est utilisé. (Autres projets est pratique pour aussi pratique pour lier la page sur un livre vers wikisource.) — Phe 16 octobre 2014 à 19:36 (UTC)
Merci pour ta réponse, je vais me pencher sur le sujet et voir comment je peux entreprendre ce travail ou pas car ça me parait colossal. --Le ciel est par dessus le toit (d) 16 octobre 2014 à 19:53 (UTC)

Compléter un scan[modifier]

Bonjour Phe,
Il manque 3 pages à ce livre : Livre:Segalen - René Leys.djvu. Hélène me les a récupérées (cf. Discussion_utilisatrice:Hsarrazin#Demande_de_service), mais c'est un truc que je ne sais toujours pas faire, alors j'aurais une fois de plus besoin de tes compétences (et puis il faudrait ensuite décaler les pages déjà créées, ça complique encore le truc).
Amicalement, --Acélan (d) 19 octobre 2014 à 09:45 (UTC)

Fait Yes check.svgPhe 19 octobre 2014 à 23:26 (UTC)
Merci ! merci beaucoup ! Et je découvre avec plaisir que mêmes les transclusions sont corrigées, c'est super. --Acélan (d) 20 octobre 2014 à 06:04 (UTC)

M&S bot [2][modifier]

Don't know if you are aware, but your bot keeps stopping to edit on pt.wikisource after some idle time between requests. Also, I've found a very weird symptom: the most majority of your edits are done within default WMF parser but few randon ones are done using HHVM [4]. Maybe it's related? 555 (d) 19 octobre 2014 à 15:15 (UTC)

Yes I know it continues to fail very often, and once it start to fail it never recover before I restart it. I didn't see it uses HHVM, perhaps the bot use some beta feature but it look like weird it use HHVM only for some edit but not all. I didn't think to look at bot user pref, perhaps the trouble come from here. — Phe 19 octobre 2014 à 16:32 (UTC)
I don't see any beta pref for the bot..., restarted it again. — Phe 19 octobre 2014 à 16:40 (UTC)

Match & Split[modifier]

Salut Phe! Je me demandais s'il y avait du développement pour le match & split. Bien que j'aie réussi à faire un volume en entier il y a quelques jours, je n'arrive malheureusement plus à le faire... :( Si je peux être d'une aide quelconque, j'ai de bonnes connections pour le ToolLabs à la fondation... :) --Ernest-Mtl (d) 31 octobre 2014 à 02:12 (UTC)

Le problème est du côté des serveurs, je redémarre le script côté serveur souvent pour pallier à ça, mais ça marche très mal :/. — Phe 31 octobre 2014 à 19:01 (UTC)
Ok, je m'informe au sysadmin du serveur de la fondation! Je le connais très très très très bien! ;) --Ernest-Mtl (d) 1 novembre 2014 à 02:19 (UTC) PS: si tu as plus de détails au sujet du problème de serveur, le plus j'en sais, le plus simple ça devient... :)
En fait, c'est pas la faute de Tool Labs. :-) La tentative de match-and-split de Ernest donne:
put error : Page not saved Aline_et_Valcour/Lettre_I
text len:  7499
Traceback (most recent call last):
 File "/data/project/phetools/phe/common/pywikibot_utils.py", line 42, in safe_put
   page.put(text, comment = comment)
 File "/data/project/phetools/pywikibot-core/pywikibot/page.py", line 1066, in put
   **kwargs)
 File "/data/project/phetools/pywikibot-core/pywikibot/tools.py", line 549, in wrapper
   return obj(*__args, **__kw)
 File "/data/project/phetools/pywikibot-core/pywikibot/page.py", line 989, in save
   **kwargs)
 File "/data/project/phetools/pywikibot-core/pywikibot/page.py", line 1013, in _save
   raise pywikibot.OtherPageSaveError(self, err)
OtherPageSaveError: Edit to page fr:Aline et Valcour/Lettre I failed:
badtoken: Invalid token
Sleeping for 9.8 seconds, 2014-11-01 02:34:04
Note la ligne en caractères gras: pour une raison quelquonque, pywikibot ne repasse pas correctement le token d'edit. Tu utilises bien la version la plus récente? MPelletier (WMF) (d) 1 novembre 2014 à 02:40 (UTC)
Oui, je sais que ça vient de là, le problème est apparu depuis quelques semaines, et oui j'utilise la version la plus récente. — Phe 1 novembre 2014 à 08:54 (UTC)
Après consultation avec des experts de pywikibot, j'ai appris que c'est un bogue connu dans pywikibot lui-même: bugzilla:59678. Il y a apparement un correctif en cours de dévelopement, mais il n'est pas encore en place. :-( MPelletier (WMF) (d) 1 novembre 2014 à 15:14 (UTC)

About OCR.js[modifier]

I discovered again your script mul:MediaWiki:OCR.js and I'm using it as a piece of a very bold project (I'll invite youto take a look as soon as I'll be satisfied by it). I found that it returns hOCR conversion of mapped djvu text layer! A suggestion: save it as it is into a localStorage variable (presently I'm running a slightly modified versio of do_hcr(), and it saves hOCR into localStorage.hOCR and a simplified, but interesting text where line breaks and paragraphs breaks are saved into localStorage.OCR).

I hope to go on - to get so fastly a hOCR transform of my beloved djvu mapped text layer is a dream for me - and if you like I'll be happy to share anything with you--Alex brollo (d) 1 novembre 2014 à 17:45 (UTC)

The hocr should be served very fastly from the server, I don't expect more than 0.5 second of latency for the request, beside that localstorage is very limited, 5 MB if i remember correctly for FF. I already needed to increase it a lot to be able to work on multiple wiki, so I don't think it's very useful, in what case do you see a use for it ? Beside that, did you notice mul:MediaWiki:Hocr.js, I announced it on the mail list a few month ago but I don't see it used except on fr:. It contains a bit of your own code. — Phe 1 novembre 2014 à 18:26 (UTC)
I only save into localStorage.hOCR (I could use a normal variable too) hOCR of current page; better: the of the last page where I called the routine. I use localStorage when I like to have persistent data.
I'll just beginning to study possible uses of hOCR. They are many and very interesting! One from the simpler ones: "pseudo-cropping" of the image; t.i. manipulating front image to enlarge and center the text area, by some calculation of coordinates of text area into the whole image.
My goal is to extract something about text structure and format. --Alex brollo (d) 3 novembre 2014 à 00:22 (UTC)
Where is your code ? — Phe 3 novembre 2014 à 11:56 (UTC)
Presently alex_do_hOCR() and some related functions to save and use lines and paragraphs fromhOCR are here: it:User:Alex brollo/pagina.js, the whole page being the "exotic page edit environment" called by it:MediaWiki:Gadget-newThumbs.js. It's work in progress, don't expect documentation nor a well structured code. :-( --Alex brollo (d) 4 novembre 2014 à 06:22 (UTC)
Ok, I did that [5], but I'm unsure if it's what you need. — Phe 4 novembre 2014 à 13:06 (UTC)
Perfect :-)
I'm working presently to scripts collected into it:User:Alex brollo/hOCRlab.js. The idea is, to build a Detail object, extracting any possible & useful data from localStorage.hOCR (now I'll point scripts to localStorage.ws_hOCR and I unuseful remove code to store it). Such Detail object contains:
  1. this.dimensioniPagina : a list of x1,y1,x2,y2 of the whole page
  2. this.dimensioniTesto : a list of x1,y1,x2,y2 of the main text box t.i. .ocr_carea element;
  3. this.parole : the list of words with their coordinates (classes .ocrx_word)
  4. this.linee: the most interesting one, the list of lines converted into objects, all data coming from this.parole; lines have presently these fields:
    1. Id: number of line
    2. lgap: left indent
    3. rgap: right space
    4. length: length of line box
    5. height: height of line box
    6. testo: text of line
    7. x1,y1,x2,y2: coordinates of line box.
Now, it's a matter to study such objects from various kinds of pages, and to imagine tools to "sniff" something more. here some examples:
1. if most lines have a similar lgap & rgap, text is a prose justified text;
2. if a line has a significant lgap, and previous line has a significant rgap into a prose text, here a paragraph begins;
3. if a series of lines have a similar significant lgap, and a similar rgap, this means that there's a text block:
4. if a series of lines have a similar significant lgap, but differ in length and rgap, this means that text is a poem;
5. if there's a similar significant lgap and rgap, line should be a centered text;
6. if there's an unusually high ratio length of line/lenght of text in characters there's something strange, and if there's too a high line height, text has a larger font for sure;
7. … and much more.
I apologize for length; consider that this is my "impossible dream" from years ;-) --Alex brollo (d) 6 novembre 2014 à 10:18 (UTC)
Perhaps it'll better to do a part of the conversion on the server side and add a format parameter labs.hocr_cgy.py?format=hocr for the actual format and a ?format=json to get a json object contaning all the possible data. { 'page' : { 'x1' : x1 ... }, 'carea' : { 'x1' :... }, 'lines' : [ { 'lgap' : ..., 'rgap' : ... }, { 'lgap' : ... }] };. This way the format could be extended w/o breaking the js code using it, actually the hocr doesn't contains words confidence and other info but in future it'll contain that, and using our own format will allow also to convert finereader xml to our own format and to get more data. Beside that, isn't it possible to have multiple carea on a page ? — Phe 6 novembre 2014 à 11:21 (UTC)
I imagine great developements, but presently I'll go on with this "word-only" simplified structure, just to explore how much formatting can be guessed. About multiple ocr_carea (and multiple ocr_par and ocr_lines: presently hOCR is a "single line into a single par into a single area list of words"): yes, djvu text layer has inside much more details, where can I browse the code that produces hOCR from DjvuLibre outputs? But consider that often high-level blocks are simply wrong and disturbing while absolute word coordinates are almost alwais right. So perhaps would be a good idea to ahead with word coordinates only. --Alex brollo (d) 7 novembre 2014 à 19:32 (UTC)
[6], file djvu_text_to_hocr.py — Phe 7 novembre 2014 à 20:46 (UTC)

PS: I uploaded a local copy of mul:MediaWiki:OCR.js into it.source to be free to edit it as little as I can to link it to a test callback routine. So feel free to change original OCR.js as you like, you'll not break anything of my tries. --Alex brollo (d) 7 novembre 2014 à 19:47 (UTC)

Van Hasselt - nouvelles poésies[modifier]

Merci Phe pour ce travail. J'avoue que cela m'étais un peu sorti de la tête, ce fichier incomplet.

--JLTB34 (d) 5 novembre 2014 à 14:46 (UTC)

Broken again on pt.wikisource[modifier]

Hi, the M&S instace is broken again on pt.Wikisource since 2 November, despite it's working here on fr.Wikisource. I was quietly waiting a new restart of the instance, but just noticed that it isn't a global bug. 555 (d) 5 novembre 2014 à 16:55 (UTC)

sorry I didn't notice it was broken on pt:, I'll restart it in a few minutes. for a definitive fix I'm waiting [7]. — Phe 5 novembre 2014 à 16:59 (UTC)

Now your entire bot disappeared (!). [8] returns server error and [9] returns 404 error O_O 555 (d) 6 novembre 2014 à 20:59 (UTC)

Labs was entirely down this afternoon. — Phe 6 novembre 2014 à 23:06 (UTC)

Djvu trop lourd : liens[modifier]

Bonsoir Phe,

Voici le détail du djvu dont je t'ai parlé sur irc hier soir : je l'ai ajouté ici.

Merci de ton aide. --Zyephyrus (d) 8 novembre 2014 à 20:54 (UTC)

J'ai répondu sur cette page. — Phe 8 novembre 2014 à 22:34 (UTC)

News about OCR.js into it.source[modifier]

I deeply reviewed drafts script to point them to localStorage.ws_hOCR. Now, a click on your OCR button:

  1. stores hOCR into localStorage.ws_hOCR;
  2. builds an object mw.pagina
  3. uses it to build the page text where line breaks are calculated from word coordinates x1.y1.x2.y2
  4. stores it as JSON structure into localStorage.ws_hOCR_page

Presently I'm focused to a hard statistical issue, t.i. to catch meaningful differences into various line attributes (lgap, rgap. width, height…) from non meaningful, small, random ones. The algorithm should be safe and fast; a little bit of luck is needed… I'll let you know for result. --Alex brollo (d) 10 novembre 2014 à 08:01 (UTC)

After hard headaches, perhaps I found the way :-) --Alex brollo (d) 11 novembre 2014 à 09:09 (UTC)
OK, a function grouped(list_of_objects, number_of_groups, attribute, exclude_last_item) retuns obiects passed into the first parameter (i.e. line objects) as sub-lists of the same objects classified by attribute into number_of_groups grups.
An example call:
grouped(mw.pagina.linee,40,"lgap",false)
returns 40 sub.lists of lines, where the first group collect left-aligned, non-indented ones, the second collect indented ones; "strange" lines are sprayed randomly in other groups, most of them being empty. This is what I needed to go ahead. I'm testing the script on different pages with unexpected, interesting results (the most surprising is that line height is far from costant: it depends on characters into the text, so that line height of aaa aaa aaa is much lower than height of fpfpfpfp fpfpfpf fpfpfpf… far from obvious, till I saw it!).
I hope that obtaining running, useful applications is a matter of days. --Alex brollo (d) 13 novembre 2014 à 13:11 (UTC)
Two screenshots for you: file:TextSelect 1.png, file:TextSelect 2.png. --Alex brollo (d) 14 novembre 2014 à 09:47 (UTC)

Script s long[modifier]

Salut Phe,
Dans les erreurs qui traînent dans le script :

  • « bosquet » (au singulier comme au pluriel) est transformé en « busquet » ; comme il y en a pas mal par page, c'est un peu gênant
  • « citer », correctement reconnu par l'OCR est remplacé par « effet » ; ce qui est encore plus bizarre.

J'ai essayé de comprendre, mais je ne m'y retrouve pas du tout dans le script - et Acer n'est pas là aussi souvent que toi ;) --Acélan (d) 19 novembre 2014 à 11:53 (UTC)

ça devrait aller maintenant. — Phe 19 novembre 2014 à 13:02 (UTC)
Merci à tous les deux...
Acelan & Phe, j'espère qu'il ne s'agit pas d'erreurs récemment introduites ?
En tout cas je corrige (lentement) de nbses approximations dues à mon apprentissage sur le tas, et il reste du taf aussi bien pour les corrections que pour les regexp à faire. --Acer11 (d) 19 novembre 2014 à 19:31 (UTC)

Bonjour,
Autre bizarrerie : le script transforme "houille" en "signifie" (j'ai vérifié : c'était bien "houille", correctement océrisé)
Acer11, je ne sais pas si ces erreurs sont récentes. --Acélan (d) 29 novembre 2014 à 11:25 (UTC)

Fait Yes check.svgPhe 29 novembre 2014 à 12:53 (UTC)
La plupart de ces erreurs viennent d'un défaut de conception dans l'établissement de la regexp, défaut que je vois bien maintenant, mais il faut reprendre la plupart des regexp, ce que je fais petit à petit, car maintenant il y en a quand même un certain nombre... Bien à vous deux :-) --Acer11 (d) 29 novembre 2014 à 17:00 (UTC)
Je m'en occupe aussi de mon côté, en quelques mots, je restreins un peu la regexp fautive puis je regarde si je ne supprime pas de correction correcte et je les réintroduis de façon plus spécifique. — Phe 29 novembre 2014 à 17:03 (UTC)
Merci Phe ! Tip-top ! Hrsment que tu px être + réactif que moi... --Acer11 (d) 29 novembre 2014 à 17:07 (UTC)

Problème[modifier]

Bonsoir Phe

Voilà j’ai ce message:

Erreur de la base de données Une erreur de requête de base de données s'est produite. Cela peut provenir d'un bogue dans le logiciel. Fonction : User::incEditCount Erreur : 1205 Lock wait timeout exceeded; try restarting transaction (10.64.16.27)

Je ne parle pas anglais, alors je ne sais pas ce que ça veut dire

Il s’affiche quand je veux enregistré mes modification, ça arrive de temps à autres, ce n’est pas systématique, De plus ça met un temps fou avant d’afficher le message, j’ai l’impression que ça fonctionne au ralentit , cela vient-il de mon ordi ou pas.

Merci de m’éclairer. --Le ciel est par dessus le toit (d) 19 novembre 2014 à 20:44 (UTC)

Pas de lumière, j'ai le même problème, il est quasi impossible d'éditer, je retenterais dans quelques heures ;( — Phe 19 novembre 2014 à 20:46 (UTC)
Merci d’avoir pris le temps de me réponde, bon alors… patientions ! --Le ciel est par dessus le toit (d) 19 novembre 2014 à 20:51 (UTC)

Travail sur les articles déjà créés[modifier]

Bonjour,
J'ai ajouté un paragraphe à la page de discussion de l'aide sur le Rozier. Peux-tu t'y reporter et me donner ton avis ? merci d'avance, --Acélan (d) 21 novembre 2014 à 11:32 (UTC)

Graphs[modifier]

Hi,

Is there any special reason why pt.Wikisource isn't included on ProofreadPage graphs ([10],[11]) or it is only due to the large time without any progress from that subdomain within this extension? Is possible to add support? Many thanks, 555 (d) 24 novembre 2014 à 05:17 (UTC)

I thought pt was in the statistics graph, but looking at the history of the code it was never added, no idea why, I added it, note pt color is nearly the same as fr color. By the way, what happened here at 2014 start [12], is it a bug in the stats ?
Many thanks!
It was only a major cleanup 555 (d) 25 novembre 2014 à 06:44 (UTC)

renommage en "batch"[modifier]

Bonjour Phe,

Je voulais savoir s'il existe un tools qui existe déjà pour renommer en "batch" des pages d'un fichier DjVu qui sera renommé sur Commons... Si oui, comment fait-on pour l'utiliser? Si non, je vais m'organiser pour en faire préparer un que les admins de WS pourront utiliser. --Ernest-Mtl (d) 29 novembre 2014 à 06:21 (UTC)

Oui, nous avons une procédure assez simple pour le renommage ; c'est l'effacement en batch que nous n'avons pas, nous devons effacer les pages une par une. --Zyephyrus (d) 29 novembre 2014 à 07:55 (UTC)
Il y a des facilités pour ce type de renommage, mais uniquement pour les administrateurs. — Phe 29 novembre 2014 à 12:34 (UTC)
Bonjour Notification Phe : et Notification Zyephyrus :... merci pour cette réponse. Comme je suis file mover sur Commons, j'ai débuté hier mes corrections d'erreurs de mes premiers volumes que j'avais inséré en septembre dernier et qui ne répondait pas à la convention de nommage des œuvres. Comme la plupart n'avait que peu ou pas de pages de traité, ce fut simple... À l'inverse, j'en ai quelques-uns qui ont beaucoup de pages à déplacer... Dans un cas pareil, 1. où est-ce que je peux faire une telle requête? et 2. dois-je déplacer le fichier sur Commons avant d'effectuer ma requête ou une fois que les pages ici auront été renommées... --Ernest-Mtl (d) 29 novembre 2014 à 17:57 (UTC)
Il vaut mieux faire directement la demande ici et ne pas faire le déplacement sur commons toi-même, j'ai file mover sur commons et je suis admin ici ce qui me donne des facilités pour faire le renommage des Page: en masse sans conserver les redirects. Je ne peux pas toujours faire le travail immédiatement mais ça sera fait dans les 24 ou 48h suivantes. — Phe 29 novembre 2014 à 18:03 (UTC)
Merci Phe! J'ai 4 livres qui doivent être renommés sur commons et ici et sur lesquelles plusieurs pages (sinon toutes) ont été traitées...
Merci beaucoup! :) --Ernest-Mtl (d) 30 novembre 2014 à 03:32 (UTC)
Est-ce qu'il n'y a eu aucun changement dans la pagination ? — Phe 30 novembre 2014 à 03:39 (UTC)
Aucun changement dans les djvu, ni ici... c'était tout simplement pour que les ouvrages soient conformes aux convention de nommage des œuvres, avant d'aller plus loin dans le projet... --Ernest-Mtl (d) 30 novembre 2014 à 04:23 (UTC)
Fait Yes check.svgPhe 30 novembre 2014 à 19:25 (UTC)

Livre:אמרי לב Prières D'un Cœur Israélite (Jonas Ennery, 1848).pdf[modifier]

Bonjour Phe... J'ai créé le fichier DjVu océrisé en français et hébreu de ce document et il est maintenant sur Commons, sous le même nom, mais avec l'extension .djvu au lieu de .pdf ; cela facilitera le traitement du document jusqu'à la fin, même s'il est tout de même très avancé et que l'océrisation était disponible en mode externe selon la discussion.

Il faudrait donc renommer toutes les pages pour utiliser le nouveau document, renommer la page de l'espace livre et le mettre en mode à corriger au lieu de OCR... Comme tu as des accès pour faire le tout sans redirection, je te laisse le tout à faire à ta convenance... Un gros merci! --Ernest-Mtl (d) 2 décembre 2014 à 14:17 (UTC)

Fait Yes check.svgPhe 2 décembre 2014 à 19:05 (UTC)

Encore le script « s long »[modifier]

Ce matin, à l’instant, le bouton a disparu, même en sous-page perso ! Je ne peux donc plus utiliser le script = O'SCOURS ... --Acer11 (d) 13 décembre 2014 à 07:40 (UTC)

Idem pour moi. --Acélan (d) 13 décembre 2014 à 09:21 (UTC)
Il semble que ça vienne de là : https://fr.wikisource.org/w/index.php?title=MediaWiki:Gadget-correct_long_s_data_5.js&diff=prev&oldid=4854122 Si c'est la cas, toutes mes excuses Acélan. Chez moi le bouton est revenu, au moins en sous-page. Tu l'as, toi, en mode édition page ?
Oui, je l'ai récupéré, maintenant, merci Acer11 (et désolée pour le dérangement, Phe) --Acélan (d) 13 décembre 2014 à 10:56 (UTC)

Gadget Typo[modifier]

Salut Phe! Je voulais savoir si l'on avait des indices à savoir pourquoi le gadget typo ne fonctionne plus en mode page depuis 2 jours… Il nous arrivait d'avoir à charger la page plusieurs fois (ou faire des prévisualisations répétées) pour faire apparaître le bouton, mais depuis 2 jours, niet… plus rien! :( --Ernest-Mtl (d) 19 décembre 2014 à 15:22 (UTC)

Oui, je regarde. — Phe 19 décembre 2014 à 18:30 (UTC)
La modification que tu as faite en le déplaçant l'a rendu disponible même en mode page… Merci ! merci ! --Ernest-Mtl (d) 19 décembre 2014 à 21:06 (UTC)

Soucis de match sur br.ws[modifier]

Bonjour Phe ! J'ai l'impression qu'il y a un soucis de matchage sur cette page : br:Implijer:Gwendal/Brouilhed. Le message comme quoi le robot n'a pas trouvé de match n'apparaît même pas. Ai-je fait une mauvaise manip' ? --Gwendal (d) 31 décembre 2014 à 11:30 (UTC)

Au passage, bonne année... :) --Gwendal (d) 31 décembre 2014 à 11:32 (UTC)
Oui, le robot à des problèmes intermittents depuis plusieurs mois, je viens de refaire le match. — Phe 31 décembre 2014 à 13:02 (UTC)