Discussion utilisateur:Phe/2013

Le contenu de la page n’est pas pris en charge dans d’autres langues.
La bibliothèque libre.

Archive 2008-2010 -- Archive 2011 -- Archive 2012 -- Archive 2013

Requête bot[modifier]

Bonne année 2013,

Voici une requête pour robot. Est-ce réalisable ? Merci en tous cas. --Pikinez (d) 2 janvier 2013 à 22:19 (UTC)[répondre]

Réponse là-bas. — Phe 2 janvier 2013 à 23:15 (UTC)[répondre]

Merci. Tu pourrais faire passer un robot sur Livre:Œuvres de Walter Scott, Ménard, traduction Montémont, tome 16, 1838.djvu pour la typographie. Je ne sais pas pourquoi Herisson refuse d'utiliser les points de suspension… --Pikinez (d) 6 janvier 2013 à 14:25 (UTC)[répondre]

Merci. --Pikinez (d) 6 janvier 2013 à 16:16 (UTC)[répondre]

Erreur de correction[modifier]

Une erreur de correction est de laisser une ligne vide sans nowiki [1]. Il serait utile de lister ces erreurs pour les pages « corrigées » et « validées » pour vérifier si les pages nécessitent un nowiki. Qu'en penses-tu ? --Pikinez (d) 6 janvier 2013 à 23:12 (UTC)[répondre]

Je ne peux faire ça qu'à partir d'un dump de la base de donné, le dernier que j'ai est un peu trop vieux, d'ici dix à quinze jours sans doute. — Phe 6 janvier 2013 à 23:15 (UTC)[répondre]
Il y a-t-il des résultats ? --Pikinez (d) 3 février 2013 à 12:51 (UTC)[répondre]
Flûte, j'avais oublié, les résultats Utilisateur:Phe/Pages et livres/Pages avec des lignes vides, cette page ne liste que les pages validées ou corrigées. Cette page ne tient pas compte des sections, il manque les pages avec une ou plusieurs sections et avec des sauts de lignes en trop en fin de section. — Phe 3 février 2013 à 13:45 (UTC)[répondre]

Sections[modifier]

Salut Phe,
Pourrais-tu mettre à jour les sections de l'Encyclopédie ? J'en ai modifié un certain nombre en passant les catégories en revue.
Merci, --Acélan (d) 8 janvier 2013 à 12:54 (UTC)[répondre]

Fait. — Phe 8 janvier 2013 à 13:29 (UTC)[répondre]
Merci. Pour ta question, j'y ai répondu sur ma page de discussion. --Acélan (d) 8 janvier 2013 à 15:26 (UTC)[répondre]

Quand tu auras le temps, pourras-tu créer les articles du tome VIII ? merci, --Acélan (d) 8 janvier 2013 à 20:53 (UTC)[répondre]

C’est fait, mais quelques articles n'ont pas été créé, je regarderai ça dans la journée. 88% des articles catégorisés, 70% avec au moins un auteur. — Phe 9 janvier 2013 à 01:14 (UTC)[répondre]
Merci ! --Acélan (d) 9 janvier 2013 à 05:48 (UTC)[répondre]
En fait je ne crois pas qu'il y ait d'article manquant, ce sont des articles comme INVALIDES qui se trouve à la fin du tome 17 et qui apparaissent en rouge dans l'index alpha/I — Phe 9 janvier 2013 à 10:58 (UTC)[répondre]

J'ai testé en https : ça marche très bien. Je n'ai donc rien testé de plus. Merci pour ton aide ! --Acélan (d) 11 janvier 2013 à 08:00 (UTC)[répondre]

Indexation du premier tome du Trévoux[modifier]

Salut Phe, et bonne année,

Le Tome I du Trévoux est à quelques jours d'être complétement corrigé et sectionné. On se demandait si tu pourras à ce moment là passer ton outil d'indexation, et créer tous les articles et tables dans l'espace principal. Je ne sais pas si ce que tu as fais l'an dernier était juste une ébauche, où si c'est prêt à être utilisé.

Discussion en cours sur la PdD.

Merci ! --LBE (d) 14 janvier 2013 à 21:31 (UTC)[répondre]

Concernant la création des articles du Trévoux : il faudrait sans doute créer un catégorie "A revoir" spécifique du Trévoux, pour pouvoir s'y retrouver dans les "à revoir" de l'Encyclopédie. --Acélan (d) 17 janvier 2013 à 15:38 (UTC)[répondre]
Oui, il va falloir séparer les catégories à revoir. — Phe 17 janvier 2013 à 15:42 (UTC)[répondre]

Bonsoir Phe, J'ai terminé la première lecture du premier tome de Trévoux, ainsi que vérifié les ajouts de section. En ce qui concerne les liens internes, et la relecture complète, je la ferai petit à petit par après.

Peux-tu, dès que tu auras le temps, créer les articles dans l'espace principal ? Merci et bon week-end. Natireland (d) 19 janvier 2013 à 20:33 (UTC)[répondre]

J'aurais bien aimé avoir l'aval de Acer11, mais il est absent jusqu'à la fin du mois, la création peut attendre ? — Phe 19 janvier 2013 à 21:20 (UTC)[répondre]
Pas de problème, j'ai entamé le deuxième tome.
Natireland (d) 19 janvier 2013 à 21:40 (UTC)[répondre]

Bonjour, je ne sais pas si je relance une polémique, mais je crois que lorsqu'il s'agit de verbe, et que le participe passé est en dessous, il ne faut créer qu'une section.

En effet, si l'on crée une section particulière pour le participe passé, l'ordre alphabétique n'est plus respecté. Donc pour moi, la définition du participe passé fait partie de celle du verbe, même s'il introduit une signification particulière.

Qu'en penses-tu ? Natireland (d) 15 février 2013 à 10:33 (UTC)[répondre]

J'ai sans doute modifié les vedettes pour faire ça, mais je m'en souviens plus. Il est possible que j'ai fait correspondre les vedettes au sommaire du début du tome II (index alpha, lettre B), ce message s'adresse à moi ou à LBE ? De toute façon, il suffit de supprimer la vedette en trop pour retomber sur une version correcte. Je vais faire tourner le script de mise à jour dans cinq minutes. — Phe 16 février 2013 à 14:53 (UTC)[répondre]

Auteurs de l'encyclopédie[modifier]

Salut,
Pour ces auteurs, il me semble que certaines formes ne sont pas prises en compte.
(''E. R. M.'') donne bien "Douchet & Beauzée", mais il faudrait ajouter (''E. R. M''.)
Par ailleurs, (''B. E. R. M''.) n'est pas pris en compte pour Beauzée tout seul ; il faudrait éventuellement vérifier si (''B. E. R. M.'') l'est. Il y a également la forme {{sc|Beauzée}}.
Je vais vérifier systématiquement dans les volumes déjà créés pour ces deux auteurs. Merci, --Acélan (d) 19 janvier 2013 à 08:59 (UTC)[répondre]

J'ai ajouté les deux formes de B E R M, pour E R M, je ne comprends pas, les deux formes devraient être prises en compte. — Phe 19 janvier 2013 à 21:17 (UTC)[répondre]
Je crois que j'ai trouvé d'où ça vient, il existe aussi dans l'encyclo la forme (''B. E. R. M'',) avec une virgule à la place du point, c'est peut être cette forme que tu as rencontré. — Phe 31 janvier 2013 à 00:02 (UTC)[répondre]

Titres des articles de la RDDM[modifier]

Bonjour. Dans les interventions de Phe-bot sur les articles de la Revue des Deux Mondes, pourquoi les titres sont-ils enlevés ? Cordialement. Fabrice Dury (d) 28 janvier 2013 à 13:43 (UTC)[répondre]

Flûte, tu as un exemple ? c'est fréquent ? — Phe 28 janvier 2013 à 13:52 (UTC)[répondre]
Voici un exemple ; depuis, j’ai complété la page, voir son état actuel. Fréquence : j’ai l’impression que c’est systématique ; en tout cas sur les cas que j’ai rencontrés (quelques dizaines depuis quelques semaines), je n’ai pas souvenir du maintien du titre par Phe-bot. Cordialement. Fabrice Dury (d) 28 janvier 2013 à 14:11 (UTC)[répondre]
Ha oui, c'est systématique, le titre est présent dans le modèle journal et ne fait pas partie du match & split, je n'avais pas vu ça comme un problème jusqu'à présent mais c'est vrai que c'est ennuyeux. Je vais voir si je peux y faire quelque chose. — Phe 28 janvier 2013 à 14:29 (UTC)[répondre]
Merci, et bon courage ! Fabrice Dury (d) 28 janvier 2013 à 14:41 (UTC)[répondre]
Voilà, c'est fait, par exemple Chronique de la quinzaine - 14 mars 1894, le bot formate le titre de façon très basique, le formatage sera souvent à reprendre lors de la validation. — Phe 28 janvier 2013 à 22:45 (UTC)[répondre]
D'accord ! C'est déjà nettement mieux comme ça pour le lecteur. — Fabrice Dury (d) 29 janvier 2013 à 07:52 (UTC)[répondre]

hOCR[modifier]

dear Phe, I'm exploring hOCR format for OCR texts, with interesting results; the most surprising is, that hOCR code can be loaded as text here and runs perfectly. Here a small example:

Dunque la suddetta serie di coniche d’ indice 4 si compone di due distinte serie, ciascuna d’ indice 2, corrispondenti ai due fasci di corde di contatto incrociate in f o in f ' *).

Heavy, but not so much, and all relevant OCR data are wrapped into tags, and they can be retrieved by javasctipt/jQuery. This opens lots of opportunities IMHO; tell me if you're interested to the issue. A test page is uploaded here: it:Discussioni pagina:Opere matematiche (Cremona) II.djvu/99; hORC has been produced by Tesseract (with ita language files). --Alex brollo (d) 29 janvier 2013 à 07:55 (UTC)[répondre]

Hi Alex, there is also the xml format used by Finereader, the dtd is here and archive.org provide this in file ended by a _abby.gz ([2], on some point it's more complete than hocr (probability of correct recognition for each character is very interesting), it it's more oriented than hocr as a raw output from ocr engine to do more analysis of result, an example :
<page width="2569" height="3963" resolution="400" originalCoords="true">
  <block blockType="Text" l="114" t="38" r="316" b="118">
    <region><rect l="114" t="38" r="316" b="118"></rect></region>
    <text backgroundColor="0" inverted="true">
      <par>
      <line baseline="116" l="130" t="40" r="306" b="116">
        <formatting lang="FrenchStandard" ff="Arial" fs="10." bold="true" color="16777215">
          <charParams l="130" t="68" r="146" b="108" suspicious="true" wordStart="true"
                wordFromDictionary="false" wordNormal="false" wordNumeric="true" wordIdentifier="false"
                charConfidence="25" serifProbability="0" wordPenalty="5" meanStrokeWidth="49">1</charParams>
          <charParams l="146" t="40" r="224" b="116" suspicious="true" wordStart="false"
                wordFromDictionary="false" wordNormal="false" wordNumeric="true" wordIdentifier="false"
                charConfidence="255" serifProbability="255" wordPenalty="5" meanStrokeWidth="49">^</charParams>
        </formatting>
      </line>
    </par>
    </text>
  </block>
</page>

It'll interesting to use hocr data to do at least basic formatting : paragraph split and centered text, can tesseract provide centered text data or must it be done through a not easy at all process of analysis all bbox to recognize centered text ?

Beside that it remains a central question which blocked me to work on that, how to provide automatically such data ? There is two class of solution, 1st, included as comment in the djvu, either as html comment (not very clean) or as djvu annotation (unsupported by mediawiki at the moment) and perhaps it'll an abuse of metadata, see the djvused manpage about metadata key value, this 1st way will require user able to setup these data in djvu file...; the 2nd way is to setup an external server to query the hocr data (or why not the xml provided by finereader) so on each Page: edit (or more likely only on page creation) a query is sent to the server which return the hocr, this is problematic if the server need to create the hocr on the fly, it'll very slow... — Phe 29 janvier 2013 à 10:16 (UTC)[répondre]

Well there is also a 3rd way, putting them manually or with a bot in the talk page (or as comment in the text box) and take the data from it. Another thought about internet archive finereader xml output, using them will solve the cpu used on an external server, it'll less costly to get the _abby.gz file, split it by page and provide this data on a page basis, anyway both hOCR and finereader format would be supported probably by translating on the server both hOCR and xml in a common format so ws site script will have to support only one data format. Supporting hOCR is straightforward, use tesseract to do the job with a clever caching scheme to try to avoid slowness, supporting finereader mean the server must have a way to retrieve internet archive item url, the first request will be slow as the server will need to upload and split the _abby.gz file (it could be done when the Index: page is created to avoid that). — Phe 29 janvier 2013 à 14:20 (UTC)[répondre]
I guess you are interested about :-)
Let my try a couple of ideas. One of them, is a djvu.xml to hOCR converter (some friends are considering a xslt approach; I can't, I'd use python to do the job). The second one is a word-by-word editor for hOCR, running in wikisource edit page. The second one is to study tesseract a little more. I can't promise anything, but I hope in interesting results. I'll let you know anything good (or bad) popping out. Thanks for mostly interesting suggestions.
PS: Aubrey is deeply involved into this stuff.... --Alex brollo (d) 29 janvier 2013 à 20:34 (UTC)[répondre]
I forget to mention auto-highlighting of the image part of a part of the text. — Phe 29 janvier 2013 à 21:43 (UTC)[répondre]
Btw, I've already code to parse abby xml output, quite possible I'll do a basic converter from abby xml to hocr (basic as the format look like complicate and I'll don't try to support it fully, at least in a first time). Beside that I'm unsure what the server need to return as data, perhaps returning an xml object make sense. — Phe 29 janvier 2013 à 22:07 (UTC)[répondre]
"Aubrey is deeply involved into this stuff" Did he starts to work on a possible server side ? or only on using the hocr on client side ? — Phe 30 janvier 2013 à 00:39 (UTC)[répondre]
No, Aubrey is in contact with friends (Federico Boschetti et al.) working to a different project using hOCR (by ocrOpus I presume + java), something terribly complex focused to OCR of ancient greek outside wiki software. Nothing related to wiki or wikisource, but hOCR could be the bridge between the projects. They feel too an indcreasing interest about djvu files - so far they didn't consider them. --Alex brollo (d) 30 janvier 2013 à 14:16 (UTC)[répondre]
It's much more difficult to translate finereader xml to hOCR than I thought, I'll continue that later. I replaced tess 3.0 with tess 3.02 on the toolserver (even 3.02 hOCR doesn't provide word confidence probability ;(, it'll available with the next release, so we will get only bounding box of words). As soon as I've time I'll hOCR'ize a few fr/it books and provide access to their hOCR layer through a api calling a server I'll install on the TS. I'll notice you when ready on your it.ws talk page. — Phe 2 février 2013 à 19:45 (UTC)[répondre]
Only the best new for you. I wrote a simple python routine which converts djvu-like mapped text output into hOCR. I feel djvu-like outout much simpler to manage: it's almost identical to a python object.... and it contains all what is needed. So, any IA djvu can be hOCRized on the fly.
There are other news - a "word by word editor for hOCR into a normal wiki page" is running and much more. But I wonder if you have the needed time to test all this stuff; it's very rough by now. All needed js is into it:MediaWiki:Gadget-hOCR.js; it's dependent from other gadgets by now but I'll solve dependancies for a simpler use. How can I share my python sctipts with you? --Alex brollo (d) 11 février 2013 à 22:34 (UTC)[répondre]
I used the simplest way of sharing: I simply posted python code here: Utilisateur:Alex brollo/djvu text to hOCR. Feel free to use any idea. And - be very patient about my rough style.... --Alex brollo (d) 11 février 2013 à 23:17 (UTC)[répondre]
I just understand your script to upload a hOCR text from it:Indice:Opere matematiche (Cremona) II.djvu; js is into it:User:Alex brollo/hOCR_Phe.js. I added two lines:
callback : function (data) {
        if (data['error'] == 0) {
            //alert('ok\n' + data['text']);
            $(".ourDiv").data("hOCR",data["text"]);
            scriviBox(find_stringa($(".ourDiv").data("hOCR"),"<body>","</body>",0));
        } else {
            alert('something feel bad, error: ' + data['error'] + ' ' + data['text']);
        }
and now one click:
  1. uploades hOCR;
  2. extracts the content of body stripping away unuseful code;
  3. saves it into a local data container;
  4. writes it into textBox, so that it can be edites with "spanP" js application.
Its very simple to convert it into a plain text, but some refining is needed to delete many new lines char to custom to wiki raw text requirements. Thanks for your interest and work! --Alex brollo (d) 13 février 2013 à 07:51 (UTC)[répondre]

Present project[modifier]

I can't use any server-side AJAX (I do nothing about) so, I'll follow this root.

  1. when a Index page is touched:
    1. Alebot loads a copy of djvu file and takes a look to internal text layer
    2. if text layer is mapped with Internet Archive text structure, page by page:
      1. it gets djvu-lisp like text map
      2. it converts into hOCR
      3. it edits it a little bit (removing trailig spaces; removing \n chars; adding some <br /> tag to save line breaks
      4. it uploades resulting html code into the talk page of right Page.

A very simple script will upload html into Page text (if user likes) with a AJAX call. Then hOCR can be edited as-it-is with spanP or transformed into plain wiki text; but, if needed, original hOCR data are permanently stored into Talk page, and can be used in any possible way (I'm thinking about self-formatting: center, font size.... mapping text into image....).

First step will be (now!) to change a little bit your script, to let it run from Talk page. --Alex brollo (d) 13 février 2013 à 21:44 (UTC)[répondre]

Cooper[modifier]

Correction des pages[modifier]

Je suis avec intérêt les corrections effectuées par le robot. Mais je ne suis pas certain d'avoir compris la meilleure manière d'utiliser les pages pré-corrigées.

Par exemple, si les italiques sont déjà crées elles sont souvent fautives et il est souvent plus long de les corriger que de les mettre directement à la main sur un texte par ailleurs correct.
C'est aussi un peu vrai pour les petites minuscules, encore que le modèle demande beaucoup de temps pour être appliqué.
Enfin, y a-t-il un robot (en exercice ou en projet) qui pourrait corriger automatiquement les textes déjà corrigés une première fois : espaces avant et après les signes de ponctuation, apostrophes, guillemets français, tirets de fin de page, etc. ?

Bien cordialement Pibewiki (d) 12 février 2013 à 18:34 (UTC)[répondre]

La qualité des italiques et des petites capitales dépendent de la qualité du scan, quand le scan est de mauvaise qualité, elles sont souvent fautive. Pour la typographie il faut activer le gadget « Typo : crée un bouton qui formate le texte conformément... » dans tes préférences onglet gadget, mais il ne fait pas les tirets de fin de page. — Phe 12 février 2013 à 18:41 (UTC)[répondre]

hOCR: possible use (diff)[modifier]

Great Phe! And now an idea about using the tool. Tell me if it's new and/or useful in your opinion.

You know by experience, I presume, how much hard and annoying is, to fix a good, reviewed text to custom it to a different edition; it occurs often after a match & split. Now, having a good reviewed text of an edition a and a decent OCR of and edition b we can launch a diff between versiones, then filtering differences (i.e., focusing on punctuation differences), and applying them to text a without any change of words. I'm going to explore mediawiki & javasctipt diff routines....

There's a promising API action=compare to drag. --Alex brollo (d) 16 février 2013 à 06:42 (UTC)[répondre]

hlist v. 3.1[modifier]

Salut Phe, pourrais-tu intégrer la dernière version de la classe hlist dans MediaWiki:Common.css ? Elle fonctionne à merveille, la nouvelle fonctionalité est particulièrement utile pour des items assez longs, le rendu est parfait ! Merci d'avance ! (genium ) 23 février 2013 à 17:52 (UTC)[répondre]

Fait Phe 23 février 2013 à 18:27 (UTC)[répondre]
Merci ! (genium ) 23 février 2013 à 18:41 (UTC)[répondre]

Demande de remplacement[modifier]

Salut Phe,
Est-ce que tu pourrais, sans que ça te prenne trop de temps, remplacer, dans ce livre (Livre:Topffer - Nouvelles genevoises.djvu) le modèle {{----}} par {{—}} ? il perturbe la mise en page sur le wiki, et en export epub, c'est pire. Eventuellement, si tu peux en profiter pour remplacer les <br /> en début de page par des <nowiki />, ce serait parfait.
Merci d'avance, --Acélan (d) 5 mars 2013 à 09:31 (UTC)[répondre]

Fait Phe 5 mars 2013 à 15:09 (UTC)[répondre]
Merci Merci ! --Acélan (d) 5 mars 2013 à 17:22 (UTC)[répondre]

Il est dommage de dégrader des livres qui sont déjà cohérents et corrigés... Sapcal22 (d) 16 mars 2013 à 09:49 (UTC)[répondre]

[3] « (trad. 1822 - republiée 1966) », il s'agit d'une republication pas d'une nouvelle édition, il n'y a aucun mélange. Évidemment si ce que que tu as marqué das la boite de titre est faux, il y a un problème, je vais regarder. — Phe 16 mars 2013 à 10:55 (UTC)[répondre]
Je pense qu’il faudrait faire 2 éditions, une à base de la ré-édition de 1966 et celle que tu as créé pour 1922. Il y a beaucoup de différences mineures, les tirets entre les mots, la manière de présenter les dialogues, cf mes dernières contributions... tant que le texte de 1922 n'est pas corrigé, on a une version bâtarde. Sapcal22 (d) 16 mars 2013 à 11:03 (UTC)[répondre]
Je ne pense, à moins que tu puisses apporter un scan de la version de 1966, ce qui n'est pas possible à mon avis à cause du copyright, il n'y a aucun moyen de vérifier la cohérence du texte présenté comme étant celui de 1966 et la ré-édition de 1966. Les pages sont marqués à corriger ce qui est tout à fait correcte vu les différences mineurs qu'elles comporte, je vais m'attaquer au plus gros de ces divergences. — Phe 16 mars 2013 à 11:15 (UTC)[répondre]
[4] «  vous refurez donc de m’obliger » « Vous refusez d’obéir à la voir de l’honneur », c'est ça un livre cohérent et corrigé ? — Phe 31 mars 2013 à 11:01 (UTC)[répondre]
Bravo, tu viens de relever 2 erreurs dans le livre imprimé... je les ai marquées en corr. Sapcal22 (d) 19 avril 2013 à 07:32 (UTC)[répondre]
Qui me me garantit que ces erreurs sont bien dans le livre imprimé, et des erreurs comme celle-là j'en ai relevé d'autre, la republication de 1966 est-elle réellement aussi médiocre qu'elle recopie les erreurs de celle de 1822 et en rajoute d'autres ? Si ce travail que j'ai soi-disant dégrader d'un état déjà cohérents et corrigés était d'aussi grande qualité que tu le prétends, pourquoi toute ses erreurs sont-elles présentes depuis des années ? Et combien d'années ces erreurs vont-elles rester ? — Phe 19 avril 2013 à 10:47 (UTC)[répondre]

Bonjour, je voudrais être sur de bien comprendre le modèle, actuellement il n'y a aucun classement si le livre n'est pas de type dictionary ou journal et que la page est une sous-page ? — Phe 22 mars 2013 à 21:20 (UTC)[répondre]

Ha oui, j'ai compris si XYZ/Chapitre I est catégorisé, on veut trié à XYZ en priorité. — Phe 22 mars 2013 à 21:24 (UTC)[répondre]
Bonjour,
Oui c’est bien ça. Je n’ai pas été plus loin, car je n’avais pas de liste précise des cas possibles. Il y a donc certainement des choses à préciser. Marc (d) 23 mars 2013 à 15:40 (UTC)[répondre]

C’est difficile de voir ce qu’il faut faire avec le type recueil. Peut-être faudrait-il ajouter un paramètre dans les index pour laisser tout simplement le choix du classement aux contributeurs. Marc (d) 23 mars 2013 à 18:06 (UTC)[répondre]

bot sur de:[modifier]

Bonjour Phe,

Je rencontre un problème sur Wikisource germanophone avec match et split : j’importe un texte très long (de:Der Mann ohne Eigenschaften/Zweiter Teil) et à partir de la page 288, j’ai un message qui me dit que la couche texte n’est pas détectée. Pourtant il y a une couche texte. J’ai essayé de faire un match avec seulement une partie du texte et j’ai le même problème.

Sinon, serait-il possible que phe-bot obtienne là-bas le statut de bot pour ne pas encombrer les modifications récentes ?

Merci pour ton aide. Marc (d) 4 avril 2013 à 13:10 (UTC)[répondre]

C'est bon, le djvu avait été tronqué lors de l'upload de commons vers le toolserver et la couche texte était incomplète, j'ai fait le match il reste le split à faire (il y a un no match pour la dernière page). Il faudra que je détecte mieux les upload foireux. — Phe 4 avril 2013 à 13:54 (UTC)[répondre]
Merci. J’avais eu un message d’erreur à la fin de l’import, mais comme le fichier était bien sur commons, je n’ai pas pensé qu’il pouvait être défectueux. Dois-je le réimporter ? Marc (d) 4 avril 2013 à 14:19 (UTC)[répondre]
Non, c'est bon, je ne suis pas sur de ce qui c'est passé, le fichier était peut-être encore en cours de traitement juste après l'upload quand tu as fait le premier match et le toolserver n'a reçu qu'une version tronqué, mais maintenant le fichier est correct sur commons et la version de la couche texte sur le toolserver est identique à celle de commons. — Phe 4 avril 2013 à 14:31 (UTC)[répondre]

Mise à jour[modifier]

Salut Phe,

J'utilise souvent ta page Utilisateur:Phe/Pages et livres/Petit nombre de pages à valider ou à corriger, elle m'a fait découvrir de petits bijoux littéraires en plus de livres à terminer. Pourrais-tu la mettre à jour pour supprimer les livres terminés récemment ?

Bien à toi. --M0tty (d) 19 avril 2013 à 21:35 (UTC)[répondre]

Je la mets à jour à partir d'un dump et je l'ai fait assez récemment, le 7 avril... Je compte attendre la mi-juin avant une de traiter un nouveau dump. — Phe 19 avril 2013 à 21:38 (UTC)[répondre]

Requête pour bot: compatibilité {{tiret}} et italique[modifier]

Salut Phe,

J'ai vu que tu faisais passer ton bot pour corriger les lignes inutiles en fin de page. Serait-il possible du même coup de détecter voir corriger les problème de compatibilité entre {{tiret}} et l'italique ? C'est un truc fréquent sur le Trévoux et sûrement ailleurs, qui ne se voit pas en mode page et qui a des effets très domageables en transclusion.

Pour mémoire, il faut que le mot en césure et italique soit saisi de la façon suivante: {{tiret|''pro|blème''}} et ''{{tiret2|pro|blème}}''.

--LBE (d) 30 avril 2013 à 08:22 (UTC)[répondre]

Création d'un index pour les planches de l'Encyclopédie[modifier]

Bonjour,

Je voudrais créer un index deux matières des planches de l'Encyclopédie à la manière de ceux qui figure sur cette page : http://fr.wikisource.org/wiki/L%E2%80%99Encyclop%C3%A9die/1re_%C3%A9dition

Par exemple pour le tome 1 des planches:

AGRICULTURE ET ECONOMIE RUSTIQUE

-- Labourage

-- Semoir

-- Façon des foins et moisson...

...

AIGUILLER

...

Est-ce que l'explication se trouve quelque part ?

Aussi, l'index des articles de l'Encyclopédie est complet pour les lettres A, B, ... mais il commence à avoir des trous avec H et I et il est incomplet après. Pourquoi? Les liens semblent bien mis pourtant...

Merci de votre aide.

Fortelle65 (d)

PS. J'avais posé cette question au Scriptorium. Je n'avais pas eu de réponse et j'ai vu que vous vous étiez occupé de l'index. Je vous ai posé la question directement.

Pour les index, je les crée au fur et à mesure de la correction des page:, les index sont à jours pour les volumes 1-7 (ou 1-8, je ne suis plus très sur), c'est pour cela qu'il y a des trous à partir de H et qu'ils sont très incomplet après. Pour l'index des planches, je ne sais pas trop comment il faut organiser, tu les connais sûrement mieux que moi. Est-ce qu'il faut une page principale séparé pour les planches ? ou plusieurs ? que faut faut-il mettre dans la page L’Encyclopédie/1re édition, seulement un lien vers le sommaire des planches ou un lien par un domaine de planches (AGRICULTURE ET ÉCONOMIE RUSTIQUE ; etc.) ? Au niveau organisation de la ou des pages d'index planches, il faut suivre l'organisation actuelle, les pages doivent être des sous-pages de L’Encyclopédie/1re édition, il faut probablement deux sortes d'index, une par volume, une par thème (à moins que les volumes correspondent à un thème).

Pour le nommage des pages, il y a plusieurs façon de faire L’Encyclopédie/1re édition/Planches/Volume 1 ou L’Encyclopédie/1re édition/Planches du volume 1 de même pour les index par thème. Bref il y a des choix à faire. Le mieux est de faire un brouillon d'organisation sous forme de liste et de sous-liste et d'en discuter, quelque chose comme :

  • AAA
    • BBBB
    • CCCC
  • DDDD
    • EEEEE

etc.

Acélan n'est pas là ce moment, sinon il faut la faire participer à la discussion. — Phe 5 mai 2013 à 13:53 (UTC) — Phe 5 mai 2013 à 13:53 (UTC)[répondre]

M&S robot[modifier]

M&S robot seems not running. I love it.... I hope that it's something simple to fix (thanks for your work). --Alex brollo (d) 11 mai 2013 à 15:26 (UTC)[répondre]

It restarted. — Phe 11 mai 2013 à 18:02 (UTC)[répondre]

Ajax tutorial/example[modifier]

After dragging someway into javascript and into user-like toolbox robots, I'd like to take the last step, t.i. Ajax server-side from toolbox using my toolbox account Alebot. Can you suggest a couple of links (and some scriptsto study) to learn basics?--Alex brollo (d) 20 mai 2013 à 05:23 (UTC)[répondre]

You can get a look at Utilisateur:Phe/Scripts/credits.py for one way to implement the server side. This file must be located as public_html/cgi-bin/credits with 0755 permission, a typical call is [5], a real call from javascript will use format=json (jsonfm return the json data as text) and a callback=your_javascript_function_to_treat_answer. The interesting part of the script start at def query_params(environ):... — Phe 21 mai 2013 à 09:49 (UTC)[répondre]
Thanks! In the meantime, I met your work again, since I imported into it.source Module:Table and I'm learning from it (interesting, highlighting code!). :-)
We are exploring Scribunto ws.loadData() now, very interesting and very promising to enhance automation (my goal is to build a "bot-written, book-specific data table" much more efficient than our present tries with large #switch or js objects)--Alex brollo (d) 25 mai 2013 à 17:02 (UTC)[répondre]

Renommage et avertissement : passer outre ?[modifier]

Bonsoir Phe,

« L’utilisateur nnn est réservé pour un compte global », dit l'avertissement lors du renommage ; s'il s'agit d'un compte créé en 2010 avec apparemment zéro contributions nulle part, et-ce que je peux renommer, en passant outre sur le message d'avertissement ? ou y a-t-il à demander un renommage pour le compte global auparavant ?

Merci de ton aide ! --Zyephyrus (d) 29 mai 2013 à 21:15 (UTC)[répondre]

Je ne crois pas que ce soit prudent de passer outre, l'ancien compte serait perdu et il a peut être été créé seulement pour modifier les préférences. — Phe 30 mai 2013 à 15:55 (UTC)[répondre]

Pagelist + javascript + Lua[modifier]

I'm building a d2b and b2d (DjvuToBook and BookToDjvu) routine - t.i. a Lua script which uses a set of data coming from of pagelist tag to get djvu page number from book page and the reverse. The "data container" can be loaded with mw.loadData() function, and it can be built by javascript in a eyeblink (half a second). A first running example (working on a single book obviously) into it:Modulo:Prova/man; I'm going to generalize it and to wrap it into two templates. If you are interested, see also it:Utente:Alex brollo/parseIndice.js, which builds data page. Presently, test data page is it:Modulo:Dati/Opere di Niccolò Machiavelli VI.djvu.

I think that many other useful book-related data could be easiliy collected in an unique data container to be effectively used here and there.

If you think that it can be someway interesting, I could mount a test copy of the whole stuff here into fr.source. --Alex brollo (d) 30 mai 2013 à 06:40 (UTC)[répondre]

One year ago, a talk page here stated that some books have index with roman numbers. Then I wrote a roman converter in mediawiki valeurDeRomain.js but I don't know if someone used it. Later in Lua, it become Module:MathRoman. The converter is in functions r2i = roman2integer and i2r = integer2roman. I use it in Module:Auteur for secular categories (Module:Auteur is build as multi-lingual if you are interested, but it is not ready to use). Have you look at french wikipedia which is more active about Lua but not about index ? --Rical (d) 30 mai 2013 à 11:56 (UTC)[répondre]
I use a DIY roman-to-arabic converter and reverse in the past, but there's no need of this in my tool, since book pages are saved simply as strings, while djvu pages are saved as numbers. Really, the main table summaryzing pagelist output is simply a list, where djvu pages are indexes of strings identifying tjhe book page; so d2b[10] (representing to Page:xxxx.djvu/10) can contain anything, "5" or "xii" or "XV" or "Figure A", while derived b2d is a real dictionary, and value stored into b2d["5"] or b2d["xii"] or b2d["XV"] or b2d["Figure A"] is 10. No matter about numerical value of "5", "xii", "XV" or "Figure A". --Alex brollo (d) 30 mai 2013 à 14:24 (UTC)[répondre]
Interesting idea, there is probably some use of it. I'm unsure why you generate the data in Modulo:Dati/Opere di Niccolò Machiavelli VI.djvu in javascript, doing it fully in lua make sense for me and if you use Modulo:Dati/Opere di Niccolò Machiavelli VI.djvu as a sort of cache, they should be a way to update the cache when the Index: change. A note on the mapping, djvu --> to book is 1:1 but the reverse can be N:1, it's possible to have the same name "Figure" multiple time for different pages, unsure if it's worth to consider that. — Phe 30 mai 2013 à 16:18 (UTC)[répondre]
It happens really that the relationship book pages-> djvu pages is not 1:1; often it's unrelevant (i.e. empty pages usually marked with a - character; but they are empty...), sometimes it's relevant, but can be avoided by try and learn (a "good" pagelist can output different ids for different pages: Figure 1, Figure 2... instead of Figure, Figure...).
I use javascript to build Modulo:Dati/.... since it's easy and fast for tests and it's "user driven" interactively. If the idea will run, a IRC bot can look for any change into Indice: pages, and update data pages as soon as pagelist is changed. Experience says that pagelist tag isn't updated so often. Obviously the whole thing is a pre-alfa idea.
mw.loadData(), with its intelligent "read once - serve many times" mechanism, needs a Modulo page, and a strict syntax returning a single table. Script generalization is going on; take a look to it:Pagina:Manuale di economia politica con una introduzione alla scienza sociale.djvu/583 where the new Lua-based tl|Pg is used, and consider that all the numbers of the page have been wrapped into the Pg template with a single keystroke Alt+Ctrl+l (using Chrome Shortcut Manager). --Alex brollo (d) 30 mai 2013 à 21:11 (UTC)[répondre]

Encyclopédie - volume 9[modifier]

Salut Phe,
Je viens (enfin !) de finir de catégoriser les articles du volume 8. Donc, quand tu auras le temps, pourras-tu lancer la création des articles du volume 9 ?
Merci d'avance,
--Acélan (d) 10 juin 2013 à 15:58 (UTC)[répondre]

Fait. — Phe 11 juin 2013 à 00:17 (UTC)[répondre]
Merci Merci ! --Acélan (d) 11 juin 2013 à 06:38 (UTC)[répondre]

Abbyy xml[modifier]

Just to let you know that I'm working about IA abbyy.xml and that I found that's much less exoteric I presumed. Here: http://it.wikisource.org/wiki/Indice:Fisiologia_del_matrimonio.djvu first results; it's a test book where I'll text OCR extraction from abbyy.xml (pages 17-30 have been uploaded by a bot and come from abbyy.xml parsing; red words are those with a parameter wordPenalty different from 0). I'm sharing scripts with Aarti into a dropbox folder. Would you like to access to that folder? --Alex brollo (d) 17 juin 2013 à 05:02 (UTC)[répondre]

L'encyclopédie[modifier]

Salut, on m'a dit que Phe a créé un gadget d'aide à la catégorisation des pages de l'encyclopédie : je ne sais plus comment on l'activer, mais il pourra t'expliquer. Peux-tu m'expliquer ?

Aussi, j'ai vu que tu as un bot qui crée les articles. Est-ce que c'est bien automatique et ça marche tout seul, ou est-ce que ça vaut quand même le coup que je crée des pages manuellement ? (par exemple si il y a un gros travail préparatoire ou manuel avant de lancer le bot).

Je me suis déjà créé un aide-mémoire Utilisateur:Kipcool/Lencyclopedie, je sais pas si c'est utile pour d'autres. --Kipcool (d) 25 juin 2013 à 17:54 (UTC)[répondre]

J'ai vu que tu étais passé sur IRC, tu as réussi à activé le script ? les trois boutons ajoutés, lang, math et Encl s'utilise en sélectionnant d'abord la partie du texte sur laquelle on veut agir. Il y a aussi MediaWiki:gadget-MiseEnPage.js qui est utile pour reporter les modèles tiret sur la page suivante. Pour les articles, il est inutile de les créer, le bot les créent, et modifie les index alphabétiques et par volume s'il y a lieu, la seule chose qui est nécessaire au bot c'est que les noms de sections soient correctes, ils sont utilisés comme nom d'article. En créant les articles, le bot ajoute les auteurs et catégories si possible. La PdD du scan du volume 1 donne les choix typographiques faits. Un choix qui n'a pas l'air indiqué est le regroupement d'article qui porte le même nom, par exemple L’Encyclopédie/1re édition/BEC contient tout ce qui au rapport au bec, d'oiseaux, instrument de chirurgie etc. C'est fait de cette façon car dans de nombreux cas on a des articles qui commencent par le sujet principal (bec d'oiseaux) dérive sur des becs qui n'ont rien à voir excepté la forme, puis revient sur le sujet principal. L'accès à des parties plus spécifiques des articles se fera plus tard par des redirections /BEC DE GRUE --> #redirect [[../BEC#BEC DE GRUE]] — Phe 25 juin 2013 à 22:16 (UTC)[répondre]
Merci oui j'ai bien activé le script, mais je n'avais pas vu que tu as répondu (fatigué en ce moment...).
Ok alors le bot fait tout le boulot c'est génial :)
j'ai eu hier justement un cas où les redirects seraient utiles (Page:Diderot - Encyclopedie 1ere edition tome 3.djvu/125). Est-ce que c'est quelque chose qu'on peut déjà faire manuellement, ou est-ce que ça n'est pas encore implémenté ? Doit-on déjà rajouter des indicateurs de sections dans les page: ? --Kipcool (d) 27 juin 2013 à 09:01 (UTC)[répondre]
Je compte rajouter les ancres dans les pages et créés les redirect avec un bot, mais rien n'est fait encore. — Phe 27 juin 2013 à 09:45 (UTC)[répondre]

Tableau réparti sur deux pages[modifier]

Bonjour Phe. Je rencontre des difficultés avec les tableaux à cheval sur deux pages, dont j'ai fait part dans les questions techniques. Acélan a commencé à m'aider, mais mes problèmes ne sont pas encore tous résolus. Une rapide investigation sur le système de numéros de pages dans la marge m'a laissé penser que tu étais la personne la plus compétente pour m'aider. En plus de ce que j'ai déjà décrit, j'ai remarqué qu'à la frontière entre les pages 371 et 372 de l'ouvrage sur lequel je travaille, un "<span class="pagenum ws-pagenum" id="356" [...]>" est créé mais il n'y pas d'entrée pour la page 356 dans le "<div id="ct-pagenums">". Mais comprendre tout le javascript qui gère ça est très laborieux pour moi. Pourrais-tu essayer de me dépanner ? BernardM (d) 2 juillet 2013 à 20:07 (UTC)[répondre]

Je vais regarder. — Phe 2 juillet 2013 à 20:10 (UTC)[répondre]
Je vois pourquoi mais je n'arrive pas à corriger, dans [6], refresh_pagenumbers() il y a une vérification que l'offset du span est différent de zéro, apparemment chrome donne un offset = 0 à certain élément s'ils sont vide (mais ce n'est pas systématique...) et je ne vois pas comment contourner le problème. — Phe 3 juillet 2013 à 00:52 (UTC)[répondre]
Errm, c'est corrigé, j'espère que je n'ai rien cassé dans d'autre cas... Il faut forcer un reload du js pour que ça prenne effet. — Phe 3 juillet 2013 à 01:00 (UTC)[répondre]
Merci beaucoup Phe. C'est une intervention qui devrait profiter à beaucoup de monde. BernardM (d) 3 juillet 2013 à 18:48 (UTC)[répondre]

Page:Restif de la Bretonne - Mes inscripcions, éd. Cottin, 1889.djvu/395[modifier]

merci ! Jean-no (d) 7 juillet 2013 à 21:15 (UTC)[répondre]

Encyclopédie[modifier]

Salut,
Je pars en vacances, donc je vais faire un gros break dans la correction de l'encyclopédie.
J'ai fait un certain nombre de modifs dans les sections récemment.
Le tome 10 est presque fini, c'est super (pour le tome 11, c'est encore loin du compte) ; il n'y a plus de grec à corriger, et on approche des 2/3 de pages corrigées ou validées. Je pense qu'on peut s'autocongratuler ;)
A +, --Acélan (d) 12 juillet 2013 à 20:28 (UTC)[répondre]

Passe de bonne vacances :) — Phe 12 juillet 2013 à 21:21 (UTC)[répondre]
Pour le grec il reste une page à vérifier que j'ai ajouté. — Phe 12 juillet 2013 à 21:39 (UTC)[répondre]
OK, c'est fait ; il y en aura vraisemblablement d'autres. --Acélan (d) 12 juillet 2013 à 21:51 (UTC)[répondre]

Remplissage de l'index alphabétique d'un livre[modifier]

Je continue ici la discussion en cours sur les requêtes aux administrateurs parce que je souhaite m'enfoncer encore un peu plus dans le hors-sujet. Comment as-tu peuplé de liens l'index du Bulletin de la société géologique de France ? C'est entièrement manuel ou bien tu t'es aidé d'un programme ? Pour me simplifier considérablement la tâche de faire des liens ancrés dans l'index de Chronique d’une ancienne ville royale Dourdan, je viens d'écrire un script Perl qui donne, pour chaque page d'un livre, la liste des modèles {{ancre+}} préparamétrés à utiliser ainsi que la liste des entrées d'index à modifier avec les liens inclus. Je comptais le publier après l'avoir un peu perfectionné. Exite-t-il déjà mieux ailleurs ? (Je n'ai pas trouvé.) BernardM (d) 18 juillet 2013 à 19:37 (UTC)[répondre]

Je viens de dumper le script que j'utilise dans mes sous-pages Python, je ne sais pas si tu es familier avec python, je détaille un peu, le script est create_ws_link.py, les trois scripts précédent sont utilisé par ce script (les deux premiers sont autres choses sans rapport). botpywi.py doit être modifié : sys.path.append('/usr/src/phe/pywikipedia') --> 'path' à remplacer par le path ou est installé ton pywikipedia. Il me semble qu'il faut aussi qu'il existe un sous-dir /cache de la directory ou tu vas coller create_ws_link.py, ce script s'utilise comme ça (pour ton bouquin)
python create_ws_link.py -lang:fr "-prefix:Chronique d’une ancienne ville royale Dourdan" "Page:Chronique d une ancienne ville royale Dourdan.djvu/455"
puis un run avec /456 etc. Il faut que toutes les sous-pages dans main soient créées (relancer le script alors qu'une Page: soit partiellement lié fonctionne très mal). Le script ne sauvegarde pas la Page: mais dump le contenu dans la console, il faut le copier/coller et regarder le diff avant de sauver (le script à du mal à faire la différence entre un chiffre là par hasard et un numéro de page...). Une description rapide du fonctionnement, le script énumère toutes les sous-pages donné par -prefix:, charge les textes de main, parse les balises <pages index="", récupère le nom de l'index, parse l'index pour récupérer la balise pagelist qui donne la mapping page du livre --> numéro de page du djvu puis parse la Page:.../455 et pour tout ce qui ressemble à un nombre romain ou entier remplace ce nombre par une {{lp}} qui va bien. Gros inconvénient par rapport à ce que tu fais, les liens ancrés se font vers le début de la page en question (il y a une ancre implicite à chaque début de page dans main qui porte le même nom que l'intitulé entre []). Je ne crois pas qu'il serait facile de l'adapter pour les liens ancrés. Le script accepte aussi une option "-index:" mais je me souviens pas à quoi elle sert...

Je viens de faire un essai puis me suis révoquer [7] Diff, comme tu peux le voir, ça fonctionne mal, les numéros de pages ne sont pas mappés correctement, le problème vient de la présence de plusieurs pagelist dans l'index, mon script ne parse que le premier. Je crois que c'est réparable mais il faudrait que tu sois familier avec python (fonction get_index_def(), il faudrait itérer sur tous les pagelist plutôt que de parser seulement le premier). — Phe 18 juillet 2013 à 22:12 (UTC)[répondre]

Merci de partager tes scripts. Je ne programme malheureusement pas en python. Je pense effectivement que ton script n'est pas aisément adaptable à mon souhait de faire des liens vers des ancres {{ancre+}}. Mon script Perl parse la page "Livre:" puis les pages de l’espace "main". Il est compatible avec des <pagelist> multiples. En plus du nom du fichier djvu, il nécessite un fichier texte contenant l'index sans fioritures autour (que j’obtiens avec "w3m -dump", un coup de "sed" et un peu de finition manuelle). Il est conçu pour être globalement générique, mais nécessite en réalité des adaptations par livre, notamment pour l'expression rationnelle de détection de numéro de page. Pour l’index de mon livre sur Dourdan, j’utilise "/[^0-9-]([0-9]{1,3}) *(,|;|\.|et suiv\.|et s\.|-)/g" en récupérant le contenu de la première expression entre parenthèses. Mon script n'interagit pas en écriture avec Wikisource, mais ce n’est pas très grave puisque le placement des {{ancre+}} nécessite de toute façon une intervention humaine. Voici un extrait de la sortie de mon script, en lui fournissant uniquement une version plaintext de Chronique d’une ancienne ville royale Dourdan/Index et le nom "Chronique d une ancienne ville royale Dourdan.djvu" :
Page 3 (djvu: 17):
Anchors:
        {{anchor+|Age de pierre3|}}
        {{anchor+|Age de bronze3|}}
        {{anchor+|Étangs 3|}}
        {{anchor+|Haches celtiques3|}}
        {{anchor+|Moutié 3|}}
        {{anchor+|Orge 3|}}
        {{anchor+|Pictet3|}}
        {{anchor+|Yveline 3|}}
Index entries:
        Age de pierre, [[Chronique d’une ancienne ville royale Dourdan/1#Age de pierre3|3]].
        Age de bronze, [[Chronique d’une ancienne ville royale Dourdan/1#Age de bronze3|3]].
        Étangs (les) de Dourdan, [[Chronique d’une ancienne ville royale Dourdan/1#Étangs 3|3]], 107, 130, 327, 432.
        Haches celtiques, [[Chronique d’une ancienne ville royale Dourdan/1#Haches celtiques3|3]].
        Moutié (Aug.), président de la Société archéol. de Rambouillet, [[Chronique d’une ancienne ville royale Dourdan/1#Moutié 3|3]], 19, 37, 39, 64, 109, 340, 376.
        Orge (l’), rivière de Dourdan, 1, 2, [[Chronique d’une ancienne ville royale Dourdan/1#Orge 3|3]], 10, 87, 180, 299, 314, 359, 361, 363, 367, 385, 387, 392, 398, 399, 405.
        Pictet, de Genève (M.), [[Chronique d’une ancienne ville royale Dourdan/1#Pictet3|3]].
        Yveline (forêt d’), [[Chronique d’une ancienne ville royale Dourdan/1#Yveline 3|3]], 380.

Page 4 (djvu: 18):
Anchors:
        {{anchor+|Monnaies gauloises4|}}
        {{anchor+|Potiers à Dourdan4|}}
        {{anchor+|Riocreux et Millet 4|}}
Index entries:
        Monnaies gauloises, [[Chronique d’une ancienne ville royale Dourdan/1#Monnaies gauloises4|4]].
        Potiers à Dourdan, [[Chronique d’une ancienne ville royale Dourdan/1#Potiers à Dourdan4|4]], 161, 316.
        Riocreux et Millet (MM.), de la manufacture de Sèvres, [[Chronique d’une ancienne ville royale Dourdan/1#Riocreux et Millet 4|4]].

Page 5 (djvu: 19):
Anchors:
        {{anchor+|Cimetière gallo-romain5|}}
        {{anchor+|Romains 5|}}
Index entries:
        Cimetière gallo-romain, [[Chronique d’une ancienne ville royale Dourdan/1#Cimetière gallo-romain5|5]].
        Romains (les) à Dourdan, [[Chronique d’une ancienne ville royale Dourdan/1#Romains 5|5]].
Ce script ne peut tourner qu'une fois que le sommaire (de la page Livre:) et tout l'espace "main" du livre sont créés, mais permet de s'occuper de l'index au fur et à mesure qu'on édite l'espace Page:. BernardM (d) 20 juillet 2013 à 12:53 (UTC)[répondre]

Groupe d’utilisateurs Wikisource[modifier]

Wikisource, la bibliothèque numérique libre s’oriente vers une meilleure mise en œuvre de la gestion des documents, la relecture et le téléchargement. Chaque communauté linguistique est très importante dans Wikisource. Nous aimerions proposer un groupe d’utilisateurs Wikisource, qui serait une organisation souple et volontaire pour faciliter la sensibilisation et encourager le développement technique, rejoignez-le si vous vous souhaitez donner un coup de main. Cela permettrait également de donner une meilleure façon de partager et d’améliorer les outils utilisés sur les Wikisources locales. Vous êtes invités à rejoindre la liste de diffusion Wikisource-l (anglais), le canal IRC #wikisource, la page Facebook ou le compte twitter Wikisource. Dans le cadre du Google Summer of Code 2013, quatre projets liés à Wikisource sont présentés. Pour obtenir les meilleurs résultats de ces projets, nous aimerions recueillir vos commentaires. Les projets sont listés sur Wikisource : tous les projets. Vous pouvez trouver le rapport de mi-parcours sur le travail de développement effectué au cours de l’Individual Engagement Grants sur Wikisource ici.

Global message delivery, 25 juillet 2013 à 00:21 (UTC)

Fonctionnement de <pages/> et Module:Header template[modifier]

Bonjour Phe. Comment tu peux le voir dans les questions techniques, je voudrais personnaliser les numéros de pages dans un header de transclusion. J'étais prêt à modifier le Module:Header template, mais je me suis rendu compte qu'il y avait du traitement fait en amont de ce module. Les numéros de pages djvu sont déjà traduits en pages de l'édition papier (grâce à <pagelist/>) quand ils y arrivent. J'ai vu que tu as participé au Module:Header template. Peut-être connais-tu le fonctionnement de <pages/> et pourrais-tu m'aiguiller ? Merci. BernardM (d) 10 août 2013 à 22:01 (UTC)[répondre]

Répondu la bas. — Phe 10 août 2013 à 23:32 (UTC)[répondre]

Bonjour Phe. Je te prie de m'excuser d'avoir modifié le sommaire de cet ouvrage. Je l'avais fait pour modifier la date de l'édition qui est erronée et pour ajouter la page de titre qui manque et qui indique la bonne date. Il reste que le djvu est de 1869 et non de 1782 et que la couche texte qui lui est associée et qui a fait l'objet de la transclusion ne correspond ni à l'édition de 1782, ni à celle de 1869, et qu'elle est très fautive. Très cordialement. Pibewiki (d) 11 août 2013 à 22:15 (UTC)[répondre]

Ha oui, effectivement, j'aurais du conserver le changement de date. J'ai remis la date du scan. Il me semble que la différence la plus fréquente est & --> et, je vais faire ça avec un robot, ça réduira pas mal la quantité de travail. — Phe 11 août 2013 à 22:18 (UTC)[répondre]
C'est en cours, ça sera fini d'ici vingt à trente minutes. — Phe 11 août 2013 à 22:24 (UTC)[répondre]
Les & et les et sont en effet utilisés de manière aléatoire dans cette version, bien que j'aie cru qu'il y avait une raison sémantique au départ. Si un robot peut le faire, ce sera formidable. Les notes originales de l'auteur sont effacées elle aussi (peut-être s'agit-il de la transcription de ebooks libres et gratuits). Par ailleurs, ce serait intéressant de savoir ce que peuvent faire les robots, car cela éviterait d'apporter des corrections qui peuvent être réalisées de manière automatique. Merci Pibewiki (d) 12 août 2013 à 00:22 (UTC)[répondre]

Bonsoir,

Je commence seulement à reprendre les scans de Buzz pour y coller le texte de l’espace principal, sauf qu’un certains nombre d’entrées ont été déjà transcluses à partir du scan de la mauvaise édition.

Je reprends le wikitexte dans la version historique avant transclusion pour le remettre dans le fac-simile. Ensuite, je mets à jour la référence au FS dans l’entrée.

Est-ce correct ? (voir la préface fs et wikitexte modèle (version du 6 juillet 2009))

Ça va être un peu long pour les premières entrées jusqu’à « Appui », heureusement que les suivantes n’ont pas bougé.

--Marceau (d) 30 septembre 2013 à 17 : 35 (UTC)

Oui, mais tu peux faire plus rapide si tu utilises le Match & Split, je ne me souviens plus si tu l’utilises, en copiant/collant une entrée dans une de tes sous-page et en faisant le M&S là, une fois fait le <pages est à copier dans l’entrée. Quand tu as plusieurs entrées sur la même Page :, le bot s’occupera d’ajouter les sections et d’ajouter le from= là ça va bien. — Phe 30 septembre 2013 à 17 : 44 (UTC)
Oui, merci, je ne m’en suis jamais servi. En fait, après avoir récupérer dans l’historique de l’entrée le wikitexte qui correspond, la correspondance page à page, ce n’est pas le plus long.
Il faut par contre moderniser le wikitexte : plus de balises <center>, utilisation des modèles DRAFL, DRAFL2 et DrafIm, peut-être remplacer les <span id="…" > par des {{ancre}}s, replacer les images pour respecter le plus possible le FS, voir dans l’historique si il y a des modifs à réappliquer sur le FS, et c’est beaucoup plus long. Plutôt que faire une section de chaque entrée, je préfère aussi employer {{MotAncre}} pour ne pas casser la mise en page.
Le plus compliqué sera de mettre à jour les liens vers les pages FS dans l’index par communes car les n° djvu des pages ne correspondront plus (je suis en train de faire une table de conversion).
Petite question subsidiaire : les routines de conversion vers les "epub" partent-elle du wikitexte ou du généré HTML ?
--Marceau (d) 1 octobre 2013 à 08:08 (UTC)[répondre]
À partir du html. — Phe 1 octobre 2013 à 08:19 (UTC)[répondre]

Robot[modifier]

Bonjour Phe,
Je crois que ton robot a bogué. Est-ce ma page est trop conséquente ? Cordialement,--Gwendal (d) 12 octobre 2013 à 16:08 (UTC)[répondre]

Il a l'air de s’être arrêté à la page 155, je vais regarder. — Phe 12 octobre 2013 à 18:39 (UTC)[répondre]
Je l'ai relancé à partir de la page 156, il y a bien eu un problème mais sans rapport avec la taille de la page. — Phe 12 octobre 2013 à 18:47 (UTC)[répondre]

Robot pour des vers[modifier]

Salut Phe,
A un moment, pour des poèmes, j'ai utilisé une syntaxe du type <poem style="margin-left:7em"> pour les poèmes en vers plus courts que des alexandrins. Or, le décalage est plutôt catastrophique sur une liseuse.
Comme la syntaxe <poem class="verse"> n'est pas prise en compte sur la liseuse, mais a un rendu satisfaisant sur le site, je me demandais si tu ne pourrais pas demander à ton robot de passer sur un certain nombre de pages pour corriger ça ?
Evidemment, la valeur peut changer d'un poème à l'autre...
Il faudrait donc remplacer tous les <poem style="margin-left:Xem"> ou <poem style="margin-left:Xem" > par <poem class="verse">
Je ne sais plus quels sont les volumes concernés (heureusement, je n'ai pas tellement corrigé de poésie), mais il y aurait au moins :

Merci d'avance, --Acélan (d) 18 octobre 2013 à 13:12 (UTC)[répondre]

C'est en cours, ajoute les autres volumes si tu en retrouves. — Phe 18 octobre 2013 à 13:28 (UTC)[répondre]
Merci beaucoup !
Il y en a effectivement d'autres :
Il y a encore un autre cas : un texte en prose, mais dans lequel de nombreux poèmes sont cités
Ici, la syntaxe est du type <poem style="margin-left:7em; font-size:85%"> (avec sans doute des variantes concernant la valeur du retrait, voire dans l'ordre entre les paramètres) à transformer en <poem style="font-size:85%" class="verse">
--Acélan (d) 18 octobre 2013 à 14:27 (UTC)[répondre]
Voilou, c'est fini. — Phe 18 octobre 2013 à 19:14 (UTC)[répondre]
Merci Merci ! encore ! --Acélan (d) 18 octobre 2013 à 19:45 (UTC)[répondre]

Modèle abréviation, suite[modifier]

Bonjour !

J’ai donc vu la modification que tu as effectuée dans Common.css, et t’en remercie. Pourrais-tu rajouter à ta nouvelle section abbr[title] l’attribut : cursor : inherit; (pour que le curseur ne se transforme pas en gros point d’interrogation) ? Et, question subsidiaire, as-tu compris pourquoi la section qui s’appliquait jusqu’alors :

/* utilisé par le modèle:1er par exemple */
.abbr {
  border-bottom : none;
  cursor : default;
}

semble ne plus s’appliquer ? Merci ! cbonnery (d) 27 octobre 2013 à 14:18 (UTC)[répondre]

Fait . Parce que abbr[title] est une règle plus spécifique que .abbr {}, .abbr {} s'applique d'abord, puis abbr[title] qui annule les effets de .abbr {}. Les devs de mediawiki ont ajoutés récemment une règle abbr[title] { border-bottom:1px dotted; etc. } qui prenait le dessus sur notre .abbr, le nouveau abbr[title] dans common.css est chargé après cette nouvelle règle et prend le dessus. — Phe 27 octobre 2013 à 14:42 (UTC)[répondre]
D’accord, merci beaucoup ! cbonnery (d) 27 octobre 2013 à 18:06 (UTC)[répondre]

Encyclopédie sur Gallica[modifier]

Le lien promis vers les 12 volumes de la première édition publiée sur Gallica : [8]
à + --Acélan (d) 18 novembre 2013 à 22:48 (UTC)[répondre]

Super, merci ! — Phe 18 novembre 2013 à 23:04 (UTC)[répondre]
J'ai essayé le tome 4 pour remplacer la page à problème, le scan est identique au notre :/. Du coup je me demande si ce n'est pas le cas pour tout les autres et que l'artlf a utilisé les scans de Gallica, un peu suprenant que le set ne contiennent que 12 volumes, enfin bref, pour le volume 4 j'ai trouvé un scan qui a l'air identique, au moins pour cette page. — Phe 19 novembre 2013 à 01:15 (UTC)[répondre]
Oui, c'est surprenant, mais je me rappelle avoir passé du temps à chercher, sans trouver les 5 manquants. S'ils les ont, ils sont vraiment très bien cachés. --Acélan (d) 19 novembre 2013 à 07:24 (UTC)[répondre]
J'ai remplacé le tome 4, cette page est réparé mais je vois encore l'ancienne image. Pourtant l'onglet fichier donne la bonne image. Purger ne donne rien. — Phe 19 novembre 2013 à 11:36 (UTC)[répondre]
J'ai déjà vu ce problème. Il me semble que purger ne donnait rien, mais qu'au bout de quelque temps (plusieurs jours ?) ça finissait par arriver... --Acélan (d) 19 novembre 2013 à 12:40 (UTC)[répondre]

Ok, merci ! Simon Villeneuve (d) 25 novembre 2013 à 23:00 (UTC)[répondre]

J'ai refait en conséquence mes contributions, mais je ne vois pas le « </div> » associé. C'est normal ? Simon Villeneuve (d) 25 novembre 2013 à 23:19 (UTC)[répondre]

Les lignes de ta dernière modif devaient servir, je pense, à conserver le format pour les balises du genre style="font-size:91%; line-height:2em". Je ne sais pas s’il vaut mieux le remettre ou pas. À toi de voir. Aristoi (d) 26 novembre 2013 à 11:04 (UTC)[répondre]

Oui, je m'en suis aperçu après, mais avec ces lignes les yyy : xxx ; zzz sont transformés en yyy:xxx;zzz, ou quelque chose dans ce genre, il faudrait quelque chose de plus fin pour réparer les style= — Phe 26 novembre 2013 à 12:17 (UTC)[répondre]
Je vais les remettre pour l'instant, casser les styles est beaucoup plus ennuyeux que de casser la typo — Phe 26 novembre 2013 à 12:21 (UTC)[répondre]

Questions[modifier]

Allo,
Je me pose 2 questions et, à la suite de ta modification, je me suis dit que je pourrais te les poser Clin d'œil.
1- Sais-tu pourquoi un lien vers « POSTFACE » apparaît dans l'en-tête à gauche ?
2- Malgré que la transclusion commence à la page 8, cette dernière, présentant un portrait de Joseph Bertrand, n'apparaît pas. Sais-tu pourquoi ?
Merci ! --Simon Villeneuve (d) 29 novembre 2013 à 12:09 (UTC)[répondre]

Je ne suis pas sur pourquoi ce lien apparaît, /Texte entier n'étant pas dans le sommaire du Livre: je crois que le lien Postface ne devrait pas apparaître, j'ai réglé le problème avec [9]. Pour le portrait, c'est normal : [10] le portrait est en noninclude et ne peut pas apparaître en transclusion, il n'apparaît d'ailleurs pas aussi dans Les Fondateurs de l’astronomie moderne/Préface, il faut supprimer le noinclude dans la Page: et sans doute transclure à partir de la page 9 dans la /Préface pour éviter un gros portrait en début de préface. 29 novembre 2013 à 12:30 (UTC)
Merci pour les tuyaux (et désolé pour le noinclude. J'aurais dû le voir (Smiley Gêné)). Simon Villeneuve (d) 29 novembre 2013 à 15:22 (UTC)[répondre]

Modifications de sections[modifier]

Salut,
Parfois, au fil de la catégorisation, je trouve encore des erreurs dans les sections. Il m'arrive de les corriger dans les articles créés, parce que je m'y retrouve mieux pour la suite. Dans ces cas-là, qu'est-ce qui t'arrange le mieux, le temps que le bot mette les index à jour ? que je supprime les articles qui n'ont plus lieu d'être ou que je les laisse ? si je renomme, faut-il ou non laisser la redirection ? --Acélan (d) 4 décembre 2013 à 09:54 (UTC)[répondre]

Il vaut mieux les laisser, je m'y retrouve plus facilement. — Phe 4 décembre 2013 à 12:00 (UTC)[répondre]

Problème pied de page/scan vertical[modifier]

Bonjour Phe

Toujours aucun changement.

Faut-il que je fasse quelque chose sur mon common js, comme purger la page par exemple, si c’est le cas, ou puis-je trouver ce fameux common js. Merci

Cordialement --Le ciel est par dessus le toit (d) 6 décembre 2013 à 11:10 (UTC)[répondre]

Normalement ce n'est pas nécessaire, mais sait-on jamais..., il est ici Utilisateur:Le ciel est par dessus le toit/common.js. Si ça ne marche toujours pas, peux-tu effacer tout le contenu de cette page et retenter ? — Phe 6 décembre 2013 à 11:18 (UTC)[répondre]
Toujours rien. désolé, si tu veux je peux te donner mes identifiants comme ça tu pourra voir par toi même--Le ciel est par dessus le toit (d) 6 décembre 2013 à 11:33 (UTC)[répondre]
Oui, par mail, là je n'arrive pas à voir où se situe le problème. Spécial:Envoyer_un_courriel/PhePhe 6 décembre 2013 à 12:07 (UTC)[répondre]

hmm, ça m'a l'air correcte, quel navigateur utilises-tu, as-tu la possibilité d'en tester un autre ?

je suis sous safari, et non je n’ai pas d’autre navigateur à ma disposition.--Le ciel est par dessus le toit (d) 6 décembre 2013 à 12:33 (UTC)[répondre]

J'ai oublié, quel version de safari ? — Phe 6 décembre 2013 à 12:37 (UTC)[répondre]
Version 4.1.3 (4533.19.4) --Le ciel est par dessus le toit (d) 6 décembre 2013 à 12:39 (UTC)[répondre]
tu trouveras sur ma page de discussion la copie de ce que tu m’as demandé.--Le ciel est par dessus le toit (d) 9 décembre 2013 à 09:10 (UTC)[répondre]
Merci Phe pour ta réponse, cela veut-il dire que ça ne venait pas de moi ?--Le ciel est par dessus le toit (d) 10 décembre 2013 à 17:10 (UTC)[répondre]
Non, non, c'est un problème du côté de mediawiki qui n'apparaît qu'avec Safari 4.0/5.1 et de vieilles versions d'Internet Explorer. — Phe 10 décembre 2013 à 17:12 (UTC)[répondre]
Je suis rassuré, vu mes difficultés financière, je ne me voyais pas renouveller mon matériel informatique, et ça m"aurait vivement attristé de ne plus pouvoir contribuer à wikisource.--Le ciel est par dessus le toit (d) 10 décembre 2013 à 17:17 (UTC)[répondre]
Voir la copie de la console d’erreur sur ma page de discussion--Le ciel est par dessus le toit (d) 10 décembre 2013 à 22:54 (UTC)[répondre]
Merci pur l’info, je patienterai --Le ciel est par dessus le toit (d) 12 décembre 2013 à 18:12 (UTC)[répondre]
Bonjour Phe :Nouveaux problèmes et nouvelle copie du message d’erreur sur ma page de discussion, peux-tu jeter un coup d’oeil, Merci --Le ciel est par dessus le toit (d) 16 décembre 2013 à 10:50 (UTC)[répondre]
Les nouvelles erreurs du jour sont sur ma page de discussion. --Le ciel est par dessus le toit (d) 18 décembre 2013 à 07:32 (UTC)[répondre]
Ok merci, j’attendrai le jour et la nuit, j’attendrai toujours… ;-) --Le ciel est par dessus le toit (d) 18 décembre 2013 à 12:59 (UTC)[répondre]

Un grand Merci à toi et à Tpt, plus aucune erreur en vue.--Le ciel est par dessus le toit (d) 31 décembre 2013 à 14:59 (UTC)[répondre]

Problem Phebot with split[modifier]

Can you take a look to the result of this split: [11]? Phebot seems to be unable to write new pages when splitting them. Can be this be related to present issues of API action=edit (requiring that the whole nsPage, with its header and footer, is built before posting)? --Alex brollo (d) 7 décembre 2013 à 20:30 (UTC)[répondre]

Yes it is, the problem has been only partly fixed, bot now can modify page but can't create them, and the big trouble when creating a page is that no error are reported from the api, so the bot is actually broken and can't even notice it is broken so it end up by what you see. — Phe 7 décembre 2013 à 20:33 (UTC)[répondre]
Ok. I found an hack: my bot creates empty pages, yours follows it and edits existing pages. :-) --Alex brollo (d) 7 décembre 2013 à 23:05 (UTC)[répondre]
Lol, i didn't thought about doing that :) — Phe 7 décembre 2013 à 23:35 (UTC)[répondre]

Auteurs de l'Encyclopédie[modifier]

Salut,
Maintenant que tous les articles sont créés, y a-t-il moyen d'enlever de ton script de mise à jour ce qui concerne les auteurs ? ça t'éviterait d'avoir à chaque fois à reverter la mise à jour d'OBELE, entre autres : il y aura sans doute un souci avec PERMUTATION, et d'autres encore, au fur et à mesure que je vérifierai les auteurs (d'ailleurs, je ne sais pas si j'ai bien vérifié à chaque fois). --Acélan (d) 9 décembre 2013 à 11:32 (UTC)[répondre]

Fait Phe 9 décembre 2013 à 13:29 (UTC)[répondre]
Merci :)
Quand j'écris que je ne sais pas si j'ai bien vérifié, je parle des mises à jour faites par le bot ; pour le reste, je m'appuie sur le site de l'Artfl, mais pas seulement sur leurs attributions : ils en oublient parfois, et il faut rechercher ailleurs pour les attributions des articles non signés, donc ça va prendre un peu de temps. --Acélan (d) 9 décembre 2013 à 14:36 (UTC)[répondre]

Je me pose des questions concernant d'Holbach : jusqu'à la lettre F, ça va, mais pour la suite, il y a plein d'articles qui lui sont attribués, sans signature. Ces attributions sont vraisemblables, même si elles ne sont pas toutes assurées (cf. cette page, où j'indique la source). J'ai plusieurs options :

  • faire figurer la liste des attributions entre parenthèses sur cette page, sans modifier les articles
  • en plus, ajouter d'Holbach entre parenthèses, ou sous une autre forme (attribué à d'Holbach) comme auteur de ces articles.

Quelle option te semble la meilleure ? J'aurais tendance à préférer la seconde, même si ça risque d'être long, mais j'hésite. --Acélan (d) 15 décembre 2013 à 11:14 (UTC)[répondre]

Il y a une variante de la seconde option qui a ma préférence, séparer la page en deux parties, == Articles signés d’Holbach == et == Articles attribués à d’Holbach ==, pour les articles eux même, je ne sais pas si c'est une bonne idée de montrer différemment les articles signés et les articles attribués. — Phe 15 décembre 2013 à 11:31 (UTC)[répondre]
Le hic, c'est que l'inventaire Schwab semble moyennement fiable, et que je n'ai pas trouvé pour le moment d'étude plus poussée sur la question (comme ce qui a été fait pour d'Alembert, et qui enlève un paquet d'articles de la liste ; ou pour Saint-Lambert, et qui confirme l'inventaire Schwab).
Je pense qu'avant d'ajouter d'Holbach aux articles, je vais faire des recherches plus poussées.
Couper la liste en deux, ça complique pas mal les choses pour la navigation, non ? Les parenthèses ne sont peut-être pas une bonne idée, cela dit ; un astérisque à la fin des articles attribués, avec un avertissement en haut de page plutôt qu'en note ? --Acélan (d) 15 décembre 2013 à 12:25 (UTC)[répondre]
Une étoile fera l'affaire aussi. Ceci dit, si les sources que tu peux trouver pour l'attribution ne sont pas fiables, autant ne pas essayer d'attribuer. — Phe 15 décembre 2013 à 13:51 (UTC)[répondre]
Le problème, c'est que je ne sais pas à quel point elles sont fiables. Je vais faire comme ça pour le moment, et j'ajouterai le nom de d'Holbach, sans ajouter "attribué à" (je me contenterai d'une précision en page de discussion) aux articles pour lesquels je trouverai mieux que des probabilités — il y en a certainement, mais ça va me prendre un certain temps d'éplucher tout ça. --Acélan (d) 15 décembre 2013 à 14:09 (UTC)[répondre]

Voir sur ma page. Phe-bot peut créer des page, mais il refuse d'écraser des pages roses créées par un utilisateur, transcluses ou pas. --Wuyouyuan - discuter 11 décembre 2013 à 14:05 (UTC)[répondre]

Favorablement terminé. Voir ma page. --Wuyouyuan - discuter 12 décembre 2013 à 05:41 (UTC)[répondre]
Autre essai sur un nouveau livre. Les pages jaunes sont respectées. Voir ma page. --Wuyouyuan - discuter 14 décembre 2013 à 13:21 (UTC)[répondre]

Problème TeX[modifier]

Salut,
Est-ce que tu as toi aussi des tas de messages d'erreur sur L’Encyclopédie/1re édition/CASCADE ? en revanche, en mode page, aucun problème... --Acélan (d) 14 décembre 2013 à 07:47 (UTC)[répondre]

Un purge corrige le problème. La cause doit être un serveur mal configuré. Si cela se reproduit, il faudra reporter le bug aux admins systèmes. Tpt (d) 14 décembre 2013 à 08:00 (UTC)[répondre]

Couches textes à améliorer[modifier]

Bonjour,
J'ai océrisé 3 livres, avec des s longs ; peux-tu nettoyer la couche texte avec ton bot ?
Les fichiers :

Merci, --Acélan (d) 22 décembre 2013 à 10:26 (UTC)[répondre]

Fait, mais la qualité du scan du troisième est vraiment exécrable, difficile d'en tirer quelque chose. — Phe 28 décembre 2013 à 19:13 (UTC)[répondre]

Dictionnaire administratif et historique des rues de Paris et de ses monuments[modifier]

Salut,

Est-ce que tu pourrais m'aider à corriger le pb de décalage du djvu sur ce djvu ?

Le problème initial était un décalage sur les pages déjà créées. Il venait certainement d'une mise à jour du djvu que tu avais faite ici sur commons, en supprimant la première page.

J'ai remis cette page en utilisant DjvuSolo, mais maintenant, la couche texte ne correspond plus au scan. J'ai l'impression que la page que j'ai rajouté n'a pas décalé la couche texte. Et c'est là que je sèche : pas moyen de trouver comment visualiser la couche texte d'un djvu sous Windows.

Help !

--LBE (d) 31 décembre 2013 à 09:06 (UTC)[répondre]

Voilà, c'est fait, le problème était effectivement plus ancien que ton upload, j'ai du aussi renommer des pages et refaire une partie des transclusions qui ne correspondait plus aux mêmes pages. — Phe 31 décembre 2013 à 15:30 (UTC)[répondre]
Merci Merci ! et bonne année ! --LBE (d) 1 janvier 2014 à 08:33 (UTC)[répondre]