Sujet sur Discussion utilisateur:Acélan/Structured Discussions Archive 1

Cunegonde1 (discussioncontributions)

Après plus de 5 ans de contribution assidue à WS, j'ai découvert l'onglet liste de suivi, ce qui m'a permit de voir le travail de chasseur de scanilles que tu réalises avec AWB. C'est formidable ! Cela m'a permit d'en découvrir de nouvelles (parles=>par les) qui est très fréquentes avec Finereader.

J'ai quelques questions à te poser à ce sujet :

  1. Je me demandais si tu vérifiais l'ensemble des ouvrages produits ? Ce doit être un travail énorme.
  2. Ta liste de scanilles a-t-elle évoluée depuis 2019, date de dernière mise à jour ? pour que je vérifie celles qui manquent à ma liste afin de les y intégrer pour les traiter en amont de la mise en ligne des djvu que j'importe ou des ouvrages que je transcris.
  3. L'outil AWB fonctionne-t-il sous Linux et Mac ou uniquement sous Win ? et est-il difficile à maîtriser ?

J'espère que je ne t'importune pas avec toutes ces questions et encore Bravo pour ce nettoyage fort utile et efficace.

Acélan (discussioncontributions)

Bonjour,

Tu ne m'importunes pas du tout : la quantité de scanilles est vraiment importante, et plus on est nombreux à les chasser, et mieux c'est !

Je ne procède pas vraiment de façon systématique ; seulement, quand je rencontre, dans mes corrections, une scanille qui risque d'être passée inaperçue ailleurs, je fais une recherche sur les pages corrigées et validées, et si les occurrences sont nombreuses, je passe par AWB. Quelquefois, ça ne donne rien, parce qu'il est impossible de trouver une équation de recherche pertinente (par exemple, je viens de me casser la tête à chercher sans la trouver une équation pour rechercher les pages où "livrera" est mis à la place de "livrer à") ; d'autres fois, la pêche est bonne.

J'ai aussi ajouté quelques éléments au gadget qui souligne les erreurs possibles : ça me fait pas mal de faux positifs, mais ça permet de repérer plus facilement des erreurs très courantes, et c'est cela essentiellement que je vérifie dans les nouveaux textes mis en ligne - sinon, effectivement, ce serait un travail colossal : la liste est là. Maintenant que je connais un peu mieux les expressions régulières, je vais d'ailleurs pouvoir l'améliorer.

Pour AWB, je pense que ça fonctionne au moins sous Linux, vu les personnes qui l'utilisent. Ce n'est pas difficile à prendre en main, non, surtout pour toi qui as l'air à l'aise avec les expressions régulières (ce qui n'est pas encore mon cas).

Amicalement,

Cunegonde1 (discussioncontributions)

Bonjour Acélan, j'ai installé AWB et je commence à le tester grâce à ton tutoriel (que je te remercie d'avoir pris le temps de faire). J'ai un étonnement, lorsque je suis ton process, jusqu'au moment de faire start, pas de problème. Ensuite chaque page est passée en revue qu'elle "matche" avec la regex ou pas, et je dois donc cliquer sur skip, pour aller à la suivante. N'y a-t-il pas un moyen de ne faire apparaître que les pages qui "matchent" avec la regex ?

Acélan (discussioncontributions)

Bonjour, Oui, il y a une case à cocher (que je n'ai découverte que récemment...) : dans "options", tu as "skip if no replacement". Cela ne fera pas disparaître les pages de la liste, mais elles défileront sans que tu aies besoin de cliquer.

Cunegonde1 (discussioncontributions)

Super, ça marche. Peut-être faut-il rajouter cette information au tutoriel ? Merci encore pour l'aide que tu nous apporte dans la prise en main de cet outil.

Acélan (discussioncontributions)

Oui, je viens de l'ajouter au tutoriel.

Cunegonde1 (discussioncontributions)

Bonjour Acélan, j'ai une nouvelle question sur AWB : lorsque je crée une liste avec les options source Wiki search (test) (all NS), incategory:"page corrigée" par exemple, j'obtiens une liste de 1000 pages. Parmi ces pages, je ne trouve pas certaines pages que je sais être corrigées comme dans Livre:Sade - La nouvelle Justine, ou les malheurs de la vertu, suivie de L'histoire de Juliette, sa soeur, tome 1, 1797.djvu, ce nombre de 1000 pages me semble bien faible. Est-ce une option à modifier ?

Acélan (discussioncontributions)

Bonjour @Cunegonde1,

Le nombre de résultats est limité, oui. Il faut opérer par ouvrage, ou choisir une équation de recherche restreignant le nombre de résultats.

Cunegonde1 (discussioncontributions)

Ok, merci.

Cunegonde1 (discussioncontributions)

Bonjour Acélan, je me suis permis d'ajouter dans le tutoriel AWB un exemple de regex un peu complexe (negative find before ET negative find behind) sur la recherche "parle" =>"par le". Je te laisse juge de la pertinence de donner un exemple et de le modifier si tu le juges utile. Bonne journée.

Acélan (discussioncontributions)

C'est super ! moi, je tâtonne pas mal avec les regexp, donc un exemple complexe comme celui-ci me semble très pertinent, ça va me permettre de progresser :)

Acélan (discussioncontributions)

Cunegonde1 :

J'ai ajouté la regexp donnée en exemple à ma liste de corrections AWB, et elle va me permettre d'affiner certaines autres.

Mais j'ai une question : je n'arrive pas à utiliser ce type d'expression dans l'interrogation elle-même ; est-ce possible ? si oui, quelle syntaxe utiliser ?

Cunegonde1 (discussioncontributions)

Là je ne sais pas ! hier soir j'ai fait une interrogation avec -"je parle" "parle" incategory:"page corrigée" et j'ai eu des "je parle" dans la liste des pages filtrées donc je ne sais pas trop comment fonctionne le filtre dans l'équation de recherche.

Acélan (discussioncontributions)

OK, merci pour ta réponse.

Cunegonde1 (discussioncontributions)

Bonjour Acélan, j'ai ajouté un paragraphe sur la recherche/modification de modèles dans le tutoriel AWB, je ne sais pas s'il est suffisamment clair, et pertinent à cet endroit. Par ailleurs j'ai trouvé cette page d'aide AWB qui est pratiquement vide. Enfin, connais-tu quelqu'un qui aurais réussi à faire fonctionner AWB.js ? qui fonctionne dans un navigateur et évite les problèmes d'OS ?

Acélan (discussioncontributions)

Bonjour @Cunegonde1,

Concernant tes ajouts (sur les modèles et sur l'exemple "parle"), je pense qu'il faudrait faire une nouvelle section, qui traiterait spécifiquement des regexp élaborées. Et qu'on pourrait développer au fur et à mesure.

Ça m'a l'air suffisamment détaillé pour être utilisé, mais il faudrait donner un exemple de ce que tu entends par "modèle erroné", pour qu'on comprenne bien de quoi il est question : une erreur dans le modèle ? un usage erroné d'un modèle ? de quelle erreur s'agit-il ?

Quand à la page quasi-vide, effectivement, on pourra (on peut peut-être dès maintenant) la fusionner avec le tutoriel en cours d'élaboration.

AWB.js, je n'ai jamais essayé. Peut-être que @VIGNERON s'en sert ?

Cunegonde1 (discussioncontributions)

J'ai repris le paragraphe avec modèle erroné, j’espère que c’est plus clair à présent. Pour le déplacement des exemples de regex, pas de problème, je te laisse le soin de les déplacer à l'endroit qui te semble le plus approprié.

VIGNERON (discussioncontributions)

Bonjour,

Je me demande si il ne serait pas plus utile de faire une réunion pour en discuter de vive voix. Et échanger (par exemple pour faire des listes de page à corriger, j'utilise de plus en plus souvent la fonction w:Aide:AutoWikiBrowser/Database Scanner ; il y a tellement de fonction dans AWB, je crains qu'une page d'aide ne soit pas suffisante).

Non, je n'ai jamais essayé la version javascript d'AWB.

Cunegonde1 (discussioncontributions)

Je peux témoigner que la page d’aide d’Acélan est précieuse, elle m’a mis le pied à l’étrier, car je ne savais absolument comment m'y prendre au démarrage. Une fois ce démarrage acquis, on apprivoise l'outil en allant chercher des exemples ailleurs (le plus souvent en anglais).

Acélan (discussioncontributions)

Bonne idée, oui, on commence à savoir faire des réunions à distance ;)

Répondre à « Corrections AWB »