Discussion utilisateur:Zyephyrus/Mai 2013
Ajouter un sujetVoyage d'une coquille
[modifier]Je viens de corriger une coquille dans Wikisource ; je me demande combien de temps cela prendra pour qu'elle soit corrigée dans les autres distributeurs de cette coquille.
Google annonce 15 résultats et si on demande la liste complète donne 12 résultats.
- The Project Gutenberg EBook of Aventures de Monsieur Pickwick ...www.gutenberg.org/files/14789/14789-8.txt--La reste sera plaça en mon nom, et quand je recevrai ma feuille de route, ça te reviendra. Ainsi prends garde de ne pas tout dépenser d'un coup, mon garçon, ...
- The Project Gutenberg eBook of Aventures de Monsieur Pickwick ...www.gutenberg.org/files/14789/14789-h/14789-h.htm—La reste sera plaça en mon nom, et quand je recevrai ma feuille de route, ça te reviendra. Ainsi prends garde de ne pas tout dépenser d'un coup, mon garçon, ...
- Page:Dickens - Les Papiers posthumes du Pickwick Club, Hachette ...fr.wikisource.org/wiki/Page...Les.../345Translate this pageNov 5, 2011 – La reste sera plaça en mon nom, et quand je recevrai ma feuille de route, ça te reviendra. Ainsi prends garde de ne pas tout dépenser d'un ...
- Les Papiers posthumes du Pickwick Club/Tome II/XXIII. - Wikisourcefr.wikisource.org/wiki/Les_Papiers...du.../XXIII.Translate this pageNov 5, 2011 – La reste sera plaça en mon nom, et quand je recevrai ma feuille de route, ça te reviendra. Ainsi prends garde de ne pas tout dépenser d'un ...
- CHAPITRE XXIII. - Annonçant un changement ... - In Libro Veritaswww.inlibroveritas.net/.../oeuvre4055-chapitre14539....Translate this page-La reste sera plaça en mon nom, et quand je recevrai ma feuille de route, ça te reviendra. Ainsi prends garde de ne pas tout dépenser d'un coup, mon garçon, ...
- CHAPITRE XXIII. - Annonçant un changement sérieux ... - Atramentawww.atramenta.net/.../oeuvre4055-chapitre14539.htm...Translate this page-La reste sera plaça en mon nom, et quand je recevrai ma feuille de route, ça te reviendra. Ainsi prends garde de ne pas tout dépenser d'un coup, mon garçon, ...
- Aventures de Monsieur Pickwick, Vol. II / free books readwww.freebooksread.finecrypt.net/.../14789-8.txt=10=7... - Translate this page--La reste sera plaça en mon nom, et quand je recevrai ma feuille de route, ça te reviendra. Ainsi prends garde de ne pas tout dépenser d'un coup, mon garçon ...
- aventures de monsieur pickwick, tome ii - Textes libres - Freetextes.libres.free.fr/.../charles-dickens_aventures-de-m...Translate this page-La reste sera plaça en mon nom, et quand je recevrai ma feuille de route, ça te reviendra. Ainsi prends garde de ne pas tout dépenser d'un coup, mon garçon, ...
- The Project Gutenberg EBook of Aventures de Monsieur Pickwick ...--La reste sera plaça en mon nom, et quand je recevrai ma feuille de route, ça te reviendra. Ainsi prends garde de ne pas tout dépenser d'un coup, mon garçon, ...
- dickens-charles-1812-1870_aventures-de-monsieur ... - Scribdfr.scribd.com/.../dickens-charles-1812-1870-aventures...Translate this pageApr 23, 2013 – --La reste sera plaça en mon nom, et. quand je recevrai ma feuille de route, ça te reviendra. Ainsi prends garde de ne pas tout dépenser d'un ...
- doctrinepublishing.com/showbook.php?file=26189-0000.txt--La reste sera plaça en mon nom, et quand je recevrai ma feuille de route, ça te reviendra. Ainsi prends garde de ne pas tout dépenser d'un coup, mon garçon, ...
- Books Aventures de Monsieur Pickwick, Vol. II - Allthebookx.com—La reste sera plaça en mon nom, et quand je recevrai ma feuille de route, ça te reviendra. Ainsi prends garde de ne pas tout dépenser d'un coup, mon garçon, ...div>allthebookx.com/viewbook.php?bookid=37021
Les autres moteurs consultés ne trouvent que Gutenberg.
Bing trouve un seul résultat, qui n'est ni Gutenberg ni aucun des 12 résultats de Google.
* Aventures de Monsieur Pickwick – tome II
www.dominiopublico.gov.br/pesquisa/DetalheObraDownload.do?select...
Relevé dans la liste Wikisource
[modifier]1. LA2
Début de citation
It should be possible, in any language of Wikisource, to check all existing text against a known dictionary valid for that year, and to find words that are outside the dictionary. These words could be proofread in some tool similar to a CAPTCHA. They might be uncommon place names that are correctly OCRed but not in the dictionary, or they could be OCR errors, or both.
Has anybody tried this?
Such finds are not necessarily the only OCR errors. Some OCR errors result in correctly spelled words, that are found in the dictionary, e.g. burn -> bum. So full manual proofreading and validation will still be needed. But a statistics based approach could fill gaps and quickly improve full text searchability.
Fin de citation
2. Aubrey
Début de citation
I remember, for example, an awesome tool from Alex Brollo, postOCR, a js script which corrects automatically most common OCR errors and converts apostrophes.[1]
...
a set of stats per books (list of words used, counting those words, etc.) could be very interesting for a tiny range of readers, but skilled ones, as digital humanists and philologists.
...
a central place (on Wikisurce.org?) to discuss tools, templates, and procedures, as an international community. It is a project long needed. Where should we start it?
Fin de citation
3. Alex Brollo
Début de citation
ideally, a "specific book spelling tool", I tried to think about but there are lots of difficulties - the first one is, that it's difficult to highlight words into a textarea by js. Can be, that VisualEditor could make things easier.
...
two different tools merged into one.
1. postOCR code comes mainly from Pathoschild's RegexMenuFramework with minor changes for Italian OCR errors.
2. apostrophes conversion (from keyboard, typewriter one ' into real apostrophe character ’) comes from an original it.source script (in python to be used by a bot, and in js to be merged into postOCR); it's very complex, since conversions into templates, link, html tags, math tags and wiki markup must be avoided. This it far from simple, since regex doesn't help to manage nested templates/nested code structures. No, we don't document this stuff. We simply use it.... a lot.
Fin de citation
- ↑ Voir si cet outil est différent du typo de fr.wikisource.