Sujet sur Wikisource:Forum des nouveaux

Valp (discussioncontributions)

Bonjour, Je domine la production de djvu à partir de pdf, car j'ai ABBYY. Mais djvu est moins bon, et surtout perd les index. La question est : peut-on sur Wikisource se contenter de pdf, formater un texte et peaufiner l'OCR à partir d'une source en pdf ?

Valp (discussioncontributions)

Bonjour @ElioPrrl et merci, Je n'ai pas la prétention de vouloir faire accepter pdf comme "standard" ! Je demande seulement s'il est permis et possible d'effectuer des Transclusions à partir d'un pdf. A ce stade, je crois comprendre que oui. Pouvez-vous le confirmer ?

ElioPrrl (discussioncontributions)

Cela est possible, mais déconseillé, autant ici que sur Commons. Honnêtement, à part un gain de temps pour vous (puisque vous savez convertir en DjVu ; mais rien ne vous empêche quand même de demander la conversion à un autre contributeur), je ne vois aucun avantage à télécharger en PDF. Y a-t-il une raison spécifique qui fasse que vous soyez obligé de téléverser un PDF ? Pourriez-vous mettre en lien le livre que vous souhaitez importer ?

Valp (discussioncontributions)

@ElioPrrl : La réduction en djvu altère la qualité des scans de vieux livres et leur OCR. L'indexation est utile quand il s'agit d'une compilation de lettres (correspondance). L'argument de la taille des fichiers est obsolète. Le format pdf a de facto cessé d'être propriétaire. Donc, sans besoin d'acquérir le statut de format "standard", pourquoi le format pdf continuerait-il à être "déconseillé" ?

Valp (discussioncontributions)

@ElioPrrl : La limitation à 100 Mo m'a convaincu et je vous remercie de vos explications.

Maintenant, pourriez-vous m'aider à créer une page des matières dans la page
wikisource.../Livre:nomfich.djvu' ?
Je dispose de la liste de mes signets : nom du signet / page du djvu.

ElioPrrl (discussioncontributions)

Je vais prendre un exemple pour être plus clair, avec Livre:Hugo - Œuvres complètes, Impr. nat., En voyage, tome I.djvu ; excusez-moi par avance si je vous explique quelque chose que vous connaissez déjà . En gros, il faut procéder comme suit :

  1. Commencez par repérer les numéros de page de la table des matières du livre, et par numéro de page, entendre non pas ceux imprimés au haut des pages, mais le numéro de page dans le fichier DjVu — dans cet exemple, 573 à 576. Pour cela, il est bon de commencer par modifier le champs « Pages » de la page Livre:, ce qui est maintenant assez intuitif avec le nouvel outil « Mode visuel pour modifier les pages ».
  2. dans la page Livre:, il faut ensuite ajouter au champ « Sommaire », autant de fois que nécessaire, {{Page:nomfich.djvu/n}}, où n décrira les numéros de page du point précédent — à ce moment là, vous avez fini de modifier la page Livre: ; des liens rouges doivent apparaître dans la colonne de droite
  3. ensuite, il faut créer chacune des pages de sommaire ; dans mon exemple, voici la première ; chaque entrée de la table des matières (avec titre et numéro de page) utilise le modèle {{table}}, dont je vous invite à lire la documentation. Il peut être utile de faire la mise en forme de manière presque automatique, en utilisant astucieusement la fonction Rechercher/Remplacer, ou ce tableur partagé.

Ce que je peux vous proposer, est de téléverser votre livre sur Commons, et je pourrais vous donner un coup de main pour mettre en route tout ça Sourire ; rien de bien difficile, mais il me sera plus commode de donner des explications sur du concret. Par ailleurs, il ne faut pas hésiter à consulter des livres dont la table des matières ressemble au vôtre, et à en inspecter le code, et à le copier et ajuster à votre livre.

Valp (discussioncontributions)

@ElioPrrl : Je vois. Je vous signale ce bon logiciel pour extraite la liste des signets d'un pdf : jpdfbookmarks-2.5.2 (portable ; menu Tools / Dump). Ensuite c'est un jeu d'enfant de construire les {{Table | ... }} qui feront le sommaire.

Je vous dirai quand j'aurai téléversé. Cordialement.

ElioPrrl (discussioncontributions)

Ah je vois... Normalement on ne fait pas des montages comme ça ; plutôt, on importe les tomes entiers, dont on ne corrige que les pages en français, en marquant les autres pages « Sans Texte » et en renvoyant au projet Wikisource de la langue correspondante grâce à {{iwpage}} (par exemple cette revue, avec un article en français et le reste en italien). Cela permet de ne pas créer de doutes : le fac-similé est-il bien intègre, a-t-il été manipulé, etc. ?

Autre remarque : le titre des fac-similés est relativement stéréotypé : Livre:Auteur - Titre, éd. Éditeur, t. Tome, Année.djvu (les mentions éditeur et tome étant facultatives, et leur ordre peut fluctuer) ; cela permet de faire des recherches facilement pour trouver un fac-similé.

Je vois que nul besoin est de vous apprendre quoi que ce soit, car tout est bien rempli. Sourire Pour les transclusions, vous trouverez toutes les informations ici. Il ne faut pas hésiter à consulter les tutoriels et les aides, qui mériteraient certes pour beaucoup un coup de jeune, mais qui dépannent vraiment au début, notamment Aide:Publier un livre et Aide:Transclusion.

Valp (discussioncontributions)

@ElioPrrl, oui je sais, normalement on ne fait pas des compilations comme cela, mais vu l'espèce d'occultation dont est victime cette partie de son oeuvre ("Newton...") alors qu'elle est, je crois, la plus actuelle et importante (en l'état de la science physique actuelle), je me permet ce petit coup de pouce.

L'important est de ne pas laisser de doute, donner le moyen de vérifier que le fac-similé est intègre, non manipulé, et c'est pourquoi je demandais s'il est possible de modifier un peu le sous-titre dans <pages HEADER. Car par exemple dans le 1er item, au lieu de "(p. 2-6)" je voudrais pouvoir figurer "(GM3a, p. 52-58)" ce qui serait plus correct.

Répondre à « Djvu obligatoire ou pdf possible ? »