Aide:Transcription

La bibliothèque libre.
Niveau débutant
Cette page explique ce qu'est la transcription d'un texte et comment la réaliser.
En résumé En résumé :
La transcription est l’action de transformation d’un texte sous forme d’image à un texte sous forme informatique
Pour transcrire utilisez le bouton « Transcrire le texte »
Respectez le plus possible ce que vous voyez sauf pour les règles de typographie moderne.
La transcription des entêtes et des pieds de page se font dans les zones prévues à cet effet.

La transcription est l’action de transformation d’un texte sous forme d’image à un texte sous forme informatique. Cette action s’effectue dans l’espace page.

Pour la transcription, il suffit le plus souvent de corriger la couche texte du fichier DjVu, qui s’affiche par défaut dans la moitié gauche de l’espace Page: ; si cette couche texte n’existe pas, le plus simple est d’utiliser le bouton de « Transcrire le texte » et de respecter le plus possible ce que l’on voit sur la page :

sauf pour certains points de typographie, qu’il faut rendre conforme à la typographie moderne ; donc :
○ un espace avant la ponctuation double (:!?;)
○ guillemets français « », apostrophe courbe et points de suspension
○ accents sur les majuscules
○ différenciation des traits d'union - et des tirets (pour les dialogues)
○ pour corriger automatiquement la typographie, cliquer sur le bouton pour formater le texte conformément aux conventions définies dans le Guide typographique de Wikisource.
sauf si on indique des choix éditoriaux dans la page de discussion, par exemple sur la graphie (remplacer ſ par s, ß par ss, dissimiler les i et j)
les entêtes et pieds de pages ne doivent pas être transcrits dans le « contenu » (pour les faire apparaître : bouton « Aide à la relecture » puis « Afficher/cacher entête et le pied de page de cette page »)

Wikisource permet d’utiliser des balises pour ajouter certaines fonctionnalités :

note de bas de page sur la page source : ‎<ref>...‎</ref>
(devient une note de fin sur la page feuille)
forcer le retour à la ligne : ‎<br />
(auto-fermante)
si titre ou début de paragraphe en début de page : ‎<nowiki />
(auto-fermante)


Modèles[modifier]

Aide détaillée : Aide:Modèles

Les modèles sont un outil pour formater certains éléments particuliers sur une page. La plupart des modèles ont une documentation, disponibles sur la page Modèle:Nom du modèle, où sont décrits son utilisation, sa syntaxe, ses paramètres obligatoires et fonctionnels, ainsi que les modèles similaires. Dans les exemples suivants, il n’y a pas de paramètres optionnels utilisés : souvent, utiliser ces paramètres optionnels permettent d’éviter d’imbriquer ou de juxtaposer plusieurs modèles.

Lors de la transcription, il est recommandé d’utiliser certains modèles de formatage des caractères ou mots :

mise en exposant : {{2e}}, {{2nd}}, {{Ier}}, {{1o}}, , {{Cie}}, etc.
civilités : {{Mme|Gautier}}, {{Mlle|Hellé}}, {{M.|Martin}}
correction d’une coquille : {{corr|cokille|coquilles}}
petites capitales : {{sc|George Sand}}
nombres en chiffres romains : {{rom|vi}}, {{rom-maj|IX}}
mot dans une autre langue : {{lang|en|Hello!}}, {{lang|la|Alea jacta est}}
taille (2e  paramètre = pourcentage) : {{t|plus grand|120}}, {{t|plus petit|80}}

ou certains modèles de formatage de la page :

mot avec une césure (ex. : anticonstitutionnellement) en fin de page :
○ en général : anticonstitution- en fin de page n et nellement en page n + 1
○ si cas particulier :
{{tiret|anticonstitution|nellement}} à la fin de la page n ; {{tiret2|anticonstitution|nellement}} au début de la page n + 1
{{tiret|peut|-être}} en page n ; {{tiret2|peut-|être}} en page n + 1
centrer : {{centré|texte…}} ; aligner à droite : {{d|texte…}}
citation : {{citation|Qu’il eût été fade d’être heureux !|gauche}}
titres de différents niveaux : {{t2|Mon titre de niveau 2}}, {{t3|Mon titre de niveau 3}}, etc.
filet : {{—}} ; astérisme : {{Astérisme}}
Aide détaillée : Aide:OCR

L’OCR est un outil de reconnaissance de caractères. Il permet de faire une transcription rapide d'un texte qui nécessitera une relecture voire un ajout de modèles pour la mise en forme.

Titre[modifier]

Aide détaillée : Aide:Titre

Les titres sont les éléments d’un texte qui présentent rapidement une partie (chapitre, paragraphe…). Pour les transcrire on utilise les modèles {{t2}}, {{t3}}, {{t4}}, {{t5}}. Le numéro du modèle dépend du niveau du titre dans l’ouvrage.

Notes et notes de bas de pages[modifier]

Aide détaillée : Aide:Notes

Une note ou une note de bas de page est une remarque de l’auteur dans un ouvrage. Pour transcrire une note il faut utiliser les balises ‎<ref>...‎</ref>

et insérer le contenu de la note dans la balise.

En-tête et pied de page[modifier]

Aide détaillée : Aide:Entête et pied de page

Les entêtes et pieds-de-pages peuvent être transcrits, mais ils ne seront pas transclus dans l’espace principal. Si vous souhaitez les transcrire, vous devrez les placer dans les champs « en-tête » et « pied de page » dans l'espace « Page ».

Indentation[modifier]

Aide détaillée : Aide:Indentation

L’indentation est le système de mise en retrait ou en alinéa d’un texte. Les alinéas en début de paragraphe sont insérés automatiquement, du moment que le début du paragraphe est précédé d’une ligne vide. Il est en général déconseillé d’insérer manuellement une indentation particulière, mais si nécessaire, les modèles les plus utiles sont les suivants :

  • {{Alinéa}} pour paramétrer la marge gauche du paragraphe et la longueur de son alinéa ;
  • {{SA}} pour supprimer l’alinéa automatique en début de paragraphe.

Pour les retraits de vers dans un poème, voyez plutôt {{em}} ou {{iv}}. Cf. Aide:Poème.

Modernisation d’un texte[modifier]

Aide détaillée : Aide:Modernisation

Moderniser un texte signifie transformer automatiquement l’orthographe d’un texte écrit en moyen français pour la ramener aux usages modernes ; en aucun cas, il s’agit de transformer la syntaxe ou le vocabulaire. La modernisation d’un texte peut être faite à l'aide du modèle {{modernisation}}.

Manuscrit[modifier]

Aide détaillée : Aide:Manuscrit

Dans le cas de la transcription d’un manuscrit il faut respecter la graphie de l’auteur.

Illustrations[modifier]

Aide détaillée : Aide:Insérer une image

De nombreux ouvrages intègrent des images à leur texte.


Voici une liste de réponses aux questions les plus fréquentes :

En-têtes et pieds de pages[modifier]

  • Faut-il transcrire les en-têtes et pieds de page ?
Non ! Les en-têtes et pieds de page ne doivent pas être saisis dans la boîte texte, car ils ne sont pas destinés à être affichés dans le document final. Si vous souhaitez les retranscrire (ce n’est pas obligatoire), vous devez les placer dans les champs « en-tête » et « pied de page ». Le bouton Afficher/cacher entête et le pied de page de cette page sert à montrer/cacher ces champs. Vous pouvez choisir de toujours montrer ces champs lors de l’édition, en cochant l’option correspondante dans Préférences → Modification.

Indentations[modifier]

  • Comment obtenir une indentation en début de page?
Si un paragraphe commence en début de page, il est nécessaire de commencer la page par un <nowiki/> et de sauter une ligne, (exemple ici). Il est recommandé d’appliquer cette règle même quand le premier paragraphe est centré, ou aligné à droite, etc.
En principe on pourrait se contenter de sauter une ligne pour obtenir un nouveau paragraphe, mais un bug de MediaWiki fait que cette ligne vide disparaît lors de l’édition suivante. Le <nowiki/> sert à éviter que la ligne vide ne disparaisse (précédemment on préconisait d’insérer <br/> qui avait un effet similaire, mais ajoutait un saut de ligne visible dans le texte principal, rompant l’harmonie des espacements de paragraphes ; ce que le <nowiki/> évite puisqu’il n’introduit rien de visible). Ce <nowiki/> n’est pas nécessaire si le saut de ligne est placé à l’intérieur du tag <poem>.
Un bug d’affichage fait que, dans certains cas, un paragraphe qui devrait être indenté ne l’est pas. C’est en particulier le cas si une page commence par une balise <poem/> : le premier paragraphe qui la suivra ne sera pas indenté, à moins qu’il ne soit précédé d’au moins trois sauts de lignes. Il est possible de contourner ce bug en insérant <nowiki/> puis un saut de ligne avant ce paragraphe, comme si l’on commençait une nouvelle page.

Modernisation[modifier]

  • Faut-il moderniser le texte ?
Non ! L’orthographe d’origine doit être respectée, même si elle est ancienne. Les seules altérations du texte qui sont autorisées sont les corrections de coquilles (erreurs faites par l’imprimeur), les modernisations typographiques et la restauration des accents sur les majuscules (leur absence était due à des limitations techniques). En cas de correction de coquille, il faut utiliser le modèle {{corr}}.

Syntaxe des notes de bas de page[modifier]

  • Comment saisir les notes de bas de page ou les notes de fin ?
Les notes de bas de page sont à inclure au fil du texte, entre les balises <ref></ref>, à l’endroit de l’appel de note. Si l’on veut mettre une espace entre le texte et l’appel de note, il faut mettre une espace insécable.
À la première inclusion d’une note, un message peut indiquer que la balise <reference /> manque, ne pas la rajouter, car elle ne doit pas se trouver sur la page elle-même.
  • Où saisir une note répartie sur plusieurs pages ? Utiliser le paramètre follow : exemple.

Attention, la référence follow introduit en général un nouveau paragraphe dans le texte dans laquelle elle est déclarée. Solution : mettre cette référence entre deux paragraphes ou, s’il n’y en a pas, bien « coller » la déclaration à la fin d’une phrase (aucune espace).

Ça marche très bien aussi sur plusieurs pages, les références follow s’enchaînant les unes aux autres.

  • Comment saisir deux types de notes distincts ? Lorsqu'il existe deux types de notes dans une même page, par exemple les notes de l’auteur et du traducteur, utiliser group (voir ici).
  • Comment saisir des notes en fin de volume ? : voir ici.

Tirets[modifier]

  • Doit-on saisir les tirets des mots coupés à la ligne ?
Non, il faut écrire le mot en entier sans césure, sauf en fin de page (cf. ci-dessous).
  • Que faire avec les mots coupés en fin de page ?
    • Exemple : dépê- et la page suivante chais.
    • Depuis 2019, il est possible d’écrire simplement dépê- en fin de page et chais en début de page suivante :
      • si le tiret de dépê- est vraiment le dernier caractère de la page (pas de note de bas de page, ni d’italique autour du mot, en particulier) ;
      • et que la césure ne se fait pas au niveau du tiret (sinon il faudrait écrire c’est-à-- en bas de page, faisant apparaître un double tiret).
    • Pour les autres cas, il faut utiliser l’ancienne méthode pour ne pas avoir un mot qui se présente en transclusion dépê- chais en utilisant les modèles {{tiret}} et {{tiret2}} de la manière suivante : {{tiret|dépê|chais}} à la fin de la première page et {{tiret2|dépê|chais}} au début de la deuxième page.
      • Il faut inclure toute la chaîne de caractères dans {{tiret}} et {{tiret2}} : {{tiret|d’inhos|pitalité}} et {{tiret2|d’inhos|pitalité}}, et non d’{{tiret|inhos|pitalité}}, qui ajouterait une espace après l’apostrophe (exemple).
      • Lorsque la césure se fait au tiret (c’est-à- en fin de page, dire en début de page suivante), utiliser le même modèle, pour éviter qu’une espace se place après le tiret. Il faut mettre le tiret après la barre verticale dans {{tiret}} et avant la barre verticale dans {{tiret2}} : {{tiret|c’est-à|-dire}} et {{tiret2|c’est-à-|dire}}.

Titres[modifier]

  • Comment afficher les titres ?
Les boîtes titre ne doivent pas être utilisées dans l’espace « Page ». Les boîtes servent à donner des informations qui ne font pas partie du texte, de sorte que le lecteur puisse clairement comprendre ce qui fait partie du document original, et ce qui a été ajouté par Wikisource. Les boîtes titre sont donc à utiliser dans l’espace principal uniquement. Si un titre est présent dans l’espace page et fait double emploi, il est possible de l’entourer de balises « noinclude ».
Pour formater des titres dans l’espace Page, il faut utiliser les modèles {{t2}}, {{t3}}, {{t4}}, {{t5}}, {{t6}}, en respectant bien la hiérarchie (t2 pour les subdivisions principales, puis t3, etc). Voir la documentation de ces modèles pour les paramètres permettant de modifier le rendu de chacun de ces titres.

Illustrations[modifier]

  • Comment placer correctement le texte autour des illustrations ?
On obtient parfois des indentations lorsqu’il n’en faut pas, ou pas lorsqu’on en souhaite. Pour ne pas avoir ces problèmes, il faut éviter de revenir à la ligne à l’intérieur d’un paragraphe pendant qu’on entre le texte dans la fenêtre d’édition. Exemple : cette page.
On peut faire disparaître l’indentation indésirable, grâce à l’emploi du modèle {{br0}}. Voir exemple.
Pour faire flotter le texte autour d’une image, on peut utiliser les modèles {{Image2}} ou {{drafIm}}.

Affichages[modifier]

  • Affichage horizontal
Il est possible d’afficher les fac-similés au-dessus de la boîte d’édition, en utilisant le bouton , ou bien en cochant l’option Utiliser une disposition horizontale lors d'une modification dans l'espace de noms Page dans Préférences, onglet Modification.

Images non actualisées[modifier]

  • Comment forcer le moteur de Wikisource à remplacer une ancienne image par une plus récente quand on a importé une nouvelle version d’un fac-similé ?
En affichant l’image non actualisée, soit par l’onglet fichier soit par un clic droit sur l’image puis Afficher l’image, et en ajoutant à l’URL de cette image : &action=purge ou ?action=purge.

L’OCR ne s’affiche pas[modifier]

  • Que faire quand l’OCR d’un fac-similé ne s’affiche pas dans la boîte d’édition ?
Si vous êtes certain que le fichier contient une couche texte, purgez le fichier sur Commons et sur Wikisource, en suivant la méthode de la section précédente.

Voir aussi[modifier]