Discussion:Dictionnaire touareg – français

Le contenu de la page n’est pas pris en charge dans d’autres langues.
La bibliothèque libre.

Indentation[modifier]

Est-il possible d’éviter l’indentation des alinéas dans ce dictionnaire? Dans la plupart du livre, l’auteur n’utilise pas d’indentation; p.ex. p. 708. — Linus (disc) 18 mars 2011 à 00:45 (UTC)[répondre]

Transition des deux fichiers[modifier]

Malheureusement, je n’ai pas trouvé de l’aide pour céer un seul fichier de ce livre-ci, ni ici, ni sur Commons. Je ne sais pas comment on peut réaliser la transclusion de la transition entre les deux fichiers (qui se trouve au milieu d’un alinéa). Dans la section Dictionnaire touareg – français/L, il faut transcluder pp. 971 à 1000 du premier fichier et pp. 1 à 131 du deuxième fichier. Merci pour toute aide! — Linus (disc) 18 mars 2011 à 01:02 (UTC)[répondre]

J’ai créé le fichier Livre:Foucauld, Dictionnaire touareg.djvu, donc le problème est resolu. Qu’est-ce que vous pensez, devrait-on garder Livre:Foucauld, Dictionnaire touareg, part 1.djvu et Livre:Foucauld, Dictionnaire touareg, part 2.djvu et tous les redirections, ou supprimer-les? — Linus (disc) 10 avril 2011 à 09:31 (UTC)[répondre]
Inutile vu que le nouveau fichier est la simple concaténation des deux anciens. — Phe 14 juin 2011 à 21:05 (UTC)[répondre]
Merci! — Linus (disc) 14 juin 2011 à 21:50 (UTC)[répondre]

Encodement des tifinagh[modifier]

Évidemment, ce dictionnaire utilise les caractères tifinagh abondamment. Ça pose des problèmes:

1. La direction d’écriture des tifinaghs dans le dictionnaire est de droite à gauche. Je trouve que c’est important de réproduire cette caractéristique. Pandries pense qu’il est mieux d’écrire les mots en tifinagh de gauche à droite et y mettre une balise bdo. Verdy_p préférait la balise span avec l’attribut dir="rtl". Moi, je ne sais pas. Jusqu’à maintenant, j’ai écrit les tifinagh de droite à gauche (sauf sur page 946, après le conseil de Pandries).
Quoi faire? Quelle direction? Peut-être c’est une bonne idée de créer un modèle pour les tifinagh?

2. Les tifinaghs utilisent des ligatures qui portent de l’information. Pandries a proposé d’utiliser le liant sans chasse, et je l’ai utilisé dans les pages transcrits jusqu’à maintenant. Mais il y existe un Tifinagh Consonant Joiner, exprêt pour encoder les ligatures en tifinagh. Je suis en peu surpris que Pandries, qui est spécialisé dans le tifinagh, n’a pas conseillé d’utiliser çe caractère. Je vais lui contacter. Quoi faire?

Linus (disc) 18 mars 2011 à 01:52 (UTC)[répondre]

Après tout, je pense qu’il est mieux de réspecter le standard Unicode et encoder les tifinaṛ de gauche à droite. Je vais effectuer ce changement bientôt. La balise <bdo> semble fonctionner dans Firefox, mais non dans des autres navigateurs. Peut-être un pourra utiliser-la un jour ou l’autre ; un modèle pour les tifinaṛ me semble une bonne idée en tout cas. — Linus (disc) 30 mars 2013 à 16:24 (UTC)[répondre]
Le renversement est fait. — Linus (disc)

Diacritiques doubles[modifier]

Foucauld utilise le digraphe ou surmonté par brève ou circonflexe, centré sur les deux lettres. Comment encoder ça?

Il y a les caractères Unicode COMBINING DOUBLE CIRCUMFLEX ABOVE et COMBINING DOUBLE BREVE pour représenter (à peu près) ces diacritiques. Malheureusement, peu des polices contiennent ces caractères.

Verdy_p trouve qu’il n’est pas necessaire d’utiliser les diacritiques doubles, et que et suffisent. Je suis d’accord que et est mieux (au début des noms propres), mais dans les autres cas je préférait de représenter le texte de manière plus exacte que possible.

Qu’est-ce que vous pensez? — Linus (disc) 21 mars 2011 à 00:31 (UTC)[répondre]

Après considération prolongé je pense qu’il serait au mieux de représenter les diacritiques doubles, mais ils ne s’affichent pas très bien. Alors j’ai l’intention de les remplacer par , . Si, un jour ou l’autre, on veut revenir sur les diacritiques doubles, ça devrait être possible, par remplacement automatisé en combination avec le Modèle:Lang. — Linus (disc) 23 mars 2013 à 17:49 (UTC)[répondre]

suspension temporaire (de ma part) & liste de choses à faire[modifier]

Dans les prochains mois je sera occupé à finalement atteindre mon degré universitaire. Afin de prémunir le projet un peu contre l’abandon, j’ai assemblé une liste de choses à faire. — Linus (disc) 21 janvier 2014 à 21:09 (UTC)[répondre]

  • abréviations ({{abréviation}})
    • p. 13 et pp. 945–7 sont utilisés comme bac à sable pour l’utilisation du modèle
    • établir des règles d’édition pour l’usage du modèle – p. ex. (Ta. 1) ?
    • réaliser un javascript pour semi-automatiser l’insertion du modèle
    • ajouter un bouton pour le modèle à la barre d’outils
    • récupérer les abréviations dans les pages existantes
    • {{abr}} ? {{abbr}} ?
  • liens / références ({{liat}})
    • p. 13 et pp. 945–7 sont utilisés comme bac à sable pour l’utilisation du modèle
    • établir des règles d’édition pour l’usage du modèle : aussi pour les synonymes et autres mots non spécifiquement introduits par v. ?
    • récupérer les pages existantes
    • ajouter un bouton pour le modèle à la barre d’outils
  • liens additionels pour les formes de conjugaison et les verbes utilisés comme types de conjugaison ?
  • réaliser un javascript pour faciliter la transcription des indications de conjugaison, c’est à dire un tel remplacement automatisé : conj. 99 ;{{abréviation|conj.|conjugaison numéro}} {{lia|Appendice|C99|99|2009}} « ''{{lang|thv-Latn|bereġ}}'' » ;Linus (disc) 10 avril 2014 à 21:45 (UTC)[répondre]
  • {{lang|thv-Latn}}
    • apparemment, non pas tous les mots sont dans le dialecte de l’Ahaggar (ISO thv)
    • baliser tous les mots selon leur langue / dialecte spécifique ? Ça serait très compliqué.
    • baliser tous les mots lang="ber" ? Est-ce conforme au standard ? Amener les balises spécifiques quand le texte est à complet ?
    • y a-t-il la possibilité de baliser un mot avec deux langues ??
Les mots berberes sont maintenant balisé par lang="ber", parce-que "thv" ‹ tamahak › est trop spécifique – tamahak n’est qu’un de à peu près 6 dialectes présent dans le dictionnaire. En plus, il est difficile de attribuer tous les mots à chaque dialecte. Par exemple, sur page 2, le mot tădṛaḳ n’est pas accentué particulièrement – ce n’est que sur page 538 qu’on trouve que ce mot n’est pas une forme tamahak, mais tamacheq et ainsi devrait être balisé "taq". — Linus (disc) 15 septembre 2014 à 21:03 (UTC)[répondre]

Projet-pilote de reconnaissance optique de caractères – balisage fin de ligne[modifier]

J’ai commencé à baliser les fins de lignes afin de pouvoir utiliser les pages déjà transcrites comme matériel d’apprentissage pour le logiciel de reconnaissance optique de caractères Transkribus. Ce balisage est nécessaire pour l’apprentissage d’un réseau de neurones artificiel. Les environs 500 pages promettent d’être une base suffisante pour un bon modèle, ce qui devrait faciliter grandement le reste du travail.

J’utilise les caractères Unicode suivantes pour la balisage :

fin de ligne Unicode
normal U+2028 LINE SEPARATOR
avec césure U+00AD SOFT HYPHEN

Il est regrettable que ces caractères soient invisibles. Si quelqu'un a une suggestion alternative pour la balisage, je suis ouvert pour cela ! Quoi qu’il en soit, j’espère que ces modifications s’inscriront dans le cadre de Wikisource et ne seront pas perturbateurs.

Dans le cadre de mon travail dans le domaine des humanités numériques, je prévois de superviser un stage de plusieurs semaines à partir de début octobre, au cours duquel une collègue contribuera à cette balisage. Mes contributions pendant ce stage seront rémunérées et j’utiliserai mon compte d’utilisateur professionnel pendant cette période. La stagiaire – étudiante des humanités numériques – se présentera certainement ici au début de son stage.

Linus (disc) 24 septembre 2020 à 20:39 (UTC)[répondre]

La stage de Ginger FoxB est fini et nous avons préparé 184 pages pour Transkribus. La reconnaissance des caractères par Transkribus a une fidelité de 2,21% (taux d’erreurs de caractère). C’est un résultat très satisfaisant ! Je vais probablement continuer à corriger des pages et préparer-les pour Transkribus – et je vais écrire une petite documentation sur la page Discussion Livre:Foucauld, Dictionnaire touareg.djvu.
Linus (disc) 2 janvier 2021 à 07:13 (UTC)[répondre]