Wikisource:Projet Wikidata/Comment faire

La bibliothèque libre.

Accueil

 

Propriétés

 

Outils

 

Tâches

 

Comment faire ?

 

SPARQL

 

Rôle de Wikidata[modifier]

Wikidata (abrégé par WD) est une base de données qui vise à faire l’inventaire de toutes les connaissances existantes, notamment celle présentes dans les différents sites de la Fondation Wikimedia. C’est aussi un wiki.

Elle est multilingue, c'est-à-dire que toutes les connaissances stockées (et leurs propriétés) sont susceptibles d’avoir un libellé et une description dans chaque langue.

Elle vise à consolider toutes les informations sur ces connaissances et à les rendre accessibles à chaque site, quelle que soit sa langue. C’est ce qui se passe pour les pages « Auteur » de Wikisource (abrégé par WS). À partir du moment où elles sont citées dans les liens de l’entité WD correspondante, elles peuvent en récupérer les informations stockées dans WD grâce aux modèles {{Auteur}} et {{Autorité}} (merci Tpt).

Page WD d’un auteur WS

Wikitexte de la page Auteur WS

Page Auteur alimentée par WD

Les « spécifications fonctionnelles des notices bibliographiques » (souvent désigné par l’acronyme anglais FRBR), adoptées par Wikidata pour les ouvrages qui nous intéressent, semblent artificiellement compliquées aux contributeurs de WS. Pourtant ce n’est qu’une extension et un enrichissement du concept d’éditions multiples de WS à toutes les éditions.

L’avantage est de pouvoir rattacher à une entité unique, l’œuvre, les propriétés communes à toutes les éditions, traductions et œuvres dérivées, quelque soit le site et pas seulement un Wikisource dans une langue particulière.

Chaque site de la fondation, et pas seulement les Wikisources, doit pouvoir se référer à une entité unique et, au besoin, y apporter ses compléments d’information, ce qui n’est pas possible si les informations sont dispersées dans les différentes éditions sur les différents sites et non consolidées dans une entité « mère » : l’œuvre.

N’oublions pas aussi que nous travaillons dans un cadre international : Wikidata est aussi consulté par les bibliothèques du monde entier, le Fichier d'autorité international virtuel (VIAF) cite les fiches WD, les robots qu’elles utilisent pour ces consultations doivent pouvoir se référer à ce point central : l’œuvre, pour avoir toutes les informations disponibles sur cette œuvre dans les différents sites de la Fondation Wikimedia.

Saisie dans Wikidata[modifier]

Wikidata est multilingue, ce qui explique pourquoi, quand on entre un libellé, il faut préciser la langue. Ceci vaut notamment pour le libellé de la page, ses alias et sa description.

Les données sont identifiées en externe par leur libellé et une description qui sont affichés si possible dans la langue de celle ou celui qui interroge.

Les alias permettent de retrouver une entité par un nom différent du libellé, c’est particulièrement utile pour les personnes dont le nom peut se présenté sous plusieurs formes.

Les différentes partie de l’entête d’une entité

C’est une des tâches importantes des contributeurs est d’ajouter le libellé et la description dans leur langue. En interne, la même donnée sera identifiée de manière unique dans WD par un numéro attribué automatiquement par le système, précédé de Q si c’est une entité (personne, pays, œuvre, etc.) ou de P si c’est une propriété (auteur d’une œuvre, langue de l’œuvre, date de naissance de l’auteur, date de publication de l’œuvre, etc.)

À part ce libellé, ces alias et cette description, la donnée est dotée de propriétés qui dépendent de sa nature :

Ces propriétés se présentent sous la forme de « déclarations » (claims en anglais) qui comportent toujours au moins deux parties : la propriété et sa valeur, par exemple :

  • date de publication (P577) et une valeur qui sera donc une date avec une précision relative (siècle, année, mois, jour) selon le cas.
    Entrée d’une date (précision : année)
  • langue de l’œuvre (P407) et une valeur qui sera une des langues déjà cataloguée dans WD, mettons le « français » (Q150).
    Liste de choix d’une valeur de propriété

C’est la propriété qui détermine si sa valeur est une chaîne de caractères (avec un code langue), une date, une valeur numérique, une entité WD existante ou un nom de fichier sur Wikimedia Commons.

Pour faciliter la saisie et ne pas avoir à connaître tous ces codes, il suffit de saisir le début du libellé de l’entité ou de la propriété et WD affiche une liste déroulante où on devrait trouver ce qui nous intéresse. Sinon, c’est qu’on s’est trompé de nom de propriété ou d’entité.

Pour préciser la propriété ou l’entité, sa description et quelquefois son code sont fournis en même temps, ce qui évite de confondre, par exemple le genre masculin grammatical (Q499327) et le genre masculin des êtres humains (Q6581097). De même, le libellé « français » (Q150) est accompagné du descriptif « langue romane » pour ne pas être confondu avec « français » (nationalité, Q121842).

Aux deux parties de la déclaration peuvent se rajouter un ou des « qualificatifs » qui se présentent de la même façon que la déclaration principale, mais viennent la préciser, ainsi la date de publication d’un article de revue est accompagnée de deux qualificatifs : le tome de parution et la page de l’article.

Propriété avec deux qualificatifs

Une propriété peut avoir plusieurs valeurs, chacune avec ses qualificatifs, il faut les enregistrer une par une.

Propriété avec plusieurs valeurs

Après avoir créé l’entité (auteur, édition, article de revue, etc.) on entre donc dans Wikidata, une par une, ces « déclarations » où une « propriété » reçoit une ou plusieurs « valeurs » sous forme de chaînes de caractères (avec le code langue qui convient), de dates ou de libellé d’entités préexistantes dans WD. On peut aussi entrer directement le code si on le connaît.

Il faut rattacher la page WS à l’entité WD, en citant son nom dans la colonne de droite qui contient les liens avec les différents sites Wikimedia (un seul lien par site).

Il y a une rubrique par type de site. Pour nous, c’est « Wikisource ».

Il y a deux champs à remplir : le premier indique sur quelle wikisource se trouve le lien ( « fr » pour nous) et le deuxième est le nom de la page WS correspondante.

Lien vers la page WS

Un aspect peu ergonomique de la saisie de données directement sur WD est que les déclarations avec leurs qualificatifs éventuels doivent être enregistrées une par une et non toutes à la fois.

Heureusement, il existe un outil (WEF) qui permet la création globale d’une entité avec ses principales déclarations en une seule fois sans même aller sur WD.

Principales entités WS à cataloguer sur Wikidata[modifier]

  • Les textes qui sont dans l’espace principal, y compris les articles de revues
  • Leurs auteurs, quand ils ne sont pas déjà répertoriés dans WD.

Pour chaque texte, le modèle à suivre comprend deux entités : une « édition » qui correspond au texte tel que nous l’avons transcrit et une « œuvre », plus générale, qui est destinée à recenser toutes les éditions, traduction et œuvres dérivées qui en découlent.

Créer une entité « édition » sur Wikidata[modifier]

Les propriétés pour renseigner les « éditions » sont détaillées dans la page « Propriétés » du Projet Wikidata sur Wikisource. Rappelons les principales :

  • nature de l’élément (P31) : version, édition ou traduction (Q1331189)
  • auteur (P51) : un auteur connu de WD
  • titre (P1476) : celui qui figure sur la page de titre du fac-similé (pas forcément celui de la page WS qui sert de libellé -- ne pas oublier le code langue)
  • langue de l’œuvre (P407) : français (Q150)
  • éditeur (P123) : la maison d’édition qui figure sur le fac-similé et qui doit être connue de WD
  • date de publication (P577) : celle du fac-similé
  • lieu de publication (P291) : idem
  • fac-similé (P996) : le nom du fichier djvu sur Wikimedia Commons (sans le préfixe « File : » )
  • édition de (P629) : rattachement à la fiche « œuvre » de WD


Les gadgets WEF


On peut utiliser le gadget WEF : FRBR Edition pour ajouter des déclarations, en modifier, et même créer l’entité WD correspondant à cette édition

WEF — édition — volet général

Voyons le formulaire qui comporte 4 onglets : On retrouve les principales propriétés listées ci-dessus, examinons les différents cadres :

WEF — édition — partie libellé et description

La zone « Label » (libellé) reprend le nom de la page WS (sauf l’année d’édition qui ne doit pas en faire partie selon les recommandations de Wikidata (merci à VIGNERON de me les avoir apprises), en création on choisit le code langue dans la liste déroulante en haut, puis on entre la description.

WEF — édition — nature, langue, titre

La propriété « nature de l’élément » est pré-remplie car on a choisi le gadget « édition ».

La langue se spécifie comme dans WD : on commence à taper le début « franç… » et une liste déroulante apparaît où l’on choisit la valeur « français, langue romane ». On peut aussi entrer directement « Q150 ».

Le titre est ici le même que le libellé. Il faut d’abord préciser le code langue ( « fr » ), sinon le gadget refusera la mise à jour (ou la création) de l’ensemble.

WEF — édition — participation à une série d’ouvrages

La partie suivante n’est pas utilisée ici, car l’ouvrage ne fait pas partie d’une série, on la retrouvera pour les articles de revues.

WEF — édition — caractéristiques de l’édition

Cette partie identifie l’édition, on commence par la référence à l’entité « œuvre » mais, la plupart du temps, à ce stade, l’œuvre n’existe pas encore, on la créera plus tard et cette zone sera renseignée ensuite.

L’édition n’étant pas numérotée, on laisse vide le no d’édition ; le lieu de publication est une entité WD existante, en général un nom de ville ; l’éditeur est une maison d’édition cataloguée dans WD ; sinon, il faudra la créer et revenir mettre à jour cette propriété ; la date est celle indiquée sur le fac-similé (ou dans une fiche bibliographique) ; en général, une année et la précision est spécifiée dans la première partie de la zone en choisissant dans une liste déroulante.

On pourrait mettre comme image la page de titre, à condition de l’avoir extraite du fichier djvu, d’en avoir fait un fichier png ou jpeg, et de placer dans la zone correspondante le nom de ce fichier sur Wikimedia Commons.

WEF — édition — collaborateurs et FS

Passons au second onglet « inside » et remarquons au passage le nombre qui suit le nom de l’onglet : c’est le nombre de déclarations qu’il contient.

Cet onglet gère deux groupes de déclarations : les collaborateurs de l’ouvrage et le fac-similé.

WEF — édition — collaborateurs

Le premier est l’auteur du texte, qui doit être connu de WD, de même que tous les autres collaborateurs ; pas de traducteur pour cet ouvrage en français ; pas d’éditeur scientifique non plus, ce n’est pas un travail de recherche ; cette édition étant illustrée par trois dessinateurs, après avoir rempli la zone « illustrateur » par le premier, il nous en faut deux autres (propriété à valeurs multiples). Pour les obtenir, on se sert du bouton « + » à gauche (pour en enlever, il faudrait se servir du bouton « poubelle » à droite).

Il n’y a pas d’autres collaborateurs à cet ouvrage, la dernière zone est donc inutilisée.

WEF — édition — fac-similé

Comme je ne sais pas encore ce qu’on doit compter ou non (pages blanches, couverture, publicités, etc.), je n’ai pas rempli la première zone.

La seconde contient le nom du fichier djvu sur Wikimedia Commons (sans le préfixe « File : » ), la troisième zone devrait indiquer l’URL où se trouve le fichier qui a servi à construire le fichier djvu. (Internet Archive a produit le djvu dans ce cas, mais l’ouvrage scanné vient de Duke University).

Passons au troisième onglet qui recense les identifiants des notices bibliographiques sur l’ouvrage.

WEF — édition — les fiches bibliographiques

Nous pourrions placer l’identifiant d’une fiche bibliographique de la BnF si la rubrique existait, mais nous devrons l’introduire dans la page WD. Nous avons aussi une fiche dans la base SUDOC que nous pouvons rentrer ici et l’identifiant Internet Archive.

WEF — édition — Identifiants IA et SUDOC

Nous passerons sur le dernier onglet « other » qui ne nous concerne pas ici.

Il ne reste qu’à enregistrer le formulaire pour que l’entité « édition » soit créée (ou modifiée) sur WD. Mais s'il y a une seule erreur, on recevra le message « unable to update entity ». La plupart du temps, c’est l’oubli d’un code langue sur un libellé qui en est la cause, ou un mauvais format de date, ou un préfixe « File : » devant le nom du Djvu sur Wikimedia Commons ; il y a aussi le format des identifiants bibliographiques à respecter.

Créer une entité « œuvre » sur Wikidata[modifier]

Les propriétés pour renseigner les « œuvres » sont détaillées dans la page « Propriétés » du Projet Wikidata sur Wikisource. Rappelons les principales :

  • nature de l’élément (P31) : œuvre littéraire (Q7725634)
  • auteur (P51) : l’auteur de l’œuvre originale, connu de WD
  • titre (P1476) : celui qui figure sur la page de titre du fac-similé (sans mention de date, ne pas oublier le code langue, et, si l’édition est une traduction, donner le titre de l’œuvre dans la langue d’origine)
  • langue de l’œuvre (P407) : il s’agit de la langue de création de l’œuvre et non de la traduction
  • date de fondation ou de création (P571) : celle de la première publication de l’œuvre
  • édition (P747) : rattachement à une fiche « édition » de cette œuvre (plusieurs occurrences possibles)


Les gadgets WEF


On a trois possibilités pour créer l’entité « œuvre » :

  • création manuelle sur WD
  • le gadget WEF — Work sur WS (prendre le dernier lien de ce nom et non celui qui précède le gadget « édition » )
  • ou la création à l’aide de « move claim » sur WD

Nous allons voir cette nouvelle possibilité qui permet de recopier ou de déplacer des déclarations (claims) d’une entité à une autre. En effet, la plupart du temps, les déclarations (auteur, titre, langue et souvent date) sont les mêmes sur l’œuvre et l’édition.

Après avoir installé le script d’appel de MoveClaim dans son common.js de Wikidata (voir la sous-page « Outils » du projet Wikidata), plaçons-nous sur l’entité « édition » nouvellement créée et nous voyons en haut à droite de chaque déclaration une petite flèche verte, c’est le déclencheur de « MoveClaim » :

Move Claim — les déclencheurs

En l’actionnant, une fenêtre vient en premier plan :

Elle permet de déplacer ou de copier une déclaration de l’entité source vers la cible indiquée par son identifiant Qxxxx ; mais aussi de créer cette entité cible si on met « NEW » à la place du Qxxxx.

Ne pas oublier de cocher la case « Ne pas supprimer… » sinon la déclaration disparaît de la source.

Ici, on cochera la case et on entrera « NEW » pour la première déclaration recopiée (par exemple, l’auteur), on notera le Qxxx de l’entité créée pour le reporter dans les appels suivants, ce qui permettra de créer un embryon d’entité « œuvre ».

Après avoir recopié les autres déclarations communes, il faudra rajouter manuellement à l’entité nouvelle la nature « œuvre », la date de création (P571) (et non de publication (P577)) et le rattachement à l’entité « édition ».

Créer une entité « article » sur Wikidata[modifier]

Les propriétés pour renseigner les « articles » sont détaillées dans la page « Propriétés » du Projet Wikidata sur Wikisource. Rappelons les principales :

  • nature de l’élément (P31) : article (Q191067) ou série d’articles (Q17518557)
  • auteur (P51) : un auteur connu de WD
  • titre (P1476) : titre de l’article (ne pas oublier le code langue)
  • langue de l’œuvre (P407) : français (Q150)
  • publié dans (P1433) : le libellé ou le code Qxxx de la revue
  • date de publication (P577) : celle du numéro de la revue dans lequel est paru l’article (précision : jour, semaine, mois, trimestre selon la périodicité) ; on qualifie cette date avec le no du tome fac-similé de la revue et avec le no de la page où commence l’article.
  • fac-similé (P996) : le nom du fichier djvu sur Commons (sans le préfixe « File : » )

Le gadget WEF Article va nous permettre de créer la fiche article avec ses propriétés de base. Attention ! ce formulaire n’est pas à jour : ce n’est pas la date de création (P571), mais la date de publication (P577) qui devrait y figurer. Nous devrons donc entrer cette déclaration manuellement sur la fiche WD de l’article.

De même, la propriété « texte intégral disponible sur » (P953) ne concerne pas le fac-similé mais un URL vers un site externe.

WEF Article — onglet général

Champs utilisés :

WEF Atricle — ajouts possibles

Il reste à renseigner dans la fiche WD la date de publication et ses deux qualificatifs ainsi que la référence au FS.

Quand l’article fait partie d’une série (par ex. un roman paru en épisodes), on doit cataloguer la série comme entité de nature « série d’articles » (Q17518557) et chaque article de la série, puis les rattacher ensemble à l’aide des propriétés suivantes :

Pour chaque article :

  • partie de (P361) : rattachement à la fiche « série »
  • précédé par (P155) : l’article précédent de la série
  • suivi par (P156) : l’article suivant de la série

L’ajout de ces déclarations peut se faire manuellement, après que chaque fiche ait été créée, ou en reprenant la fiche des articles de la série avec le gadjet WEF Édition qui affiche ces trois déclarations.

WEF édition — liens dans une série

Pour la fiche de la série :

  • comprend (p527) : une valeur par article, avec, en qualificatif, ordre dans la série (P1545) = no de l’article dans la série.

Là, on ne peut que reprendre manuellement la fiche de la série.

Voyons d’abord un exemple de propriété « comprend » dans la fiche d’une série d’articles :

WEF édition — liens dans une série

Puis les propriétés supplémentaires de chaque article de la série en prenant la fiche du deuxième article :

WEF édition — liens dans une série

Créer une entité « auteur » sur Wikidata[modifier]

Les propriétés pour renseigner les « auteurs » sont détaillées dans la page "Propriétés" du Projet Wikidata sur Wikisource. Rappelons les principales :

  • nature de l’élément (P31) : être humain (Q5) (pour l’instant !)
  • sexe ou genre (P21) : masculin (Q6581097) / féminin (Q6581072)
  • date de naissance (P569) : à retrouver dans les notices d’autorité, quelquefois avec le lieu de naissance (P19)
  • date de décès (P570) : même chose, avec quelquefois le lieu de décès (P20)
  • langues parlées, écrites ou signées (P1412) : toutes les langues dans lesquelles l’auteur s’est exprimé, là aussi d’après les notices d’autorité et les notices bibliographiques associées (au moins à la BnF), au moins le français (Q150)
  • occupation (P106) : en général, au moins écrivain (Q36180)

On y ajoute les identifiants des notices d’autorité trouvées pour chacun :

  • Identifiant VIAF (P214), souvent celui qui permet d’accéder aux autres, la base VIAF étant un hub pour les bibliothèques du monde entier (y compris Wikidata).
  • Identifiant BnF (P268), pour nous un des plus utiles car les notices « auteurs »0 y sont souvent assez complètes, et on peut facilement "rebondir" sur les notices bibliographiques associées.
  • Identifiant IdRef dit aussi SUDOC (Système Universitaire de DOCumentation) (P269) : recouvre le champ de l’enseignement supérieur et de la recherche.
  • Identifiant ISNI (P213) : certifie la forme ISO du nom public, ce qui est utile lorsque la même personne signe sous plusieurs noms.

On en trouve beaucoup d’autres, par exemple la liste des identifiants de Victor Hugo (Q535) mérite un coup d’œil.

Citons également Worldcat comme catalogue général, avec une bonne ergonomie et une bibliographie intégrée.

Pour remplir toutes les rubriques ci-dessus, il faut faire un travail d’enquêteur en cherchant dans chacun de ces différents systèmes d’identification (y compris Wikidata) pour ne pas créer de doublons :

Personnellement, je m’occupe des auteurs de articles parus dans la revue La Nature qui ne sont pas en majorité des hommes de lettres mais plutôt des scientifiques. Ne connaissant en général qu’une partie du nom (le plus souvent un nom de famille et les initiales du ou des prénoms), si je trouve une notice semblant correspondre à ce nom je me pose ces questions :

  • Les dates de vie, si elles sont indiquées sont-elles compatibles avec la date de l’ouvrage ou de l’article ?
  • La personne indiquée a-telle publié des ouvrages sur le même thème ou domaine de connaissance ?
  • Ses occupations, si elles sont indiquées, ont-elles un rapport avec le thème de l’ouvrage ou article ? (Il y a des personnes d’une telle polyvalence qu’il est difficile de décider, en particulier les journalistes de vulgarisation scientifique.)

Pour mes recherches , je commence en général par VIAF en lui donnant le nom sous la forme « nom de famille, prénoms ou initiales » (à utiliser aussi dans le catalogue de la BnF).

Quand j’ai trouvé une notice d’autorité convaincante, je note son identifiant et les quelques renseignements biographiques qu’elle contient puis je vais voir dans les notices liées s’il n’y a pas quelques compléments.

Mon « minimum vital » est d’avoir un identifiant (VIAF, BnF, IdRef…) avec les quelques données que la notice correspondante contient. Quelques fois, je trouve des données supplémentaires sur les auteurs dans un ouvrage numérisé par Google. Dans ce cas, il faut noter l’URL en référence pour « sourcer » l’information.

Le meilleur moyen de créer la fiche « auteur » sur WD est de créer la page sous WS avec un contenu semblable à celui qu’on a vu au début de cette visite, puis d’utiliser le gadget WFR Biographie qui propose les rubriques voulues sauf les identifiants de notices d’autorité. Il faudra rentrer ces rubriques sur la fiche WD créée. L’avantage du gadget est de lier automatiquement la page auteur WS à la fiche auteur WD.

Étape 1 : créer la page WS


Ne nous inquiétons pas des messages d'erreur, ils sont dû à la non-existence de la fiche Auteur WD.


Étape 2 : WEF : Biographie


Voici ce qu’on peut spécifier sur l’onglet « général » :


Voici ce qu’on peut spécifier sur l’onglet « naissance et mort » :


Voici ce qu’on peut spécifier sur l’onglet « Profession » :


Ajout des identifiants de notices d’autorité sur la fiche WD de l’auteur :


et voici le résultat : Aïe !


Il y a une erreur sur l’identifiant IdRef-SUDOC, vérifions la notice :


Il manque un « 0 » en tête de l’identifiant (se rappeler que chaque identifiant a une syntaxe particulière, on peut la consulter sur la fiche WD de la propriété).

Corrigeons. Et voilà la page Auteur WS :