Les identifiants, pivots entre les API et jeux de données
Pour manipuler les données, et notamment pour récupérer des informations sur une même ressource à travers plusieurs applications, ou basculer d'une ressource à une autre quand elles sont liées, il est souvent indispensable de s'appuyer sur des identifiants partagés entre ces applications, ou entre ces ressources. Ressource s'entend pour tout document disponible en ligne ou non, création de l'esprit, mais aussi auteur, thématique, au sujet desquels on peut avoir besoin de dire des choses.
Cette page vous présente les identifiants présents dans les bases de données de la BnF, sous une forme concise pour chaque ressource. Dans certains cas, des explications complémentaires, plus détaillées, sont données à la suite des tableaux.
Identifiants internes à la BnF
ARK
ARK, pour Archival ressource key, est un dispositif technique garantissant une pérennité des identifiants utilisés, indépendamment des systèmes d'information et des bases de données. Le préfixe "12148" identifie l'établissement BnF. La suite, non signifiante, identifie la même ressource sur toutes les applications BnF où elle apparaît. La BnF publie les préconisations pour l'implémentation d'ARK par les sous-autorités nommantes et autorités d'adressage BnF
Exemple : ark:/12148/cb140094767
Type de ressource
Dans Gallica :
- Exemplaires numérisés
Dans le catalogue général :
- Documents (livres, périodiques, CD/DVD, etc...)
- Personnes physiques, organisations, lieux
- Notices d'oeuvre (autorités titre)
- Concepts sujet (vocabulaire Rameau)
Dans BnF Archives et manuscrits :
- Inventaires d'archives
- Personnes physiques, organisations, lieux
- Oeuvres
- Sujets
Dans data.bnf.fr :
- L'ensemble des ressources ci-dessus
API
Dans le SRU Gallica : dc:identifier
Dans le SRU de BnF Catalogue général :
- critères de recherche bib.ark et aut.ark
- ARK récupérable dans les zones suivantes :
- format Dublin Core : dc:identifier
- formats Unimarc/Intermarc : mxc:record/@id
Dans data.bnf.fr : utilisés pour tous les URI des ressources BnF
Dans data.bnf.fr : utilisés pour tous les URI des ressources BnF
Numéro de notice
Notamment dans le webservice SRU du catalogue général, les numéros de notice interne peuvent servir de clés de recherche. Ils sont sur 8 chiffres.
Type de ressource
Catalogue général :
Toute notice présente dans la base de données
API
Dans le SRU du catalogue général :
- critères de recherche :
- bib.recordid, aut.recordid : récupère la notice à partir de l'identifiant interne
- bib.author2bib : récupère la liste des documents d'un auteur, à partir de son identiant interne
- bib.subject2bib : récupère la liste des documents sur un sujet (ce sujet peut être un thème, une personne, un lieu) à partir de cet identifiant
- bib.work2bib : liste des éditions successives d'une oeuvre, à partir de l'identifiant de cette oeuvre
- aut.authors2works : liste des oeuvres d'un auteur, à partir de son identifiant
- où trouver cette information :
- pour chaque notice, l'identifiant interne est encapsulé dans l'ARK. Dans les 9 derniers caractères de l'ARK, le dernier est une clé de contrôle. Les 8 autres correspondent à l'identifiant interne.
- au sein d'une notice de ressources, les identifiants internes des autres ressources sont dans différentes zones du format Unimarc ou Intermarc, en sous-zone "3".
Exemples :- dans une notice bibliographique, la zone 100$3 contient l'identifiant de l'auteur principal.
- dans une notice bibliographique, la zone 410$3 contient l'identifiant de la collection dans laquelle est paru l'ouvrage.
FRBNF
Le numéro FRBNF est traditionnellement l'identifiant diffusé lors de la récupération des notices de la BnF par d'autres bibliothèques. Il est présent dans les notices bibliographiques et d'autorité au format Marc. Il préfixe le numéro de notice interne des lettres "FRBNF", et ajoute une clé de contrôle.
Identifiants internationaux
Dans les bases de données de la BnF sont aussi utilisés des identifiants internationaux pour décrire ces mêmes ressources, personnes ou objets. Certains sont très connus, d'autres le sont surtout des professionnels du domaine -- mais tous peuvent se révéler très utiles.
ISBN
L'ISBN définit une édition imprimée particulière d'une oeuvre.
D'abord sur 10 chiffres, il est aujourd'hui sur 13 chiffres. Le dernier caractère est toujours une clé de contrôle, avec un chiffre de 1 à 9 ou la lettre X.
Si l'ISBN est à 10 chiffres, on peut le convertir en ISBN13 : il suffit d'ajouter le préfixe 978, retirer la clé de contrôle et recalculer cette clé selon le mode de calcul propre aux ISBN13.Si c'est un ISBN13, on ne peut le convertir en ISBN10 que s'il commence par "978" (les ISBN13 commençant par 979 ne sont pas convertibles en ISBN10).
Les modes de calcul des clés de contrôle sont expliqués sur Wikipedia. Il existe par ailleurs de nombreuses fonctions déjà écrites dans différents langages qui opèrent ces calculs.
Le consortium américain OCLC, qui maintient le catalogue WorldCat, fournit gratuitement une API de conversion : pour convertir un ISBN10 en 13 ou un ISBN13 en 10
Type de ressource
Livres imprimés ou électroniques, hors périodiques et revues, postérieurs à 1970.
API
Dans le SRU catalogue général :
- critère de recherche : bib.isbn
On peut chercher l'ISBN tel qu'il apparaît dans la notice, ou complètement "nettoyé" de ses tirets et espaces - récupérable dans :
- format Dublin Core : dc:identifier
- format Unimarc : zone 010$a
<mxc:datafield tag="010"><mxc:subfield code="a"/></mxc:datafield> - format Intermarc : zone 020$a
- dc:identifier
- propriété bnf-onto:isbn
ISSN
L'ISSN est un identifiant de ressource continue, c'est-à-dire de périodique (revue) ou de collection.
Une revue qui existe à la fois en version imprimée et électronique aura deux ISSN.
L'histoire d'une revue peut être parfois compliquée, avec changements de titre et de propriétaire : dans un nombre croissant de cas, un ISSN dit "de liaison" permettra de savoir que l'ensemble de ces ISSN relèvent des différentes péripéties d'une revue.
L'attribution des ISSN est pilotée par une agence internationale. La BnF est agence française ISSN. Pour des raisons d'organisation propre à cette agence internationale, la BnF ne peut rediffuser que les ISSN français.
Type de ressource
Ressources continues (périodiques et revues, collections) imprimées, électroniques, multimédia
API
Dans le SRU catalogue général :
- critère de recherche : bib.issn
On peut chercher l'ISSN tel qu'il apparaît dans la notice, ou complètement "nettoyé" de ses tirets et espaces - récupérable dans :
- format Dublin Core : dc:identifier
- format Unimarc : zone 011$a
<mxc:datafield tag="011"><mxc:subfield code="a"/></mxc:datafield> - format Intermarc : zone 022$a
- dc:identifier
- propriété bnf-onto:issn
EAN
L'EAN est un identifiant commercial, utilisé pour le code-barre. Pour les livres, il se confond désormais avec l'ISBN à 13 chiffres.
Il est présent surtout dans les documents des trente dernières années.
Type de ressource
Monographies, livres imprimés, partitions, DVD, DVD, VHS, etc.
API
Dans le SRU catalogue général :
- critère de recherche : bib.ean
L'EAN n'a pas de caractère d'espacement (ni tirets ni espaces) - récupérable dans :
- format Dublin Core : dc:description, précédé de la mention : "Code à barres commercial : EAN"
- format Unimarc : zone 073$a
<mxc:datafield tag="073"><mxc:subfield code="a"/></mxc:datafield> - format Intermarc : zone 038$a
Dans le SRU Gallica : peu fréquent, puisque Gallica contient essentiellement des documents dans le domaine public
- dc:description
- propriété bnf-onto:ean
Numéro commercial (musique)
Le numéro commercial est présent dans les notices de 1 million d'enregistrements sonores, 100 000 vidéos, ainsi que pour des images, des documents multimédias et des ressources électroniques. Il est mentionné dans le catalogue sous le libellé " Référence(s) commerciale(s)"
Type de ressource
Enregistrements sonores, vidéos, multimédia
API
Dans le SRU catalogue général :
- critère de recherche : bib.comref
- récupérable dans :
- format Dublin Core : dc:description, précédé de la mention : "Numéro commercial : "
- format Unimarc : zone 071$b (marque, société, source de l'identifiant) et $a (identifiant de la ressource au sein de cette marque ou société)
<mxc:datafield tag="071"><mxc:subfield code="b"/><mxc:subfield code="a"/></mxc:datafield> - format Intermarc : zone 028$e$a
Dans le SRU Gallica : assez rare, puisque Gallica contient essentiellement des documents dans le domaine public
- dc:description
Dans data.bnf.fr : non récupéré
ISNI
Identifiant international et normalisé servant à identifier de manière univoque et pérenne les identités publiques des personnes et des organismes impliqués dans la création, la production, la gestion et la distribution de contenus intellectuels et artistiques.
L’ISNI se révèle particulièrement utile pour différencier les homonymes. Pour une personne ou collectivité utilisant plusieurs identités publiques (par exemple un nom réel et un pseudonyme) un identifiant ISNI distinct est associé à chacune de ces identités.
L’attribution et la gestion des ISNI sont centralisées par l’Agence internationale ISNI. La BnF est Agence d'enregistrement ISNI depuis 2014. A ce titre, elle sert d’intermédiaire pour l’attribution d’ISNI aux personnes et collectivités contribuant au patrimoine documentaire national. La BnF ne prend pas en charge l’attribution d’identifiants ISNI à des données non décrites dans son Catalogue général.
L’ISNI est intégré dans les notices d'autorité Personnes et Collectivités de BnF catalogue général, avec un taux de couverture croissant. Les ISNI sont mis à jour à un rythme hebdomadaire et sont diffusés en formats MARC et RDF via diverses modalités de récupération.
Type de ressource
Autorités (personnes, collectivités)
API
Dans le SRU catalogue général :
- Critères de recherche dans les notices d’autorité :
- aut.isni :permet de chercher les notices d’autorité par leur ISNI en utilisant les 16 chiffres accolés de l’identifiant.
- aut.isnidate :permet de rechercher par date de chargement de l’ISNI dans le catalogue général de la BnF et notamment de récupérer toutes les notices d’autorité pour lesquelles un ISNI a été chargé avant telle date. Interrogeable au format YYYYMMDD.
- Formats de récupération :
- format Unimarc A : zone 010
<mxc:datafield tag="010" ind1=" " ind2=" "><mxc:subfield code="a">ISNI sur 16 chiffres</mxc:subfield><mxc:subfield code="2">source de chargement</mxc:subfield><mxc:subfield code="d">date de chargement</mxc:subfield></mxc:datafield> - format Intermarc A : zone 031
<mxc:datafield tag="031" ind1=" " ind2=" "><mxc:subfield code="a"> ISNI sur 16 chiffres </mxc:subfield><mxc:subfield code="2"> source de chargement </mxc:subfield><mxc:subfield code="d"> date de chargement </mxc:subfield>
- format Unimarc A : zone 010
- propriété isni:identifierValid
L’ISNI est exprimé sous la forme d’une chaîne de caractères (16 caractères).
En savoir plus : Modalités de récupération de l'ISNI (sur bnf.fr)
Autres identifiants pour la musique et l'audiovisuel
- ISMN (International Standard Music Number), équivalent de l'ISBN pour les partitions, et passé de 10 à 13 caractères comme lui
Sur 13 chiffres, il commence par "979-0"
Présent dans 20.000 notices de partitions
Critère de recherche dans le SRU du cataloge général : bib.ismn (exemples : les ISMN sur 10 caractères, préfixés M ; ISMN sur 13 caractères)
Dublin Core : en dc:description, préfixé "ISMN "
Unimarc : en zone 013
Intermarc : en zone 024
- Cotage et numéro d'édition pour la musique (exemple : Carli 247).
300.000 partitions sont dotées de cette information
Dublin Core : en zone dc:description, préfixé "Cotage : " (sans précision de la source)
En Unimarc : zone 071
En Intermarc : zone 023
- Identifiant de disque ancien (exemple)
Dans les notices bibliographiques
Dublin Core : en dc:description, préfixé "Numéro(s) de matrice : "
En Unimarc : zone 071
En Intermarc : zone 027
- ISAN : Identifiant international pour les oeuvres audiosivuelles (exemple : 0000-0000-71C3-0000-5-0000-0000-M)
Dans le catalogue de la BnF, cette information est présente dans les notices d'oeuvre (ou notices d'autorité Titre), mais de manière encore très incomplète (quelques milliers seulement). Un travail de reprise est prévu.
En Unimarc : non encore exposé
En Intermarc : zone 032
Identifiants externes
La BnF s'efforce de récupérer aussi des identifiants d'autres bases, afin de faciliter la récupération et l'utilisation de ses données.
Elle réalise alors des alignements, c'est à dire qu'elle déclare des équivalences entre ses ressources et ces mêmes ressources (concepts, personnes, lieux) décrites ailleurs.
Ne sont énoncés ici que les principaux. Certains sont le résultat d'alignements manuels, d'autres sont obtenus par des traitements automatiques.
- Dans le catalogue général, ces alignements ne concernent que les thèmes du vocabulaire de description RAMEAU.
- Dans data.bnf.fr, ce peut être tous types de ressources, hormis les documents eux-mêmes (qui sont de type frbr-rda:Manifestation)
LCSH/LCA (Library of Congress Subject Headings / Library of Congress Authorities)
Noms communs et noms propres de la Bibliothèque du Congrès.
Ces alignements sont saisis manuellement dans le catalogue, rediffusés dans data.bnf.fr avec les propriétés skos:exactMatch ou skos:closeMatch.
Dans le catalogue, et dans data.bnf.fr, on trouve plus de 120 000 alignements
Vocabulaire d'indexation utilisé en médecine, maintenu par la National Library of Medecine américaine, notamment pour les articles de la base bibliographique Pubmed.
Alignements exclusivemement dans data.bnf.fr, obtenus par algorithmes. DBpedia d'abord, et aujourd'hui plus encore Wikidata, peuvent servir de pivot pour récupérer des informations complémentaires et basculer vers d'autres plates-formes sur le web.
Wikidata utilise une propriété Identifiant BnF (P268). La valeur en est les 9 derniers caractères de l'ARK BnF, sans le préfixe qui est commun à toutes les ressources.
Wikidata utilise aussi une propriété Gallica ID (P4258).
MusicBrainz est une encyclopédie musicale collaborative, diffusant ses métadonnées en utilisant les technologies du linked data, décrivant plusieurs centaines de milliers de ressources et d'artistes.
Un dump (fichier téléchargeable) d'alignements entre ressources BnF et ressources MusicBrainz est proposé sur ce site.