Dumps de data.bnf.fr
Présentation
data.bnf.fr rassemble les données issues des différentes bases et catalogues de la BnF pour y donner un accès fédéré par auteurs, oeuvres, thèmes, lieux et dates. Les données de data.bnf.fr sont enrichies par des alignements avec d'autres données publiées sur le Web, comme Wikidata ou DBpedia. Elles sont exprimées selon les standards du Web sémantique et sont récupérables au format RDF (XML, NT, N3) et JSON ou JSON-LD.
Contenu des jeux de données
data.bnf.fr utilise des données produites dans des formats divers, notamment Intermarc pour les livres imprimés, XML-EAD pour les archives et manuscrits, et Dublin Core pour la bibliothèque numérique Gallica. Ces données sont modélisées, regroupées, enrichies par des traitements automatiques et publiées selon le langage du Web sémantique, le RDF (Ressource description framework).
data.bnf.fr expose l'ensemble des données de bonne qualité des catalogues et bases de données de la BnF, à savoir les données relatives aux autorités (personnes, organisations, thèmes, oeuvres, lieux) validées par un expert et les données des ressources de la BnF qui sont liées à ces autorités.
Formats de récupération
- RDF/XML
- NT
- N3
Modèle de données
Les données de data.bnf.fr sont modélisées selon un modèle entité-relations pensé pour les bibliothèques et les collections qu'elles décrivent, et adapté à l'univers du Web.
Comprendre le modèle de données de data.bnf.fr
API et jeux de données en lien
- Les données de data.bnf.fr sont également interrogeables grâce à des requêtes SPARQL, qui permettent de récupérer les données de manière plus précise
- Les identifiants ark des documents numérisés dans Gallica sont présents dans les données de data.bnf.fr
- Grâce aux identifiants ark, les données de data.bnf.fr peuvent être complétées avec les données du catalogue général, disponibles par le protocole SRU
Guide technique complet
Récupérer les données de data.bnf.fr
Politique de permanence associée aux ressources identifiées par un ARK
Considérations générales sur les ARK BnF
La BnF attribue des identifiants dans le domaine ARK 12148 (Bibliothèque nationale de France) selon les principes suivants.
- Aucun identifiant ARK ne sera attribué à nouveau ; c'est-à-dire qu'une fois qu'un lien entre un identifiant ARK et un objet aura été publié, ce lien devra être considéré comme unique, et ce pour une durée indéfinie.
- Les identifiants ARK attribués par la BnF ne contiennent, dans la mesure du possible, aucune information sémantique facilement reconnaissable ; cela contribue à faciliter leur utilisation indépendamment d'un contexte de temps ou de lieu.
- Les identifiants ARK attribués par la BnF contiennent un caractère de contrôle qui les garantit contre des erreurs de caractère isolées et des erreurs de transposition. Un utilisateur ayant fait une faute de frappe en tapant un ARK obtiendra une réponse HTTP 400 et un message l’informant que l’ARK fourni est erroné.
Mutabilité des ressources
La mutabilité des ressources présentes dans data.bnf.fr et identifiées par des ARK est définie comme suit.
- Les données présentes dans data.bnf.fr et identifiées par des ARK sont issues de différents catalogues et applications de la BnF (Catalogue général, Gallica, BAM). Néanmoins, les métadonnées descriptives diffusées par data.bnf.fr présentent un différentiel par rapport à celles des applications sources. Les modifications peuvent être de plusieurs ordres :
- Les métadonnées sont susceptibles d’avoir été enrichies de données extérieures (Wikimedia, VIAF, Bibliothèque du Congrès, etc.) ;
- Les métadonnées peuvent avoir été enrichies grâce à des inférences permettent de déduire des informations et des liens non présents dans les données sources ;
- Certaines métadonnées présentes initialement dans les notices sources des catalogues et applications de la BnF peuvent ne pas être affichées dans les données de data.bnf.fr.
- Data.bnf.fr met en avant des données dont l’application n’est pas la productrice. Les notices sources peuvent être scindées, remplacées, supprimées ou dé-publiées des applications et catalogues de la BnF. Dans ces différents cas, il est nécessaire de se référer aux politiques de maintien des ARK émanant des différents sites producteurs des notices. A terme, data.bnf.fr mettra en place des mécanismes de redirection pour que les ressources soient accessibles.
Autorité d’adressage
L’autorité d’adressage data.bnf.fr gère les qualificatifs de service génériques suivants :
- « description » : les données dans data.bnf.fr sont scindées en deux groupes:
- Les informations portées par un ARK suffixé par #about concernent les entités elles-mêmes, les choses du monde réel ;
- Les informations portées par un ARK non suffixé concernent les notices, les descriptions des entités
- « policy » : politique de permanence de la ressource.
- La politique de permanence des ressources rendues disponibles sur le site data.bnf.fr est à consulter sur les sites producteurs des données, notamment le Catalogue général, Gallica, BAM, etc.
Disponibilité
Les services (hors sparql) et les données de data.bnf.fr sont accessibles 24h/24h 7j/7j. Il convient de mentionner que des indisponibilités temporaires peuvent être liées à des problématiques de service interne et ne sont pas toujours prévisibles.
Contact : data@bnf.fr
Télécharger
Fiche Technique
Date de mise en ligne10 juin 2024
FormatRDF/XML RDF/NT RDF/N3
Licence TechnologiesRDF
SujetsManuscrits Patrimoine écrit Musique Périodiques Images Cartes Transition bibliographique