Logo BnF

API et jeux de données

fr
  • Accueil
    • Gallica
    • data.bnf.fr
    • Dépôt légal du Web
    • Catalogue collectif de France (CCFr)
    • Catalogue général de la BnF
    • Mandragore
    • BnF Archives et Manuscrits
    • Bibliographique des éditions parisiennes du XVIe siècle
    • Reliures
    • Données statistiques
    • Voir toutes les sources
    • Expérimentations
    • Projets de recherche
    • Tutoriels & outils
  • Services
  1. Vous êtes ici : Accueil
  2. Entrepôt OAI PMH De BnF Catalogue Général (OAI CAT)
XML OAI-PMH

Entrepôt OAI-PMH de BnF Catalogue général (OAI-CAT)


Présentation

OAI-PMH  (Open Archives Initiative - Protocol for Metadata Harvesting), est un « protocole de collecte de métadonnées de l'Initiative pour les Archives ouvertes ».

Le protocole OAI-PMH est un moyen d'échanger sur Internet des métadonnées entre institutions, afin de multiplier les accès aux données des catalogues et bibliothèques numériques.

Son utilisation est libre, tout comme ses spécifications, disponibles sur le site http://www.openarchives.org. Le fonctionnement de base du protocole OAI-PMH repose sur une communication de client à serveur. Le client envoie des requêtes HTTP au serveur, le serveur répond par un flux de données au format XML.

Les entrepôts de la BnF

La BnF gère deux types d'entrepôts où sont stockés l'ensemble des métadonnées relatives à ses documents.

Le premier entrepôt correspond aux notices des documents numériques consultables sur Gallica (OAI-NUM) et dont la BnF détient un exemplaire numérisé.

Le deuxième entrepôt a été créé pour améliorer le signalement des documents conservés dans les collections de la BnF et faciliter la diffusion et l'échange de métadonnées descriptives. Les métadonnées proviennent des catalogues de la BnF, dont BnF catalogue général. Environ 13 942 000 notices sont exposés dans cet entrepôt (OAI-CAT).

La granularité de cet entrepôt est la notice bibliographique. On appellera cet entrepôt OAI-CAT. L’interrogation de cet entrepôt permet d’obtenir les métadonnées « simplifiées » issues de la notice bibliographique. Il est possible entre autres d’obtenir une liste d’identifiants de documents appartenant à un ensemble prédéfini dans l’entrepôt, à partir de laquelle on peut obtenir les notices associées.

  • Adresse de l’entrepôt OAI-CAT (requête à compléter): http://catoai.bnf.fr/oai2/OAIHandler?verb=

Les deux entrepôts proposés fournissent au minimum des notices au format OAI_DC, Dublin Core non qualifié (15 types d’attribut différents), et au format TEL_AP (The European Library Application Profile). La page Récupération des notices descriptives des documents numérisés décrit succinctement ces formats.

Les notices Dublin Core de l’OAI-CAT et celles de l’OAI-NUM, bien que toutes conformes au Dublin Core, contiennent des informations différentes (plus riches pour ce qui concerne OAI-CAT). Par ailleurs l’ensemble des sets proposés sont différents.

Le contenu des entrepôts, sous forme de liste d'identifiants, est donné par le verbe ListIdentifiers :

  • OAI-CAT : http://catoai.bnf.fr/oai2/OAIHandler?verb=ListIdentifiers&metadataPrefix=oai_dc

Documentation

  • Présentation générale
  • Présentation BnF de l’OAI [PDF]
  • Site comportant la présentation complète du protocole OAI

Le langage d’interrogation

Il existe six requêtes et plusieurs paramètres :

  • Identify : pour obtenir des informations sur l’entrepôt interrogé.
  • ListIdentifiers : pour obtenir la liste des identifiants de notice de l’entrepôt. Il faut préciser des paramètres complémentaires, comme le format Dublin Core.
  • ListMetadataFormats : pour obtenir la liste des formats présents dans l’entrepôt.
  • ListSets : pour obtenir la liste des sets (ensembles prédéfinis) de l’entrepôt.
  • ListRecords : pour obtenir la liste des enregistrements/notices de l’entrepôt. Il faut préciser le format attendu.
  • GetRecord : pour obtenir un enregistrement/notice de l’entrepôt. Il faut préciser le format attendu et l’identifiant du document.

Les requêtes sont précédées de ?verb= et commencent par une majuscule.

Les paramètres sont introduits par « & » et commencent par une minuscule. Il y a des paramètres obligatoires et optionnels pour chaque requête.

Plus de précisions sur le langage d’interrogation

Les sets dans OAI-CAT

Les sets sont de trois types différents :

  • type de documents,
  • fonds,
  • collections/département d’appartenance d’un exemplaire.

Toutes les notices d’OAI-CAT appartiennent au moins à un set « type de document ».

Exemples de requêtes

Identify

http://catoai.bnf.fr/oai2//OAIHandler?verb=Identify

ListIdentifiers

http://catoai.bnf.fr/oai2//OAIHandler?verb=ListIdentifiers&metadataPrefix=oai_dc

Recherche avec clé de reprise (resumption token) : les longues listes sont récupérées par paquets avec Resumption token : http://oai.bnf.fr/oai2/OAIHandler?resumptionToken=1%2168816%2124557098%212767325%21100%212826328%21oai_dc&verb=ListIdentifiers

ListSets

http://catoai.bnf.fr/oai2//OAIHandler?verb=ListSets

ListRecords

http://catoai.bnf.fr/oai2//OAIHandler?verb=ListRecords&metadataPrefix=oai_dc

Liste des enregistrements créés ou modifiés depuis le 15/10/2016 au format oai_dc :
http://catoai.bnf.fr/oai2//OAIHandler?verb=ListRecords&from=2016-10-15&metadataPrefix=oai_dc

ListMetadataFormats

http://catoai.bnf.fr/oai2//OAIHandler?verb=ListMetadataFormats

GetRecord

http://catoai.bnf.fr/oai2//OAIHandler?verb=GetRecord&identifier=oai:bnf.fr:catalogue/ark:/12148/cb40500064k&metadataPrefix=oai_dc

Remarques :

  • les suppressions de notices dans un set ou dans l'entrepôt sont signalées par les identifiants, mais il n'y a pas de record associé.
  • le standard OAI-PMH ne permet pas d'exprimer de requête sur un critère bibliographique (titre, auteur, etc.).

Aide


Dublin Core Format bibliographique

Le Dublin Core simple propose 15 attributs, facultatifs et répétables :

Contenu

  • Titre dc:title    
  • Sujet dc:subject    
  • Description dc:description    
  • Source, origine de l'information dc:source    
  • Langue dc:language    
  • Relation avec d'autres ressources dc:relation    
  • Couverture chronologique et géographique dc:coverage

Propriété intellectuelle

  • Auteur dc:creator    
  • Contributeur dc:contributor    
  • Editeur dc:publisher    
  • Droits, conditions d'utilisation dc:rights

Instanciation

  • Date dc:date    
  • Type de document (texte, image, son, etc) dc:type    
  • Format dc:format    
  • Identifiant dc:identifier

Présentation des 15 éléments sur le site officiel du Dublin Core

Guide d'utilisation du Dublin Core à la BnF décrivant notamment les choix d'implémentation spécifiques à l'établissement

Accès

Page de présentation : http://oai.bnf.fr/oai2//OAIHandler?verb=Identify

Formulaire d'aide à la création de requêtes : http://oai.bnf.fr/oai2/test.html

Fiche Technique
Version

2

Format

XML

Licence

Licence ouverte de l’état

Technologies

OAI-PMH

Contact
coordination-bibliographique@bnf.fr
Partage
Twitter Facebook Linkedin
Ressources en lien
Entrepôt OAI-PMH de Gallica et des expositions virtuelles (OAI-NUM)

OAI-PMH  (Open Archives Initiative - Protocol for Metadata Harvesting), est un « protocole de collecte de métadonnées de l'Initiative pour les Archives ouvertes ».

XML OAI-PMH
  • © 2020 BnF
  • A propos
  • Conditions d'utilisation
  • Mentions légales
  • Politique de confidentialité
  • RSS
  • Écrire à la BnF
  • Accessibilité (non conforme)
  • DCAT
twitter facebook instagram youtube