Gallica : métadonnées de la collection numérique
Présentation
Ce jeu de données référence tous les documents de la collection numérique de Gallica à travers leurs métadonnées bibliographiques élémentaires.
Contenu du jeu de données
Ce jeu contient les identifiants et les métadonnées bibliographiques élémentaires (auteur, date de publication, etc.) des documents numérisés des différentes collections de Gallica.
Collection | Documents | Date (dump) |
Images | 412 786 | août 2021 |
Partitions | 57 411 | janvier 2022 |
Cartes | 70 161 | janvier 2022 |
Monographies | 550 474 | janvier 2022 |
Manuscrits | 125 420 | mars 2022 |
Périodiques | ||
Objets | ||
Son | 48 194 | juin 2023 |
Vidéo | 2 097 | juin 2023 |
Les documents concernés ont pour source :
- la collection de la BnF,
- les collections des partenaires intégrés à Gallica (hors partenaires moissonnés).
Contexte de production
Le jeu a été exporté de l'entrepôt OAI-PMH de Gallica à l'aide de requêtes portant sur les différents sets documentaires de Gallica. Par exemple, pour la collection Image : gallica:typedoc:images
http://oai.bnf.fr/oai2//OAIHandler?verb=ListRecords&set=gallica:typedoc:images&metadataPrefix=oai_dc
La requête Gallica correspondante est :
https://gallica.bnf.fr/services/engine/search/sru?operation=searchRetrieve&collapsing=false&version=1.2&query=(dc.type%20all%20%22image%22)%20and%20(provenance%20adj%20%22bnf.fr%22)
Format du jeu de données
Les métadonnées sont fournies au format CSV (UTF8). Elles incluent les champs suivants :
identifiant;titre;date;auteur;langue;notice;source;sujets;description;format;couverture;genre;largeur;hauteur;ocr;table;légendes;#pages
Télécharger
Fiche Technique
Version1
Date de mise en ligneAoût 2021
FormatCSV
Licence TechnologiesOAI-PMH