Dumps Gallica : métadonnées de la collection
Présentation
Ce jeu de données référence tous les documents de la collection numérique de Gallica à travers leurs métadonnées bibliographiques élémentaires.
Contenu du jeu de données
Ce jeu contient les identifiants et les métadonnées bibliographiques élémentaires (auteur, date de publication, etc.) des documents numérisés des différentes collections de Gallica.
Collection | Documents | Date (dump) |
Images | 412786 | août 2021 |
Partitions | 57411 | janvier 2022 |
Cartes | 70161 | janvier 2022 |
Monographies | 550474 | janvier 2022 |
Manuscrits | 125420 | mars 2022 |
Objets | ||
Vidéo | ||
Périodiques |
Les documents concernés ont pour source :
- la collection de la BnF,
- les collections des partenaires intégrés à Gallica (hors partenaires moissonnés).
Contexte de production
Le jeu a été exporté de l'entrepôt OAI-PMH de Gallica à l'aide de requêtes portant sur les différents sets documentaires de Gallica. Par exemple, pour la collection Image : gallica:typedoc:images
http://oai.bnf.fr/oai2//OAIHandler?verb=ListRecords&set=gallica:typedoc:images&metadataPrefix=oai_dc
La requête Gallica correspondante est :
https://gallica.bnf.fr/services/engine/search/sru?operation=searchRetrieve&collapsing=false&version=1.2&query=(dc.type%20all%20%22image%22)%20and%20(provenance%20adj%20%22bnf.fr%22)
Format du jeu de données
Les métadonnées sont fournies au format CSV (UTF8). Elles incluent les champs suivants :
identifiant;titre;date;auteur;langue;notice;source;sujets;description;format;couverture;genre;largeur;hauteur;ocr;table;légendes;#pages
Télécharger
Fiche Technique
Version1
Date de mise en ligneAoût 2021
FormatCSV
Licence SujetsImages