Logo BnF

API et jeux de données

fr
  • Accueil
    • Gallica
    • data.bnf.fr
    • Dépôt légal du Web
    • Catalogue collectif de France (CCFr)
    • Catalogue général de la BnF
    • Mandragore
    • BnF Archives et Manuscrits
    • Bibliographique des éditions parisiennes du XVIe siècle
    • Reliures
    • Données statistiques
    • Voir toutes les sources
    • Expérimentations
    • Projets de recherche
  • Services
Sources
  • Gallica (43)
  • Catalogue général de la BnF (18)
  • data.bnf.fr (6)
  • Catalogue collectif de France (CCFr) (6)
  • Mandragore (5)
  • Dépôt légal du Web (3)
  • Données statistiques (2)
  • Reliures (1)
  • BnF Archives et Manuscrits (1)
  • Bibliographique des éditions parisiennes du XVIe siècle (1)
Catégories
  • Jeux de données (50)
    • Jeux de données brutes (15)
    • Jeux de données transformées (3)
  • Métadonnées descriptives (28)
  • Documents (17)
  • Manuels (14)
  • API (12)
  • Projets de recherche (9)
  • Tutoriels (6)
  • Scénarios de recherche (3)
  • Outils (3)
  • Expérimentations (3)
date de dernière mise à jour
  • 2025 (8)
  • 2024 (7)
  • 2021 (6)
  • 2023 (3)
  • 2022 (3)
  • 2020 (2)
  • 2018 (1)
Formats techniques
  • XML (20)
  • CSV (17)
  • JSON (12)
  • JPEG / JPG (10)
  • Texte (9)
  • RDF/XML (7)
  • RDF/N3 (6)
  • RDF/NT (5)
  • XLS / XLSX (4)
  • RDF/Turtle (3)
  • PDF (3)
  • METS (3)
  • ALTO (3)
  • ZIP (2)
  • TIFF (2)
  • TEI (2)
  • RTF (2)
  • XSL (1)
  • TSV (1)
  • Sibelius (1)
  • PNG (1)
  • PAGE XML (1)
  • MEI (1)
  • EPUB (1)
Formats de description
  • UNIMARC (12)
  • Intermarc (10)
  • RDF (4)
  • EAD (3)
  • Dublin Core (3)
Technologies
  • GT (18)
  • OCR (15)
  • ISO 2709 (10)
  • OLR (9)
  • IIIF (8)
  • SRU (4)
  • Sparql (4)
  • Python (4)
  • OAI-PMH (4)
  • Segmentation (3)
  • Unimarc (2)
  • RDF (2)
  • R (2)
  • NLP (2)
  • Intermarc (2)
  • Détection d'objet (2)
  • Classification (2)
  • TEI (1)
  • PHP (1)
  • OPDS (1)
  • OMR (1)
  • OMEKA (1)
  • Javascript (1)
Sujets
  • Documents (20)
  • Presse (15)
  • Textes (13)
  • Images (13)
  • Manuscrits (11)
  • Intelligence artificielle (IA) (8)
  • Musique (7)
  • Cartes (6)
  • Transition bibliographique (5)
  • Sites web (4)
  • Périodiques (4)
  • Europeana Newspapers (4)
  • Patrimoine écrit (3)
  • Livres (3)
  • XVIe siècle (2)
  • Vidéos (2)
  • Sons (2)
  • Lexicométrie (2)
  • Humanités numériques (2)
  • Hackathon (2)
  • Bibliothèques (2)
  • Archives de l'internet (2)
  • Partitions (1)
  • Monnaies (1)
  • Littérature anglaise (1)
  • Littérature (1)
  • Jeux vidéos (1)
  • Jeunesse (1)
  • Histoire du livre et de la lecture (1)
  • Elections (1)
  • Covid-19 (1)
  • Bibliographie (1)
public
  • Métiers du livre (20)
  • Chercheurs (16)
Licence
  • Licence ouverte de l’État (53)
  • Conditions d'utilisation des contenus de Gallica (35)
Nouveautés des données et de l'Unimarc de diffusion de la BnF (2023)

Les données bibliographiques proposées par la Bibliothèque nationale de France connaissent des transformations régulières.

Unimarc Intermarc ISO 2709 Transition bibliographique
Gallica : texte corrigé et OCR de documents

Ce jeu de données contient les textes océrisés et corrigés de documents des collections monographiques et périodiques de Gallica.  

Texte OCR GT Textes Documents
Documents de presse numérisés en mode « article » du projet Europeana Newspapers

Ce jeu de données contient les documents numériques des collections de presse traitées durant le projet européen Europeana Newspapers avec une reconnaissance de la mise en page (OLR, optical lay

METS ALTO OLR GT Textes Presse Europeana Newspapers
Notices bibliographiques de la Bibliographie nationale française - Produits rétrospectifs

Ces jeux de données contiennent les notices des documents édités ou diffusés en France et reçus par la BnF au titre du dépôt légal.

ISO 2709 Métiers du livre Intermarc UNIMARC
Décrire les collectivités en UNIMARC avec RDA-FR

Comment cataloguer une collectivité conformément au code RDA-FR dans le format UNIMARC ?

Décrire les événements en UNIMARC avec RDA-FR

Comment cataloguer un événement conformément au code RDA-FR dans le format UNIMARC ? L'entité "Evénément" du code RDA-FR n'est pas définie dans IFLA-LRM, ni dans RDA.

Explorer les données des collections musicales

La BnF propose pour les collections musicales des données particulièrement riches et qui offrent des possibilités d'enrichissement auprès de sources extérieures de données.

JSON XML IIIF SRU Sparql Musique Hackathon Intermarc
Dumps DOREMUS

DOREMUS pour Doing Reusable Musical data est un projet de recherche lancé en 2014 visant à « mieux décrire la mus

RDF/Turtle Musique Hackathon
HBA : un jeu d'images annotées pour l'analyse de la structure de mise en page d'ouvrages anciens

HBA est un jeu de données dédié à l'analyse de la structure de mise en page d'ouvrages anciens. Il constitue une vérité terrain d'images annotées au niveau pixel.

Texte JPEG / JPG OLR GT Segmentation Documents
Thésaurus iconographique de Mandragore

La base iconographique Mandragore utilise un thésaurus iconographique de référence de plus de 20 000 mots-clés utilisés pour l’indexation des enluminures.

RDF/XML RDF/Turtle Manuscrits Humanités numériques Métiers du livre RDF

Pagination

  • Page précédente ‹‹
  • Page 2 (current)
  • Page suivante ››
  • © 2020 BnF
  • A propos
  • Conditions d'utilisation
  • Mentions légales
  • Politique de confidentialité
  • RSS
  • Écrire à la BnF
  • Accessibilité (non conforme)
  • DCAT
twitter facebook instagram youtube