Logo BnF

API et jeux de données

fr
  • Accueil
    • Gallica
    • data.bnf.fr
    • Dépôt légal du Web
    • Catalogue collectif de France (CCFr)
    • Catalogue général de la BnF
    • Mandragore
    • BnF Archives et Manuscrits
    • Bibliographique des éditions parisiennes du XVIe siècle
    • Reliures
    • Données statistiques
    • Voir toutes les sources
    • Expérimentations
    • Projets de recherche
  • Services
Sources
  • Gallica (10)
  • Mandragore (1)
  • data.bnf.fr (1)
  • Catalogue collectif de France (CCFr) (1)
Catégories
  • Jeux de données (11)
    • Jeux de données transformées (2)
    • Jeux de données brutes (1)
  • Documents (5)
  • Scénarios de recherche (2)
  • Métadonnées descriptives (2)
  • Projets de recherche (1)
  • API (1)
date de dernière mise à jour
  • 2025 (1)
  • 2024 (1)
  • 2023 (1)
Formats techniques
  • (-) XML (7)
  • (-) CSV (5)
  • (-) METS (2)
  • (-) TSV (1)
  • JSON (7)
  • Texte (6)
  • JPEG / JPG (6)
  • XLS / XLSX (2)
  • TEI (2)
  • RDF/XML (2)
  • RDF/NT (2)
  • RDF/N3 (2)
  • ALTO (2)
  • Sibelius (1)
  • PNG (1)
  • PDF (1)
  • PAGE XML (1)
  • MEI (1)
Formats de description
  • RDF (1)
  • Dublin Core (1)
Technologies
  • OCR (6)
  • GT (4)
  • OLR (3)
  • TEI (1)
  • Sparql (1)
  • Segmentation (1)
  • Python (1)
  • OAI-PMH (1)
  • IIIF (1)
  • Classification (1)
Sujets
  • (-) Documents (9)
  • (-) Patrimoine écrit (2)
  • (-) Cartes (2)
  • Presse (9)
  • Manuscrits (8)
  • Images (8)
  • Textes (6)
  • Intelligence artificielle (IA) (5)
  • Sites web (3)
  • Musique (3)
  • Europeana Newspapers (2)
  • Bibliothèques (2)
  • Archives de l'internet (2)
  • Transition bibliographique (1)
  • Périodiques (1)
  • Monnaies (1)
  • Livres (1)
  • Littérature (1)
  • Lexicométrie (1)
  • Histoire du livre et de la lecture (1)
  • Hackathon (1)
  • Elections (1)
  • Covid-19 (1)
public
  • Chercheurs (3)
  • Métiers du livre (1)
Licence
  • Conditions d'utilisation des contenus de Gallica (9)
  • Licence ouverte de l’État (3)
Gallica : jeu d'images annotées pour la segmentation

Ce jeu de données est dédié à l'analyse de contenus iconographiques patrimoniaux.

JPEG / JPG JSON XML Python GT Segmentation Images Intelligence artificielle (IA) Documents
Métadonnées des collections médiévales numérisées du projet Europeana ARMA

Dans le cadre du projet ARMA : The Art of Reading

CSV XLS / XLSX OAI-PMH Histoire du livre et de la lecture Manuscrits Livres Cartes Monnaies Chercheurs Dublin Core
SPARQL endpoint de data.bnf.fr

data.bnf.fr rassemble les données issues des différentes bases et catalogues de la BnF pour y donner un accès fédéré par auteurs, oeuvres, thèmes, lieux et dates.

RDF/N3 JSON RDF/NT XML CSV TSV RDF/XML Sparql Patrimoine écrit Musique Cartes Images Manuscrits Périodiques Transition bibliographique RDF
Gallica : texte océrisé des monographies de langue française

Ce jeu de données fournit le texte océrisé des monographies en langue française de la collection numérique de Gallica.

CSV Texte OCR Documents Textes Lexicométrie
Gallica : feuilletons littéraires dans la presse

Ce jeu de données regroupe des romans-feuilletons parus dans la presse française du XIXe siècle.

CSV JSON Texte XML OLR OCR Presse Documents
Gallica : tables et index

Ce jeu de données liste les imprimés de la collection numérique de Gallica proposant des tables et index transcrits.

XML TEI Documents
Mandragore : jeu d'images annotées sur le thème de la zoologie

Ce jeu de données est dédié à l'analyse des contenus iconographiques d’ouvrages anciens.

JPEG / JPG CSV GT Classification Intelligence artificielle (IA) Images Documents Chercheurs
Fiches descriptives de fonds (Répertoire du CCFr)

Ce jeu de données comprend les fiches descriptives de fonds du Répertoire du Catalogue Collectif de France (CCFr).

XML Patrimoine écrit Bibliothèques Métiers du livre Chercheurs
Documents de presse numérisés en mode « article »

Ce jeu de données contient les documents numériques d'une sélection des collections de presse de la BnF traitées avec une reconnaissance de la mise en page (OLR, optical layout recognition).

METS ALTO OLR GT OCR Textes Presse Documents
Gallica : OCR corrigé de documents de presse

Ce jeu de données contient des pages corrigées (vérité terrain) de documents numériques de collections de presse traités avec de l'OCR (optical characters recognition).   

XML OCR GT Textes Presse Documents

Pagination

  • Page 1 (current)
  • Page suivante ››
  • © 2020 BnF
  • A propos
  • Conditions d'utilisation
  • Mentions légales
  • Politique de confidentialité
  • RSS
  • Écrire à la BnF
  • Accessibilité (non conforme)
  • DCAT
twitter facebook instagram youtube