Logo BnF

API et jeux de données

fr
  • Accueil
    • Catalogue général de la BnF
    • Gallica
    • data.bnf.fr
    • Dépôt légal du Web
    • Catalogue collectif de France (CCFr)
    • Mandragore
    • Bibliographique des éditions parisiennes du XVIe siècle
    • Reliures
    • Données statistiques
    • Voir toutes les sources
    • Expérimentations
    • Projets de recherche
    • Tutoriels & outils
  • Services
Sources
  • Gallica (6)
  • Catalogue collectif de France (CCFr) (4)
Replier tout
Catégories
  • (-) Jeux de données (10)
  • Métadonnées descriptives (10)
  • API (6)
  • Documents (3)
  • Projets de recherche (2)
  • Tutoriels & outils (1)
Voir tout (+6) Voir moins (-6) Replier tout
Licence
  • Licence ouverte de l’état (5)
  • Conditions d'utilisation des contenus de Gallica (5)
Replier tout
Formats
  • (-) XML (10)
  • CSV (11)
  • JSON (6)
  • JPEG / JPG (6)
  • Texte (5)
  • RDF/N3 (4)
  • XLS / XLSX (3)
  • RDF/XML (3)
  • RDF/NT (3)
  • METS (3)
  • ALTO (3)
  • ZIP (2)
  • RTF (2)
  • RDF/Turtle (2)
  • TEI (1)
  • Sibelius (1)
  • PDF (1)
  • MEI (1)
  • HTML (1)
Voir tout (+19) Voir moins (-19) Replier tout
Technologies
  • OCR (4)
  • OLR (3)
  • GT (2)
  • EAD (2)
  • TEI (1)
  • Segmentation (1)
  • Python (1)
  • IIIF (1)
Voir tout (+8) Voir moins (-8) Replier tout
Sujets
  • Presse (3)
  • Manuscrits (2)
  • Intelligence artificielle (IA) (2)
  • Images (2)
  • Documents (2)
  • Bibliothèques (2)
  • Textes (1)
  • Patrimoine écrit (1)
  • Littérature (1)
Voir tout (+9) Voir moins (-9) Replier tout
Fiches descriptives de bibliothèques (Répertoire du CCFr)

Ce jeu de données reprend le contenu du Répertoire du Catalogue collectif de France pour sa partie "Bibliothèques".

XML Bibliothèques
Gallica : jeu d'images annotées pour la segmentation

Ce jeu de données est dédié à l'analyse de contenus iconographiques patrimoniaux.

JPEG / JPG JSON XML Python GT Segmentation Images Intelligence artificielle (IA)
Inventaires du Répertoire des manuscrits littéraires français du XXème siècle (Palme) (CCFr)

Ce jeu de données comprend l'ensemble des enregistrements de la base Palme du CCFr.

XML EAD Manuscrits Littérature
Feuilletons littéraires dans la presse

Ce jeu de données regroupe des romans-feuilletons parus dans la presse française du XIXe siècle.

CSV JSON Texte XML OLR OCR Presse Documents
Gallica : tables et index

Ce jeu de données liste les imprimés de la collection numérique de Gallica proposant des tables et index transcrits.

XML TEI Documents
Métadonnées quantitatives de la presse ancienne (XIXe-XXe siècles)

Ce jeu de données contient des métadonnées quantitatives relatives aux contenus de la collection de presse traitée durant le projet européen Europeana Newspapers.  

XML JSON CSV OCR OLR Presse
Fiches descriptives de fonds (Répertoire du CCFr)

Ce jeu de données comprend les fiches descriptives de fonds du Répertoire du Catalogue Collectif de France (CCFr).

XML Patrimoine écrit Bibliothèques
Inventaires du Catalogue général des manuscrits (CGM)

Ce jeu de données comprend les inventaires en XML EAD extraits du Catalogue général des manuscrits (CGM).

XML CSV EAD Manuscrits
OCR corrigé de documents de presse de Gallica

Ce jeu de données contient des pages corrigées (vérité terrain) de documents numériques des collections de presse traités avec de l'OCR (optical characters recognition).   

XML OCR GT Textes
Gallica : jeu de publicités illustrées

Ce jeu de données propose des publicités illustrées parues dans des périodiques du XXe siècle (quotidiens, revues et magazines).

JSON XML JPEG / JPG IIIF OCR OLR Images Presse Intelligence artificielle (IA)
  • © 2020 BnF
  • A propos
  • Conditions d'utilisation
  • Mentions légales
  • Politique de confidentialité
  • RSS
  • Écrire à la BnF
  • Accessibilité (non conforme)
  • DCAT
twitter facebook instagram youtube