Logo BnF

API et jeux de données

fr
  • Accueil
    • Catalogue général de la BnF
    • Gallica
    • data.bnf.fr
    • Dépôt légal du Web
    • Catalogue collectif de France (CCFr)
    • Mandragore
    • Bibliographique des éditions parisiennes du XVIe siècle
    • Reliures
    • Données statistiques
    • Voir toutes les sources
    • Expérimentations
    • Projets de recherche
    • Tutoriels & outils
  • Services
Sources
  • Gallica (3)
Replier tout
Catégories
  • Jeux de données (3)
  • Documents (1)
Replier tout
Licence
  • Conditions d'utilisation des contenus de Gallica (3)
Replier tout
Formats
  • (-) Texte (3)
  • (-) JSON (1)
  • (-) JPEG / JPG (1)
  • XML (1)
  • HTML (1)
  • CSV (1)
Voir tout (+6) Voir moins (-6) Replier tout
Technologies
  • (-) OCR (2)
  • (-) Segmentation (1)
  • OLR (2)
  • GT (1)
Replier tout
Sujets
  • (-) Documents (3)
  • Presse (7)
  • Textes (4)
  • Intelligence artificielle (IA) (4)
  • Images (4)
  • Manuscrits (1)
  • Europeana Newspapers (1)
Voir tout (+7) Voir moins (-7) Replier tout
Feuilletons littéraires dans la presse

Ce jeu de données regroupe des romans-feuilletons parus dans la presse française du XIXe siècle.

CSV JSON Texte XML OLR OCR Presse Documents
Dumps Gallica : OCR des monographies

Ce jeu de données fournit le texte océrisé des monographies en langue française de la collection numérique de Gallica.

HTML Texte OCR Documents
HBA : un jeu d'images annotées pour l'analyse de la structure de mise en page d'ouvrages anciens

HBA est un jeu de données dédié à l'analyse de la structure de mise en page d'ouvrages anciens. Il constitue une vérité terrain d'images annotées au niveau pixel.

Texte JPEG / JPG OLR GT Segmentation Documents
  • © 2020 BnF
  • A propos
  • Conditions d'utilisation
  • Mentions légales
  • Politique de confidentialité
  • RSS
  • Écrire à la BnF
  • Accessibilité (non conforme)
  • DCAT
twitter facebook instagram youtube