Logo BnF

API et jeux de données

fr
  • Accueil
    • Catalogue général de la BnF
    • Gallica
    • data.bnf.fr
    • Dépôt légal du Web
    • Catalogue collectif de France (CCFr)
    • Mandragore
    • Bibliographique des éditions parisiennes du XVIe siècle
    • Reliures
    • Données statistiques
    • Voir toutes les sources
    • Expérimentations
    • Projets de recherche
    • Tutoriels & outils
  • Services
Sources
  • Gallica (12)
  • Catalogue collectif de France (CCFr) (4)
  • Mandragore (2)
Replier tout
Catégories
  • (-) Jeux de données (14)
  • (-) Projets de recherche (2)
  • Métadonnées descriptives (10)
  • API (8)
  • Documents (7)
  • Tutoriels & outils (2)
Voir tout (+6) Voir moins (-6) Replier tout
Licence
  • Conditions d'utilisation des contenus de Gallica (11)
  • Licence ouverte de l’état (5)
Replier tout
Formats
  • (-) XML (12)
  • (-) JPEG / JPG (7)
  • CSV (12)
  • Texte (7)
  • JSON (7)
  • RDF/XML (4)
  • RDF/N3 (4)
  • XLS / XLSX (3)
  • RDF/NT (3)
  • METS (3)
  • ALTO (3)
  • ZIP (2)
  • RTF (2)
  • RDF/Turtle (2)
  • XSL (1)
  • TIFF (1)
  • TEI (1)
  • Sibelius (1)
  • PNG (1)
  • PDF (1)
  • MEI (1)
  • HTML (1)
Voir tout (+22) Voir moins (-22) Replier tout
Technologies
  • GT (8)
  • OCR (6)
  • OLR (5)
  • Segmentation (2)
  • Python (2)
  • EAD (2)
  • Classification (2)
  • TEI (1)
  • IIIF (1)
  • Détection d'objet (1)
Voir tout (+10) Voir moins (-10) Replier tout
Sujets
  • Images (6)
  • Presse (5)
  • Intelligence artificielle (IA) (5)
  • Manuscrits (3)
  • Documents (3)
  • Textes (2)
  • Bibliothèques (2)
  • Patrimoine écrit (1)
  • Littérature (1)
Voir tout (+9) Voir moins (-9) Replier tout
Fiches descriptives de fonds (Répertoire du CCFr)

Ce jeu de données comprend les fiches descriptives de fonds du Répertoire du Catalogue Collectif de France (CCFr).

XML Patrimoine écrit Bibliothèques
Mandragore : jeu d'images annotées pour la détection d'objet

Ce jeu de données est dédié à l'analyse de contenus iconographiques patrimoniaux.

JPEG / JPG CSV GT Python Détection d'objet Intelligence artificielle (IA) Manuscrits Images
OCR corrigé de documents de presse de Gallica

Ce jeu de données contient des pages corrigées (vérité terrain) de documents numériques des collections de presse traités avec de l'OCR (optical characters recognition).   

XML OCR GT Textes
Inventaires du Répertoire des manuscrits littéraires français du XXème siècle (Palme) (CCFr)

Ce jeu de données comprend l'ensemble des enregistrements de la base Palme du CCFr.

XML EAD Manuscrits Littérature
Métadonnées quantitatives de la presse ancienne (XIXe-XXe siècles)

Ce jeu de données contient des métadonnées quantitatives relatives aux contenus de la collection de presse traitée durant le projet européen Europeana Newspapers.  

XML JSON CSV OCR OLR Presse
Inventaires du Catalogue général des manuscrits (CGM)

Ce jeu de données comprend les inventaires en XML EAD extraits du Catalogue général des manuscrits (CGM).

XML CSV EAD Manuscrits

Pagination

  • Page précédente ‹‹
  • Page 2 (current)
  • © 2020 BnF
  • A propos
  • Conditions d'utilisation
  • Mentions légales
  • Politique de confidentialité
  • RSS
  • Écrire à la BnF
  • Accessibilité (non conforme)
  • DCAT
twitter facebook instagram youtube