Logo BnF

API et jeux de données

fr
  • Accueil
    • Gallica
    • Catalogue général de la BnF
    • data.bnf.fr
    • Dépôt légal du Web
    • Répertoire du Catalogue collectif de France (CCFr)
    • Mandragore
    • Catalogue général des manuscrits (CGM / CCFr)
    • Base Patrimoine (CCFr)
    • Répertoire des manuscrits littéraires français du XXème siècle (Palme)
    • Bibliographique des éditions parisiennes du XVIe siècle
    • Reliures
    • Données statistiques
    • Voir toutes les sources
    • Expérimentations
    • Projets de recherche
    • Tutoriels & outils
  • Services
Sources
  • (-) Gallica (22)
  • Catalogue général de la BnF (14)
  • data.bnf.fr (4)
  • Mandragore (3)
  • Dépôt légal du Web (3)
  • Répertoire du Catalogue collectif de France (CCFr) (2)
  • Base Patrimoine (CCFr) (2)
  • Répertoire des manuscrits littéraires français du XXème siècle (Palme) (1)
  • Reliures (1)
  • Données statistiques (1)
  • Catalogue général des manuscrits (CGM / CCFr) (1)
  • Bibliographique des éditions parisiennes du XVIe siècle (1)
Voir tout (+12) Voir moins (-12) Replier tout
Catégories
  • Documents (12)
  • Jeux de données (11)
  • API (7)
  • Métadonnées descriptives (4)
  • Tutoriels & outils (2)
  • Expérimentations (2)
Voir tout (+6) Voir moins (-6) Replier tout
Licence
  • Conditions d'utilisation des contenus de Gallica (16)
  • Licence ouverte de l’état (6)
Replier tout
Formats
  • XML (6)
  • JSON (5)
  • Texte (4)
  • JPEG / JPG (4)
  • METS (3)
  • CSV (3)
  • ALTO (3)
  • PDF (2)
  • TIFF (1)
  • TEI (1)
  • EPUB (1)
Voir tout (+11) Voir moins (-11) Replier tout
Technologies
  • Reconnaissance automatique des caractères (OCR) (6)
  • IIIF (4)
  • Reconnaissance automatique de la mise en page (OLR) (3)
  • SRU (2)
  • Python (2)
  • Sparql (1)
  • OPDS (1)
  • OAI-PMH (1)
  • Intermarc (1)
Voir tout (+9) Voir moins (-9) Replier tout
Sujets
  • Textes (9)
  • Presse (5)
  • Europeana Newspapers (4)
  • Musique (1)
  • Intelligence artificielle (IA) (1)
  • Images (1)
  • Hackathon (1)
  • Documents (1)
Voir tout (+8) Voir moins (-8) Replier tout
Entrepôt OAI-PMH de Gallica et des expositions virtuelles (OAI-NUM)

OAI-PMH  (Open Archives Initiative - Protocol for Metadata Harvesting), est un « protocole de collecte de métadonnées de l'Initiative pour les Archives ouvertes ».

XML OAI-PMH
API Gallica de recherche

Cette API permet de rechercher dans le fonds numérique et de fournir également un ensemble d'éléments d'affinage des requêtes.

XML SRU
API Document de Gallica

À partir d'un document trouvé via l’API de recherche ou de l'interface Gallica, l’API Document (non standardisée) permet de récupérer un certain nombre d'informations (métadonnées) afin d'exploiter

XML
Texte des documents de presse du projet Europeana Newspapers (XIXe-XXe siècles)

Ce jeu de données contient le texte des collections de presse traitées durant le projet européen Europeana Newpapers.

JSON Reconnaissance automatique des caractères (OCR) Textes Presse Europeana Newspapers
Métadonnées quantitatives de la presse ancienne (XIXe-XXe siècles)

Ce jeu de données contient des métadonnées quantitatives relatives aux contenus de la collection de presse traitée durant le projet européen Europeana Newspapers.  

XML JSON CSV Reconnaissance automatique des caractères (OCR) Presse
Texte corrigé et OCR de documents de Gallica

Ce jeu de données contient les textes océrisés et corrigés de documents des collections monographiques et périodiques de Gallica.  

Texte Reconnaissance automatique des caractères (OCR) Textes
Documents de presse numérisés en mode « article » du projet Europeana Newspapers

Ce jeu de données contient les documents numériques des collections de presse traitées durant le projet européen Europeana Newspapers avec une reconnaissance de la mise en page (OLR, optical lay

METS ALTO Reconnaissance automatique de la mise en page (OLR) Textes Presse Europeana Newspapers
Texte de presse annoté en entités nommées du projet Europeana Newspapers

Ce jeu de données est constitué de textes extraits de documents des collections de presse traitées durant le projet européen Europeana Newspapers et annotés en terme d’entités nommées de type Perso

Texte Textes Presse Europeana Newspapers
OCR corrigé de documents de presse de Gallica

Ce jeu de données contient des pages corrigées (vérité terrain) de documents numériques des collections de presse traités avec de l'OCR (optical characters recognition).   

XML Reconnaissance automatique des caractères (OCR) Textes
Documents de presse numérisés en mode « OCR » du projet Europeana Newspapers

Ce jeu de données contient les documents numériques des collections de presse traitées durant le projet européen Europeana Newspapers avec une reconnaissance du texte (OCR, optical character rec

METS ALTO Reconnaissance automatique des caractères (OCR) Textes Presse Europeana Newspapers

Pagination

  • Page précédente ‹‹
  • Page 2 (current)
  • Page suivante ››
  • © 2020 BnF
  • A propos
  • Conditions d'utilisation
  • Mentions légales
  • Politique de confidentialité
  • RSS
  • Écrire à la BnF
  • Accessibilité
  • DCAT
twitter facebook instagram youtube