Logo BnF

API et jeux de données

fr
  • Accueil
    • Gallica
    • data.bnf.fr
    • Dépôt légal du Web
    • Catalogue collectif de France (CCFr)
    • Catalogue général de la BnF
    • Mandragore
    • BnF Archives et Manuscrits
    • Bibliographique des éditions parisiennes du XVIe siècle
    • Reliures
    • Données statistiques
    • Voir toutes les sources
    • Expérimentations
    • Projets de recherche
    • Tutoriels & outils
  • Services
Sources
  • Gallica (31)
  • Catalogue général de la BnF (12)
  • Catalogue collectif de France (CCFr) (6)
  • Mandragore (4)
  • data.bnf.fr (4)
  • Dépôt légal du Web (3)
  • Reliures (1)
  • Données statistiques (1)
  • BnF Archives et Manuscrits (1)
  • Bibliographique des éditions parisiennes du XVIe siècle (1)
Voir tout (+10) Voir moins (-10) Replier tout
Catégories
  • (-) Jeux de données (50)
  • (-) API (12)
  • Métadonnées descriptives (28)
  • Documents (17)
  • Tutoriels & outils (12)
  • Projets de recherche (9)
  • Expérimentations (3)
Voir tout (+7) Voir moins (-7) Replier tout
Licence
  • Licence ouverte de l’État (35)
  • Conditions d'utilisation des contenus de Gallica (27)
Replier tout
Formats
  • XML (17)
  • CSV (14)
  • JSON (10)
  • JPEG / JPG (9)
  • Texte (7)
  • RDF/XML (7)
  • RDF/N3 (6)
  • RDF/NT (5)
  • XLS / XLSX (4)
  • RDF/Turtle (3)
  • METS (3)
  • ALTO (3)
  • ZIP (2)
  • TEI (2)
  • RTF (2)
  • PDF (2)
  • XSL (1)
  • TSV (1)
  • TIFF (1)
  • Sibelius (1)
  • PAGE XML (1)
  • MEI (1)
  • EPUB (1)
Voir tout (+23) Voir moins (-23) Replier tout
Technologies
  • GT (13)
  • OCR (12)
  • Unimarc (11)
  • ISO 2709 (10)
  • Intermarc (9)
  • OLR (7)
  • RDF (6)
  • Python (4)
  • OAI-PMH (4)
  • SRU (3)
  • IIIF (3)
  • EAD (3)
  • Sparql (2)
  • Segmentation (2)
  • Dublin Core (2)
  • Classification (2)
  • TEI (1)
  • R (1)
  • PHP (1)
  • OPDS (1)
  • OMR (1)
  • OMEKA (1)
  • NLP (1)
  • Javascript (1)
  • Détection d'objet (1)
Voir tout (+25) Voir moins (-25) Replier tout
Sujets
  • Documents (19)
  • Textes (11)
  • Presse (11)
  • Manuscrits (10)
  • Images (9)
  • Musique (6)
  • Intelligence artificielle (IA) (5)
  • Cartes (5)
  • Transition bibliographique (4)
  • Sites web (4)
  • Périodiques (4)
  • Europeana Newspapers (4)
  • Patrimoine écrit (3)
  • Livres (3)
  • XVIe siècle (2)
  • Vidéos (2)
  • Sons (2)
  • Humanités numériques (2)
  • Bibliothèques (2)
  • Archives de l'internet (2)
  • Partitions (1)
  • Monnaies (1)
  • Littérature anglaise (1)
  • Littérature (1)
  • Lexicométrie (1)
  • Jeux vidéos (1)
  • Jeunesse (1)
  • Histoire du livre et de la lecture (1)
  • Hackathon (1)
  • Elections (1)
  • Covid-19 (1)
  • Bibliographie (1)
Voir tout (+32) Voir moins (-32) Replier tout
HBA : un jeu d'images annotées pour l'analyse de la structure de mise en page d'ouvrages anciens

HBA est un jeu de données dédié à l'analyse de la structure de mise en page d'ouvrages anciens. Il constitue une vérité terrain d'images annotées au niveau pixel.

Texte JPEG / JPG OLR GT Segmentation Documents
Thésaurus iconographique de Mandragore

La base iconographique Mandragore utilise un thésauru

RDF/XML RDF/Turtle RDF Manuscrits Humanités numériques
Dumps DOREMUS

DOREMUS pour Doing Reusable Musical data est un projet de recherche lancé en 2014 visant à « mieux décrire la mus

RDF/Turtle Musique Hackathon
Gallica : OLR corrigé de documents de presse

Ce jeu de données contient des pages corrigées ("vérité terrain") de documents numérisés de collections de presse traités avec une reconnaissance des articles (OLR, optical layout recognition

PAGE XML OLR OCR GT Presse Textes Documents
Fiches descriptives de bibliothèques (Répertoire du CCFr)

Ce jeu de données reprend le contenu du Répertoire du Catalogue collectif de France pour sa partie "Bibliothèques".

XML Bibliothèques
Gallica : métadonnées de la collection numérique

Ce jeu de données référence tous les documents de la collection numérique de Gallica à travers leurs métadonnées bibliographiques élémentaires.

CSV OAI-PMH
Métadonnées des collections médiévales numérisées du projet Europeana ARMA

Dans le cadre du projet ARMA : The Art of Reading

CSV XLS / XLSX OAI-PMH Dublin Core Histoire du livre et de la lecture Manuscrits Livres Cartes Monnaies
Catalogues de vente annotés du projet Datacatalogue

Ce jeu de données regroupe des catalogues de vente annotés durant le projet Datacatalogue. Ces documents sont issus des collections numérisées de la BnF et de l'INHA.

JSON TEI JPEG / JPG GT Documents
Gallica : texte océrisé des monographies de langue française

Ce jeu de données fournit le texte océrisé des monographies en langue française de la collection numérique de Gallica.

CSV Texte OCR Documents Textes Lexicométrie
Entrepôt OAI-PMH de Gallica et des expositions virtuelles (OAI-NUM)

OAI-PMH  (Open Archives Initiative - Protocol for Metadata Harvesting), est un « protocole de collecte de métadonnées de l'Initiative pour les Archives ouvertes ».

XML OAI-PMH

Pagination

  • Page précédente ‹‹
  • Page 2 (current)
  • Page suivante ››
  • © 2020 BnF
  • A propos
  • Conditions d'utilisation
  • Mentions légales
  • Politique de confidentialité
  • RSS
  • Écrire à la BnF
  • Accessibilité (non conforme)
  • DCAT
twitter facebook instagram youtube