Logo BnF

API et jeux de données

fr
  • Accueil
    • Gallica
    • data.bnf.fr
    • Dépôt légal du Web
    • Catalogue collectif de France (CCFr)
    • Catalogue général de la BnF
    • Mandragore
    • BnF Archives et Manuscrits
    • Reliures
    • Données statistiques
    • Voir toutes les sources
    • Bibliographie des éditions parisiennes du XVIe siècle
    • Expérimentations
    • Projets de recherche
  • Services
Sources
  • Gallica (17)
  • Catalogue général de la BnF (5)
  • Mandragore (4)
Catégories
  • Jeux de données (21)
    • Jeux de données transformées (12)
    • Jeux de données brutes (9)
  • Documents (15)
  • Métadonnées descriptives (6)
  • Scénarios de recherche (2)
  • Outils (1)
  • Manuels (1)
  • Expérimentations (1)
  • API (1)
date de dernière mise à jour
  • (-) 2024 (21)
  • (-) 2022 (3)
  • 2023 (10)
  • 2025 (9)
  • 2021 (7)
  • 2020 (4)
  • 2018 (1)
Formats techniques
  • XML (5)
  • JSON (5)
  • JPEG / JPG (5)
  • CSV (4)
  • Texte (3)
  • METS (2)
  • ALTO (2)
  • TEI (1)
  • Sibelius (1)
  • RDF/XML (1)
  • RDF/Turtle (1)
  • PDF (1)
  • PAGE XML (1)
  • MEI (1)
Formats de description
  • UNIMARC (5)
  • Intermarc (5)
  • RDF (1)
  • Dublin Core (1)
Technologies
  • GT (11)
  • OCR (9)
  • ISO 2709 (4)
  • OLR (3)
  • Segmentation (2)
  • Python (2)
  • IIIF (2)
  • Détection d'objet (2)
  • Classification (2)
  • TEI (1)
  • SRU (1)
  • R (1)
  • OMR (1)
  • NLP (1)
Sujets
  • Documents (15)
  • Textes (10)
  • Presse (8)
  • Intelligence artificielle (IA) (6)
  • Images (6)
  • Manuscrits (3)
  • Europeana Newspapers (3)
  • Lexicométrie (2)
  • Transition bibliographique (1)
  • Musique (1)
  • Humanités numériques (1)
public
  • Métiers du livre (6)
  • Chercheurs (4)
Licence
  • Conditions d'utilisation des contenus de Gallica (18)
  • Licence ouverte de l’État (6)
Échantillon segmenté d'enluminures de Mandragore

Dans le cadre d'expérimentations liées à la reconnaissance automatique d'images à partir d'enluminures de Mandragore, un petit corpus de 8 manuscrits a été segmenté manuellement afin de faire office d'échantillon d'apprentissage.

JSON CSV IIIF GT Détection d'objet Segmentation Manuscrits Images Intelligence artificielle (IA) Chercheurs
Gallica : documents produits au format TEI

Ce jeu de données contient le mode texte des documents de Gallica traités par l’Observatoire de la vie littéraire (Labex OBVIL

TEI JSON OCR Textes Documents
Notices bibliographiques de la Bibliographie nationale française - Produits rétrospectifs

Ces jeux de données contiennent les notices des documents édités ou diffusés en France et reçus par la BnF au titre du dépôt légal.

ISO 2709 Métiers du livre Intermarc UNIMARC
Notices bibliographiques des catalogues rétroconvertis (imprimés et audiovisuel)

Ces jeux de données sont constitués de notices issues de deux catalogues (imprimés et audiovisuel) qui existaient sur différents supports avant d'être intégrées dans BnF Catalogue général.

ISO 2709 Métiers du livre Intermarc UNIMARC

Pagination

  • Page précédente ‹‹
  • Page 3 (current)
  • © 2020 BnF
  • A propos
  • Conditions d'utilisation
  • Mentions légales
  • Politique de confidentialité
  • RSS
  • Écrire à la BnF
  • Accessibilité (non conforme)
  • DCAT
twitter facebook instagram youtube