Ce jeu de données comprend les inventaires en XML EAD extraits du Catalogue général des manuscrits (CGM).
Ce jeu de données contient les documents numériques d'une sélection des collections de presse de la BnF traitées avec une reconnaissance de la mise en page (OLR, optical layout recognition).
Gallicagram est un outil de lexicométrie conçu pour les chercheurs et portant sur les contenus de Gallica.
HBA est un jeu de données dédié à l'analyse de la structure de mise en page d'ouvrages anciens. Il constitue une vérité terrain d'images annotées au niveau pixel.
Ce jeu de données contient des pages corrigées ("vérité terrain") de documents numérisés de collections de presse traités avec une reconnaissance des articles (OLR, optical layout recognition
Ce jeu de données est dédié à l'analyse de contenus iconographiques patrimoniaux.
Les formats de catalogage évoluent régulièrement pour permettre une meilleure description des ressources conservées en bibliothèque et s’adapter aux besoins des usagers.
Ce jeu de données regroupe des catalogues de vente annotés durant le projet Datacatalogue. Ces documents sont issus des collections numérisées de la BnF et de l'INHA.
Lancé en février 2012, le projet européen Europeana Newspapers avait comme objectif de garantir une visibilité augmentée et un meilleur accès aux collections numérisées de la presse européenne.