Ce jeu de données est dédié à l'analyse des contenus iconographiques d’ouvrages anciens.
La BnF propose pour les collections musicales des données particulièrement riches et qui offrent des possibilités d'enrichissement auprès de sources extérieures de données.
Ce jeu de données est dédié à l'analyse de contenus iconographiques patrimoniaux.
Ce jeu de données contient des pages corrigées (vérité terrain) de documents numériques de collections de presse traités avec de l'OCR (optical characters recognition).
Ce jeu de données propose des publicités illustrées parues dans des périodiques du XXe siècle (quotidiens, revues et magazines).
HBA est un jeu de données dédié à l'analyse de la structure de mise en page d'ouvrages anciens. Il constitue une vérité terrain d'images annotées au niveau pixel.
Pyllica est un outil écrit en Python permettant de récupérer des documents hébergés sur la bibliothèque numérique Gallica.
Lancé en février 2012, le projet européen Europeana Newspapers avait comme objectif de garantir une visibilité augmentée et un meilleur accès aux collections numérisées de la presse européenne.