Ce jeu de données est dédié à l'analyse des contenus iconographiques d’ouvrages anciens.
Ce jeu de données regroupe des romans-feuilletons parus dans la presse française du XIXe siècle.
Ce jeu de données fournit le texte océrisé des monographies en langue française de la collection numérique de Gallica.
Ce jeu de données contient des pages corrigées ("vérité terrain") de documents numérisés de collections de presse traités avec une reconnaissance des articles (OLR, optical layout recognition