Ce jeu de données contient des pages corrigées (vérité terrain) de documents numériques des collections de presse traités avec de l'OCR (optical characters recognition).
HBA est un jeu de données dédié à l'analyse de la structure de mise en page d'ouvrages anciens. Il constitue une vérité terrain d'images annotées au niveau pixel.