Ce jeu de données contient les textes océrisés et corrigés de documents des collections monographiques et périodiques de Gallica.
Ce jeu de données contient des partitions numériques d’Eustache du Caurroy et de Carlo Gesualdo produites aux formats MEI et Sibelius.
Lancé en février 2012, le projet européen Europeana Newspapers avait comme objectif de garantir une visibilité augmentée et un meilleur accès aux collections numérisées de la presse européenne.
Pyllica est un outil écrit en Python permettant de récupérer des documents hébergés sur la bibliothèque numérique Gallica.
Ce jeu de données contient les documents numériques des collections de presse traitées durant le projet européen Europeana Newspapers avec une reconnaissance de la mise en page (OLR, optical lay
Ce jeu de données fournit le texte océrisé des monographies en langue française de la collection numérique de Gallica.
Ce jeu de données regroupe des romans-feuilletons parus dans la presse française du XIXe siècle.
NewsEye, financé par le programme de recherche et d'innovation Horizon 2020 de l'Union européenne, est un projet de recherche qui fait progresser l'état de l'art et introduit de nouveaux concepts, méthodes et outils pour les humanités numériques en fournissant un accès amélioré aux journaux historiques.
Ce jeu de données contient les documents numériques d'une sélection des collections de presse de la BnF traitées avec une reconnaissance de la mise en page (OLR, optical layout recognition).
HBA est un jeu de données dédié à l'analyse de la structure de mise en page d'ouvrages anciens. Il constitue une vérité terrain d'images annotées au niveau pixel.