Dans le cadre du projet ARMA : The Art of Reading
Dans le cadre de la Semaine de l’innovation publique, la BnF a organisé son 3e Hackathon les 24 et 25 novembre 2018.
Ce jeu de données regroupe des catalogues de vente annotés durant le projet Datacatalogue. Ces documents sont issus des collections numérisées de la BnF et de l'INHA.
Ce jeu de données fournit le texte océrisé des monographies en langue française de la collection numérique de Gallica.
Ce jeu de données regroupe des romans-feuilletons parus dans la presse française du XIXe siècle.
Ce jeu de données liste les imprimés de la collection numérique de Gallica proposant des tables et index transcrits.
Ce jeu de données est dédié à l'analyse des contenus iconographiques d’ouvrages anciens.
Ce jeu de données est dédié à l'analyse de contenus iconographiques patrimoniaux.
Ce jeu de données contient des pages corrigées (vérité terrain) de documents numériques de collections de presse traités avec de l'OCR (optical characters recognition).
Ces jeu de données sont constitués de textes extraits de documents des collections de presse traitées durant les projets européens Europeana Newspapers et NewsEye et dont les d’entités nommées ont