Ce jeu de données regroupe des catalogues de vente annotés durant le projet Datacatalogue. Ces documents sont issus des collections numérisées de la BnF et de l'INHA.
Ce jeu de données contient des pages corrigées ("vérité terrain") de documents numérisés de collections de presse traités avec une reconnaissance des articles (OLR, optical layout recognition
data.bnf.fr rassemble les données issues des différentes bases et catalogues de la BnF pour y donner un accès fédéré par auteurs, oeuvres, thèmes, lieux et dates.
Ce jeu de données contient le mode texte des documents de Gallica traités par l’Observatoire de la vie littéraire (Labex OBVIL