Ce jeu de données regroupe un ensemble de romans scolaires parus sous la Troisième république et mobilisés dans le cadre du projet ModOAP (Modèles et outils d'apprentissage profond).
Ces jeu de données sont constitués de textes extraits de documents des collections de presse traitées durant les projets européens Europeana Newspapers et NewsEye et dont les d’entités nommées ont
Ce jeu de données contient les textes océrisés et corrigés de documents des collections monographiques et périodiques de Gallica.
Ce jeu de données contient le mode texte des documents de Gallica traités par l’Observatoire de la vie littéraire (Labex OBVIL
Ce jeu de données contient des métadonnées quantitatives relatives aux contenus de la collection de presse traitée durant le projet européen Europeana Newspapers.
Ce jeu de données contient les documents numériques d'une sélection des collections de presse de la BnF traitées avec une reconnaissance de la mise en page (OLR, optical layout recognition).