Ce jeu de données regroupe un ensemble de romans scolaires parus sous la Troisième république et mobilisés dans le cadre du projet ModOAP (Modèles et outils d'apprentissage profond).
Cette API permet de rechercher dans le fonds numérique et de fournir également un ensemble d'éléments d'affinage des requêtes.
Ce jeu de données contient des métadonnées quantitatives relatives aux contenus de la collection de presse traitée durant le projet européen Europeana Newspapers.
Ce jeu de données contient les textes océrisés et corrigés de documents des collections monographiques et périodiques de Gallica.
Ce jeu de données contient des pages corrigées (vérité terrain) de documents numériques de collections de presse traités avec de l'OCR (optical characters recognition).