HBA est un jeu de données dédié à l'analyse de la structure de mise en page d'ouvrages anciens. Il constitue une vérité terrain d'images annotées au niveau pixel.
Ce jeu de données reprend le contenu du Répertoire du Catalogue collectif de France pour sa partie "Bibliothèques".
Ce jeu de données est dédié à l'analyse de contenus iconographiques patrimoniaux.
Ce jeu de données contient le texte des collections de presse traitées durant le projet européen Europeana Newpapers.
À partir d'un document trouvé via l’API de recherche ou de l'interface Gallica, l’API Document permet de récupérer les d'informations (métadonnées) nécessaires à l'exploitation des ressources numér
OAI-PMH (Open Archives Initiative - Protocol for Metadata Harvesting), est un « protocole de collecte de métadonnées de l'Initiative pour les Archives ouvertes ».
Cette API permet de rechercher dans le fonds numérique et de fournir également un ensemble d'éléments d'affinage des requêtes.
Ce jeu de données comprend les fiches descriptives de fonds du Répertoire du Catalogue Collectif de France (CCFr).
Ce jeu de données contient des pages corrigées (vérité terrain) de documents numériques de collections de presse traités avec de l'OCR (optical characters recognition).
Ces jeu de données sont constitués de textes extraits de documents des collections de presse traitées durant les projets européens Europeana Newspapers et NewsEye et dont les d’entités nommées ont