Projet IMPACT
Les résultats du projet européen IMPACT 2012-2015) consacré à la numérisation du patrimoine écrit sont hébergés par le Centre de compétences IMPACT, chargé de diffuser outils, données et savoir-faire.

Présentation
IMPACT est un projet financé par la Commission européenne (2012-2015). Il visait à améliorer de manière significative l'accès aux textes historiques et à supprimer les obstacles qui entravent la numérisation de masse du patrimoine culturel européen, en particulier ceux liés à l'océrisation.
Données disponibles
Le projet a agrégé des documents de divers types (monographies, périodiques) conservés dans plusieurs bibliothèques européennes.
Ces documents sont disponibles sous diverses formes :
- images,
- textes océrisés,
- textes corrigés (vérité terrain).
Ils sont accessibles sur le site du Centre de compétences IMPACT, à la rubrique Image and ground truth resources.
Une copie de ces données est également disponible sur le site du laboratoire Prima de l'université de Salford, avec un moteur de recherche dédié. L'accès est donné sur simple demande.
Le jeu de données de la BnF contient environ 150 documents, 90 000 pages dont 8 000 dotées d'une vérité terrain au format PAGE XML (cf. état dans le tableau en téléchargement). Cette vérité terrain est également disponible sur demande exprimée à la BnF.
Télécharger
Fiche Technique
formatXML JPEG / JPG TIFF
LicenceConditions d'utilisation des contenus de Gallica
TechnologiesOCR GT
SujetsTextes Images Presse