Utiliser les API de Gallica : l'exemple du rapport de recherche
Gallica, la bibliothèque numérique de la BnF, propose plusieurs millions de documents en libre accès. C'est sans conteste l'une des plus grandes bibliothèques numériques nationales dans le monde. La diversité de la typologie documentaire, ainsi que le fonds proposé et mis à disposition par les chargés de collections, lui donne un attrait supplémentaire. Ainsi cette bibliothèque attire aussi bien le grand public qu'un public de chercheurs.
Pour ce dernier, utiliser Gallica implique souvent de dépouiller manuellement, à partir de la liste de résultats, les éléments pour chaque document afin de sélectionner ceux étant potentiellement intéressants dans le contexte d'une recherche. Cela génère d'incessant allers-retours entre les documents, leurs métadonnées et contenus textuels et la liste de résultats.
Services rendus par le Rapport de recherche
Le Rapport de recherche effectue cette tâche de dépouillement, pour mettre ensuite à disposition de l'utilisateur la liste des documents de sa recherche, avec pour chacun un ensemble d'extractions corrélées à la requête. On peut accéder à cette application directement, mais surtout depuis Gallica au niveau de la liste de résultats dans l'onglet "Exporter" du panneau d'affinage de gauche. Elle fournit un dépouillement au niveau de la liste de résultats, mais aussi pour chaque résultat, un dépouillement par document.

L'application propose également une fonctionnalité d'export exhaustive qui génère en tâche de fond un rapport complet, envoyé à l'adresse électronique indiquée par l'utilisateur.
Pour en savoir plus sur le rapport de recherche, consulter le blog Gallica.
API Gallica
Cette application utilise les services de recherche de l'API Gallica de recherche afin de parcourir la liste de résultats.
Pour chaque document, elle utilise l'ensemble des services de l'API Document de Gallica, pour fouiller dans les métadonnées, les contenus textuels (reconnaissance optique de caractères, OCR) et les tables des matières.
On génère également des imagettes extraites des contenus du document numérisé, avec un surlignage dans le contenu textuel (OCR), afin de mettre en avant et en contexte les résultats, grâce à l'API IIIF de récupération des images de Gallica.
Accès