Dumps Mandragore
Présentation
Mandragore est la base d’indexation iconographique des enluminures de la BnF. Régulièrement enrichie depuis 1989, elle décrit aujourd’hui 205 000 enluminures issues de près de 7000 manuscrits conservés au département des Manuscrits et à la Bibliothèque de l’Arsenal. Chaque élément identifiable y est indexé à l’aide d’un vocabulaire multilingue de plus de 20 000 termes.
L’application web donnant accès à Mandragore depuis 2003 est aujourd’hui un peu vieillissante et fait l’objet d’un projet de refonte qui permettra de mieux mettre en valeur les riches données de la base.
Mise à jour de Mandragore : une nouvelle version de l'application de consultation de Mandragore a été mise en ligne en 2022. Elle utilise un modèle de données revu et enrichi, appuyé sur les formats XML/EAD et XML/SKOS.
Le présent jeu de données est conservé à titre d'archive mais n'est plus mis à jour, et ne correspond plus aux données effectivement utilisées par l'application. Les URL mentionnées dans le texte de présentation (à l'exception des liens ark dont la pérennité est assurée) peuvent être obsolètes.
Les dumps des données de la nouvelle version de Mandragore seront prochainement mis en ligne sur ce site. (Le thésaurus est d'ores-et-déjà téléchargeable).
Contexte de production et modèle de données
Mandragore a un objet très large : décrire et indexer l’ensemble du décor réalisé de façon non mécanique (c’est-à-dire les dessins, enluminures, peintures, etc. mais pas les estampes) des documents conservés par la BnF, quelle que soit l’époque ou l’aire culturelle. Actuellement, les données contiennent uniquement des enluminures de manuscrits, « orientaux » et « occidentaux » (selon la typologie du département des Manuscrits), datés entre le XVIe siècle avant l’ère chrétienne et le XXe siècle. La vocation à l’exhaustivité n’est pas (encore) atteinte et Mandragore s’enrichit régulièrement ; à terme, la prise en compte des enluminures peintes sur des livres imprimés est également envisagée.
Exemples de décors indexés dans Mandragore
Le modèle de données de Mandragore distingue trois principales entités : des unités codicologiques (« Manuscrits »), des cycles décoratifs (« Part ») et des unités de décor (« Image »).
Un manuscrit, au sens courant d’unité matérielle (un volume relié, un rouleau, une boîte de documents en feuilles) est caractérisé par sa cote à la BnF mais peut être composé de plusieurs unités codicologiques (fabriquées dans un même contexte). Par exemple, deux unités codicologiques distinctes, l’une constituée en France au XIe siècle, l’autre en Angleterre au XIVe siècle, ont pu être reliées ensemble au XVIIe siècle. Mandragore les considère comme deux « Manuscrits » différents.
Chacune de ces unités codicologiques peut contenir un ou plusieurs textes illustrés par un ou plusieurs artistes (identifiables ou non). Mandragore distingue des « parts » correspondant à un même cycle décoratif pour chaque texte. Par exemple, les peintures en pleine page étaient parfois confiées à un enlumineur expérimenté (ou spécialisé) alors que les initiales décorées étaient réalisées par un autre artiste. Dans ce cas, Mandragore distingue deux « parts » pour chaque texte illustré de la sorte.
Plusieurs cycles décoratifs (« parts ») sur un même feuillet
Les « Images » de Mandragore sont des unités de décor. Il peut s’agir de décor non figuratif (initiale coloriée, entrelacs, motifs géométriques…) : dans ce cas, on retient dans Mandragore un échantillon représentatif du manuscrit, mais pas forcément toutes les initiales ! Le décor figuratif (qui représente une scène), en revanche, est intégralement décrit. Chaque « Image » correspond justement à une scène, même si, comme il arrive parfois, plusieurs scènes successives sont représentées dans le même cadre, sans contour strict. Chaque enluminure fait ainsi l’objet d’un titre forgé (permettant d’identifier toutes les illustrations de la même scène) appelé « Légende ». Souvent, une reproduction numérique de l’enluminure ou du feuillet entier est associé (voir plus bas).
Plusieurs scènes successives (« images ») dans un même cadre
Enfin, l’essentiel des données de Mandragore correspond à l’identification, dans chaque enluminure, de tous les objets, lieux, personnages, etc. qui y sont représentés, de façon à pouvoir, par exemple, rechercher toutes les représentations d’un lapin, d’un aqueduc ou d’Alexandre le Grand. Le référentiel iconographique utilisé est propre à Mandragore, même s’il est proche d’autres référentiels semblables. Il est constitué de « formes retenues » de référence, chacune liée à plusieurs « formes rejetées », qui sont soit des synonymes, soit la traduction de la forme retenue en anglais, allemand, italien et espagnol. Pour faciliter l’exploration du référentiel, les « descripteurs » sont classés en grandes catégories Dewey (déroulables dans l’application Mandragore) mais ils ne sont pas hiérarchisés. On peut cependant utiliser leur « définition » pour les regrouper en grandes classes (par exemple, « crustacé » est la définition commune de « crevette », « crabe », « homard » et « langouste »).
Les descripteurs iconographiques d’une enluminure
L’application web Mandragore permet d’explorer les index, et propose d’autres astuces de recherche plus poussées (voir également une série de billets sur le carnet de recherches Manuscripta). On se reportera par ailleurs au dictionnaire des données fourni.
Un manuscrit n’est visible dans l’application Mandragore qu’une fois que toutes ses enluminures sont décrites et indexées. De la même façon, les manuscrits en cours d’indexation ont été exclus de ce jeu de données.
Contenu des extractions
Les extractions sont proposées au format tabulaire (CSV) :
- Liste des manuscrits décrits
- Liste des enluminures, y compris les caractéristiques du cycle décoratif (« part ») auquel elles se rapportent (artiste, date, texte illustré), leur titre forgé (« légende ») et quelques informations d’identification
- Indexation des enluminures : pour chaque unité de décor (« image »), l’ensemble des descripteurs associés.
- Liste des descripteurs, avec leur « définition » et, si besoin, les notes précisant leur sens
- Listes des formes rejetées des descripteurs
- Liste des classes Dewey utilisées pour la présentation thématique des descripteurs
- Classes Dewey associées à chaque descripteur. Attention, un descripteur peut être associé à plusieurs classes Dewey.
Il est fortement recommandé de lire le dictionnaire de données fourni au format RTF pour comprendre le contenu de chaque colonne.
Identifiants et API dans mandragore.bnf.fr
L’application web Mandragore, accessible à l’adresse http://mandragore.bnf.fr/, est l’une des plus anciennes encore en fonctionnement à la BnF, ce qui explique que toutes les fonctionnalités présentes dans les applications plus récentes ne soient pas complètement implémentées.
- URI et identifiants ARK
La plupart des entités du modèle de données de Mandragore sont dotés d’identifiants numériques (présents dans les extractions), mais seules les « images » (unités de décor) disposent d’identifiants pérennes et actionnables de type ark.
Ces identifiants ark ne sont pas fournis en clair dans les extractions de données. Ils doivent être reconstruits à partir du « n° image » (voir le dictionnaire de données), en utilisant le préfixe « cgfbt » et en calculant le caractère de contrôle avec une table de concordance base10/base29 (cf. §8.3 des préconisations BnF pour les ark ; voir aussi la présentation générale des identifiants ark sur le site de la BnF).
Exemple : image n°208161 => http://mandragore.bnf.fr/ark:/12148/cgfbt208161k
Des URL dynamiques permettent d’exploiter certains des autres identifiants (sans garantie de pérennité), mais dans un contexte dégradé (mauvais gestion des frames sur mandragore.bnf.fr).
Pour les « manuscrits » : http://mandragore.bnf.fr/jsp/AfficheNoticeManArk.jsp?id=588 (pour le manuscrit n°588)
Pour les descripteurs : http://mandragore.bnf.fr/jsp/afficherNoticeDesc.jsp?id=165 (pour le descripteur n°165). Attention, cet URL appelle la notice du descripteur, pas les enluminures correspondantes. Pour cela, on peut utiliser l’URL suivant : http://mandragore.bnf.fr/jsp/switch.jsp?division=Mix&desc=dragon&idDesc=165.
- Recherche avancée
L’application web mandragore.bnf.fr propose un formulaire de recherche avancée, le seul réellement performant. Il n’existe malheureusement pas d’API pour appeler ce moteur de recherche.
- API de recherche par mot
Mandragore peut également être interrogée en utilisant un moteur de recherche « tous mots ». Le fonctionnement de celui-ci s’avère peu satisfaisant : son usage est donc déconseillé dans l’attente de la refonte de l’application qui verra son remplacement.
Un accès à cette recherche tous mots par SRU a été proposé à titre expérimental (http://motmandragore.bnf.fr/). Devant les nombreux dysfonctionnements identifiés, ce service a été interrompu en 2019.
Une refonte complète de l'application de consultation à l'échéance 2022 devrait permettre la mise en place d'API modernes.
Récupérer les images numériques
Certaines des enluminures décrites dans Mandragore sont associées à une reproduction numérique. Ces reproductions peuvent provenir de plusieurs réservoirs : numérisations intégrales de Gallica, numérisations partielles de la banque d’images de la BnF ou numérisations spécifiques réalisées pour Mandragore avant 2007.
L’ensemble de ces images sont sauvegardées sur les serveurs de la BnF et dotées d’un même système d’adressage : un numéro de LOT et un numéro d’IMAGE (cf. dictionnaire des données). Ces « coordonnées » peuvent être transformées en ark en utilisant un nom ark construit sur le numéro de LOT préfixé de « btv1b » et un qualificatif constitué du numéro d’IMAGE préfixé de « f ».
Exemple : LOT 8406169 – IMAGE 135 => ark:/12148/btv1b84061698/f135
Elles ne sont pas visualisables ou téléchargeables dans la même application en fonction du réservoir source. Les premiers chiffres du numéro de LOT permettent d’identifier celui-ci :
- Les lots commençant par (0)20, (0)21, (0)22, (0)23, (0)24, (0)25, (0)26, (0)30, (0)31, (0)32, (0)33, (0)78, (0)79, (0)80 sont des images issues de la banque d’images. Le numéro IMAGE correspondant est toujours 1. Ils ne doivent pas être transformés en ark et sont uniquement affichables dans l’application visualiseur.bnf.fr.
- Les lots commençant par (0)81 sont des reproductions partielles réalisées spécifiquement par Mandragore. Ils comportent plusieurs images, affichables dans l’application visualiseur.bnf.fr (en utilisant au choix l’ark ou les identifiants numériques).
- Tous les autres lots sont des numérisations de Gallica. Ils peuvent être affichés dans le visualiseur de Gallica et téléchargés en IIIF en utilisant leur ark (uniquement). En principe, ils peuvent également être affichés dans l’application visualiseur.bnf.fr, mais des erreurs sont possibles en cas d’appel de documents récents et/ou en dehors de la BnF.
Deux applications permettent de visualiser et de télécharger ces images :
- Le visualiseur http://visualiseur.bnf.fr/ peut être appelé en utilisant des URL dynamiques : par exemple http://visualiseur.bnf.fr/CadresFenetre?O=IFN-8101738&I=8 pour la visualisation du LOT 8101738 IMAGE 8 ; http://visualiseur.bnf.fr/ConsulterElementNum?O=IFN-8101738&E=JPEG&Deb=8&Fin=8&Param=E pour récupérer le fichier image dans la meilleure résolution disponible*. Il s’agit du visualiseur natif de l’application web Mandragore.
- Le visualiseur de Gallica peut être utilisé uniquement pour les documents indexés dans Gallica. Il nécessite l’utilisation de l’identifiant ark (voir ci-dessus). Les documents indexés dans Gallica sont également visualisables et téléchargeables en pleine définition* en utilisant les API IIIF.
* Attention : la récupération et la réutilisation des reproductions de Mandragore sont soumises au respect de la licence Gallica.
Exemples d’utilisation
Le portail Biblissima utilise les données de Mandragore (en relation avec d’autres bases de données) pour ses entités « Enluminures et marques ». Un important travail d’alignement des données avec divers référentiels a été mené pour cela. Des visualisations innovantes, et une intéressante exploitation des reproductions (avec par exemple la constitution de manifestes IIIF pour toutes les enluminures attachées à un même descripteur) ont également été mises en œuvre.
Aide
Téléchargement des jeux de données
Les jeux de données sont mis à disposition sur un serveur FTP. En fonction du navigateur utilisé, le téléchargement est plus ou moins aisé.
L'accès au serveur FTP se fait sans difficulté avec Internet explorer et Edge. Il est plus aléatoire avec Firefox. Chrome interdit quant à lui l'accès aux serveurs FTP dans ses versions récentes.
L'utilisation de clients FTP comme le logiciel FileZilla est une autre solution pour récupérer ces fichiers.
Télécharger
Fiche Technique
Version1.1
Date de mise en ligneNovembre 2018
FormatCSV
Licence SujetsManuscrits Images