Notices de manuscrits médiévaux de BnF Archives et Manuscrits
Présentation
Pour permettre un projet de comparaison des méthodes de catalogage des manuscrits médiévaux dans les bibliothèques européennes, une extraction de BnF Archives et Manuscrits a été réalisée en octobre 2022.
Principes du catalogage dans BnF Archives et Manuscrits
Depuis 2007, les bibliothèques françaises utilisent le format XML/EAD version 2002 pour la description de leurs manuscrits et fonds d’archives, aussi bien dans le cas de rétroconversions (informatisation de catalogues papier) que pour les nouvelles descriptions.
Depuis 2013, les bonnes pratiques de l’EAD en bibliothèques, communes aux principaux réseaux bibliographiques nationaux en France, sont la référence pour toute nouvelle description. En revanche, les notices historiques, en particulier issues de rétroconversions, ne sont pas toujours entièrement conformes à ces bonnes pratiques tant qu’elles ne font pas l’objet d’une mise à jour complète, par exemple dans le cadre d’un projet de recherche thématique.
Par ailleurs, certains choix de description, suivis dans BnF Archives et Manuscrits pour des raisons historiques, s’éloignent des principes suivis dans le catalogue en ligne des archives et des manuscrits de l’enseignement supérieur (Calames) et/ou dans le catalogue collectif de France (CCFr). En particulier, s’agissant de manuscrits unitaires, on privilégie à la BnF la rédaction d’un instrument de recherche (correspondant à un fichier XML distinct) par cote ou petit ensemble cohérent de cotes (par exemple pour un manuscrits en plusieurs volumes), plutôt qu’un seul instrument de recherche pour une collection entière.
Un manuel de catalogage des manuscrits médiévaux, accessible sur le site portail d’aide au catalogage de la BnF est largement utilisé pour les nouvelles descriptions de manuscrits unitaires (ne faisant pas partie d’un fonds d’archives littéraires ou administratives). Il s’inspire des « règles suivies pour la description des notices » du catalogue latin (au format papier), adaptées au contexte numérique. Ces consignes ont évolué depuis l’adoption du catalogage informatisé en 2007, et les notices les plus anciennes, même nativement numérique, ne sont pas toujours mises à niveau des nouvelles recommandations.
Sélection des manuscrits médiévaux
Isoler les « manuscrits médiévaux » dans les collections de la BnF pose des difficultés méthodologiques.
Le choix de bornes chronologiques est arbitraire par définition et fait fi des continuités historiques. Si la période de la Renaissance, par exemple, introduit des évolutions marquées en histoire de l’art et, dans certains domaines, en histoire des textes, la codicologie des manuscrits réalisés au XVIe siècle reste tout à fait semblable à celle du XVe siècle. Un certain nombre de manuscrits, réalisés à une époque, ont été modifiés à une autre époque, parfois de façon extensive. De nombreux recueils factices, réalisés aux XVIIIe et XIXe siècles, sont composés de divers fragments de manuscrits médiévaux et/ou modernes. Enfin, la date de réalisation d’un manuscrit n’est pas toujours aisée à définir et n’est parfois pas renseignée dans les notices (en particulier lorsqu’elles consistent en une simple informatisation d’inventaires anciens).
Le périmètre géographique et/ou linguistique des « manuscrits médiévaux » peut également être défini de plusieurs manières. Le concept de « Moyen Âge », s’agissant de manuscrits extra-européens, peut ne pas être pertinent, ou ne pas recouper les mêmes bornes chronologiques.
Pour le projet de recherche ayant donné lieu à cette extraction de données, il a été décidé d’appliquer un simple filtre chronologique sur la période 500-1600 (du calendrier grégorien proleptique), quelle que soit la langue et le lieu de production, mais à l’exclusion des manuscrits non datés. Seules les collections de la bibliothèque de l’Arsenal et du département des Manuscrits ont été prises en compte. Un affinage manuel sur la base des dossiers du cadre de classement (ou des fichiers eux-mêmes) est possible.
Contenu du jeu de données
La liste des instruments de recherche extraits s’appuie sur une analyse des balises <unitdate> (date de l’unité documentaire) réalisée le 30 septembre 2022.
L’ensemble des instruments de recherche dont la description archivistique contenait au moins une balise <unitdate> le rattachant (partiellement ou complètement) à la période 500-1600 sont intégralement présents dans l’extraction, y compris les éventuels composants d’une autre période. La sélection s’appuie sur l’attribut @NORMAL de <unitdate>, d’après la norme ISO-8601.
La liste des 36 011 instruments de recherche sélectionnés (correspondant à environ 42 000 cotes) est fournie en annexe. Seuls les 35 966 instruments de recherche publiés dans BnF Archives et Manuscrits en octobre 2022 sont inclus dans l’extraction finale. (La différence correspond à des instruments de recherche encore en cours de rédaction à cette date.)
Le fichier d’archive ZIP distingue les collections du département des Manuscrits (MSS) et de la bibliothèque de l’Arsenal (ARS). Au sein de chaque département, les instruments de recherche sont rangés dans le dossier auquel ils se rattachent directement dans BnF Archives et Manuscrits : l’ensemble des dossiers intermédiaires du mode « Explorer les collections » ne sont pas restitués (et seuls les dossiers contenant des instruments de recherches sélectionnés sont présents).
Chaque fichier XML correspond à un instrument de recherche. Il est identifié par son numéro de notice commençant par FRBNFEAD. Cet identifiant est unique et correspond à l’ark visible dans BnF Archives et Manuscrits (sous la forme ark:/12148/cc + partie numérique de l’identifiant FRBNFEAD + caractère de contrôle, en savoir plus sur l’identifiant ark à la BnF). Attention, seuls les arks publiés font l’objet d’un engagement de pérennité en cas d’évolution de la ressource, pas les numéros de notice.
Encodés selon la DTD EAD version 2002 (téléchargeable sur le site de la Library of Congress), ces fichiers correspondent aux versions des instruments de recherche publiées dans BnF Archives et Manuscrits le 12 octobre 2022. Les données accessibles sur la base Mandragore, dont la migration n’était pas achevée à cette date, ont été exclues, ainsi que les données à usage interne ou non encore publiées.
Ce jeu de données n’a pas vocation à être mis à jour à échéance régulière et peut donc être obsolète.
API, jeux de données et utilisations des données liés
A ce jour, le catalogue BnF Archives et Manuscrits n’est pas équipé d’une fonctionnalité d’export EAD ou d’une API équivalente.
En revanche, le Catalogue Collectif de France permet un export EAD (à l’unité) de chaque instrument de recherche de la base Manuscrits et Archives, y compris ceux de la BnF. Il est donc possible d’afficher une notice dans le CCFr puis d’utiliser la fonction d’export (icone orange en haut à droite). Attention cependant, une conversion a lieu lors de l’intégration des instruments de recherche de BnF Archives et Manuscrits dans le Catalogue Collectif de France, y compris la reconstitution d’instruments de recherche « de collection », ce qui provoque la perte de certaines métadonnées (entre autres, le numéro de notice).
Un jeu de données régulièrement mis à jour sur ce site permet par ailleurs le téléchargement de l'ensemble des instruments de recherche du Catalogue Général des Manuscrits (bibliothèque territoriales publiques).
Le portail Biblissima utilise une extraction des instruments de recherche de BAM pour enrichir les descriptions des manuscrits de la BnF d’autres bases agrégées (avec une sélection d’informations).
Dans le cadre du projet Europeana ARMA, la sélection de « manuscrits médiévaux » numérisés a soulevé des difficultés méthodologiques de même nature, amplifiées par l’accès aux données bibliographiques au format Dublin Core, moins précis que l’EAD.
Aide
EAD Format bibliographique
Téléchargement des jeux de données
Les jeux de données sont mis à disposition sur un serveur FTP. En fonction du navigateur utilisé, le téléchargement est plus ou moins aisé.
L'accès au serveur FTP se fait sans difficulté avec Internet explorer et Edge. Il est plus aléatoire avec Firefox. Chrome interdit quant à lui l'accès aux serveurs FTP dans ses versions récentes.
L'utilisation de clients FTP comme le logiciel FileZilla est une autre solution pour récupérer ces fichiers.
Télécharger
Fiche Technique
Date de mise en ligneoctobre 2022
FormatXML XLS / XLSX
Licence TechnologiesEAD
SujetsManuscrits