Web sémantique et interopérabilité des vocabulaires - Archive ouverte HAL Access content directly
Journal Articles World Library And Information Congress: 74th IFLA General Conference And Council Year : 2008

Web sémantique et interopérabilité des vocabulaires

(1) , (2)
1
2

Abstract

Semantic search across collections described with heterogeneous metadata is an important problem in the Cultural Heritage field. This paper presents an experiment on enhancing the semantic interoperability of two digital iconographic collections: Mandragore, the iconographic database of the Manuscript Department of the French National Library (BnF), and the Medieval Illuminated manuscripts collection of the National Library of the Netherlands (KB). While the content of these two collections is similar, they have been processed differently. The vocabularies used to index their objects are both controlled and hierarchically organized Knowledge Organization Systems (KOS), but they do not have the same semantics and structure. The experiment presented here started with a precise analysis of each of these vocabularies. Then, each of them was represented in a standard model. This model, namely, SKOS, paves the way for semantic reconciliation of heterogeneous KOSs, on top of the RDF Semantic Web data model. Once this step has been taken, it is possible to use simple automatic techniques for matching the concepts of the two vocabularies at the semantic level, based on their lexical similarities. Finally, a prototype was built that exploits the information contained in the vocabularies and in their alignment, to allow for searching documents in both collections at the same time, using a single set of descriptors as query terms.
Pendant la période 2006-2007 une collaboration entre la Bibliothèque nationale de France et la Bibliothèque royale des Pays-Bas a eu lieu autour du projet néerlandais STITCH. Ce projet, à travers des expériences concrètes, explore l'axe sémantique de la recherche. Comment effectuer des recherches sémantiques simultanées à travers plusieurs collections patrimoniales numériques ? Les métadonnées ayant trait à l'analyse du contenu sont souvent hétérogènes. Outre l'exploitation des méthodes de mise en correspondance manuelle des entités sémantiquement comparables, STITCH explore les techniques du web sémantique, notamment l'alignement d'ontologies. Cette présentation porte sur l'expérience qui a été menée sur deux collections iconographiques numériques, Mandragore, base iconographique du département des Manuscrits de la Bibliothèque nationale de France et la Collection d'enluminures de la Bibliothèque royale des Pays-Bas. Les contenus des deux collections sont comparables mais le traitement documentaire et les vocabulaires utilisés pour l'indexation de leurs contenus sont très différents. Les deux vocabulaires Mandragore et Iconclass sont certes contrôlés et hiérarchisés mais ils diffèrent dans leur sémantique et dans leur structure. C'est précisément cette différence qui a intéressé le projet STITCH qui vise à étudier l'alignement automatique des deux vocabulaires. L'expérience collaborative a démarré avec l'analyse fine de chacun des vocabulaires : les concepts et leur représentation, les propriétés lexicales des termes, les relations sémantiques, etc. L'équipe de chercheurs néerlandais a ensuite étudié et mis en place des mécanismes d'alignement des deux vocabulaires. Les modèles d'origine étant différents, une conversion dans un formalisme pivot (standard commun) était nécessaire pour engager ensuite les procédures d'alignement. C'est le RDF / SKOS qui a été utilisé. L'expérience a abouti à la réalisation d'un prototype qui permet une interrogation simultanée des deux bases à partir d'une même interface. Les descripteurs de chacun des deux vocabulaires servent de termes de requête sur l'ensemble des images appartenant indifféremment à l'une ou l'autre des deux collections. Cette expérience n'est qu'une étape dans la recherche de solutions visant à faciliter la navigation entre les collections patrimoniales dont les métadonnées sont hétérogènes.
Fichier principal
Vignette du fichier
129-Angjeli_Isaac-fr.pdf (355.77 Ko) Télécharger le fichier
Origin : Publisher files allowed on an open archive
Loading...

Dates and versions

hal-00876135 , version 1 (23-10-2013)

Identifiers

  • HAL Id : hal-00876135 , version 1

Cite

Anila Angjeli, Antoine Isaac. Web sémantique et interopérabilité des vocabulaires : une expérimentation dans le domaine des enluminures. World Library And Information Congress: 74th IFLA General Conference And Council, 2008, http://archive.ifla.org/IV/ifla74/papers/129-Angjeli_Isaac-fr.pdf. ⟨hal-00876135⟩

Collections

BNF
234 View
357 Download

Share

Gmail Facebook Twitter LinkedIn More