Knowledge Management - Gestion des Connaissances

Indexation / Recherche de Connaissances
Adjonction d'un Thésaurus XML à Lucene

LAURENT Jean-Marc - OCSIMA Audit - Conseil - Développement - Formation

Thésaurus

Indexation / Recherche : Adjonction d'un thésaurus à Lucene

Chapitres de ce document Thésaurus : Cliquez ici pour obtenir ce fichier au format PDF (518 KB) : Thésaurus au Format PDF
  1. Lucene

  2. Méta Connaissances, meta data, XML, ...

  3. Le Thésaurus

  4. Thésaurus et meta data XML

  5. Future Indexation Recherche

Voir aussi notre page Recherche Sémantique de Connaissances : Pourquoi mon intérêt pour Lucene ?, Indexation Recherche avec Lucene, et Recherche d'Information.

Résumé de ce document Thésaurus

Thésaurus, définitions :

La définition sur Wikipédia d'un Thésaurus, ou les définitions Ontologie, thésaurus, taxonomie et Web sémantique ? Le Thésaurus est un dictionnaire hiérarchisé (relation père -> fils = spécialisation) ; de plus pour chaque concept sont indiqués ses synonymes, sa traduction (limitée à l'anglais), et sa formule chimique ; sont indiqués également les rôles ou fonctions (ex. : solvant, solution titrante, ...) joués par le concept.

Descriptions des chapites sur le Thésaurus

Le premier paragraphe est une introduction à Lucene, outil Java d'indexation / recherche, distribué en 'open-source' à partir du printemps 2000.

La problématique du format des documents diffusés et celle des meta data XML sont évoquées dans le second.

L'adjonction d'un thésaurus XML à l'outil d'indexation / recherche Lucene est décrite dans le troisième : Pourquoi un thésaurus ? Pourquoi XML ? Les aides que peut apporter un thésaurus dans la recherche de connaissances sont rappelées.
Le problème de l'élaboration d'une hiérarchie ou d'un héritage est aussi ancien que la notion d'objet (cf. les débuts de l'IA et de la représentation des connaissances). Cette notion de fonction, de rôle, est-elle une solution générique ? La notion d'Interface introduite dans le langage Java est-elle la solution ? Les informations des lecteurs sont bienvenues.

Les deux derniers paragraphes présentent une conclusion et une description des mes prochaines études sur l'adjonction de thésaurus XML à l'outil d'indexation / recherche dans le domaine de la 'Gestion des Connaissances'.

Une première version de ce document a été réalisée en 2002. La date de "Dernière révision" indique une modification dans la page, pas forcément dans le texte !


LAURENT Jean-Marc - Conseil Gestion des Connaissances - OCSIMA Consultant Knowledge Management
Valid XHTML 1.0 Strict Dernière révision mars 08 Plan du site OCSIMA Pour nous écrire, cliquez ici :