Thésaurus XML et Lucene |
||
LAURENT Jean-Marc - Méthode OCSIMA | Audit - Conseil - Développement - Formation |
|
|
|
Lien : Ontologie, thésaurus, taxonomie et Web sémantique L'analyse de connaissances nous amène très souvent à considérer l'aspect statique et l'aspect dynamique des entités recensées. Exemple : l'acide acétique est un acide faible. Il peut parfois 'jouer le rôle' de solvant. Cette distinction entre ces deux aspects est très fréquente. Autre exemple pris du langage informatique Java : pour contourner les difficultés inhérentes à 'l'héritage multiple' non disponible, une distinction est faite entre les classes et les interfaces. Une Classe ne peut spécifier qu'une et une seule autre Classe mère dont elle hérite les propriétés (extends) mais peut utiliser et / ou redéfinir les méthodes (implements) d'un nombre quelconque d'Interfaces. Voici ce que l'on peut lire dans le tutorial Java : (Dans le Thésaurus réalisé, c'est cette notion de 'rôle' qui est utilisée.)
Les principaux <éléments> XML utilisés dans le ThésaurusJ'ai retenu, pour le domaine de l'analyse physico-chimique les éléments suivants :
Ces éléments contiennent les 'sous-éléments' suivants, en plus de l'attribut 'fr' = sa désignation en français, :
Les deux derniers 'sous-éléments' sont terms/usingterm et roles/role. Les éléments 'usingterm' et 'rôle' sont 'EMPTY' mais ont pour attribut ''termid' une référence sur l'id d'un term. Thésaurus, sa DTD (Document Type Definition)Les deux dernières références permettent d'implémenter les rôles des substances chimiques.
Exemple : l'acide acétique est un 'acide faible' mais il peut avoir le rôle de solvant en 'potentiométrie acide base en milieu non aqueux'. L'acide acétique, l'acide benzoïque et l'acide butyrique sont trois frère dans l'arbre. Mais, comme on le vérifie sur l'applet de visualisation, l'acide acétique peut jouer un rôle que les deux autres ne présentent pas. Lorsqu'on lance une recherche avec la query "acide butyrique" et qu'aucun document indexé ne le mentionne, le système de recherche doit présenter les résultats concernant l''acide benzoïque' (s'il y en a) et non tous les documents contenant 'acide acétique'. Applet de visualisation du ThésaurusVous trouverez ci-dessous des captures d'écran de l'application. Votre système de navigation vous permet-il de voir (attendre le chargement et le lancement de Java platform) des Applets ? Alors vous pourrez voir l'Applet de visualisation du Thésaurus XML
Applet de visualisation du Thésaurus (2ème onglet)
La Gestion du ThésaurusComme pour les fiches XML, une interface de gestion permet (boutons et items de menus), après avoir sélectionné un noeud de l'arbre, et lorsque cela est autorisé, ;
La figure suivante montre la fenêtre principale (toujours l'exemple du noeud <substance fr="acide acétique" ...> ainsi que l'onglet secondaire d'édition des rôles. (Rappel : Un tel noeud ne contient que la référence au terme (une IDREF), il n'est pas possible de l'éditer directement à ce niveau. Pour ajouter un rôle, l'utilisateur doit sélectionner une valeur dans la liste de choix de termes proposée.) Pour éliminer un 'rôle', il faut commencer par le sélectionner dans la liste.
|
|
|
|
Dernière révision décembre 05 |
Plan du site OCSIMA |
Pour nous écrire, cliquez ici : |