In english
Système d'indexation et d'accès à des Résumés Médicaux en Langage Naturel

Menelas

AIM Project 11213

An Access System for Medical Records Using Natural Language
Advanced Infomatics in Medecine Programme of the Commission of the European Communities


Contact:
P. Zweigenbaum
Service d'Informatique Médicale, Assistance Publique - Hôpitaux de Paris
91, boulevard de l'hôpital, F-75634 Paris Cedex 13, France
email: pz@biomath.jussieu.fr

Référence Source:
P. Zweigenbaum, Consortium Menelas. MENELAS: An Access System for Medical Records Using Natural Language. Computer Methods and Programs in Biomedicine, 45:117--120, 1994.


Objectifs :

MENELAS est un projet de l'Union Européenne du programme AIM La base du projet est de concevoir et de réaliser un système pilote d'analyse des résumés médicaux en utilisant les techniques de traitement du langage naturel. Il regroupe huit partenaires européens alliant des compétences en informatique médicale et linguistique et appartenant à trois communautés de langues différentes (Francais, Anglais, Néerlandais).

Dans le système d'information hospitalier (SIH), l'expérience montre que la majeure partie des données médicales pertinentes est contenue sous forme de textes narratifs dans le résumé de sortie du patient. Pour augmenter l'efficacité du SIH, MENELAS offre un meilleur accès à l'information des résumés médicaux. Le traitement du langage naturel permet d'extraire des informations utiles au suivi clinique du patient, à l'administration et à la gestion de l'activité des services hospitaliers ou bien encore à la recherche médicale

L'architecture générale du système s'organise autour de trois grandes fonctions.

Indexation :

Le système d'indexation des documents analyse le résumé médical et modélise l'information suivant le formalisme des graphes conceptuels. Ce modèle peut être vu comme une expression de la valeur sémantique d'un texte qui est indépendante de la langue. La construction des graphes est basé sur des ensembles structurés de concepts et de relations sémantiques.

L'analyse se décompose en plusieurs modules .L'analyseur morphosyntaxique et l'analyseur sémantique produisent à partir du texte un ensemble de graphes conceptuels. Le premier utilise grammaire et dictionnaire syntaxique, le second un lexique sémantique décrivant les mots sous la forme de graphes conceptuels. L'analyseur pragmatique, ensuite, a pour rôle de canoniser les données, de faire des vérifications de cohérence et de générer l'information implicite du texte. Il s'appuye pour cela sur une base de connaissances médicales. Le traitement se termine par la génération d'index.

Ce module, développé à Rennes.consiste à rechercher un ensemble de données prédéterminées au sein de la représentation profonde du résumé. En particulier la nomenclature ICD9-CM permet de décrire un résumé de sortie de patient en codifiant les diagnostics et les actes réalisés.

L'indexation est réalisée en recherchant parmi les graphes associés au résumé, ceux qui identifient les entités de la nomenclature, en appliquant ensuite les règles de codification. La base de connaissances utilisée par le générateur d'index, exprime les conditions nécéssaires à la reconnaissance des codes de nomenclature.

Des index propres au modèle conceptuel sont également produits, concepts clés discriminants pour la différenciation des résumés. Au sein du système le résumé médical est donc présent sous trois formes: le texte original, les graphes conceptuels et les index.

Gestion des Bases de Connaissances :

L'administration système permet le contrôle et l'optimisation des performances du système et la gestion des bases de connaissances.

L'application pilote porte sur les comptes rendus de coronarographie en cardiologie, l'extension du système à d'autres domaines de la médecine nécéssite de modifier certaines bases de connaissances spécifiques au domaine.

Interrogation :

La consultation. se fait via une interface utilisateur conviviale et ergonomique La réponse du système peut prendre différentes formes, tout ou partie de texte, ensemble de textes ou tableaux diagrammes et graphiques. Comme pour le texte, la représentation interne de la question est un graphe conceptuel.;dans une première étape les index sont utilisés,pour selectionner un sous ensemble de résumés qui répondent de manière globale à la question. La réponse finale est ensuite élaborée par comparaison entre les graphes conceptuels de la question et ceux des textes candidats.


L.I.M.