AMIX: Ein System zur automatisierten MeSH-Indexierung

Olaf Wilken, Josef Ingenerf

Abstract

Einleitung und Fragestellung
Eine automatische Indexierung von Volltextdokumenten mit Schlagwörtern aus kontrollierten Vokabularien bekommt mit der anvisierten Realisierung des Semantic Web eine neue Dynamik. Die Bemühungen hängen aber entscheidend von der effizienten Bereitstellung der Schlagworte für große Mengen von Volltexten ab. Das gilt auch für die elektronischen Kursmaterialen zum Hochschulstudium der „Medizinischen Informatik“, die im bereits beendeten MEDIN-Projekt entstanden sind. Eines der Ziele war eine kursübergreifende Recherche und Navigation der XML-basierten Online-Kurse in einem MEDIN-Portal [1]. Voraussetzung ist eine möglichst rechnergestützte Verschlagwortung sämtlicher Dokumente.

Als kontrolliertes Vokabular bietet sich die Verwendung des MeSH-Thesaurus an. Vor allem in den 80er und 90er Jahren wurden zahlreiche Systeme zur automatischen MeSH-Indexierung entwickelt. Diese stehen jedoch überwiegend für die englische Sprache zur Verfügung [2], [3]. Für die deutsche Sprache sind allenfalls die Freiburger Ansätze basierend auf dem Morphosaurus-Ansatz zu nennen [4]. Das System AMIX (Automatische MeSH-Indexierung von XML-Dokumenten) wurde einerseits neu entwickelt, weil Systeme nicht verfügbar oder kaum in das komplexe XML-basierte MEDIN-Portal technisch zu integrieren sind. Andererseits zeigen alle Evaluationen vorhandener Lösungen, dass die Vollständigkeit und Korrektheit vollautomatisch extrahierter Schlagworte inhärent limitiert sind. Statt dem Wettbewerb um Recall und Präzision eine weitere Variante hinzuzufügen, wurde Wert auf ein hohes Maß an Parametrisierbarkeit und Interaktivität gelegt. Neben einem vollautomatischen Modus existieren Werkzeuge zur intellektuellen Nachbesserung.

...
OriginalspracheDeutsch
PublikationsstatusVeröffentlicht - 08.09.2005
Veranstaltung50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds)
- Freiburg im Breisgau, Deutschland
Dauer: 12.09.200515.09.2005

Tagung, Konferenz, Kongress

Tagung, Konferenz, Kongress50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds)
Kurztitelgmds 2005
Land/GebietDeutschland
OrtFreiburg im Breisgau
Zeitraum12.09.0515.09.05

Zitieren