Refine
Document Type
- Doctoral Thesis (3)
Language
- German (3)
Has Fulltext
- yes (3)
Is part of the Bibliography
- no (3)
Keywords
- Codierung (1)
- Datenverarbeitung (1)
- Deutschland / Fallpauschalengesetz (1)
- Diagnose (1)
- Diagnosenschlüssel (1)
- Heuristik (1)
- ICD (1)
- IDT (1)
- Kodieralgorithmus (1)
- Leitbegriff (1)
Institute
- Medizin (3)
In der medizinischen Praxis in Deutschland ist Klassifikation als essentieller Bestandteil der Dokumentation in vielen Bereichen durch gesetzliche Regelungen vorgeschrieben. Über diesen gesetzlich determinierten Rahmen hinaus können durch Klassifikation vergleichbar gemachte Informationen als Basis neuer wissenschaftlicher Erkenntnisse herangezogen werden und weiterhin helfen, bestehende Lehrmeinungen zu evaluieren. Ein Blick auf die im medizinischen Umfeld vorhandene organisatorische Realisierung der Klassifikation zeigt, daß diese in der Regel von medizinisch qualifiziertem Fachpersonal neben der eigentlichen Tätigkeit durchgeführt wird. Eine Klassifikation vorhandener Dokumentationen im Sinne einer Erschließung zusätzlicher wertvoller Informationsquellen über den gesetzlichen Mindestumfang hinaus scheitert somit häufig an der organisatorisch bedingten Überlastung der eingesetzten Mitarbeiter. Eine Unterstützung medizinischer Klassifikation in der Praxis durch den geeigneten Einsatz von Informationstechnologie (IT) erscheint somit sinnvoll und wünschenswert. Im Rahmen der vorliegenden Arbeit wird ein entsprechender Ansatz in Form eines entwickelten Prototypen (XDIAG) vorgestellt und evaluiert. Der entwickelte Prototyp realisiert ein IT-gestütztes leitbegrifforientiertes Verfahren zur automatischen Kodierung von Diagnosen auf Basis vorliegender medizinischer Freitexte. Die hierbei realisierten Ansätze und Verfahren folgen den Vorschlägen von Herrn D. Schalck und sind somit das Resultat langjähriger intensiver und praxisnaher Beschäftigung mit Fragen medizinischer Freitextverarbeitung und Klassifikation. Die besondere Vorgehensweise verleiht dem vorgestellten Prototypen den Charakter einer Heuristik. In Abgrenzung zu zahlreichen bestehenden Verfahren erfolgt eine konsequente Reduktion der Komplexität der eingesetzten Algorithmen und Stammdaten durch einen Verzicht auf eine tiefgreifende linguistische Analyse der zur Kodierung vorgelegten Texte. Durch diesen Verzicht kann auf die Verwendung einer Grammatik und somit auf die Verwendung komplexer Stammdaten verzichtet werden. Als Stammdatenbasis werden vielmehr Datenbestände verwendet, die entweder besonders leicht zu pflegen sind oder aber ohnehin permanent im Rahmen von Langzeitprojekten gepflegt werden. An dieser Stelle spielt insbesondere der ICD10-Diagnosen-Thesaurus mit seiner umfassenden und besonders praxisorientierten Begriffsmenge eine wichtige Rolle. In Erweiterung bestehender Verfahren bietet der vorgestellte Prototyp darüber hinaus die Möglichkeit, mehrere medizinische Diagnosen im Rahmen eines Satzes zu kodieren. Weiterhin können dem Benutzer interaktiv qualifizierte Fehlerhinweise mit dem Ziel einer verbesserten Kodierung bereitgestellt werden. Als Ergebnis der Evaluation des realisierten Prototypen läßt sich festhalten, daß die hierbei eingesetzten Verfahren helfen können, eine synergistische Brücke zwischen praktischer Medizin, medizinischer Verwaltung und medizinischer Forschung zu schlagen, wenn sie an der richtigen Stelle und mit der richtigen Motivation eingesetzt werden.
Die vorliegende Arbeit beschäftigt sich mit automatischer Informationssuche in heterogenen medizinischen Datenquellen. Informationssuche beschreibt einen Vorgang zur Deckung eines vorhandenen Informationsbedarfs, der aus einem Mangel an Wissen resultiert. In der modernen medizinischen Praxis sind aktuelle Informationen zur optimalen Behandlung eines Patienten wichtig. Fehlen diese Informationen, resultieren negative Folgen für den Behandlungsprozess. Im Hinblick auf den ableitbaren Erkenntnisgewinn ist die Fülle an aktuellen medizinischen Informationen, die heute über Literatur- und Wissensdatenbanken im Internet zur Verfügung steht, eigentlich wünschenswert. Das gezielte Auffinden relevanter Informationen, die zum Kenntnisstand des Arztes und dem Problem des Patienten passen, ist aber mühsam, fehlerbehaftet und zeitaufwändig. Der Aufwand, problemspezifische Informationen zu finden, wird zusätzlich dadurch vergrößert, dass die vorhandenen medizinischen Informationsanbieter unterschiedliche Anfragesprachen zum Zugriff auf die Daten bereitstellen und sich die Struktur der angebotenen Informationen von Anbieter zu Anbieter unterscheidet. Zur Lösung dieser Problematik werden Verfahren untersucht, mit denen die Informationsrecherche automatisiert werden kann. Ausgehend von den Informationen in der elektronischen Patientenakte und den persönlichen Interessen des Arztes werden Suchanfragen automatisch generiert, an verschiedene Informationsanbieter versandt, und die Suchergebnisse anschließend bedarfsgerecht gefiltert präsentiert. Die so gewonnenen Informationen ergänzen die Inhalte der elektronischen Patientenakte. Für die Generierung von problemspezifischen Suchanfragen wird ein komplexes, universelles Verfahren auf der Basis von dynamischen Textgenerierungsmethoden mittels XML-Strukturen entwickelt. Als Grundlage dient eine formal definierte Beschreibung des Informationsinteresses. Daten aus der elektronischen Patientenakte und dem Interessenprofil des Arztes werden über sog. Datencontainer in die Beschreibung eingebettet. Die Auswertung der Datencontainer ergibt eine allgemeine Anfrage, die erst in einem weiteren Schritt in die spezifische Anfragesyntax der einzelnen Informationsanbieter transformiert wird. Als Informationsanbieter kommen sowohl Anbieter medizinischer Literaturdatenbanken als auch eine medizinische Suchmaschine für das World Wide Web zum Einsatz. Das Konzept der virtuellen Datenbank wird verwendet, um aus den Antworten der Informationsanbieter die jeweils erforderlichen Informationsbestandteile zu extrahieren und in ein universelles XML-Dokumentenformat zu integrieren. Der Arzt, der mit dem System arbeitet, erhält als Ergebnis einer Recherche eine einheitliche, übersichtsartige Darstellung der Suchergebnisse, unabhängig von der Struktur der Informationen. Die Realisierung erfolgt als Prototyp eines Informations-Agentensystems, das aus einer interaktiven und einer automatischen, im Hintergrund arbeitenden Komponente besteht.
Die vorliegende Arbeit beschäftigt sich mit medizinischem Information-Retrieval in Volltext-Datenbanken und im World-Wide-Web. Information-Retrieval unterscheidet sich von Daten- oder Text-Retrieval dadurch, dass nicht nach Wörtern gesucht wird, die einem exakten Patternmatch folgend (Zeichen für Zeichen identisch) gefunden werden. Stattdessen wird eine vage Suchanfrage gestellt, bei der vielerlei Faktoren die Suchergebnisse beeinflussen können. So existieren von vielen Wörtern Schreibweisen-Variationen, wie etwa Cervix-Zervix. Auch kommen in medizinischen Texten, die im Routinebetrieb entstanden sind und die nicht korrekturgelesen wurden, viele Orthografie- bzw. Tipp-Fehler vor. Zusätzlich entstanden durch die Rechtschreibreform der deutschen Sprache weitere Schreibweisenvariationen (Elektrokardiograf-Elektrokardiograph). In der Medizin wird das Problem des Information-Retrieval noch dadurch vergrößert, dass eine Fach- und eine Umgangssprache existieren. So recherchiert ein Arzt als Kenner der Fachsprache nach “Tachykardie“, während ein Patient nach dem umgangssprachlichen “Herzrasen“ sucht. Für Information-Retrieval im World-Wide-Web ist die Nutzung von Suchmaschinen von elementarer Bedeutung. Auch Meta-Suchmaschinen haben sich etabliert. Darauf aufbauend wird das Modell einer thesaurus- und indexbasierten Meta-Suchmaschine entwickelt und implementiert. Dieses Modell bietet - im Vergleich zu klassischen Volltext- und Meta-Suchmaschinen - einige Vorteile. So entsteht z.B. nur sehr geringer Speicherplatzbedarf, es ergeben sich schnelle Zugriffszeiten, trotzdem wird kein eigener Crawler benötigt. Zur Lösung der Probleme werden Thesauri und die Fuzzy-Set-Theorie eingesetzt: * Die Theorie der unscharfen Mengenlehre (Fuzzy-Set-Theorie) wird genutzt, um Differenzen in der Schreibweise zu eliminieren. Dazu wird ein neuer Algorithmus entwickelt, der - basierend auf einem klassischen, etablierten Algorithmus - bessere Retrieval-Ergebnisse bei gleichzeitig geringerer Laufzeit ergibt. Er basiert auf Buchstabengruppen (sog. n-Gramme) und wurde am Beispiel der Größe n = 3 (Trigramme) implementiert und getestet. * Thesauri sind Datenbanken, die W¨orter und Relationen zwischen Wörtern enthalten. Sie werden in der vorliegenden Arbeit extensiv f¨ur Crawling, Ranking, Information-Retrieval und Meta-Suche eingesetzt. Fuzzy-Set-Theorie und Thesauri dienen zusammen der Modellierung des ungenauen Wissens für das Information-Retrieval. Test und Evaluation finden anhand von drei verschiedenen Textmengen statt. Die Suchmöglichkeiten für das Information-Retrieval werden komplex gestaltet. Es wird sowohl eine Operatorpriorität als auch Setzung von Prioritätsklammern ermöglicht. Dazu werden Techniken der formalen Sprachen und des Compilerbaus eingesetzt. Für die Ausgabe der Seiten werden spezifische Verfahren entwickelt, die Seite bezüglich der Relevanz zu bewerten, das sog. Ranking. Insgesamt werden drei verschiedene Ranking-Verfahren vorgestellt und implementiert. Die Realisierung erfolgt komplett XML-basiert mit einem Schwerpunkt auf XSLT. Als Ausgabeformate stehen XML, HTML und PDF zur Verfügung.