Home
Diplomarbeit - Artificial Intelligence Group
Contents
1. selbst ndig und nur unter Verwendung der angegebenen Hilfsmittel angefertigt habe n Dortmund den VE Ee Eed Unterschrift
2. Befunde durch das System okenComponent Interface W rterbuch MetaGraph Befund ffnen Eingabe hinzut gen Benutzers entsprec Graphen W rterb chern 1 Syste mAGENTa Verf gung TCP IP Pro Farbschemata Briefteile Gliederung der Diplomarbeit Folien Netzschnittstelle Netzschnittstelle des Vortrags Internet Intranet Abbildung 1 Client Server Paradi gma 7 i E Abbildung 70 Der Hilfetext Als Hilfetext wird das zu HTML konvertierte und berarbeitete Benutzerhandbuch verwendet 11 5 2 4 4 2 Info Durch Bet tigung dieses Men punktes ffnet sich ein Dialog der kurz den Titel und die Autoren von mAGENTa vorstellt Durch Bet tigung des OK Knopfes wird der Dialog wieder geschlossen 11 5 3 Der Graph Der Graph ist die visuelle animierte Darstellung des DFA Es werden die Zust nde die von ihnen ausgehenden Kanten und die Tokens dargestellt F r eine bessere Ansicht werden die Kanten auf denen die Tokens liegen aufgeteilt in Kanten die von einem Zustand zu einem Token f hren und Kanten die von einem Token zu einem Zustand f hren 11 Benutzerhandbuch 141 S Legende Verstreuen Ersch ttern _ L nge _ Zuf llig _ Fixieren Aufl sen Fortschritt 134 Abbildung 71 Graph Fenster Die obige Abbildung zeigt ein typisches Graph Fenster Am oberen Rand ist die Werkzeugleiste mit ihren verschie
3. 100 Schlu folgerungsverfahren einer 39 deduktiv 42 39 Schlu folgerunngsf higkeit 36 unse net 42 198 Semantik E 25 Sery eion aE RA AS 103 SHOUT east 108 Sicherheitsbeschr nkungen 103 Poftwareagenten 34 ek E nn ea hs 96 St tuszeile su sans Bann 116 Steuerzeichen n nennen 95 12 183 UE 62 aan 106 Synchronisation automatische 108 VE 108 KEE 25 T Tastatureingabe nennen 108 treten ante 88 TEI Vorschan u seen 162 TOPP esee eE 101 Testverfahren a t 67 Texvtertagsung 98 163 RN CH WEE 115 Token et 57 neiise eee 88 90 1 91 TokenComponent Interface 88 160 TokenComponents ssseseeeeseersereerrerererererseen 90 Tokenize nanen EE ee 57 Trainingseffekt 200 nennen 31 Transaktionsagenten nenn 35 1 E 57 e Ubergeneralisierung 85 36 Unicode 118 universit re Ausbildung 30 Vereinheitlichung eo 12 183 VNersiopnenraum Model 200 43 Index Verzeichnisstruktur 105 Vorbild einer BmptvtComonent 162 Voreinstellungen nen 186 Vorverarbeitung ucesseessee
4. o gt b KI Jo d A re verbleibender Zustand zu l schender Zustand verbleibender Zustand Abbildung 22 Mergingvorgang 8 DFA Generierung 67 8 3 1 Die Meta Struktur Texte die eine bestimmte inhaltliche Gliederung in Form von festgelegten Abschnitten aufweisen eignen sich im besonderen f r die Verwendung im vorgestellten System Diese Struktur findet sich u a in medizinischen Befunddokumentationen insbesondere radiologischer Art und legt den Ansatz nahe die Repr sentationsform der Befunddaten im System die deterministischen endlichen Automaten um eine Meta Struktur die die Abschnittsstruktur der Befunde widerspiegelt zu erweitern Eine Voraussetzung die das System an die Eingabedaten stellt ist da zu Beginn des Lernvorgangs bereits die Menge der Abschnitte bekannt ist die in den Befundtexten verwendet wird Da in der Praxis der radiologischen Befundung wie auch innerhalb der meisten anderen Dom nen die Struktur eines Befundes standardisiert ist stellt diese Vorgabe jedoch keine wesentliche Einschr nkung dar 8 3 1 1 Motivation Die wichtigsten Argumente f r die Erweiterung der Datenstruktur um eine Meta Struktur sind die Einschr nkung des Hypothesenraumes eine Verringerung der Rechenzeit und eine Verminderung von unerw nschten Lernergebnissen 8 3 1 1 1 Einschr nkung des Hypothesenraumes Die Strukturierung endlicher Automaten bedeutet eine erhebliche Eingrenzung des Hypothesenraume
5. als auch des eigentlichen Mergingvorganges ver ndern und somit das Lernergebnis die generierte Oberfl che entsprechend beeinflussen Eine Zusammenstellung s mtlicher Systemparameter findet sich im Anhang 7 Verarbeitung der Befundtexte Damit Texte gelernt werden k nnen m ssen sie zuerst von mAGENTa in eine bestimmte Form gebracht werden damit sie weiter verarbeitet werden k nnen Der Text mu dazu in seine einzelnen Bestandteile aufgeteilt werden Diese Bestandteile i A werden sie als Worte betrachtet dienen als Grundlage zur Bildung von einzelnen Tokens die in dem DFA einen Zustand in den n chsten berf hren Diese Aufteilung wird von dem Tokenizer vorgenommen Zur Optimierung des Lernergebnisses ist es sinnvoll f r eine Vereinheitlichung der gelernten Texte zu sorgen indem verschiedene Worte mit der selben Bedeutung auf ein einheitliches Synonym abgebildet werden Dieses wird durch das W rterbuch unterst tzt 7 1 Der Tokenizer Die zu lernenden Texte m ssen in einzelne Tokens eingeteilt werden damit diese gelernt werden k nnen Der Text wird als Strom von Zeichen eingelesen Dabei ist es unerheblich ob dieser Strom von der Tastatur einem lokalen Speicher ber ein Intranet oder das Internet kommt Dieser Strom wird mittels vorher festgelegter Trennzeichen in einzelne Tokens eingeteilt Ein Token mu dabei nicht zwangsl ufig identisch mit einem Wort sein welches von zwei Leerzeichen begrenzt ist E
6. 8 DFA Generierung 70 8 3 2 3 Deskriptive Meta Regel Im Falle des deskriptiven Ansatzes ist das Ziel nicht wie beim pr skriptiven Ansatz eine einmal festgelegte Struktur beizubehalten sondern eine Struktur zu erstellen die den Aufbau aller Befunde insbesondere die Reihenfolge der Abschnitte innerhalb einzelner Befunde ber cksichtigt Abbildung 24 verdeutlicht diesen Ansatz In Befund 1 weisen die Abschnitte die Reihenfolge Untersuchung Fragestellung und Untersuchungstechnik auf In Befund 2 liegt folgende Abfolge der Abschnitte vor Untersuchung Untersuchungstechnik und Fragestellung Im Falle des ersten Befundes folgt z B nach dem Abschnitt Untersuchung der Abschnitt Fragestellung Im zweiten Fall folgt nach Untersuchung die Untersuchungstechnik Das Ergebnis zeigt da die Reihenfolge der Abschnitte in Befund 2 ber cksichtigt wurden Die Wahl zwischen pr skriptivem und deskriptivem Ansatz h ngt somit vor allem davon ab ob man der Reihenfolge der Abschnitte Bedeutung beimi t oder nicht Befund 1 Befund 2 Ergebnis Untersuchung S Untersuchung Untersuchung D e E N N Untersuchungs Fragestellung _ SI F A ragestellung technik Ke y gt d y ur SE N J Untersuchungs Fragestellung Untersuchungs technik technik N Ta X X A Abbildung 24 Deskriptive Metaregel 8 DFA Generierung 71 Abbildung 25 zeigt den Meta Graphen nach Verarbeitung eines Befundes mit
7. Mithilfe des in Kapitel 8 3 1 beschriebenen MetaStruktur Konzeptes und des Aufbau des DFA wird der Arzt im TCI strukturiert durch den Befundungsvorgang geleitet zu 3 _Vereinheitlichung Hierzu dient das W rterbuch mit dessen Hilfe automatisch Synonyme Akronyme Abk rzungen usw in einer einheitlichen Schreibweise dargestellt werden k nnen Das W rterbuch verf gt ber die M glichkeit eine beliebige Folge von W rtern durch eine andere Folge zu ersetzen n m Ersetzung Somit kann in gewissem Umfang das Problem einer einheitlichen Terminologie in der radiologischen Befundung durch entsprechend umfassende W rterb cher gel st werden zu4 Fehlervermeidung Da der Arzt seinen Befund direkt mittels der vom System erzeugten Benutzeroberfl che durch Anwahl einzelner Radiobuttons erstellt und diese Oberfl che jeweils aus korrekten Befunddaten gelernt wurde ist die Gefahr inkorrekter Eingaben weitgehend ausgeschlossen Fehlerhafte Eingaben die der Arzt zus tzlich im Rahmen des Befundungsvorganges ber entsprechende EmptyComponents vornimmt werden Mithilfe des W rterbuches automatisch korrigiert Abschlie ende Betrachtung 181 zu 5 _Adaptivit t Das System beobachtet das Verhalten des Benutzers pa t sich diesem automatisch durch entsprechende Lernalgorithmen an und kann auch interaktiv durch Eingabe von Texten in das TCI erg nzt werden Falsch geschriebene W rter k nnen mit Hilfe des W rterbuches direkt durch ko
8. Befundungsvorgang 12 Testergebnisse 176 Neben dem oben beschriebenen Zusammenhang zwischen der Anzahl der Eingaben innerhalb eines Befundungsvorganges und der durchschnittlichen L nge der einzelnen Tokensequenzen wird noch ein weiterer Zusammenhang deutlich Gemeint ist die Relation zwischen dem durchschnittlichen Fan Out eines Zustandes und der L nge der einzelnen Tokensequenzen im entsprechenden Zustandspanel Je h her der Fan Out desto geringer die L nge der Tokensequenzen bzw vice versa Auch hier l ge der optimale Wert im Sinne der Benutzerfreundlichkeit zwischen diesen beiden Extremen Abbildung 91 zeigt da bei der Regelmenge von Angluin mit einem k Vorg ngerwert von 2 ein durchschnittlicher und somit optimaler Wert in Bezug auf die Anzahl der Eingaben erreicht wird Der h chsten Wert wird bei der Regelmenge von Schlimmer und Hermens mit einem k Vorg ngerwert von 2 der geringste Wert mit einem Vorg ngerwert von 0 angenommen 12 Testergebnisse 177 12 2 6 der Meta Zust nde Aus den n chsten Abbildungen kann man folgenden Erkenntnisse ableiten Zum einen f hren Inhomogenit ten einzelner Meta Abschnitte Segment C3 4 Segment 4 5 Segment C5 6 und Segment C6 7 in der Dom ne CT HWS Segment L3 4 Segment L4 5 Segment L5 S1 in der Dom ne CT LWS bzw Beurteilung Segment L4 5 Segment 15 51 in der Dom ne LWS bez glich der zugrundeliegenden Syntax im Zusammenhang mit den Regelmengen 12a02b03al3b
9. 8 2 2 Aufbau des Pr fixbaumes Der Aufbau des Pr fixbaumes erfolgt inkrementell Jeder eingelesene Befund wird nach Umwandlung in eine Tokensequenz siehe Kapitel 7 dem bestehenden Pr fixbaum hinzugef gt Dabei werden die Token der aktuellen Tokensequenz schrittweise mit dem Pr fixbaum verglichen Hierbei wird berpr ft ob f r das aktuelle Token der Tokensequenz eine Transition im Pr fixbaum existiert Im positiven Fall wird der Test mit dem n chsten Element der Sequenz wiederholt bis das Ende der Sequenz erreicht wurde Im negativen Fall wird f r die verbleibenden Token der Sequenz ein neuer Zweig des Pr fixbaumes erzeugt An Abbildung 21 l t sich das Prinzip der Generierung eines Pr fixbaumes verdeutlichen Sei aa das erste Beispiel das eingelesen wird Die Tokensequenz wird in diesem Fall vollst ndig bernommen Das zweite eingelesene Beispiel sei abba Das erste Token a der Sequenz stimmt noch mit dem Pr fixbaum berein f r das zweite Token b existiert hingegen keine Transition im Pr fixbaum Es wird also ein neuer Zweig mit der Sequenz bba angef gt Beim dritten eingelesenen Beispiel stimmt bereits das erste Token b nicht mit dem Pr fixbaum berein Der neue Zweig bba wird direkt an den Startzustand des Baumes angeh ngt 8 2 3 Generalisierung des Automaten Der Verband Lattice der endlichen Automaten ist definiert als die Menge aller Partitionen des Pr fix Automaten Die einzelnen Elemente des Verbandes sind
10. Abbildung 41 ZustandsRahmen 9 Das TokenComponent Interface 88 Die ausgehenden Kanten eines Zustandes sind jeweils mit Tokens beschriftet Jedes dieser Tokens hier die Tokens Toten und Token3 wird durch eine eigene Komponente dargestellt Diese Tokens berf hren den Zustand jeweils in einen Nachfolgezustand Oftmals ist es in den gelernten Texten so da lineare Pfade dem Zustand folgen f r den der Rahmen generiert wird Die Worte auf diesen Pfaden werden konkateniert und an das erste Token gehangen Als letzte Komponente in einem ZustandsRahmen befindet sich immer eine EmptyComponent um neue Eingaben des Benutzers aufnehmen zu k nnen die durch die bisherigen Komponenten nicht abgedeckt worden sind Die einzelnen TokenButtons k nnen optional der Wahrscheinlichkeit nach geordnet werden mit der sie bei k nftigen Befundungen angeklickt werden Dies wird aus den Frequenzen der Tokens die durch die einzelne TokenComponent repr sentiert werden ermittelt Die Frequenz eines Tokens gibt an wie oft bisher dieses Token in Befunden vorkam bzw wie oft es schon vom Benutzer angeklickt worden ist um in einen neuen Befund aufgenommen zu werden F r die wahrscheinlichste TokenComponent wird jeweils als Vorschau ein weiterer Rahmen f r den Zustand angezeigt der erreicht wird wenn diese TokenComponent bet tigt wird Die einzelnen TokenComponents im ZustandsRahmen bilden eine TokenComponent Auswahl Dies bedeutet da z
11. Bochum DATI TIME Sehr geehrte ANREDE Tabelle 11 Briefkopf 10 3 Brieffu Ein einfacher Brieffu der hinter dem durch das TCI erfa ten Text steht k nnte beispielsweise folgende Form haben Mit freundlichen Gr en NAME Tabelle 12 Brieffu 10 98 10 4 Schl sselworte ANSCHRIFT und ANREDE sind Platzhalter die von dem Arzt entsprechend der Patientendaten gef llt werden m ssen DATE und TIME sind besondere Schl sselworte die von mAGENTa automatisch durch das aktuelle Datum und die aktuelle Zeit ersetzt werden Der Platzhalter name kann jeweils durch den Namen des behandelnden Arztes ersetzt werden Arbeitet ein Arzt immer mit demselben Brieffu so kann der Name nat rlich auch direkt in den Brieffu eingetragen werden 11 Benutzerhandbuch In diesem Kapitel wird die Benutzung des mAGENTa Systems so wie es schlie lich realisiert worden ist anschaulich dargestellt Auch ohne die theoretischen Vorkenntnisse der Kapitel aus dem ersten Teil der Diplomarbeit sollte es dem unge bten Nutzer m glich sein mAGENTa mittels der intuitiv zu bedienenden Oberfl che zu benutzen Leichte Bedienbarkeit war bei dieser interdisziplin ren Arbeit eine Hauptaufgabe Eine effiziente Befundeingabe f r den Arzt sollte durch das System erm glicht werden Die umfangreiche Parametrisierung dient zus tzlich dazu das S
12. Dank geht ebenfalls an Michael Kleinwegen f r die gewissenhafte und unerm dliche Durchsicht der Diplomarbeit Ganz speziellen Dank an unsere Eltern sowie an Annette und Sonja f r ihre Geduld und Unterst tzung ohne die diese Arbeit nicht m glich gewesen w re Die vorgestellte Arbeit ist in enger Zusammenarbeit der beiden Autoren entstanden Dennoch k nnen die nachfolgenden Kapitel wie folgt den einzelnen Autoren zugeordnet werden Kai Bullerdick Oliver Ritthoff Kapitel 4 Intelligente Agenten Kapitel 3 Radiologie Kapitel 7 Verarbeitung der Befundtexte Kapitel 5 Maschinelle Lernverfahren Kapitel 9 TokenComponentInterface Kapitel 6 Systemarchitektur Kapitel 10 Befunddokumentation Kapitel 8 DFA Generierung Kapitel 11 Benutzerhandbuch Kapitel 12 Testergebnisse Inhaltsverzeichnis 1 VORWORT INHALTSVERZEICHNIS GRUNDLAGEN 2 EINLEITUNG 2 1 ABSTRACT 2 2 AUFGABENSTELLUNG 2 3 BISHERIGE L SUNGSANS TZE 2 4 L SUNGSANSATZ DURCH EINEN SOFTWAREAGENTEN 209 AUFBAU DER DIPLOMARBEIT 3 RADIOLOGIE 3 1 BILDGEBENDE VERFAHREN IN DER RADIOLOGIE 3 1 1 Computertomographie 3 1 1 1 Verfahren 3 1 1 2 Anwendungsgebiet 3 1 2 Magnetresonanztomographie 3 1 2 1 Verfahren 3 1 2 2 Anwendungsgebiet 3 1 3 Elektronenstrahltomographie _ 3 1 3 1 Verfahren 3 1 3 2 Anwendungsgebiet 3 2 DIE RADIOLOGISCHE BEFUNDUNG 3 2 1 Die radiologische Fachsprache 3 2 2 Der radiologische Befund 3 2 2 1 Der Aufbau eines radiologischen Befun
13. T T gilt also S und Sy identische k Vorg nger besitzen und zum anderen die beiden Zust nde S und S jeweils ber Token mit identischem Label hier A in den gemeinsamen Nachfolgezustand S bergehen Die Liste der Vorg nger bzw Nachfolger Token des verbleibenden Zustandes wird um die des zu l schenden Zustandes erweitert und der Frequenzwert des verbleibenden Tokens um den des zu l schenden erh ht Zustand Se GH Zustand Q1 Q2 y y Zustand Sx Zustand 5 d 7 2 Zustand S1 Zustand S1 ES Let Abbildung 31 Mergingregel 2b 8 3 3 1 1 4 Eigenschaften des Algorithmus Wie bereits in Kapitel 5 erw hnt sind die Klasse der regul ren Sprachen sowie deren quivalenter Repr sentationsformalismus die deterministischen endlichen Automaten bekannt und ihre formalen Eigenschaften gut untersucht Diese Eigenschaften gelten insbesondere f r die von Angluin beschriebene Klasse der k reversiblen Sprachen einer Teilmenge der regul ren Sprachen 8 DFA Generierung 77 Man kann unter der Voraussetzung der k Reversibilit t einer Sprache L z B die Identifikation im Grenzwert und die Reihenfolge Invarianz f r eine gegebene Menge positiver Beispiele konkret der zur Verf gung stehenden Befundmenge garantieren Au erdem stehen im Fall der radiologischen Befundung keine zus tzlichen Informationen insbesondere in Form negativer Beispiele zur Verf gung Da der Algorithmus von Angluin au
14. Der neue Befund Der eingelesene Befund enth lt etaZustaende lenth lt folgende mindestens einen MetaTitel Exception etaTitel mehrfach mehrfach und die Option MetaAbschnitte zusammenfassen ist nicht aktiviert Zus tzlich Der neue Befund Der eingelesene Befund enth lt etaZustaende enth lt folgende zus tzlich zu den bereits Exception etaTitel zus tzlich vorhandenen Meta Zust nden mindestens einen weiteren Meta Zustand Fehlende Der neue Befund Beim eingelesenen Befund ist etaZustaende lenth lt folgende bezogen auf die aktuell Exception etaTitel nicht vorhandenen MetaZust nden mindestens ein MetaZustand nicht aufgef hrt und die Option unvollst ndige Metastruktur ist nicht aktiviert Tabelle 20 Potentielle Fehler beim Merging von MetaZust nden Die MergingRegeln auf Zustandsebene also konkret die in Kapitel 8 3 3 1 beschriebenen Regeln 1 2a 2b 3a 3aE und 3b k nnen in dem Dialog nahezu beliebig kombiniert werden So sind durch Aktivierung der entsprechenden Auswahlfelder z B auch die Regelmengen von Angluin 1 2a 2b bzw Schlimmer und Hermens 1 2a 2b 3a 3b leicht nachzubilden ber bestimmte Textfelder kann der Benutzer dabei die Anzahl der k Vorg nger siehe Definitionen in Kapitel 8 1 bez glich der Regeln 2a 2b 3a 3aE und 3b einstellen Bei der Kombination der Regelmenge hat er die Wahl zwischen der urspr nglichen Regel 3a von Schlimmer und Hermens und der erweit
15. asien 99 Briefkopf 99 Browser Ka else 102 Charakter schrie 37 charakteristische 63 Chomsky Hierarchie 47 nee 102 Client Server Paradigma seseeeseeeeeeeeeeee 101 Chp bo rd Bess 129 D Dateiauswahldialog RIES 120 lokal 0 22 02 119 ere ee 124 IR E 42 IK LE 58 Demoversion 184 DFA Generierung sen seenseennenneennennn 65 Dokumentattonsobtekt A 26 Dom nenunabh ngigkeit 13 171 184 Double Bufteng nn 149 E EmptyComponent sssseseeseseeesrsrrersserereseseee 91 equivalence querie 49 Erg0H0Mie une ann 107 F Fan Out a 2 2er Eeer 177 Farbauswahl 119 133 144 150 Fehlervermeidung 12 183 Fokustraversierung nenn 109 Index G nenn 129 Ged chtnisverlust sseseeeeeeee esene seeeeeseee see 123 generatelndex 5s ers 170 Grammatik nun sehn 47 Grammatik InferenZz 46 Spezbkanon 48 Graph ee an 143 Grundelemente des Graphen 144 H east 115 106 EE 109 Hill climbing Methode u 44 HIM tens ees 104 Hypothesenraum Strukturierung 43 Hypothesenvergleich 41 I
16. prim r auf formale Kriterien die eine objektive Bewertung der gelernten Automaten in Hinblick auf die Benutzerfreundlichkeit der entsprechenden Oberfl chen und deren Verwendbarkeit im praktischen Einsatz erm glichen Bei der Erstellung der Testreihen wurde von der Vielzahl der m glichen Parametereinstellungen des Systems abstrahiert und der Fokus der Betrachtung auf die Auswirkungen bestimmter Kombinationen von Mergingregeln gesetzt die das jeweilige Lernergebnis entscheidend beeinflussen 12 Testergebnisse 169 12 Testergebnisse 12 1 Einleitung Wie bereits erw hnt werden im folgenden die Auswirkungen bestimmter Regelmengen auf das Lernergebnis also insbesondere auf die Benutzerfreundlichkeit der jeweiligen Oberfl chen untersucht Dabei werden insgesamt acht Regelkombinationen basierend auf den Ans tzen von Angluin Schlimmer und Hermens und einer Erweiterung des letzten Ansatzes untersucht Ein wichtiges Kriterium zur formalen Evaluation des Lernerfolges ist das bereits in Kapitel 5 2 6 1 beschriebene Paradigma der Identifikation im Grenzwert Eine Methode den formalen Lernerfolg im konkreten Fall zu bewerten ist es zu berpr fen ob der entstandene DFA bergeneralisiert d h ob er ungrammatikalische S tze erzeugt Im einzelnen werden f r jede Dom ne neben dem entsprechenden Pr fixbaum die Mergingergebnisse nach Anwendung der Regelmengen von Angluin Schlimmer und Hermens sowie einer modifizierten Version der letztere
17. 11 5 2 4 3 3 1 11 5 2 4 3 3 2 11 5 2 4 3 3 3 11 5 2 4 3 3 4 11 5 2 4 3 3 5 11 5 2 4 3 3 6 11 5 2 4 3 3 7 11 5 2 4 3 3 8 11 5 2 4 3 3 9 11 5 2 4 3 4 11 5 2 4 3 4 1 11 5 2 4 3 4 2 11 5 2 4 3 4 3 11 5 2 4 3 4 4 11 5 2 4 3 4 5 11 5 2 4 3 4 6 11 5 2 4 3 4 7 11 5 2 4 4 11 5 2 4 4 1 TokenComponent Interface Die Men s Das Datei Men Neu ffnen Hinzuf gen Speichern Speichern unter Befundliste einlesen Merging Protokoll anzeigen Eigenschaften des Graphen anzeigen Beenden Das Bearbeiten Men Ausschneiden Kopieren Einf gen Das Optionen Men Die Graph Optionen Festlegen der Merging Parameter Angestrebte Kantenl nge Farbauswahl Die W rterbuch Optionen Maximale Anzahl von Eintr gen pro Seite __ Die TokenComponent Interface Optionen Anzeige Nachfolger Symbol Anzeige Steuerzeichen Mehrfaches Besuchen von Metazust nden Mehrfache Anzeige von Metatiteln__ Nach Frequenz Protokoll der TC Positionen Anzahl TokenChoice Briefkopf Brieffu Die sonstigen Optionen MetaStruktur erw nscht Sortierung der Tokens nach Frequenz __ Festlegen der Tokenizer Parameter Ersetzen von Zahlen Festlegen der Delimiter Look amp Feel Internet Verbindung vorhanden Das Hilfe Men Hilfe vii 120 120 120 121 121 121 121 122 123 123 125 126 126 127 127 127 127 128 128 130 130 132 132 132 132 132 133 133 133 133 133 134 134 134 134 135 135
18. 11 5 5 3 1 Das Datei Men 11 5 5 3 1 1 Neu Durch Anwahl dieses Men punktes werden die Eintr ge des W rterbuches entfernt Ist ein DFA gelernt worden so k nnen durch Bet tigung des Knopfes W rterbuch aus Graph die Tokens des Graphen in das W rterbuch eingetragen werden Vorher eingetragene Ersetzungen sind allerdings nicht mehr in dem W rterbuch vorhanden 11 Benutzerhandbuch 154 11 5 5 3 1 2 ffnen Ein vorher abgespeichertes W rterbuch kann hier wieder ge ffnet werden Je nach Einstellung erfolgt ein Dialog zum ffnen einer lokalen Datei oder ber das Netzwerk siehe Kapitel 11 5 2 4 3 4 7 Internet Verbindung vorhanden Das vorher vorhandene W rterbuch wird durch das neu ge ffnete ersetzt 11 5 5 3 1 3 Hinzuf gen Im Gegensatz zum ffnen eines W rterbuches kann durch den Men punkt Hinzuf gen ein W rterbuch ge ffnet werden welches das bisher vorhandene nicht berschreibt sondern mit ihm kombiniert wird Die alten Eintr ge des W rterbuches bleiben erhalten und werden durch zus tzliche aus dem gerade ge ffneten erg nzt So ist es m glich da verschiedene Benutzer ihre W rterb cher kombinieren und somit eine gemeinsame Basis schaffen 11 5 5 3 1 4 Speichern Wurde das W rterbuch schon einmal unter einem Namen gespeichert so kann es mittels dieses Men punktes wieder direkt darunter lokal abgespeichert werden 11 5 5 3 1 5 Speichern unter Dieser Men punkt ffnet einen Dateiauswahldi
19. 136 137 138 139 139 139 Inhaltsverzeichnis 11 5 2 4 4 2 11 5 3 11 5 3 1 11 5 3 1 1 11 5 3 1 1 1 11 5 3 1 1 2 11 5 3 1 2 11 5 3 1 2 1 11 5 3 1 3 11 5 3 2 11 5 3 3 11 5 3 3 1 11 5 3 3 2 11 5 3 3 3 11 5 3 3 4 11 5 3 3 5 11 5 3 3 6 11 5 3 3 7 11 5 3 3 8 11 5 4 11 5 4 1 11 5 4 1 1 11 5 5 11 5 5 1 11 5 5 2 11 5 5 2 1 11 5 5 2 2 11 5 5 2 3 11 5 5 2 4 11 5 5 2 5 11 5 5 3 11 5 5 3 1 11 5 5 3 1 1 11 5 5 3 1 2 11 5 5 3 1 3 11 5 5 3 1 4 11 5 5 3 1 5 11 5 5 3 1 6 11 5 5 3 1 7 11 5 5 3 2 11 5 5 3 2 1 11 5 6 11 5 6 1 Info Der Graph Die Elemente des Graphen Zust nde Kontextmen eines Zustands Kontextmen eines MetaZustands Tokens Kontextmen eines Tokens Kanten Die Animation des Graphen Die Werkzeugleiste Legende Verstreuen Ersch ttern L nge Zuf llig Fixieren Aufl sen Fortschritt Der MetaGraph Die Elemente des MetaGraphen Kontextmen eines MetaZustandes Das W rterbuch Die W rterbucheintr ge Die Werkzeugleiste Neuer Eintrag Ansicht Aktualisieren Graph aus W rterbuch W rterbuch aus Graph Merge Das Men Das Datei Men Neu ffnen Hinzuf gen Speichern Speichern unter W rterbuch Liste anzeigen Beenden Das Optionen Men Maximale Anzahl von Eintr gen pro Seite Das TokenComponent Interface Der MetaTitel 140 140 141 142 142 143 144 144 145 145 146 146 147 147 147 147 147 148 148 149 149 150 150 151 152 152 _ 152 152 15
20. Algorithmen von Angluin und Schlimmer Hermens zur Inferenz k reversibler Sprachen einer Teilmenge der regul ren Sprachen aus einer Menge positiver Beispiele den Befundtexten vorgestellt Zum Abschlu des Kapitels wird das Problem der bergeneralisierung im Zusammenhang mit der Inferenz k reversibler Sprachen und deren Auswirkungen auf die Qualit t des diskutiert 8 1 Definitionen In diesem Abschnitt werden einige grundlegende Definitionen eingef hrt die zum Verst ndnis dieses Kapitels von Bedeutung sind Sei eine endliche nicht leere Menge von Symbolen genannt das Alphabet Dann ist die Menge aller Strings ber dem Alphabet Die L nge eines Strings a wird mit bezeichnet Der leere String wird mit A notiert und hat die L nge 0 Die Konkatenation zweier Strings aund b wird mit ab bezeichnet 8 DFA Generierung 61 Falls ein String c ab gegeben ist so bezeichnet man a als den Pr fix und b als den Suffix von c Eine Sprache L ist eine Teilmenge von Die Menge aller Pr fixe einer Sprache L notiert man mit Pr L und definiert sie wie folgt Pr L al ab eL Die Menge der Suffixe tails von L ist definiert als T bl ab e L Eine lexikographische Ordnung der Strings ber dem Alphabet a b ordnet alle Strings aus LX zuerst nach ihrer L nge und dann gem ihres alphabetischen Wertes Somit lautet die lexikographische Ordnung ber dem Alphabet a b A a b aa ab ba bb aaa Ein klassifizierte
21. Die Voraussetzungen zur Anwendung der Regel 3a von Schlimmer und Hermens sind hingegen in diesen F llen erf llt Abbildung 33 zeigt das Ergebnis des Generalisierungsprozesses auf der Grundlage der Regeln von Schlimmer und Hermens terminal Abbildung 32 O rekursiver Automat 8 DFA Generierung 79 Abbildung 33 Automat nach Anwendung der Regeln von Schlimmer Hermens 8 3 3 1 2 1 Regel 3a Wie bereits angedeutet stellt die Regel 3a eine Modifikation der Angluin Regel 2b dar Schlimmer und Hermens verallgemeinerten das Kriterium der urspr nglichen Regel 2b von Angluin dahingehend da die betrachteten Zust nde S bzw S auch ber ein beliebiges Token A oder in den gemeinsamen Nachfolger Zustand 5 1 bergehen k nnen Im konkreten Fall m ssen au erdem die Label der Token und bereinstimmen die Zust nde S und S also einen gemeinsamen 1 Vorg nger haben ZustandS x 4 Zustand j N N X gt Zustand Sm N d X Ce Zustand S 1 Zustand S 1 Abbildung 34 Mergingregel 3a 8 DFA Generierung 80 8 3 3 1 2 2 Regel 3b Die Regel 3b auch Kleene Regel genannt verallgemeinert den DFA durch Zyklenbildung Die Tokensequenzen innerhalb der entstandenen Zyklen k nnen dabei als optional betrachtet werden Schlimmer und Hermens stellten diese in der graphischen Benutzeroberfl che dem als Checkboxes dar die maximal einmal ausgew hlt w
22. Identifikation durch Aufz hlung 46 Identifikation im Grenzwert ssseeeeeeeeeeeeee 44 Indexdateien sn 121 Induktives Lemen 39 Inferenzproblem Spezifikation eersensssnsennennnenneenennnn 40 Inferenzverfahren nn 41 Konsistenz Ae EEN 42 Nerl lbchket essen 42 Informationsagenten e sseseeeereereereeerereeeeee 35 Intelligente Softwareagenten 34 Internets en o a 102 Ire EE 102 inverse Transitionsfunktion ee 62 J Java 2 Platform een 106 Java Foundation 106 EVER EE 102 K Kantenl nge optimale 133 148 151 Kategorisierung nenn 12 183 197 K Nachtolger ENEE 2802 63 K sten een 145 Kommunikation 224 snernensensenneennnenn 36 Komprmerung 124 Komprimierungsgrad nn 174 Kontextmen MetaZustand 146 153 Token ea 147 Zustand Hure 145 Kontext Sensitivit t eeeessnessnensenseenneenn 107 Konvergenzpunkt 42 Kooperation 36 Kooperationsagenten 35 kooperative 13 184 k Vorg nger nese nee 63 L Legende Graph 149 Lernalgorithmen 2242 240220 49 Algorithmus von Angluin 75 Reseller 76 Regel ignoreiert 76 77 Erweite
23. Token bergang zwischen den Zust nden 1 m Sofortige Anwendung der Regeln Abbrechen Abbildung 61 MergingDialog Zun chst kann der Benutzer beim Merging von Meta Zust nden zwischen dem pr skriptiven und dem deskriptiven Ansatz ausw hlen Um das deskriptive Verfahren auszuw hlen mu er das Auswahlfeld deskriptives MetaZustandsMerging selektieren Die beiden nachfolgenden Parameter erlauben eine gewisse Flexibilisierung bei der Festlegung der MetaStruktur der einzulesenden Befundtexte Das Konzept der Meta Struktur und die beiden Merging Verfahren auf Meta Ebene werden im Detail in Kapitel 8 3 1 bzw 8 3 2 vorgestellt 11 Benutzerhandbuch 129 So kann der Benutzer bestimmen da beim Einlesen der Befundtexte auch Befunde mit einer unvollst ndigen MetaStruktur akzeptiert werden siehe Kapitel 8 3 2 4 Diese Option kann durch Aktivierung des Auswahlfeldes unvollst ndige MetaStruktur ausgew hlt werden Desweiteren kann festgelegt werden da MetaAbschnitte mit identischen MetaTiteln innerhalb eines Befundes zusammengefa t werden sollen siehe Kapitel 8 3 2 5 Durch Anwahl des Feldes MetaAbschnitte zusammenfassen kann diese Option aktiviert werden Tabelle 20 zeigt drei potentielle Fehler im Zusammenhang mit dem Merging von MetaZust nden die jeweiligen Fehlerausgaben sowie eine kurze Erl uterung der Fehler Exception Fehlertext Beschreibung ehrfache
24. re da es nat rlich auch m glich ist lesend auf das lokale Dateisystem zuzugreifen siehe Kapitel 11 5 2 3 2 2 ffne externe Datei aus dem Netzwerk Ist das Auswahlfeld nicht selektiert so wird bei dem ffnen und Speichern von Dateien auf das lokale Dateisystem zugegriffen siehe Kapitel 11 5 2 3 2 1 ffne lokale Datei bzw 11 5 2 4 1 4 Speichern 11 5 2 4 4 Das Hilfe Men Das Hilfe Men hat zwei Eintr ge Die Punkte Hilfe und Info 11 5 2 4 4 1 Hilfe Sobald dieser Men punkt angew hlt wird erscheint in dem im Hintergrund des Hauptfensters laufenden Browser der Hilfetext zu mAGENTa Dies ist ein hnliches Vorgehen wie die Darstellung der Indexdateien bei dem ffnen von Dateien ber das Netzwerk siehe Kapitel 11 5 2 3 2 2 ffne externe Datei aus dem Netzwerk Durch den Hilfetext werden die f r die Benutzung wichtigen Funktionen erkl rt und dem Benutzer ein ausf hrliches Nachschlagewerk ber mAGENTa zur Hand gegeben Durch diese Online Hilfe ist der Benutzer nicht mehr darauf angewiesen w hrend der Benutzung des Systems ein gedrucktes Handbuch zur Verf gung zu haben 11 Benutzerhandbuch 140 http homepage ruhr uni bochum de kai bullerdick Diplomarbeit index htmi Das Applet Benutzerhandbuch Hilfesette In diesem Kapitel wird die Benutzung des mRAGENTa Systems so wie es schlie lich realisiert worden ist anschaulich dargestellt Auch ohne die theoretisc mAGENTa mittels Datei Opti Leichte
25. wenn eine TokenComponent bet tigt wird Die Erkl rung f r die einzelnen Symbole l t sich auch im TCI ber den Knopf Legende aus der Werkzeugleiste aufrufen siehe Kapitel 11 5 6 4 1 Legende 11 5 2 4 3 3 2 Anzeige Steuerzeichen Sollte dieses Auswahlfeld selektiert sein werden im TCI die Steuerzeichen auch Escape Sequenzen genannt in der Standardnotation der C Escape Sequenzen dargestellt Wird der Wert des Auswahlfeldes selektiert oder nicht selektiert ver ndert und ist gleichzeitig das TCI Fenster ge ffnet so werden automatisch die Beschriftungen der TokenComponents mit den Steuerzeichen versehen oder diese entfernt Dies folgt dem 11 Benutzerhandbuch 133 Prinzip der automatischen Synchronisation siehe Kapitel 11 4 2 Automatische Synchronisation 11 5 2 4 3 3 3 Mehrfaches Besuchen von Metazust nden Ein MetaZustand kann aufgrund eines Zyklus mehrfach besucht werden Ist dieses nicht gew nscht d h es sollen MetaZust nde nur genau einmal besucht werden k nnen so ist diese Option zu deselektieren Wird unter dieser Konfiguration bei Eingabe in das TCI ein MetaZustand ein zweites Mal besucht so wird automatisch der n chste noch nicht besuchte MetaZustand aufgesucht Ist diese Option jedoch selektiert so Kann ein MetaAbschnitt dessen MetaZustand sich in einem Zyklus befindet beliebig oft durchlaufen werden 11 5 2 4 3 3 4 Mehrfache Anzeige von Metatiteln Ist die vorige Option selektiert so wird bei j
26. 1 Legende Die Bet tigung dieses Knopfes ffnet einen Dialog der die Darstellung der einzelnen Elemente des Graphen erl utert Der Grant Zustand Moma Ein normales Token Ein normaler Zustand zeien Ein selektiertes Token Ein selektierter Zustand fixiertes Token Eine Kante won einem Gm ZD 23 Ein fixierter Zustand Zustand zu einem Tokeni Cep Es Eine Kante won einem En Mats Zustand Token zu einem Zustand Der Terminal Zustand Abbildung 75 Legende des Graphen Auf der linken Seite des Dialoges sind die verschiedenen Darstellungsformen der Zust nde zu sehen auf der rechten die der Tokens und darunter die der Kanten Die unterschiedliche Farbgebung dient zur besseren Unterscheidung der Elemente und kann jeweils individuell eingestellt werden siehe Kapitel 11 5 2 4 3 1 3 Farbauswahl Wird die Farbe eines Elementes ge ndert so ndert sich synchron dessen Darstellung in dem Graphen und auch in der Legende 11 Benutzerhandbuch 147 11 5 3 3 2 Verstreuen Der Knopf Verstreuen dient dazu die Knoten des Graphen zuf llig innerhalb des Fensters zu verteilen Eine zuf llige Verteilung der Knoten bietet sich an um nach Aufruf des Graph Fensters eine ungeordnete aber gleichm ige Verteilung zu erlangen Anschlie end kann der Animations Algorithmus besser die Ordnung des Graphen herbeif hren als wenn die Knoten zu Beginn nur in einem kleinen Bereich des Fensters w ren 11 5 3 3 3 Ers
27. 11 Benutzerhandbuch 167 11 7 generatelndex generatelndex ist eine Java Application die HTML Indexdateien zu Verzeichnissen generieren kann F r ein oder mehrere Verzeichnisse werden rekursiv Indexdateien generiert die als Inhalt Verweise auf die einzelnen Dateien in dem Verzeichnis haben Es wurden hiermit Indexdateien f r die in Tabelle 14 Verzeichnisse auf dem Server angegebenen Verzeichnisse erstellt damit beim ffnen von Dateien ber das Netzwerk eine einfachere Auswahl der Dateien erm glicht wird siehe Kapitel 11 5 2 3 2 2 ffne externe Datei aus dem Netzwerk In Abbildung 55 ffne externe Datei mittels eines Internet Browsers ist im Hintergrund eine Indexdatei f r ein Verzeichnis mit EBT Befunden zu sehen Auswertung In diesem Kapitel werden die Testergebnisse aus drei unterschiedlichen radiologischen Dom nen CT HWS CT LWS und MRT LWS im Umfang von insgesamt ca 250 Befunden betrachtet Ziel der nachfolgenden Testreihen war es zum einen den Nachweis der Dom nenunabh ngigkeit des Systems zu erbringen und zum anderen das subjektive Kriterium der Benutzerfreundlichkeit der jeweils erzeugten Oberfl chen im Kontext der radiologischen Befundung quantitativ zu erfassen Dabei konzentrieren sich die folgenden Untersuchungen in Erg nzung zu den in der Einleitung der Diplomarbeit abstrakt formulierten Anforderungen an das System wie z B Kategorisierung Vereinheitlichung Fehlervermeidung kooperative Nutzung etc
28. 1377184 1 1671883 22030 0 1262 0 1120 0 33 0 449 0 118 0 33 0 2 0 0 0 14 0 167 0 311760 0 949 9092 1 1267858 1 1315273 13180 0 1340 0 1186 0 25 0 474 0 101 0 48 0 1 0 0 0 12 0 162 0 516326 0 871 9092 1 1298482 1 2140282 15100 0 1347 0 1187 0 5 0 479 0 96 0 32 0 0 0 0 0 8 0 136 0 862383 0 864 9092 1 1347936 1 2315814 18730 0 1373 0 1212 0 5 0 484 0 111 0 22 0 0 0 0 0 8 0 141 0 798066 0 838 9092 1 1328382 1 2192127 16860 0 1447 0 1280 0 11 0 495 0 100 0 36 0 2 0 0 0 13 0 151 0 642817 0 764 9092 1 1304687 1 1954379 21420 0 1481 0 1312 0 11 0 506 0 92 0 23 0 0 0 0 0 7 0 122 0 532161 0 730 9092 1 128811 1 1872131 16750 0 1496 0 1324 0 1 0 507 0 78 0 32 0 0 0 0 0 8 0 118 0 345113 0 715 9092 1 1299094 1 1895999 16860 0 1579 0 1401 0 29 0 536 0 80 0 43 0 0 0 0 0 12 0 135 0 424853 0 632 9092 1 1270521 1 1910279 Abbildung 58 MergingProtokoll Nur Werte 11 Benutzerhandbuch 125 Das Protokoll wird bei jedem Lernproze um weitere Daten erg nzt Die folgende Tabelle gibt Auskunft ber die erhobenen Daten Eintr ge des Mergingprotokolls Fortlaufend Zuwachs der Zuwachs der Zuwachs der Zuwachs der Anzahl der jetzt vorhandenen Anzahl der jetzt vorhandenen Worte Zuwachs der Wortanzahl absolut Zuwachs der Wortanzahl prozentual Anzahl der Aufrufe der Mergingregel Anzahl der Aufrufe der Mergingregel Anzahl der Aufrufe der Mergingregel Anzahl der Aufrufe der Mergingregel Anzahl gesam
29. 173 e TokenComponent Interface Legenge Ersteiten Beengen Zur ck Segment L4 5 W hlen Sie Ihre Eingabe ur e 1 Spondylosis Ligamenta flava mO im kleinen O eine rechten Eine O Regelrechter Abschlu ng 7 foraminal reichend einem O zystische Aufweitung L sichere Abgrenzbarkeit bandscheiben qun Umschriebene sklerosierte Dichteminderung Ligamentum flavum foraminalem Anteil Sagittaldurchmesser unter 1 cm liegt mO vor allen Dingen O breitbasigen medid Degenerative Ver nderung 1 extraforaminal reichende M degenerative verkalkten Anteilen L kranial umgeschlagenen Anteilen XO Hinweis auf einen Abbildung 89 Benutzeroberfl che eines bergeneralisierenden Automaten Abbildung 89 zeigt einen Ausschnitt aus einer entsprechenden Oberfl che mit hohem Zyklenanteil Es ist unschwer zu erkennen da ein effektiver Befundungsvorgang mit einer derartigen Benutzeroberfl che nicht zu realisieren ist Das vorliegende Ergebnis dieser Testreihe deckt sich dabei sowohl mit den subjektiven Bewertungen der jeweiligen Oberfl chen als auch mit den theoretischen Erwartungen bez glich der Auswirkungen eines hohen Zyklenanteils 12 Testergebnisse 174 12 2 4 Durchschnittlicher Fan Out Der durchschnittliche Fan Out der erzeugten DFA ist ein weiterer Faktor der sich unmittelbar auf die Benutzerfreundlichkeit des Systems auswirkt Der Fan
30. Agenten auch m glich die gew nschte CD bei einer Internetauktion oder einem virtuellen Marktplatz von anderen Softwareagenten oder realen Bietern zu erstehen 4 Intelligente Softwareagenten 35 4 2 Charakteristika Um von einem intelligenten Softwareagenten reden zu k nnen m ssen einige Charakteristika erf llt sein die ihn gegen herk mmliche Softwareprodukte abgrenzen Zu unterscheiden sind hier interne und externe Charakteristika Auch hier sind die Grenzen nicht eindeutig Interne Charakteristika betreffen nur den Agenten und seinen Aufbau Externe beschreiben wie der Agent mit seiner Umwelt umgeht Als Umwelt f r Agenten k nnen andere Agenten Interaktion mit dem Benutzer oder andere Informationsquellen dienen 4 2 1 Reaktivit t Der Agent reagiert angemessen auf seine Umwelt Hierf r mu er eine geeignete Repr sentation und Sensoren aufweisen 4 2 2 Proaktivit t Zielorientiertheit Der Agent reagiert nicht nur auf Umweltver nderungen sondern agiert auch selbst ndig Hierzu ben tigt er 1 ein komplexes Ziel f r dessen Erf llung er aktiv wird 4 2 3 Schlu folgerunngs Lernf higkeit Die Intelligenzleistung eines Agenten beruht im wesentlichen auf seiner internen Wissensbasis und der F higkeit daraus Schlu folgerungen zu ziehen sowie der F higkeit zu lernen und sich nderungen der Umwelt anzupassen 4 2 4 Autonomes Handeln Agenten sollten weitgehend autonom d h ohne unn tige Interaktion mit der
31. Anwendungsgebiet Durch die verk rzte Scanzeit findet das Verfahren unter anderem Anwendung in der Untersuchung von nicht kooperativen Patienten P diatrie Notfalldiagnostik Des weiteren wird das Verfahren bei der Studie an bewegten Organen angewendet F r derartige Untersuchungen ist die konventionelle Computertomographie ungeeignet da in diesen F llen h ufig Bewegungsartefakte auftreten Der Hauptanwendungsbereich der Elektronenstrahltomographie ist jedoch die Diagnostik der Funktion und der Morphologie des Herzens und der Koronargef e Durch die geringen Scanzeiten wirken sich die Pulsationen des Herzens w hrend der Untersuchung nicht st rend aus Neben pathologischen Ver nderungen z B Kalzifikationen k nnen mittels Computerauswertung auch quantitative Funktionsparameter wie z B Perfusion Kammervolumen etc ermittelt werden 3 Radiologie 24 Abbildung 8 Darstellung der Herzphasen mittels EBT 3 2 Die radiologische Befundung 3 2 1 Die radiologische Fachsprache Sprache ist allgemein definiert als ein System von gesprochenen bzw geschriebenen Zeichen zum Zwecke der Kommunikation die nach festgelegten Gesetzm igkeiten zu gr eren Einheiten wie etwa Silben W rtern Phrasen S tzen oder ganzen Texten kombiniert werden Seelos et al 1997 Zur Einordnung der radiologischen Fachsprache ist eine generelle Aufteilung der Sprache in nat rliche und formale Sprachen hilfreich Nat rliche Sprachen sin
32. Beispiele auf die Menge der positiven und negativen Beispiele abbildet Der Algorithmus von Oncina et al 1992 ben tigt hingegen keine negativen Beispiele Grundlage dieses Verfahrens ist die sogenannte charakteristische Menge die Informationen ber die Zust nde und Transitionen des Ziel Automaten beinhaltet f r eine formale Definition der charakteristischen Menge siehe Kapitel 8 1 Die 5 Maschinelle Lernverfahren 48 Identifikation des Ziel Automaten wird dadurch gew hrleistet da die gegebenen Beispiele diese charakteristische Menge enth lt Eine bereits erw hnte M glichkeit zus tzliche Information zu erhalten ist durch sogenannte membership bzw equivalence queries gegeben Eine membership querie befragt ein Orakel nach der Klassifikation f r ein Beispiel x Im Fall der Inferenz endlicher Automaten k nnte eine solche Anfrage lauten Wmd der Satz x von der Sprache L erzeugt bzw alternativ Wird der Satz x DFA akzeptiert Eine equivalence querie in Bezug auf eine gegebene Hypothese H w re z B eine Frage der Form Ist die gegebene Hypothese H quivalent mit der gesuchten Hypothese H Das Orakel antwortet wiederum vor dem Hintergrund endlicher Automaten mit ja falls der aktuelle Automat M quivalent ist mit dem gesuchten Automaten M andernfalls antwortet er mit nein und liefert einen String w zur ck der von M nicht aber von M akzeptiert wird Formal gilt f r den String we
33. Browser ist der AppletViewer der Java 2 Platform von Sun Microsystems Dieses Programm kann keine kompletten HTML Seiten darstellen sondern nur die in sie eingebetteten Java Applets ausf hren F r die Benutzung von mAGENTa reicht dies aber vollkommen aus da nur in geringem Ma e auf HTML Seiten w hrend der Benutzung von mAGENTa zugegriffen werden mu Als besonderer Komfort mu mAGENTa nicht direkt ber ein Netzwerk verwendet werden sondern kann auch lokal auf einem Arbeitsplatzrechner ausgef hrt werden Dieser ist dann Client und Server zugleich Um als Client mit mAGENTa zu arbeiten mu in den Browser die Adresse des Servers und der HTML Seite in die mAGENTa eingebettet ist eingegeben werden Sobald die Seite und das Applet ber das Netzwerk geladen worden sind kann mAGENTa in Betrieb genommen werden 11 Benutzerhandbuch 101 11 1 1 1 Sicherheitsbeschr nkungen Bei der Verbindung eines Computers mit einem Netzwerk insbesondere dem Internet ist dieser Computer prinzipiell auch anderen Computern die an das Netzwerk angeschlossen sind zug nglich Dies k nnte nun b swilligerweise dazu genutzt werden Daten auf diesem Computer zu manipulieren oder zu zerst ren Damit diese Vorgehensweise nicht durch Java Applets geschieht die sich ein ahnungsloser Nutzer ber ein Netzwerk auf seinen Computer l dt ist in die Browser eine sogenannte sandbox integriert Dies bedeutet da herk mmliche Java Applets nur innerhalb e
34. K reversiblen Sprachen Ahonen 1996 fa t die Gemeinsamkeiten dieser im folgenden betrachteten Sprachklassen wie folgt zusammen Our assumption is that the grammars used in structured documents have only limited context in the following sense If a sufficiently long sequence of elements occur in two places in the examples the elements that can follow this sequence are independent of the position of the sequence in the 5 Maschinelle Lernverfahren 50 document The classes of k reversible languages K contextual languages and K h contextual languages satisfy this condition in varying degrees Die im vorliegenden System verwendeten Lernverfahren basieren auf den Algorithmen von Angluin zur Inferenz k reversibler Sprachen Aus diesem Grund wird diese Sprachklasse ausf hrlich im Kapitel 8 3 3 1 diskutiert 5 3 5 1 1 k kontextuelle Sprachen Die Intuition bei k kontextuellen Sprachen ist da aus dem Auftreten zweier identischer String Sequenzen der L nge k folgt da die nachfolgenden Elemente der Sequenz in beiden F llen bereinstimmen Muggleton 1990 gibt dazu folgende Definition der k kontextuellen Sprachen A regular language is k contextual for all strings u U2 w w and if and only if and u gt vw are in L and k then 3 Neben der formalen sprachlichen Beschreibung dieser Sprachklasse ist auch eine Deutung in der Terminologie der endlichen Automaten m glich Hie
35. L M Des weiteren wurden eine Reihe von Subklassen regul rer Sprachen untersucht z B die Klassen der k kontextuellen bzw der k reversiblen Sprachen Diese Klassen unterliegen nicht mehr den o g Einschr nkungen und sind f r viele Anwendungen noch ausdrucksstark genug Der im vorliegenden System gew hlte Ansatz geht bei der Inferenz im brigen von einer solchen Teilmenge der regul ren Sprachen konkret von den k reversiblen Sprachen aus 5 3 5 Lernalgorithmen f r regul re Sprachen Zur bessern Einordnung der im System verwendeten Methoden in die Klasse der Lernverfahren f r regul re Sprachen gibt Abbildung 17 einen Einblick in die Klasse der exakten Lernmethoden Die Ausf hrungen beschr nken sich dabei auf einen sehr begrenzten f r die Einordnung relevanten Ausschnitt aus der Vielzahl der Methoden Auf die Beschreibung heuristischer Verfahren zur Grammatik Inferenz wie zum Beispiel auf der Grundlage eines konnektionistischen bzw stochastischen Ansatzes oder Verfahren auf der Basis genetischer Algorithmen wird in diesem Zusammenhang verzichtet Alle nachfolgend beschriebenen Verfahren basieren auf dem Paradigma der Identifikation im Grenzwert und die betrachtete Hypothesensprache ist die Klasse der endlichen Automaten 5 Maschinelle Lernverfahren 49 exakte Methoden klassifizierte positive Beispiele Beispiele K h kontextuelle Sprachen k kontextuelle Sprachen k reversible Sprachen Abbildung 17
36. Quotienten Automaten im Sinne der Definition und entstehen aus dem Pr fix Automaten durch Merging von Zust nden die zum gleichen Block einer Partition geh ren Ein Quotienten Automat ist allgemeiner als ein Quotienten Automaten falls durch eine Zusammenfassung von Bl cken von entstanden ist Aufgrund dieser Relation l t sich ein partiell geordneter Suchraum erzeugen Dieser Suchraum besteht aus der Potenzmenge der Zust nde des Pr fix Automaten und ist somit exponentiell in der Anzahl der Zust nde 8 DFA Generierung 65 Wie bereits in Kapitel 5 diskutiert setzt an dieser Stelle der im System verwendete Algorithmus an Der Ansatz ist dabei die Klasse der zu lernenden deterministischen Automaten einzuschr nken Dabei wird ein auf den Arbeiten von Angluin 1983 und Schlimmer et al 1993 basierender Algorithmus zur Inferenz von k reversiblen Sprachen verwendet der es erm glicht den eingeschr nkten Suchraum in polynomieller Zeit zu bearbeiten Die Forderung da sich der gesuchte Automat mit minimaler Anzahl von Zust nden im betrachteten Hypothesenraum befindet kann garantiert werden wenn die vorliegende Menge positiver Beispiele S strukturell vollst ndig ist siehe hierzu auch Dupont et al 1994 Diese Eigenschaft ist im Falle des Pr fix Automaten gegeben Der Pr fix Automat eignet sich im Besonderen als Ausgangspunkt f r die Erzeugung des Verbandes da er die speziellste Hypothese ist die konsistent
37. Schmidt H Grassme U Der sonographische Befund aus dem Computer in Deutsches rzteblatt Nr 85 S 443 448 1988 Hopcroft J Ullman Einf hrung in die Automatentheorie formale Sprachen und Komplexit tstheorie 1 Auflage Addison Wesley 1988 Literaturverzeichnis Kr ger 1999 Kuhn 1994 Kuhn 1996 Langenscheidt 1991 Leiner et al 1998 Lipinski 1999 Lissner et al 1992 L th 1998 Meyer 1998 Mitchell 1997 Muggleton 1990 Morik 1997 Morik 1999 Oncina et al 1992 Parekh et al 1998 PG 281 1996 193 Kr ger Guido GoTo Java 2 Addison Wesley Longman 1999 Kuhn K et al Strukturierte Befunderstellung f r die Oberbauchsonographie Erfahrungen und Perspektiven in Ultraschall Klinische Praxis Nr 9 S 43 46 1994 Kuhn K Die elektronische Befund und Bildokumentation in der Sonographie in Radiologe Nr 36 S 47 50 1996 Langenscheidt Taschenw rterbuch Englisch 20 Auflage Langenscheidt 1991 Leiner F Gaus W Haux R Medizinische Dokumentation 2 Auflage Schattauer 1998 Lipinski Einf hrung in die medizin technische Informatik Oldenbourg 1999 Lissner J Fink U Radiologie I 3 Auflage Ferdinand Enke Verlag 1992 L th Tim Technische Multi Agenten Systeme Carl Hanser Verlag 1998 Meyer Andre JFC 1 1 mit Java Swing 1 0 Addison Wesley 1998 Mitchell Tom Machine Learning McGraw Hill 1997 Muggleton S I
38. Sequenzen 93 Tabelle 11 Briefkopf 97 Tabelle 12 Brieffu 97 Tabelle 13 HTML Tag f r das Applet Tabelle 14 Verzeichnisse auf dem Server Tabelle 15 Die Fenster mMAGENTa Tabelle 16 Fensterfunktionalit t Tabelle 17 potentielle Fehler beim Einlesen eines Befundes Tabelle 18 Eintr ge des Mergingprotokolls Tabelle 19 Die Zwischenablage Operationen Tabelle 20 Potentielle Fehler beim Merging von MetaZust nden Tabelle 21 Die f rbbaren graphischen Elemente Tabelle 22 Grundelemente des Graphen Tabelle 23 Kontextmen eines Zustandes Tabelle 24 Kontextmen eines MetaZustandes Tabelle 25 Kontextmen eines Tokens Tabelle 26 Der Graph Algorithmus Tabelle 27 Kontextmen eines MetaZustandes im MetaGraphen Tabelle 28 Bestandteile des vollst ndigen Textes 102 103 107 108 116 125 127 129 130 141 143 144 144 145 150 164 Literaturverzeichnis Adlassnig 1993 Ahonen 1996 Altenkr ger et al 1992 Angluin 1983 Angluin et al 1983 Beran 1984 Bernauer 1991 Berner et al 1999 Berwick et al 1987 Boegl et al 1995 Burgener et al 1997 Caglayan et al 1997 Comer 1999 Adlassnig K P Wissensbasierte Entscheidungsunterst tzung in der Medizin 1993 Ahonen Helena Generating grammars for structured documents using grammatical inference methods Dissertation Universit t Helsink
39. Struktur der Befunde hinsichtlich der Abfolge einzelner Abschnitte zu beschreiben im zweiten Fall hingegen findet der eigentliche Lernvorgang auf der syntaktischen Ebene der Befundinhalte einzelner Abschnitte statt Einen anderen Schwerpunkt setzte im Gegensatz dazu H Ahonen die sich in ihrer Dissertation Ahonen 1996 vor allem auf den Aufbau strukturierter Texte z B W rterb cher Enzyklop dien etc konzentrierte und dabei von den Inhalten einzelner Abschnitte abstrahierte Zum besseren Verst ndnis der folgenden Abbildungen sei darauf hingewiesen da ein Kreis jeweils einen Meta Zustand darstellt Dieser Zustand hat die Eigenschaft Start Zustand eines Meta Abschnittes zu sein und diesen im DFA zu repr sentieren Jedem Meta Zustand ist ein entsprechender Bezeichner Meta Titel zugeordnet Ein Rechteck ist als Abstraktion f r die Menge aller von M erreichbaren und somit f r diesen Abschnitt relevanten Zust nde im Rahmen des Lernverfahrens zu verstehen Die 8 DFA Generierung 69 Bezeichnung der Abschnitte z 0 ist dabei lediglich ein Hilfsmittel zur Vereinfachung der Darstellung Im folgenden werden die beiden Mergingverfahren auf der Ebene der Meta Struktur beschrieben Die beiden Regeln ber cksichtigen dabei in jeweils unterschiedlichem Grad die Meta Struktur der verwendeten Befunde Den Ausgangspunkt des Mergingvorganges bildet dabei der erste eingelesene Befund der bereits die vollst ndige Menge der Abschnitte enth
40. Tabelle 19 Die Zwischenablage Operationen 11 5 2 4 2 1 Ausschneiden Der vorher mit der Maus oder der Tastatur selektierte Text wird durch diese Operation in die Zwischenablage kopiert und anschlie end aus dem gesamten Text gel scht 11 5 2 4 2 2 Kopieren Diese Operation arbeitet wie Ausschneiden mit dem Unterschied da der selektierte Text erhalten bleibt 11 5 2 4 2 3 Einf gen Wurde ein Text durch die Operationen Ausschneiden oder Kopieren in die Zwischenablage gebracht auch aus anderen Anwendungen so kann dieser Text durch die Einf gen Operation in das Textfeld siehe 11 5 2 1 Das Textfeld f r die Befundeingabe eingef gt werden Die Einf gung findet immer an der Position der Schreibmarke statt Sollte bisher noch kein Text in das Textfeld eingegeben worden sein und somit keine Schreibmarke sichtbar sein so erscheint der eingef gte Text am Anfang des Feldes Die oben benannten Operationen des Men s sind auch betriebssystemabh ngig ber Tastatur Shortcuts durchf hrbar z B f r Windows Betriebssysteme Strg X f r Ausschneiden Strg C f r Kopieren und Strg V f r Einf gen 11 5 2 4 3 Das Optionen Men Das Optionen Men stellt umfangreiche Konfigurationsm glichkeiten f r mAGENTa zur Verf gung Hier kann eingestellt werden wie sich das System im weiteren Verlauf verhalten soll z B Einstellungen f r den Lernproze au erdem kann hier Einflu auf 11 Benutzerhandbuch 128 das Erscheinungsbild von einz
41. Umwelt agieren k nnen da sie einem etwaigen Benutzer Arbeit abnehmen und nicht viele Handlungsentscheidungen von ihm treffen lassen sollen 4 2 5 Kommunikation Kooperation Kommunikation bezeichnet die F higkeit eines Agenten mit seiner Umwelt Informationen auszutauschen Wird die Kommunikation auf einer h heren Ebene betrieben und kann durch diese Interaktion mit der Umwelt gemeinsam eine Aufgabe gel st werden so wird auch von Kooperation gesprochen 4 2 6 Mobilit t Mobilit t ist die F higkeit eines Agenten sich selbst innerhalb eines Netzwerkes zu bewegen 4 Intelligente Softwareagenten 36 4 2 7 Charakter Insbesondere f r Agenten die ber ein hohes Ma an Interaktion mit realen Personen verf gen ist es sinnvoll diesen nicht nur ein menschliches Erscheinungsbild zu geben sondern dies auch durch menschliche Charaktereigenschaften und Kommunikation von Emotionen zu unterstreichen 4 3 Einflu gebiete Die oben aufgef hrten Charakteristika spiegeln wieder da die Agententechnologie Ergebnisse aus vielen verschiedenen Forschungsgebieten nutzt und auch ben tigt um sich weiterzuentwickeln Dies wird in der folgenden Abbildung verdeutlicht Entscheidungs x theorie Netzwerke ee Kommunikation _ p Autonomie i Mobilit t wi 4 Lernf higkeit N Charakteristika Kommunikation Proaktivit t verteilte K nstliche ig Kooperation f s K nstliche Ne KE Int
42. Version 1 2 unterst tzen gt lt APPLET gt Tabelle 13 HTML Tag f r das Applet Wie zu sehen ist gibt es hier insgesamt sechs Parameter die der Browser zur Darstellung des Applets ben tigt ARCHIVE Magenta jar Das ist der Verweis auf die JAR Java ARchive Datei in der sich die mMAGENTa Klassen befinden Eine JAR Datei ist grob betrachtet eine kKomprimierte Datei in der sich weitere Dateien insbesondere Klassendateien befinden Das hat den Vorteil da neben der geringeren Gr e nur ein HTTP Request ben tigt wird um die ben tigten Klassendateien bei mAGENTa insgesamt 106 zu bertragen Dadurch wird die Geschwindigkeit erh ht und die Netzlast betr chtlich vermindert Die Datei Magenta jar mu sich in demselben Verzeichnis wie die HTML Seite befinden da der Browser sie sonst nicht findet es sein denn es ist eine relative oder absolute Adressierung auf die JAR Datei angegeben CODE ProjektApplet class Dies ist die Referenz auf die Applet Klasse von mAGENTa Dem Browser wird hier mitgeteilt da dies die Klasse ist die zuerst aufgerufen werden soll Da vorher der ARCHIVE Parameter angegeben wurde mu sich diese Datei in der JAR Datei Magenta jar befinden Diese Klasse ruft direkt oder indirekt alle anderen Klassen von mAGENTa auf WIDTH 130 HEIGHT 80 ALIGN MIDDLE 11 Benutzerhandbuch 103 Diese drei Parameter dienen zur Formatierung des Applets innerhalb des Browser
43. aufgesammelt und vor bzw hinter die Beschriftung des TokenButtons geschrieben 9 3 2 TokenChoice F r eine bessere bersichtlichkeit werden TokenButtons mit gleichem Start und Endzustand ab einem einstellbaren Schwellenwert in einer Aufklappliste der sogenannten TokenChoice zusammengefa t Die Anzahl ab wann TokenButtons zusammengefa t werden sollen ist voreingestellt auf 5 hier 3 aber beliebig im ganzzahligen Bereich nderbar Die TokenChoice dient der bersichtlichkeit damit nicht zu viele Komponenten gleichzeitig dargestellt werden Token v Abbildung 43 TokenChoice 9 3 3 EmptyComponent Da die gelernten Befunde evtl nicht alle F lle abdecken ist es wichtig da der Benutzer einfach Erg nzungen am DFA vornehmen kann indem er einen weiteren Text eingeben kann ohne einen kompletten Befund eingeben zu m ssen neue Tokens Abbildung 44 EmptyComponent F r diese gezielte Modifikation wird dem Benutzer im TCI eine graphische Komponente geboten die als EmptyComponent bezeichnet wird Eine EmptyComponent repr sentiert im eigentlichen Sinne keine Tokens des DFA sondern dient dazu neue Tokens aufzunehmen die vom Benutzer gezielt eingegeben werden k nnen Daf r enth lt sie ein Textfeld f r Erg nzungen 9 Das TokenComponent Interface 90 Diese werden direkt in den DFA integriert und zwar hinter den Zustand den der ZustandsRahmen repr sentiert in dem sich die EmptyComponent
44. ber hinaus ein Optionen Men 11 5 2 4 1 Das Datei Men Die Eintr ge des Datei Men s des Hauptfensters beziehen sich jeweils auf den gesamten Graphen bzw das gesamte System 11 Benutzerhandbuch 121 11 5 2 4 1 1 Neu Der Men punkt Neu veranla t mAGENTa dazu das bisher gelernte zu vergessen Der Graph wird aus dem Speicher gel scht und s mtliche Parameter auf die Voreinstellungen siehe Anhang Voreinstellungen zur ckgesetzt hnlich verh lt es sich bei dem Bet tigen des Knopfes Neustart vgl Kapitel 11 5 1 Start des Applets mit dem Unterschied da nicht alle brigen Fenster geschlossen werden 11 5 2 4 1 2 ffnen Mit diesem Men punkt kann ein Graph eingelesen werden Mit dem Unterschied da die Graphdatei die Endung graph haben mu gelten die gleichen Ausf hrungen wie in Kapitel 11 5 2 3 2 Befund ffnen Sollte vorher schon einmal ein Graph ge ffnet oder generiert worden sein so wird er durch den neu eingelesenen ersetzt Der Dateiname der aktuell ge ffneten Graphen wird anschlie end in der Titelzeile des Hauptfensters angezeigt In der Statuszeile wird nach dem ffnen des Graphen zur Information die Dauer des Vorganges sowie die Anzahl der Zust nde und der Tokens angezeigt 11 5 2 4 1 3 Hinzuf gen Das ffnen eines Graphen hat Ged chtnisverlust zur Folge Damit mAGENTa aber auf den bisherigen Erfahrungen aufbauend weiterlernen kann gibt es den Men punkt Hinzuf gen Mit
45. beschriebene Effekt soll anhand der nachfolgenden Befunddaten verdeutlicht werden Untersuchung 02 02 1998 Elektronenstrahltomographie des Herzens Untersuchung 19 07 1999 Elektronenstrahltomographie des Herzens Untersuchung 12 12 1999 Elektronenstrahltomographie des Herzens Untersuchung 03 04 1998 Elektronenstrahltomographie des Herzens Der Mergingvorgang erfolgt dabei auf Basis der Regelmenge von Angluin Regeln 1 2a und 2b und einem k Vorg ngerwert von 2 TokenComponent Interface Ioj x Legende Erstellen Beenden Untersuchung W hlen Sie Ihre Eingabe 02 02 1998 Elektronenstrahltomographie des Herzens 19 07 1999 Elektronenstrahltomographie des Herzens gt 12 12 1999 Elektronenstrahltdiiographie des Herzens 03 04 1998 Elektronenstrahltomographie des Herzens Abbildung 66 TCI nach Lernvorgang ohne vorherige Ersetzung von Zahlen 11 Benutzerhandbuch 137 In Abbildung 66 wird das oben beschriebene Ph nomen bereits nach wenigen Befunddaten deutlich Im Gegensatz dazu f hrt eine Ersetzung der Zahlen im Vorfeld des Mergingvorganges durch die Generalisierung des Automaten zu einer bersichtlicheren und benutzerfreundlicheren Oberfl che siehe Abbildung 67 TokenComponent Interface Ioj x Legende Erstellen Beenden Untersuchung W hlen Sie Ihre Eingabe lt XXX Elektronenstrahl
46. bet tigt Es wurde 1 mal die 3 TokenComponent bet tigt Es wurde 1 mal die 4 TokenComponent bet tigt Es wurde 0 mal die 5 TokenComponent bet tigt Es wurde 0 mal die 6 TokenComponent bet tigt Es wurde 0 mal die 7 TokenComponent bet tigt Es wurde 0 mal die 8 TokenComponent bet tigt Es wurde 0 mal die 9 TokenComponent bet tigt Es wurde 0 mal die 10 TokenComponent bet tigt Es wurde 0 mal die 11 TokenComponent bet tigt Es wurde 0 mal die 12 TokenComponent bet tigt Es wurde 0 mal die 13 TokenComponent bet tigt Es wurde 0 mal die 14 TokenComponent bet tigt Es wurde 0 mal die 15 TokenComponent bet tigt Es wurde 0 mal die 16 TokenComponent bet tigt Es wurde 0 mal die 17 TokenComponent bet tigt Es wurde 0 mal die 18 TokenComponent bet tigt Es wurde 0 mal die 19 TokenComponent bet tigt Es wurde 0 mal die 20 TokenComponent bet tigt Es wurde 0 mal die 21 TokenComponent bet tigt Dies entspricht 0 0 Dies entspricht 0 0 Dies entspricht 0 0 Dies entspricht 0 0 Dies entspricht 0 0 Dies entspricht 0 0 Dies entspricht 0 0 Dies entspricht 0 0 Dies entspricht 0 0 Dies entspricht 0 0 Dies entspricht 0 0 Dies entspricht 0 0 Dies entspricht 0 0 Dies entspricht 0 0 Dies entspricht 0 0 Dies entspricht 0 0 Dies entspricht 0 0 Es wurde 0 mal eine Eingabe in eine EmptyComponent vorgenommen Dies entspricht 0 0 Abbildung 84 TCI Protokoll Der letzte
47. betrachtet werden mu Schr der 1993 Formal ist die der radiologischen Fachsprache zugrundeliegende Grammatik weniger umfangreich als die eines beliebigen Textes Diese Eigenschaft wirkt sich entsprechend positiv auf das Ergebnis des Lernverfahrens aus Des weiteren wird durch die Beschr nkung eines konkreten Befundungsvorganges auf eine bestimmte Dom ne jeweils nur ein eingeschr nkter Ausschnitt der radiologischen Fachsprache verwendet Die dargestellten Eigenschaften der radiologischen Fachsprache sowie die nachfolgend beschriebene Struktur radiologischer Befundungstexte erm glichen mittels der verwendeten maschinellen Lernverfahren siehe Kapitel 5 aus Befundungstexten einer bestimmten Dom ne ein geeignetes System zur Befundungsunterst tzung zu generieren das dem Arzt eine strukturierte Eingabe neuer Befunde erm glicht 3 2 2 Der radiologische Befund 281 1996 beschreibt die Intention radiologischer Befundungstexte als die m glichst explizite und eindeutige Beschreibung eines radiologischen Bildes Im Idealfall ist ein solcher Befund vollkommen objektiv Befundungstexte beschreiben Normalzust nde ebenso wie pathologische Zust nde Die obige Definition soll den Zusammenhang zwischen dem radiologischen Bild der im Befund verwendeten radiologischen Sprache und der Struktur des Befundungstextes verdeutlichen 3 2 2 1 Der Aufbau eines radiologischen Befundes Klinische Dokumentationsobjekte wie z B Aufna
48. das Textfeld eingetragen Das Erscheinungsbild des Textes ist so wie er auch sp ter in dem Befundfenster siehe Kapitel 11 5 7 Das Befund Fenster erscheint Durch evtl in den gelernten Texten vorhandene Steuerzeichen erfolgt eine gewisse Formatierung des Textes Ist eine MetaStruktur f r die Texte erw nscht so sind die Titel der Abschnitte durch eine doppelte Unterstreichung hervorgehoben Wie in der Abbildung 81 TokenComponent Interface Fenster gezeigt ist der MetaTitel Koronare Risikofaktoren unterstrichen Die L nge der Unterstreichung ist proportional zu der L nge des MetaTitels Gem der Vorgabe der Option aus Kapitel 11 5 2 4 3 3 4 Mehrfache Anzeige von Metatiteln werden die MetaTitel entweder nur einmal oder bei einem weiteren Besuch auch mehrfach eingef gt 11 5 6 4 Die Werkzeugleiste 11 5 6 4 1 Legende Durch Bet tigung dieses Knopfes ffnet sich ein Dialog welcher Auskunft ber die einzelnen Symbole gibt die neben den TokenComponents stehen k nnen 11 Benutzerhandbuch 162 x Legende f r TokenComponent Interface Der Nachfolger ist ein Terminalzustand Der Nachfolger ist der Startzustand Der Nachfolger ist ein Metazustand A ZA Der Nachfolger befindet sich in einem Zyklus Abbildung 83 Legende f r das TokenComponent Interface Soll die Anzeige der Symbole unterdr ckt werden so kann dies durch Bet tigung der entsprechenden Option geschehen siehe Kapitel 11 5 2 4 3 3 1 Anzeige N
49. dem Aufruf dieser Operation wird wie im vorigen Abschnitt beschrieben ein Graph geladen Nur wird hier nicht ein evtl vorhandener Graph durch den neuen ersetzt sondern der neue wird dem alten unter Anwendung der eingestellten Merging Parameter siehe Kapitel 11 5 2 4 3 1 1 Festlegen der Merging Parameter hinzugef gt Der alte Graph lernt also von dem neuen Ist noch kein Graph vorhanden so verh lt sich Hinzuf gen wie ffnen 11 5 2 4 1 4 Speichern Dieser Men punkt speichert den Graphen unter dem bisherigen Dateinamen Der Dateiname ist mAGENTa dadurch bekannt da der Graph aus einer Datei geladen worden ist oder vorher die Datei mittels des Men punktes Speichern unter siehe n chsten Abschnitt unter einem einzugebenden Namen gespeichert worden ist Dieser Men punkt ist also nur aktivierbar wenn mAGENTa einen Graphen gelernt hat dieser unter einem Dateinamen bekannt ist und au erdem die Option Internet Verbindung vorhanden nicht selektiert ist Eine Datei Kann aus Sicherheitsgr nden nicht auf einem entfernten Rechner abgespeichert werden sondern dies kann nur auf einem lokalen Laufwerk geschehen 11 Benutzerhandbuch 122 11 5 2 4 1 5 Speichern unter Ein neu generierter Graph kann durch diesen Men punkt unter einem einzugebenden Dateinamen lokal abgespeichert werden Sobald dieser Men punkt ausgew hlt worden ist ffnet sich ein Dateiauswahldialog hnlich dem ffnen Dialog f r eine lokale Datei vgl Kapi
50. den Meta Abschnitten Untersuchung Fragestellung Untersuchungstechnik Beurteilung Segment L1 2 Segment L2 3 Segment L3 4 Segment L4 5 Segment L5 S1 Nebenbefund Muskulatur sowie eines zweiten Befundes mit den Abschnitten Untersuchung Fragestellung Untersuchungstechnik Beurteilung Segment L3 4 Segment L5 S1 Nebenbefund Muskulatur Im zweiten Befund werden die Abschnitte Segment L1 2 Segment L2 3 sowie Segment L4 5 nicht behandelt In der Abbildung spiegelt sich dies in der dargestellten Struktur des Meta Graphen wider Abbildung 25 Meta Graph nach Anwendung der deskriptiven Metaregel Der deskriptive Ansatz findet also immer dann Verwendung wenn nicht nur die Struktur innerhalb der Meta Abschnitte sondern auch die Meta Struktur der Befunde insbesondere die Abfolge der Abschnitte gelernt werden soll 8 DFA Generierung 72 8 3 2 4 Verarbeitung unvollst ndiger Befunde Eine Option des Systems ist die Verarbeitung unvollst ndiger Befunde Eine bereits in Kapitel 8 3 1 beschriebene Voraussetzung ist hierbei da der erste Befund bereits die Menge aller in den Befunden vorkommenden Meta Abschnitte enth lt Der folgenden Abbildung 26 liegt der pr skriptive Ansatz zugrunde d h die in Befund 1 vorgegebene Meta Struktur bleibt auch nach Einlesen des neuen Befundes 2 erhalten Der Unterschied zu Abbildung 23 liegt darin da es erlaubt ist bei neuen Befunden lediglich eine Teilmenge der vollst ndigen Abschnittsmenge anzugebe
51. dieses Auswahlfeld wieder selektiert ist werden die TokenComponents automatisch in der sortierten Reihenfolge dargestellt Die Option die Sortierung zu deaktivieren ist insbesondere f r diejenigen Benutzer gedacht die ber Erfahrung im Umgang mit mAGENTa verf gen Durch h ufige 0 95 Erstellung von Texten mit dem TCI hat der Benutzer sich eingepr gt an welcher Position sich eine bestimmte TokenComponent befindet Erfahrenen Benutzern gen gt es nur die ersten Tokens oder auch nur die ersten Buchstaben einer TokenComponent zu lesen um zu wissen wie die komplette Beschriftung hei t Dies f hrt zu einer Erh hung des Geschwindigkeit mit der ein Text erfa t werden kann Es kann dann unerw nscht sein durch Erfassung weiterer Texte die Position der TokenComponents zu ver ndern 9 6 6 Protokollder Positionen der TokenComponents Mit dieser Einstellung wird festgelegt da die Position einer angeklickten TokenComponent innerhalb des TCI w hrend der Erfassung eines Textes protokolliert werden soll Am Ende eines Erfassungsvorganges wird eine Auswertung dar ber angezeigt an wievielter Position sich eine TokenComponent innerhalb der Auswahl befand Dies ist f r die statistische Auswertung interessant um zu berpr fen wie gut die Sortierung der TokenComponents den Erfassungsvorgang unterst tzt 9 6 7 Anzahl TokenChoice Es kann festgelegt werden wie viele TokenButtons mit gleichem Start und Endzustand zu einer TokenChoice z
52. entsteht somit eine vollst ndige Liste aller Worte einer spezifischen Dom ne 11 5 5 3 1 7 Beenden Dieser Men punkt schlie t das W rterbuch Fenster 11 5 5 3 2 Das Optionen Men 11 5 5 3 2 1 Maximale Anzahl von Eintr gen pro Seite Dieser Men punkt ist identisch mit dem Men punkt des Hauptfensters Wenn er bet tigt wird ffnet sich derselbe Dialog Dieser Dialog bezieht sich auf die Anzahl der Eintr ge die auf einer Seite des W rterbuches angezeigt werden sollen 11 Benutzerhandbuch 156 Bitte geben Sie die maximale Anzahl von W rterbuch Eintr gen ein die auf einer Seite dargestellt werden sollen 50 Abbildung 80 Maximale Anzahl von Eintr gen pro Seite Jede Seite kann eine festgelegte Anzahl von Wort Eintr gen und deren Ersetzung fassen Diese Anzahl wirkt sich auf die Anzahl der Seiten des W rterbuches aus da gilt Anzahl der Worte maximale Anzahl Anzahl der Seiten Die Anzahl der Eintr ge hat die Auswirkung da ein einzelner zu ndernder Eintrag durch den Benutzer schneller gefunden werden kann da eine W rterbuchseite jeweils mit den ersten f nf Buchstaben des ersten und letzten Eintrages betitelt ist Durch eine geringere Anzahl an Eintr gen pro Seite wird au erdem die Geschwindigkeit erh ht mit der die W rterbuchseiten graphisch aufgebaut werden Der voreingestellte Wert von 50 d rfte auf einem gew hnlichen Personal Computer keine merkbare Verz gerung bewirken Sollen
53. false xistiert eine Verbindung zum Netzwerk context null der Kontext des Applets codeBase null Die Basis Adresse des HTML Codes Sortierungs Parameter Parameter Voreinstellung Beschreibung sortierung true sollen die Token sortiert werden Abbildungsverzeichnis 17 Abbildung 1 Bildgebende Verfahren in der Radiologie Abbildung 2 Aufbau eines Computertomographen Abbildung 3 CT Aufnahmen der Lendenwirbels ule 18 19 Abbildung 4 Erzeugung und Nachweis magnetischer Kernspinresonanz Abbildung 5 Aufbau eines Magnetresonanztomographen 20 21 Abbildung 6 MRT der Lendenwirbels ule Abbildung 7 Prinzip der Elektronenstrahltomographie 22 23 24 Abbildung 8 Darstellung der Herzphasen mittels EBT Abbildung 9 Beispiel eines radiologischen Befundes Abbildung 10 Kategorien intelligenter Agenten 28 33 Abbildung 11 Charakteristika und deren Einflu gebiete 36 Abbildung 12 Arbeitsprozesse eines intelligenten Agenten Abbildung 13 Versionenraum Modell 37 42 Abbildung 14 Identifikation formaler Grammatiken im Grenzwert 44 44 Abbildung 15 Lernbarkeit formaler Sprachen nach Gold Abbildung 16 Prinzip der Grammatik Inferenz Abbildung 17 Hierarchie der Lernverfahren f r regul re Sprachen Abbildung 18 Systemarchitektur 47 49 52 Abbildung 19 Deterministischer endlicher Automat Abbildung 20 Quotien
54. hrt Der Shortcut f r eine Komponente l t sich daran erkennen da ein Buchstabe in der Beschriftung der Komponente unterstrichen dargestellt wird Der unterstrichene Buchstabe mu dann zur Ausf hrung der gew nschten Operation zusammen mit der Meta Taste gedr ckt werden 11 Benutzerhandbuch 107 Zwischen einzelnen Oberfl chenkomponenten kann auch mittels der Tabulator Taste man vriert werden Ist eine Komponente selektiert erkennbar an dem Rahmen um die Beschriftung so kann mittels einmaligem Druck auf die Tabulator Taste die n chste Komponente selektiert werden bei gleichzeitigem Niederdr cken der Shift und der Tabulator Taste wird die vorhergehende Komponente ausgew hlt Diese Vorgehensweise wird auch Fokustraversierung genannt 11 4 4 Hilfetexte Den wichtigsten Oberfl chenkomponenten ist dar ber hinaus noch ein kurzer Hilfetext zugeordnet Dieser Hilfetext wird sichtbar sobald der Mauszeiger eine Sekunde ber einer solchen Komponente verharrt Der Text gibt Hinweise auf die Funktion dieser Komponente falls dem Benutzer trotz der mnemonischen Beschriftung die Benutzung unklar sein sollte Zus tzlich existiert das Benutzerhandbuch auch als HTML Dokument zur Hilfestellung w hrend der Benutzung von mAGENTa siehe auch Kapitel 11 5 2 4 4 Das Hilfe Men 11 4 5 Anpa bare Fenster F r besonderen Benutzerkomfort wurde f r mAGENTa konsequent die Fenstertechnik benutzt Jeder Hauptbereich von mAGENTa wird in ein
55. in die radiologische Dom ne im Allgemeinen und die Befunderhebung im Speziellen in Kapitel 3 befa t sich Kapitel 4 mit dem Begriff der intelligenten Softwareagenten Kapitel 5 gibt einen berblick ber maschinelle Lernverfahren die h ufig die Basis intelligenter Systeme darstellen Der zweite Abschnitt legt dar wie die beschriebenen Grundlagen unter Ber cksichtigung der Aufgabenstellung in ein funktionierendes System umgesetzt worden sind In Kapitel 6 wird ein berlick ber den Aufbau des erstellten Systems gegeben Kapitel 7 zeigt wie die Befundungstexte vorverarbeitet werden m ssen damit in Kapitel 8 der Lernalgorithmus darauf arbeiten kann Anhand dieser Ergebnisse wird im folgenden Kapitel 9 beschrieben wie daraus eine Benutzeroberfl che generiert werden kann Kapitel 10 gibt dar ber Auskunft wie durch die Eingaben in die Benutzeroberfl che nun wieder Befundungstexte erstellt werden Kapitel 11 beinhaltet ein ausf hrliches und umfangreiches Benutzerhandbuch Der letze Abschnitt behandelt die Auswertung des erstellten Systems Kapitel 12 zeigt vergleichende Testergebnisse anhand von drei verschiedenen Dom nen Das 13 Kapitel liefert eine abschlie ende Betrachtung der Diplomarbeit hinsichtlich des erzielten Ergebnisses 3 Radiologie Dieses Kapitel beginnt mit einem Einblick in die wichtigsten bildgebenden radiologischen Untersuchungsmethoden Dabei liegt der Schwerpunkt der Ausf hrungen prim r auf den in der Diplomarbei
56. in diesem Zusammenhang auf das Kapitel 7 1 1 verwiesen 11 Benutzerhandbuch 117 Je nachdem ob die Option Internet Verbindung vorhanden vgl Kapitel 11 5 2 4 3 4 7 Internet Verbindung vorhanden selektiert ist wird ein anderer Dateiauswahldialog ge ffnet Da die Vorgehensweise zum ffnen von anderen Dateiarten Graphen Kapitel 11 5 2 4 1 2 ffnen W rterb cher Kapitel 11 5 5 3 1 2 ffnen Farbschemata Kapitel 11 5 2 4 3 1 3 Farbauswahl hnlich ist wird hier eine ausf hrlichere Beschreibung geliefert und in den o a Kapiteln hierauf verwiesen 11 5 2 3 2 1 ffne lokale Datei Ist die Option Internet Verbindung vorhanden nicht selektiert so wird ein Dateiauswahldialog ge ffnet mit dem der Benutzer auf die lokalen Verzeichnisse zugreifen kann Der Dialog zeigt zuerst das voreingestellte Verzeichnis in dem sich die Befunddateien befinden an siehe Tabelle 14 Verzeichnisse auf dem Server Aus der Tabelle geht auch hervor ber welche Dateiendung die Datei verf gen mu um in dem Dialog angezeigt zu werden Die brigen Dateien die nicht ber die spezifische Dateiendung verf gen werden der bersichtlichkeit halber nicht angezeigt eine Befunddatei Look in Befunde z EI EA ol S Do File name enn O oen Files orme Befunddateien tx v Cancel Abbildung 53 ffne lokale Datei In der obigen Abbildung ist ein solcher Dateidialog dargestellt Beachtet werden
57. ist die Ermittlung der Sprachklasse der Befunddaten n tig da im Vorfeld des Lernverfahrens keine Angaben ber die Sprachklasse der Befunddaten bestehen Zur Ermittlung des Parameters k wurde folgendes Verfahren von Berwick et al 1987 verwendet Annahme alle Strings au erhalb eines bestimmten endlichen Korpus sind negative Beispiele Setze k 0 Wiederhole Falls der DFA alle positiven Beispiele des Korpus und keine negativen abdeckt ende Sonst Erh he k um 1 Tabelle 7 Verfahren zur Ermittlung des Parameters k Sowohl die Wahl des k Vorg ngerwertes der jeweiligen Regel als auch die Zusammensetzung der Regelmenge beeinflu t entscheidend die Qualit t des erzeugten DFA im Hinblick auf die Benutzerfreundlichkeit des entsprechenden Befundungssystems Tendenziell kann festgestellt werden da mit steigenden Parameterwerten gr ere Anzahl der betrachteten Vorg nger eines Zustandes die Zahl der bergeneralisierungen abnimmt und somit die M glichkeit ungrammatikalische S tze zu erzeugen Eine ausf hrlichere Diskussion der Auswirkungen unterschiedlicher Parameter bzw Regelkombinationen findet sich in Kapitel Testergebnisse 9 Das TokenComponent Interface Das TokenComponent Interface abgek rzt ist die graphische Benutzeroberfl che die es einem Nutzer erlaubt aus einmal gelernten Texten weitere Texte jeweils auf eine effiziente Art zu erstellen Insbesondere wird der Benutzer strukturiert durch den Erstell
58. ist mit der gegebenen Beispielmenge 8 3 Der Merging Algorithmus In Tabelle 4 wird der zentrale Algorithmus der adaptiven Komponente beschrieben Eingabe Ein DFA A mit einer Menge von Zust nden Z einer Menge von Meta Zust nden mit MAZ 0 und einer Regelmenge R Ausgabe Ein DFA A F r alle Meta Zust nde m eM Ermittle die Menge aller von m erreichbaren Zust nde EZ 2 ERZEUGE_PR FIXBAUM EZ Ermittle die Menge aller Zust nde des Pr fixbaumes PZ EZ Wiederhole F r alle Zustandspaare ZP z 2 mit z 2z2 E PZ Falls eine der ausgew hlten Regeln anwendbar ist MERGE 21 722 Bis kein Zustandspaar mehr die Merging Bedingungen erf llt Tabelle 4 Skizze des Merging Algorithmus Ausgangspunkt f r den eigentlichen Mergingvorgang ist der bereits erw hnte Pr fixbaum genauer die Zustandsmenge des Pr fixbaumes Dieser Pr fixbaum repr sentiert ausschlie lich die Menge der positiven Beispiele also konkret die eingelesenen Befunde Der Aufbau des Pr fixbaumes wurde bereits in Kapitel 8 2 2 erl utert Der nachfolgend beschriebene Mergingprozess dient nun der Generalisierung des Pr fix Automaten 8 DFA Generierung 66 Das Testverfahren durchl uft den Automaten r ckw rts beginnend mit den Terminalzust nden und numeriert die Zust nde gem eines BFS Durchlaufes auf dem inversen Automaten Entsprechend dieser Numerierung werden nun die Zustandspaare gebildet f r die getestet wird
59. jede zu lernende Regel von dem Hypothesenraum abgedeckt wird bzw aus dem Hypothesenraum erzeugt werden kann Die Menge der Ziel Hypothesen sollte dabei eine Teilmenge von Lo sein Unter der Inferenzmethode soll im folgenden ein Lernverfahren verstanden werden das den eigentlichen induktiven Lernschritt die Hypothesengenerierung mit einem nachfolgenden deduktiven Schritt dem Hypothesentest verbindet Beim Hypothesentest wird dabei die Konsistenz der Hypothesen mit der Beispielmenge gepr ft Unter den Kriterien des Lernerfolges wird z B das in Kapitel 5 2 6 beschriebene Paradigma der Identifikation im Grenzwert verstanden Pitt 1989 f hrt in seiner Definition des Inferenzproblems einen weiteren Punkt ein Hierbei stehen zus tzliche Informationen ber die gesuchten Regeln zur Verf gung Diese zus tzlichen Informationen k nnen z B in Form eines knowledgeable teachers gegeben sein der Anfragen Oueries in Bezug auf die gesuchte Hypothese beantworten kann 5 Maschinelle Lernverfahren 40 Die Beschreibung eines Inferenzproblems soll anhand der Inferenz von regul ren Sprachen aus positiven und negativen Beispielen verdeutlicht werden Die Klasse der zu lernenden Regeln sei die Menge der regul ren Ausr cke ber einem vorgegebenen Alphabet Der Hypothesenraum sei die Menge aller DFA denkbar w re z B auch die Menge der regul ren Sprachen bzw der nichtdeterministischen Automaten Die Menge der Beispiele besteht aus Tupeln
60. lt 8 3 2 2 Pr skriptive Meta Regel Dem pr skriptiven Ansatz liegt die Idee zugrunde da mit der Meta Struktur des ersten eingelesenen Befundes eine optimale Struktur vorliegt die w hrend des gesamten Lernvorganges hinweg beibehalten werden soll Abbildung 23 soll die Funktionsweise des Algorithmus verdeutlichen Befund 1 sei der erste Befund der eingelesen wurde und seine Meta Struktur somit Grundlage f r alle nachfolgenden Befunde Vereinfacht gesagt werden die Meta Abschnitte des neuen Befund Graphen Befund 2 extrahiert und an der entsprechende Position des alten Befund Graphen Befund 1 eingef gt Beispielsweise wird der Abschnitt des neuen Befundes mit dem zugeh rigen Meta Titel Fragestellung zwischen dem Meta Zustand des alten Befundes mit gleichem Meta Titel und dessen direkten Nachfolger im Meta Graphen eingeordnet Betrachtet man das Ergebnis des pr skriptiven Merging Vorganges so wird deutlich da die Meta Struktur des neuen Befundes insbesondere die Abfolge der Abschnitte nicht ber cksichtigt wurde Dies erfolgt unter der Pr misse da nur die Inhalte der Abschnitte der neuen Befunde von Bedeutung sind nicht jedoch ihre Meta Struktur Befund 1 Befund 2 Ergebnis a u en ww Fragestellung Untersuchungs y Fragestellung gt technik 2 v TTN Pa Untersuchungs Fragestellung et technik technik si d K KA G Abbildung 23 Pr skriptive Metaregel Pas
61. mu Diese beiden Oberfl chenkomponenten werden normalerweise am oberen Rand eines Fensters dargestellt Die Werkzeugleisten von mAGENTa k nnen jedoch auf Wunsch horizontal oder vertikal am Rand des Ursprungsfensters oder gar frei schwebend auf der Oberfl che positioniert werden Damit eine Werkzeugleiste bewegt werden Kann mu der Mauszeiger auf dem gepunkteten Bereich der Werkzeugleiste im Falle des Metal Look amp Feel positioniert werden und mittels der betriebssystemabh ngigen Vorgehensweise f r Drag amp Drop bei Windows linke Maustaste gedr ckt halten und ziehen an die gew nschte Position gebracht werden 11 Benutzerhandbuch 109 Datei Bearbeiten Optionen Hilfe 2 TokenComponent Interface W rterbuch Graph Ansicht MetaGraph Befu le hinzuf gen ffnet einen gespeicherten Befund Abbildung 47 Oberfl chenkonzepte I Beispielhaft werden in der obigen Abbildung die gerade aufgez hlten Oberfl chenkonzepte anschaulich dargestellt Zu sehen ist das Hauptfenster von mAGENTa unmittelbar nach dem Start weiteres hierzu in Kapitel 11 5 2 Das Hauptfenster Von den sichtbaren Kn pfen sind nur die Kn pfe W rterbuch und Befund ffnen aktivierbar Der Mauszeiger befindet sich ber letztgenanntem Knopf Daraufhin erscheint der Hilfetext ffnet gespeicherten Befund alt F Der Zusatz alt F bedeutet da in dieser Betriebssystemumgebung der Knopf auch durc
62. mu da Dateiauswahldialoge stark betriebssystemspezifisch sind und demzufolge in einem anderen eingestellten Look amp Feel auch deutlich anders aussehen 11 Benutzerhandbuch 118 In dem oberen Bereich des Dialoges findet sich eine Auswahlliste ber die direkt die einzelnen Laufwerke und deren Verzeichnisse ausgew hlt werden k nnen ein Knopf zum Wechsel in das ber dem aktuellen Verzeichnis liegende Verzeichnis ein Knopf zum Sprung in das Home Vezeichnis ein Knopf zur Erstellung eines neuen Verzeichnisses und ein Knopf zum Wechsel der Ansicht der Dateien als Listen oder als Detail Ansicht Darunter befindet sich der Auswahlbereich in dem die einzelnen Dateien und Verzeichnisse des aktuellen Verzeichnisses aufgelistet werden Mittels eine Doppelklicks auf ein Datei oder Verzeichnis Symbol wird das entsprechende ge ffnet Dies kann auch durch einen einzelnen Klick auf den Open Knopf nach Selektion des gew nschten Elementes geschehen Neben diesem Knopf befindet sich ein Feld zur Eingabe des Dateinamens Darunter ist die Auswahlliste der selektierbaren Dateitypen zu sehen die durch diesen Dateiauswahldialog ge ffnet werden k nnen Beendet wird dieser Dialog durch Bet tigen des Open Knopfes nach Selektion einer Datei oder durch Bet tigen des Cancel Knopfes bzw das Schlie en des Fensters Falls eine Datei selektiert worden ist so wird sie von dem lokalen Laufwerk eingelesen und analog der Vorgehensweise in Kapitel
63. ob die Voraussetzungen f r eine Anwendung der ausgew hlten Regeln erf llt sind Dieser Vorgang wird solange wiederholt bis kein Zustandspaar mehr die Merging Bedingungen erf llt Abbildung 22 visualisiert den Mergingvorgang zweier Zust nde Im Rahmen des Mergingvorganges wird ein Zustand ausgew hlt der aus dem DFA gel scht werden soll Bei der Auswahl des zu l schenden Zustandes mu beachtet werden da falls mindestens einer der Zust nde ein Terminalzustand ist der verbleibende Zustand ebenfalls terminal ist Somit wird gew hrleistet da immer mindestens ein Terminalzustand existiert In der Abbildung wurde als zu l schender Zustand ausgew hlt Das bedeutet da das Nachfolger Token von Zustand d vor den verbleibenden Zustand geh ngt wird Die Vorg nger Token a und werden ebenfalls dem verbleibenden Zustand zugeordnet Auf der rechten Seite der Abbildung 22 ist der verbleibende Zustand nach Anwendung der beschriebenen Operationen zu sehen Den Token im DFA sind neben ihrem Label noch die H ufigkeit ihres Auftretens ihre Frequenz in den Befundtexten zugeordnet Fa t man nun zwei Zust nde inklusive ihrer Vorg nger und Nachfolger Token zusammen m ssen die Frequenzwerte der Token des zu l schenden Zustandes denen des verbleibenden aufsummiert werden Die Frequenzwerte spielen eine wichtige Rolle bei der Generierung der Benutzeroberfl che d b 6 a b
64. r den Zyklus links daneben 9 6 2 Anzeige von Steuerzeichen Texte sind im Allgemeinen durch Steuerzeichen formatiert Am Ende eines Satzes oder Abschnittes finden sich diese speziellen Zeichen die daf r sorgen da z B die Schreibmarke in die n chste Zeile gesetzt wird Da diese Steuerzeichen in Texten sehr h ufig vorkommen aber keinen semantischen Vorteil zeigen sind sie in der Ansicht des TCI eher hinderlich da sie den Blick auf den eigentlichen Text der TokenComponents ablenken Deshalb sind diese Steuerzeichen gem den Voreinstellungen nicht sichtbar Sollte dieses Auswahlfeld selektiert sein werden im TCI die Steuerzeichen auch Escape Sequenzen genannt in der Standardnotation der C Escape Sequenzen dargestellt Steuerzeichen Escape Sequenz Unicode Wert Tabulator horizontal t u0009 Zeilenvorschub n u000a Wagenr cklauf r u000d Tabelle 10 Sonderzeichen Escape Sequenzen 9 6 3 Mehrfaches Besuchen von MetaZust nden Folgt der Lernproze dem Konzept des deskriptiven Mergings der MetaZust nde siehe Kapitel 8 DFA Generierung so ist es m glich da die Struktur der gelernten Texte einen Zyklus aufweist Dies hat zur Folge da ein MetaZustand mehrfach besucht werden kann Ist dies nicht gew nscht d h die MetaZust nde sollen nur genau einmal besucht werden k nnen so l t sich auch dies einstellen Wird unter dieser Konfiguration bei Eingabe in das TCI ein MetaZustand ein
65. seiner Arbeit vor II Realisierung 6 Systemarchitektur Nachdem in den bisherigen Kapiteln die Grundlagen im Bereich der angewandten maschinellen Lernverfahren der intelligenten Softwareagenten und der radiologischen Befundung vorgestellt wurden soll dieses Kapitel einen berblick ber den konkreten Aufbau des entwickelten Systems geben Wie bereits in der Einleitung erw hnt ist die Aufgabe dieses Systems aus einer Menge strukturierter Texte am Beispiel radiologischer Befundungstexte eine ad quate interne Repr sentation zu erzeugen Basierend auf dieser Repr sentation wird nun eine Benutzeroberfl che generiert die es dem Arzt erm glicht neue Befundungstexte effizient und strukturiert zu erstellen Befundtexte D een A Tokenizer DFA eg Parameter Pflege des W rterbuch Merging 6 9 fE W rterbuches Parameter Merging Parameter TCI W rterbuch Parameter erstellter Befund I Abbildung 18 Systemarchitektur Abbildung 18 zeigt eine vereinfachte Darstellung der Systemarchitektur Am Anfang des Prozesses steht das Einlesen und Vorverarbeiten der Befundungstexte durch einen Tokenizer Dabei werden die vorverarbeiteten Texte in eine interne Repr sentation konkret in einen endlichen Automaten DFA berf hrt Dieser DFA kann um eine zus tzliche sogenannte Meta Strukturierun
66. zu dr cken ist vgl Abbildung 52 Eingabe in das Hauptfenster Bei l nger andauernden Aktionen wird dort zus tzlich eine Uhr eingeblendet die Auskunft dar ber gibt wie lange die aktuelle Operation gerade dauert Zum Beispiel hat der Benutzer bei einem Lernproze den tempor ren Fortschritt des Vorgangs direkt im Blickfeld 11 5 2 3 Die Werkzeugleiste Wie aus Abbildung 51 ersichtlich sind nach dem Start von mAGENTa nur die Kn pfe W rterbuch und Befund ffnen aktivierbar Dies folgt dem Konzept der Kontext Sensitivit t vgl Kapitel 11 4 1 Adaptivit t Kontext Sensitivit t da es nur mit einem vorhandenen DFA sinnvoll ist die Fenster die ber die anderen Kn pfe erreichbar sind zu ffnen Sobald jedoch ein DFA generiert siehe Kapitel 11 5 2 1 Das Textfeld f r die Befundeingabe 11 5 2 3 1 Eingabe hinzuf gen 11 5 2 3 2 Befund ffnen bzw 11 5 2 4 1 6 Befundliste einlesen oder geladen siehe Kapitel 11 5 2 4 1 2 ffnen bzw 11 5 2 4 1 3 Hinzuf gen worden ist werden diese jedoch aktivierbar und der Benutzer kann die dadurch aufgerufenen Fenster nutzen Im Folgenden werden die Funktionen der einzelnen Kn pfe erl utert 11 5 2 3 1 Eingabe hinzuf gen Wie schon in Kapitel 11 5 2 1 Das Textfeld f r die Befundeingabe erw hnt ist dieser Knopf zu bet tigen wenn die Eingabe in das Textfeld abgeschlossen werden soll d h wenn ein manuell erfa ter Befund vollst ndig eingegeben wurde Sobald di
67. zugreifen zu k nnen wird ein Browser ben tigt der diese Seiten lesen und interpretieren kann Die Seiten im Internet sind mittels der Hypertext Markup Language HTML beschrieben HTML ist eine Art Seitenbeschreibungssprache die Text Formatierungen und Verweise auf weitere Seiten bzw andere Objekte z B Bilder T ne Videos Java Applets bietet Der Browser liest ber das Netzwerkprotokoll eine Seite die der Server anbietet ein und verarbeitet die Anweisungen die in der HTML Seite angegeben sind Die interpretierte Seite wird nun in dem Browser Fenster dargestellt mAGENTa ist als Java Applet realisiert Ein Applet kann als eine Art Programm verstanden werden welches sich auf einer Internetseite befindet und innerhalb eines Browser Fensters abl uft Um ein Applet korrekt ausf hren zu k nnen mu der Browser Java f hig sein Das Java Programm wird ber das Netzwerk in einem plattformunabh ngigen Bytecode bermittelt und durch den Browser interpretiert Da mAGENTa mittels der Java 2 Platform entwickelt wurde mu der Browser ber ein JRE Java Runtime Environment verf gen welches Java Bytecode ab dem JDK Java Development Kit 1 2 interpretieren kann Zur Zeit der Drucklegung der Diplomarbeit war dies nur dem Browser HotJava von Sun Microsystems m glich da die Browser der Firmen Netscape und Microsoft bisher nur Java Applets der Version 1 1 7 ausf hren k nnen Eine Alternative zu einem vollst ndigen Internet
68. 11 5 2 3 1 Eingabe hinzuf gen dem bisher Gelernten hinzugef gt 11 5 2 3 2 2 ffne externe Datei aus dem Netzwerk Im Unterschied zum ffnen einer lokalen Datei kann ber den in dem folgenden abgebildeten Dialog eine Datei aus einem heterogenen Netzwerk ge ffnet werden E URL Eingabe Befund Bitte geben Sie die URL des Befundes ein den Sie ffnen m chten http fhomepage ruhr uni bochum deskai bullerdick diplomarbeitibef Abbildung 54 ffne externe Datei In diesen Dialog mu nur die URL Uniform Resource Locator die Netzwerkadresse der zu ffnenden Datei eingegeben werden um sie zu ber das Netzwerk zu transferieren und dem Gelernten hinzuzuf gen Bei der Eingabe der URL ist stets auch das verwendete Protokoll zu benennen In der obigen Abbildung wurde das HyperText Transport Protocol HTTP verwendet Wird allerdings das File Protocol file 11 Benutzerhandbuch 119 und der Name einer Datei auf dem lokalen Dateispeicher angegeben so kann lesend auch auf diese Datei zugegriffen werden Da die URL einer Datei mitunter sehr lang werden kann stellt mAGENTa eine wirkungsvolle Hilfe zur Verf gung Abh ngig vom Kontext d h welche Dateiart ge ffnet werden soll wird der im Hintergrund laufende Internet Browser angewiesen die Indexdateien der passenden Dateien auf dem Server anzuzeigen Mittels dieser Indexdateien kann der Benutzer auf dem Server zwischen den Verzeichnissen man vrieren Er kann die ge
69. 1988 Hopcroft et al 1988 192 Dupont P Miclet L Vidal E What is the search space of the regular inference in Proceedings of the 2nd International Colloquium on Grammatical Inference 1 194 5 25 37 1994 Dupont Incremental regular inference in Grammatical Inference Learning Syntax from Sentences ICGI96 Lecture Notes in Artificial Intelligence 1147 S 222 237 Springer 1996 Dupont P Grammatical Inference Formal and Heuristic Methods Carnegie Mellon University Pittsburg PA 1997 Finch Steven Finding Structure in Language Dissertation Centre of Cognitive Science Universit t Edinburgh 1993 Flanagan David Java in a Nutshell 2nd Edition O Reilly amp Associates 1998 Fu K S Booth T L Grammatical inference Introduction and survey part in IEEE Transactions on Systems Man and Cybernetics Vol 5 S 95 111 1975 Goan T Benson N Etzioni A Grammar Inference Algorithm for the World Wide Web in Proceedings of the 1996 AAAI Spring Symposium on Machine Learning in Information Access MLIA 96 Stanford CA AAAI Press 1996 Gold M Language Identification in the Limit in Information and Control Vol 10 S 447 474 1967 Gold M Complexity of Automaton Identification from given Data in Information and Control V 01 37 S 302 320 1978 Hellbig Hermann K nstliche Intelligenz und automatische Wissensverarbeitung Verlag Technik 1991 Heyder N Lederer P
70. 1l bzw 12a02b03aE13b1 zu hohen maximalen Fan Out Werten von bis zu 150 CT HWS bzw sogar bis zu 280 CT LWS Demgegen ber weisen homogenere Abschnitte wie z B Fragestellung oder Untersuchungstechnik unabh ngig von den jeweiligen Dom nen einen geringen Fan Out auf Zum anderen wird bez glich der Regelmenge 12a2b2 deutlich da die Ersetzung von Zahlwerten im Vorfeld des eigentlichen Mergingvorganges eine wesentlich bessere Generalisierung in Abschnitten mit einem naturgem hohen Fan Out z B bei Untersuchungsdaten im Abschnitt Untersuchung zur Folge hat Diese Ergebnisse best tigen die in Kapitel 12 2 4 erzielten Erkenntnisse bez glich der Auswirkungen einzelner Regelmengen auf den Fan Out des entstehenden Automaten 160 5 140 E 2 120 53 N 100 S 80 Voruntersuchung d Segment C7 Thl Segment C 7 60 Segment C5 6 Segment 4 5 5 40 Segment C3 4 Segment C2 3 20 Untersuchungstechnik Fragestellung Pr fixbaum 12 02603 1361 12 02603 1361 12222b23a13b1 Abbildung 92 Fan Out der Meta Zust nde CT HWS 12 Testergebnisse Fan Out der Meta Zust nde Fan Out der Meta Zust nde 178 300 250 200 Muskulatur Nebenbefund 150 L Segment 131 Segment 14 5 Segment 13 4 100 Segment 12 3 Beurteilung Untersuchungstechnik Fragestellung Untersuchung Klinische Angaben Pr fixbaum 12 0260 12222b2 1
71. 2 2202 12 02603 1301 12222b23a13b1 12 02603 1361 12 22023 1361 Abbildung 93 Fan Out der Meta Zust nde LWS Muskulatur Nebenbefund Segment L5 S1 Segment L4 5 Segment L3 4 Segment L2 3 Segment L1 2 Beurteilung Untersuchungstechnik Fragestellung Untersuchung 12a22b2 12a22b2 12a02b03a13b1 12a02b03aE13b1 12a22b23a13b1 12a22b23aE13b1 Abbildung 94 Fan Out der Meta Zust nde MRT LWS 12 Testergebnisse 179 12 3 Bewertung der Testergebnisse Es kann abschlie end festgehalten werden da ein direkter Zusammenhang zwischen der objektiven Bewertung des jeweiligen DFA durch formale Kriterien wie dem Komprimierungsgrad dem Anteil der Zyklen dem durchschnittlichen Fan Out und der Anzahl der Einaben je Befundungsvorgang auf der einen Seite und der subjektiven Bewertung der entsprechenden Benutzeroberfl chen auf der anderen Seite besteht Die Automaten bei denen die Benutzeroberfl chen subjektiv am besten bewertet wurden wiesen je nach Dom ne einen Zyklenanteil von maximal 9 einen Komprimierungsgrad zwischen 25 und 48 eine durchschnittliche Anzahl von ca 30 Eingaben je Befundungsvorgang einen durchschnittlichen Fan Out von 3 1 und den geringsten Grad an bergeneralisierungen innerhalb der Vergleichsmenge auf Die obigen Werte wurden mit der Regelmenge 12a22b2 erreicht Ein formaler Hinweis auf die Dom nenunabh ngigkeit des Systems ist neben dem bereits in Kapitel 12 2 1 beschriebenen Z
72. 2 Methoden mit negativen Beispielen 5 3 5 2 1 RPNI Oncina et al 1992 beschreibt mit RPNI Regular Positive and Negative Inference ein Verfahren da in polynomieller Zeit genauer in Ouls a N d KR einen Automaten identifiziert der konsistent ist mit der gegebenen Beispielmenge S S US Dabei ist S die Menge der positiven und S die Menge der negativen Beispiele Des weiteren garantiert der Algorithmus eine kanonische Repr sentation des Ziel Automaten zur ckzugeben falls die charakteristische Menge dieses Automaten in S enthalten ist f r exakte Begriffsdefinitionen siehe Kapitel 8 1 Der Algorithmus konstruiert zuerst eine Repr sentation der positiven Beispielmenge S in Form eines sogenannten Pr fixbaumes Dieser spezielle DFA akzeptiert ausschlie lich die Strings aus S und keine sonst Nun werden die Strings die vom Pr fixbaumes erzeugt werden in lexikographischer Ordnung sortiert Jeder Zustand des Pr fixbaumes wird nachfolgend gem der Position seines korrespondierenden Strings in der sortierten Liste numeriert Der Algorithmus testet nun systematisch alle Zustandspaare gem dieser Ordnung und fa t diese zu einem Zustand zusammen generalisiert den bisherigen Automaten falls der entstehende Automat noch konsistent ist mit der Beispielmenge S d h insbesondere da er keine Beispiele aus S akzeptiert 6 Eine inkrementelle Erweiterung der RPNI 2 stellte im brigen Dupont 1996 in
73. 3 153 153 153 153 154 154 154 154 154 155 155 155 157 158 Inhaltsverzeichnis 11 5 6 2 Der Eingabebereich 11 5 6 2 1 Die TokenComponents 11 5 6 2 2 Der ZustandsRahmen 11 5 6 2 3 Eingabe eines neuen Textes in eine EmptyComponent 11 5 6 2 4 Die TCI Vorschau 11 5 6 2 5 Der Vorgang der Texterfassung mit dem ICT 11 5 6 3 Das Textfeld 11 5 6 4 Die Werkzeugleiste 11 5 6 4 1 Legende 11 5 6 4 2 Erstellen 11 5 6 4 3 Beenden 11 5 6 4 4 Zur ck 11 5 6 4 5 Weiter 11 5 6 4 6 Merge 11 5 6 5 Das Protokoll Fenster 11 5 7 Das Befund Fenster 11 5 7 1 Das Textfeld 11 5 7 2 Die Werkzeugleiste 11 5 7 2 1 Speichern 11 5 7 2 2 Drucken 11 6 MAGENTASCRIPT 11 7 GENERATEINDEX HI AUSWERTUNG 12 TESTERGEBNISSE 12 1 EINLEITUNG 12 2 FORMALE BEWERTUNGSKRITERIEN 12 2 1 Prozentualer Zuwachs der Wortanzahl 12 2 2 Komprimierungsgrad des DFA 12 2 3 Anteil der Zyklen des DFA 12 2 4 Durchschnittlicher Fan Out 12 2 5 Anzahl der Eingaben je Befundungsvorgang 12 2 6 Fan Out der Meta Zust nde 12 3 BEWERTUNG DER TESTERGEBNISSE 13 _ABSCHLIE BENDE BETRACHTUNG 13 1 ZUSAMMENFASSUNG 13 2 AUSBLICK ANHANG VOREINSTELLUNGEN MERGING PARAMETER TOKENCOMPONENT INTERFACE PARAMETER W RTERBUCH PARAMETER 158 158 158 158 159 160 161 161 161 162 162 162 163 163 163 164 165 166 166 166 166 167 168 169 169 170 170 171 172 174 175 ___177 179 180 180 182 183 183 184 185 TOKENIZER PARAMETER DELIMITER
74. 49 Applet Start Abbildung 50 Applet Neustart Abbildung 51 Hauptfenster Abbildung 52 Eingabe in das Hauptfenster Abbildung 53 ffne lokale Datei Abbildung 54 ffne externe Datei Abbildung 55 ffne externe Datei mittels eines Internet Browsers 109 110 111 112 113 114 117 118 119 Abbildung 56 Speichere eine Graphdatei Abbildung 57 MergingProtokoll Ausf hrlich Abbildung 58 MergingProtokoll Nur Werte Abbildung 59 Eigenschaften des Graphen Abbildung 60 Beenden mAGENTa Abbildung 61 MergingDialog Abbildung 62 Angestrebte Kantenl nge Abbildung 63 Farbauswahldialog Abbildung 64 Anzahl TokenChoice Abbildung 65 Festlegen der Tokenizer Parameter Abbildung 66 TCI nach Lernvorgang ohne vorherige Ersetzung von Zahlen Abbildung 67 TCI nach einem Lernvorgang mit vorheriger Ersetzung von Zahlen Abbildung 68 Festlegen der Delimeter Abbildung 69 Look amp Feel Abbildung 70 Der Hilfetext Abbildung 71 Graph Fenster Abbildung 72 Kontextmen eines Zustands Abbildung 73 Kontextmen eines MetaZustandes Abbildung 74 Kontextmen eines Tokens Abbildung 75 Legende des Graphen Abbildung 76 MetaGraph Fenster Abbildung 77 Kontextmen eines MetaZustandes im MetaGraph Abbildung 78 W rterbuch Fenster Abbildung 79 W rterbuch Liste Abbildung 80 Maximale Anzahl von Eintr gen pro Seite Abbildung 81 TokenCompo
75. 7 Dorsale Bandscheibenprotrusion mit Pelottierung des Duralsacks Spondylosis deformans mit ventraler und dorsaler Osteophytenbildung Kn cherne Einengung des rechten Neuroforamens Facettengelenkarthrose Segment 7 1 Kein Nachweis eines Bandscheibenvorfalls Arthrose der Facettengelenke Spondylosis deformans Mit freundlichen Gr en Dr Muster Abbildung 9 Beispiel eines radiologischen Befundes 3 Radiologie 29 3 2 3 Kontext der radiologischen Befundung 3 2 3 1 Die universit re Ausbildung Die radiologische Ausbildung im Rahmen des Medizinstudiums beschr nkt sich auf zwei einsemestrige Kurse in Strahlenschutz sowie in radiologischer Diagnostik Begleitet werden diese Kurse dabei jeweils von einer einst ndigen Vorlesung Diese Kurse bieten jedoch in der Regel nicht die M glichkeit die erworbenen theoretischen Grundlagen in der Praxis anzuwenden und das eigenst ndige Befunden in ausreichendem Ma e zu trainieren Das im Rahmen der Diplomarbeit erstellte System bietet hingegen die M glichkeit aus bereits erstellten Befunden die einer bestimmten Dom ne bzw einer bestimmten Untersuchungstechnik zuzuordnen sind eine Benutzeroberfl che zu generieren die die Struktur der Befunddaten wiedergibt Diese Benutzeroberfl che gew hrleistet bei entsprechenden Eingabedaten da der Student strukturiert durch den Befundungsvorgang geleitet wird 3 2 3 2 Praxis der radiologischen Befundung Im Rahmen der Befunderfass
76. Befundungsvorgang geleitet werden Als eines der wichtigsten Argumente gegen eine strukturierte computerunterst tzte Dokumentation wird h ufig die Einschr nkung bei der Befundformulierung angesehen die eine Umstellung der Befundungsgewohnheiten des befundenden Arztes und dadurch einen m glicherweise erh hten Zeitbedarf nach sich ziehen Diesem Argument wurde jedoch bei der Konzeption des entwickelten Systems in Form einer umfassenden Konfigurierbarkeit und Adaptivit t Rechnung getragen 3 3 2 Textbaustein basierte Systeme Bei Textbaustein basierten Systemen werden die Befundungstexte aus vorgefertigten S tzen zusammengef gt Diese S tze m ssen mit entsprechendem Aufwand aus konventionell erstellten Befunden extrahiert und entsprechend aufbereitet werden z durch Zusammenfassung von Synonymen Gruppierung von Satzfragmenten etc Ein Beispiel f r ein Texbaustein basiertes Befundungsunterst tzungs System ist z Beran 1984 3 Radiologie 31 Da diese S tze bzw Satzfragmente aber in der Regel keinen direkten Bezug zueinander haben mu eine gew nschte Strukturierung explizit vorgegeben werden da der Benutzer ansonsten nicht strukturiert durch den Befundungsvorgang geleitet werden kann In diesem Zusammenhang besteht auch die Gefahr da vor allem unge bte Benutzer unstrukturierte unter Umst nden sogar unsinnige Eingaben vornehmen Ebenso ist eine nderung der vorgefertigten S tze teilweise schwierig bzw kann
77. Diplomarbeit mAGENTa Ein Internet Agent zur automatischen Generierung von graphischen Benutzeroberfl chen mittels maschineller Lernverfahren am Beispiel radiologischer Befunde Kai Bullerdick Oliver Ritthoff Diplomarbeit am Lehrstuhl 8 des Fachbereichs Informatik der Universit t Dortmund in Zusammenarbeit mit dem Lehrstuhl f r Radiologie und MikroTherapie der Universit t Witten Herdecke 6 Oktober 1999 Betreuer Prof Dr Katharina Morik Prof Dr med Dietrich H W Gr nemeyer 1 Vorwort An dieser Stelle m chten wir all denjenigen danken die einen Beitrag zu dieser Diplomarbeit geleistet haben F r die Betreuung der Diplomarbeit m chten wir uns bei Prof Dr Katharina Morik und Prof Dr med Dietrich H W Gr nemeyer bedanken Besonderer Dank gilt Dr med Paul Kriener f r die fachliche Beratung und Unterst tzung auf radiologischem Gebiet sowie f r die Bereitstellung und Bearbeitung der Befunddaten Ebenso bedanken wir uns bei Dipl Inform J rg Holstein f r seine spontane und unerm dliche Hilfe in allen Belangen Herzlicher Dank geb hrt Dipl Inform Thorsten Joachims f r seine Beratung in Fragen des maschinellen Lernens sowie f r zahlreiche Kommentare und Hinweise bez glich der Gestaltung der Diplomarbeit Ein besonderer Dank geht im brigen an die Mitarbeiter des Lehrstuhls VII des Fachbereiches Informatik f r anregende Diskussionen nicht nur auf dem Gebiet der K nstlichen Intelligenz
78. Eintrag f r eine TokenComponent in der obigen Abbildung 21 ist auch gleichzeitig der maximale Verzweigungsgrad des DFA 11 5 7 Das Befund Fenster Ist die Texterfassung mittels des TCI abgeschlossen so erscheint in einem separaten Fenster der vollst ndige Text Dieser vollst ndige Text setzt sich aus drei Teilen zusammen Bestandteile des vollst ndigen Textes Der Briefkopf Der mit dem TCI erfa te Text Der Brieffu Tabelle 28 Bestandteile des vollst ndigen Textes 11 Benutzerhandbuch 165 Zur Information ber den Briefkopf und fu siehe Kapitel 11 5 2 4 3 3 8 Briefkopf bzw 11 5 2 4 3 3 9 Brieffu Der erfa te Text wird direkt aus dem Textfeld des bernommen siehe Kapitel 11 5 6 3 Das Textfeld erstellte Befund 2 Drucken 21 07 1999 Elektronenstrahl Tomographie des Herzens Klinische Angaben AF typische Beschwerdesymptomatik Koronare Risikofaktoren Positive Familienanamnese Arterielle Hypertonie Inzwischen eingestellter Nikotinabusus Untersuchungstechnik Elektronen Strahl Tomographie des Herzens mit getriggerter kontinuierlicher transversaler 3 3 Schichtung von der Pulmonalisgabel bis kaudal des Apex cordis mit einer Akquisitionszeit pro Bild von 100 ms Quantitative Erfassung der koronaren Kalkl sionen und computergest tzte Scorebestimmung nach Kalkdichte Abbildung 85 Be
79. Fensters Sie geben an da der Platz der dem Applet zur Verf gung steht 130 Pixel breit 80 Pixel hoch sowie horizontal in der Mitte der Seite ausgerichtet ist ALT Ihr Browser mu mindestens die Java Version 1 2 unterst tzen Der Parameter ALT dient nur dazu eine Fehlermeldung in dem Browser anzugeben wenn das Applet nicht ausgef hrt werden kann 11 1 2 2 Die Verzeichnisstruktur F r eine sinnvolle Anwendung reicht es normalerweise nicht aus nur das Programm zur Verf gung zu stellen sondern es sollten auch weitere Daten zur Verf gung gestellt werden die es dem Benutzer erlauben produktiv mit mAGENTa zu arbeiten Hier ist insbesondere an vorgenerierte Graphen anonymisierte Befunde erstellte W rterb cher aus verschiedenen Dom nen personalisierte Briefk pfe und f e sowie individuelle Voreinstellungen der Farbgebung der Graphen zu denken Damit der Client dies nutzen kann sollten die entsprechenden Dateien in den folgenden Verzeichnissen auf dem Server zu finden sein Verzeichnisname Dateiendung Graphen graph Befunde txt Dictionaries dic Briefteile Ext Farbschemata sas Tabelle 14 Verzeichnisse auf dem Server Diese Verzeichnisse sollten sich sinnvollerweise in dem selben Verzeichnis wie die HTML Datei und die JAR Datei befinden Die Namen der Dateien in ihnen m ssen die angegebenen Endungen besitzen damit sie bei der Dateiauswahl auch korrekt angezeigt werden k nnen 11 2 Inbet
80. Hierarchie der Lernverfahren f r regul re Sprachen Charakteristisch f r die Klasse der exakten Methoden ist eine garantierte Konvergenz in Hinblick auf die gesuchte Grammatik unter der Voraussetzung da eine widerspruchs und fehlerfreie sowie repr sentative Beispielmenge existiert Innerhalb der Klasse der exakten Methoden ist das Vorhandensein negativer Beispiele ein wichtiges Unterscheidungskriterium Aus diesem Grund werden sowohl Methoden diskutiert bei denen ausschlie lich positive Beispiele zur Verf gung stehen wie z B der im System verwendeten Methode als auch ein Verfahren das mit vollst ndigen klassifizierten Beispielmengen arbeitet Im Gegensatz zu Inferenzverfahren f r kontextfreie Grammatiken gibt es im Rahmen regul rer Sprachen eine Reihe von Verfahren die unter den bereits diskutierten Voraussetzungen eine Identifikation der gesuchten Grammatik gew hrleisten 5 3 5 1 Methoden ohne negative Beispiele Wie bereits erw hnt ist das Problem der Identifikation einer Grammatik allein auf der auf der Grundlage positiver Beispiele nicht effizient berechenbar Eine M glichkeit dieses Problem zu umgehen ist es sich auf Teilmengen regul rer Sprachen zu beschr nken Exemplarisch f r diesen Ansatz sollen die Klassen der k kontextuellen bzw k h kontextuellen Sprachen genannt werden In diese Klasse der exakten Methoden die keine negativen Beispiele verwenden f llt auch die in Abbildung 17 grau unterlegte Klasse der
81. INFERENZ Definitionen Chomsky Hierarchie Spezifikation der Grammatik Inferenz Theoretische Resultate der Grammatik Inferenz regul rer Sprachen _ Lernalgorithmen f r regul re Sprachen 1 Methoden ohne negative Beispiele 1 1 k kontextuelle Sprachen 1 2 k h kontextuelle Sprachen 2 Methoden mit negativen Beispielen 2 1 RPNI II REALISIERUNG 6 6 1 6 1 1 6 1 2 6 2 6 3 6 4 7 7 1 SYSTEMARCHITEKTUR EINLESEN UND VORVERARBEITUNG DER BEFUNDE Der Tokenizer Das W rterbuch DER MERGINGVORGANG DER AUFBAU DES TOKENCOMPONENTINTERFACES DAS ERSTELLEN VON BEFUNDUNGSTEXTEN VERARBEITUNG DER BEFUNDTEXTE DER TOKENIZER 35 35 35 35 36 36 37 38 38 38 39 40 40 41 41 41 _43 43 45 45 45 45 46 47 48 49 50 __50 51 51 52 52 53 53 53 54 54 54 56 56 Inhaltsverzeichnis 7 1 1 Die Trennzeichen 7 1 2 Interpretation der Trennzeichen als eigene Tokens 7 1 3 Delimiter f r MetaZust nde 7 1 4 Ersetzen von Zahlen 7 2 DAS W RTERBUCH 8 _ DFA GENERIERUNG 8 1 DEFINITIONEN 8 2 DAS PRINZIP DER DFA GENERIERUNG 8 2 1 Lernen als Suche 8 2 2 Aufbau des Pr fixbaumes 8 2 3 Generalisierung des Automaten 8 3 DER MERGING ALGORITHMUS 8 3 1 Die Meta Struktur 8 3 1 1 Motivation 8 3 1 1 1 Einschr nkung des Hypothesenraumes 8 3 1 1 2 Verringerung der Rechenzeit 8 3 1 1 3 Einschr nkung von unerw nschten Lernergebnissen 8 3 2 Merging von Meta Zust nden 8 3 2 1 Metaregeln 8 3 2 2 Pr skripti
82. KOPF 10 3 BRIEFFU 10 4 SCHL SSELWORTE 11 _BENUTZERHANDBUCH 11 1 SYSTEMVORAUSSETZUNGEN 11 1 1 Der Client 11 1 1 1 Sicherheitsbeschr nkungen 11 1 2 Der Server 11 1 2 1 Die HTML Seite 11 1 2 2 Die Verzeichnisstruktur 11 2 INBETRIEBNAHME 11 3 WARUM DIE JAVA 2 PLATFORM 11 4 GLOBALE OBERFL CHENKONZEPTE 11 4 1 Adaptivit t Kontext Sensitivit t 11 4 2 Automatische Synchronisation 11 4 3 Umfangreiche Unterst tzung von Maus und Tastatureingabe 11 4 4 Hilfetexte 11 4 5 Anpa bare Fenster 11 5 DIE OBERFL CHE 11 5 1 Start des Applets 11 5 2 Das Hauptfenster 11 5 2 1 Das Textfeld f r die Befundeingabe 11 5 2 2 Die Statuszeile 11 5 2 3 Die Werkzeugleiste 11 5 2 3 1 Eingabe hinzuf gen 11 5 2 3 2 Befund ffnen 11 5 2 3 2 1 ffne lokale Datei 11 5 2 3 2 2 ffne externe Datei aus dem Netzwerk 11 5 2 3 3 Graph Ansicht 11 5 2 3 4 MetaGraph 11 5 2 3 5 W rterbuch vi 90 91 92 __92 93 93 94 94 95 95 96 96 97 97 98 99 99 100 101 101 102 103 103 104 105 105 105 106 107 107 110 111 113 113 114 115 115 116 117 118 120 120 120 Inhaltsverzeichnis 11 5 2 3 6 11 5 2 4 11 5 2 4 1 11 5 2 4 1 1 11 5 2 4 1 2 11 5 2 4 1 3 11 5 2 4 1 4 11 5 2 4 1 5 11 5 2 4 1 6 11 5 2 4 1 7 11 5 2 4 1 8 11 5 2 4 1 9 11 5 2 4 2 11 5 2 4 2 1 11 5 2 4 2 2 11 5 2 4 2 3 11 5 2 4 3 11 5 2 4 3 1 11 5 2 4 3 1 1 11 5 2 4 3 1 2 11 5 2 4 3 1 3 11 5 2 4 3 2 11 5 2 4 3 2 1 11 5 2 4 3 3
83. Out eines Zustandes korreliert dabei mit der Anzahl der TokenComponents des entsprechenden Zustandspanels d h ein hoher Fan Out hat eine umfangreiche und in der Regel un bersichtliche Benutzeroberfl che zur Folge Auch in diesem Punkt zeigen die Regelmengen von Schlimmer und Hermens mit einem k Vorg ngerwert von 0 das ung nstigste Verhalten Die Ergebnisse der restlichen Regelmengen unterscheiden sich hingegegen kaum voneinander wobei in diesem Zusammenhang ein leichter Vorteil bei der Regelmenge von Angluin mit einem k Vorg ngerwert von 2 zu verzeichnen ist Auffallend sind auch die maximalen Fan Out Werte innerhalb der einzelnen Dom nen So bersteigt der Maximalwert der Dom ne CT LWS den entsprechenden Wert der Dom ne MRT LWS um das dreifache Diese Tatsache ist auf die insgesamt inhomogene Struktur der Dom ne zur ckzuf hren LWS m CT HWS OCT LWS Fan Out durchschnittlicher Abbildung 90 durchschnittlicher Fan Out 13 Da ca 98 aller Zust nde exakt einen Zustandsnachfolger besitzen Fan Out 1 werden bei der Ermittlung des durchschnittlichen Fan Outs ausschlie lich Zust nde mit mehr als einem Zustandsnachfolger betrachtet um eine bessere Vergleichbarkeit der einzelnen Regelmengen zu gew hrleisten 12 Testergebnisse 175 12 2 5 Anzahl der Eingaben je Befundungsvorgang Die Anzahl der Eingaben im Rahmen eines einzelnen Befundungsvorganges entspricht der Zahl der unterschiedlichen TokenCom
84. PARAMETER FARBSCHEMA PARAMETER NETZWERK PARAMETER SORTIERUNGS PARAMETER ABBILDUNGSVERZEICHNIS TABELLENVERZEICHNIS LITERATUR VERZEICHNIS ABK RZUNGSVERZEICHNIS INDEX 185 185 186 186 186 187 190 191 195 196 I Grundlagen 2 Einleitung 2 1 Abstract Die Erfassung von gleichartigen Texten ist eine in vielen Bereichen immer wieder vorkommende Aufgabe Besonders in der Medizin ist das Erstellen von Befundtexten eine Routineaufgabe die von rzten meist unter Zeitdruck durchgef hrt wird Der hier vorgestellte Softwareagent unterst tzt den Arzt aktiv bei seiner Arbeit indem er ihn bei der Erfassung von Befunden beobachtet aus seiner Vorgehensweise lernt und eine graphische Benutzerschnittstelle generiert Diese Benutzerschnittstelle leitet den Arzt anschlie end strukturiert durch weitere Befundungsvorg nge und erm glicht durch blo es Anklicken von Oberfl chenelementen die effiziente Erstellung von Befundtexten 2 2 Aufgabenstellung Die Befundung von Patienten geh rt zu den t glichen Aufgaben eines Arztes sowohl in der Praxis als auch in der Klinik Obwohl die Befunderfassung eine Routinearbeit ist stellt sich jeder Patient als individueller Fall mit speziellen Eigenheiten dar Der Einsatz eines Befundungsunterst tzungssystems k nnte hier den Arzt bei dieser Routinearbeit entlasten und es ihm so erm glichen sich mehr auf seine diagnostische und therapeutische T tigkeit zu Konzentrieren Ein solches System sollt
85. a22b2 mit 25 50 minimal bez glich der betrachteten Regelmengen sind mCTLWS m CT HWS LWS 2 KS D n Weg d x 0 5 MRT LWS x CT HWS Abbildung 87 Komprimierungsgrad bez glich der Pr fixb ume 12 Testergebnisse 172 12 2 3 Anteil der Zyklen des DFA Wie bereits erw hnt wurde der Anteil der Zyklen eines Automaten als Ma f r den Grad der bergeneralisierung gew hlt da eine Quantifizierung der ber generalisierungen und somit eine direkte Vergleichbarkeit zweier Automaten bez glich dieses Kriteriums nicht ohne weiteres realisierbar ist Der Zyklenanteil wirkt sich dabei unmittelbar auf die Benutzerfreundlichkeit des Systems aus da dieser zum einen den Befundungsproze erschwert und zum anderen der Trainingseffekt durch die Vielzahl der ungrammatikalischen Auswahlm glichkeiten gef hrdet ist MRT LWS m CT HWS OCT LWS Anteil der Zyklen Abbildung 88 prozentualer Zyklenanteil Aus der Abbildung 88 geht deutlich hervor da der Anteil der Zyklen im Fall der Regelmenge von Angluin mit einem k Vorg ngerwert von 2 12a22b2 und 12a22b2 minimal ist im Vergleich zu den restlichen Regelkombinationen Die Anwendung der urspr nglichen und der modifizierten Regelmengen von Schlimmer und Hermens insbesondere mit einem k Vorg ngerwert von 0 12 02603 13 1 bzw 12a02b03aE13b1 ergibt dabei einen teilweise erheblichen Zyklenanteil 12 Testergebnisse
86. aAbschnittes ZustandsAufschrift Die Beschriftung des Zustandes im Graphen MetaPosition Die MetaPosition innerhalb des DFA interne Numerierung der MetaZust nde ZustandsPosition Die Position des Zustandes innerhalb des DFA interne Numerierung der Zust nde Fixieren Fixieren des Knotens an seiner aktuellen Fensterposition Freigeben Freigeben eines fixierten Knotens Tabelle 27 Kontextmen eines MetaZustandes im MetaGraphen 11 5 5 Das W rterbuch Das W rterbuch Fenster zeigt die Eintr ge des W rterbuches in sortierter Form an Da mitunter viele verschiedene Worte in den gelernten Texten vorkommen ist es n tig diese in geeigneter Form darzustellen Diese Form mu sowohl einen guten berblick ber s mtliche Eintr ge als auch gezielten Zugriff auf einzelne bieten Da mAGENTa von verschiedenen Personen genutzt werden kann ist es sinnvoll wenn diese ihre einmal gelernten Texte austauschen und kombinieren um so ein besseres Gesamtergebnis zu erreichen Ebenso wie bei Graphen ist es auch bei W rterb chern m glich diese anderen nutzbar zu machen indem ein Benutzer sein erstelltes 11 Benutzerhandbuch 151 W rterbuch abspeichert und andere es ffnen Prinzipiell stellt sich hier eine gewisse Unabh ngigkeit der W rterb cher gegen ber den Graphen dar Das W rterbuch wird selbst ndig ohne weitere Aktionen des Benutzers erweitert Wird ein neuer Text gelernt ein Graph geladen oder ein Eintrag in ein
87. achfolger Symbol 11 5 6 4 2 Erstellen Wurde ein Texterfassungsvorgang abgeschlossen oder ein neuer Graph ge ffnet so ist es notwendig das TCI neu zu erstellen um neue Eingaben in das TCI zu erm glichen Durch Bet tigung dieses Knopfes wird der erste Rahmen mit den TokenComponents f r den StartZustand des DFA erstellt 11 5 6 4 3 Beenden Der Beenden Knopf ist zur weiteren Beschleunigung des Texterfassungsvorganges Wird er bet tigt so vervollst ndigt mAGENTa automatisch den Text mit den wahrscheinlichsten Tokens bis zum n chsten MetaZustand Dies geschieht durch Auswahl der Tokens mit der jeweils h chsten Frequenz pro Zustand an dem der Vorgang gerade weitergef hrt wird Diese Vorgehen gleicht der Auswahl der jeweils ersten TokenComponent in einem Rahmen wenn die Sortierung nach Frequenz eingeschaltet ist siehe Kapitel 11 5 2 4 3 3 5 Nach Frequenz 11 5 6 4 4 Zur ck Nicht jede Entscheidung zur Anwahl einer TokenComponent stellt sich im Nachhinein als richtig und gew nscht dar mAGENTa bietet hierf r eine R ckg ngig Funktion Undo f r alle Bet tigungen von TokenComponents Ist irrt mlicherweise eine TokenComponent angew hlt worden die gar nicht beabsichtigt war so kann mittels des Zur ck Knopfes dieser Vorgang zur ckgenommen werden Die M chtigkeit dieser Funktion erlaubt es s mtliche Eingaben in das TCI zur ckzunehmen bis wieder der Rahmen f r den StartZustand dargestellt wird Sogar die Eingabe
88. acht damit die Knoten schneller ihren Weg zu einer geordneten Darstellung begehen Die Anzahl der Animationsschritte die im Hintergrund ausgef hrt werden ist gleich der Anzahl der Knoten also gleich der Summe der Zust nde und Tokens Eine proportionale Anzahl von Schritten bringt den Graphen n her an eine geordnete Darstellung als eine feste Anzahl da ein Graph mit einer gro en Anzahl von Knoten mehr Animationsschritte f r die Ordnung ben tigt als einer mit einer geringeren Au erdem k nnten bei einer geringen Anzahl von Knoten zu viele Schritte get tigt werden obwohl der Graph sich schon in einer geordneten Darstellung befindet Sind entsprechend viele Schritte berechnet worden so werden schlie lich die Knoten und Kanten an ihren aktuellen Positionen gezeichnet und der Animations Algorithmus f hrt wieder fort 11 5 3 3 8 Fortschritt Zur Information des Benutzers wird in diesem Textfeld die Anzahl der bisher berechneten Animationsschritte festgehalten Bei jedem weiteren Schritt wird diese Anzahl inkrementiert Wird w hrend der Animation der Aufl sen Knopf bet tigt so erscheint hier eine Prozentzahl die anzeigt wie weit die Berechnungen ohne Aktualisierung der Graphansicht fortgeschritten sind Sind diese Berechnungen durchgef hrt so wird wieder die gesamte Anzahl der Animationsschritte als absolute Zahl dargestellt 11 Benutzerhandbuch 149 11 5 4 Der MetaGraph So wie der Graph die Zust nde und Tokens des DFA anz
89. alisierung des Graphen Dies wird ausf hrlich in Kapitel 11 5 3 Der Graph beschrieben 11 5 2 3 4 MetaGraph Es ffnet sich das Fenster mit der Visualisierung des MetaGraphen Dieser Knopf ist allerdings nur aktivierbar wenn ein Graph existiert d h etwas gelernt worden ist und die Option MetaStruktur erw nscht selektiert worden ist vgl Kapitel 11 5 2 4 3 4 1 MetaStruktur erw nscht Eine ausf hrliche Darstellung dieses Fensters ist in Kapitel 11 5 4 Der MetaGraph zu finden 11 5 2 3 5 W rterbuch Mittels dieses Knopfes kann das Fenster des W rterbuches ge ffnet werden Weiteres hierzu im Kapitel 11 5 5 Das W rterbuch Im Gegensatz zu den anderen Fenstern ist dieses auch dann zu ffnen wenn bisher kein Graph gelernt worden ist Dies liegt an einer gewissen Unabh ngigkeit der W rterb cher von den Graphen Sie k nnen unabh ngig voneinander ge ffnet gespeichert und ver ndert werden 11 5 2 3 6 TokenComponent Interface Ebenso ffnet sich ber diesen Knopf das Fenster des TokenComponent Interfaces nur wenn vorher ein Graph gelernt worden ist Eine ausf hrliche Erl uterung der TCI Oberfl che findet sich in Kapitel 11 5 6 Das TokenComponent Interface 11 5 2 4 Die Men s Neben der Werkzeugleiste stellen die Men s eine wichtige Schnittstelle zur Benutzerinteraktion dar Angelehnt an bew hrte und weit verbreitete Standards gibt es auch in mAGENTa ein Datei Men ein Bearbeiten Men ein Hilfe Men und dar
90. alle Worte auf einer Seite angezeigt werden so ist eine Zahl einzutragen die gr er oder gleich der Anzahl der Worte ist Diese Anzahl l t sich durch Aufruf des Graph Eigenschaften Dialoges aus dem mAGENTa Hauptfenster siehe Kapitel 11 5 2 4 1 8 Eigenschaften des Graphen anzeigen ablesen 11 Benutzerhandbuch 157 11 5 6 Das TokenComponent Interface Das TokenComponent Interface erm glicht es aus einmal gelernten Texten weitere Texte jeweils auf eine effiziente Art zu erstellen Es ist eine direkte Abbildung des DFA in eine benutzerfreundliche Darstellung TokenComponent Interface gende Erstellen Beenden Zur ck Weiter Merge KoronareRisikofaktoren W hlen Sie Ihre Eingabe Hypercholesterin mie und lt Nikotinabusus lt Dyslipoprotein mie mit Diabetes mellitus gt Adipositas Positive Familienanamnese Nicht zu erheben Inzwischen eingestellter Belastungsabh ngige arterielle Hypertonie Arterielle Hypertonie KoronareRisikofaktoren Abbildung 81 TokenComponent Interface Fenster Das Fenster verf gt am oberen Rand ber eine Werkzeugleiste darunter befindet sich ein Bereich f r den Titel des aktuellen MetaAbschnittes Den Hauptbereich des Fensters teilen sich der eigentliche Eingabebereich des TCI und darunter das Textfeld f r den aktuell entstehenden Text Diese beiden Bereiche sind d
91. alog durch den das W rterbuch unter einem einzugebenden Namen lokal abgespeichert werden kann 11 5 5 3 1 6 W rterbuch Liste anzeigen Um die Eintr ge des W rterbuches in einer einfachen Form einzusehen kann mittels dieses Men punktes ein Fenster ge ffnet werden da hnlich aufgebaut ist wie das Fenster f r das Merging Protokoll siehe Kapitel 11 5 2 4 1 7 Merging Protokoll anzeigen 11 Benutzerhandbuch W rterbuch Liste 20 Ausf hrlich Nur Worte Restinfiltrat Rezidivierende Schichtung Schmerzen Relevanz Resektion Residuen Residuum Restinfiltrat Rezidivierende Rezidivs Richtlinien Risiko Risikofaktoren Ruhedyspnoe Rundherd Rundstruktur R cken ST Schichtung Schmerzen Abbildung 79 W rterbuch Liste Die Werkzeugleiste bietet zwei Auswahlkn pfe mit denen zwischen den Ansichten umgeschaltet werden kann Bei Auswahl des Knopfes Ausf hrlich werden s mtliche Eintr ge des W rterbuches lexikographisch sortiert in dem Textfeld dargestellt neben ihnen sind jeweils ihre Ersetzungen zu finden Bei der Auswahl des Knopfes Nur Worte fehlen diese Ersetzungen es werden nur die Worte selbst angezeigt Diese blo e Textdarstellung erlaubt es die Eintr ge des W rterbuches einfach zu exportieren um sie weiterzuverarbeiten Dies kann von Interesse sein da es einen kompletten berblick ber alle Worte liefert die in den bisher gelernten Texten vorkamen Bei entsprechend vielen Texten
92. aren automatisch eingetragen F r jedes Token eines neuen Textes wird in dem W rterbuch nachgesehen ob hierf r eine Ersetzung existiert Falls es ein neues Wort ohne bisherigen Eintrag in das W rterbuch ist so wird es mit sich selbst als Ersetzung aufgenommen andernfalls bekommt das Token die Ersetzung aus dem W rterbuch als neue Benennung Neben dieser automatischen Verfahrensweise beim Einlesen eines Befundes kann das W rterbuch auch interaktiv genutzt werden um gezielt einen bestehenden Eintrag durch ein oder mehrere W rter 1 n Ersetzung zu ersetzen Dar ber hinaus ist es auch m glich einen neuen Eintrag f r ein oder mehrere Worte und deren Ersetzung m n Ersetzung vorzunehmen Dies bedeutet da Wortgruppen oder ganze S tze durch andere benutzerdefinierte ersetzt werden K nnen Bei den 1 n Ersetzungen wird ein Token durch eine lineare Folge von Zust nden ersetzt Dabei wird jeder dieser Zust nde jeweils nacheinander durch ein eingegebenes Token in den nachfolgenden Zustand berf hrt Bei den m n Ersetzungen wird dementsprechend eine Folge von Zust nden durch eine andere ersetzt Durch dom nenspezifische W rterb cher wird der Lernvorgang unterst tzt und so das Lernergebnis verbessert Weitere Informationen zu dem W rterbuch insbesondere dessen graphische Gestaltung und Bedienung ist in dem Benutzerhandbuch in Kapitel 11 5 5 Das W rterbuch angegeben 8 DFA Generierung Dieses Kapitel beschreibt wie aus d
93. atums sowie der Art und Lokalisation der durchgef hrten Untersuchung Abschnitt Betreff Danach wird die Fragestellung der Untersuchung beschrieben Es folgt eine pr zise Darstellung der angewandten Untersuchungstechnik 2 im konkreten Fall der Computertomographie die Angabe der Schichtdicke der Lokalisation der Untersuchung und der verwendeten Fenstertechnik Anschlie end folgen die eigentlichen Befunddaten Im konkreten Fall werden die einzelnen Segmente der Halswirbels ule des Patienten hier von C2 3 bis C7 Thl im Detail beschreiben Dabei werden sowohl pathologische Auff lligkeiten Arthrose der Facettengelenke als auch unauff llige Befunde innerhalb eines Segmentes z Nachweis eines Bandscheibenprolaps bzw komplett unauff llige Segmente Segment C2 3 festgehalten siehe hierzu auch die Definition in Kapitel 3 2 Der Aufbau des beschriebenen Befundtextes soll nur als Rahmen f r eine bestimmte Klasse radiologischer Befunde in diesem Fall die Computertomographie der Halswirbels ule verstanden werden So weisen unterschiedliche Klassen bzw unterschiedliche Dom nen in der Regel eine mehr oder weniger gro e Varianz in der Auswahl respektive der Abfolge einzelner Abschnitte auf So sind in der Befundung von Elektronenstrahltomographien des Herzens andere Befundangaben von Bedeutung koronare Risikofaktoren Kalkl sionen je Segment etc als z B bei der Magnetresonanztomographie der Wirbels
94. b k wobei ke 0 1 angibt ob ein String b Element der regul ren Sprache L ist Die Inferenzmethode zur Induktion regul rer Sprachen aus klassifizierten Beispielen sei RPNI siehe Kapitel 5 3 5 2 1 Das Kriterium der Identifikation regul rer Sprachen im Grenzwert ist im vorliegenden Fall erf llt 5 2 2 Vergleich von Hypothesen Eine M glichkeit die Qualit t der Hypothesen und damit die Qualit t des induktiven Lernergebnisses zu bewerten ist es die Einfachheit simplicity dieser Hypothesen zu betrachten Dabei ist unter Einfachheit die Komplexit t der Hypothesen bzw die Gr e des Hypothesenraumes zu verstehen Im Fall der Inferenz endlicher Automaten wird als Kriterium der Einfachheit z B die Anzahl der Zust nde des erzeugten Automaten gew hlt Diesem Kriterium liegt die Erkenntnis zugrunde da die Generalisierungsgenauigkeit bei Automaten mit einer geringen Anzahl von Zust nden h her ist als bei Automaten mit einer h heren Anzahl von Zust nden Weitere Ma e sind je nach Art des Hypothesenraumes denkbar so z B Inklusionsbeziehungen von Mengen bei der Inferenz von Sprachen etc Zur Bewertung der Hypothesen kann eine partielle Ordnung ber der Menge der Hypothesen bez glich des gew hlten Ma es definiert werden Die Hypothesen also die Elemente dieser Ordnung werden gem dieses festgelegten Ma es sortiert In jedem Schritt des Inferenzprozesses also nach jeder neuen Eingabe wird diese Liste aktualisier
95. befindet Hierdurch wird dem Benutzer eine flexible M glichkeit gegeben das Lernergebnis zu erweitern wenn z B ein Krankheitsbild ber zus tzliche Symptome verf gt die bisher noch nicht vorgekommen sind 9 4 Algorithmus zur Generierung des TokenComponent Interfaces Beginne beim StartZustand Solange der betrachtete Zustand genau ein NachfolgeToken hat merke das Token in einer Liste wenn der NachfolgeZustand des Tokens ein MetaZustand ist beende Schleife der NachfolgeZustand wird zum betrachteten Zustand gt Eine lineare Liste von Token Vorg ngerliste erstelle f r den zuletzt besuchten Zustand einen leeren ZustandsRahmen ist der letzte Zustand Terminal oder Meta Zustand dann erstelle TokenButton f r Vorg ngerListe sonst sammle NachfolgerListen f r jeden Nachfolger des letzten Zustandes gibt es Nachfolge Token die den selben Folge Zustand haben und ist deren Anzahl gr er als der Parameter f r die TokenChoice dann trage die Vorg ngerToken Liste die Tokens und die aufgesammelte NachfolgerToken Liste in eine TokenChoice ein trage die brigen Token jeweils mit der Vorg ngerToken Liste und deren gesammelter NachfolgerToken Liste in einen TokenButton ein rstell ine EmptyComponent f ge alle TokenComponents geordnet nach der Frequenz ihrer Token in das ZustandsRahmen beginne mit dem NachfolgeZustand der ersten TokenComponent wie
96. beitung von anderen Anwendungen importiert werden kann 11 5 7 2 2 Drucken Der Text kann aber auch direkt auf einem angeschlossenen Drucker ausgegeben werden mAGENTa nutzt hierzu jeweils die Schnittstellen des aktuellen Betriebssystems um die Druckoperation durchzuf hren 11 6 mAGENTasScript mAGENTaScript ist ein zus tzliches Programm welches es erlaubt den Lernproze von vielen Beispieltexten zu automatisieren Es ist eine Java Applikation die ohne graphische Oberfl che auskommt und per Kommandozeile durch Aufruf des Java Interpreters gestartet wird Als Parameter ben tigt mAGENTaScript zwei Dateinamen Die erste Datei mu eine Liste von weiteren Dateien enthalten in denen jeweils die Texte stehen die gelernt werden sollen Die zweite Datei enth lt in kodierter Form pro Zeile jeweils Parametereinstellungen f r den Lernproze mAGENTaScript lie t nun f r eine Parametrisierung alle Texte ein lernt sie und speichert den gelernten DFA inklusive des Protokolles des Lernvorganges in ein eigenes Verzeichnis ab Dies wird f r jede Zeile der Datei mit Parametereinstellungen durchgef hrt mAGENTaScript hat den Vorteil da es unbeaufsichtigt eine F lle von Lernvorg ngen ausf hren kann Durch Verzicht auf eine graphische Oberfl che ist es m glich das Programm auf entfernten Rechnern remote insbesondere auf Workstations ausf hren zu lassen um so den Arbeitsplatzrechner nicht mit dem Lernproze zu belasten
97. bildung ersichtlich Kann in den sich bei Anwahl des Men punktes ffnenden Dialog jeweils in die Textfelder der passende Delimiter eingetragen werden Anschlie end mu die Eingabe mit Dr cken des OK Knopfes best tigt werden 11 5 2 4 3 4 6 Look amp Feel Eins der herausragenden Merkmale von der Java 2 Platform insbesondere Swing ist die M glichkeit des Pluggable Look amp Feel der zur Laufzeit auswechselbaren Darstellung von Java Programmen W hlen Sie ein Look amp Feel Metal Windows CDE Motif Abbildung 69 Look amp Feel Nach Bet tigung dieses Men punktes erscheint der obige Dialog mit dem der Benutzer zwischen den angegebenen Look amp Feels w hlen kann Wird der Auswahlknopf Windows bet tigt so erscheint mAGENTa gem dem Style Guide von Windows 95 wird CDE Motif bet tigt wechselt mAGENTa wieder entsprechend Dabei ist es unerheblich unter welchem Betriebssystem mAGENTa gerade l uft Voreingestellt ist das Java Look amp Feel Metal das auch bei den abgebildeten Bildschirmdarstellungen verwendet wurde 11 Benutzerhandbuch 139 11 5 2 4 3 4 7 Internet Verbindung vorhanden Durch dieses Auswahlfeld wird festgelegt wie mAGENTa sich bez glich der Dateiablage verhalten soll Ist das Feld selektiert so versucht mAGENTa zum ffnen von Dateien auf das Netzwerk zuzugreifen Ein Speichern von Dateien ist aufgrund von Sicherheitsbeschr nkungen nicht erlaubt Anzumerken w
98. bination von Worten zu gr eren Einheiten z B S tzen Eine grammatikalische Analyse eines sprachlichen Ausdrucks auf syntaktische Korrektheit wird dabei als Parsing bezeichnet Ein grammatikalisch falscher Ausdruck w re z B Chronisches Status vor Microtherapie wohingegen Chronischer Status vor Microtherapie grammatikalisch korrekt w re Die Semantik untersucht die Bedeutung von gr eren sprachlichen Einheiten und orientiert sich dabei an der syntaktischen Struktur Des weiteren stellt sie sicher da nur sinnvolle syntaktisch korrekte Ausdr cke erzeugt werden k nnen Die Pragmatik beschr nkt sich im Gegensatz zu den beiden vorherigen Beschreibungsebenen einer Sprache nicht ausschlie lich auf sprachinterne Ph nomene die allein am Textmaterial ausgerichtet sind sondern betrachtet das Umfeld bzw den Kontext in dem eine sprachliche u erung erfolgt Die Pragmatik bez glich der radiologischen Befundung ist dabei eindeutig festgelegt und der sprachliche Kontext ist in diesem Fall die objektive Beschreibung eines radiologischen Bildes Zur detaillierteren Charakterisierung radiologischer Fachsprachen sollen im folgenden deren wichtigste Eigenschaften beschrieben werden siehe 281 1996 Ein stilistisches Merkmal radiologischer Fachsprachen ist der sogenannte Telegrammstil Er zeichnet sich dadurch aus da radiologische Befundungstexte selten vollst ndige S tze sondern eher Standardfloskeln kein Nach
99. ch ttern Eine Bet tigung dieses Knopfes f hrt zu einer kurzen Ersch tterung des Graphen S mtliche Knoten werden jeweils zuf llig um bis zu 40 Pixel in der x und y Achse bewegt Die Verwendung dieser Funktion ist sinnvoll wenn der Animations Algorithmus bei der Verteilung der Knoten nicht voran schreitet da die Knoten sich in einer ung nstigen Lage zueinander befinden Z B zwei benachbarte Knoten m ssen sich aneinander vorbei bewegen der eine von links nach rechts der andere rechts nach links k nnen dies aber nicht da sie sich gegenseitig absto en Die Bet tigung des Knopfes f hrt dann dazu da die Position der Knoten sich zuf llig ver ndert und sie sich somit besser aneinander vorbei bewegen k nnen 11 5 3 3 4 L nge Ist dieses Auswahlfeld selektiert so wird an die Kanten des Graphen jeweils deren L nge geschrieben Die L nge ist in Pixeln angegeben Diese Angabe hilft dem Benutzer eine f r die Gr e des Graphen und des Fensters passende L nge der Kanten siehe Kapitel 11 5 2 4 3 1 2 Angestrebte Kantenl nge einzugeben damit sich die Knoten gleichm iger in dem Graph Fenster verteilen 11 5 3 3 5 Zuf llig Solange dieses Auswahlfeld selektiert ist wird pro Animationsschritt ein zuf llig ausgew hlter Knoten um eine zuf llige Anzahl von Pixeln bis zu 40 von der urspr nglichen Position entfernt in der x und y Achse bewegt Dies hat die gleiche Zweckm igkeit wie die Ersch ttern Funk
100. chen aus positiven Beispielen allein Gold 1967 als auch die Identifikation eines minimalen Automaten der konsistent ist mit einer beliebigen Menge positiver und negativer Beispiele Gold 1978 nicht effizient berechenbar ist Das Problem eine Grammatik eindeutig aus der Menge der positiven Beispiele zu bestimmen bzw zu identifizieren wird deutlich wenn man bedenkt da keine 1 1 Beziehung zwischen einer Sprache L G und einer erzeugenden Grammatik G existiert Das bedeutet da jede endliche Beispielmenge S von einer unendlichen Zahl von Grammatiken erzeugt werden kann Ohne weitere Information sei es 7 durch zus tzliche negative Beispiele oder die M glichkeit Anfragen ber die Form der Ziel Grammatik zu stellen ist eine eindeutige Zuordnung somit nicht m glich Siehe hierzu auch Fu et al 1975 Diese zun chst ern chternden Resultate leiteten eine Reihe von Forschungen nach effizienteren Inferenz Methoden ein Dabei entstanden zwei Ans tze zur effizienten Identifikation regul rer Sprachen Zum einen wurden bestimmte Anforderungen an die Form der Beispielmenge gestellt zum Anderen wurden neben den Beispielen zus tzliche Information bereitgestellt die die Lernaufgabe erleichtern sollten Trakhtenbrot et al 1973 gehen in ihrem Algorithmus von einer vollst ndigen klassifizierten Beispielmenge aus d h einer vollst ndigen Aufz hlung der Beispiele bis zu einer bestimmten L nge und einer Funktion c die die jeweiligen
101. ck von geh ren Die Partition des Automaten A in Abbildung 19 lautet Qo Q Q gt 2 Q3 Partition des Automaten A in Abbildung 20 lautet Qo Q0 Q Q1 1Q2 Q2 1Q3 Das Ergebnis des Mergingvorgangs ist somit eine Generalisierung der erzeugten Sprache formal L A L A Abbildung 20 Quotientenautomat Ein Pr fixbaum P ist ein Automat der exakt die Strings aus S akzeptiert Die formale Definition eines Pr fixbaumes P S Q 8 1 F lautet wie folgt Q Pr S I A F S und u a ua falls u ae Q Abbildung 21 zeigt einen Pr fixbaum nach der Eingabe der Strings aa abba und baa Abbildung 21 Pr fixbaum 7 Im folgenden werden die Begriffe Pr fixbaum und Pr fixautomat als quivalent betrachtet 8 DFA Generierung 64 8 2 Das Prinzip der DFA Generierung 8 2 1 Lernen als Suche Die Grammatik Inferenz regul rer Sprachen kann als Suchproblem ber der Menge der deterministischen endlichen Automaten aufgefa t werden Der Suchraum ber der Menge der DFA ist jedoch prinzipiell unendlich Zur effizienten Inferenz regul rer Sprachen bildet man anf nglich einen Pr fixbaum aus der Menge der positiven Beispiele der ausschlie lich die Worte aus S akzeptiert Der eigentliche Lernproze findet im Rahmen der Generalisierung des Pr fixbaumes statt Dieses Kapitel besch ftigt sich nun damit diesen Proze im Allgemeinen und die konkreten Inferenz Algorithmen im Speziellen zu beschreiben
102. d historisch gewachsene Sprachen deren Regeln den Gebrauch widerspiegeln ohne notwendigerweise bekannt zu sein Formale Sprachen z B Programmiersprachen sind hingegen konstruierte Systeme die aus einer festgelegten Menge grammatikalischer Regeln ableitbar sind Die radiologische Fachsprache kann zwischen den nat rlichen und den formalen Sprachen eingeordnet werden Einerseits teilt sie wichtige Struktureigenschaften mit einer Reihe nat rlicher Sprachen wie z B der deutschen der lateinischen oder der griechischen Sprache Andererseits zeichnet sie sich durch eine f r Fachsprachen symptomatische hohe Kompaktheit und Pr zision aus Diese Eigenschaft teilt sie wiederum mit den formalen Sprachen Nachfolgend sollen die unterschiedlichen linguistischen Beschreibungsebenen einer Sprache erl utert werden In Hinblick auf den im System verwendeten Ansatz Lernen 3 Radiologie 25 der Syntax aus einer vorgegebenen Menge von Befundungstexte beschr nken sich die folgenden Betrachtungen schwerpunktm ig auf die Syntax einer Sprache Die Lehre von der Struktur der S tze und ihrer Teile wird als Syntax bezeichnet Sie besch ftigt sich mit den Regeln zum Aufbau gr erer sprachlicher Einheiten etwa S tzen aus kleineren Einheiten etwa Worten Einzelne Worte besitzen dabei bestimmte morphologische Merkmale wie z B Wortart Kasus Numerus und Genus Eine Grammatik beschreibt dann eine Menge von Regeln zur sinnvollen und korrekten Kom
103. de z in Morik 1997 ermittelt die Hypothese die bezogen auf eine gegebene Metrik ein lokales Maximum im Hypothesenraum annimmt Eine sinnvolle Metrik M im Rahmen der Grammatik Inferenz k nnte die Komplexit t einer Grammatik G und die bereinstimmung der erzeugten Sprache L G mit der gegebenen Beispielmenge S in Beziehung setzen 5 2 6 Kriterien zur Evaluation von Inferenzmethoden Die folgenden Verfahren von Gold 1967 zur Identifikation bzw Enumeration d h zur exakten Bestimmung einer Sprache dienen der Erfolgskontrolle des induktiven Inferenzprozesses 5 2 6 1 Identifikation im Grenzwert identification in the limit Gegeben ist eine Klasse von Sprachen Die einzelnen Sprachen sind Strings ber einem gemeinsamen Alphabet Des weiteren gibt ein Lehrer teacher die Form vor method of information presentation in der die Beispiele dem Sch ler learner pr sentiert werden Man unterscheidet dabei den Typ text unter dem vereinfacht gesagt eine Pr sentation der positiven Beispiele der gesuchten Sprache verstanden wird sowie den Typ informant der eine Klassifizierung der gegebenen Informationen in positive und negative Beispiele der Sprache liefert Zur eindeutigen Benennung der vom Sch ler erkannten Sprache steht diesem eine sogenannte naming relation zur Verf gung Der Lehrer w hlt nun eine Sprache aus der festgelegten Sprachklasse und eine Methode der Pr sentation der Beispiele aus Nach jedem Beispiel gib
104. den Ferner sollten die diagnostisch wichtigen Erkenntnisse vor den weniger wichtigen genannt werden 3 Vereinheitlichung Viele rzte f hren hnliche Untersuchungen durch Trotzdem haben diese Befunde oftmals sehr unterschiedliches Aussehen Dies h ngt u a damit zusammen da jeder Arzt seinen individuellen Befundungsstil hat Au erdem werden in der medizinischen Fachsprache sehr oft Synonyme Akronyme und Abk rzungen in beliebiger Kombination verwendet F r Fachworte gibt es mitunter verschiedene gebr uchliche Schreibweisen die selbst innerhalb eines Befundes zu finden sind Eine knappe aber pr zise Formulierung ist einer zu ausf hrlichen vorzuziehen Eine Vereinheitlichung dieser Punkte ist f r gute Befunde erstrebenswert da dies die Lesbarkeit erh ht und einen uniformen Befundungsstil f r eine Klinik oder Praxis bietet 4 Fehlervermeidung Das System sollte bei einem neu eingegebenen Befund automatisch feststellen k nnen da ein Wort oder ein Satz des neuen Befundes schon einmal als falsch deklariert und korrigiert worden ist Es sollte dies selbst ndig feststellen und ohne weitere Anweisung korrigieren Oftmals werden die Befunddaten vom Arzt zum Teil handschriftlich oder mittels Diktat erfa t Nachtr glich m ssen sie zur Weiterverarbeitung im Rechner von einer Schreibkraft in eine elektronische Form bertragen werden Es ist zu beobachten da in diesem Medienbruch nicht nur eine Fehlerquelle liegt sondern dies auch
105. denen Kn pfen zu sehen darunter die Darstellung des DFA 11 5 3 1 Die Elemente des Graphen Der Graph ist aus drei Grundelementen aufgebaut die jeweils unterschiedlich dargestellt werden Grundelemente des Graphen Zust nde Tokens Kanten Tabelle 22 Grundelemente des Graphen Wie in Abbildung 71 zu sehen werden die verschiedenen Elemente des Graphen jeweils farbig dargestellt Diese Farbgebung ist nach individuellen Gesichtspunkten einstellbar siehe Kapitel 11 5 2 4 3 1 3 Farbauswahl Eine Erkl rung der unterschiedlichen Farben der Abbildung ist in dem Kapitel 11 5 3 3 1 Legende zu finden 11 Benutzerhandbuch 142 Zust nde und Tokens werden im Graph auch als Knoten bezeichnet Der Graph bietet nicht nur eine umfassende Gesamtdarstellung des DFA sondern kann auch gezielt Auskunft ber einzelne Zust nde und Tokens geben Wird ein Knoten mit der sekund ren i A rechten Maustaste angeklickt so ffnet sich ein spezifisches Kontextmen das weitere Informationen ber diesen Knoten bietet und auch einige nur f r diesen Knoten g ltige Funktionen zur Verf gung stellt Auch k nnen die Knoten des Graphen einzeln frei auf dem Bildschirm mittels der Drag amp Drop Technik von einer Position auf die n chste gezogen werden Dies bedeutet da ein Knoten der mit der prim ren 1 linken Maustaste angeklickt wird dann bei gedr ckter Maustaste an eine beliebige Position innerhalb des Fenste
106. der Regelmenge das vorgestellte System den Arzt bei der Befunderfassung unterst tzen kann und durch seine genannten Eigenschaften insbesondere der Dom nenunabh ngigkeit und Adaptivit t vielen bisherigen Systemen berlegen ist Eine Demoversion findet sich unter http homepage ruhr uni bochum de kai bullerdick Diplomarbeit html Abschlie ende Betrachtung 182 13 2 Ausblick Die Erstellung der Diplomarbeit und Realisierung von mAGENTa f hrte zu weitergehenden berlegungen wie die Thematik eines solchen Befundungsunterst tzungssystems weitergef hrt werden kann Hier sind vor allem zwei Gebiete f r weitere Forschung zu sehen Einerseits die Optimierung des Lernverfahrens andererseits eine Verbesserung der Mensch A genten Schnittstelle Im konkreten Fall k nnte die reale Trennung der Lernkomponente vom TokenComponent Interface zu einer Verschlankung des gesamten Systems f hren So m te der Arzt den Befundungsvorgang nicht mehr an seinem PersonalComputer durchf hren sondern k nnte mit einem Java f higen Handheldcomputer seinen Befund mobil erfassen Anschlie end werden per Infrarotanbindung an ein Intranet die Befunde zu einem Server bermittelt der dann f r viele verschiedene Benutzer den Lernproze bernimmt Hierzu k nnte auch auf das kooperative Optimieren des Lernergebnisses durch verschiedene Agenten Wert gelegt werden Eine Verschlankung des Lernvorganges w rde auch durch Festlegung auf die Parameterkombi
107. der von vorne Tabelle 8 Algorithmus zur Generierung des TokenComponent Interfaces 9 Das TokenComponent Interface 91 9 5 Die Generierung des TCI an einem Beispiel Die folgende Abbildung zeigt das TCI des in Abbildung 40 Graph f r koronare Risikofaktoren dargestellten MetaAbschnittes TokenComponent Interface HE Legende Erstellen Beenden ick Weiter Meri je Koronarekisikofaktoren r W hlen Sie Ihre Eingabe und Hypertrigiyzerid mie lt Hypercholesterin mie lt Nikotinabusus lt Dyslipoprotein mie mit Diabetes mellitus Adipositas Positive Familienanamnese lt Nicht zu erheben Inzwischen eingestellter Belastungsabh ngige arterielle Hypertonie lt Arterielle Hypertonie KoronareRisikofaktoren Abbildung 45 TokenComponent Interface f r Koronare Risikofaktoren Beginnend bei dem MetaZustand mit der Aufschrift Start werden dessen ausgehende Kanten betrachtet Jede dieser 11 Kanten wird durch einen TokenButton repr sentiert Einige der Kanten bilden lineare Pfade deren Worte zusammengefa t wurden Beispielsweise werden die Worte auf dem Pfad Start ber Z 4 zu Z 5 aufgesammelt und zu der Beschriftung Diabetes mellitus zusammengefa t Erst nach dem Zustand mit der Aufschrift Z 5 findet eine Verzweigung statt die falls der Benutzer diesen TokenButton w hlen sollte zur Generierung von neuen TokenButtons f hrt Vier der Toke
108. des 3 2 3 Kontext der radiologischen Befundung 3 2 3 1 Die universit re Ausbildung 3 2 3 2 Praxis der radiologischen Befundung 3 3 BEFUNDUNGSUNTERST TZUNGS SYSTEME 3 3 1 Generelle Vorteile von Befundungsunterst tzungs Systemen _ 3 3 2 Textbaustein basierte Systeme 3 3 3 Wissensbasierte Systeme 4 INTELLIGENTE SOFTWAREAGENTEN 4 1 BEGRIFF DES SOFTWARBAGENTEN 4 2 CHARAKTERISTIKA 4 2 1 Reaktivit t 4 2 2 Proaktivit t Zielorientiertheit 11 11 11 11 13 14 15 16 16 18 18 19 19 19 21 22 22 23 24 24 26 26 29 29 29 30 30 30 31 33 33 35 35 _ 35 Inhaltsverzeichnis 4 2 3 4 2 4 4 2 5 4 2 6 4 2 7 4 3 4 4 5 5 1 5 2 5 2 1 5 2 2 5 2 3 2 2 3 5 2 4 5 2 5 5 2 6 5 2 6 5 2 6 5 3 5 3 1 5 3 2 5 3 3 5 3 4 5 3 5 5 3 5 5 3 5 5 3 5 5 3 5 5 3 5 Schlu folgerunngs Lernf higkeit Autonomes Handeln Kommunikation Kooperation Mobilit t Charakter EINFLU GEBIETE ALLGEMEINE AUFBAU EINES INTELLIGENTEN AGENTEN MASCHINELLE LERNVERFAHREN EINF HRUNG INDUKTIVES LERNEN Spezifikation des Inferenzproblems Vergleich von Hypothesen ____ Eigenschaften von Inferenzmethoden 1 Ein Rahmen zur Evaluation von Inferenzverfahren Einschr nkungen von Inferenzmethoden Praktische Inferenzmethoden Kriterien zur Evaluation von Inferenzmethoden 1 Identifikation im Grenzwert identification in the limit 2 Identifikation durch Aufz hlung identification by enumeration GRAMMATIK
109. des Men punktes Beenden ffnet sich der oben abgebildete Dialog zur Sicherheitsabfrage Wird diese durch anklicken des Knopfes Yes best tigt so wird das System zur ckgesetzt und s mtliche zur Zeit ge ffneten Fenster von mAGENTa geschlossen Das Zur cksetzen bewirkt eine Reinitialisierung der Voreinstellungen siehe Anhang Voreinstellungen gefolgt von einer Speicherbereinigung Garbage Collection Wird der Knopf No bet tigt so wird der Dialog ohne nderungen geschlossen 11 5 2 4 2 Das Bearbeiten Men Die Punkte in diesem Men dienen der Vereinfachung der Texteingabe Wie ein Textverarbeitungsprogramm bietet auch mAGENTa die M glichkeit der einfachen Textmanipulation durch Unterst tzung der Systemzwischenablage auch Clip board genannt Die Zwischenablage ist ein Speicherbereich in dem Daten zwischengespeichert werden k nnen um z B von einer Anwendung in eine andere oder auch innerhalb einer einzelnen Anwendung transferiert zu werden 11 Benutzerhandbuch 127 Bei mAGENTa bezieht sich dieser Datentransfermechanismus auf Texteingaben Es kann also ein Text oder auch einzelne W rter bzw Buchstaben aus einer Textverarbeitung importiert oder exportiert werden Auch ist der Transfer von Text innerhalb einer Eingabe m glich In diesem Men finden sich die drei klassischen Operationen f r Daten der Zwischenablage Die Zwischenablage Operationen Ausschneiden Cut Kopieren Copy Einf gen Paste
110. e Seit den Java Foundation Classes JFC Meyer 1998 ist auch dieses Hindernis f r echte plattformunabh ngige Software genommen Als herausragende Erweiterung der JFC des JDK 1 1 ist Swing zu nennen Seit der Java 2 Platform ist Swing fester Bestandteil der Programmierschnittstelle Mittels Swing k nnen die schwergewichtigen heavyweight Komponenten die durch das Betriebssystem 11 Benutzerhandbuch 105 dargestellt und verwaltet werden durch leichtgewichtige lightweight Komponenten ersetzt werden die selbst komplett durch Java erstellt und verwaltet werden Dadurch da die Swing Komponenten plattformunabh ngig sind ist es sogar m glich zur Laufzeit eines Java Programmes dessen Layout zu einem von dem Benutzer gew nschten Layout zu ver ndern Ein Benutzer der z B die Windows Oberfl che gew hnt ist kann diese mit einem Klick einstellen der Motif Gew hnte kann mit einem Klick seine Wunsch Oberfl che wieder herstellen vgl Kapitel 11 5 2 4 3 4 6 Look amp Feel Voreingestellt ist jedoch die Swing Oberfl che Metal die einen einheitlichen Standard zur Bedienung von Java Programmen bietet Bei den Bildschirmdarstellungen der folgenden Kapitel wird dieses Look amp Feel benutzt um sie nicht mit redundanten Darstellungen zu berfrachten 11 4 Globale Oberfl chenkonzepte Ein modernes Softwaresystem sollte nicht nur funktional sondern auch ergonomisch sein Das System sollte leicht zu e
111. e EmptyComponent des TCI vorgenommen so werden die W rter die bisher noch nicht im W rterbuch zu finden waren automatisch eingetragen Der Benutzer kann nun das W rterbuch aufrufen um gezielt einzelne W rter durch Synonyme zu ersetzen Jedes Vorkommen des Wortes als Token im DFA wird nun durch das oder die neuen W rter ersetzt Werden neue Texte eingelesen so werden diese automatisch auf Eintr ge des W rterbuches berpr ft und diese gegebenenfalls vor dem Lernproze ersetzt Dies ist nicht nur in der Form einer 1 Ersetzung m glich sondern auch in der Form m n Dies bedeutet da Wortgruppen oder ganze S tze durch andere benutzerdefinierte ersetzt werden k nnen Durch dom nenspezifische W rterb cher wird der Lernvorgang unterst tzt und so das Lernergebnis verbessert W rterbuch Datei Optionen e Neuer Eintrag Ansicht Aktualisieren Graph aus W rterbuch W rterbuch aus Merge Septum Septum 8 Sicherheit Sicherheit Sicherheitsgr nden Sicherheitsgr nden SinnelSinne Sinus Sinus Sinusbradykardie Sinusbradyka rdie Sinusrhythmus Sinusrhytnmus Sitz Sitz SkleroselSklerose Abbildung 78 W rterbuch Fenster Wie andere Fenster auch bietet das W rterbuch Fenster ein Datei und Optionen Men sowie eine Werkzeugleiste f r die wichtigsten Funktionen Die Darstellung der W rterbucheintr ge selbst ist in der Mit
112. e Erfahrung in der Erstellung wissensbasierter Systeme hat gezeigt da gerade der Vorgang der Wissensakquisition oft den Flaschenhals im Entwicklungsproze darstellt Altenkr ger et al 1992 beschreiben dieses Problem wie folgt Die Erfahrung aus vielen Projekten zeigt da das Wissen von Experten zur L sung einer Aufgabe h ufig nicht bewu t vorhanden ist sondern unbewu t angewandt wird Die Ermittlung und Strukturierung des Wissens gestaltet sich h ufig deutlich schwieriger als zuvor angenommen Aber gerade das Resultat der Wissensakquisition ist f r den Erfolg oder Mi erfolg wissensbasierter Systeme entscheidend 3 Radiologie 32 Die Erstellung einer konsistenten und vollst ndigen Wissensbasis stellt somit eine gro e Herausforderung bei der Entwicklung wissensbasierter Systeme dar und ist in der Regel nur durch enge Kooperation von mehreren Fachexperten m glich Boegl et al 1995 Der Nachteil wissensbasierter Systeme im praktischen Einsatz liegt vor allem darin da in der Regel f r jede einzelne radiologische Dom ne die Modellierung des Wissens explizit durchgef hrt werden mu und nicht wie bei dem vorgestellten System ein dom nenunabh ngiges Verfahren verwendet wird das eine entsprechend aufwendige Wissensakquisition berfl ssig macht Bernauer 1991 entwickelte ein System zur Unterst tzung des Befundungsvorganges bei dem die Befundaussagen mit Hilfe einer graphischen Benutzeroberfl che zusam
113. e Menge von Daten die ben tigt wird um eine korrekte Hypothese zu inferieren Gegeben ist also eine unendliche Folge von Beispielen so da jede Regel aus der Regelmenge durch mindestens ein Beispiel abgedeckt wird admissible presentation Der Konvergenzpunkt ist nun der kleinste Index i der Eingabedaten x mit i lt n so da die gesuchte Hypothese ausgibt und alle nachfolgenden Eingabedaten x mit j gt i zu keiner Ver nderung der korrekten Hypothese mehr f hren Ein Verfahren besitzt eine h here Dateneffizienz als ein Verfahren falls M dieselbe Menge der Regeln identifiziert wie unabh ngig von der zul ssigen Folge der Eingabedaten und der Konvergenzpunkt M kleiner ist als der von Neben dem Konvergenzpunkt und der damit verbundenen Dateneffizienz ist die Anzahl der mind changes also der H ufigkeit mit der Hypothesen im Laufe des Inferenzprozesses ver ndert werden ein wichtiges Kriterium 5 2 4 Einschr nkungen von Inferenzmethoden Die Konsistenz consistence verlangt von einer Methode M da zu jedem Zeitpunkt der Inferenz die Hypothesen konsistent sind mit den gegebenen Eingabedaten d h da sie alle positiven und kein negatives Beispiel abdecken Die Verl lichkeit reliability besagt da im Falle einer Konvergenz der Methode M die korrekte Hypothese inferiert wird Im negativen Fall ist die Anzahl der unterschiedlichen Hypothesen unendlich Eine Methode ist konservativ conservati
114. e f r eine sinnvolle Anwendung verschiedene Anforderungen erf llen die im folgenden erl utert werden Anforderungen an das System ix Kategorisierung 4 Strukturierung 2 Vereinheitlichung Si Fehlervermeidung 3 Adaptivit t 6 kooperative Nutzung Tabelle I Anforderungen an das System 2 Einleitung 12 1 Kategorisierung Ein Arzt mu immer wieder die gleichen Krankheitsbilder bzw Organsysteme befunden Besonders Fach rzte haben hier ein eng umfa tes Aufgabengebiet welches immer wieder zu hnlichen Befunden f hrt Oft werden auch Befunde speziell f r eine Diagnose mit einem Untersuchungsger t erstellt Hier w ren insbesondere die radiologischen Untersuchungen zu nennen die beispielhaft f r eine Anwendung des Systems genutzt worden sind Jede Untersuchungsart wird speziell f r ein Krankheitsbild bzw eine Organregion genutzt Hierdurch ergibt sich eine Kategorisierung der Befunddom ne 2 Strukturierung Im Idealfall sollte ein Befund gut strukturiert sein Er sollte einem bestimmten Schema folgen das als Richtlinie f r eine Befundkategorie z B Computertomogramme der Halswirbels ule dient Es m ssen bei der Befundung alle f r die Diagnose wichtigen Sachverhalte erkannt und so pr zise wie m glich dargelegt werden Alle auf den Untersuchungsaufnahmen sichtbaren Organe sollten befundet werden Falls einzelne Organe sich ohne pathologischen Befund darstellen sollte dies entsprechend festgehalten wer
115. edem Besuch des MetaZustandes im TCI der Titel des MetaZustandes in den Befund bernommen um den Beginn eines neuen MetaAbschnittes zu signalisieren 11 5 2 4 3 3 5 Nach Frequenz Das TCI pr sentiert dem Benutzer die einzelnen TokenComponents in der Reihenfolge die durch die Frequenzen der repr sentierten Tokens vorgegeben wird Sollte eine Sortierung nach der Frequenz der Tokens nicht gew nscht sein so ist dieses Auswahlfeld zu deselektieren Die TokenComponents bleiben an ihrer aktuellen Position verankert sofern kein neuer Lernproze gestartet wird 11 5 2 4 3 3 6 Protokoll der TC Positionen Mit der Selektion dieses Auswahlfeld wird festgelegt da die Position einer angeklickten TokenComponent protokolliert werden soll Am Ende eines Erfassungsvorganges wird eine Auswertung dar ber angezeigt Ausf hrliche Informationen ber das Protokoll sind in Kapitel 11 5 6 5 Das Protokoll Fenster zu finden 11 5 2 4 3 3 7 Anzahl TokenChoice In dem nach Anwahl des Men punktes sich ffnenden Dialoges kann festgelegt werden wie viele TokenButtons mit gleichem Start und Endzustand zu einer TokenChoice zusammengefa t werden sollen 11 Benutzerhandbuch 134 SEE TokenChoice Eintr ge Bitte geben Sie die minimale Anzahl der Tokens ein die zu einer TokenChoice zusammengefa t werden sollen 5 Abbildung 64 Anzahl TokenChoice 11 5 2 4 3 3 8 Briefkopf Abh ngig davon ob eine Verbindung zum Internet besteh
116. ehende Kante eines dargestellten Zustandes ein TokenButton evtl zusammengefa t zu einer TokenChoice und zus tzlich eine EmptyComponent angezeigt In einer TokenComponent k nnen auch mehrere Tokens konkateniert dargestellt werden wenn sich die Tokens auf Kanten einer linearen Liste von Zust nden befinden 11 5 6 2 2 Der ZustandsRahmen Die TokenComponents die der Benutzer aktuell ausw hlen kann die direkt von dem aktuellen Zustand ausgehen sind zur besseren Sichtbarkeit mit einem Rahmen versehen Dessen Titel W hlen Sie Ihre Eingabe fordert den Benutzer auf eine TokenComponent aus diesem Rahmen zu w hlen TokenButtons werden wie gew hnliche Auswahlkn pfe TokenChoices wie Aufklapplisten bedient 11 5 6 2 3 Eingabe eines neuen Textes in eine EmptyComponent In EmptyComponents kann nach Selektion ihres Auswahlknopfes ein Text eingegeben werden Dieser Text wird dann in den DFA als neuen bergang dieses Zustandes eingef gt siehe auch Kapitel 11 5 6 4 6 Merge Der Eintrag in die EmptyCompontent f hrt durch die eingegebenen Tokens den aktuellen Zustand direkt in den n chsten MetaZustand Da oftmals schon vorhandene Texte nur geringf gig ge ndert werden sollen ist es m glich eine TokenComponent als Vorbild f r einen neuen Eintrag zu w hlen Ist eine EmptyComponent selektiert so kann anschlie end eine TokenComponent angew hlt werden Deren Beschriftung wird in das Textfeld der EmptyComponent 11 Benutzerhandb
117. eht in direktem Zusammenhang mit der L nge der Beispiele Sei nun As ein strukturierter Automat mit m Meta Abschnitten Zustandsmengen Au Au und der Gr e der zugeh rigen Zustandsmengen n nm 50 ergibt sich f r die Absch tzung der Rechenzeit f r einen Mergingvorgang auf As die Formel n1 n m Zum besseren Vergleich der Laufzeiten sei nun eine Gleichverteilung der Zustandsmengen ber die m 2 m m 3 3 Abschnitte angenommen Damit folgt f r die resultierende Laufzeit el Dieses Ergebnis zeigt da eine Strukturierung in kleinere Abschnitte neben der Einschr nkung des Hypothesenraumes eine signifikante Verringerung der Rechenzeit des Algorithmus bedeutet 8 3 1 1 3 Einschr nkung von unerw nschten Lernergebnissen Die Meta Struktur stellt eine explizite Nebenbedingung des Lernverfahrens in Form einer Gliederung des DFA dar Diese Struktur dient der Einschr nkung unerw nschter Lernergebnisse da der Merging Algorithmus ausschlie lich innerhalb einzelner Abschnitte angewendet wird Dieses Verfahren verhindert da z B Zust nde aus dem Abschnitt Untersuchungstechnik mit Zust nden aus dem Abschnitt Beurteilung verglichen und f lschlicherweise zusammengefa t werden 8 3 2 Merging von Meta Zust nden 8 3 2 1 Metaregeln Der Mergingvorgang in Bezug auf die Meta Struktur des DFA unterscheidet sich deutlich vom Mergingvorgang innerhalb der Meta Abschnitte Im ersten Fall ist das Ziel die vorgegebene u ere
118. eichen Parameter aufgerufen werden Die folgende Abbildung zeigt das Hauptfenster von mAGENTa direkt nach dem Start Am oberen Rand befinden sich das Men und darunter die Werkzeugleiste Der Gro teil des Fensters ist mit dem Textfeld f r die manuelle Befunderfassung belegt Am unteren Rand ist die Statuszeile sichtbar Datei Bearbeiten Optionen Hilfe terface W rterbuch Graph Ansicht MetaGraph Befund ffnen Ein Abbildung 51 Hauptfenster 11 5 2 1 Das Textfeld f r die Befundeingabe In dieses Feld kann der Benutzer direkt seine Texte eingeben die von dem System gelernt werden sollen Sobald der Benutzer mit der Maus einmal in das Textfeld geklickt hat oder mittels der Tabulator Taste den Selektions Fokus auf das Textfeld wandern lie kann dort der zu lernende Text eingegeben werden Wie bei allen Textfeldern in mAGENTa ist hier ein automatischer Zeilenumbruch vorhanden Das hei t sobald der eingegebene Text l nger als die vorhandene Zeilenl nge wird so wird die Zeile umgebrochen und der Text wird in der n chsten Zeile weitergef hrt Dies f hrt allerdings nicht zu unerw nschten Trennungen eines einzelnen Wortes sondern das Wort welches nicht mehr in die obere Zeile pa t wird an den Anfang der n chsten Zeile bertragen 11 Benutzerhandbuch 114 Sollte der Text ber mehr Zeilen reichen als urspr nglich in dem Textfeld zur Verf gung standen so wird automatisch am rechten Rand des T
119. eigt so zeigt der MetaGraph die MetaZust nde an Die Darstellung und Funktionalit t des MetaGraph Fensters ist mit der des Graph Fensters identisch so da hier nur auf die Unterschiede eingegangen wird 11 5 4 1 Die Elemente des MetaGraphen Im MetaGraph werden nur die MetaZust nde des DEA dargestellt Wie aus Abbildung 76 MetaGraph Fenster ersichtlich fehlen die Tokens und die brigen Zust nde Dementsprechend gibt es nur eine Art von Kanten n mlich diejenigen die von einem MetaZustand zu dem n chsten MetaZustand f hren Abstrakt betrachtet befinden sich auf diesen Kanten die einzelnen MetaAbschnitte Die Kante die z B von dem MetaZustand Koronare Risikofaktoren zu dem MetaZustand Untersuchungstechnik f hrt stellt den kompletten Abschnitt ber die koronaren Risikofaktoren eines Patienten dar In diesem Abschnitt gibt es also einen Zustand der in den MetaZustand Untersuchungstechnik berf hrt werden kann Abbildung 76 MetaGraph Fenster 11 Benutzerhandbuch 150 11 5 4 1 1 Kontextmen eines MetaZustandes MetaZustand MetaTitel Koronare Risikofaktoren ZustandsAufschrift Start MetaPosition 0 ZustandsPosition 0 Fixieren Freigeben Abbildung 77 Kontextmen eines MetaZustandes im MetaGraph Das Kontextmen eines MetaZustandes im MetaGraphen bietet folgende Eintr ge Men punkt Beschreibung Token Der Typ des Knotens MetaTitel Der MetaTitel des Zustandes als berschrift des et
120. einem Terminalzustand abwechselnd aus Zust nden und Token besteht Des weiteren besteht die M glichkeit diese Datenstruktur um eine sogenannte Meta Struktur zu erweitern die die inhaltliche Gliederung des Textes widerspiegelt siehe Kapitel 8 3 1 Dabei kann eine solche Struktur durch Setzen von Markierungen im urspr nglichen Text vorgegeben und im Rahmen der Vorverarbeitung in eine entsprechende Datenstruktur umgesetzt werden Um einzelne Worte aus der Token Sequenz herauszul sen kann der Benutzer bestimmte Zeichen als Trennzeichen f r den Tokenizer definieren Diese Trennzeichen k nnen beliebig kombiniert werden Au erdem kann dem System mitgeteilt werden ob die Trennzeichen selbst als Token interpretiert oder bei der weiteren Verarbeitung unterdr ckt werden sollen Dies kann sinnvoll sein um die Formatierung des eingelesenen Befundes durch Leerzeilen oder Absatzmarken beizubehalten 6 1 2 Das W rterbuch Das System erm glicht zum einen das automatische Ersetzen von W rtern w hrend des Einlesens der Befunde zum anderen die explizite Ver nderung von W rterbucheintr gen durch den Benutzer Somit k nnen Synonyme eingef gt 6 Systemaschitektur S M Abk rzungen expandiert lange Schreibweisen durch k rzere ersetzt und fehlerhafte Worte automatisch korrigiert werden Neben dem einfachen Speichern und Laden ist es m glich einzelne W rterb cher aus unterschiedlichen Dom nen zusammenzufassen um auf diese Weise ein W r
121. elimiter f r MetaZust nde Damit der Lernalgorithmus erkennen kann wann ein MetaAbschnitt beginnt und wie dieser Abschnitt betitelt ist mu vor dem eigentlichen Abschnitt der MetaTitel stehen Er dient dazu anstatt eines normalen Zustandes einen MetaZustand zu generieren siehe Kapitel 7 1 Das MetaStruktur Konzept Der MetaTitel besteht aus mindestens drei Worten dem Start Delimiter der den MetaTitel einleitet dem eigentlichen MetaTitel und dem End Delimiter der den MetaTitel abschlie t Der MetaTitel mu aus mindestens einem Wort bestehen kann aber auch ein ganzer Satz sein der den Inhalt des Abschnittes kurz beschreibt Die beiden Delimiter stehen neben den brigen Worte in dem zu lernenden Text So f hrt z B der folgende Eintrag in einem eingelesenen Text dazu da der MetaZustand Untersuchungstechnik gebildet wird der als Startzustand f r den Abschnitt mit dem Thema der Untersuchungstechnik fungiert Untersuchungstechnik Der Start Delimiter ist in diesem Fall das Token der End Delimiter das Token Die drei Punkte signalisiern da hier der Text des Abschnittes folgt Damit es zu keiner Verwechslung zwischen den Delimitern und den eigentlichen Worten des Textes kommen kann ist es m glich beliebige Worte festzulegen die jeweils als Delimiter fungieren sollen 7 Verarbeitung der Befundtexte 58 7 1 4 Ersetzen von Zahlen In vielen Texten sind Zahlen zu finden die nur f r einen einzigen Tex
122. elligenz Intelligenz Reaktivit t E Charakter Po Psychologie Abbildung 11 Charakteristika und deren Einflu gebiete Als wichtigste Einflu gebiete und ma geblich f r die Entwicklung der Agententechnologie sind die Bereiche der K nstlichen Intelligenz der verteilten K nstlichen Intelligenz und der Netzwerk und Kommunikationssysteme 4 Intelligente Softwareagenten 37 4 4 Allgemeiner Aufbau eines intelligenten Agenten Das Verhalten eines intelligenten Agenten l t sich abstrakt so betrachten da er basierend auf einer Eingabe eine Verarbeitung durchf hrt und dazu eine Ausgabe produziert Dieses bekannte EVA Prinzip ist f r Agenten nur auf einer sehr niedrigen Ebene anwendbar Die Eingabe ist die Wahrnehmung der Umwelt des Agenten es folgt eine intelligente Verarbeitung dieser Eindr cke und f hrt schlie lich zu Aktionen des Agenten Informations Informations verschmelzung verarbeitung E gt E Interaktion Ausgabe Aktionen emm 4 Eingabe Intelligente Wahrnehmung Verarbeitung Abbildung 12 Arbeitsprozesse eines intelligenten Agenten Wird dieser Arbeitsproze bei Agenten genauer betrachtet so besitzt ein Agent zwei Interaktionsmodule Mit dem einen nimmt er seine Umwelt d h Benutzereingaben andere Agenten Datenbanken oder hnliche Informationsquellen wahr Es liest also Informationen ein Das andere dient dazu sein Ergebnis zu kommunizieren bzw
123. elnen Fensterinhalten genommen werden z B TokenComponent Interface Die Optionen wurden auf solche Werte eingestellt da von Benutzerseite ein subjektiv gutes Ergebnis erzielt wurde Die voreingestellten Werte sind im Anhang aufgelistet Das Optionen Men verf gt ber drei Untermen s f r die Fenster Graph TokenComponent Interface und W rterbuch sowie sieben weitere Men punkte zur Einstellung von weiteren Parametern Einige Men punkte sind einfache Auswahlfelder Checkboxes andere ffnen Dialoge zur Eingabe der Voreinstellungen 11 5 2 4 3 1 Die Graph Optionen 11 5 2 4 3 1 1 Festlegen der Merging Parameter In dem in Abbildung 61 gezeigten MergingDialog k nnen die wichtigsten Parameter des Lernverfahrens eingestellt werden MergingDialog EN Bitte stellen Sie die folgenden Parameter ein Bitte geben Sie die aktiven Mergingregeln und die Anzahl zu betrachtender Vorgaenger ein Abfrage auf Zyklen D deskriptives MetaZustandsMerging Sollen Befunde mit unvollst ndiger Metastruktur zugelassen werden v Regel gleiche NachfolgeToken gleicher NachfolgeZustand v Regel2b gleiche Vorg ngerToken gleicher Vorg ngerZustand 0 Sollen die Inhalte mehrfach auftretender Regel3a beliebige NachfolgeToken gleicher NachfolgeZustand 1 Meta Abschnitte zusammengefa t werden _ unvollst ndige Metastruktur _ Betrachtung beliebiger Anzahl von Nachfolgern v MetaAbschnitte zusammenfassen 1 Regel3b
124. em eigenen Fenster auch Frame genannt dargestellt Die Fenster Hauptfenster TokenComponent Interfac W rterbuch Graph Ansicht MetaGraph Ansicht Befundfenster Tabelle 15 Die Fenster von mAGENTa 11 Benutzerhandbuch 108 Diese Fenster haben die hinl nglich bekannte Funktionalit t gew hnlicher Betriebssystemfenster wie Fensterfunktionalit t Verschieben Gr e ver ndern Minimieren Maximieren Schlie en Tabelle 16 Fensterfunktionalit t Die Fenster k nnen nat rlich nebeneinander auf dem Bildschirm dargestellt werden Dies erm glicht es dem Benutzer die f r ihn relevanten Informationen aus den einzelnen Fenstern direkt im Blickfeld zu haben F r gr tm glichen Informationsgehalt kann aber auch ein Fenster auf Bildschirmgr e maximiert werden In Fenstern in denen mehr dargestellt werden soll als es die Gr e des Fensters zur Zeit erlaubt werden jeweils am rechten und ggf unteren Rand des Fensters Rollbalken dargestellt damit der Benutzer trotzdem den weiteren Inhalt des Fenster einsehen kann Den Hauptfenstern ist gemein da sie ber eine Werkzeugleiste und ein Men nur Hauptfenster und W rterbuch verf gen Die Werkzeugleiste beinhaltet Kn pfe die bestimmte Operationen ausl sen k nnen Der Einsatz einer Werkzeugleiste erm glicht den direkten Zugriff auf h ufig genutzte Operationen ohne da der Benutzer jedesmal durch die Men struktur man vrieren
125. en eines MetaZustandes Tokens die einen Zustand in den n chsten berf hren sind als Rechtecke zu erkennen Beschriftet sind sie jeweils mit dem Wort das den vorhergehenden Zustand in den folgenden berf hrt 11 5 3 1 2 1 Kontextmen eines Tokens Token Aufschrift Nikotinabusus Position 22 Frequenz 2 Fixieren Freigeben Abbildung 74 Kontextmen eines Tokens Das Kontextmen eines Tokens bietet folgende Eintr ge Men punkt Beschreibung Token Der Typ des Knotens Aufschrift Die Beschriftung des Knotens wie sie im Graph angezeigt wird Position Die Position innerhalb des DFA interne Numerierung der Tokens Frequenz Die Frequenz des Tokens d h die Anzahl wie h ufig dieses Token gelernt bzw im TCI angeklickt wurde Fixieren Fixieren des Knotens an seiner aktuellen Fensterposition Freigeben Freigeben eines fixierten Knotens Tabelle 25 Kontextmen eines Tokens 11 Benutzerhandbuch 145 11 5 3 1 3 Kanten Kanten sind die Verbindungsstellen zwischen den einzelnen Knoten Es wird unterschieden zwischen Kanten die von einem Zustand zu einem Token f hren und Kanten die von einem Token zu einem Zustand f hren Diese zus tzliche Unterscheidung erleichtert es einen Pfad im Graph zu verfolgen Deshalb verf gen die Kanten zus tzlich ber eine Pfeilspitze die auf das Zielelement der Kante zeigt 11 5 3 2 Die Animation des Graphen Da der Graph mitunter sehr ko
126. en Befund nicht erw nscht ist da alle Abschnitte f r den Text essentielle Fakten beinhalten Es wird also nun berpr ft ob alle MetaZust nde w hrend des Vorganges der Texterfassung besucht worden sind siehe 11 Benutzerhandbuch 161 auch Kapitel 11 5 2 4 3 3 3 Mehrfaches Besuchen von Metazust nden Wurde festgestellt da ein MetaZustand noch nicht besucht worden ist dadurch da er nicht auf dem vom Benutzer eingeschlagenen Weg lag so wird dieser als n chster zur Auswahl pr sentiert damit der Benutzer auch zu diesem Abschnitt Angaben machen kann Sind alle MetaZust nde besucht worden und die zuletzt angew hlte TokenComponent f hrt zu einem TerminalZustand so ist der Vorgang der Texterfassung beendet Der letzte Rahmen wird aus dem Eingabefeld entfernt und es erscheint ein entsprechender Benachrichtigungsdialog Wurde dieser durch Bet tigung des OK Knopfes best tigt so wird das Befundfenster ge ffnet siehe Kapitel 11 5 7 Das Befund Fenster Ist bei den Optionen f r das TCI angegeben worden da ein Protokoll des Erfassungsvorganges erstellt werden soll siehe Kapitel 11 5 6 5 Das Protokoll Fenster so wird dieses nun angezeigt 11 5 6 3 Das Textfeld Durch Bet tigung der TokenComponents in der gew nschten Reihenfolge erzeugt der Benutzer einen neuen Text Dieser Text ergibt sich aus der Konkatenation der Beschriftungen der TokenComponents Zur besseren Kontrolle des bisher erzeugten Textes wird dieser in
127. en eingelesenen und vorverarbeiteten Befunden siehe Kapitel 7 zuerst eine formale Repr sentation und anschlie end im folgenden Lernschritt aus dieser die zugrundeliegende Syntax der Befundtexte erstellt wird Das Ergebnis dieses Lernverfahrens bildet die Grundlage f r den nachfolgenden Schritt der Abbildung des gelernten DFA auf eine benutzerfreundliche Oberfl che Diese Benutzeroberfl che kann wiederum zur Eingabe neuer Befunde benutzt werden Zu Beginn dieses Kapitels werden eine Reihe von Begriffen definiert die zum Verst ndnis der nachfolgenden Abschnitte beitragen In Kapitel 8 2 werden in allgemeiner Form die grundlegenden Prinzipien der DFA Generierung im Rahmen der Grammatik Inferenz beschrieben um danach konkret auf das verwendete Verfahren einzugehen Dabei wird zuerst ein Konzept beschrieben das die Datenstruktur der endlichen Automaten um eine zus tzliche Strukturierung die sogenannte Meta Struktur erweitert Diese Meta Struktur unterteilt den DFA in weitgehend autonome Abschnitte und gibt damit die inhaltliche Gliederung der Befundtexte besser wieder als der urspr ngliche DFA Der Effekt ist eine Verbesserung der Ergebnisse der nachfolgenden Lernschritte Im Rahmen des Kapitels 8 3 1 werden diverse Algorithmen auf der Grundlage der Meta Struktur beschrieben Die eigentliche Lernaufgabe d h die Inferenz der Syntax der eingelesenen Befunde findet innerhalb einzelner Abschnitte statt In diesem Zusammenhang werden die
128. en false Gibt an ob di ingestellten DerRegelnAbfrage Mergingparameter direkt oder erst nach Aufruf einer entsprechenden Operation z B Einlesen eines Befundes auf den aktuellen Graph n sS angewendet werd ollen MetaAbschnitt true Gibt an ob Abschnitte mit Abfrage identischen Meta Titeln innerhalb ines Befundes zusammengefa t werden sollen MetaStruktur true Gibt an ob eine Meta Strukturierung erw nscht ist oder die Befundtext als unstrukturierte Tokensequenzen betrachtet werden sollen regellAbfrage true Gibt an ob im Rahmen des Mergingvorganges die Regel 1 getestet werden soll regel2aAbfrage true Gibt an ob im Rahmen des Mergingvorganges die Regel 2a getestet werden soll MetaMerging false Gibt an ob der Mergingvorgang auf VarianteAbfrage Meta Ebene pr skriptiv false oder deskriptiv true erfolgen soll regel2a 2 Gibt den k Vorg ngerwert der Regeln VorgaengerAbfrage 2 regel2bAbfrage true Gibt an ob im Rahmen des Mergingvorganges die Regel 2b getestet werden soll regel2b 2 Gibt den k Vorg ngerwert der Regeln VorgaengerAbfrage 2b an regel3aAbfrage false Gibt an ob im Rahmen des Mergingvorganges die Regel 3a getestet werden soll regel3a 1 Gibt den k Vorg ngerwert der Regeln VorgaengerAbfrage 3a an Anhang Voreinstellungen 184 Parameter Voreinstellung Beschreibung regel3bAbfrage false G
129. en ist die L sung des Wortproblems NP vollst ndig Chomsky 2 Grammatiken kontextfreie Sprachen enthalten folgende Regeln mit den Bedingungen A Vy we V und 0 0 Obwohl es zur L sung des Wortproblems effiziente Algorithmen gibt z B Cocke Younger Casami bzw Earley ist in der Klasse der kontextfreien Grammatiken die Frage der Teilmengenbeziehung zweier Sprachen L G gt 2L G gt sowie die Frage nach der Schnittmenge zweier Sprachen L G NL G unentscheidbar Dies hat zur Folge da viele Lernalgorithmen f r kontextfreie Sprachen heuristischer Natur sind Das korrespondierende Maschinenmodell f r Kontextfreie Sprachen sind die nondeterministic pushdown automata PDA Chomsky 3 Grammatiken regul re Sprachen enthalten folgende Regeln A gt aB und A gt amitae VrundA Be Vyn Die Menge der regul ren Sprachen mit dem korrespondierenden Maschinenmodell der Klasse der deterministischen endlichen Automaten ist die am besten untersuchte und insbesondere im Hinblick auf die Grammatik Inferenz am h ufigsten benutzte Klasse der formalen Sprachen Als Repr sentationsformalismus f r regul re Grammatiken stehen regul re Ausdr cke Produktionsregeln DFA und NFA nichtdeterministische endliche Automaten zur Verf gung Am h ufigsten wurde dabei das Modell der deterministischen endlichen Automaten verwendet Die Gr nde hierf r liegen unter anderem darin da f r einige h ufig benutzte Operationen im Rah
130. enButtons dargestellt Jeder TokenButton steht f r eine ausgehende Kante des Zustandes Der TokenButton wird demnach mit dem Wort beschriftet das gem der Zustands bergangsfunktion den Zustand in einen Folgezustand berf hrt Die folgende Abbildung zeigt exemplarisch die graphische Ansicht des gelernten DFA f r den MetaAbschnitt Koronare Risikofaktoren nachdem 13 typische Beispiele aus der Dom ne der EBT Befunde gelernt worden sind Eine genaue Beschreibung der einzelnen Elemente des Fenster sind in Kapitel 11 5 3 Der Graph zu finden Hier gen gt es zu wissen da Kreise Zust nde repr sentieren und Rechtecke Tokens Der rote Startzustand am oberen Rand des Fensters repr sentiert 9 Das TokenComponent Interface 87 den MetaZustand f r den Abschnitt Koronare Risikofaktoren Der rote TerminalZustand am unteren Rand den folgenden MetaZustand Verstreuen Ersch ttern L nge Zuf llig Fixieren Aufl sen Fortschritt Abbildung 40 Graph f r Koronare Risikofaktoren Als Beispiel dient der in seiner Graph Darstellung abgebildete DFA 92 ZustandsRahmen Ein ZustandsRahmen repr sentiert einen Zustand von dem mehrere Kanten ausgehen Es enth lt alle TokenComponents die diesen Zustand repr sentieren Zuerst die TokenButtons und evtl TokenChoices und als letzte dargestellte Komponente eine EmptyComponent r W hlen Sie Ihre Eingabe Token1 2 lt Token
131. end wird das Hauptfenster jedoch wieder ge ffnet Damit auch optisch zu erkennen ist da es sich um eine Neuinitialisierung handelt ndert sich die Beschriftung des Buttons nach Bet tigung von Start auf Neustart Die Voreinstellungen finden sich in dem Anhang Voreinstellungen Die Diplomarbeit Netscape lel x Bearbeiten Ansicht Gehe Communicator Hilfe http homepage ruhr uni bochum de Kai Bullerdick Diplomarbeit index html mAGENTa Ein Internet Agent zur automatischen Generierung von graphischen Benutzeroberfl chen mittels maschineller Lernverfahren Datei Bearbeiten Optionen Hilfe ZS TokenComponent Interface W rterbuch Graph Ansicht MetaGraph Befund ffnen Eingabe hinzuf gen Hilfeseite Befunde Graphen Die Diplomarbeit von W rterb chern Kai Bullerdick kai Seinen Oliver Ritthoff ritth Brie feile F r Fragen Anregungen Ve TEE Dieses Projekt entstand in ek mit dem Institut f r Mikro Folien Hier kommt das Applet Bitte bet tigen sie den Start Button sobald das Applet geladen wurde des Vortrags Abbildung 50 Applet Neustart 11 Benutzerhandbuch 113 11 5 2 Das Hauptfenster Das Hauptfenster ist sozusagen die Schaltzentrale von mAGENTa Dies ist Ausgangspunkt und Zentrum des Systems von hier aus k nnen die anderen Fenster aktiviert Dateien ge ffnet und gespeichert sowie die Dialoge zur Einstellung der umfangr
132. enen Trennzeichen werden als eigenst ndige Token interpretiert tokenInzZahl false Zahlen werden als das Token xxx interpretiert DelimiterParameter Parameter Voreinstellung Beschreibung start in MetaTitel beginnt mit diesem Delimiter in einem Befund end L I in MetaTitel endet mit diesem Delimiter in einem Befund Anhang Voreinstellungen Farbschema Parameter 186 Parameter Voreinstellung Beschreibung zustandColor Color orange ein Zustand wird orange dargestellt metaColor Color red brighte MetaZustand wird hell rot r dargestellt terminalColor Color red ein TerminalZustand wird rot dargestellt tokenColor Color 250 220 ein Token wird als die Farbe mit den 100 RGB Werten 250 220 100 dargestellt selectedColor Color cyan darker ein selektierter Zustand oder Token wird dunkel cyan dargestellt fixedColor Color white ein fixierter Zustand oder Token wird wei dargestellt kanteVon Color lightGray ine Kante von einem Zustand zu einem ZzustandColor Token wird hell grau dargestellt kanteVon Color gray ine Kante von einem Token zu einem TokenColor Zustand wird grau dargestellt stressColor Color darkGray die Kantenbeschriftung mit dem Abstand zwischen Zustand und Kante in Pixeln wird dunkel grau dargestellt textColor Color black die Beschriftung wird schwarz dargestellt Netzwerk Parameter Parameter Voreinstellung Beschreibung connection
133. enten zu implementieren ist es sinnvoll dies in einer plattformunabh ngigen Programmiersprache zu tun F r gr tm gliche Unabh ngigkeit und Flexibilit t wurde hier Java 2 gew hlt um mit den Vorz gen von Swing eine vom Betriebssystem unabh ngige Darstellung zu erreichen Einmal gelernte Befundkategorien k nnen von allen rzten genutzt werden auch wenn der einzelne noch keine Befunde f r eine spezielle Kategorie verfa t hat Auch k nnen so die Ergebnisse von Befundungsvorg ngen verschiedener rzte zusammengef gt werden um zu einem umfassenderen System zu gelangen Wenn ein Agent noch keine Erfahrung ber eine bestimmte Eigenart eines Patienten hat so ist es m glich da dieser auf die eines anderen zur ckgreift und beide miteinander kombiniert Au erdem wird der Anteil der Fehler z B Rechtschreibfehler durch die kooperative Nutzung des Systems im Rahmen der Befunderstellung minimiert Sollten einzelne rzte entsprechende Fehler feststellen k nnen sie diese umgehend korrigieren und die verbesserte Version den restlichen Benutzern zug nglich machen 2 15 2 5 Aufbau der Diplomarbeit Die Diplomarbeit l t sich in drei gro e Abschnitte einteilen Die Abschnitte der Diplomarbeit 1 Die Grundlagen 2 Die Realisierung 3 Die Auswertung Tabelle 2 Die Abschnitte der Diplomarbeit Die Grundlagen und theoretischen Hintergr nde werden in den Kapiteln 3 4 und 5 behandelt Nach der Einf hrung
134. er Atomkerne kann dabei in zwei Komponenten n mlich die Spin Gitter Relaxationszeit 1 und die Spin Spin Relaxationszeit T2 aufgeschl sselt werden Empf nger HF Sender Impulsprogramm generator Abbildung 4 Erzeugung und Nachweis magnetischer Kernspinresonanz Dadurch da das vom Atomkern ausgesandte Frequenzsignal proportional zur Protonendichte im angeregten Volumen ist und sich die Protonendichten einzelner Organe unterscheiden kann aus diesen Informationen ein Bild erzeugt werden Da die Protonendichte jedoch nur geringe organspezifische Unterschiede aufweist werden sogenannte Gradientenspulen zur Kontrasterh hung eingesetzt Einen berblick ber die wichtigsten Komponenten eines Magnetresonanztomographen insbesondere die Magnet und Gradientenspulen ein System zum Senden und Empfangen von Hochfrequenz Signalen sowie ein zentraler Steuerrechner gibt Abbildung 5 3 Radiologie 21 Gradientenspulen Hochfrequenzspule oo oe G See Anschnitt der Magnetspule Abbildung 5 Aufbau eines Magnetresonanztomographen 3 1 2 2 Anwendungsgebiet Der Vorteil der Kernspintomographie ist neben der multiplanaren Schichtf hrung durch eine beliebige Orientierung des statischen Magnetfeldes und einer hohen Kontrastaufl sung der f r den Patienten weitgehend belastungsfreie Untersuchungs vorgang Indiziert ist das Verfahren u a bei Gelenk und Bandscheibenl sionen Knochen nekrosen O
135. erden konnten Es kann jedoch auch sinnvoll sein einen Zyklus mehrfach zu durchlaufen In diesem Fall ist im TCI ein Radiobutton als Darstellungselement vorgesehen Der Zusammenhang zwischen dem DFA und der erzeugten Benutzeroberfl che wird in Kapitel 9 detailliert beschrieben Konkret erf llen zwei Zust nde S und S die Regel 3b falls sie identische k Vorg nger besitzen und eine Transition beliebiger L nge zwischen diesen beiden Zust nden existie lt rt Abbildung 35 zeigt da eine Transition bestehend aus der Tokensequenz von Zustand S nach Zustand S besteht Die Listen der Vorg nger und Nachfolger Token des verbleibenden Zustandes werden dabei wiederum um die entsprechenden Listen des zu l schenden Zustandes erweitert Als Ergebnis des Mergingvorganges kann die Tokensequenz A B im TokenComponentInterface nun beliebig oft ausgew hlt werden d VER P h Zustand f Se u Zustand Zustand Sm Sx Sy K B E ES Abbildung 35 Mergingregel 3b ER N H E 5 8 DFA Generierung 81 8 3 3 1 3 Eigene Erweiterung 8 3 3 1 3 1 Regel 3aE Die Regel 3aE stellt im Vergleich zur urspr nglichen Regel 3a von Schlimmer und Hermens eine leichte Modifikation dar Die Modifikation besteht v a in einer Abschw chung des Nachfolgerkriteriums der urspr nglichen Regel Gem Regel 3aE werden nun zwei Zust nde S und S zusammengefa t falls die jeweiligen k Vorg nger bereinstimmen und die Zus
136. eren Vorgehensweise Hierdurch erfolgt eine zus tzliche Anleitung des Benutzers durch die Funktionalit t des Systems 11 4 2 Automatische Synchronisation Die Fenster von mAGENTa stehen alle in einem inneren Zusammenhang der auf den DFA als Repr sentation der gelernten Daten zur ckgeht Der Graph und der MetaGraph 11 Benutzerhandbuch 106 zeigen eine direkte graphische Ansicht das TokenComponent Interface eine Abbildung dessen und das W rterbuch die einzelnen W rter der Zustands bergangsfunktion Eine nderung des DFA z B durch das Lernen von neuen Texten mu also eine direkte Auswirkung auf das Erscheinungsbild der brigen Fenster haben Werden z B in eine EmptyComponent des TCI oder das W rterbuch neue Eintr ge vorgenommen wirkt sich das wiederum auch auf den DFA und dessen graphische Repr sentation aus Damit dies gew hrleistet werden kann herrscht in mAGENTa das Prinzip der automatischen Synchronisation vor Eine nderung in einem Fenster einem Dialog oder Men zur Einstellung von Parametern zieht die sofortige nderung der Inhalte der anderen Fenster nach sich Wird zu einem schon gelernten DFA ein neuer Text gelernt so kann direkt beobachtet werden wie sich der neue Text auf das Lernergebnis auswirkt Da es sich bei dem Lernproze bei entsprechend gro en Textmengen um eine l nger andauernde Aufgabe handeln kann ist es selektiv auch m glich die automatische Synchronisation zu verz gern Wird z B in dem D
137. erst im schon erstellten Befund vorgenommen werden Au erdem m ssen f r jede neue radiologische Dom ne explizit entsprechende Textbausteine erstellt bzw bestehende erweitert werden 3 3 3 Wissensbasierte Systeme Wissensbasierte Systeme bestehen aus einer Reihe von interagierenden Komponenten Die einzelnen Komponenten sind das Wissenserwerbsmodul das Probleml sungsmodul die Erkl rungskomponente die Wissensbasis und die Dialogkomponente Die Dialogkomponente steuert die Interaktion mit dem Benutzer insbesondere die Eingabe von Daten bez glich des aktuell zu l senden Problems sowie die Ausgabe der vom System ermittelten Probleml sung Das Probleml sungsmodul versucht anhand der eingegebenen Fakten und des vorhandenen Wissens aus der Wissensbasis das jeweilige Problem des Anwenders zu l sen Die Probleml sungskomponente wird auch als Inferenzmaschine der Probleml sungsproze als Inferenz bezeichnet Die Erkl rungskomponente vermittelt das f r eine Probleml sung angewandte Vorgehen und macht die Schlu weise des Systems f r den Anwender transparent Das Wissenserwerbsmodul erm glicht das Auff llen und die Abfrage der Wissensbasis und unterst tzt die Akquisition des Expertenwissens Die Qualit t eines wissensbasierten Systems h ngt nun ma geblich von der Wissensbasis ab Der Vorgang der Wissensakquisition wird somit zu einem der entscheidenden Schritte bei der Konzeption und dem Aufbau eines solchen Systems Di
138. erten Version 3aE Des weiteren kann er festlegen ob ein Lernvorgang auf Grundlage der oben beschriebenen Parameter sofort auf den aktuellen DFA angewendet werden soll oder mAGENTa diesen Vorgang erst nach einer entsprechenden Aktion Einlesen eines Befundes Hinzuf gen eines Graphen etc ausl st Eine direkte Anwendung der Mergingparameter kann durch Aktivierung des Auswahlfeldes Sofortige Anwendung der Regeln eingestellt werden 11 Benutzerhandbuch 130 11 5 2 4 3 1 2 Angestrebte Kantenl nge Diese Einstellung wirkt sich auf das Verhalten des Graphen bei der Darstellung im Graph Fenster siehe Kapitel 11 5 3 Der Graph aus E Optimale Kantenl nge 2 Bitte geben Sie die optimale Kantenl nge f r die Graphdarstellung ein E Abbildung 62 Angestrebte Kantenl nge Bei der fortlaufenden Aktualisierung der Graph Ansicht versuchen die einzelnen Knotenpunkte jeweils einen bestimmten Abstand zueinander zu erreichen um so einen gleichm ige Verteilung der gesamten Knoten innerhalb des Fensters zu erreichen Die L nge der Kanten zwischen den Knoten kann hier eingestellt werden Voreingestellt ist ein Wert von 5 Pixeln Ein h herer Wert bewirkt da die Knoten einen gr eren Abstand erhalten sinnvoll bei einer geringen Anzahl von Knoten und oder hohen Bildschirmaufl sung ein kleinerer Wert sorgt daf r da die Knoten n her zusammen liegen sinnvoll bei einer h heren Anzahl von Knoten und oder niedrigen Bildschirma
139. eser Knopf bet tigt worden ist wird der Lernalgorithmus den neuen Text mit den eingestellten Parametern dem bisher Gelernten hinzuf gen Falls kein Fehler bei dem Lernproze auftrat wird anschlie end der Inhalt des Textfeldes gel scht um f r neue Eingaben bereit zu stehen Falls jedoch ein Fehler w hrend des Lernvorganges auftrat erscheint eine Fehlermeldung die ber die Ursache des Fehlers Auskunft gibt Der eingegebene Befund bleibt in dem Textfeld erhalten und der Benutzer kann seinen Befund dahingehend ndern da der Text bei dem n chsten Ansto des Lernverfahrens fehlerlos gelernt werden kann 11 Benutzerhandbuch 116 Tabelle 17 zeigt die im Zusammenhang mit dem Einlesen eines Befundes potentiell auftretenden Fehler Exception zusammen mit der im jeweiligen Fall angezeigten Fehlermeldung und einer kurzen Erl uterung des entsprechenden Fehlers 10 KeinTitel Exception TextException f r den Meta Abschnitt angegeben Es wurde kein MetaTitel angegeben Exception Fehlertext Beschreibung BefundLeer Der Befund ist leer Der eingelesene Befund enth lt Exception keinen Text KeinAbschnitts wurde kein Text Ein Meta Abschnitt enth lt keinen ntsprech Ein als Me Zustand en nden Abschnitts Text ta Zustand markierter th lt keinen ntsprechenden Meta Titel KorrekterBeginn Eingabeseq
140. ests angewandt wird Unter Deduktion versteht man die formale Schlu folgerungsmethode in der Logik Mit dem deduktiven Schlu k nnen aus wahren Aussagen wiederum wahre abgeleitet werden Diese Ableitung wird durch sogenannte Schlu regeln realisiert die die 5 Maschinelle Lernverfahren 39 Eigenschaften der Vollst ndigkeit und der Korrektheit erf llen sollen Die wichtigsten H Schlu regeln sind zum einen der Modus Ponens sowie zum anderen die VxP x P a Instantiierung wobei gilt da falls alle Aussagen oberhalb der Linie wahr sind dies auch f r alle Aussagen unterhalb der Linie gilt Unter dem abduktiven Schlu wird im einfachsten Fall die Umkehrung des Modus Ponens verstanden und die entsprechende Schlu regel folgenderma en formalisiert B A gt B Der abduktive Schlu ist ebenso wie der induktive nicht wahrheitserhaltend 5 2 1 Spezifikation des Inferenzproblems Von Angluin et al 1983 stammt eine allgemeine Beschreibung des induktiven Inferenzproblems Die nachfolgende Spezifikation stellt auch den Rahmen f r das sp ter diskutierte Problem der Grammatik Inferenz dar Folgende Punkte geh ren zu einer Beschreibung des Inferenzproblems Die Klasse der zu lernenden Regeln Ziel Hypothesen Der Hypothesenraum Lp Die Menge der Beispiele Lg Die betrachtete Inferenzmethode Ein Kriterium zur Evaluation des Lernerfolges der Inferenzmethode F r den Hypothesenraum Ly mu gelten da
141. euroforamen ist nicht eingeengt nicht erzeugt werden Die Pr fixe teilen in diesem Fall also nicht alle Suffixe Andererseits ist leicht ersichtlich da nach Vertauschung von Terminal und Startzustand und nach Umkehrung aller Kanten der DFA nicht mehr deterministisch ist 8 3 3 1 1 Der Algorithmus von Angluin Der Algorithmus von Angluin ist ein Verfahren zur Grammatik Inferenz und erzeugt aus einer Menge von positiven Beispielen Befundtexten einen k reversiblen Automaten Dabei wird f r alle Zustandspaare des urspr nglichen Automaten berpr ft ob eine der in Tabelle 5 angegebenen Regeln erf llt ist In diesem Fall werden die Zust nde des entsprechenden Zustandspaares zusammengefa t siehe Kapitel 1 3 Dieser Vorgang wird solange wiederholt bis keine der aufgef hrten Regeln mehr erf llt 1st 8 DFA Generierung 75 Another state arcs to both states on the same word OR Both states have a common k Leader AND either a both states are accepting states OR b both states arc to a common state via the same word Tabelle 5 Mergingregeln von Angluin Im folgenden werden die Regeln von Angluin zur Inferenz k reversibler Sprachen die Erweiterungen von Schlimmer und Hermens und eine Modifikation einer Regel von Schlimmer und Hermens detailliert beschrieben Da das Lernergebnis entscheidend von der Kombination der o g Regeln beeinflu t wird ist ein Verst ndnis der Regeln im Einzelnen die Basis f r eine Verbesserung des Ler
142. extfeldes ein Rollbalken erscheinen um den Text zeilenweise nach oben zu rollen Mit Hilfe des Rollbalkens kann der Benutzer die nicht mehr in dem sichtbaren Bereich des Textfeldes befindlichen Zeilen einsehen indem er ihn nach oben verschiebt Der Beginn der Texteingabe bewirkt da die Kn pfe der Werkzeugleiste bis auf den Knopf Eingabe hinzuf gen deaktiviert werden Erst wenn mittels dieses Knopfes die Eingabe als vollst ndig best tigt wird beginnt der Lernproze mit den eingestellten Parametern vgl Kapitel 11 5 2 4 3 1 1 Festlegen der Merging Parameter Wenn dieser abgeschlossen ist sind die brigen Kn pfe aktivierbar und der Eingabe hinzuf gen Knopf wird wieder deaktiviert bis eine erneute Eingabe in das Textfeld erfolgt EAmAGENTa Datei Bearbeiten Optionen Hilfe 2 TokenComponent Interface W rterbuch Graph Ansicht MetaGraph ffnen Eingabe hinzuf gen Untersuchung 05 02 1999 Elektronenstrahltomographie des Herzens Klinische Angaben Belastungsabh ngige links thorakale nitropositive Schmerzsymptomatik Belastungsdyspnoe Dilatative Kardiomyopathie unklarer Genese Koronare Risikofaktoren Positive Familienanamnese Dyslipoprotein mie mit Hypercholesterin mie und Hypertriglyzerid mie Hyperurik mie Untersuchungstechnik Z Elektronenstrahltomographie des Herzens mit EKG getriggerter kontinuierlicher ransversaler 3 3 mm Schichtung von der Pulmonalisgabel bis kaudal des Apex cordis
143. fund Fenster 11 5 7 1 Das Textfeld In der obigen Abbildung ist ein Ausschnitt aus solch einem vollst ndigen Text zu sehen Durch den Rollbalken am rechten Rand des Fensters kann der Rest des Textes eingesehen werden Falls der Benutzer es w nscht kann der Text in dem Textfeld noch weiter editiert werden um weitere Eintragungen oder L schungen von Textpassagen zu t tigen Dies sollte nat rlich nicht mehr notwendig sein da alle Eingaben ber das TCI erfolgen k nnen Ist die Option aktiviert da w hrend des Lernprozesses eingelesene Zahlen durch das vorgegebene Token XXX ersetzt werden sollen siehe Kapitel 11 5 2 4 3 4 4 Ersetzen von Zahlen so k nnen hier dieser und andere Platzhalter manuell durch den gew nschten Eintrag ersetzt werden 11 Benutzerhandbuch 166 11 5 7 2 Die Werkzeugleiste Die Werkzeugleiste bietet f r die Texterfassung grundlegende Funktionen Speichern und Drucken Beide Funktionen k nnen aus Sicherheitsgr nden nur lokal wirksam werden siehe Kapitel 11 5 2 4 3 4 7 Internet Verbindung vorhanden Die Kn pfe sind nicht aktivierbar wenn die Internet Verbindung besteht 11 5 7 2 1 Speichern Wird der Speichern Knopf bet tigt so ffnet sich ein Dateiauswahldialog in dem angegeben werden Kann unter welchem Dateinamen der erstellte Text abgespeichert werden soll siehe 11 5 2 4 1 5 Speichern unter Die Datei wird in einem normalen Textformat gespeichert so da sie einfach zur Weiterverar
144. g erweitert werden um eine ad quatere 6 Systemarchitektur 53 Abbildung der inhaltlichen Gliederung der Befundungstexte zu erreichen und die Ergebnisse des Lernverfahrens zu verbessern Der eigentliche Lernvorgang erfolgt nun im Rahmen des sogenannten Mergingprozesses bei dem quivalente Zust nde des DFA zusammengefa t werden Das Ziel dieses maschinellen Lernverfahrens ist es die den Befundungstexten zugrundeliegende Syntax zu ermitteln Aus dem so erzeugten DFA der die syntaktische Struktur der eingelesenen Befunde widerspiegelt wird nun eine benutzerfreundliche Oberfl che generiert Diese als TokenComponentlInterface bezeichnete Oberfl che erm glicht es dem Arzt neue bisher noch nicht eingegebene Befunde zu erfassen Im folgenden sollen die zentralen Schritte vom Einlesen und Vorverarbeiten der Befundungstexte durch Tokenizer und W rterbuch ber den Mergingvorgang den Aufbau der Benutzeroberfl che bis zur anschlie enden Ausgabe des erstellten Befundes skizziert werden Eine ausf hrliche Behandlung dieser Schritte erfolgt im zweiten Abschnitt der Diplomarbeit 6 1 Einlesen und Vorverarbeitung der Befunde 6 1 1 Der Tokenizer Der Tokenizer verwandelt die eingelesenen Befundungstexte die aus unterschiedlichen Quellen Tastatur Festplatte Intranet oder Internet stammen k nnen in eine entsprechende Tokensequenz Aus dieser Sequenz wird nun eine Datenstruktur aufgebaut die beginnend mit einem Startzustand und endend mit
145. gen Diese Eigenschaft macht sich vor allem bei der Darstellung von Knochenstrukturen negativ bemerkbar Indikationen f r die Computertomographie sind u a Frakturen Luxationen Entz ndungen und prim re bzw sekund re Knochentumoren Burgener et al 1997 Abbildung 3 CT Aufnahmen der Lendenwirbels ule 3 1 2 Magnetresonanztomographie 3 1 2 1 Verfahren Bei der Magnetresonanztomographie synonym Kernspintomographie wird die Tatsache ausgenutzt da bestimmte Atome u a Wasserstoff bedingt durch sogenannte Kernspinbewegungen ein magnetisches Gesamtmoment ungleich Null aufweisen Dieser Effekt entsteht aufgrund eines Ladungsungleichgewichtes von Protonen und Neutronen Die Ausrichtung der Atome kann durch Anlegen eines starken magnetischen Feldes beeinflu t werden Dieses Feld f hrt zu einer gleichm igen Ausrichtung der ansonsten v llig ungeordneten Atomkerne Nun wird ein Hochfrequenzimpuls bestimmter St rke und Dauer in einem definierten Winkel zur 7 3 Radiologie 20 Achse meist 90 oder 180 der Atome eingestrahlt Dieser Impuls ndert die Richtung der in der Probe vorhandenen magnetischen Momente mehr oder weniger stark Ist der Impuls beendet bewegen sich die Atomkerne unter Energieabgabe in ihre urspr ngliche Ausgangslage zur ck W hrend dieser als Relaxationszeit bezeichneten Phase geben die Kerne ein charakteristisches Hochfrequenzsignal ab das registriert werden kann siehe Abbildung 4 Die Relaxation d
146. h die Tastenkombination Alt und aktiviert werden kann Die Tastenkombination ist auch daran zu erkennen da das f in Befund ffnen unterstrichen ist Sobald die Voraussetzungen f r die Aktivierung einer anderen Oberfl chenkomponente vorliegen wird diese auch als anw hlbar dargestellt In Abbildung 47 sind das Men und die Werkzeugleiste am oberen Rand des Fensters positioniert 11 Benutzerhandbuch 110 Datei Bearbeiten Optionen Hilfe 100 ms Quantitative Erfassung der koronaren Kalkl sionen und computergest tzte Scorebestimmung nach Kalkdichte und volumen TokenComponent Interface Befund Es wurden die folgenden koronaren Kalkl sionen gefunden deren Lokalisation und Score der folgenden Tabelle entnommen werden kann Die Einteilung der Koronarsegmente erfolgt nach den Richtlinien der American Heart Ol aph Ansicht association MetaGraph Beurteilung Eingeschr nkte Beurteilbarkeit infolge von Triggerartefakten bei Herzrhythmusst rungen Aufgrund der absoluten Arrhythmie war eine suffiziente 3 riggerung der Untersuchung nicht m glich so da das Ger t die Untersuchung Eingabe hinzuf gen W rterbuch Befund ffnen Bee ea und Auff lligkeiten in der Echokardiographie sowie der Myokardszintigraphie ist eine koronare Herzkrankheit nicht vollst ndig auszuschlie en Bitte geben Sie Ihren Befund ein und bet tigen Sie den Eingabe hinzuf gen Button wenn Sie fertig sind Abbildu
147. h mehreren Eingaben in verschiedene EmptyComponents oder erst nach einigen Texterfassungsvorg ngen zu starten ganz wie es der Benutzer w nscht Vgl auch das Kapitel 11 5 5 2 5 aus dem W rterbuch 11 5 6 5 Das Protokoll Fenster Ist die Option da der Texterfassungsvorgang protokolliert werden soll siehe Kapitel 11 5 2 4 3 3 6 Protokoll der TC Positionen selektiert so erscheint am Ende des Vorganges das TCI Protokoll in einem eigenen Fenster Das Protokoll gibt einerseits Auskunft ber die Geschwindigkeit mit der der Text mittels des TCI erfa t worden ist andererseits wird festgehalten wie h ufig die TokenComponents an einer bestimmten Position bet tigt worden sind Neben den absoluten Zahlen erfolgt auch eine prozentuale Gewichtung die angibt wie gut die Sortierung der TokenComponents helfen kann neue Texte zu erfassen Es sollten bei einem neu erstellten Text die in einem Rahmen weiter oben stehenden TokenComponents h ufiger bet tigt werden als diejenigen im unteren Bereich da die oberen gem ihren Frequenzen auch in der Vergangenheit h ufiger vorkamen 11 Benutzerhandbuch 164 Protokoll Der gesamte Befundungsvorgang dauerte insgesamt 5 Minuten und 16 Sekunden Insgesamt wurden 38 Eingaben get tigt Dies entspricht 73 68421 Dies entspricht 21 052631 Dies entspricht 2 631579 Dies entspricht 2 631579 Es wurde 28 mal die 1 TokenComponent bet tigt Es wurde 8 mal die 2 TokenComponent
148. h table in der jedem Wort eine Ersetzung zugeordnet sein kann Dies dient vor allem dazu die Befundsprache zu vereinheitlichen Automatisch k nnen Synonyme ersetzt Abk rzungen expandiert oder lange Schreibweisen durch k rzere ersetzt werden Ganz wie es der Benutzer w nscht So kann zum Beispiel eingetragen werden da das Vorkommen von Fettsucht generell durch Adipositas ersetzt werden soll Es wird hiermit die Grundlage f r eine einheitliche Nomenklatur gelegt die von allen Benutzern gleicherma en genutzt wird Da mAGENTa von verschiedenen Personen genutzt werden kann ist es sinnvoll wenn diese ihre einmal gelernten Texte austauschen und kombinieren um so ein besseres Gesamtergebnis zu erreichen Ebenso wie bei DFA ist es auch bei W rterb chern m glich diese anderen nutzbar zu machen indem ein Benutzer sein erstelltes W rterbuch abspeichert und es anderen zur Verf gung stellt Prinzipiell stellt sich hier eine gewisse Unabh ngigkeit der W rterb cher gegen ber den DEA dar Die von verschiedenen Benutzern erstellten W rterb cher k nnen nat rlich miteinander kombiniert werden um so z B ein umfassendes und einheitliches W rterbuch f r alle zu erstellen 7 59 Das W rterbuch wird selbst ndig ohne weitere Aktionen des Benutzers erweitert Wird ein neuer Text gelernt ein DFA geladen oder ein Eintrag in eine EmptyComponent des TCI vorgenommen so werden die W rter die bisher noch nicht im W rterbuch zu finden w
149. hmeformulare Anamneseb gen Arztbriefe Laboranforderungen Konsiliarberichte Operationsberichte Befundberichte etc weisen teilweise erhebliche Variationen in Art und Umfang der Strukturierung auf So unterscheidet Leiner et al 1998 Dokumente mit schwachen strukturellen Vorgaben z B Arztbriefe Operationsberichte von Dokumenten mit starken strukturellen Vorgaben z B Aufnahmeformulare Befundberichte etc Im Idealfall eines strukturierten Befundes siehe Abbildung 9 kann man auf der obersten Abstraktionssebene eine dreiteilige Gliederung in einen Briefkopf den eigentlichen Befundtext und einen Brieffu erkennen 3 Radiologie 27 Der Briefkopf setzt sich aus dem Adressaten des Befundes dem aktuellen Datum und einer Begr ungsfloskel zusammen Danach folgt je nach Dom ne z B Computertomographie Magnetresonanz tomographie oder Elektronenstrahltomographie eine vorgegebene Menge von Befundangaben im folgenden als Abschnitte bezeichnet Diese Abschnitte werden in der Regel durch ein gesondertes Trennzeichen hier Doppelpunkt bzw durch spezielle Formatierungen hier Fettdruck hervorgehoben Die vorgegebene Strukturierung der Befunde durch Aufteilung in einzelne Abschnitte wird wie bereits erw hnt beim Aufbau des entsprechenden Software Agenten verwendet Eine ausf hrlichere Diskussion dieses Strukturierungs Konzeptes findet sich in Kapitel 8 3 1 Der konkrete Befund beginnt mit der Angabe des Untersuchungsd
150. ht nach Aufruf der HTML Seite in die das mAGENTa Applet eingebettet ist werden die einzelnen Fenster vgl Tabelle 15 beschrieben Zuerst das 11 Benutzerhandbuch 111 Hauptfenster von wo aus die brigen Fenster aufgerufen werden k nnen Anschlie end das Fenster mit der Graph Ansicht gefolgt von dem hnlich aufgebauten Fenster mit der MetaGraph Ansicht dem W rterbuch Fenster dem Fenster f r das TokenComponent Interface und dem Fenster mit dem fertiggestellten Befund In den Abschnitten f r die einzelnen Fenster werden zuerst einleitende Worte die grundlegende Aufgabe dieses Fensters erkl ren Es folgt eine Erl uterung der Werkzeugleiste und falls vorhanden eine Beschreibung des Men s des Fensters Eventuell von diesem Fenster aus aufrufbaren Dialoge werden ebenfalls erkl rt 11 5 1 Start des Applets Nachdem die HTML Seite wie in Kapitel 11 2 Inbetriebnahme beschrieben aufgerufen wurde kann das Browser Fenster mit dem mAGENTa Applet beispielsweise wie folgt aussehen Die Diplomarbeit Netscape Datei Bearbeiten Ansicht Gehe Communicator Hilfe http homepage ruhr uni bochum de Kai BullerdickDiplomarbeit index html mAGENTa Ein Internet Agent zur automatischen Generierung von graphischen Benutzeroberfl chen mittels maschineller Lernverfahren am Beispiel radiologischer Befunde Das Applet Hilfeseite Befunde Graphen Die Diplomarbeit von Dozen Kai Bullerdick kai bullerdick ruhr un
151. hverarbeitung in der Medizin Anwendungen und Methoden in Nr 2 S 50 55 1993 Seelos Hans J rgen Hrsg Medizinische Informatik Biometrie und Epidemiologie de Gruyter 1997 Stowasser Josef M Der kleine Stowasser Lat dt Schulw rterbuch G Freytag 1980 Thurn P B cheler E Lackner K J Thelen M Einf hrung in die radiologische Diagnostik 10 Auflage Thieme Verlag 1998 Trakhtenbrot B Barzdin Y Finite Automata Behavior and Synthesis North Holland Publishing Company Amsterdam 1973 Wegener Ingo Effiziente Algorithmen f r grundlegende Funktionen 2 Auflage Teubner 1996 Abk rzungsverzeichnis API ATM BWS CT DFA DFS EBT FTP HTML HTTP HWS IP JAR JDK JFC JRE LWS MRT Pixel RGB Modell TCI TCP TCP IP URL Application Programming Interface Asynchronous Transfer Mode Brustwirbels ule Computertomographie Deterministic Finite Automat Deterministischer Finiter Automat Depth First Search Eletronic Beam Tomography File Transfer Protocol HyperText Markup Language HyperText Transport Protocol Halswirbels ule Internet Protocol Java Archive Java Development Kit Java Foundation Classes Java Runtime Environment Lendenwirbels ule Magnetresonanztomographie Picture Element Bildpunkt Rot Gr n Blau Modell Token Component Interface Transmission Control Protocol Transmission Control Protocol Internet Protocol Uniform Reso
152. i 1996 Altenkr ger Doris B ttner Winfried Wissensbasierte Systeme Vieweg 1992 Angluin D Inference of Reversible Languages in journal of the association of computing machinery Vol 29 Nr 3 S 741 765 1983 Angluin D Smith C H Inductive Inference Theory and Methods in Computing Surveys Vol 15 Nr 3 S 237 269 1983 Beran Georg Textgenerierung zu CT Untersuchungen ber befundorientierte Entscheidungslogik Diplomarbeit Fachbereich Informatik Universit t Dortmund 1984 Bernauer Conceptual graphs as an operational model for descriptive findings in SCAMC 1991 S 214 218 1991 Berner E S Hrsg Clinical Decision Support Systems Theory and Practice Springer 1999 Berwick Robert Pilato Sam Learning Syntax by Automata Induction in Machine Learning Nr 2 S 9 38 1987 Boegl K et al Neue Ans tze zur computerassistierten Diagnose rheumatologischer Erkrankungen in Radiologie Nr 35 S 604 610 1995 Burgener F A Kormano Martti Differentialdiagnose in der Computertomographie Thieme Verlag 1997 Caglayan Alper K Harrison Colin G Agent Sourcebook John Wiley amp Sons 1997 Comer Douglas Computer Networks and Internets zu ed Prentice Hall 1999 Literaturverzeichnis Dupont et al 1994 Dupont 1996 Dupont 1997 Finch 1993 Flanagan 1998 Fu et al 1975 Goan et al 1996 Gold 1967 Gold 1978 Hellbig 1991 Heyder et al
153. i Das WagenR cklauf Zeichen r v Der Bindestrich Sollen die obigen Trennzeichen au er Leerzeichen beim Einlesen als Token ber cksichtigt werden vi Trennzeichen als Token OK Abbrechen Abbildung 65 Festlegen der Tokenizer Parameter Mittels dieses Dialoges k nnen die Zeichen angegeben werden welche als Trennzeichen zwischen einzelnen Worten fungieren sollen damit diese als Tokens verarbeitet werden k nnen Zus tzlich zu der Angabe welche Zeichen als Trennzeichen dienen kann in diesem Dialog auch festgelegt werden ob die Trennzeichen selbst als Token betrachtet werden sollen 11 Benutzerhandbuch 136 Ist das Auswahlfeld Trennzeichen als Token nicht selektiert so werden die ausgew hlten Zeichen zwar als Trennzeichen der Tokens betrachtet nicht jedoch in den DFA aufgenommen Eine etwaige Formatierung durch Steuerzeichen geht hierbei verloren 11 5 2 4 3 4 4 Ersetzen von Zahlen Das Ersetzen von Zahlen ist eine zus tzliche Option von mAGENTa Hierbei werden im Vorfeld des eigentlichen Lernvorganges s mtliche Zahlen durch das Wort XXX ersetzt Dies hat zur Folge da der entstehende DFA und damit das entsprechende TokenComponent Interface wesentlich kompakter wird Das in Goan et al 1996 beschriebene Problem des bushy prefix trees also die Erzeugung von Zust nden mit hohem Fan Out kann dadurch verringert werden Dies f hrt zu einem entsprechend bersichtlicheren TokenComponent Interface Der
154. i bochum de Oliver Ritthoff rittho ffi uni duisburg de F r Fragen Anregungen Verbesserungsvorschl ge Fehlermeldungen usw k nnen Sie einfach eine Mail an uns schicken Farbschemata Briefteile eisen Dieses Projekt entstand in Zusammenarbeit des Lehrstuhl f r k nstliche Intelligenz der Universit t Dortmund mit dem Institut f r MikroTherapie des Lehrstuhls f r Radiologie und MikroTherapie der Universit t Witten Herdecke Folien Hier kommt das Applet des Vortrags Start Bitte bet tigen sie den Start Button sobald das Applet geladen wurde Abbildung 49 Applet Start Zu sehen ist ein Browser der Firma Netscape mit einer Beispiel HTML Seite in die das Applet eingebettet ist Das Applet wird als graues Rechteck in dem gr eren der beiden HTML Rahmen dargestellt 11 Benutzerhandbuch 112 In dem Applet selbst ist nur ein einzelner Knopf mit der Beschriftung Start sichtbar Sobald dieser Knopf bet tigt wird ffnet sich das Hauptfenster von mMAGENTa siehe Kapitel 11 5 2 Das Hauptfenster Der Knopf dient zur Initialisierung des Applets Sobald er gedr ckt wird werden die Parameter von mAGENTa auf die voreingestellten Anfangswerte gesetzt Dies ist insbesondere auch w hrend der Laufzeit m glich damit der Benutzer eventuelle nderungen an der Parametrisierung wieder r ckg ngig machen kann Zus tzlich werden alle bis dahin ge ffneten Fenster geschlossen Anschlie
155. ialog Festlegen der Merging Parameter siehe Kapitel 11 5 2 4 3 1 1 Festlegen der Merging Parameter die Option Sofortige Anwendung der Regeln aktiviert so wird sowohl bei nderung der Merging Regeln als auch direkt nach Eingabe in eine EmptyComponent im TCI sowie bei nderung der W rterbucheintr ge ein neuer Lernvorgang begonnen Ist das Auswahlfeld nicht selektiert so wird in dem Fenster des TCI und des W rterbuches der Merge Knopf aktivierbar falls dort eine nderung vorgenommen worden ist Erst nachdem dieser Knopf bet tigt worden ist wird ein neuer Lernproze gestartet Insbesondere bei multiplen Eintragungen oder nderungen in das W rterbuch ist es sinnvoll nach Abschlu aller nderungen den Lernproze anzusto en anstatt ihn automatisch nach jeder nderung beginnen zu lassen 11 4 3 Umfangreiche Unterst tzung von Maus und Tastatureingabe Der unge bte Benutzer kann mAGENTa bis auf die Eingabe von Befundtexten in der Lernphase fast vollst ndig mit der Maus bedienen Dem fortgeschrittenen Benutzer steht zus tzlich die M glichkeit offen Befehle mittels der Tastatur einzugeben Bei Systemen die ber keine Maus verf gen ist dies die einzige Eingabem glichkeit Jeder anklickbaren Oberfl chenkomponente ist ein Shortcut zugeordnet Mittels einer plattformspezifischen Meta Taste auf der Tastatur z B bei Windows die ALT Taste und eines passenden weiteren Tastendruckes wird der entsprechende Befehl durchgef
156. ibt an ob im Rahmen des Mergingvorganges die Regel 3b getestet werden soll regel3b 1 Gibt den k Vorg ngerwert der Regeln VorgaengerAbfrage 3b an Unvollstaendige false Gibt an ob bei der Eingabe der Metastruktur Befundtexte auch Teilmengen der Abfrage aktuellen Meta Abschnitte akzeptiert werden TokenComponent Interface Parameter Parameter Voreinstellung Beschreibung anzahlTokenChoice anzeige NachfolgerSymbol anzeige Steuerzeichen mehrfache Metatitel mehrfache Metazustaende protokoll briefkopf ffuss brie briefkopf Dateiname brieffuss Dateiname nachFrequenz 5 true false true true true null null Briefkopf txt Brieffu txt true die Anzahl von TokenButtons mit dem selben Vorg nger und NachfolgerZustand ab der eine Darstellung in einer TokenChoice Auswahl erfolgt gibt an ob bei angezeigten TokenComponents ein Symbol f r die Eigenschaft des NachfolgezZustandes Meta Start Terminal Zyklus angezeigt werden soll gibt an ob bei angezeigten TokenComponents die Steuerzeichen t n r angezeigt werden sollen jeweils mit einem zur Maskierung gibt an ob Metatitel im BefundFenster mehrfach angezeigt werden sollen gibt an ob MetaZust nde im TCI mehrfach besucht werden k nnen nicht soll beim n chsten weiter gemacht werden falls soll die Position der angeklickten Toke
157. ichkeit durch extrem kurze Scanzeiten Bewegungsartefakte wie sie z B im Rahmen der Herzdiagnostik auftreten weitgehend zu vermeiden 3 Radiologie 18 Als einziger Vertreter aus der Gruppe der nicht ionisierenden Verfahren wird die Magnetresonanztomographie genauer beschrieben 3 1 1 Computertomographie 3 1 1 1 Verfahren Im Unterschied zur konventionellen R ntgentechnik ist das erzeugte Bild kein berlagerungsbild sondern basiert auf einer lokalen physikalischen Eigenschaft des untersuchten Gewebes dem Schw chungsverm gen der R ntgenstrahlung Dieses l t sich in Form von quantitativen Dichteangaben in Bezug zur R ntgenabsorption von Wasser gemessen in Hounsfield Einheiten darstellen Im Grundaufbau besteht ein Computertomograph aus einer R ntgenr hre einem Detektor einem Steuerrechner und einem Bildrechner siehe hierzu Abbildung 2 Das Bildaufnahmesystem setzt sich aus der R ntgenr hre und einem Detektorfeld zusammen Dabei sind beide Komponenten entweder gekoppelt und drehen sich gemeinsam um den Patienten oder die Detektoren befinden sich in einem geschlossenen feststehenden Ring um den Patienten wobei die R ntgenr hre rotiert W hrend des Untersuchungsvorgangs wird im Rahmen der Me werterfassung f r jede Winkelposition ein Absorptionsprofil erstellt Aus der Gesamtheit der eindimensionalen Absorptionsprofile rekonstruiert ein Rechner nun mittels der sogenannten gefilterten R ckprojektion eine zweidimens
158. ie Single Photon Emission Endoskopie Tomographie DH Digitale Luminiszens Radiographie Elektronen strahl tomographe Digitale Angiographie Subtraktions Angiographie Abbildung 1 Bildgebende Verfahren in der Radiologie Die bildgebenden Verfahren k nnen nach der Form der Bildrepr sentation in analoge und digitale Verfahren eingeteilt werden Zu den analogen Verfahren z hlt man unter anderem die konventionelle R ntgenbildtechnik Dieses Verfahren stellt die Basis der radiologischen Diagnostik der Wirbels ule dar und wird in der Praxis im Bedarfsfall durch digitale Verfahren erg nzt Der Vorteil der digitalen Verfahren liegt dabei in der direkten Weiterverarbeitung der radiologischen Bilder durch einen Rechner Die digitale Form der Bilddaten erm glicht z B die Bildverbesserung verrauschter Daten diverse Visualisierungsmethoden z B in Form von 3D Darstellungen der Daten die Bildanalyse z B durch Segmentierung bestimmter Bildregionen sowie die bertragung bzw Speicherung digitaler Bilddaten im Rahmen von Bildarchivierungs und Kommunikationssystemen Bei den digitalen Untersuchungsverfahren unterscheidet man ionisierende auf R ntgenstrahlung basierende und nicht ionisierende Methoden Unter den ionisierenden Methoden ist die Computertomographie die am h ufigsten verwendete Erg nzung analoger Verfahren Daneben bildet ein relativ neues Verfahren die Elektronenstrahltomographie die M gl
159. ie manuelle Eingabe in das Textfeldes des Hauptfeldes w re hier recht arbeitsintensiv Selbst wenn die Texte in elektronischer Form als Textdateien vorl gen m te jede einzelne Datei explizit ber den Men punkt ffnen hinzugef gt werden Bei mehreren Dutzend oder hunderten von Texten wie bei den Testreihen im Rahmen der Diplomarbeit wird selbst die einfache Bedienung der Maus als zu aufwendig betrachtet Hierf r bietet mAGENTa die M glichkeit an Listen von Befunden zu verarbeiten und von dem System lernen zu lassen Diese Befundlisten sind einfache Textdateien deren einzelne Zeilen jeweils den Dateinamen eines Textes enthalten der sich in dem selben Verzeichnis wie die Befundliste befindet S mtliche Dateien aus der Befundliste werden mit den aktuell eingestellten Parametern gelernt Die Befundliste selbst wird mit den bekannten Dateiauswahldialogen f r das ffnen von Dateien entweder lokal oder ber das Netzwerk eingelesen Eine weitergehende Automatisierung des Einlesens und Lernens von sehr vielen Befunden bietet die erg nzend entwickelte Software mAGENTaScript siehe Kapitel 11 6 mAGENTascript 11 5 2 4 1 7 Merging Protokoll anzeigen Es nicht nur wichtig da etwas gelernt worden ist sondern es interessiert aus theoretischer Sicht auch insbesondere wie etwas gelernt worden ist Hierf r wird von mAGENTa ein Protokoll des Lernvorganges erstellt Insbesondere finden die Protokolle des Lernprozesses unter unte
160. ines eng begrenzten Rahmens der sandbox auf einen Client Computer zugreifen k nnen Es ist vor allem nicht m glich direkt auf Speicherbereiche des Betriebssystems die Festplatte oder den Drucker zuzugreifen Wird das Applet allerdings lokal in dem Appletviewer ausgef hrt so treten die Einschr nkungen bzgl des Lesens und Schreibens auf der Festplatte sowie des Druckens nicht auf da hier davon ausgegangen wird da lokal ausgef hrte Applets grunds tzlich vertrauensw rdig sind und keine Gefahr f r den Computer darstellen 11 1 2 Der Server Auf dem Server m ssen die HTML Seiten die Klassen von mAGENTa sowie optionale Zusatzdateien in verschiedenen Verzeichnissen abgelegt werden damit diese von einem Client angefordert werden k nnen Das Ablegen der Dateien auf dem Server kann entweder durch direktes Einspielen der Dateien vor Ort oder mittels eines FTP File Transfer Protocol Programmes geschehen Als Server reicht ein einfacher HTTP Hypertext Transfer Protocol Server aus auf dessen angebotene Seiten ein Client lesend zugreifen kann 11 Benutzerhandbuch 102 11 1 2 1 Die HTML Seite Die HTML Seite in die das Applet eingebettet ist sollte minimal den folgenden Eintrag f r das Applet beinhalten HTML Tag f r das Applet APPLE ARCHIVE Magenta jar CODE ProjektApplet class wWIDTH 130 HEIGHT 80 ALIGN MIDDLE ALT Ihr Browser mu mindestens die Java
161. ionale Schichtaufnahme Thurn et al 1998 Computersystem Detektorsystem Archivierung lerfassung rekonstruktion 2 P auf Daten und Bild Zei L speicherung El L tsch SCH R ntgen gt darstellung generator pea und g s d Auswertung R ntgenr hre Mn en Steuerrechner Ger teelektronik gt Bedienpult Abbildung 2 Aufbau eines Computertomographen 3 Radiologie 19 3 1 1 2 Anwendungsgebiet Aufgrund der transversalen Darstellung und der verbesserten Beurteilbarkeit durch eine deutlich bessere Kontrastabstufung der dem Knochen benachbarten Weichteilstrukturen hat sich die Computertomographie in der Diagnostik von Skeletterkrankungen insbesondere im Bereich der Wirbels ule etabliert und kann im Vergleich zu konventionellen Verfahren zus tzliche diagnostische Informationen bieten Lissner et al 1992 Au erdem kann die Gewebsdichte nicht nur qualitativ wie bei der konventionellen R ntgentechnik sondern auch numerisch erfa t und gespeichert werden Dies erm glicht z B neben der transversalen Darstellung der Ausgangsdaten die Rekonstruktion sagittaler oder Schichtaufnahmen ohne zus tzliche Belastung des Patienten Ein Nachteil des Verfahrens ist das im Vergleich zur konventionellen Tomographie deutlich geringere r umliche Aufl sungsverm
162. isierungen Mittels der Parametrisierungen des TokenComponent Interface lassen sich Einstellungen vornehmen die bei der Benutzung des TCI in der Oberfl che Informationen ber den DFA anzeigen um den Benutzter bei der Erstellung von Texten behilflich zu sein Durch weitere Einstellungen l t sich Einflu auf den Weg des Benutzers durch den DFA nehmen und somit auch auf den erstellten Text der durch die Tokens auf dem Pfad durch den DFA gebildet wird 9 6 1 Anzeige von Nachfolgersymbolen Ist dieses Auswahlfeld selektiert so werden im TCI Informationen ber denjenigen Zustand angezeigt der erreicht wird wenn eine TokenComponent bet tigt wird Die Eigenschaften dieses Zustandes werden jeweils durch ein bestimmtes Symbol dargestellt Eigenschaft des nachfolgen Zustandes Symbol TerminalZustand a StartZustand MetaZustand ul Zustand befindet sich in einem Zyklus Tabelle 9 Symbole f r die Eigenschaften des nachfolgenden Zustandes 9 Das TokenComponent Interface 93 Diese Symbole dienen zur Information des Benutzers und erm glichen ihm die n chste Auswahl der TokenComponents differenzierter zu treffen Da ein Zustand auch ber mehrere der folgenden Eigenschaften verf gen kann werden die entsprechenden Symbole nebeneinander von rechts nach links angezeigt Befindet sich z B ein MetaZustand in einem Zyklus so wird das MetaZustand Symbol am rechten Rand der TokenComponent gezeichnet das Symbol f
163. iteren Befundungsvorgang am wahrscheinlichsten ist Diese Reihenfolge ergibt sich gem der Annahme da Textesequenzen die in der Vergangenheit h ufig in gelernten Texten vorkamen auch in der Zukunft h ufiger erfa t werden Jedes Token verf gt ber eine Frequenz die angibt wie h ufig dieses Token in den bisher gelernten Texten auftrat Diese Frequenz wird neben dem Lernproze auch dann erh ht wenn die TokenComponent die dieses Token repr sentiert w hrend der Benutzung des TCI bet tigt wird Durch h ufiges Bet tigen einer TokenComponent wird diese in der Anzeige des TCI nach oben wandern Je h her die Frequenz ist desto h her ist die Wahrscheinlichkeit f r ein Auftreten dieses Tokens nach seinem Vorg ngerzustand Demzufolge ergibt sich die Sortierung der TokenComponents als Sortierung der Frequenzen des jeweils ersten Tokens in den TokenComponents Sollte eine Sortierung nach der Frequenz der Tokens nicht gew nscht sein so ist dieses Auswahlfeld zu deselektieren Die Frequenzen werden somit nicht mehr bei der Reihenfolge der TokenComponents ber cksichtigt Sie werden in der Reihenfolge dargestellt die der Lernalgorithmus f r die Zust nde und Token vorgibt Werden keine weiteren Text gelernt so ndert sich auch nicht die Reihenfolge der TokenComponts Selbst die Erstellung eines Textes mit Hilfe des TCI ver ndert die Reihenfolge der TokenComponents nicht obwohl die Frequenz der Token jeweils erh ht wird Erst wenn
164. jeden Zustand im DFA der mehr als einen Zustands bergang hat kann der Arzt zwischen diesen Zustands berg ngen w hlen um in den nachfolgenden Zustand zu gelangen Die Wahlm glichkeit an diesen Zust nden wird im TCI durch Radiobuttons repr sentiert Jeder Radiobutton wird mit der Tokensequenz beschriftet die den aktuellen Zustand in den Folgezustand berf hrt Jeder der urspr nglich eingelesenen Befundungstexte entspricht somit einem bestimmten Pfad im DFA 6 4 Das Erstellen von Befundungstexten Der eigentliche Befundungstext setzt sich aus der Folge von Tokensequenzen zusammen die der Arzt im TokenComponentlInterface durch Anklicken der entsprechenden RadioButtons w hrend seines Befundungsvorganges ausw hlt Der Befundungsvorgang ist beendet wenn der Arzt s mtliche Abschnitte z B 6 Systemarchitektur 55 Untersuchungstechnik Fragestellung etc behandelt hat und im DFA den Terminalzustand erreicht Zus tzlich besteht die M glichkeit automatisch einen Briefkopf enth lt z B ein Standardanschreiben vor bzw einen Brieffu enth lt z B eine Verabschiedungs floskel hinter den Befundungstext einzuf gen Anschlie end kann der so erstellte Befund gespeichert oder direkt ausgedruckt werden Das bestehende System zeichnet sich durch eine hohe Flexibilit t und Adaptivit t aus So kann der Benutzer durch eine Reihe von Parametern sowohl die Eigenschaften des Tokenizers des W rterbuches der Benutzeroberfl che
165. kategorien unterst tzt werden sollen sondern auch g nzlich andere Arten strukturierter Texte wie z B Formbriefe aus beh rdlichen Einrichtungen Der Rahmen in dem die Evaluation des Systems erfolgt soll jedoch beschr nkt bleiben auf einzelne radiologische Dom nen 2 3 Bisherige L sungsans tze Bestehende Befundungsunterst tzungssysteme haben das Manko da sie von den rzten als nicht sehr benutzerfreundlich empfunden werden Bei Textbaustein basierten Systemen werden die Befundtexte aus vorgefertigten S tzen zusammengef gt Diese S tze haben aber keinen Bezug untereinander so da der Benutzer nicht strukturiert durch den Befundungsvorgang geleitet wird Auch ist eine nderung der vorgefertigten S tze nicht immer einfach m glich sondern kann erst im schon erstellten Befund vorgenommen werden Ebenso unflexibel stellen sich wissensbasierte Systeme dar W hrend eine strukturierte Befundungsanleitung m glich ist ist es hier ebenso schwierig f r einen Arzt das Hintergrundwissen dieser Systeme den eigenen 2 Einleitung 14 Bed rfnissen entsprechend zu modifizieren F r jede Befundkategorie mu au erdem eine neue Wissenbasis aufwendig erstellt werden 2 4 L sungsansatz durch einen Softwareagenten Das hier vorgestellte System soll den Arzt aktiv bei der Befunderstellung unterst tzen indem es das Erfassen von Befunden beobachtet aus den erfa ten Befunden lernt und ihn bei seinen n chsten Befundungen strukturiert anlei
166. kation durch Aufz hlung identification by enumeration Bei diesem Verfahren werden die gesamten Elemente des Hypothesenraumes systematisch aufgez hlt Nach jedem neuen Beispiel wird diese Aufz hlung durchsucht und das erste Element dieser Liste z B die gefundene Sprache bzw der gefundene DFA ausgegeben das mit den bisherigen Daten konsistent ist Dabei mu nat rlich gew hrleistet sein da die Erzeugung der Aufz hlung und die Konsistenzpr fung mit den aktuellen Daten berechenbar ist Der gr te Nachteil dieser Methode ist da der Hypothesenraum der jeweils durchsucht werden mu exponentiell in der Gr e der Eingabemenge ist 5 3 Grammatik Inferenz Die Grammatik Inferenz kann als eine Instanz des induktiven Lernens betrachtet werden Sie stellt im Rahmen der nat rlichen Sprachverarbeitung ein Werkzeug dar mit dem Strukturen innerhalb einer Sprache genauer innerhalb der Syntax einer Sprache ermittelt werden k nnen Definiert ist die Grammatik Inferenz als ein Proze der aus einer Menge von Beispielen die erzeugende Grammatik lernt Neben der Menge der positiven Beispiele also der grammatikalisch korrekten S tze werden in einigen Algorithmen auch negative Beispiele grammatikalisch inkorrekte S tze zur Inferenz der Grammatik verwendet Als grundlegende Einf hrungen in den Bereich der Grammatik Inferenz sei an dieser Stelle z B auf Parekh et al 1998 und Dupont 1997 verwiesen 5 3 1 Definitionen Ei
167. m nen und den gew hlten Mergingparametern im Verlauf des Lernvorganges der prozentuale Anteil neuer Worte stetig abnimmt und somit die Menge der vom jeweiligen DFA neu erzeugten S tze gegen Null konvergiert E CT LWS m CT HWS MRT LWS Zuwachs der Wortanzahl in 49 57 65 73 e E 105 113 121 Abbildung 86 prozentualerZuwachs der Wortanzahl 12 Testergebnisse 171 12 2 2 Komprimierungsgrad des DFA Der Komprimierungsgrad eines endlichen Automaten bez glich des jeweiligen Pr fixbaumes kann als ein Indikator f r die Qualit t des gewertet werden Generell ist ein hoher Komprimierungsgrad ein Indiz f r einen entsprechend hohen Zyklenanteil siehe Kapitel 12 2 3 und hat in der Regel eine Verringerung der Benutzerfreundlichkeit der entsprechenden Oberfl chen zur Folge Andererseits zeigen die nachfolgenden Testergebnisse da ein niedriger Komprimierungsgrad von ca 30 40 wie im Fall der Regelmenge 12a02b0 kein hinreichendes Kriterium ist um eine subjektive Benutzerfreundlichkeit des Systems zu garantieren Des weiteren zeigt Abbildung 87 da die urspr ngliche 12 02603 1361 und die erweiterte 12a02b03aE13b1 Regelmenge von Schlimmer und Hermens mit einem k Vorg ngerwert von 0 einen Komprimierungsgrad von bis zu 94 aufweisen wohingegen der Komprimierungsgrad nach Anwendung der Regelmenge von Angluin mit einem k Vorg ngerwert von 2 12a22b2 und 12
168. men der Grammatik Inferenz wie z B der Minimierung von Automaten dem Test auf quivalenz bzw Inklusionsbeziehungen zweier Sprachen effiziente Algorithmen existieren 5 3 3 Spezifikation der Grammatik Inferenz Das allen Methoden der Grammatik Inferenz zugrundeliegende Prinzip wird in Abbildung 16 verdeutlicht Gesucht wird eine Grammatik G das Ergebnis des Inferenz Prozesses die die zu lernende Grammatik Go identifiziert bzw m glichst gut approximiert Dabei ist die Existenz der Grammatik Go eine reine Modellierungshypothese Anders formuliert kann man die Grammatik als Black Box betrachten von der nur das Verhalten die von Go erzeugten S tze bzw Beispiele 5 Maschinelle Lernverfahren 47 bekannt ist Die Art der Eingabedaten kann jedoch je nach Verfahren variieren So stellen einige Verfahren besondere Anforderungen an die Beispielmenge z B explizite negative Beispiele bzw ben tigen neben den Beispielen zus tzliche Informationen Dieser Aspekt der Inferenz wird detaillierter in Kapitel 5 3 4 behandelt Grammatik Go Beispiele Grammatik G Erzeugung Inferenz Abbildung 16 Prinzip der Grammatik Inferenz 5 3 4 Theoretische Resultate der Grammatik Inferenz regul rer Sprachen Gold legte mit den folgenden Ergebnissen aus dem Bereich der Identifikation formaler Sprachen einen Grundstein der theoretischen Forschung im Bereich der Grammatik Inferenz Er bewies da sowohl die Identifikation regul rer Spra
169. mengestellt und anschlie end als Text ausgegeben werden k nnen Dabei beschr nkt ein Dom nenmodell die Eingabem glichkeiten die ber die Benutzeroberfl che vorgenommen werden k nnen wobei die Semantik einer u erung hierbei mittels eines Conceptual Graphs realisiert wird Auch hier stellt sich wieder das Problem das Wissen das in Form eines Conceptual Graphs repr sentiert wird entsprechend zu akquirieren Eine ausf hrlichere Betrachtung wissensbasierter Systeme in der Medizin findet sich z B in Adlassnig 1993 und Berner et al 1999 4 Intelligente Softwareagenten 4 1 Begriff des Softwareagenten Dieses Kapitel soll als Einf hrung in den Begriff der intelligenten Softwareagenten dienen Gegenw rtig existieren hierf r zahlreiche unscharfe und teilweise sich berschneidende Begriffsdefinitionen Eine wesentliche Eigenschaft eines Softwareagenten ist seine Intelligenz Ohne auf die weitere Definition von Intelligenz eingehen zu wollen l t sich feststellen da die F higkeit des Lernens im Allgemeinen als intelligent angesehen wird Der in der deutschsprachigen Literatur verwendete Begriff des Agenten beruht auf der inkorrekten bersetzung des englischen Begriffes agent L th 1998 was eigentlich soviel wie Handelnder bzw wirkende Kraft Langenscheidt 1991 bedeutet und von dem lateinischen Verb agere abgeleitet ist Stowasser 1980 welches sich im Deutschen noch in den Begriffen agieren und Agentu
170. mit einer Akquisitionszeit pro Bild von 100 ms Quantitative Erfassung der koronaren Kalkl sionen und computergest tzte Scorebestimmung nach Kalkdichte und volumen Befund Es wurden die folgenden koronaren Kalkl sionen gefunden deren Lokalisation und Score der olgenden Tabelle entnommen werden kann Die Einteilung der Koronarsegmente erfolgt nach den Richtlinien der American Heart Association L sionen Segment 2 Segmentscore 2 8 pran Ae Bitte geben Sie Ihren Befund ein und bet tigen Sie den Eingabe hinzuf gen Button wenn Sie fertig sind Abbildung 52 Eingabe in das Hauptfenster Die obige Abbildung zeigt das Hauptfenster bei einem manuell eingegebenen Befund Zu bemerken ist hierbei da jeder MetaAbschnitt tats chlich jeweils in nur einer einzigen Zeile liegt und diese am rechten Rand des Textfeldes entsprechend umgebrochen wurde 11 5 2 2 Die Statuszeile In ihr werden f r die jeweiligen von dem Benutzer ausgel sten Aktionen kurze Mitteilungen ber deren Status angezeigt Dies geschieht sowohl bei Aktionen die ber die Werkzeugleiste aktiviert werden als auch ber Aufrufe durch das Men 11 Benutzerhandbuch 115 Bei vielen Aktionen erh lt der Benutzer Hinweise auf die weitere sinnvolle Vorgehensweise Z B wird bei der Eingabe eines Textes in das Textfeld eine Meldung eingeblendet die dem Benutzer mitteilt da sobald die Eingabe abgeschlossen ist der Eingabe hinzuf gen Knopf
171. mplex werden kann ist es notwendig da dieser in einer geordneten Darstellung angezeigt wird Der Graph versucht in diese geordnete Darstellung zu gelangen indem sich die einzelnen Knoten Zust nde und Tokens gleichm ig in dem Fenster verteilen und danach streben jeweils einen bestimmten Abstand zueinander zu erlangen Dieser optimale Abstand kann mittels der Option Angestrebte Kantenl nge festgelegt werden siehe Kapitel 11 5 2 4 3 1 2 Angestrebte Kantenl nge Der Graph ist in einer geordneten Darstellung wenn kein Knoten von einem anderen berdeckt wird und die Kanten keine berschneidungen aufweisen Dieses Ziel ist in realen Graphen meistens nicht erreichbar da einerseits nicht jeder beliebige Graph planar ist Wegener 1996 und andererseits die Fenstergr e einfach zu klein ist um alle Knoten anzuzeigen Der Graph strebt solange nach einer geordneten Darstellung bis der Benutzer den Proze anh lt da eine befriedigende Darstellung erreicht worden ist insbesondere dann wenn nur Teile des gesamten Graphen von prim rem Interesse sind Die folgende Skizze des Algorithmus stellt das Vorgehen informal dar Der Graph Algorithmus Solange kein Anhalten durch den Benutzer F r jeden Knoten wird der Abstand zu seinen direkten Vorg ngern und Nachfolgern bestimmt Schrittweise versuchen diese Nachbarn zwischen sich den optimalen Abstand zu erreichen Ist der optimale Abstand g
172. n Kantenl nge Text OK Abbrechen Abbildung 63 Farbauswahldialog Die Auswahl eines Elementes geschieht ber die auf der linken Seite des Dialoges aufgelisteten Auswahlkn pfe Wird ein Auswahlknopf angeklickt so erscheinen die Farbkomponentenwerte in den entsprechenden Textfeldern die Schieberegler werden auf die passende relative Position zwischen und 255 gesetzt und das Farbfeld erh lt die aktuell g ltige Farbe des Elementes Die einzelnen Werte f r ein Element k nnen entweder ber einen Schieberegler oder direkt in ein Textfeld eingegeben werden Ein Ziehen des Schiebereglers erh ht oder erniedrigt direkt den Wert in dem nebenstehenden Textfeld Zur Kontrolle des Farbergebnisses nach nderung eines Wertes wird in dem Dialog ein rechteckiger Canvas Bereich entsprechend der resultierenden Farbe eingef rbt Ist das Graph oder MetaGraph Fenster ge ffnet so werden die einzelnen Komponenten parallel zum Ziehen des Schiebereglers eingef rbt Somit kann der Benutzer direkt die Farb nderungen am aktuellen Graphen w hrend der Aktualisierung beobachten Erst wenn der Benutzer die Auswahl seiner Farben beendet hat und den Dialog mittels des OK Knopfes schlie t wird die nderung der Farben aber in den Graphen bzw 11 Benutzerhandbuch 132 MetaGraphen bernommen Wird der Dialog mittels des Abbrechen Knopfes verlassen so stellt mMAGENTa die vorher g ltige Farbgebung wieder her Da nicht jeder Benutzer eine
173. n Dies hat den Vorteil da es bei der Eingabe der Befundtexte ausreicht sich auf pathologische Beschreibungen zu beschr nken Nicht aufgef hrte Abschnitte wie z B Segment 1 2 Segment 2 3 und Segment 4 5 in Abbildung 25 werden dabei als unauff llig bzw ohne Befund gewertet ohne dies explizit angeben zu m ssen Befund 1 Befund 2 Ergebnis Untersuchun Untersuchung A 9 Untersuchung y Le e Fragestellung A Untersuchungs b Fragestellung technik D v Untersuchungs JUntersuchungs f technik u technik N IN a IN A H Abbildung 26 Verarbeitung unvollst ndiger Befunde 8 DFA Generierung 73 8 3 2 5 Verarbeitung von Befunden mit mehrfach auftretenden Meta Titeln Neben der soeben beschriebenen M glichkeit unvollst ndige Befunde einzugeben k nnen auch Befunde verarbeitet werden in denen einzelne Abschnitte mehr als einmal aufgef hrt werden Diese Option erm glicht es Befunde zu verarbeiten bei denen die Inhalte einzelner Abschnitte beliebig innerhalb des Befundtextes verteilt sind Wie in Abbildung 27 zu erkennen ist der Abschnitt Untersuchung in Befund 2 in zwei Teile U und aufgeteilt Das Ergebnis des Mergingvorgangs zeigt da U und U3 zusammengefa t worden sind Befund 1 Befund 2 Ergebnis fei Untersuchung Untersuchung SE Fragestellung Fragestellung Untersuchungs technik Unter
174. n hnlichen Farbgeschmack hat kann mittels der Kn pfe im oberen Bereich des Dialoges ein geeignetes Farbschema wie in Kapitel 11 5 2 4 1 2 ffnen bzw Kapitel 11 5 2 4 1 5 Speichern unter f r Graphen beschrieben ge ffnet und gespeichert werden 11 5 2 4 3 2 Die W rterbuch Optionen F r das W rterbuch kann nur eine Einstellung ge ndert werden Weitergehende Informationen bez glich der Bedienung des W rterbuches sind in Kapitel 11 5 5 Das W rterbuch zu finden Eine Beschreibung des selbst W rterbuches liefert das Kapitel 7 2 Das W rterbuch 11 5 2 4 3 2 1 Maximale Anzahl von Eintr gen pro Seite Da das W rterbuch Fenster ber ein eigenes Optionen Men mit einem identischen Men punkt verf gt wird dieses ausf hrlich dort beschrieben siehe Kapitel 11 5 5 3 2 1 Maximale Anzahl von Eintr gen pro Seite 11 5 2 4 3 3 Die TokenComponent Interface Optionen Da diese Optionen schon in Kapitel 9 Das TokenComponent Interface ausf hrlich beschrieben worden sind erfolgt hier nur noch einmal der Vollst ndigkeit halber eine kurze Auflistung der Men eintr ge die eher auf die Bedienung als auf die dahinter liegende Theorie eingeht Eine ausf hrliche Beschreibung der Bedienung des TCI findet sich in Kapitel 11 5 6 Das TokenComponent Interface 11 5 2 4 3 3 1 Anzeige Nachfolger Symbol Ist dieses Auswahlfeld selektiert so werden im TCI Informationen ber denjenigen Zustand angezeigt der erreicht wird
175. n Bezug auf das Lernen von Sprache liegt hierbei vor allem auf der Analyse ihrer Syntax Dieses Kapitel beginnt mit einer Einf hrung in das induktive Lernen zur Einordnung des Systems in das Gebiet maschineller Lernverfahren Danach folgt der thematische Schwerpunkt dieses Kapitels die Grammatik Inferenz Sowohl das einf hrende Kapitel zum induktiven Lernen als auch die Ausf hrungen zur Grammatik Inferenz erfolgen vor dem Hintergrund des Paradigmas der Identifikation im Grenzwert So werden bei der nachfolgenden Beschreibung entsprechender Lernverfahren zur Grammatik Inferenz heuristische Verfahren z B auf der Grundlage konnektionistischer bzw stochastischer Modelle nicht diskutiert 5 2 Induktives Lernen Eine allgemeine Definition des induktiven Lernens stammt von Angluin et al 1983 und bezeichnet dieses als act process or result of an instance of reasoning from a part to a whole from particulars to generals or from individuals to the universal Dupont 1997 definiert induktives Lernen im Kontext der Grammatik Inferenz als the task of discovering common structures in examples which supposed to be generated by the same process Bei den logischen Schlu folgerungsverfahren werden neben dem induktiven noch der deduktive und der abduktive Schlu betrachtet Morik 1999 Dem deduktiven Schlu kommt dabei eine besondere Bedeutung zu da dieser innerhalb des induktiven Lernvorganges im Rahmen des Hypothesent
176. n Regelmenge jeweils mit den k Vorg ngerwerten und 2 anhand diverser Kriterien bewertet Dabei soll der Fokus der Betrachtung jeweils auf diejenigen Regelkombinationen gelegt werden die das jeweilige Kriterium besonders gut bzw besonders schlecht erf llen Der k Vorg ngerwert 2 wurde im brigen gew hlt da im Vorfeld der Testreihen auf der Grundlage des in Kapitel 8 3 3 2 beschriebenen Verfahrens von Berwick et al 1987 die 2 Reversibilit t der betrachteten Dom nen gezeigt wurde Die beschriebenen Regelkombinationen werden im weiteren Verlauf der Auswertung folgenderma en kodiert Nach jeder Regelangabe 2a 2b 3a 3aE und 3b folgt jeweils der entsprechende k Vorg ngerwert z B bedeutet 12a22b23al3bl einerseits da sich die Regelmenge aus den Regeln 1 2a 2b 3a und 3b zusammensetzt und andererseits da die Regeln 2a und 2b einen k Vorg ngerwert von 2 sowie die Regeln 3a und 3b einen k Vorg ngerwert von 1 besitzen Das Ausrufezeichen im Zusammenhang mit der Regelmenge 12a2b bedeutet da in einem Vorverarbeitungsschritt s mtliche Zahlenwerte durch den String ersetzt werden f r weitere Erl uterungen siehe Kapitel 13 5 2 4 3 4 4 12 Eine ausf hrliche Diskussion des Mergingprozesses und der verwendeten Mergingregeln findet sich Kapitel 8 3 12 Testergebnisse 170 12 2 Formale Bewertungskriterien 12 2 1 Prozentualer Zuwachs der Wortanzahl Abbildung 86 zeigt da unabh ngig von den jeweiligen Do
177. n in EmptyComponents lassen sich r ckg ngig machen auch nachdem sie gelernt worden sind Die Frequenzen der einzelnen Tokens die durch Bet tigung einer TokenComponent erh ht worden sind werden wieder entsprechend dekrementiert 11 Benutzerhandbuch 163 11 5 6 4 5 Weiter Der Weiter Knopf wird bet tigt um das Ende der Eingabe in eine EmptyComponent zu signalisieren Wurde der Text eingetragen und anschlie end dieser Knopf bet tigt so wird eine Folge von Zust nden erzeugt die die eingegebenen Worte jeweils zur berf hrung in den n chsten Zustand nutzen Der nachfolgende Zustand der EmptyComponent ist der n chste MetaZustand oder wenn keiner erreichbar ist der TerminalZustand Diente ein TokenButton als Vorbild f r die EmptyComponent so f hren beide zu dem nachfolgenden Zustand des TokenButtons 11 5 6 4 6 Merge Ist in dem Dialog zur Festlegung der Merging Parameter siehe Kapitel 11 5 2 4 3 1 1 Festlegen der Merging Parameter die Option Sofortige Anwendung der Regeln selektiert so wird direkt nach Eingabe in eine EmptyComponent der hinzugef gte Text gelernt Der Merge Knopf ist nicht aktivierbar Wenn die Option allerdings nicht selektiert ist so werden die Eintr ge zwar dem DFA hinzugef gt aber noch nicht gelernt Dies erkennt mAGENTa und der Merge Knopf ist aktivierbar Der Benutzer kann nun jederzeit den Knopf bet tigen um den Lernproze zu starten Es ist somit m glich den Lernproze erst nac
178. n sollen an einem konkreten Beispiel die Auswirkungen von bergeneralisierungen verdeutlicht werden Die Komplexit t des Beispieles ist bewu t gering gehalten um die erzeugten Automaten in Abbildung 39 bersichtlich zu gestalten 8 DFA Generierung Gegeben sei die folgende Menge positiver Beispiele 1 Chronisches Zervikalsyndrom 2 Zervikalsyndrom 3 Status vor Microtherapie T 1 T Zervikalsyndrom Zeryikalsyndrom rar N D H l d 1 1 H L g H K d Zervwikalsyndrom i H U d amp bergeneralisierender Automat nicht bergeneralisierender Automat Abbildung 39 bergeneralisierender Automat Die in Abbildung 39 dargestellten Automaten wurden auf der Grundlage der Angluin Regeln 1 2a und 2b mit unterschiedlichen Parameterwerten k erzeugt Auf der linken Seite der Abbildung wurde auf 0 gesetzt d h es wird vermutet da die gesuchte Sprache O reversibel ist Das Ergebnis zeigt da diese Hypothese inkorrekt war da der Automat als Folge einer bergeneralisierung den ungrammatikalischen Satz 84 8 DFA Generierung 85 Chronisches Status vor Microtherapie erzeugt Auf der rechten Seite sieht man einen Automaten bei dem der Parameter f r k um eins erh ht wurde Dieser inferierte Automat erzeugt ausschlie lich grammatikalisch sinnvolle S tze Um entscheiden zu k nnen ob der inferierte Automat bergeneralisiert
179. nButtons die den MetaZustand repr sentieren stehen also f r ein einzelnes Token Hypercholesterin mie Nikotinabusus Adipositas und Hyperurik mie Die brigen sieben stehen f r zwei oder mehr linear aufeinander folgende Tokens 9 Das TokenComponent Interface 92 In der Abbildung des ist zu sehen da auf den TokenButton mit der Beschriftung Hypercholesterin mie ein neuer Rahmen mit dem TokenButton und Hypertriglycerid mie folgt Der Titel des Abschnittes findet sich als berschrift oberhalb der TokenButtons Im unteren Bereich des Fensters werden die Beschriftungen der nacheinander angeklickten TokenButtons sowie die Abschnittstitel in einem Textfeld dargestellt Solange der Folgezustand eines TokenButtons kein MetaZustand oder Terminalzustand ist werden f r diesen die weiteren TokenButtons dargestellt Wird schlie lich ein Terminalzustand erreicht so ist der Befundungsvorgang beendet und der Benutzer kann den erstellten Befund direkt abspeichern oder ausdrucken In der Arbeit von Schlimmer amp Hermens Schlimmer et al 1993 wurde ein Auswahlfeld neben den TokenButtons als Eingabekomponente vorgestellt Diese w rde angeben da sich der Zustand in einem Zyklus befindet Mittels des Auswahlfeldes kann der Zyklus genau einmal durchlaufen werden oder eben nicht Oftmals ist es aber sinnvoll einen Zyklus mehrfach zu durchlaufen dies kann durch mehrfaches Bet tigen eines TokenButton dargestellt werden 9 6 Die Parametr
180. nComponents protokolliert werden der Text der vor dem erstellten Text steht der Text der hinter den erstellten Text steht der voreingestellte Dateiname f r den Briefkopf der voreingestellte Dateiname f r den Brieffu gibt an ob bei Bet tigung des Beenden Konpfes die TokenComponent mit der h chsten Frequenz oder die an rster Stelle im TCI genommen werden soll Anhang Voreinstellungen W rterbuch Parameter 185 Parameter Voreinstellung Beschreibung anzahlEintraege 50 die maximale Anzahl von die auf einer W rterbuch Seite angezeigt werden bevor die weiteren Eintr ge auf der n chsten Seite angezeigt werden Eintr gen Tokenizer Parameter Parameter Voreinstellung Beschreibung space true Das Leerzeichen wird als Trennzeichen interpretiert tab true Der Tabulator wird als Trennzeichen interpretiert newLine true Das Neue Zeile Zeichen wird als Trennzeichen interpretiert carriageReturn true Das Wagenvorlauf Zeichen wird als Trennzeichen interpretiert punkt true Der Punkt wird als Trennzeichen interpretiert komma true Das Komma wird als Trennzeichen interpretiert semikolon true Das Semikolon wird als Trennzeichen interpretiert strich true Der Bindestrich wird als Trennzeichen interpretiert alsTokens true Die gefund
181. nation erreicht die sich in der Diplomarbeit als g nstig erwiesen hat Auch w re eine weitere Verbesserung der Lernalgorithmen z B durch parallele Probleml sungsstrategien denkbar Da im Zuge des wissenschaftlichen Fortschritts gelernte Erkenntnisse revidiert werden k nnten sollte auch das Entfernen von bisher Gelerntem m glich sein Eine weitere Steigerung der Benutzerfreundlichkeit k nnte durch die Integration einer Spracheingabe f r das TCI erzielt werden Der Arzt spricht die ersten Silben oder Worte und der Satz wird gem der Struktur des vervollst ndigt Weitere Textformatierungen wie z B fett kursiv sowie die Verwendung von verschiedenen Schriftgr en und arten dienen einer bersichtlicheren Gestaltung und k nnen dem Lernproze als Anhaltspunkt f r einzelne Abschnitte dienen Die Anzeige des Graphen k nnte durch eine eigene Ansicht pro MetaAbschnitt verbessert werden Ein beliebige virtuelle Fenstergr e lie e es zu mehr Elemente gleichzeitig einsehen zu k nnen Da der Lernvorgang prinzipiell sprachunabh ngig ist w re es w nschenswert auch die Benutzeroberfl che f r andere Sprachen z B Englisch zu lokalisieren Anhang Voreinstellungen Merging Parameter Parameter Voreinstellung Beschreibung BeliebigeAnzahl false Gibt an ob statt der urspr nglichen NachfolgerAbfrage Regel 3a von Schlimmer und Hermens di rweiterte Version verwendet werden soll DirektesAnwend
182. nductive Acquisition of Expert Knowledge Addison Wesley Reading MA 1990 Morik K Einf hrung in die k nstliche Intelligenz 5 Auflage Lehrstuhl VII Fachbereich Informatik Universit t Dortmund 1997 Morik K Maschinelles Lernen Lehrstuhl Fachbereich Informatik Universit t Dortmund 1999 Oncina J Gracia P Inferring regular languages in polynomial update time in Pattern Recognition and image analysis S 49 61 1992 Parekh Rajesh Honovar Vasant Grammar Inference Automata Induction and Language Acquisition in Handbook of Natural Language Processing New York 1998 Projektgruppe 281 Moses ein medizinisch orientiertes Literaturverzeichnis Pitt 1989 Pschyrembel 1994 Schlimmer et al 1993 Schr der 1993 Seelos et al 1997 Stowasser 1980 Thurn et al 1998 Trakhtenbrot et al 1973 Wegener 1996 194 Sprachevaluationssystem Abschlu bericht Fachbereich Informatik Lehrstuhl I Universit t Dortmund 1996 Pitt L Warmuth M K Inductive Inference dfas and computational complexity in Analogical and Inductive Inference Lecture Notes in Artificial Intelligence 397 S 18 44 Springer 1989 Pschyrembel Klinisches W rterbuch 257 Auflage de Gruyter 1994 Schlimmer Jeffrey C Hermens Leonard A Software Agents Completing Patterns and constructing user interfaces in Journal of artificial intelligence research Nr 1 S 61 89 1993 Schr der M Sprac
183. ne Ethernet Varianten LocalTalk ATM A Trotzdem ist es wichtig da ein System mit diesen verschiedenartigen Begebenheiten umgehen kann Mit der Verbreitung des TCP IP Standards auf verschiedenen Hardwareplattformen ist zumindest das Problem der Daten bertragung in heterogenen Netzwerken gel st Dar ber hinaus ist es aber bisher notwendig gewesen f r jedes Betriebssystem auf dem eine Netzwerkanwendung laufen sollte eine eigene L sung zu implementieren da z B f r jedes Betriebssystem eine eigene Benutzeroberfl che erstellt werden mu Von Anfang an war es ein Bestreben der Entwickler der Programmiersprache Java eine plattformunabh ngige Entwicklungsumgebung zur Verf gung zu stellen mit der getreu dem Motto write once run anywhere Anwendungen betriebssystemunabh ngig erstellt werden konnten Da insbesondere die Oberfl chen AP l f r jedes Betriebssystem separat erstellt werden mu te f hrte dies bisher nicht zu den gew nschten Ergebnissen sondern vielmehr dazu da ein einmal in Java geschriebenes Programm zwar auf jedem Betriebssystem lief aber durch betriebssystemeigene Aufrufe doch jeweils unterschiedliches Aussehen hatte Abgesehen davon da sich der Benutzer f r jedes Betriebssystem an eine neue Oberfl che mit evtl abweichender Funktionalit t gew hnen mu te Konnten auch die Entwickler bei der Implementierung nicht sicher sein da ein einmal entworfenes Programm auf allen Plattformen das gleiche Aussehen hatt
184. ne formale Grammatik ist ein 4 Tupel G V V S P wobei die Menge der terminalen Symbole die Menge der nicht terminalen Symbole S S Nal die Menge der Startsymbole und P die Regelmenge der Form a B ist wobei o und f Worte ber dem Alphabet U Nal sind und o mindestens ein Element aus enth lt Eine Sprache L G ist die Menge aller Worte w die in endlich vielen Schritten aus den Produktionsregeln der Grammatik G abgeleitet werden kann formal gilt L w S gt 5 3 2 Chomsky Hierarchie Eine Strukturierung der Grammatiken in vier Klassen mit steigender Einschr nkung der zugrundeliegenden Regelmengen und sinkendem Umfang der erzeugten Sprachen wird durch die Chomsky Hierarchie f r formale Sprachen gegeben siehe dazu auch Hopcroft et al 1988 Zu jeder Grammatik Klasse existiert ein entsprechendes 5 Maschinelle Lernverfahren 46 Maschinenmodell zur L sung des Wortproblems also zur Beantwortung der Frage ob ein beliebiges Wort Element der Sprache ist Chomsky O Grammatiken uneingeschr nkte Sprachen enthalten nur Regeln der Form P W ohne weitere Einschr nkungen Chomsky I Grammatiken kontextsensitive Sprachen enthalten Regeln der Form c A c10 c2 mit den Bedingungen A Vy 00 und 0 c2 E V Das zugeh rige Maschinenmodell f r die Klasse der kontextsensitiven Sprachen sind die nichtdeterministischen Turingmaschinen mit einseitig begrenztem Band F r diese Klasse von Sprach
185. nent Interface Fenster Abbildung 82 TCI Vorschau 122 124 124 126 126 128 130 131 134 135 136 137 138 138 140 141 142 143 144 146 149 150 151 155 156 157 160 Abbildung 83 Legende f r das TokenComponent Interface Abbildung 84 TCI Protokoll Abbildung 85 Befund Fenster Abbildung 86 prozentualerZuwachs der Wortanzahl Abbildung 87 Komprimierungsgrad bez glich der Pr fixb ume Abbildung 88 prozentualer Zyklenanteil Abbildung 89 Benutzeroberfl che eines bergeneralisierenden Automaten Abbildung 90 durchschnittlicher Fan Out Abbildung 91 Anzahl der Eingaben je Befundungsvorgang Abbildung 92 Fan Out der Meta Zust nde CT HWS Abbildung 93 Fan Out der Meta Zust nde CT LWS Abbildung 94 Fan Out der Meta Zust nde MRT LWS 189 162 164 165 170 171 172 173 174 175 177 178 178 Tabellenverzeichnis Tabelle I Anforderungen an das System 11 Tabelle 2 Die Abschnitte der Diplomarbeit 15 Tabelle 3 Tokenizer Trennzeichen 56 Tabelle 4 Skizze des Merging Algorithmus 65 Tabelle 5 Mergingregeln von Angluin 75 Tabelle 6 Mergingregeln von Schlimmer und Hermens 77 Tabelle 7 Verfahren zur Ermittlung des Parameters k 85 Tabelle 8 Algorithmus zur Generierung des TokenComponent Interfaces Tabelle 9 Symbole f r die Eigenschaften des nachfolgenden Zustandes 90 92 Tabelle 10 Sonderzeichen Escape
186. nergebnisses und somit f r eine erh hte Benutzerfreundlichkeit der erzeugten Oberfl che 8 3 3 1 1 1 Regel 1 Die erste Regel garantiert den Determinismus des erzeugten Automaten Das zu betrachtende Zustandspaar in Abbildung 29 ist 81 85 Falls diese Zust nde einen direkten gemeinsamen Vorg ngerzustand S besitzen und sowohl 8 S A S als auch 8 gilt also ein nichtdeterministischer Automat vorliegt werden die Zust nde S und S zur Wiederherstellung des Determinismus zu einem neuen Zustand SmE bi S zusammengefa t Dabei werden die Vorg nger und Nachfolgerlisten der beiden Zust nde gem dem in Abbildung 22 beschriebenen Mergingvorgang angepa t und der Frequenzwert des verbleibenden Tokens A wird dabei um den Wert des gel schten Tokens erh ht Zustand Sx Zustand Sx Zustand S1 Zustand S2 Zustand Sm Abbildung 29 Mergingregel 1 8 3 3 1 1 2 Regel 2 Diese Regel fa t alle Terminalzust nde zusammen die einen gemeinsamen Vorg nger besitzen Im Spezialfall 0 f hrt die Anwendung dieser Regel dazu da der DFA nur noch einen Terminalzustand enth lt Analog zur Regel 1 werden auch hier die Vorg nger und Nachfolgerlisten der beiden Zust nde entsprechend angepa t 8 DFA Generierung 76 N N ch 7 1 1 Zustand T1 Zustand T2 Zustand T m Abbildung 30 Mergingregel 2a 8 3 3 1 1 3 Regel 2b Praktisch werden die Zust nde S und S zusammengefa t wenn zum einen T T
187. ng 48 Oberfl chenkonzepte II Die obige Abbildung zeigt mAGENTa nachdem ein Befund ber die Tastatur eingegeben worden ist Die Werkzeugleiste ist hier an der rechten Seite verankert Die darauf befindlichen Kn pfen sind bis auf den Knopf Eingabe hinzuf gen nicht anw hlbar da der Benutzer erst mit seiner Eingabe abschlie en mu bevor andere Fenster mit aktualisiertem Inhalt dargestellt werden k nnen Da der eingegebene Befund gr er ist als es der sichtbare Bereich zul t wurde automatisch am rechten Rand des Textes ein Rollbalken eingef gt mit dem der Benutzer den gesamten Text einsehen kann 11 5 Die Oberfl che Dieses Kapitel beschreibt die Fenster und Dialoge von mAGENTa Es kann einerseits als Einf hrung in die umfangreiche Funktionalit t gesehen werden ohne da der Benutzer die theoretischen Vorkenntnisse aus den vorangegangenen Kapiteln vorweisen mu Hierf r ist dieses Kapitel so aufgebaut da es versucht den Leser in der Reihenfolge durch die einzelnen Abschnitte zu f hren in der ein Benutzer w hrend der Anwendung von mAGENTa die einzelnen Fenster aufrufen w rde Andererseits verf gt dieses Kapitel auch ber eine klare Gliederung die es als Nachschlagewerk w hrend der Benutzung von mAGENTa pr destiniert Die Verweise in einzelnen Abschnitten auf andere Kapitel erm glichen es die spezifischen Lesew nsche zu unterst tzen und evtl auftretende Fragen gezielter zu beantworten Beginnend mit der Ansic
188. ngvorganges 870 0 Millisekunden Anzahl Tokens 295 0 Anzahl Zust nde 265 0 uwachs der Tokenanzahl um 115 0 Tokens entsprechend einem Zuwachs von 63 888885 uwachs der Zustandsanzahl um 109 0 Zust nde entsprechend einem Zuwachs von 69 871796 Anzahl neuer Worte 71 0 Anzahl der gesamten Worte 137 0 uwachs der Wortanzahl um 71 0 Worte entsprechend einem Zuwachs von 107 57575 Mergingoperationen auf Zustands Ebene Anzahl Aufrufe der Mergingregel1 40 0 Anzahl Aufrufe der Mergingregel2bk 11 0 Abbildung 57 MergingProtokoll Ausf hrlich MergingProtokoll O Ausf hrlich Nur Werte 0 0 180 0 156 0 66 0 66 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2031 9092 1 1538461 1 3065606 870 0 295 0 265 0 71 0 137 0 40 0 11 0 0 0 0 0 8 0 59 0 24997 0 1916 9092 1 1132076 1 0142453 770 0 400 0 350 0 51 0 188 0 95 0 42 0 4 0 0 0 12 0 153 0 107998 0 1811 9092 1 1428572 0 9544739 1870 0 559 0 492 0 71 0 259 0 121 0 66 0 5 0 0 0 14 0 206 0 213632 0 1652 9092 1 159751 1 0688916 4340 0 686 0 590 0 35 0 294 0 130 0 68 0 3 0 0 0 14 0 215 0 374489 0 1525 9092 1 1627119 1 1777453 7260 0 801 0 698 0 27 0 321 0 151 0 37 0 0 0 0 0 13 0 201 0 193464 0 1410 9092 1 1475644 1 1137335 6100 0 978 0 859 0 54 0 375 0 121 0 42 0 3 0 0 0 14 0 180 0 316319 0 1233 9092 1 1385332 1 1762663 9120 0 1023 0 896 0 9 0 384 0 123 0 56 0 3 0 0 0 12 0 194 0 3196602 0 1188 9092 1 141741 1 2012823 42570 0 1107 0 973 0 32 0 416 0 96 0 45 0 0 0 0 0 10 0 151 0 1332054 0 1104 9092 1
189. nnesnnesnnennne nenn 57 WwW MWabrnechmung 38 Werkzeugleiste ssseseeeeeeeeeeeereeeeere eee 110 117 W rterbuch 59 154 W rterbuch Liste 158 7 Zielorientiertheit 36 Ka KEE 124 ZustandebRabmen ee eeeeeenenenene 89 Zwischenablage nennen 129 Zyklenanteili 2 2suss sen 175 Erkl run Names Vorname a Hiermit erkl re n ich wir da ich wir die Diplomarbeit mit dem Titel
190. nsagenten auf die im folgenden erl utert werden Informationsagenten unterst tzen den Benutzer bei der Beschaffung von Informationen die f r ihn relevant sind Beispiele daf r sind Internet Suchmaschinen die z B personalisierte Nachrichten liefern PointCast Network oder den jeweils g nstigsten Anbieter von Musik CDs herausfinden BargainFinder siehe Caglayan et al 1997 Kooperationsagenten hingegen versuchen eine komplexe Aufgabe durch Kommunikation und Kooperation mit Agenten Menschen oder anderen Ressourcen zu l sen Kooperationsagenten werden benutzt wenn die L sung f r einen Agenten zu komplex w re oder wenn das Wissen von bereits existierenden Agenten genutzt werden kann um zu einer L sung zu gelangen Transaktionsagenten schlie lich f hren Transaktionen aus oder berwachen diese wie z B Kauf von Ware beim elektronischen Handel Die oben beschriebenen Auspr gungen der Softwareagenten sind keineswegs disjunkt zu sehen Es kann Agenten geben die sogar alle drei vorweisen k nnen Zum Beispiel w re es denkbar einen Agenten mit dem Kauf einer CD eines K nstlers zu beauftragen deren Titel man nicht kennt Der Agent h tte jetzt die Aufgabe zuerst Informationen ber den K nstler und seine Werke zu finden Hierbei k nnte er auf Informationsagenten zugreifen und anschlie end andere nutzen um den g nstigsten Anbieter herauszufinden Ist dies geschehen so kann dort die CD bestellt werden Evtl w re es dem
191. nterhalb der rekursiven Sprachen identifizierbar Method of presentation Class of languages Recursively enumerable Recursive Informant SECHS Primitive recursive Context sensitive Context free Regular Text 8 Finite cardinality Abbildung 15 Lernbarkeit formaler Sprachen nach Gold Trotz der grundlegenden Bedeutung von Golds Resultaten auf theoretischer Ebene sind die Ergebnisse f r die praktische Anwendung des induktiven Lernens insbesondere der Grammatik Inferenz von eher eingeschr nkter Bedeutung So kritisiert Finch 1993 Golds Paradigma in folgenden Punkten Zum einen sei das Kriterium des Lernerfolges die Identifikation aller S tze einer Sprache zu strikt da eine gute Approximation einer Sprache in vielen F llen ausreicht It is not much more useful to be able to identify all sentences than 99 99 of the sentences Zum anderen ist eine implizite Voraussetzung f r die Korrektheit der Identifikation einer Sprache nach Gold da die gegebenen Beispiele fehlerfrei noise free sind d h vom Lehrer korrekt klassifiziert wurden Andernfalls wird die fehlerhafte Eingabe dazu f hren da der Algorithmus eine inkorrekte Grammatik lernt Ferner kritisiert Finch da sowohl durch die potentiell unendliche Laufzeit des Lernprozesses als auch durch die Gr e des Hypothesenraumes 5 Maschinelle Lernverfahren 45 unrealistische Rahmenbedingungen in Bezug auf die praktische Anwendung gesetzt wurden 5 2 6 2 Identifi
192. on 1 Leader AND either a both states transition to a common state via any word OR b one transitions to the other via any word Tabelle 6 Mergingregeln von Schlimmer und Hermens Die Regeln 1 2a und 2b entsprechen der Regelmenge von Angluin f r einen 0 reversiblen Automaten siehe Tabelle 5 Die Regeln 3a und 3b wurden zus tzlich von Schlimmer und Hermens eingef hrt um die Qualit t der generierten Benutzeroberfl che zu verbessern Beiden zus tzlichen Regeln ist gemein da sie den Generalisierungs An dieser Stelle sei ausdr cklich darauf hingewiesen da im vorliegenden System die Wahl des k Vorg ngerwertes bez glich der in Tabelle 6 aufgef hrten Regeln unbeschr nkt ist 8 DFA Generierung 78 vorgang beschleunigen und im Vergleich zur urspr nglichen Regelmenge von Angluin zum Lernen der Syntax deutlich weniger Befunde ben tigen Abbildung 32 macht in diesem Zusammenhang eine Schw che des Algorithmus von Angluin deutlich Viele der Zust nde in dieser Abbildung k nnten sinnvollerweise zusammengefa t werden Allein auf der Grundlage der Angluin Regeln h tte es jedoch noch vieler Beispiele bedurft um den DFA in Abbildung 33 zu generieren In Abbildung 32 tritt h ufig die Situation auf da viele Tokensequenzen bei denen dem String Size eine Gr enangabe folgt im selben Zustand enden Die Angluin Regel 2b findet in diesen F llen jedoch keine Anwendung da sich die Gr enangaben voneinander unterscheiden
193. orschau In der Abbildung 82 TCI Vorschau sind jeweils hinter den TokenComponents Symbole angegeben die n here Informationen ber den Zustand geben der nach Bet tigung dieser TokenComponent erreicht wird siehe Kapitel 11 5 2 4 3 3 1 Anzeige Nachfolger Symbol 11 5 6 2 5 Der Vorgang der Texterfassung mit dem TCI Um einen kompletten Befund mit dem TCI zu erfassen mu der Benutzer lediglich eine Reihe von TokenComponents mit der Beschriftung anw hlen die in dem fertigen Text stehen soll Die Beschriftung einer angew hlten TokenComponent wird in das unten stehende Textfeld eingetragen Die Frequenz der Tokens die die TokenComponent repr sentiert werden inkrementiert Der Rahmen in dem sich die TokenComponent befand verschwindet und es wird die n chste Auswahl von TokenComponents in einem neuen Rahmen angezeigt Diese Auswahl steht f r den Zustand der von der angew hlten TokenComponent aus ber die Tokens erreicht wird Ist ein solcher Zustand ein MetaZustand so wird dieser in das Feld f r den MetaTitel eingetragen In das Textfeld wird er unterstrichen als berschrift f r den kommenden Abschnitt eingetragen Der Benutzer f hrt solange mit der Anwahl von TokenComponents fort bis ein TerminalZustand erreicht wird F r einen vollst ndigen Text m ssen alle MetaAbschnitte besucht worden sein denn sonst w rde es bedeuten da zu einzelnen Abschnitten nichts eingegeben worden ist was insbesondere f r einen vollst ndig
194. ponents die der Benutzer anw hlen mu um vom Startzustand des DFA zum Terminalzustand zu gelangen und ist somit ein Faktor der die Dauer dieses Vorganges entscheidend beeinflu t Die Zahl der Eingaben bezieht sich dabei jeweils auf die Tokensequenzen mit dem h chsten Frequenzwert innerhalb eines Zustandspanels Vereinfacht gesagt wird also die L nge des wahrscheinlichsten Weges durch das TokenComponentlInterface gemessen Es kann festgehalten werden da die durchschnittliche L nge der einzelnen Tokensequenzen umgekehrt proportional zur Zahl der Eingaben ist Die Praxis zeigt hier da sowohl viele Eingaben mit jeweils kurzen Tokensequenzen als auch wenige Eingaben mit entsprechend langen Tokensequenzen zu einer subjektiv schlechten Bewertung im Sinne der Benutzerfreundlichkeit f hren Im ersten Fall ist der Zeitaufwand f r einen durchschnittlichen Befundungsvorgang relativ gro im zweiten Fall ist die Wahrscheinlichkeit hoch da die vom Benutzer ausgew hlten Sequenzen unerw nschte Textfragmente enthalten Ein optimales Ergebnis im Hinblick auf die Benutzerfreundlichkeit des Systems wird in der Regel durch einen DFA erreicht bei dem sich die Anzahl der Eingaben zwischen diesen beiden Extremen bewegt m CT HWS m MRT LWS OCT LWS Anzahl der Eingaben je Befundungsvorgang CT LWS MRT LWS CTHWS 3 8 2 SS a U 2 95 9 99 R 46 Abbildung 91 Anzahl der Eingaben
195. r er als der tats chlich bewegen sich die Knoten schrittweise aufeinander zu Ist der optimale Abstand kleiner so entfernen sie sich voneinander Tabelle 26 Der Graph Algorithmus 11 Benutzerhandbuch 146 Aus Gr nden der Effizienz wird bei der Darstellung des Graphen die Technik des Double Buffering verwendet u Kr ger 1999 F r jeden Knoten wird erst dessen neue Position berechnet dieser Knoten dann an seiner neuen Position in ein Offscreen Image geschrieben und erst wenn alle Knoten einmal berechnet und geschrieben worden sind wird dieses Offscreen Image auf einmal in die Fensteroberfl che kopiert Im Sinne des obigen Algorithmus wird dies als ein Animationsschritt betrachtet Die Schrittweite mit der sich die Knoten jeweils bewegen betr gt 5 Pixel Dieser Wert erm glicht eine weiche smooth Animation der Knotenbewegung bei gleichzeitig hoher Animationsgeschwindigkeit Der Graph versucht die gesamte Fl che des Fensters auszunutzen und pa t sich automatisch der Gr e des Fensters an wenn diese sich ndern sollte 11 5 3 3 Die Werkzeugleiste Die Werkzeugleiste bietet haupts chlich Funktionen die eine bessere Ansicht des Graphen bieten Diese Funktionen haben jeweils Auswirkungen auf den gesamten Graphen und nicht nur auf einzelne Knoten so wie die Kontextmen s Au erdem k nnen von hier aus weitere Informationen ber den Graph eingesehen werden 11 5 3 3
196. r Transitionen umkehrt 8 DFA Generierung 62 Ein String u wird k Nachfolger k follower eines Zustandes q genannt genau dann wenn lul und Atout Analog dazu wird ein String u k Vorg nger k leader genannt falls lul k und sl Ein Automat A wird als kanonisch bezeichnet bez glich einer regul ren Sprache L G falls A eine minimale Anzahl von Zust nden besitzt und L A L G gilt Eine Menge positiver Beispiele 5 ist strukturell vollst ndig in Bezug auf einen Automaten A falls jede Transition von A mindestens einmal benutzt wird und jeder Terminalzustand von A mindestens einen String aus S akzeptiert Eine strukturell vollst ndige Menge bez glich des Automaten in Abbildung 19 w re S b aa aaaa Eine Menge S S U S ist charakteristisch bez glich einer regul ren Sprache L G und eines kanonischen Akzeptors A falls S strukturell vollst ndig ist und f r jeweils zwei Zust nde ein Suffix c existiert der beide voneinander unterscheidet Gegeben sei ein Automat mit der Menge der Zust nde Z Eine Partition ist eine paarweise disjunkte Vereinigung von Teilmengen von Z Sei eine Partition von dann existiert f r jedes se S genau ein Element von das s enth lt Dieses Element wird als Block 5 bezeichnet 8 DFA Generierung 63 Gegeben sei ein Automat und eine Partition von A Ein Quotienten Automat entsteht aus A durch Zusammenfassung Merging von Zust nden die zum selben Blo
197. r findet Ein intelligenter Agent ist laut Brenner eine Software die in einer digitalen vernetzten Umgebung selbst ndig Aufgaben im Auftrag des Benutzers erledigt Brenner et al 1998 Intelligente Agenten Menschliche Hardware Software Agenten agenten Sn z B Reiseb ro z B Roboter g Informations Kooperations Transaktions agenten agenten agenten Abbildung 10 Kategorien intelligenter Agenten Zu einer ersten Einteilung des breiten Spektrums von Intelligenten Agenten lassen sich drei Kategorien finden die von unterschiedlicher Beschaffenheit sind Menschliche Agenten Hardwareagenten und Softwareagenten 4 Intelligente Softwareagenten 34 Ein menschlicher Agent ist im Prinzip jede Person die einer Dienstleistungst tigkeit nachgeht Als Beispiel sei hier ein Angestellter eines Reiseb ros zu nennen Der Kunde wird bez glich m glicher Reiseziele beraten oder nennt direkt sein Wunschziel Daraufhin erh lt er ein Angebot ber eine Unterkunft Verpflegung und die Reiseroute S mtliche mit dem Buchen einer Reise verbundenen Aufgaben werden von dem travel agent ausgef hrt Dieses Bild l t sich auch auf die hier n her betrachteten Softwareagenten bertragen Der Nutzer nennt seine W nsche und der Agent hilft ihm bei deren Erf llung oder sie werden direkt von ihm erf llt Softwareagenten weisen Auspr gungen als Informations Kooperations und Transaktio
198. r gilt da eine regul re Sprache k kontextuell ist if and only if there is a finite automaton such that L L M and for any two states po and qo of M and any string with IvI k we have if there are states D and of such that and go V gx then D Ahonen 1996 5 3 5 1 2 k h kontextuelle Sprachen Die bereits f r k kontextuelle Sprachen formulierte Bedingung wird nun im Fall der k h kontextuellen Sprachen insoweit modifiziert als da das Auftreten zweier Sequenzen nun bedingt da die nachfolgenden Elemente schon nach h Worten bereinstimmen Ahonen 1996 definiert die Klasse der k h kontextuellen Sprachen wie folgt Let 0 lt lt A regular language L is k h contextual if and only if for all strings u U2 W1 and w2 and input symbols a ax if and are in L then for every 1 with 0 lt lt 1 lt and each pair of strings v and such that vja axw eL and v gt a aKW L we have Zur Konstruktion eines k kontextuellen bzw k h kontextuellen Automaten werden die Zust nde des urspr nglichen Automaten solange zusammengefa t bis die jeweils formulierten Bedingungen nicht mehr erf llt sind Der entstandene Automat ist dann k kontextuell bzw k h kontextuell ist die Menge aller Suffixe einer Sprache L siehe hierzu auch die Definitionen in Kapitel 8 1 5 Maschinelle Lernverfahren 51 5 3 5
199. riebnahme Nachdem die HTML Seite erstellt worden ist und diese mit den brigen o a Dateien auf dem Server abgelegt worden sind kann der Client ber das Netzwerk die HTML Seite des Servers aufrufen Sobald diese komplett geladen worden ist startet der Browser automatisch das mAGENTa Applet Eine komplette Demo Version von mAGENTa mit ber 50 Graphen und 400 Befunden ist unter folgender Adresse zu finden http homepage ruhr uni bochum de Kai Bullerdick Diplomarbeit index html 11 Benutzerhandbuch 104 Auf diesem Server sind dar ber hinaus weitere Dokumente wie Zusammenfassungen der Arbeit und Folien zu einem Vortrag ber das mAGENTa System zur Einsicht vorhanden 11 3 Warum die Java 2 Platform mAGENTa wurde mit der Zielsetzung entworfen dem Benutzer ein Werkzeug an die Hand zu geben welches ihn bei seiner Arbeit unterst tzt und nicht behindert Dieser Pr misse folgend wurde die Benutzeroberfl che entwickelt F r herk mmliche Softwaresysteme welche in Netzwerken eingesetzt werden stellt die Heterogenit t der Netzwerke durch die verschiedenartigen verbundenen Systeme und Subnetze besonders ausgepr gt im Internet eine besondere Schwierigkeit dar Es findet sich kaum noch ein Netzwerk welches nur noch Computer mit identischer Hardware und gleichem Betriebssystemen also ausschlie lich Windows 98 oder ausschlie lich Solaris verbindet Selbst die Art des Netzwerkes kann lokal unterschiedlich sein z B verschiede
200. rlernen sein damit nicht viel Zeit bei aufwendigen Schulungen verloren geht Au erdem sollte es einfach zu bedienen sein damit w hrend der Anwendung nicht viel Zeit mit der Bedienung des Systems verbraucht wird Diese Zeit kann sinnvoller in der L sung der Aufgabe f r die das System unterst tzend wirkt genutzt werden Im Falle eines Befundungsunterst tzungssystems wie mAGENTa hei t dies da der Arzt weniger Zeit damit verbringt das System zu bedienen und dadurch mehr Zeit f r eine ausf hrliche Befundung zu Verf gung hat Nach der Erkl rung herausragender Konzepte f r die Oberfl chengestaltung von mAGENTa folgen Abbildungen die diese Konzepte anschaulich darstellen 11 4 1 Adaptivit t Kontext Sensitivit t Die Adaptivit t von mAGENTa spiegelt sich nicht nur im TokenComponent Interface wieder sondern auch in der Benutzeroberfl che der brigen Teile von mAGENTa Falls eine Funktion zu einem Zeitpunkt nicht ausf hrbar ist so ist der Knopf oder Men punkt ber den diese Funktion normalerweise aufgerufen wird auch nicht anw hlbar und optisch dementsprechend dargestellt Wenn mAGENTa z gestartet wird so ist es noch nicht sofort m glich einen DFA abzuspeichern da bisher noch keiner eingelesen oder generiert worden ist Erst nachdem der Benutzer einen Befund eingegeben oder einen DFA eingelesen hat kann dieser abgespeichert werden Der Benutzer hat somit jederzeit einen berblick ber die M glichkeiten zur weit
201. rne Numerierung der Zust nde Die Anzahl der nachfolgenden Tokens d h die Anzahl der Zustands berg nge von diesem Zustand aus MetaGraph hinzuf gen Der Punkt des Untermen s MetaGraph dient zum Hinzuf gen des Zustandes zu dem MetaGraphen Es wird ein Dialog ge ffnet in den der MetaTitel ingetragen werden kann Fixieren Fixieren des Knotens an seiner aktuellen Fensterposition Bei der Animation des Graphen bewegt sich dieser Knoten nicht mehr mit Freigeben Freigeben eines fixierten Knotens Ein ehemals fixierter Knoten bewegt sich wieder gem des Animationsalgorithmus des Graphen Tabelle 23 Kontextmen eines Zustandes 11 5 3 1 1 2 Kontextmen eines MetaZustands Zustand Label Start Position 0 Tokens 11 MetaGraph MetaTitel Koronare Risikofaktoren entfernen Fixieren Freigeben Abbildung 73 Kontextmen eines MetaZustandes Das Kontextmen eines MetaZustandes ist wie das eines normalen Zustandes aufgebaut mit die Unterschied da das Untermen MetaGraph zwei andere Punkte enth lt 11 Benutzerhandbuch 144 Men punkt Beschreibung MetaGraph MetaTitel MetaGraph entfernen Der MetaTitel des Zustandes so wie er in der etaGraph Ansicht erscheint Entfernen der MetaZustands Eigenschaft Ein etaZustand wird zu einem normalen Zustand und aus dem MetaGraph entfernt 11 5 3 1 2 Tokens Tabelle 24 Kontextm
202. rnt worden ist kann diese Option nicht mehr ver ndert werden Sie ist nicht mehr selektierbar bis der Benutzer den Men punkt Neu siehe Kapitel 11 5 2 4 1 1 Neu anw hlt 11 Benutzerhandbuch 135 11 5 2 4 3 4 2 Sortierung der Tokens nach Frequenz Wie in Kapitel 11 5 2 4 3 3 5 Nach Frequenz dargelegt worden ist verf gen die Tokens ber eine Frequenz die angibt wie oft sie bisher in gelernten Texten auftraten bzw wie oft sie bei der Texterfassung im TCI ausgew hlt worden sind Dieser Men punkt gibt an ob die Tokens die von einem Zustand in einen anderen berf hren gem ihrer Frequenz sortiert werden sollen Dies wirkt sich dann auf das TCI aus da die TokenComponents von Tokens mit h herer Frequenz vor denen mit niedrigerer dargestellt werden Bei dem Lernproze ist festzustellen da die Sortierung der Tokens sich positiv auf die Geschwindigkeit des Lernvorganges auswirkt Tokens die bisher h ufig in Texten vorkamen haben eine hohe Wahrscheinlichkeit auch weiterhin h ufig in den folgenden Texten vorzukommen Der Lernproze folgt der gegebenen Reihenfolge und findet somit schneller zu mergende Zust nde 11 5 2 4 3 4 3 Festlegen der Tokenizer Parameter Tokenizer Dialog EI Bitte geben Sie an welche der folgenden Zeichen als Trennzeichen zwischen Worten dienen sollen v Das Leerzeichen vi Der Punkt vi Der Tabulator t vi Das Komma v Das NeueZeile Zeichen n v Das Semikolon v
203. rrekte ersetzt werden Neben der automatischen Anpassung der Systems an den Benutzer hat dieser selbst die M glichkeit ber zahlreiche Parameter das Verhalten des Systems und seiner Komponenten Tokenizer W rterbuch Lernkomponente und TCI zu beeinflussen zu 6 kooperative Nutzung Die Benutzung und das Training des Systems kann von verschiedenen rzten getrennt geschehen Dabei k nnen sowohl die erlernte Struktur in Form des DFA als auch das jeweilige W rterbuch der einzelnen Agenten zusammengefa t werden um so die Qualit t nachfolgender Befundungen zu verbessern F r gr tm gliche Betriebssystem unabh ngigkeit und Flexibilit t wurde f r die Realisierung Java 2 gew hlt zu 7 Dom nenunabh ngigkeit Prinzipiell der ist das System unabh ngig von einzelnen Dom nen Hiermit ist nicht nur gemeint da beliebige Befundkategorien gelernt werden k nnen sondern auch andere Arten von Texten wie z B Formbriefe aus beh rdlichen Einrichtungen Diese Systemeigenschaft konnte im brigen in im Rahmen zahlreicher Testreihen best tigt werden Das System wurde mit ber 250 Befunden aus 3 Dom nen in verschiedenen Testreihen d h mit unterschiedlichen Regelkombinationen trainiert Dabei hat sich gezeigt da die gew hlten Regelmengen einen entscheidenden Einflu auf die Benutzerfreundlichkeit der erzeugten Oberfl chen haben Prinzipiell konnte nachgewiesen werden da bei entsprechender Wahl der Systemparameter insbesondere
204. rs gezogen werden kann Da der Graph w hrend dieser Aktion weiterhin versucht sich gleichm ig in dem Fenster zu verteilen werden auch diejenigen Knoten die mit dem selektierten durch Kanten verbunden sind versuchen den optimalen Abstand zu erhalten und folgen somit dem selektierten Knoten Sie werden mitgezogen Zur Auswahl eines Knotens ist es nicht notwendig diesen Knoten exakt mit dem Mauszeiger zu treffen sondern es reicht in die N he des Knoten zu klicken mAGENTa selektiert dann automatisch den n chstgelegenen Knoten 11 5 3 1 1 Zust nde Zust nde des DFA werden als Ovale dargestellt Beschriftet sind sie jeweils mit Z und einer fortlaufenden Nummer Optisch besonders hervorgehoben sind der StartZustand sowie die Meta und TerminalZust nde Der StartZustand befindet sich immer in der Mitte des oberen Fensterrandes die TerminalZust nde frei am unteren MetaZust nde verteilen sich ebenso wie die anderen Zust nde gleichm ig innerhalb des Fensters 11 5 3 1 1 1 Kontextmen eines Zustands Zustand Label Z 8 Position 2 Tokens 1 MetaGraph hinzuf gen Fixieren Freigeben Abbildung 72 Kontextmen eines Zustands 11 Benutzerhandbuch 143 Das Kontextmen eines Zustandes bietet folgende Eintr ge Men punkt Beschreibung Zustand Der Typ des Knotens Label Die Beschriftung des Knotens wie sie im Graph angezeigt wird Position Die Position innerhalb des DFA inte
205. rschiedlicher Parametrisierung Anwendung in Kapitel 12 Vergleichende Testergebnisse Jeder Lernvorgang unabh ngig davon ob er durch Eingabe eines Befundes in das Befundfenster durch Einlesen eines Befundes bzw einer Befundliste aus einer Datei durch Hinzuf gen eines neuen Graphen zum bestehenden Graphen durch Eingabe in eine EmptyComponent bzw durch Ersetzungen von Eintr gen im W rterbuch ausgel st wurde wird von mAGENTa protokolliert Dieses Protokoll umfa t eine Reihe von Statistiken bez glich des entstandenen Graphen bzw MetaGraphen der Merging Operationen etc Das Protokoll wird in zwei unterschiedlichen Formatierungen erstellt Die erste ist ausf hrlich und auch f r Menschen lesbar die zweite enth lt nur die bei der Protokollierung erhobenen Werte Die zweite Formatierungsart ist f r die elektronische Weiterverarbeitung bestens geeignet da ein Lerndurchlauf genau eine Zeile umfa t und 11 Benutzerhandbuch 124 die einzelnen Werte durch Semikola getrennt werden Dies erm glicht einen einfachen Import in eine Tabellenkalkulation wie z B Excel der Firma Microsoft Die Werkzeugleiste des Fensters beinhaltet zwei Auswahlkn pfe mit denen zwischen den Formatierungen gewechselt werden kann Ausf hrlich und Nur Werte Die beiden folgenden Abbildungen zeigen das Erscheinungsbild mit den jeweils unterschiedlichen Formatierungen E MergingProtokoll 1 Ausf hrlich Nur Werte Mergingdurchlauf 1 Dauer des Mergi
206. rungen von Schlimmer und Hermens EE 78 Kegel esoe 80 Regel 81 REN arten 52 Lermf ibigket 36 M mACGENT abeng 169 membership ouerte 49 Merging von Zust nden 74 Merging Algorithmus sseesesereeeeeeereeeeree 66 Merongvorgang 67 MetaGraph gec onsieur s 152 Meta Regehn niser n 69 delt 71 E e EE 70 Meta Struktur 68 2 engen 68 Index Mobilit t sense 37 N Nachfolgersymbol een 94 sde ge seen 124 eier 63 Pfad hne ren n 8 ehe 90 plattformunabh ngig 106 IN 100 nenn fallenden 62 SEENEN 64 EFrzeugung nennen 65 Pragmatik ue egen 25 Proaktivit t riesis arena 36 Protokoll Merging 125 129 158 Token omponente 97 Pr nne u ebene e i E 44 R 16 radiologische Fachsprache Kondensgterung 25 Redund nz 26 Telegramm til een 25 radiologischer Befund A 26 Reaktivit t nee 36 regul re Sprachen k h Kontextuelle 51 k kontextuelle Sprachen 51 k reversiblen Sprachen 74 4 8 80 134 R ckg ngig Funktion sseeeeeeesseeeeeeereee 165 S
207. s Beispiel ist ein Zweier Tupel wobei und eine Klassifizierungsfunktion mit 1 0 die folgenderma en definiert ist c a 1 falls ae L und c a 0 falls a L Die Menge aller positiven Beispiele kann mit Hilfe der Klassifikationsfunktion wie folgt definiert werden ae S gilt c a 1 Die Menge aller negativen Beispiele A wird analog definiert V ae 5 gilt 0 Ein deterministischer endlicher Automat DFA ist ein Tupel Q 8 90 F wobei Q die endliche Menge der Zust nde das Alphabet qo Q ein ausgezeichneter Startzustand eine endliche Menge von Terminalzust nden akzeptierenden Zust nden und mit Osch Q die Transitionsfunktion beschreibt Abbildung 19 Deterministischer endlicher Automat Abbildung 19 zeigt einen DFA mit go Qo Q3 gekennzeichnet durch zwei konzentrische Kreise Eine konkrete Transition des Automaten w re z Q a Eine andere gebr uchliche Bezeichnung f r einen DFA ist der Begriff Akzeptor Dieser Begriff leitet sich aus der Funktion eines ab f r einen beliebigen String w zu entscheiden ob der Automat den String akzeptiert formal qo w F Die inverse Transitionsfunktion ist definiert als q ge g a Vae qe Q Den inversen Automaten A Q erh lt man aus A indem man die Initial und Terminalzust nde des Automaten vertauscht und die Richtungen s mtliche
208. s kann eine Reihe von Zeichen angegeben werden welche als Trennzeichen fungieren sollen 7 1 1 Die Trennzeichen F r reale Anwendungen haben die folgenden Trennzeichen sinnvolle Ergebnisse erzielt da sie eine aus Benutzersicht sinnvolle Einteilung in Tokens boten Ansonsten w rden z B Wortendungen nicht richtig erkannt werden Trennzeichen Darg TS LLN Trennzeichen Darstellung Leerzeichen Punkt H Tabulator Ne Komma Wien 8 NeueZeile An H Semikolon VE ae Wagenr cklauf N Bindestrich zn Tabelle 3 Tokenizer Trennzeichen 7 Verarbeitung der Befundtexte 57 Diese Trennzeichen k nnen beliebig untereinander kombiniert werden um unterschiedliche Ergebnisse zu erzielen 7 1 2 Interpretation der Trennzeichen als eigene Tokens Es kann mAGENTa auch mitgeteilt werden ob die Trennzeichen selbst als Token interpretiert oder bei der weiteren Verarbeitung unterdr ckt werden sollen Dies kann dann sinnvoll sein wenn die Formatierung des eingelesenen Befundes durch Leerzeilen oder Absatzendemarken beibehalten werden soll W rde z B ein NeueZeile Zeichen als Token betrachtet werden so wird es auch in den aufgenommen im Graph und folglich im TCI durch n angezeigt Ist dies nicht gew nscht so werden die ausgew hlten Zeichen zwar als Trennzeichen der Tokens betrachtet nicht jedoch in den DFA aufgenommen Eine etwaige Formatierung durch Steuerzeichen geht hierbei verloren 7 1 3 D
209. s und damit eine Beschr nkung der m glichen Lernergebnisse des Systems language bias Sei n die Anzahl der Strings eines Befundes und somit die Anzahl der Token eines unstrukturierten Automaten A d h eines Automaten ohne explizite Meta Struktur m die Anzahl der Abschnitte im strukturierten Automaten und w die Anzahl der Worte bzw die Kardinalit t des Eingabealphabets der Automaten Die Zahl der Hypothesen betr gt im Fall des unstrukturierten Automaten w Unter der vereinfachenden Annahme da die Zustandsmengen der einzelnen Abschnitte in einem strukturierten Automaten gleiche Kardinalit t besitzen ergibt sich f r die Zahl der Hypothesen in diesem Fall Sei 100 m 10 und w 80 realistische Werte eines durchschnittlichen radiologischen Befundes so ergibt sich im unstrukturierten Fall ein Suchraum von 80 10 Hypothesen im strukturierten Fall betr gt die 100 Gr e des Suchraumes 10 80 1 10 80 10 Hypothesen 8 F r eine ausf hrlichere Diskussion des Komplexes der radiologischen Befundung insbesondere des Befundungsvorgangs des Aufbaus eines radiologischen Befundes und der radiologischen Fachsprache sei an dieser Stelle auf das Kapitel 3 verwiesen 8 DFA Generierung 68 8 3 1 1 2 Verringerung der Rechenzeit Der zugrundeliegende Algorithmus hat unabh ngig von der gew hlten Regelmenge R eine Laufzeit von Om wobei n die Anzahl der Zust nde des Automaten ist Diese Anzahl st
210. sschlie lich aus positiven Beispielen lernt kann er als Basis f r entsprechende Inferenz Algorithmen im Rahmen des Systems verwendet werden Umfangreiche Evaluierungen des Systems anhand unterschiedlicher radiologischer Dom nen haben gezeigt da die auf der Grundlage des Algorithmus von Angluin erzeugten Grammatiken eine ausreichende Ausdrucksst rke in Bezug auf die radiologische Befundungssprache besitzen Des weiteren wurde festgestellt da die auf der Basis der verwendeten Befunddaten erzeugten Automaten 2 reversibel sind Ein weiterer Vorteil des Algorithmus in Bezug auf den praktischen Einsatz ist die niedrige polynomielle Laufzeit Die Laufzeit von wobei die Anzahl der Zust nde ist ergibt sich im brigen dadurch da jedes der Zustandspaare im Worst Case n mal betrachtet wird Der Faktor k l t sich dadurch erkl ren da jeweils k Vorg nger Token der betrachteten Zustandspaare untersucht werden m ssen 8 3 3 1 2 Die Erweiterungen von Schlimmer und Hermens Schlimmer et al 1993 verwendeten in ihrer Arbeit den bereits beschriebenen Algorithmus von Angluin zur Inferenz k reversibler Sprachen und erg nzten die Regelmenge um zwei weitere Regeln siehe Tabelle 6 1 Another state arcs to both states on the same word OR 2 Both states have a common 0 Leader AND either a both states are accepting states OR b both states transition to a common state via the same word 3 Both states have a comm
211. steomyelitis und anderen entz ndlichen Prozessen sowie prim ren und sekund ren Knochentumoren bzw dem Knochen benachbarten Weichteiltumoren Lissner et al 1992 Dabei liegt die St rke dieses Verfahrens weniger in der Darstellung oss rer Feinstrukturen aufgrund der geringen Protonendichte der Knochenstrukturen sondern eher in der Abbildung von Weichteilstrukturen der gesamten Wirbels ule Thurn et al 1998 3 Radiologie 22 Abbildung 6 MRT der Lendenwirbels ule 3 1 3 Elektronenstrahltomographie 3 1 3 1 Verfahren Im Gegensatz zur konventionellen Computertomographie besitzt die Elektronenstrahltomographie Electron Beam Tomography kurz EBT keine rotierende R ntgenr hre Der Elektronenstrahl wird vielmehr ber Fokussierungs und Ablenkspulen auf die halbkreisf rmig um den Patienten angeordneten Wolframtargets gelenkt Diese erzeugen die eigentliche R ntgenstrahlung vor Ort die wiederum von entsprechenden Detektorringen empfangen wird siehe Abbildung 7 Da die Ablenkung des Elektronenstrahls elektromagnetisch erfolgt sind extrem kurze Scanzeiten Abtastzeiten im Millisekunden Bereich realisierbar Insgesamt entspricht das Prinzip des EBT dem einer riesigen konventionellen R ntgenr hre 3 Radiologie 23 Fokussierungs spulen Elektronen kanone Ablenkspulen Detektorringe R ntgenstrahlung Vakuumpumpen Elektronenstrahl Abbildung 7 Prinzip der Elektronenstrahltomographie 3 1 3 2
212. suchungs V Untersuchung e A a v d technik FR ZEN AN SE LC Abbildung 27 Verarbeitung von Befunden mit identischen Meta Titeln 8 3 3 Merging von Zust nden Wie bereits in Kapitel 5 erw hnt basieren die verwendeten Verfahren zum Merging von Zust nden auf den Algorithmen von Angluin und Schlimmer Hermens zur Inferenz k reversibler Sprachen Im folgenden Abschnitt werden aus diesem Grund sowohl die Klasse der k reversiblen Sprachen als auch die genannten Algorithmen mit besonderem Schwerpunkt auf der Beschreibung der jeweiligen Regelmengen intensiver untersucht 8 3 3 1 Die Klasse der k reversiblen Sprachen Berwick et al 1987 definiert die Klasse der k reversiblen Sprachen wie folgt A regular language is k reversible where k is a non negative integer if whenever two prefixes whose last k words match have a tail in common then the two prefixes have all tails in common In other words a deterministic finite state automaton is k reversible if it is deterministic with lookahead k when its sets of initial and final states are swapped and all of its arcs are reversed 8 DFA Generierung 74 Abbildung 28 Nicht k reversibler Automat Anhand von Abbildung 28 kann das Kriterium der k Reversibilit t veranschaulicht werden Einerseits haben die Pr fixe Der Spinalkanal und Das Neuroforamen zwar den gemeinsamen Suffix ist eingeengt jedoch kann der Satz Das N
213. t indem die beste Beschreibung f r die Eingabedaten ermittelt wird Dabei mu die Voraussetzung gelten da die Konsistenz mit der Beispielmenge erhalten bleibt 5 2 3 Eigenschaften von Inferenzmethoden Grob gesagt ist eine Inferenzmethode ein computable process of some kind that reads in examples and outputs guesses from the hypothesis space Angluin et al 1983 Zum besseren Verst ndnis induktiver Inferenzverfahren sollen im folgenden die wichtigsten Charakteristika solcher Verfahren kurz definiert werden Grundlage der folgenden Begriffsbildungen sind jeweils ein Kriterium zur Evaluation der korrekten Inferenz eine Datenrepr sentation D und ein Inferenzverfahren 5 Maschinelle Lernverfahren 41 5 2 3 1 Ein Rahmen zur Evaluation von Inferenzverfahren Zur Erfolgskontrolle eines Inferenzverfahrens gibt es eine Reihe von Kriterien Die folgenden Begriffe stellen dabei eine definitorische Grundlage aller Inferenzverfahren dar Kapitel 5 2 6 beschreibt mit der Identifikation bzw Enumeration im Grenzwert wichtige Evaluationsmethoden Der Scope bezeichnet die Menge der Regeln die ein konkretes Verfahren M f r ein bestimmtes D inferiert Ein Verfahren M ist m chtiger more powerful als ein Verfahren falls der Scope von in M enthalten ist Eine Menge von Regeln U ist inferierbar in Bezug auf die Methode M falls U im Scope von M enthalten ist Die Dateneffizienz einer Inferenzmethode M ist definiert als di
214. t nde einen gemeinsamen Nachfolger Zustand besitzen Die Pfade vom jeweiligen Zustand bis zum gemeinsamen Nachfolger Zustand m ssen dabei disjunkt sein Diese einschr nkende Bedingung soll verhindern da Zust nde deren Vorg nger Zust nde auf einem gemeinsamen Pfad liegen zusammengefa t werden Diese Regel kann im brigen im Rahmen des Mergingvorganges alternativ zur Regel 3a ausgew hlt werden IN N EN Ti Tn a e Gap EE SE E b A Zustand Sm AN a gt Zustand S 1 Zustand S 1 Abbildung 36 Mergingregel 3aE 8 DFA Generierung 82 B ED MRT 5 Bws Graph mit der erweiterten Graph mit der urspr nglichen Version der Regel 3a Version der Regel 3a Abbildung 37 Vergleich der urspr nglichen mit der erweiterten Regel 3a Die Modifikation der Regel 3a von Schlimmer und Hermens soll im folgenden anhand zweier Befundfragmente erl utert werden 1 15 1 1999 MRT HWS 2 20 2 1998 CT BWS Die beiden Fragmente weisen folgende identische Struktur auf Tag Monat Jahr Untersuchungsmethode untersuchter Wirbels ulenabschnitt Abbildung 37 zeigt die beiden Automaten die vom System nach dem Einlesen der beiden Fragmente erzeugt wurden In beiden F llen wurden neben den Angluin Regeln 8 DFA Generierung 83 2a und 2b mit dem k Vorg ngerwert 0 die jeweilige Version der Regel verwendet Der von Schlimmer und Hermens vorgeschlagene Parame
215. t siehe Kapitel 11 5 2 4 3 4 7 Internet Verbindung vorhanden erscheint der entsprechende Dateiauswahldialog siehe Kapitel 11 5 2 3 2 1 ffne lokale Datei bzw 11 5 2 3 2 2 ffne externe Datei aus dem Netzwerk zum ffnen einer Datei f r den Briefkopf Diese sollte eine einfache Textdatei sein die als Einleitung f r den erfa ten Text zu sehen ist 11 5 2 4 3 3 9 Brieffu Die Ausf hrungen zu dem vorigen Abschnitt ber den Men punkt Briefkopf gelten auch f r diesen Men punkt mit der Einschr nkung da hier eine Datei angegeben werden kann die hinter dem erfa ten Text steht 11 5 2 4 3 4 Die sonstigen Optionen 11 5 2 4 3 4 1 MetaStruktur erw nscht Soll bei dem Lernen von Texten deren Struktur gem dem MetaKonzept ber cksichtigt werden so ist diese Option zu selektieren Ist sie nicht selektiert so werden die Texte jeweils als Ganzes betrachtet und das Lernverfahren arbeitet ber die Abschnittsgrenzen hinaus Die Einstellungen aus dem Kapitel 11 5 2 4 3 1 1 Festlegen der Merging Parameter die sich auf das Mergen von MetaZust nden beziehen haben demnach keine Auswirkungen auf den Lernproze Ebenso bleiben die in den Kapiteln 11 5 2 4 3 3 3 Mehrfaches Besuchen von Metazust nden und 11 5 2 4 3 3 4 Mehrfache Anzeige von Metatiteln vorgestellten Optionen ohne Wirkung da es keine MetaZust nde gibt Diese Option kann nur mit einem bisher leeren eingestellt werden Sobald ein Text gele
216. t der Sch ler aufgrund der bisher vom Lehrer erhaltenen Informationen einen Vorschlag in Bezug auf die zu identifizierende Sprache ab Dieser Proze ist prinzipiell unendlich Eine Sprachklasse wird als identifiziert bezeichnet falls es einen Algorithmus gibt so da nach einem Zeitpunkt t alle nachfolgenden Hypothesen des Sch lers identisch und korrekt sind Abbildung 14 veranschaulicht diesen Proze vom Blickwinkel der entsprechenden Grammatiken einer Sprache Grammatik Go ist die zu identifizierende Grammatik Der Lehrer erzeugt jeweils ein Beispiel aus der gesuchten Sprache und pr sentiert es dem Sch ler Dieser schl gt daraufhin eine bestimmte Grammatik G vor Die Grammatik stellt im Fall der Identifikation eine Repr sentation von dar 5 Maschinelle Lernverfahren 44 Grammatik Go Beispiele Grammatik Erzeugung Inferenz Beispiel 1 Grammatik G4 Beispiel 2 Grammatik G2 Beispiel n Grammatik G Abbildung 14 Identifikation formaler Grammatiken im Grenzwert Abbildung 15 verdeutlicht folgende Erkenntnisse in Bezug auf das Lernen von Sprache Zum einen sind mit positiven Beispielen allein in der Abbildung als text deklariert nur die Sprachen endlicher Kardinalit t erlernbar Alle anderen Sprachen auch die regul ren sind somit nicht allein durch positive Beispiele lernbar Zum anderen sind mit klassifizierten Beispielen in der Abbildung als informant bezeichnet alle Sprachklassen u
217. t relevanten Methoden der Computertomographie CT der Elektronenstrahltomographie EBT und der Magnetresonanztomographie MRT Im zweiten Abschnitt dieses Kapitels wird der radiologische Befundungsvorgang diskutiert Dabei wird neben den sprachlichen Besonderheiten der radiologischen Fachsprache auch die Struktur eines radiologischen Befundes untersucht Anschlie end werden die Anwendungsm glichkeiten des erstellten Systems im Rahmen der radiologischen Ausbildung sowie zur Unterst tzung des Arztes beim Befundungsvorgang diskutiert Der letzte Abschnitt behandelt die generellen Vorteile von Systemen zur Befundungsunterst tzung im Vergleich zu herk mmlichen Befundungsverfahren und gibt einen Einblick in die Methoden von Textbaustein bzw wissensbasierten Systemen 3 1 Bildgebende Verfahren in der Radiologie Die folgende Abbildung gibt einen berblick ber die wichtigsten radiologischen Untersuchungsverfahren siehe hierzu auch Seelos et al 1997 Die grau unterlegten Verfahren Computertomographie Magnetresonanztomographie und Elektronenstrahl tomograhpie werden in diesem Kapitel ausf hrlicher behandelt 3 Radiologie 17 bildgebende Verfahren analoge digitale Verfahren Verfahren P We 20 s Ba e konventionelle Tomographie ionisierend R ntgentechnik Computer tomographie nicht ionisierend Sonographie Positronen Magnet Emissions Resonanz Tomographie tomograph
218. t spezifische Bedeutung haben So ist z B bei EBT Befunden der Grad der Kalzifikation der Herzkranzgef e speziell f r einen Patienten Es wird kaum zwei Patienten geben die ber identische Kalzifikationsgrade in den Gef en verf gen Bei mehreren hundert gelernten Befunden w rde somit im TCI dem Arzt eine Anzahl von Kalzifikationswerten angezeigt werden die nicht mehr einfach handhabbar w re F r diese F lle bietet mAGENTa die Option an alle Tokens die nur Zahlen als Beschriftung aufweisen durch jeweils ein festgelegtes Token zu ersetzen Dieses Token hat die einheitliche Beschriftung XXX Durch die Vereinheitlichung der Tokens wird der Lernalgorithmus nun in die Lage versetzt mehr Zust nde zu mergen sofern es die Mersingregeln erlauben Durch die Verringerung der Anzahl der Tokens und Zust nde wird nicht nur die Gr e des DFA geringer es verringert sich auch die Anzahl der TokenComponents im Dies f hrt zu einer schnelleren Texterstellung da nicht mehr aus einer gro en Menge von TokenComponents ausgew hlt werden mu die mit verschiedenen Zahlen beschriftet sind sondern es wird nur noch eine TokenComponent mit der Beschriftung XXX dargestellt Am Ende des Befundungsvorganges hat der Benutzer dann die M glichkeit die korrekten Zahlen f r den Platzhalter in den erstellten Text einzusetzen 7 2 Das W rterbuch Das W rterbuch dient zum automatischen Ersetzen von W rtern Es enth lt eine Tabelle Has
219. te des Fensters zu sehen 11 5 5 1 Die W rterbucheintr ge Die Eintr ge des W rterbuches sind gem des Unicode Standards lexikographisch sortiert Um einen berflu an Informationen zu vermeiden kann das W rterbuch in 11 Benutzerhandbuch 152 einzelne Seiten eingeteilt werden Der Benutzer kann vorgeben wie viele Eintr ge pro Seite erw nscht sind siehe 11 5 5 3 2 1 Maximale Anzahl von Eintr gen pro Seite und mAGENTa teilt die W rterbucheintr ge in eine entsprechende Anzahl von Seiten ein Die einzelnen Seiten verf gen jeweils ber einen Reiter Tab der anzeigt welche Eintr ge sich auf ihr befinden Es werden auf dem Reiter jeweils die ersten f nf Buchstaben des ersten und letzten Eintrages angezeigt Durch Anwahl ihres Reiters kann die gew nschte Seite in den Vordergrund gebracht werden Die vertikal orientierten Eintr ge sind jeweils mit dem Wort und dessen Ersetzung aufgef hrt Links steht die Beschriftung rechts ein Textfeld zur Aufnahme der Ersetzung Zu Beginn ist das Textfeld mit dem Wort selbst gef llt da bisher der Benutzer noch keine Ersetzung eingetragen hat Dies kann der Benutzer durch berschreiben des Wortes vornehmen 11 5 5 2 Die Werkzeugleiste Die Werkzeugleiste bietet die Funktionalit t um das W rterbuch zu erweitern und in Synchronisation mit dem Graphen bzw DFA zu bringen 11 5 5 2 1 Neuer Eintrag M chte der Benutzer W rter ersetzen die noch nicht in den bisherigen Texten
220. tel 11 5 2 3 2 1 ffne lokale Datei Der u ere Unterschied besteht nur darin da der Knopf der vorher mit Open betitelt war hier mit Save beschriftet ist Speichere eine Graphdatei Look in Graphen v EI EA ol 08 D File Swe Files of type Cancel Abbildung 56 Speichere eine Graphdatei Wie im vorigen Abschnitt schon dargelegt ist die Speicherung von Dateien au erhalb des lokalen Systems nicht m glich Sollte dies gew nscht sein so kann die Datei die entsprechenden Zugriffsrechte vorausgesetzt mittels FTP auf den Server zur Dateiablage bertragen werden Insbesondere f r das sp tere ffnen von Graphdateien und deren bertragung durch das Netzwerk ist es wichtig da nicht durch gro e Dateien eine hohe Netzlast entsteht Um dies zu vermeiden werden die Dateien von mAGENTa vor dem Abspeichern automatisch komprimiert Durch das Verwenden des ZIP Algorithmus zur Komprimierung werden die Dateigr en auf ca 20 verringert Beispielsweise wurde ein Graph mit 8480 Zust nden 9235 Tokens und 17 MetaZust nden von einer urspr nglichen Dateigr e von 1 6 MegaByte auf nur 352 KiloByte reduziert 11 Benutzerhandbuch 123 Ist eine Graphdatei mit einem Namen versehen und abgespeichert worden so erscheint dieser Name k nftig in der Titelzeile des Hauptfensters 11 5 2 4 1 6 Befundliste einlesen Oftmals ist es notwendig mehrere Texte hintereinander zu lernen D
221. ten Mergingaufrufe Anzahl der gesamten Testaufrufe Prozentualer A Nummer des Lernlaufes Tokens Tokenanzahl absolut Tokenanzahl prozentual Zustandsanzahl absolut Anzahl der jetzt vorhandenen Zust nde zustandsanzahl prozentual 1 2b 3a 3b Dauer des Lernvorganges in Millisekunden Anzahl der Mergingoperationen auf Meta Ebene nteil der Mergingoperationen an den Testaufrufen Lineare Abweichung der aktuellen von der mittleren Tokenanzahl Mittelwert der Anzahl der Zustandsnachfolger Standardabweichung der Anzahl der Zustandsnachfolger Tabelle 18 Eintr ge des Mergingprotokolls 11 5 2 4 1 8 Eigenschaften des Graphen anzeigen Einen schnellen berblick ber den Umfang und besondere Charakteristika des Graphen bietet dieser Men punkt In dem sich ffnenden Dialog werden die wichtigsten Daten aufgef hrt 11 Benutzerhandbuch 126 E Eigenschaften des Graphen Anzahl der Tokens 3616 Anzahl der Zust nde 3163 Anzahl der MetaZust nde 17 Anzahl der Worte 940 Abbildung 59 Eigenschaften des Graphen Der Dialog wird durch einen Klick auf den Knopf OK wieder geschlossen Eine ausf hrlicheren Blick auf das Lernergebnis liefert der Men punkt Merging Protokoll anzeigen aus dem vorigen Abschnitt 11 5 2 4 1 9 Beenden Soll mAGENTa wirklich beendet werden ven Abbildung 60 Beenden von mAGENTa Nach Bet tigung
222. tenautomat 61 63 Abbildung 21 Pr fixbaum 63 66 Abbildung 22 Mergingvorgang Abbildung 23 Pr skriptive Metaregel 69 Abbildung 24 Deskriptive Metaregel 70 Abbildung 25 Meta Graph nach Anwendung der deskriptiven Metaregel Abbildung 26 Verarbeitung unvollst ndiger Befunde 71 72 Abbildung 27 Verarbeitung von Befunden mit identischen Meta Titeln Abbildung 28 Nicht k reversibler Automat 73 74 75 Abbildung 29 Mergingregel 1 Abbildung 30 Mergingregel 2a 76 Abbildung 31 Mergingregel 2b 76 Abbildung 32 0 Automat 78 Abbildung 33 Automat nach Anwendung der Regeln von Schlimmer Hermens Abbildung 34 Mergingregel 3a 79 79 Abbildung 35 Mergingregel 3b 80 81 Abbildung 36 Mergingregel Abbildung 37 Vergleich der urspr nglichen mit der erweiterten Regel 3a 82 Abbildung 38 bergeneralisierung 83 Abbildung 39 bergeneralisierender Automat 84 Abbildungsverzeichnis Abbildung 40 Graph f r Koronare Risikofaktoren 188 87 Abbildung 41 ZustandsRahmen 87 Abbildung 42 TokenButton 89 Abbildung 43 TokenChoice 89 89 Abbildung 44 EmptyComponent Abbildung 45 TokenComponent Interface f r Koronare Risikofaktoren 91 Abbildung 46 Client Server Paradigma 99 Abbildung 47 Oberfl chenkonzepte I Abbildung 48 Oberfl chenkonzepte II Abbildung
223. terbuch zu erstellen das mehrere Dom nen umfa t So k nnen im Rahmen der radiologischen Befundung z B die W rterb cher der Dom nen CT und MRT der Halswirbels ule zu einer Dom ne Untersuchung der Halswirbels ule zusammengefa t werden Generell erm glicht der beschriebene Integrationsproze eine dynamische Erweiterbarkeit des Dom nenwissens 6 2 Der Mergingvorgang Der bis zu diesem Zeitpunkt erstellte DFA gibt lediglich eine Repr sentation der bisher eingelesenen Befundungstexte wieder Dieser Automat erf llt noch nicht die gew nschte Eigenschaft weitere bisher noch nicht eingegebene Befunde zu erzeugen Zu diesem Zweck werden einzelne Zust nde des DFA im Rahmen eines maschinellen Lernverfahrens dem sogenannten Mergingverfahren zusammengefa t Dieser Vorgang f hrt zu einer Komprimierung des Automaten und somit zu einer Generalisierung der inferierten Sprache Als Konsequenz dieses Lernvorgangs k nnen nun zus tzliche Befunde auf der Grundlage der bisherigen Befunddaten erstellt werden Die umfangreiche Parametrisierbarkeit des Mergingvorganges erm glicht es dem Benutzer das Lernergebnis zu beeinflussen und somit die zu generierende Benutzeroberfl che seinen Bed rfnissen entsprechend anzupassen 6 3 Der Aufbau des TokenComponentinterfaces Das TokenComponentiInterface ist eine direkte Abbildung des gelernten DFA in eine benutzerfreundliche Oberfl che die den Arzt durch seinen Befundungsvorgang leitet F r
224. terwert f r wurde in beiden F llen bernommen Der Automat auf der linken Seite der Abbildung der auf der Basis der erweiterten Regel 3aE erzeugt wurde gibt die Struktur der Fragmente deutlich besser wieder als der Automat auf der rechten Seite bei dem die von Schlimmer und Hermens verwendete Regel 3a zugrunde gelegt wurde Entscheidend in diesem Fall sind die beiden Zust nde Z6 und Z14 auf der rechten Seite der Abbildung Zwar haben sie denselben 1 Vorg nger n mlich jedoch kann die urspr ngliche Regel hier nicht angewendet werden da sie keinen direkten gemeinsamen Nachfolger Zustand besitzen Neben der Regel 2a findet in diesem Fall keine weitere Regel Anwendung Im Gegensatz dazu erf llen die Zust nde Z6 und 714 die Bedingungen der erweiterten Regel 3aE und k nnen folglich zusammengefa t werden 8 3 3 2 bergeneralisierung Abbildung 38 bergeneralisierung Die Abbildung 38 visualisiert das Prinzip der bergeneralisierung Formal liegt eine bergeneralisierung der inferierten Grammatik G bzw des entsprechenden endlichen Automaten vor falls mindestens ein we amp existiert so da we L G und wg L Konkret bedeutet dies da die Sprache der inferierten Grammatik L G Strings enth lt die nicht Teil der gesuchten Sprache L sind Da der String w ein negatives Beispiel in Bezug auf die gesuchte Sprache L ist und L G diesen String enth lt ist L G somit inkonsistent mit der gegebenen Beispielmenge Im folgende
225. tet Dieser adaptive Softwareagent konstruiert also aus den gelernten Befunden eine leicht zu bedienende graphische Benutzeroberfl che die es dem befundenden Arzt erm glicht durch blo es Anklicken einzelner Oberfl chenelemente effizient einen Befund zu verfassen W hrend der Benutzung des Agenten pa t dieser sich selbst ndig an um f r zuk nftige Befundungen eine bessere Nutzbarkeit zu erreichen und den Arzt strukturiert durch seinen Befundungsvorgang zu leiten Technisch gesprochen soll das System Befundtexte einlesen mittels maschineller Lernverfahren eine interne Repr sentation davon erstellen und daraus eine graphische Oberfl che erzeugen mit der weitere Befunde erfa t werden k nnen F r jede Befundungskategorie z B EBT des Herzens oder der HWS ist es m glich jeweils einen Agenten zu trainieren Dies kann auch von verschiedenen rzten getrennt geschehen Die Agenten k nnen jedoch ihre einzeln akkumulierten Erfahrungen zusammenfassen so da sie jeweils bei weiteren Befundungen ein umfangreicheres Hintergrundwissen zur Verf gung haben Da die befundenden rzte i A nicht alle einen einzigen zentralen Computer zur Befunderfassung nutzen sondern eher r umlich getrennt ber ein Netzwerk Intranet oder auch Internet verbunden arbeiten ist es notwendig da die Kooperation zwischen ihnen auch ber diese Kan le erfolgt Um in heterogenen Netzwerken nicht f r jede Betriebssystem Plattform einen eigenen Ag
226. tiger Aspekt beim Einsatz von Befundungsunterst tzungs Systemen ist die deutliche Verbesserung der Vollst ndigkeit der erstellten Befunde Diverse Studien z B Heyder et al 1988 sowie Kuhn 1994 haben gezeigt da der Anteil fehlender Angaben in einem freitextlich erstellten Befund oft einen hohen Prozentsatz ausmacht und da dieser Anteil unter der Vorgabe einer strukturierten Erfassung der Befundtexte signifikant abnimmt Des weiteren erh ht sich auch die Objektivit t d h die Vereinheitlichung der erstellten Befunde Befunde die mittels nicht standardisierter Befundungsverfahren erstellt wurden weisen oft eine hohe Variationsbreite bei der Beschreibung der Befunddaten auf und es besteht kaum Konsens dar ber in welchem Detaillierunggrad bzw mit welcher Terminologie dokumentiert werden soll Kuhn 1996 Ein weiterer Gesichtspunkt der radiologischen Befundung ist die Validit t der Befunde also ihre Richtigkeit Zuverl ssigkeit und Konsistenz im Kontext der medizinischen Qualit tssicherung Dieser Aspekt ist unter der Voraussetzung da die zur Erstellung des Systems verwendeten Befunddaten die genannten Eigenschaften besitzen erf llt Au erdem erleichtert die direkte elektronische Verf gbarkeit der Befunddaten z B die Integration in ein radiologisches Informationssystem siehe hierzu Lipinski 1999 Hinzu kommt ein Trainingseffekt f r weniger erfahrene rzte bzw Studenten da diese gezielt und strukturiert durch den
227. tion ist aber von beliebiger Dauer 11 5 3 3 6 Fixieren Durch Selektion dieses Auswahlfeldes signalisiert der Benutzer da die Animation des Graphen angehalten werden soll Jeder einzelne Knoten des Graphen wird an seiner aktuellen Position festgesetzt seine Farbe ver ndert sich zu der in der Farbauswahl festgelegten Farbe f r die fixierten Knoten 11 Benutzerhandbuch 148 Dies ist n tzlich um einen schon in ausreichendem Ma e im Fenster verteilten Graphen daran zu hindern sich weiter zu bewegen Der Benutzer kann nun da die Knoten fixiert sind gezielter einzelne selektieren per Drag amp Drop an eine gew nschte Position ziehen oder sich die Kontextmen s anzeigen lassen 11 5 3 3 7 Aufl sen Bei einer gro en Anzahl von Knoten des Graphen kann es eine l ngere Zeit dauern bis eine geordnete Darstellung der Knoten vorliegt Dies ist haupts chlich von der Geschwindigkeit mit der die Elemente gezeichnet werden abh ngig und nicht von der Berechnung der neuen Positionen der Knoten Deshalb ist es m glich mAGENTa anzuweisen den Animations Algorithmus zur Berechnung der neuen Positionen ohne gleichzeitige Darstellung des Graphen auszuf hren Durch Bet tigung des Aufl sen Knopfes wird eine proportional zur Gr e des Graphen liegende Anzahl von Animationsschritten ausgef hrt ohne die Elemente jeweils an ihren neuen Positionen zu zeichnen Zus tzlich wird die bliche Schrittweite der Knoten auf 20 Pixel vervierf
228. tomographie des Herzens Abbildung 67 TCI nach einem Lernvorgang mit vorheriger Ersetzung von Zahlen Am Ende des Befundungsvorganges hat der Benutzer dann die M glichkeit die korrekten Zahlen f r den Platzhalter in den erstellten Text einzusetzen siehe Kapitel 11 5 7 Das Befund Fenster 11 5 2 4 3 4 5 Festlegen der Delimiter Damit der Lernalgorithmus erkennen kann wann ein MetaAbschnitt beginnt und wie dieser Abschnitt betitelt ist mu vor dem eigentlichen Abschnitt der MetaTitel stehen Dieser MetaTitel besteht aus dem Start Delimiter dem eigentlichen MetaTitel und dem End Delimiter Er dient somit in der Vorverarbeitung des Lernvorganges dazu statt eines normalen Zustandes einen MetaZustand zu generieren siehe Kapitel 8 3 1 So f hrt z B der folgende Eintrag in einem Befundtext dazu da ein MetaZustand mit dem Titel Untersuchung erzeugt wird wobei die nachfolgenden Worte als entsprechender Abschnittstext interpretiert werden Untersuchung 02 02 1998 Elektronenstrahltomographie des Herzens 11 Benutzerhandbuch 138 In diesem Beispiel ist also der Start Delimiter der End Delimiter Untersuchung der Mea Tel des neuen MetaAbschnittes und Elektronenstrahltomographie des Herzens der zugeh rige Abschnittstext Delimiter Start Delimiter End Delimiter ka OK Abbrechen Abbildung 68 Festlegen der Delimeter Wie aus der obigen Ab
229. u einem Zeitpunkt nur eine Komponente angew hlt werden kann Wenn eine angew hlt worden ist so wird die Beschriftung der Komponente in den Befundungstext bernommen und f r den nachfolgenden Zustand der Komponente der zugeh rige ZustandsRahmen angezeigt um hier mit der Eingabe fortzufahren 9 3 Die TokenComponents Zur graphischen Darstellung von Tokens gibt es drei verschiedene TokenComponents die TokenButtons die TokenChoices und die EmptyComponents Wird eine von ihnen bet tigt so wird f r den Zustand der ber das letzte dargestellte Token erreicht wird ein neuer ZustandsRahmen angezeigt der anstelle des alten angezeigt wird 9 3 1 TokenButton Ein TokenButton repr sentiert ein Wort bzw Token hier Token und eventuelle Listen von vorhergehenden und nachfolgenden Tokens die zusammengefa t worden sind 9 Das TokenComponent Interface 89 Token Abbildung 42 TokenButton Da in den gelernten DFA h ufig Pfade vorkommen auf denen die Zust nde nur durch ein einziges Wort in einen Nachfolgezustand berf hrt werden k nnen ist es sinnvoll diese auch nur durch einen einzigen TokenButton darzustellen W rde f r jeden dieser Worte ein eigener TokenButton generiert werden m te der Benutzer jedes Wort seines Textes einzeln anklicken was einer benutzerfreundlichen Darstellung widerspr che So werden die Worte auf linearen Pfaden die vor bzw hinter einem Zustand mit einem Verzweigungsgrad gr er als eins liegen
230. uch 159 eingetragen und der nachfolgende Zustand der TokenComponent dient nun auch als Nachfolger der EmptyComponent Die beiden Tokens sind nun parallel in dem DFA angeordnet Ist die Eingabe in eine EmptyComponent vollst ndig so mu zur Best tigung der Weiter Knopf bet tigt werden 11 5 6 2 4 Die Neben dem ersten Rahmen f r den aktuellen Zustand k nnen sich in horizontaler Anordnung noch weitere Rahmen befinden die TokenComponents beinhalten Diese sind allerdings noch nicht selektierbar da die Eingabe gem der in dem DFA herrschenden Reihenfolge zu erfolgen hat da sonst keine strukturierte Anleitung mehr erfolgen w rde In Abbildung 81 findet sich neben dem aktuellen Rahmen ein zweiter der einen TokenButton sowie eine EmptyComponent beinhaltet Der Zustand der durch den ersten Rahmen repr sentiert wird wird gem des DFA ber die Tokens der ersten TokenComponent in einen nachfolgenden Zustand berf hrt der nun durch den zweiten Rahmen repr sentiert wird Dies ist nat rlich transitiv Es werden so viele Rahmen angezeigt bis ein bergang zu einem Meta oder TerminalZustand erreicht wird oder f r denselben Zustand noch ein Rahmen erstellt werden soll Zyklus Gem den Voreinstellungen siehe Anhang Voreinstellungen sind die TokenComponents nach der Frequenz ihrer Tokens sortiert siehe Kapitel 11 5 2 4 3 3 5 Nach Frequenz Das wahrscheinlichste Token wird als erstes angezeigt Also
231. uenz Der eingelesene Text enth lt Exception beginnt nicht mit inen End Delimiter ohne da einer Markierung zuvor ein entsprechender Start Delimiter angegeben wurde KorrektTerminie Eine Endekennung Der eingelesene Text enth lt zwar rtException wurde nicht angegeben einen Start Delimiter jedoch keinen entsprechenden End Delimiter Tabelle 17 potentielle Fehler beim Einlesen eines Befundes 11 5 2 3 2 Befund ffnen Ein Befund kann nat rlich nicht nur ber die Tastatur eingegeben werden Falls er schon in elektronisch lesbarer Form als Datei vorliegt kann er direkt eingelesen werden Der Befund mu hierzu in dem Unicode Format vorliegen Unicode ist eine 16 Bit Zeichenkodierung im Gegensatz zu der herk mmlichen ASCII und 15088591 Latin l Kodierung die nur ein Byte ben tigt Der Unicode Standard enth lt 38 885 unterschiedliche Zeichen aus den weltweit 25 wichtigsten Sprachen bzw Schriften Da die 256 Unicode Zeichen u0000 bis 00 16 Bit Unicode Z hlweise mit den Zeichen 0x00 bis OxFF 8 Bit Hexadezimal Z hlweise der oben genannten Kodierungen identisch sind Flanagan 1998 k nnen auch ganz normale Textdateien eingelesen werden Auch dies unterstreicht wieder den flexiblen Grundgedanken von mAGENTa Die Befunddatei kann sich entweder lokal auf der Festplatte befinden oder auch innerhalb des Netzwerkes auf das der Benutzer Zugriff hat 10 Zum besseren Verst ndnis der nachfolgenden Tabelle sei
232. ufl sung 11 5 2 4 3 1 3 Farbauswahl Die Farbauswahl Option dient dazu die Erscheinung des Graphen und des MetaGraphen farblich zu ver ndern Den einzelnen graphischen Elementen lassen sich unterschiedliche Farben zur besseren Identifikation zuordnen Die Gesamtheit aller Farbeinstellungen das Farbschema l t sich zur sp teren Verwendung auch abspeichern Dadurch wird erm glicht da jeder Benutzer sein eigenes individuelles Farbschema benutzen kann Die f rbbaren graphischen Elemente zustand MetazZustand TerminalZustand Token Selektierter Knoten Fixierter Knoten Kante von einem Zustand Kante von einem Token Kantenl nge Text Tabelle 21 Die f rbbaren graphischen Elemente 11 Benutzerhandbuch 131 In der obigen Tabelle sind die graphischen Elemente aufgelistet denen jeweils eine Farbe zugeordnet werden kann Die Farbe eines Elementes wird jeweils durch ihre Rot Gr n und DBlau Komponenten charakterisiert RGB Modell Die einzelnen Komponentenanteile sind ganze Zahlen zwischen und 255 Die Standardfarbe f r ein Zustandsknoten beispielsweise hat einen roten Anteil von 255 einen gr nen von 201 und einen blauen von 2 Die Voreinstellung f r die brigen Farbwerte findet sich in Anhang Voreinstellungen E3 Farbschema x Zustand ffnen Meta Zustand lt Terminal Zustand Rot 255 Token Gr n Selektierter Knoten Blau Fixierter Knoten Kante von Zustand Kante von Toke
233. uftritt ist in Kapitel 3 2 2 Der radiologische Befund angegeben Hier ist deutlich die oben dargelegte Dreiteilung des Textes zu erkennen Briefkopf und Brieffu sollten einfache Textdateien sein die als Epilog bzw Prolog zu dem erfa ten Text dienen In ihnen k nnen Schl sselworte eingef gt sein die f r bestimmte Angaben die in allen Texten immer wieder vorkommen Platzhalter sind Beispielsweise ist hier an das aktuelle Datum die aktuelle Uhrzeit das K rzel des befundenden Arztes usw zu denken Einige k nnen automatisch von mAGENTa ersetzt werden andere m ssen f r jeden Text individuell eingetragen werden Nach der Fertigstellung des gesamten Textes durch Hinzuf gen von Biefkopf und Brieffu kann dieser gespeichert oder direkt ausgedruckt werden Die folgenden Abschnitte zeigen exemplarisch einen typischen Briefkopf und Brieffu sowie eine Aufstellung von Platzhaltern und Schl sselworten die bei der Verwendung von mAGENTa eingesetzt werden k nnen 10 Erzeugen der Befunddokumente 97 10 2 Briefkopf Ein einfacher Briefkopf k nnte z B in folgender Form gestaltet sein Lehrstuhl f r Radiologie und MikroTherapie Prof Dr med Dietrich H W Gr nemeyer Institut f r MikroTherapie Universit tsstra e 142 D 44799 Bochum Telefon 0234 9 71 31 0 Telefax 0234 9 71 31 99 e mail info microtherapy de Internet www microtherapy de ANSCHRIFT ANSCHRIFT ANSCHRIFT ANSCHRIFT
234. ule Aus diesem Grund erreicht man mit dem vorgestellten System die besten Ergebnisse wenn man f r jede Dom ne einen speziellen Automaten lernt 2 Diese Eigenschaft der Befundtexte er ffnet im brigen die M glichkeit zur automatischen bertragung dieser Strukturierung auf die vom System erzeugte Datenstruktur Zum besseren Verst ndnis dieses Vorgangs sei an dieser Stelle auf das Kapitel 7 Verarbeitung von Befundtexten verwiesen 3 Radiologie 28 Institut f r MikroTherapie Universit tsstr 142 D 44799 Bochum Herrn Mustermann Musterstr 10 12345 Musterstadt Bochum 20 12 1998 mm Sehr geehrter Herr Mustermann Betreff 17 12 1998 Computertomographie Halswirbels ule Fragestellung Status vor Mikrotherapie Untersuchungstechnik Kontinuierliche abschlu plattenparallele 3 3 mm Schichtung der Intervertebralr ume C3 4 bis C7 Thl Ausdruck in Weichteil und Knochenfenstertechnik Segment C2 3 Unauff llig Segment C3 4 Regelrechter Abschlu der Bandscheiben in der Dorsalkante des Wirbelk rpers Die Neuroforamina und der Spinalkanal sind unauff llig Segment 4 5 Regelrechter Abschlu der Bandscheiben in der Dorsalkante des Wirbelk rpers Die Neuroforamina und der Spinalkanal sind nicht eingeengt Segment 5 6 Medialer bis links lateraler Bandscheibenprolaps mit Pelottierung und leichter Kompression des Duralschlauchs Einengung des linken Neuroforamens Spondylosis deformans Segment C6
235. ung wird zwischen konventionellen nicht rechner basierten und rechnerbasierten Methoden unterschieden Bei der konventionellen Befunderfassung werden die Befunddaten zum Teil handschriftlich oder mittels Diktat erfa t und m ssen zur Weiterverarbeitung im Rechner nachtr glich von einer Schreibkraft in eine elektronische Form bertragen werden Dieser Vorgang dauert zum einen wesentlich l nger als die direkte Eingabe des Befundes in den Rechner zum anderen ist die Gefahr einer Verf lschung der urspr nglichen Daten aufgrund des mehrfachen Medienbruches relativ hoch Bei der rechnerbasierten Befunderfassung werden die Befunddaten direkt in den Rechner eingegeben Die Eingabe der Befunde kann dabei durch ein Befundungs unterst tzungs System siehe Kapitel 3 3 erleichtert werden In der Praxis ist der Vorgang der Befundung in vielen F llen noch nicht standardisiert und bietet Raum f r Verbesserungen hinsichtlich der Qualit t und der Verf gbarkeit der erstellten Befunde Das vorgestellte System setzt an diesen Punkten an um die Effizienz des Befundungsvorgangs zu erh hen 3 Radiologie 30 3 3 Befundungsunterst tzungs Systeme 3 3 1 Generelle Vorteile von Befundungsunterst tzungs Systemen Bei der Befunderstellung mittels Freitext oder Diktat mu der Befund erst in eine elektronische Form bertragen werden Dieser Proze bedeutet einen hohen Zeitaufwand und die Gefahr der Verf lschung der urspr nglichen Daten Ein wich
236. ungsvorgang geleitet rzte vor allem Radiologen unterst tzt mAGENTa so aktiv bei der Befunderfassung indem sie schrittweise durch den Befundungsvorgang geleitet werden Da das TokenComponent Interface sowohl theoretische als auch praktische Bewandtnis hat wird in diesem Kapitel auf die theoretischen Hintergr nde eingegangen w hrend im Benutzerhandbuch in dem Kapitel ber das TCI die praktische Anwendung durch den Benutzer im Vordergrund steht 9 1 Zusammenhang zwischen DFA und TokenComponent Interface Das TCI ist eine direkte Abbildung des gelernten DFA in eine benutzerfreundliche Darstellung Ein einzelner Text kann als Pfad betrachtet werden der durch den DFA beschritten wurde Von einem Zustand aus kann jeweils ein Wort Token gem der Zustands berf hrungsfunktion gew hlt werden um in einen n chsten Zustand zu gelangen Beginnend bei dem StartZustand man vriert der Benutzer so von Zustand zu Zustand bis er in einem TerminalZustand endet Die Konkatenation Verkettung der einzelnen W rter die jeweils einen Zustand in den n chsten berf hrt haben ergibt nun einen zusammenh ngenden Text F r jeden Zustand im DFA der mehr als einen Zustands bergang hat also mehr als zwei ausgehende Kanten kann der Benutzer sich entscheiden welchen Weg er gehen m chte Er hat also die Wahl welches Wort er eingeben m chte um in den n chsten Zustand zu gelangen Diese Wahlm glichkeit an einem Zustand wird im TCI durch Tok
237. urce Locator Index A Adaptvt t 13 107 184 eege 34 es ine silber 38 ae rel TEE 148 Animationsschritt esersssesseersssenssnernnnnn 149 Anleit ns nnsshsrteetentesiteise 107 Applet EE 102 AUSWEITUNG E 171 Automat Deterministischer endlicher Automat 62 Inverser Automat 63 Kanonischer 63 Quotienten Automat eeeeeeeeeeesee eesse eeeeeee 64 Autonomes Handeln 36 B 98 Befunderfassung konventionell essen 30 rechnerbasiert 30 Beiundltete soeren es 117 125 Befundtexte Objektivit t nanne a ENEE 31 Nalidit t 31 Verf gbarkeit 31 Befundungepraxig 30 Befundungsunterst tzungs Systeme 31 Textbaustein basierte Systeme 32 Wissensbasierte 32 Beispiel klassifiziert 62 Negativ seine ED 62 62 strukturell vollst ndig 63 Benutzerfreundlichkeit A 171 Benutzerhandbuch ss seseeseseeseesereesreeseeee 101 Benutzeroberfl che 112 Bildgebende 16 Computertomographie 18 Elektronenstrahltomographie 22 Magnetresonanztomographie 19
238. urch einen horizontalen Mittelsteg getrennt Dieser Mittelsteg ist beweglich so da die Gr enverh ltnisse der beiden Bereiche den W nschen des Benutzers gem angepa t werden k nnen Durch einfaches Ziehen mit der Maus kann der Mittelsteg verschoben werden Wird einer der beiden kleinen Pfeile am linken Ende des Mittelsteges bet tigt so wird der Eingabebereich bzw das Textfeld vergr ert da es die gesamte Fl che bedeckt Durch erneute Anwahl wird wieder das urspr ngliche Gr enverh ltnis hergestellt 11 Benutzerhandbuch 158 Die Angaben ber die MetaZust nde gelten im folgenden nur wenn die MetaStruktur auch aktiviert worden ist siehe Kapitel 11 5 2 4 3 4 1 MetaStruktur erw nscht 11 5 6 1 Der MetaTitel Wird bei der Arbeit mit mAGENTa die MetaStruktur verwendet so erscheint in diesem Feld der Titel des aktuellen MetaAbschnittes zur Orientierung f r den Benutzer 11 5 6 2 Der Eingabebereich In dem Eingabebereich werden die einzelnen TokenComponents dargestellt TokenComponents ist der Oberbegriff f r TokenButtons TokenChoices und EmptyComponents Die ersten beiden sind mit einer Aufschrift versehen in die EmptyComponent kann Text der dem DFA an dieser Stelle hinzugef gt werden soll eingetragen werden 11 5 6 2 1 Die TokenComponents Das TCI zeigt die TokenComponents die von einem Zustand bis zum n chsten MetaZustand aus erreichbar sind an Beginnend mit dem StartZustand des DFA werden f r jede ausg
239. usammengefa t werden sollen Gehen von einem Zustand mindestens so viele Kanten aus wie festgelegt worden ist und enden alle von diesem Zustand ausgehenden lineare Pfade in dem selben Zustand so wird eine TokenChoice erzeugt Die konkatenierten Tokens die jeweils auf einem ausgehenden Pfad liegen bilden einen Eintrag der TokenChoice Wird ein Wert angegeben der gr er ist als der maximale Verzweigungspfad des DFA so werden nur TokenButtons generiert 10 Erzeugen der Befunddokumente 10 1 Aufbau des Befunddokumentes Bei der Texterfassung mittels des TokenComponent Interfaces bet tigt der Benutzer eine Folge von TokenComponents Beginnend mit dem StartZustand werden die einzelnen Zust nde die durch die ZustandsRahmen repr sentiert werden gem der Zustands bergangsfunktion in andere Zust nde berf hrt Dieser Vorgang f hrt schlie lich zu einem TerminalZustand Ist dieser erreicht so ist der Texterfassungsvorgang beendet und der endg ltige Text kann erstellt werden Der erfa te Text ergibt sich jetzt aus den Tokens die auf dem Pfad liegen den der Benutzer durch die TokenComponents ausgew hlt hat Zus tzlich zu diesem erfa ten Text gibt es die M glichkeit einen Briefkopf und einen Brieffu vor bzw hinter dem Text einzuf gen In diesen Texten k nnen sich beispielsweise ein Standardanschreiben und eine Verabschiedungsformel befinden Ein typischer radiologischer Befundtext so wie er in der t glichen Praxis a
240. usammenhang da die betrachteten Dom nen bez glich der einzelnen Kriterien vergleichbare Profile auswiesen Dieses Verhalten lie sich sowohl f r den Komprimierungsgrad als auch den Anteil der Zyklen den durchschnittlichem Fan Out und die Anzahl der Einaben je Befundungsvorgang beobachten Der Zeitaufwand f r einen Befundungsvorgang h ngt im Grunde von mehreren Kriterien ab Zum einen hemmt ein hoher durchschnittlicher Fan Out diesen Vorgang da der Arzt unter Umst nden die gesamte Liste der Tokensequenzen durchsehen mu um einen gew nschten Eintrag zu finden Zum anderen erschwert ein hoher Zyklenanteil bzw eine hohe Anzahl von Eingaben eine effektive Befundung und wirkt sich negativ auf die Geschwindigkeit aus 13 Abschlie ende Betrachtung 13 1 Zusammenfassung Die im ersten Abschnitt formulierten Anforderungen an ein Befundungsunterst tzungs system werden mit dem hier vorgestellten Softwareagenten erf llt Im folgenden wird konkret auf einzelne Anforderungen und ihre entsprechende Realisierung im System eingegangen zu l Kategorisierung F r jede Befundkategorie ist es m glich jeweils einen eigenen Agenten zu trainieren Im Rahmen umfangreicher Testreihen wurde exemplarisch eine Kategorisierung in die Dom nen CT HWS CT LWS und MRT LWS vorgenommen Eine Einteilung der radiologischen Befundung in weitere Befundkategorien ist denkbar und mit dem vorliegenden System ohne weiteres zu realisieren zu2 Strukturierung
241. ve falls sich die Hypothese bei neuen Eingabedaten nur dann ndert wenn sich eine Inkonsistenz der Hypothese mit den Eingabedaten ergeben hat 5 2 5 Praktische Inferenzmethoden Das Verfahren Hypothesen innerhalb des Suchraumes linear anzuordnen ist denkbar ineffizient und wird heute in der Regel durch Verfahren ersetzt die sich durch eine Strukturierung des Hypothesenraumes auszeichnen Durch diese Strukturierung ist es m glich im Falle einer Inkonsistenz mehr als nur jeweils die letzte Hypothese auszuschlie en 5 Maschinelle Lernverfahren 42 Dieser Ansatz der Strukturierung des Hypothesenraumes zur effizienteren Inferenz von Hypothesen ist einer der grundlegenden Ans tze zahlreicher Verfahren der Grammatik Inferenz insbesondere bei regul ren Sprachen Der Ansatz soll an dieser Stelle nur skizziert werden eine ausf hrlichere Behandlung erfolgt im Zusammenhang mit der DFA Generierung im Kapitel 8 Zun chst wird ein DFA erzeugt der konsistent ist mit der Menge der positiven und negativen Beispiele Dieser Automat wird durch sukzessive Zusammenfassung Merging von Zust nden komprimiert Der Hypothesenraum der durch die so entstandenen endlichen Automaten gebildet wird stellt eine erhebliche Einschr nkung des urspr nglich unstrukturierten Suchraumes dar Ein anderer Ansatz ist die Betrachtung von Subsumptionsbeziehungen Hierbei geht man von einer partiellen Ordnung des Hypothesenraumes in Bezug auf die Generalit t Spe
242. ve Meta Regel 8 3 2 3 Deskriptive Meta Regel 8 3 2 4 Verarbeitung unvollst ndiger Befunde 8 3 2 5 Verarbeitung von Befunden mit mehrfach auftretenden Meta Titeln 8 3 3 Merging von Zust nden 8 3 3 1 Die Klasse der k reversiblen Sprachen 8 3 3 1 1 Der Algorithmus von Angluin 8 3 3 1 1 1 Regel 1 8 3 3 1 1 2 Regel 2a 8 3 3 1 1 3 Regel 2b 8 3 3 1 1 4 Eigenschaften des Algorithmus 8 3 3 1 2 Die Erweiterungen von Schlimmer und Hermens 8 3 3 1 2 1 Regel 3a 8 3 3 1 2 2 Regel 3b 8 3 3 1 3 Eigene Erweiterung 8 3 3 1 3 1 Regel 3aE 8 3 3 2 bergeneralisierung 9 Das TOKENCOMPONENT INTERFACE 9 1 ZUSAMMENHANG ZWISCHEN DFA UND TOKENCOMPONENT INTERFACE 9 2 ZUSTANDSRAHMEN 9 3 DIE TOKENCOMPONENTS 9 3 1 TokenButton 9 3 2 TokenChoice 9 3 3 EmptyComponent 56 __57 57 58 58 60 60 64 64 64 64 65 67 67 67 68 68 68 68 69 70 72 73 73 73 74 75 75 76 76 77 79 80 81 81 83 86 86 87 88 88 89 89 Inhaltsverzeichnis 9 4 ALGORITHMUS ZUR GENERIERUNG DES TOKENCOMPONENTINTERFACES 9 5 DIE GENERIERUNG DES TCI AN EINEM BEISPIEL 9 6 DIE PARAMETRISIERUNGEN 9 6 1 Anzeige von Nachfolgersymbolen 9 6 2 Anzeige von Steuerzeichen 9 6 3 Mehrfaches Besuchen von MetaZust nden 9 6 4 Mehrfache Anzeige von MetaTiteln 9 6 5 Sortierung der Tokens nach Frequenz 9 6 6 Protokoll der Positionen der TokenComponents 9 6 7 Anzahl TokenChoice 10 ERZEUGEN DER BEFUNDDOKUMENTATION 10 1 AUFBAU DER BEFUNDDOKUMENTATION 10 2 BRIEF
243. vorkamen wohl aber in zuk nftigen so k nnen auch Eintr ge in das W rterbuch vorgenommen werden die erst sp ter zur Anwendung kommen Wird der Knopf Neuer Eintrag bet tigt so werden zwei Textfelder vor dem ersten Eintrag der sichtbaren Seite eingef gt In das linke tr gt der Benutzer das oder die zu ersetzenden W rter ein in das rechte die gew nschte Alternative evtl auch aus mehreren W rtern bestehend Dies kann auch dazu genutzt werden einzelne Eintr ge des W rterbuches die sich im Graph in einer linearen Liste von Tokens befinden durch ein gemeinsames Wort zu ersetzen 11 5 5 2 2 Ansicht Aktualisieren Dieser Knopf gleicht die Ansicht des W rterbuches mit dessen Eintr gen ab Wurde z B ein neuer Eintrag in das W rterbuch vorgenommen so wird das Wort und seine Ersetzung an der lexikographisch richtigen Stelle angezeigt 11 5 5 2 3 Graph aus W rterbuch Wurden in dem W rterbuch Ersetzungen vorgenommen oder neue Eintr ge hinzugef gt so mu der Graph entsprechend aktualisiert werden damit beide Fenster ber synchrone Darstellungen verf gen 11 Benutzerhandbuch 153 Bei einer Ersetzung eines Wortes durch das W rterbuch werden durch Bet tigung dieses Knopfes s mtliche Tokens des Graphen die mit diesem Wort beschriftet sind durch Tokens die mit der Ersetzung des Wortes beschriftet sind ersetzt 11 5 5 2 4 W rterbuch aus Graph Sind hingegen an dem DFA Ver nderungen 1 durch Lernen von neuen Te
244. w nschte Datei ausw hlen und auch in dem Browserfenster ansehen bevor sie von mAGENTa geladen wird Die folgende Abbildung illustriert diesen Vorgang Hilfeseite Bearbeiten Optionen Hilfe okenComponent Interface W rterbuch Graph Ansicht MetaGraph Befuna ffnen Eingabe hinzuf gen Befunde Graphen 030 E URL Eingabe Befund W rterb chern 063 Bitte geben Sie die URL des Befundes ein den Sie ffnen m chten runr uni bochum defkai bullerdickDiplomarbeitBefunde ebt 003 hd Cal ze Farbschemata Briefteile Gliederung der Diplomarbeit 062 ffne einen Befund Folien des Vortrags Abbildung 55 ffne externe Datei mittels eines Internet Browsers Wird die gew nschte Datei in dem Browserfenster angezeigt so kann mittels der rechten sekund ren Maustaste die Verkn pfungsadresse kopiert werden und anschlie end in das Textfeld des Eingabedialoges bertragen werden Nun kann die Datei wie oben beschrieben ber das Netzwerk geladen werden 11 Benutzerhandbuch 120 Die Indexdateien wurden mit dem Hilfsprogramm generatelndex vgl Kapitel 11 7 generatelndex welches auch im Rahmen der Diplomarbeit geschrieben wurde erstellt 11 5 2 3 3 Graph Ansicht Dieser Knopf ist nur dann aktivierbar wenn bisher etwas gelernt worden ist Die Bet tigung dieses Knopfes ffnet das Fenster mit einer anschaulichen dynamischen graphischen Visu
245. weis bzw verblose Satzfragmente Regelrechter Abschlu der Bandscheiben in der Dorsalkante des Wirbelk rpers enthalten Zum anderen ist h ufig eine Verdichtung Kondensierung der radiologischen Fachsprache zu verzeichnen die sich unter anderem in der Bildung von Komposita manifestiert und zu Wortneubildungen wie z B Facettengelenkarthrose f hrt Au erdem ist ein hoher Grad an Redundanz zu verzeichnen Beispiele hierf r finden sich im vorliegenden Befundunsgstext z an folgenden Stellen Bandscheibenvorfall Abschnitt C7 Thl und Bandscheibenprolaps Abschnitt C5 6 bzw Die F r eine intensivere Besch ftigung mit den grundlegenden Begriffen und Prinzipien der automatischen Sprachverarbeitung sei an dieser Stelle auf Hellbig 1991 verwiesen 3 Radiologie 26 Neuroforamina und der Spinalkanal sind unauff llig Abschnitt C3 4 und Die Neuroforamina und der Spinalkanal sind nicht eingeengt Abschnitt 4 5 Das Problem der Redundanz kann weitgehend durch eine Standardisierung radiologischer Begriffe umgangen werden Eine Umsetzung dieser Standardisierung wird im vorliegenden System im brigen durch Verwendung eines W rterbuches realisiert Medizinische Fachsprache im Allgemeinen und die radiologische Fachsprache im Speziellen erlaubt die Beschr nkung auf bestimmte sprachliche Ph nomene Diese Eigenschaft der Fachsprachen hat zur Folge da Sprache in ihrer vollen Allgemeinheit nicht
246. wird auch der n chste Rahmen f r den Zustand angezeigt der erreicht wird wenn der Pfad ber diese Tokens begangen wird M chte der Benutzer aber wissen welche weiteren TokenComponents einer bestimmten TokenComponent folgen die sich nicht an erster Stelle in dem Rahmen befindet so ist lediglich die sekund re Maustaste i A die rechte zu bet tigen Unmittelbar werden der n chste und evtl folgende Rahmen durch den Rahmen ersetzt der den Zustand repr sentiert der erreicht wird wenn die betrachtete TokenComponent bet tigt wird Auch hier werden evtl weiter Rahmen erzeugt Diese TCI Vorschau ist nicht nur f r den ersten Rahmen sondern auch f r die folgenden m glich Weitere Rahmen werden entsprechend durch neue ersetzt Bet tigt der Benutzer bei Darstellung des TCI wie in der obigen Abbildung die sekund re Maustaste auf der TokenComponent Diabetes mellitus so wird wie aus der folgenden Abbildung ersichtlich der zweite Rahmen durch zwei neue ersetzt Mit den Angaben in den zweiten Rahmen kann der Typ des Diabetes mellitus n her bestimmt werden 11 Benutzerhandbuch 160 W hlen Sie Ihre Eingabe Hypercholesterin mie Nikotinabusus Goin Se lt gt Dyslipoprotein mie mit ang O Diabetes mellitus O Adipositas 50 Positive Familienanamnese O Nicht zu erheben O Inzwischen eingestellter ts Hyperurik mie Belastungsabh ngige arterielle Hypertonie Arterielle Hypertonie Abbildung 82 TCI V
247. xten vorgenommen worden so kann es auch hier vorkommen da die Eintr ge des W rterbuches nicht ber die gleiche Aktualit t wie die Eintr ge des DFA verf gen Insbesondere wenn das W rterbuch Fenster ge ffnet ist und dem DFA neue Texte hinzugef gt werden werden in dem W rterbuch Fenster neu dazugekommene Worte nicht sofort angezeigt Wird dieser Knopf bet tigt so werden die Eintr ge des DFA in das W rterbuch aufgenommen und die Ansicht anschlie end aktualisiert 11 5 5 2 5 Merge Ist in dem Dialog f r die Merging Parameter siehe 11 5 2 4 3 1 1 Festlegen der Merging Parameter festgelegt worden da der Lernproze nicht sofort bei jeder nderung am DFA gestartet werden soll so ist dieser Knopf nach nderung von Eintr gen des W rterbuches aktivierbar Ansonsten wird bei jeder nderung der W rterbucheintr ge direkt der Lernproze gestartet M chte der Benutzer mehrere nderungen an dem W rterbuch vornehmen so ist es oftmals sinnvoller erst alle diese nderungen einzutragen und dann gemeinsam auf einmal lernen zu lassen indem durch Bet tigung dieses Knopfes der Lernproze gestartet wird 11 5 5 3 Das Men Das Men verf gt im wesentlichen ber die Funktionalit t des Men s des mAGENTa Hauptfensters Es gibt ein Men f r die Dateiverarbeitung und eins f r Optionen Da die Funktionalit t sich sehr hnelt wird hier auf das entsprechende Kapitel verwiesen siehe Kapitel 11 5 2 4 Die Men s
248. ystem den W nschen des Benutzers entsprechend anzupassen Bei der Beschreibung der einzelnen Komponenten des Systems wurde darauf geachtet ein durchg ngiges Beispiel aus dem realen Alltag eines Radiologen zu verwenden Es wurden reale Befundtexte zu EBT Aufnahmen des Herzens verwendet 11 1 Systemvoraussetzungen mAGENTa ist gem des Client Server Paradigmas aufgebaut Comer 1999 Der Server stellt das System als Dienst zur Verf gung der Client greift zur Benutzung dieses Dienstes auf den Server zu Client und Server nutzen zur Kommunikation den TCP IP Protokollstapel Transport Internet Transport Transport Netzschnittstelle Internet Internet Netzschnittstelle Netzschnittstelle Abbildung 46 Client Server Paradigma Internet Intranet 11 Benutzerhandbuch 100 Sowohl der Client als auch der Server m ssen ber einen Zugang zum selben Netzwerk verf gen Internet oder Intranet in dem mit mAGENTa gearbeitet werden soll Dieser Zugang l uft wie aus der obigen Abbildung ersichtlich ber eine Netzschnittstelle Netzwerkkarte Modem oder dergleichen die Internet Protokolle IP und die Transportprotokolle TCP Daten werden ber diese einzelnen Schichten zwischen der Anwendung auf dem Client und der Anwendung auf dem Server bermittelt 11 1 1 Der Client Um auf einzelne Seiten welche auf entfernten Servern in einem Netzwerk stehen
249. zeitlich 2 Einleitung 13 von Nachteil ist Bei der manuellen Eingabe von Texten ber eine Tastatur ist es oft der Fall da sich einfache Schreibfehler wie z B Buchstabendreher fehlende Buchstaben usw einschleichen 5 Adaptivit t Das System sollte an die Belange des Benutzers angepa t werden k nnen Dar ber hinaus ist es w nschenswert durch die selbst ndige Anpassung eine erh hte Nutzbarkeit zu erreichen Es mu einfach m glich sein Informationen zu entfernen zu ndern oder zu erg nzen Ist z B ein Wort falsch geschrieben so sollte dieses durch die korrekte Schreibweise ersetzt werden k nnen bzw automatisch ersetzt werden 6 kooperative Nutzung Jeder Arzt befundet nur auf Grundlage seines eigenen Kenntnisstandes ohne w hrend der Befundung auf die Erfahrungen anderer zur ckgreifen zu k nnen In vielen Kliniken und gro en Praxen sind untereinander vernetzte Systeme zu finden Die Infrastruktur um das Potential der vorhandenen rzte im Intra oder Internet kooperativ zu nutzen ist gegeben wird aber noch nicht ausgesch pft Da die eingesetzten Netzwerke oftmals heterogen sind ist ein plattformunabh ngiges System sinnvoll Durch die gemeinsame Nutzung des gleichen Systems k nnen Fehler leichter aufgesp rt werden die ein einzelner bers he 7 _Dom nenunabh ngigkeit Prinzipiell soll das System unabh ngig sein von der Wahl der jeweiligen Kategorie Hiermit ist nicht nur gemeint da beliebige Befund
250. zifit t der Hypothesen aus Sei eine Hypothese die ein negatives Beispiel abdeckt Dann gibt es keine generellere Hypothese die konsistent ist mit der gegebenen Beispielmenge Sei nun eine Hypothese die ein positives Beispiel nicht abdeckt Dann sind alle spezielleren Hypothesen als H ebenfalls inkonsistent mit der Beispielmenge und m ssen nicht weiter untersucht werden Das Prinzip der Halb Ordnung eines Suchraumes unter Ausnutzung von Subsumptionsbeziehungen machte sich Mitchell 1997 im Rahmen seines Versionenraum Modells zu nutze Dieser Versionenraum enth lt zu Beginn nur die Menge der generellsten Hypothesen G die kein negatives Beispiel abdecken und die Menge der speziellsten Hypothesen S die alle positiven Beispiele abdecken Im Laufe des Inferenzprozesses verkleinert sich der Versionenraum kontinuierlich bis die Mengen S und G in einem Element der gesuchten Hypothese zusammenfallen Generellste Hypothese Menge der generellen Hypothesen gesuchte Hypothese Menge der speziellen Hypothesen Speziellste Hypothese Abbildung 13 Versionenraum Modell Beim sogenannten Pruning wird im Fall der Inkonsistenz einer Hypothese mit der Beispielmenge nach dem Grund f r diese Inkonsistenz dem sogenannten forbidden 5 Maschinelle Lernverfahren 43 feature gesucht Bei der nachfolgenden Suche werden Hypothesen mit dieser Eigenschaft ausgeschlossen Die Hill climbing Methode ausf hrlichere Beschreibung der Metho
251. zu agieren Nach der Wahrnehmung werden die eingehenden Informationen mit den schon vorhandenen in der Wissensbasis verschmolzen um ein einheitliches Bild der Umwelt zu erlangen Nun werden die so erhaltenen Informationen weiterverarbeitet um sie zu interpretieren und damit Schl sse f r das weitere Vorgehen des Agenten zu erhalten Dies wird benutzt um die weiteren Aktionen des Agenten planen zu k nnen Entscheidet sich der Agent aufgrund der vorhandenen Informationen zu einer Aktion mit seiner Umwelt so wird diese im n chsten Schritt durchgef hrt Eine Aktion k nnte z B die Pr sentation eines Ergebnisses f r den Benutzer sein oder die weitere Interaktion mit einem anderen Agenten 5 Maschinelle Lernverfahren 5 1 Einf hrung Das Lernen von nat rlicher Sprache ist seit Jahrzehnten ein intensiv untersuchtes Forschungsgebiet an dem sich diverse Disziplinen beteiligt haben Neben der Psychologie Erforschung kindlicher Sprachentwicklung der Linguistik Vergleich unterschiedlicher Sprachen zur Ermittlung universeller Eigenschaften der theoretischen Informatik formale Betrachtung von Sprachen unter dem Gesichtspunkt ihrer Ausdruckskraft und Komplexit t und der k nstlichen Intelligenz Anwendungen nat rlicher Sprachverarbeitung bei der Kommunikation intelligenter Systeme z B in der Robotik gab es vor allem in den letzten zwei Jahrzehnten wichtige Ergebnisse aus dem Bereich des Maschinellen Lernens Der Schwerpunkt der Forschung i
252. zweites Mal besucht so wird automatisch der Rahmen f r den n chsten noch nicht besuchten MetaZustand generiert Der n chste MetaZustand wird durch einen DFS Durchlauf ermittelt der bei dem erneut besuchten MetaZustand beginnt Sollte sich in dem durch den DFS ergebenden Spannbaum kein noch nicht besuchter MetaZustand befinden so erfolgt die weitere Suche ab dem StartZustand des gesamten DFA Sollte auch hier kein unbesuchter 9 Das TokenComponent Interface 94 MetaZustand gefunden werden so ist der Befundungsvorgang hiermit abgeschlossen da alle MetaZust nde und folglich auch alle Abschnitte einmal besucht worden sind Ist diese Option selektiert so kann ein MetaAbschnitt dessen MetaZustand sich in einem Zyklus befindet beliebig oft durchlaufen werden 9 6 4 Mehrfache Anzeige von MetaTiteln Ist die vorige Option selektiert d h ein MetaZustand in einem Zyklus kann mehrfach besucht werden so wird bei jedem Besuch des MetaZustandes im TCI der Titel des MetaZustandes in den Befund bernommen um den Beginn eines neuen MetaAbschnittes zu signalisieren Dies kann von dem Benutzer nicht erw nscht sein und mittels dieser Option verhindert werden Ist sie selektiert so wird der Titel des MetaZustandes nur einmal in den Befund aufgenommen und auch bei erneutem Besuch nicht mehr hinzugef gt 9 6 5 Sortierung der Tokens nach Frequenz Das TCI pr sentiert dem Benutzer die einzelnen TokenComponents in der Reihenfolge die f r den we
Download Pdf Manuals
Related Search
Related Contents
BDB-833NS Documentation pour les enseignants Autour de l Just Name Your Need 2706-808, DL40 Programming Software User Manual CMA5000a Scarica manuale MC2000 - Media Discopiu Rimini User`s Manual Kodak C300 User Guide Manual pdf Curtis DVD 1084 User's Manual Copyright © All rights reserved.
Failed to retrieve file