Home
UNSCHARFE SUCHE IN DATENBANKEN –
Contents
1. Queries ohne lokale und globale Gewichtung Extrahiert man alle scharfen Bedingungen einer Fuzzy Query und verkn pft diese Kriterien wieder so wie in der Ausgangsquery so erh lt man bei der Evaluierung der Abfrage eine Tabelle die alle relevanten Datens tze enth lt Das Nichterf lltsein einzelner Kriterien ist n mlich auch f r Fuzzy Queries ein Ausschlusskriterium innerhalb einer Alternative wenn f r die Interpretation des Und gilt V be Wi 0F u UND wo 0 Vorraussetzung 2 Diese Bedingung erfiillen insbesondere die Multiplikation und die Minimumbildung nicht aber das geometrische Mittel das besonders bei Theoretikern als nicht zu rigide Form des Und beliebt ist Innerhalb einer Alternative die neben diesem scharfen Kriterium noch unscharfe Kriterien enth lt wird die Zugeh rigkeit des Datensatzes zu dieser Altenative durch die unscharfen Attribute beschrieben wenn analog zu Vorraussetzung 2 f r die Interpretation des Und s gefordert wird V bo W 1F u UND w Vorraussetzung 3 Diese Vorraussetzung erf llen wie bei Vorraussetzung 2 die Multiplikation und die Minimumbildung Als Vorteil f r die Implementation ergibt sich daraus dass die Bewertung der SQL Query dieses Kriteriums mit dem Zugeh rigkeitswert Eins nicht mit in den AFR bertragen werden muss Der AFR muss so nur die unscharfen Kriterien berechnen Man muss nun bedenken wie die boolesche Information der Datenbank mit dem SFR wechselwirkt Die Tabel
2. Dennoch zeigen beide nur die Dualit t eines Weltbilds Einerseits kann man versuchen die Welt in ihrer Komplexit t pr zise abzubilden Unsere wachsenden technischen M glichkeiten sind hierzu zunehmend in der Lage Dies macht die Modelle zwar pr ziser nicht aber unbedingt handhabbarer F r eine sinnvolle Bearbeitung der Daten etwa mit dem menschlichen Geist ber die Schnittstelle des Perzeptionsverm gens ist es aber andererseits notwendig diese Information ggf in iterativen Prozessen zu komprimieren um das zuvor gewonnene Mehr an Pr zision zu einem Mehr an Information zu machen Diese Abl ufe m ssen zum Teil von Experten bewerkstelligt werden Es gibt aber zunehmend Bestrebungen das Wissen der Experten in Computerprogramme abzubilden um ihr Wissen effektiver zu nutzen und die Verf gbarkeit zu erh hen Am Arbeitsbereich Softwaresysteme der TU Hamburg Harburg wird ein Personal Information Assistent PIA entwickelt der das Ziel verfolgt interaktive Kommunikation zwischen Anwendern und Produktkatalogen zu erm glichen PIA soll intuitiven Zugriff auf unterschiedlichste Informationsquellen bieten und im interaktiven Prozess vom Verhalten der Anwender lernen Die Aufgabe des intuitiven Zugriffs erfordert neben einem angemessenen Frontend Datenbankabfragen die nat rlichsprachliche Queries beantworten Der Ansatz dieser Arbeit ist es hierzu die Methoden der Fuzzy Logic f r Datenbanken und andere Informationssysteme zu adaptieren Mit d
3. Kapitel 6 Ergebnis OLEProces Fra ProcesQuery PO InitVars PO Proces PO ProcessCriteria S IFA MD i MD IMD Process MS Access TransformSQL MS DB engine Process Interest 1 run Win FfA_Threshold 2 Declare_V affargname 3 run 4 IntVar s 5 looptAlternatives 6 cutOutAttrernatives 7 loop Critnas 8 cutOutC iterial 9 fetchParameten 10 fetchParameter 11 Concat pute 12 Quantyfierx 13 globalQuant 14 Ordenglo balOWA 15 AggregateNew sqls Q 16 SetOrderOptiond 1 Tr peoe SOL 18 ead 19 rung Sg 20 declare var 21 com pute atomeg 23 ProcessSQLisq 22 init ward 24 and Aggregation quant type 25 orAggregation 26 closeD Bs T 27 ent Abbildung 6 5 process_query Sequnence Diagramm Query Die Hauptprozedur hei t FfA_ProcessQuery sql_str As String FfA_ Threshold As Double st_FAG As String Der bergebene Parameter sql_str ist ein String der den Namen der Datei angibt in der der auszuf hrende String in FfA SQL Syntax steht Auf diese Weise l sst sich das Modul sowohl aus der Datenbank Umgebung heraus leicht testen als auch vom CGI File per OLE steuern Test werden mittels des Go Buttons des Formulars FfA Toolbarl durchgef hrt Im Falle des direkten Aufrufs aus Access heraus Debug Level 1 wird der SQL String ausgef hrt der 75
4. 25 run FIA_ProcessQuery 26 FIA_ProcessQuety IN Ole_success 28 Ole_success 29 saveAsHtmI W1 out 30 open 31 write 32 close 33 Ole_success 4 exit k 35 onClose true 36 action_executed 37 KT 38 Helete 39 delete g 4b delete Abbildung 6 2 start_query sequence diagramm 69 Der Ablauf sei kurz beschrieben Das auszuwertende Interesse wird zu Demonstrationszwecken mit einem Formular in Form eines Html Dokuments nachgebildet siehe Abbildung 6 3 Html Query Sp ter wird es durch das PIA Frontend abgel st Es l sst sich in seiner gegenw rtigen Form nur von Microsofts Internet Explorer ffnen Dies r hrt daher das es komplett auf Javascript basiert welches in unterschiedlichen Browsern unterschiedlich implementiert ist Es enth lt keine einzige Zeile rudiment ren Html Codes da der gesamte Inhalt des Dokuments per Write Befehlen geschrieben wird Der Vorteil der sich daraus ergibt ist dass es sich besonders dynamisch den User Preferenzen anpassen kann bzgl gew nschter Komplexit t und Interpretation der Abfrage Die Eintr ge der Felder werden mit action cgi win c2a EXE method post an den Web Server gesandt der die Applikation in seinen CGI Pfaden sucht In diesem Fall findet er sie im win cgi Verzeichnis Im Falle des
5. Ich m chte etwas billiges erg be sich eine Wildcard d h alle Datens tze m ssen betrachtet werden Kriterien auf hierarchischen und Volltext Dom nen Der eben beschriebene Fall einer Wildcard wird allerdings nur selten auftreten da zu den Kriterien auf numerischen Dom nen in der Regel noch die Kriterien der Volltext und der hierarchischen Dom nen kommen Weil der Fuzzy Zugriff auf die Werte dieser Dom nen noch 13 Hierf r sei zun chst der Fall gesetzter lokaler Importance au er acht gelassen 50 Kapitel 5 Losungsentwurf nicht realisiert ist wird es sich bei diesen Zugriffen zun chst immer um scharfe Kriterien handeln So etwa bei Ich m chte ein Auto das rot ist Der von der Datenbank durch die SQL Query gefundene Zugeh rigkeitswert wird hierbei wie auch bei den scharfen numerischen Bedingungen immer den Wert Eins oder Null haben Extraktionsfilter Diese Vor berlegungen in Betracht soll nun der Extraktionsfilter entworfen werden Ohne die theoretischen berlegungen unn tig auf die Spitze treiben zu wollen scheint es sinnvoll vier F lle zu betrachten Queries ohne lokale und globale Gewichtung Queries ohne lokale aber mit globaler Gewichtung Queries mit globaler Gewichtung und lokaler Gewichtung auf numerischen Dom nen Queries mit globaler Gewichtung und lokaler Gewichtung auf nichtnumerischen Dom nen Von globalen und lokalen Quantifiern soll hier der Einfachheit halber abgesehen werden
6. String e Ben float name egated boolean Property 0 0 1 1 germinValue float 11 0 ER sten Item float maxValue float u avgValue float 0 numberOfttems int D wi La u RER of Di Predicate etc rity int E Domain ame String name String description URL newValue s String Value score i Item a Attribute args Valuel float 7 PP D i Li 3 is defined on J Lous Value has as arguments An der Spitze des Diagramms findet sich ein allgemeiner Actor der ein Anwender Customer d h jemand der Anfragen an das System stellen m chte sein kann oder aber jemand der Daten ablegen oder verwalten m chte Maintainer oder Provider berwacher oder Datenanbieter Der Maintainer Redakteur ist jemand der das System im Bertrieb kontrolliert also Attribute und Dom nen pflegt Der Provider dagegen stellt Beschreibungen ein Den Verwaltern des PIA l sst sich etwa die rechte den Anwendern die linke Teil des Diagramms zuordnen In der Mitte findet sich ein Rahmen der als Mutual Understanding gegenseitiges Verstehen bezeichnet wird Er beschreibt die abstrakte Ebene eines Entscheidungsprozesses und interagiert mit dem Rest des Modells ber die Klassen Interest Interesse und Item Produkt Abgelegte Datens tze werden in diesem System als Items bezeichnet Jedes Produkt weist bestimmte Einzelheiten auf die durch Eigenschaften beschrieben werden die Werte values habe
7. der Klasse Predicate beschrieben durch Score i item a Attribute Value float So ist beispielsweise das Pr dikat teuer auf der Dom ne Geldwert definiert und hat als un re Funktion keine Argumente aus dieser Dom ne Ein Kriterium benutzt dieses Pr dikat z B f r die Bedingung Kaufpreis teuer teuer score Beispielauto X Kaufpreis Bei der Ermittlung des score werden die Methoden minValue maxValue avgValue und numberOfltems herangezogen Hierbei muss sichergestellt werden dass diese Methoden ihr Ergebnis in Abh ngigkeit von bestimmten Eigenschaften des zu bewertenden Items ermitteln Wenigstens die Eigenschaft dass es sich um eine Preisbewertung bzgl der Kategorie Auto handelt muss beachtet werden Um auch noch zu ber cksichtigen dass es sich vielleicht um einen neueren Jaguar handelt und dieser bei einem angenommenen Preis von 5 000 relativ g nstig ist muss konzeptionelle Arbeit in den Begriff relativ gesteckt werden Score i item a Attribute Value float Stellt die bergabe der Attribute des Items sicher minValue maxValue avgValue und numberOfltems m ssen als Parameter diese Attribute mit bergeben bekommen beispielsweise Kaufpreis min Value Marke Jaguar Baujahr 1998 16 Zur Anschaulichkeit ist die Abbildung 2 2 D as PIA D omanenmodell hier och einmal angef hrt als Abbildung 5 9 67 Kapitel 6 Ergebnis F r die prototypische Realisierung der Fuzz
8. cke Diesem Mangel will der Personal Information Assistant im folgenden auch als das PIA oder PIA System bezeichnet begegnen indem er personalisierte Suchabfragen an den Computer erlaubt Er wird am Arbeitsbereich Softwaresysteme STS der TU Harburg entwickelt Dabei verfolgt man das Ziel nicht nur auf der Clientseite mit dem Anwender in einen lang andauernden interaktiven Lernprozess zu treten sondern auch auf der Anbieterseite von dem Verhalten des Anwenders zu lernen Dieser Prozess wird als gegenseitiges Verst ndnis Mutual Understanding bezeichnet und wird von einem sogenannten Relevance Feedback gesteuert einer R ckwirkung des vom Anwender bewerteten Angebots welches ihm vom Anbieter unterbreitet wurde Neben weiteren Anforderungen des Systems Benutzerfreundlichkeit benutzerspezifische Schnittstellen personalisierte Suchabfragen Medienunabh ngigkeit u MaSt99 ist f r die vorliegende Arbeit besonders wichtig quasi nat rlichsprachliche unscharfe Anfragen zuzulassen Dabei wird zun chst mehr Augenmerk auf eine reiche Funktionalit t der Sprache gelegt als auf eine mathematisch exakte und wohl definierte Theorie Um dies zu erf llen wurde zun chst ein Frontend zur Anwenderkommunikation entwickelt Ca01 Parallel dazu wurde ein offenes Objektmodell erstellt Es hat u a die Aufgabe eine Br cke zwischen verschiedenen Arten von Informationssystemen schlagen Insbesondere die Verschiedenartigkeit von struk
9. und Verkniipfung der A die unscharfe Menge mit Luna X min Jus ee Un X oder Verkn pfung der A die unscharfe Menge mit Moder X max UI X Un X Tats chlich haben sich diese Definitionen in der Fuzzy Logic durchgesetzt da sie in ihrer Einfachheit an Performanz nicht zu berbieten sind und sie sich f r die meisten praktischen Anwendungen als qualitativ ausreichend herausgestellt haben Dennoch resultiert ihr Ergebnis aus der Erf lltheit einer einzigen Bedingung Min oder Max Anschaulich lassen sich daher aus dem Stand heraus eine Reihe sinnvollerer Algorithmen finden wie beispielsweise der arithmetische und der geometrische Mittelwert Uuna X HI X Un X Im Loder X 1 n u1 x Un X F r eine h chstm gliche Pr zision der Ergebnisse wurde gar ein sogenannter Gamma Operator entwickelt der mittels einer numerischen Konstanten beliebige Einstellungen in einem kontinuierlichen bergang zwischen Min und Max erm glicht Definition 3 5 Gamma Operator Seien A e P X Die y Verkn pfung der Aj x u X xe X f hrt zu einer unscharfen Menge A mit der Zugeh rigkeitsfunktion WR IE ER gt C1 TE A MO und y 0 1 als Kompensationsgrad Mit diesem auch als Kompensatorisches Und bezeichneten Operator lassen sich alle oben angefiihrten Verkniifungsoperatoren beschreiben 3 2 7 Linguistic Quantifier und Importance In diesem Abschnitt sollen verschiedene M glichkeiten
10. Access Umgebung zug nglich zu machen Der Webserver Sambar bekommt die Query in Form von Post Parametern Diese werden gem der WIN CGI Spezifikation in einer tempor ren Ini Dateien abgelegt Daraufhin wird c2a exe mit drei Kommandozeilen Parametern aufgerufen die Verweise auf tempor re Dateien sind Dies sind die erw hnte Ini Datei eine Datei mit den Parametern im Get Format und eine Datei die zur Ergebnisausgabe vorgesehen ist Diese wird vom Webserver beobachtet Tritt ein Schlie en Ereignis auf ihr auf so wird sie als Ergebnis an den fragenden Client gesandt Um mit den beschriebenen Konzepten auf eine Formularanfrage mit einer html Seite zu reagieren m ssen verschiedene Funktionen implementiert werden e bernahme der Kommandozeilen Parameter Auslesen der Ini Datei bersetzung der Formularparameter in das FfA eigene SQL FQUERY Ergebnistabelle gem Query errechnen Ergebnistabelle als html Datei formatieren Ergebnis unter dem spezifischen Dateinamen speichern Das Access eigene Visual Basic erweist sich f r diese Aufgabe als ungeeignet Es kann beispielsweise keine Kommandozeilen Parameter bernehmen und enth lt auch keine Methoden die der Syntax von Windows Ini Dateien Rechnung tragen Zur Steuerung der Abfrage wurde daher Delphi gew hlt Das FfA Access Modul wird als OLE Prozess angesprochen 11 Die QBE wird intern als SQL String behandelt und l t sich auch vom User als solcher betrachten und editieren 39 Das Programm
11. Access konforme Schreibweise s u berf hrt und von der Access DBE evaluiert Das Ergebnis wird wie blich in einer tempor ren Tabelle dargestellt die neben den in der select clause spezifizierten Attributen zus tzlich ein Attribut MD Matching Degree enth lt in der das Bewertungsergebnis dargestellt ist Vor der Pr sentation der Ergebnistabelle wird der alte SQL String noch wiederhergestellt Access konforme Schreibweise bedeutet dass VBA Funtionsaufrufe wie der der Funktion FfA_MD p As Integer as double erlaubt sind wohingegen sich die von FfA erweiterte SQL Syntax mehr an dem deklarativen Charakter von SQL orientiert So wird aus SELECT HOUSES PRICE FROM HOUSES WHERE HOUSES PRICE FfA_FR Not much greater thanl250000 nach der Transformation SELECT HOUSES PRICE FfA_MD PutValue 0 HOUSES PRICE False 0 As MD FROM HOUSES WHERE FfA_MD PutValue 0 HOUSES PRICE False 0 gt 0 As MD bewirkt die Erzeugung einer neuen Spalte mit dem Attributnamen MD und ist Teil g ltiger SQL Syntax PutValue und FfA_MD sind dagegen Funktionsaufrufe von VBA Funktionen FfA_MD berechnet die Matching Degrees nachdem die Werte des jeweils aktuellen Datensatzes mittels PutValue in die Variablen der Funktion bergeben wurden Ein Abriss der implementierten Funktionen ist in Absatz 0 Der Name der Schnittstelle steht f r CGI to Access Grundidee dieser Delphi Applikation ist es die FfA Software in ihrer MS
12. Fall l sst sich die Erf lltheit eines Alternative also noch aus der Datenbank Query berechnen wenn man auf den numerischen Dom nen auch scharfe Kriterium im AFR realisiert Queries mit globaler Gewichtung und lokaler Gewichtung auf nichtnumerischen Dom nen In diesem Fall m ssen die Zugeh rigkeitswerte eines jeden nichtnumerischen Kriteriums explizit vom Standard DBMS ermittelt werden Hierzu werden zun chst alle Kriterien mit einer Gewichtung von Null aus der Query eliminiert Dann werden die einzelnen Kriterien Oder verkn pft Dadurch wird einzig der entartete Fall ausgeschlossen dass alle Gewichte gleich Null sind der bereits in Vorraussetzung la ausgeschlossen wurde In der Nachevaluation muss jetzt wenigstens f r alle nichtnumerischen Kriterien die Zugeh rigkeit ermittelt und im Regler gewichtet werden Gegebenenfalls k nnte man diesen rechnerischen Aufwand unterdr cken indem man f r die Kriterien dieser Dom nen keine Gewichtung zul sst 5 1 2 2 Bewertung AFR Nach der Ermittlung aller relevanten Datens tze in der Vorbereitungsphase werden die Daten zur Bewertung an einen Regler als Eingangssignal angelegt Der Regler wird in Anlehnung an Abbildung 3 6 Max Min Inferenz Methode graphisch entworfen In Abbildung 5 3 werden durch unterschiedliche Bearbeitungsrichtungen unterschiedliche Funktionen realisiert 52 Kapitel 5 Losungsentwurf jeu ssbue sny ss 1 u onesu g gt Oder Kombi
13. Logic In den folgenden Jahren entstand eine gro e Anzahl sowohl von theoretischen als auch von anwendungsbezogenen Arbeiten insbesondere in den Bereichen Steuerung und Regelung Prozess berwachung und diagnose Mustererkennung Medizin und Psychologie Wirtschaftswissenschaften Mathematik Motor f r die rasche industrielle Entwicklung war weniger die Notwendigkeit f r bis dahin unl sbare Aufgaben eine L sungsmethode zu finden sondern vielmehr schnellere L sungsverfahren zu entwickeln als sie von den klassischen Methoden zur Verf gung gestellt werden Im Falle unscharfer Datenbankabfragen hingegen m ssen wir die Fuzzy Logic als Methodik f r ein sonst nicht beherrschbares Problem einf hren Die Abbildung scheinbar genau quantifizierbarer Werte auf sprachliche Ungenauigkeiten 3 1 2 Linguistische Variable Das menschliche Denken ist eng mit der menschlichen Sprache verbunden Anfang des Jahrhunderts vertrat der Philosoph Arthur Wittgenstein die noch heute bei KI Forschern beliebte These Wor ber man nicht sprechen kann dar ber muss man schweigen W160 und stellt in den weiteren berlegungen zu diesem Satz heraus wie eng der Zusammenhang ist zwischen der menschlichen Ausdrucksf higkeit und der M glichkeit Sachverhalte gedanklich 8 Kapitel 3 Stand der Technik Fuzzy D atenbanken zu erfassen und zu verarbeiten hnliche Ans tze wurden sp ter in der Kybernetik weiterentwickelt u
14. Pflege der Fuzzy Zugeh rigkeitsfunktionen und ggf auch der Steuerungsparameter der Neuronalen Netze 5 3 Erweiterung des PIA Objektmodells Um die vorgesehenen Fuzzy Funktionalit ten zu erm glichen muss das bestehende PIA Objekt Modell noch um einige Klassen erweitert werden W nare Sting utOffScore float cutOffSize irk op OrLikeAgaregationOperater IE e Alternative op AndLikeAggregatorO pert CNES i weight float negated boolear T Abbildung 5 6 Objekt Condition 65 Zun chst werden die drei Klassen Interest Alternative und Criterion unter einer Oberklasse Condition zusammengefasst Von dieser erben sie die Methode score Der Grund f r dieses Vorgehen ist zum einen die Vereinheitlichung der Methode score und zum anderen ist es f r die noch einzuf hrenden Klasse Fuzzy Application unbedeutend welche Form die Bedingung hat die sie bearbeiten soll Auf der anderen Seite des Ausgangs Modells wird Catalog Collection als Generalisation von Catalog eingef hrt um Katalog Verb nde zu erm glichen d h die Suche ber verteilte Angebote Der vorgestellte L sungsentwurf erlaubt mit seiner tempor ren Tabelle relevanter Datens tze das Zusammenfassen solcher Verb nde bevor sie abschlie end bewertet werden Die Klassen Catalog Collection Catalog und Item werden in der neuen Oberklasse Presentation zusammengefa t Ihre gemeinsame Eigenschaft ist es Suchmenge einer Sucha
15. Robotica 1 Ya88 Yager R R On ordered weighted average aggrgation operators in multi media desision making 1988 Man and Cybernetics SMC 18 IEEE Transactions on Systems 82 Anhang Za65 Lotfi A Zadeh Fuzzy Sets Information and Control 1965 Za83 A computational approach to fuzzy quantifier in natural languages 1983 Computers and Mathematics with Applications Ch96 Davis Chapman Building Internet Applikations with Delphi 2 1996 Indianapolis Que 0 7897 0732 2 Zh98 Lan Zhang Objektorientierte Analyse und Entwurf eines Internet Produkt Informationssystems Juli 1998 Universit t Hamburg Germany Studienarbeit Arbeitsbereich Informatik 83 A4 Abbildungsverzeichnis Abbildung 2 1 Das PIA Objektmodell 2 22 acasmeslasiaaiaasate 5 Abbildung 2 2 Das PIA Domanenmsdell 3 2 22 22222 322 s22 2 a deske eas 6 Abbildung 3 1 m glicher syntaktischer Aufbau der linguistischen Variable Geschwindigkeit 9 Abbildung 3 2 Zugeh rigkeitsfunktion um x f r eine scharf begrenzte Menge M und vis f r eine unscharf begrenzte Menge ME aan 10 Abbildung 3 3 normierte Linguistische Werte eege 11 Abbildung 3 4 Auswirkung Linguistischer Modifikatoren auf die Linguistische Variable wahr ae Me Eed enee 12 Abbildung 3 5 Syntaktischer Aufbau der Linguistischen Variablen Geschwindigkeit 13 Abbildung 3 6 Max Min Inferenz Methode AAA 16 Abbildung 3 7 Zugeh rigkeitsfunktion u x Funktio
16. Shareware Webservers Sambar V4 1 wird daraufhin das Windows CGI 1 3a Interface genutzt welches verschiedene Workarounds f r fehlende Features von Windows Webservern im Vergleich zu Unix Servern bietet Speziell das fehlende stdin und stdout werden durch tempor re Dateien ersetzt Beim Aufruf eines CGI Files werden drei Dateien erzeugt i steht f r einen fortlaufenden Integer der berschneidungen verschiedener Prozesse verhindert Wi txt enth lt die Formulardaten als w ren sie per Methode get gesandt worden als einen String Wi ini enth lt die gesamten Umgebungsvariablen inklusive der Formularfelder mit Values in Form der Windows typischen Ini Files Wi out ist eine Datei die f r die Ausgabe gedacht ist Wenn sie geschlossen wird bernimmt der Web Server sie und sendet sie zum anfragenden Client Diesen Effekt macht sich die CGI Applikation c2a EXE zunutze siehe 6 2 Die Schnittstelle C2a exe Es wurde in der Entwicklungsumgebung Delphi 2 0 in Object Pascal geschrieben und hat die Aufgabe zwischen der WIN CGI 3 1 Schnittstelle siehe www sambar com und der FfA Applikation in Access zu vermitteln Es bersetzt die in Wi ini enthaltenen Formulardaten in g ltige FfA SQL Syntax und steuert die Prozeduren des Moduls Query und die Speicherfunktionen von Access mittels OLE 2 0 Zun chst startet es einen OLE Server Prozess auf Access Dieser wird im zweiten Schritt dazu angehalten eine Replikation der Datenbank zu ffnen in der sich
17. UML Diagramme beschrieben Zun chst sieht man in einem bergeordneten Klassendiagramm Abbildung 6 1 main class diagramm die Zusammenh nge der verschiedenen Klassen im Gesamtprozess Man erkennt hier zun chst als wesentliche Funktionalit t den Weg des Calls eines Html Dokuments an ffa_ole db FfA_ProcessQuery Aus Gr nden der Vereinfachung wurde die Rolle des Internet Clients hier vernachl ssigt Die ausgel sten Prozesse werden in Abbildung 6 2 start_query sequence diagramm veranschaulicht wobei der die Berechnung durchf hrende Prozess die Nummer 26 FfA_ProcessQuery ist der ungef hr in der Mitte des Diagramms steht query form win cgi 1 3a c2a exe MS Access a ffa ole ffa ci file system Wiin data file Wiini Wi out html document cgi interface cgi2access ole db data file data file 1 post interest_data u 2 newFile W1 in 3 create 4 newFile W1 out 5 create 6 newFile W tlini 7 crdate 8 monitorFile W 1 ol t g respond onClose 10 unt Anitialize var s 12 open 3 read 14 crpateSQLString 15 close T6 open T7 write 18 Closer J EE 19 CreateOleObject 20 Ole_success 21 OpenCurrentDatabase a_ffa_ gnCurrentDatabase 23 Ole_success 24 Ole_success
18. Umsetzung dieser Anforderung werden zun chst die Definitionen fiir Und und Oder ben tigt Sie werden mit Hilfe des Durchschnitts und der Vereinigung definiert und dann zu allgemeineren Formen hin berf hrt bis zum frei skalierbaren y Operator Im Laufe dieser Uberlegungen wird deutlich werden dass ein Und oder ein Oder fiir unscharfe Gr en eine deutlich komplexere Bedeutung hat als f r scharfe Werte Dies wird im anschlie enden Abschnitt noch versch rft wenn mit Einf hrung von Gewichtung Importance Mengenoperatoren wie Und vielleicht eingef hrt werden Diese Diskussion wird von eigenen berlegungen ber den Vergleich zwischen Und vielleicht und Oder vielleicht ber sogenannte Fuzzy Quantifier Die meisten der wichtigen Bedingungen m ssen erf llt sein bis zu den neuesten Forschungsergebnissen von R Fagin f hren Die Verkn pfung von Importance bewerteten Fuzzy Mengen geschieht getrennt f r Und und Oder F r den schwierigeren Fall des Und s wird hierf r die Betrachtung eines eigentlich nicht geforderten Fuzzy Attributs angef hrt die des Fuzzy Quantifiers Die Erkl rung seiner urspr nglichen Bedeutung in der Interpretation nach Zadeh ist dabei eher als Einf hrung zu verstehen Die neuere Deutung gem Ordered Weighted Average OWA dagegen liefert gleicherma en das Instrumentarium f r einen allgemeinen Verkn pfungsoperator y wie f r Und verkn pfte gewichtete Bedingungen Au erdem triff
19. X liegt zwischen a und b oder zwischen c und d Zur L sung dieses Problems lassen sich zwei Ans tze finden Zum einen k nnte ein eigenes mathematisches Konzept entwickelt werden wie im Kapitel 5 L sungsentwurf angef hrt zum anderen lie e sich die tern re Funktion mit Verkn pfungsoperatoren in zwei bin re Funktionen zerlegen siehe hierzu auch Particularization and Conditional Possibility Distributions in KaZe84 S 91 T ist gr er als TB und T ist kleiner als TC Auch dieser Ansatz erfordert im Sinne eine theoretischen Fundierung eine weiterf hrende Diskussion n mlich ber die Funktion des Und Diese Funktionen lassen sich dennoch mit gewissem Aufwand als Ausschluss Kriterien nutzen wenn sie geschickt umformuliert werden x gt a and x lt b bzw x gt a and x lt d 5 2 Interface Anschlie end werden die Schnittstellen des Systems entworfen n mlich einerseits die Query Schnittstelle mit der aus PIA heraus auf die FDBMS zugegriffen werden kann und andererseits die Administrationsschnittstelle mit der die FDBMS verwaltet werden kann 5 2 1 Query Schnittstelle In dem vorliegenden Entwurf ruft die Schnittstelle des PIA Frontends eingangsseitig zwecks Evaluierung einer Query ein Objekt der Klasse Fuzzy Application auf und bergibt diesem die Query Diese Query setzt sich gem erweitertem Objektmodell siehe 5 3 Erweiterung des PIA Objektmodells aus einer Condition und einer Presentati
20. besteht aus Initialisierung Query und Umgebungsvariablen in interne Variablen einlesen erzeugen eines entsprechenden FQUERY Strings und Steuerung der Access Datenbank tiber OLE Ergebnis berechnen und als Html Datei abspeichern Dabei werden typische Fehlerfalle abgefangen und gegebenenfalls in der Ergebnisdatei als Fehler benannt Im Falle einer Fagin Interpretation von Gewichtung wird die notwendige Sortierung und Normierung vorgenommen Die Anwendung wird l sst sich ber eine Datei d2a ini steuern die im gleichen Verzeichnis wie die Applikation selbst liegt Die Datei enth lt folgende Parameter config database dbms ffa_ole mdb default_in tmp debug default_ffa ini default_query tmp debug default_ffa txt default_out tmp debug default_ffa out Access_OLE Access Application 8 Die Pfadangaben sind relativ zur Wurzelverzeichnis des Webservers database ist die Datenbank die durchsucht werden soll Die anderen drei Dateien dienen Debugzwecken Zu Entwicklungszwecken arbeitet das Programm auch ohne Kommandozeilenparameter In diesem Fall werden die drei genannten Dateien verwendet Der Wert von Access_OLE findet sich in der Windows Registry unter HKEY_CLASSES_ROOT Access Application CurVer Es handelt sich um den internen OLE Namen der Access Version Er muss gegebenenfalls maschinenabh ngig angepasst werden Ffa Ole als Realisation der FDBMS beschrieben 4 2 5 Installation und Portierung Die beiden Ver
21. count die als ZCount A notiert wird Hier die Definition f r eine diskrete Fuzzy Menge A Hait t HA Xn YCount A ua Mit Q Imp y s sind F Er schlie t damit auf U Q mp y s sind F Uo amp Count Imp und F Count F Im Falle des Oder Operators in unserer Notation also auf Ebene der Verkn pfung gewichteter Alternativen f hrt diese Definition zur Bewertung eines arithmetischen Mittelwerts ber den mit der Gewichtung weight multiplikativ gewichteten MDs der Alternativen Der so gewonnene Wert wird wie im obigen Beispiel mit der Zugeh rigkeitsfunktion des gew hlten Quantifiers bewertet Umost Interest Umost 2Imp W alternative XImp 23 Eine detailliertere Diskussion findet sich in Ya83 und Kacprzyk und Yager KaYa84a KaYa84b Quantifier nach OWA Zadeh s Ansatz wurde 1988 von Yager Ya88 verallgemeinert zum OWA Operator Ordered weighted Average oder geordneter gewichteter Durchschnitt Damit ist es m glich sowohl Zadeh s Definition nachzubilden als auch erweiterte Formen der Interpretation durchzufiihren Als Spezialf lle dieser Erweiterungen treten die Verkniipfungsoperatoren Und und Oder auf sowie deren kontinuierlicher bergang wie wir ihn beim Y Operator kennen gelernt haben Quantifier nach Fagin Ronald Fagin und E Wimmers stellten diesen Ans tzen zur Behandlung von Gewichtung j ngst einen neuen Algorithmus entgegen der in FaWi97 beschrieben wird Die entwickelte Formel wird al
22. der Klasse Fuzzy Application gem dem erweiterten 46 Kapitel 5 Losungsentwurf Objektmodell Abbildung 5 8 Sie ruft die verschiedenen Module auf iibergibt die Parameter und sorgt fiir die zeitliche Synchronisation Adaptiver Fuzzy Regler AFR Database Management System DBMS wor ee gt Match en al Interest Ste persian Abbildung 5 2 Daten und Steuerungssignale 5 1 1 6 Feedback Durch Riickgabe eines Fehlersignals d h durch Angabe einer Differenz zwischen Soll und Ist Wert am Ausgang lassen sich Neuronale Netze wie sie fiir die Regleraktivierungseinheit und das Personaliserungsmodul vorgeschlagen werden leicht trainieren Dieser Vorgang wird als Backpropagation bezeichnet da es sich um eine R ckw rtsprojektion des Fehlersignals durch das Netz handelt Dieses Vorgehen wird im PIA Objektmodell als Ver nderliches Verst ndnis Mutual Understanding bezeichnet Als Begriff f r die Fehler R ckwirkung wird dort Relevance Feedback verwendet 5 1 1 7 Abgleich des Entwurfs mit menschlichen Entscheidungs und Bewertungsverfahren Es hat sich als treffliche Testmethode f r KI Anwendungen erwiesen zu berpr fen inwiefern sie mit den Funktionsweisen des menschlichen Gehirns bereinstimmen Dies kann nat rlich nur ein heuristischer Wert und kein eigentliches Qualit tsma sein Dennoch sei eine solche berlegung an dieser Stelle angef hrt Die Frage nach allgemein Interessante
23. der Query ausgew hlten Attribut zugeordnet indem man den symbolisierte Bleistift dr ckt Da es sich bei der Fuzzy Relation um eine bin re Funktion handelt muss bevor der Operator geschrieben wird noch der zweite Operand gew hlt werden Er kann entweder ein Attribut der Tabelle sein Zahl der Badezimmer ist viel gr er als Zahl der Garagen oder aber ein absoluter Wert Zahl der Badezimmer ist viel gr er als 3 Die anderen Fuzzy Operatoren funktionieren entsprechend amp Fuzzy relations amp attributes EN Not much greater than Not much less than Rather greater than Rather less than Slightly less than Slightly more than test Absolute value FfA_TabO LIFE QUALITY_O HOUSES BATHROOMS HOUSES BEDROOMS HOUSES CAR SPACE HOUSES CELLAR ROOMS Abbildung 4 5 Administrations Fentster f r Fuzzy Relations Fuzzy Operatoren editieren Um die Operatoren zu editieren z B hinzuf gen einer Fuzzy Values Not High mit entsprechenden Parametern bet tigt man in dem entsprechenden Formular den Schalter der ein Auswahlfeld symbolisiert Er ffnet ein Editier Fenster wie in Abbildung 4 6 gezeigt Hier lassen sich sowohl bestehende Werte veranschaulichen und ver ndern als auch neue erzeugen Diese Option gibt es aus ersichtlichen Gr nden nicht f r die Fuzzy Importance da dies lediglich eine Zahl aus dem Intervall 0 1 ist 42 Kapitel 4 FfA Fuzzy for Access f Fuzzy values list Fuzzy
24. die neue Disziplin Soft Computing in der er neben den eben benannten Themen noch genetische Algorithmen Agenten Theorie und hnliche Disziplinen zusammenfa t damit sie zusammen einen Sinn erg ben Agenten sei abschlie end erw hnt k nnten auch in unserem Fall einen Sinn machen indem sie unvollst ndige Information selbst ndig durch Zusatzinformationen aus anderen Informationsquellen erg nzen Sie k nnten beispielsweise herausfinden dass es sich bei einem Passat um ein Auto der Marke Volkswagen handelt Mit dem vorgestellten Entwurf werden alle Anforderungen der PIA Systems erf llt Einzig die Berechnung tern rer Funktionen bedarf noch einiger Erl uterungen Der Regler verwirklicht gem der bisher in PIA festgelegten Syntax f r numerische Dom nen folgende Konzepte Existenz Fuzzy Value Fuzzy Relation Extended Fuzzy Relation Importance Complement 1 Normalform 63 5 1 2 5 Terndre Funktionen Extended Fuzzy Relation Schlie lich m ssen f r den Ansatz von PIA Abfragen der Form T liegt ungef hr zwischen TB und TC zuzulassen die vorgenannten Konzepte noch auf tern re Funktionen erweitert werden Au erdem ist bei h herwertigen Funktionen arity gt 1 zu bedenken dass sie trotzdem sie scharfe Funktionen sind m glicherweise nicht als SQL Clause implementiert sind und im Fuzzy Regler realisiert werden m ssen Man denke beispielsweise an die Funktion X liegt zwischen a und b oder
25. diesem Sinne m ge man sich geduldig mit der Technik zeigen Ihre Intelligenz steht noch am Anfang der Evolution Ich danke meinen Betreuern Professor Florian Matthes und Ulrike Steffens f r ihre Geduld und Unterst tzung Hamburg im August 2002 Inhaltsverzeichnis Kapitel1 Einleitung und Motivation Kapitel2 PIA 2 1 Das PIA Vokabular 2 2 Das PIA Objektmodell 2 3 Das PIA Dom nenmodell 2 4 Zusammenfassung PIA Kapitel3 Stand der Technik Fuzzy Datenbanken 3 1 Konzepte der Fuzzy Logic 3 1 1 Begriff und Historie 3 1 2 Linguistische Variable 3 1 3 Unscharfe Mengen unscharfe Relationen und Zugeh rigkeitsfunktion 3 1 4 Definition von Unsch rfe mittels Normalisierung 3 1 5 Modifikator 3 1 6 Weitere Schl sselkonzepte am Beispiel eines Reglers 3 1 7 Fuzzifikation 3 1 8 Approximatives Schlie en 3 1 9 Defuzzifikation 3 1 10 Linguistic Quantifier 3 2 Mathematik der Fuzzy Logic 3 2 1 Diskrete vs kontinuierliche Mengen 3 2 2 Konstruktion von Zugeh rigkeitsfunktionen 3 2 3 Zwischenbilanz Fuzzy Logic 3 2 4 a cut 3 2 5 Komplementbildung und weitere Modifikatoren 3 2 6 Verkn pfungsoperatoren 3 2 7 Linguistic Quantifier und Importance 3 3 weitere Ans tze 3 3 1 Erste Grundlagenarbeit FRDB 3 3 2 Fuzzy Prolog databases 3 3 3 Architekturmodelle 3 4 Zusammenfassung Stand der Technik Kapitel4 FA Fuzzy for Access 4 1 Query Design 4 2 Implementierung 4 2 1 Versionen 4 2 2 Access rapid description 4 2
26. ffa97www mde bzw ffa20 mda stellen die eigentlichen Anwendungen dar Die drei w s der ffa97www mde stehen laut readme txt f r Webedition was die Vermutung nahe legt dass die Software noch in weiteren Formen beim Institut vorliegt Eine Internet Funktionalit t war in dieser Version jedenfalls nicht zu erkennen Sollte sich die Performance und die Anpassungsf higkeit in der praktischen Anwendung als ausreichend herausstellen so k nnte man sich hierum weiter bem hen 4 2 2 Access rapid description Die drei Dateiendungen mdb mda und mde haben folgende Bedeutungen mdb bezeichnet allgemeine Microsoft Datenbanken mda bezeichnet spezielle Datenbanken sogenannte Add In s s u und mde bezeichnet Datenbanken mdb oder mda mit kompiliertem Quellcode Der Inhalt von Access Datenbanken ordnet sich grunds tzlich in sechs verschiedenen Funktionsgruppen ein 37 Tabellen Abfragen Formulare Berichte Makros und Module Hierin sind Berichte und Makros fiir unsere Zwecke unbedeutend Module bezeichnet Programmbibliotheken in VBA und Tabellen Abfragen und Formulare sind bekannte Datenbank Begriffe 4 2 3 Add In Unter einem Add In versteht man in Access die funktionale berlagerung einer vorgefertigten zweiten Datenbank ber eine ge ffnete erste Im vorliegenden Fall bedeutet dies dass zun chst eine mit Fuzzy Techniken zu behandelnde Datenbank von dem User ge ffnet
27. in einem Quasi linearen Berechnungsalgorithmus wie er im folgenden beschrieben ist etwa in der Form MD interest ORi UA AND Nok mod LV x Beim spezialisierten AFR w rde der Eingangsvektor nur gem des spezifischen Interesses fuzzifiziert d h die Fuzzifizierung w re ein Vorgang der von dem spezifischen Interesse abh ngt wie zuvor schon die Normalisierung in Bezug auf die Abbildung der Relationen In diesem Fall l sst sich die Abbildung durch geschickte Wahl der standardisierten Linguistischen Variablen vereinfachen So wurden In Abbildung 5 5 die Modifikatoren in den Vorgang der Fuzzifizierung einbezogen Linguistische Variable Bewertung Linguistische Prim rterm hoch Werte mod Prim rt sehr hoch Terme Duchschnittswert mittel Antonym niedrig mod Antonym sehr niedrig Abbildung 5 5 LV Bewertung spezialisierter AFR 14 Die Gr en der Formel werden noch einzeln beschreiben 56 Kapitel 5 Losungsentwurf Beim vollst ndigen AFR w re f r jeden Wert eines anliegenden Datensatzes zun chst ein Sympathie Vektor zu ermitteln etwa gem Abbildung 5 4 Leistung 100PS hohe Leistung 0 8 mittlere Leistung 0 5 niedrige Leistung 0 1 Sei der Eingangsvektor ein n zeiliger Vektor dann ergibt die Fuzzifizierung einen 3 n zeiligen Sympathie Vektor aus dem sich alle ggf auch mit Modifikatoren belegten Kriterien berechnen lassen Daher w re in diesem Ansatz die A
28. muss eine entsprechende Semantik hinterlegt werden die die erzeugten Abfragen beantworten kann Die Beschreibung der Fuzzy Syntax erfolgt im anschlie enden Abschnitt mit einer formalen Erweiterung der SQL Syntax Daran schlie t der Abschnitt Implementierung mit der Beschreibung der semantischen Umsetzung an Abschlie end wird in FfA Toolbar die Schnittstelle zur Verwaltung der Fuzzy Objekte beschrieben 4 1 Query Design Die Standard SQL Syntax f r eine Datenbank Anfrage in der ersten Normalform l sst sich wie folgt beschreiben select lt list of fields gt from lt list of tables gt where cond and cond and and cond OF EE cond and cond and condi 31 mit condj als atomaren Bedingungen im Sprachgebrauch der FfA Entwickler Im PIA Objektmodell Abbildung 2 1 entsprechen diese Bedingungen den Kriterien Sie beschreiben die kleinste d h nicht mehr zusammensetzte Abfrage Bedingung wie Preis gt 100 oder Lagerbestand lt Zahl der Anforderungen Eine Und Komposition atomarer Bedingungen wird als Unterbedingung bezeichnet PIA Alternative Eine Oder Komposition der Unterbedingungen ergibt eine Sequence of Subconditions PIA Interesse Diese Form einer Bedingung wird in der Datenbank Theorie auch als erste Normalform bezeichnet In FQUERY wird dieses Schema nun um Fuzzy Terme erweitert Die verallgemeinerte Form l sst sich wie folgt beschreiben lt query gt select lt list of fields gt f
29. und keine anderen als die angegebenen Quellen und Hilfsmittel benutzt habe Hamburg den 08 08 2002 80 Anhang A2 Inhalt der CD In der Anlage zu dieser Diplomarbeit befindet sich eine CD Sie enth lt die Dateien des Prototyps und das vorliegende Dokument in PDF Form Inhalt DA_EAW0802 pdf PDF Datei dieser Arbeit install txt Installationsanleitung readme txt Datei mit den letzten Anderungen sambar Verzeichnis des Webservers inkl bin Verzeichnis der Server Binaries egi win cgi Verzeichnis ffa Verzeichnis der c2a Applikation L c2a dpr shell_u pas Projekt Quellcode c2a exe c2a Applikation query Verzeichnis des Query Formulars form dpr form_u pas Proj ekt Quellcode form exe Form Applikation config Verzeichnis der Konfigurationsdateien dbms Verzeichnis der Datenbanken f a_ole97 mdb Datenbank mit Tabelle houses den Parametern fiir die Fuzzy Funktionen und dem VBA Code docs Dokumenten Verzeichnis des Servers index html enth lt Redirect auf form exe log Verzeichnis der Log Dateien search Verzeichnis der Such Indizes des Servers ohne Bedeutung T tmp Arbeitsverzeichnis von win CGI L debug Hilfsdateien der c2a Applikation 81 A3 Literaturverzeichnis Bo97 Bosc P Some Appproaches for Processing SQLf nested Queries To appear Journal of Intelligent Systems Bo87 Bocklisch S F Proze analyse mit unscharfen Verfahren 1987 Berlin VEB Verlag Technik Bo95 Bosc P et al Quantified S
30. wird Anwendungs Datenbank Dann wird ber Menu Extras Add Ins das vorher dort installierte Ffa20 Add In zus tzlich aufgerufen Beide Datenbanken interagieren jetzt In der internen Repr sentation werden sie vermutlich zu einer Datenbank vereint Beide Datenbanken sind im brigen auch manipulierbar So lassen sich beispielsweise die Tabellen des Add Ins editieren wenn die in dem Add In implementierten Funktionen dies zulassen Ein direkter Zugriff auf die Tabellen Formulare Abfragen und Module des Add Ins ist dagegen nur m glich wenn man es direkt als Datenbank aufruft Auf diese Weise lassen sich die Funktionen die in Ffa20 mda implementiert wurden f r beliebige Access Datenbanken nutzen Der Anwendungsbereich vergr ert sich auf viele weitere Datenbanksysteme n mlich um die die sich mittels ODBC einbinden lassen 4 2 4 Funktionsprinzip Die Funktionsweise der Software l sst sich am einfachsten untersuchen indem man sich die Trennung von Anwendungs Datenbank und Add In zun chst wegdenkt Dies ist leicht zu simulieren indem man das Add In direkt in Access ffnet und die Anwendungs Datenbank als Tabelle importiert Damit hat man eine Datenbank vorliegen die sowohl die zu bearbeitenden Daten enth lt als auch die Fuzzy Funktionen und das User Interface f r den Zugriff die in dem Add In implementiert sind Zur einfachen Generation von Queries greift FfA auf die Query by Example QBE Funktion von Access zur ck Diese
31. wird sich aber zeigen dass sich die beiden unterschiedlichen Bedeutungen mit dem selben mathematischen Ansatz behandeln lassen Die zwei grundlegenden mathematischen Konzepte zur Behandlung von Fuzzy Quantifiern die Deutung nach Zadeh bzw gem OWA werden im Laufe des nachfolgenden Abschnitts ber die Mathematik der Fuzzy Logic behandelt Das Umdeuten des Vertrauenswertes als Gewichtung von Verkn pfungsoperatoren findet sich im Kapitel L sungsansatz 3 2 Mathematik der Fuzzy Logic Auf dem Gebiet der unscharfen Mengen existieren mehrere unterschiedliche axiomatische Systeme Regeln und Gesetze gestalten sich je nach aktueller Auswahl der verwendeten Verkn pfungen unterschiedlich wobei die Widerspruchsfreiheit oft unerf llt bleibt Die Gesamtheit der bekannten Axiomatiken kann als Theorie der unscharfen Mengen bezeichnet werden Die Definition unscharfer Mengen geht auf Lotfi A Zadeh Za65 zur ck und gestaltet sich bis auf die Schreibweise einheitlich Im folgenden wird ausschlie lich die bliche Mengendarstellung gew hlt wobei die Elemente als Wertepaare Linguistische Variable Zugeh rigkeitswert in runden Klammern geschrieben und mit einem Semikolon getrennt werden 3 2 1 Diskrete vs kontinuierliche Mengen Definition 3 1 Unscharfe Menge Sei X eine Menge von Elementen bzw Objekten x die hinsichtlich einer unscharfen Aussage mit einem Wahrheitswert U x auf Zugeh rigkeit zu bewerten sind Dann ist die Menge A d
32. 3 Add In 4 2 4 Funktionsprinzip 4 2 5 Installation und Portierung 4 3 FfA Toolbar 4 4 FfA97 Erweiterungen Kapitel5 L sungsentwurf 5 1 Modellentwurf FDBMS Zoo ee UDAN m bet Fe ke Fei Ch Ch On E GO kA A FA EA EA LA Ke be Neee GI Di Jl zl AHA HA kW NAAN Ge LA w Gi ke BR BW W L Lu Lu bh DO GO N NN A W A A A A 5 1 1 Beschreibung der Komponenten des Systems 5 1 2 Sequentielle Beschreibung des Systems 5 2 Interface 5 2 1 Query Schnittstelle 5 2 2 Administrationsschnittstelle 5 3 Erweiterung des PIA Objektmodells Kapitel6 Ergebnis 6 1 Das Query Formular 6 2 Die Schnittstelle C2a exe 6 3 Ffa Ole als Realisation der FDBMS 6 4 Administrationsinterface 6 5 Zusammenfassung Kapitel 7 Zusammenfassung und Ausblick Anhang A1 Unabh ngigkeitserkl rung A2 Inhalt der CD A3 Literaturverzeichnis A4 Abbildungsverzeichnis 7 1 A5 FfA97 Erweiterungen 7 1 A5 FfA97 Erweiterungen A2 1 Fuzzy set constants A2 2 Compatibility operator A2 3 Single and multi valued attributes 45 48 64 64 65 65 68 70 72 73 76 77 78 80 80 81 82 84 85 85 85 85 86 Kapitel 1 Einleitung und Motivation Die vorliegende Arbeit besch ftigt sich mit der Problematik von Fuzzy Zugriffen auf Datenbanken Das englische Wort Fuzzy l sst sich etwa mit unscharf oder verschwommen bersetzen und bezieht sich auf die den Abfragen zu Grunde liegenden Bedingun
33. 84 Information Sciences 34 KaZa97 Kacprzyk J Zadrozny S Fuzzy Queries in Microsoft Access V 2 in Fuzzy Information Engineering 1997 New York John Wiley amp Sons eds Dubois D Prade H Yager R KaZa97b Kacprzyk J Zadrozny S Multistage Fuzzy Control A Model Based Approach to Fuzzy Control and Decision Making 1997 New York John Wiley amp Sons KaZe84 Kandel A Zermankova Leech M Fuzzy Relational Databases A Key to Expert Systems 1984 Verlag TUV Rheinland Ko89 Kohonen T Self Organization and Associative Memory ER ed 1989 Berlin Heidelberg Springer Verlag Ku93 Kurzweill R Das Zeitalter der kiinstlichen Intelligenz 1993 Miinchen Carl Hauser Verlag 3 446 17375 7 MaSt99 Florian Matthes Ulrike Steffens PIA A Generic Model and System for Interactive Product and Service Catalogs April 1999 Technische Universit t Hamburg Harburg Germany Technical report Arbeitsbereich Softwaresysteme Accepted for Digital Libraries 99 McFr94 McNeill D Freiberger P Die unscharfe Logik erobert die Technik 1994 Miinchen Droemer Knaur 3 426 26583 4 St97 Ulrike Steffens Wechselseitige Integration von Information Retrieval und Datenbanken December 1997 Universit t Hamburg Germany Diplomarbeit Arbeitsbereich Informatik W160 Wittgenstein L Tractatus logico philosophicus Tagebiicher 1914 1916 1960 Frankfurt Main Ya83 Yager R R Robot Planning with Fuzzy Sets 1983
34. Artikel Extending SQL Retrieval Features for the Handling of Flexible Queries Systemerweiterungen relationaler Datenbanksysteme um unpr zise Abfragen behandeln zu k nnen Sie behandeln Syntax und Semantik ihrer erweiterten Komponenten sowie die dazu n tigen Spracherweiterungen von SQL Sie nennen ihre Sprache SQLf Au erdem besch ftigen sie sich mit der Realisierbarkeit und Implementierungsaspekten welche uns in diesem Zusammenhang besonders interessieren Die Autoren schreiben die Berechnung von Queries im Rahmen deklarativer Sprachen wie SQL sei ein offenes Problem in sich Im Allgemeinen k nne bei einer gegebenen Query kein optimaler Algorithmus zu deren Berechnung gefunden werden Wegen der h heren Komplexit t die bei der Berechnung unscharfer Queries notwendig ist gelte diese Effektivit tsbeschr nkung hier besonders Die Erh hung der Komplexit t beruhe vor allen Dingen auf der gr eren Menge an Daten die f r die Berechnung der Zugeh rigkeitswerte ben tigt werde und der Durchf hrung von Berechnungen im Gegensatz zu einfachen booleschen Vergleichen Dies in Bedacht k nne man zur Realisierung der von ihnen vorgestellten Spracherweiterungen f r SQL zwei Modelle unterschiedlicher Effektivit t heranziehen denen hier zwei weitere Architekturen gegen bergestellt werden sollen Die Autoren bezeichnen ihre Ans tze als a derivation Strategie und b direct evaluation Strategie 7 Anmerkung Wegen des Prob
35. Bewertungskriterium f r zusammengesetzte Abfragen eingef hrt Dabei geht es um die Bewertung einer zusammengesetzten Bedingung mit einem linguistischen Ausdruck der Form Die meisten der angegebenen Bedingungen m ssen erf llt sein Es wird die defuzzifizierte Zugeh rigkeit des Datensatzes zu der zusammengesetzten Bedingung auf ein Einheitsintervall 0 10 19 projiziert und dort gem Za83 mit einer st ckweise linearen Zugeh rigkeitsfunktion bewertet Beispiel 4 1 Die Aussage Das Auto ist rot und schnell und billig ist zu 0 7 erf llt 0 7 entspricht nach der Projektion dem Wert 7 Die Aussage gt gt Die meisten Bedingungen der Aussage Das Auto ist rot und schnell und billig sind erf llt lt lt ist gem Abbildung 4 2 zu 0 67 erf llt Um speziell die Realisierung dieser Methodik in FfA darzustellen muss zwischen der Anwendung auf Ebene der einzelnen Alternativen oder des Interesses unterschieden werden a Quantifier f r Alternativen Auf der Ebene der Subqueries wird folgenderma en verfahren Es gibt eine Reihe atomarer Bedingungen die Und verkn pft sind Preis ist hoch und Geschwindigkeit ist hoch und Die MDs der einzelnen Bedingungen werden gem der Definition der Und Bedingung zu einem Gesamt MD verkn pft Min Der Gesamt MD wird wie oben angegeben mit der Zugeh rigkeitsfunktion des Fuzzy Quantifiers bewertet 10 aus technischen Gr nden abweichend vom sonstigen Einheitsint
36. Darstellung vermuten l sst keine Verkn pfung von Fl chen sondern eine Verkn pfung von einzelnen numerischen Werten n mlich den MDs der einzelnen Kriterien Im einfachsten Fall handelt es sich dabei um die Minimumbildung je zweier Werte in einem iterativen Prozess wenn wir uns auf das harte Und beschr nken Die Elemente werden solange paarweise ausgewertet bis sich Implikation und Pr misse zu einer Folgerung reduziert haben Approximatives Schlie en mit dem Modus Ponens Die hierbei geltende Kommutativit t und Assoziativit t gilt f r einige Interpretationen des Und nicht etwa im Falle des geometrischen Mittelwerts Ia Eine weitere Beschr nkung der paarweisen Interpretation ergibt sich wenn die Gewichtung der Kriterien mit Gewichtung eingef hrt wird Hier ist nach den drei Interpretationen gem Zadeh Fagin und PIA zu unterscheiden siehe 3 1 10 Linguistic Quantifier 57 Zadeh ignoriert den Verkniipfungsoperator Und verlangt das Setzen eines Linguistic Quantifiers ist in dieser Eigenschaft nicht Teil der Anforderungsdefinition und wird deshalb nicht besprochen Fagin verlangt in der Form wie seine Interpretation in dieser Arbeit verwendet wird die Sortierung der Kriterien nach abfallender Gewichtung Man stelle sich die zu verkniipfenden Elemente also entsprechend sortiert vor Dann bildet er iterativ die Verkniipfung Und tiber die jeweils ersten j Elemente gewichtet sie mit der Differenz der aktuellen und der nachf
37. Einstellwerte zu erzeugen wird oft die Fl che unter den Kurvenverl ufen der Zugeh rigkeitsfunktionen herangezogen Der Abszissenwert des Fl chenschwerpunkts wird als resultierender scharfer Stellwert herangezogen In Beispiel 3 5 ergibt sich damit der scharfe Stellwert u 70 der K hlventil ffnung Dieser Vorgang wird als Defuzzifikation der Ausgangsgr e bezeichnet Andere Anwendungen verwenden hier den kleinsten Wert bei dem sich das Maximum der Kurve findet F r unseren Anwendungsfall entspricht der so gewonnene Wert dem Zugeh rigkeitswert MD der Bedingung 3 1 10 Linguistic Quantifier Im Bereich der Konzepte der Fuzzy Logic sei abschlie end eine Funktion beschrieben die man als Bewertung von Fuzzy Aussagen beschreiben k nnte Als Beispiele m gen dienen 16 Kapitel 3 Stand der Technik Fuzzy D atenbanken 1 Die meisten Cabrios sind teuer 2 Die meisten der folgenden Bedingungen m ssen erf llt sein Trotz der gleichen Wortwahl sehen wir in den beiden Beispielen zwei grundlegend unterschiedliche semantische Konzepte Das erste Beispiel stellt den Vertrauenswert einer Aussage dar Er bewertet die Aussage Cabrios sind teuer mit stimmt meistens Dagegen finden wir im zweiten Beispiel einen Mechanismus zur Gewichtung von Verkn pfungsoperatoren wieder Die Zugeh rigkeitswerte eines Datensatzes zu einzelnen Bedingungen die gew hnlich Und bzw Oder verkn pft sind werden als Gruppe bewertet Es
38. Prozedur process_query die von dem Button ausgel st wird Ihr vorgeschaltet ist noch eine Abfrage nach dem matching degree threshhold der bestimmt ab welchem MD ein Datensatz der L sungsmenge zugeordnet wird Wird statt des Go Buttons der Access eigene Evaluierungs Button gedr ckt reagiert Access mit einer Fehlermeldung da die FfA SQL Syntax nicht SQL konform ist Sie wird in process_query umgewandelt und dann von der Prozedur ausgel st Abbildung 4 4 Access GO Button Die verbleibenden f nf Schalter dienen dem Editieren der Fuzzy Funktionen Zum einen lassen sich damit die Begriffe der vier Fuzzy Operatoren Fuzzy Value Fuzzy Relation Fuzzy Quantifier und Fuzzy Importance fehlerfrei in Queries setzen zum anderen lassen sich deren Werte sowie die der Attribute editieren was im Folgenden n her erl utert wird 41 Editieren von Queries Im Regelfall dient die Toolbar dem Editieren von Queries Deshalb verlangt das Bet tigen der letztgenannten f nf Schalter zwingend dass eine Query im Editier Modus ge ffnet ist F r den Fall das man nur eine Fuzzy Funktion editieren m chte k nnte man dies als Bug bezeichnen Dr ckt man bei zum Editieren ge ffneter Query auf einen der vier Schalter f r die Operatoren so erscheint zun chst ein Formular wie in Abbildung 4 5 beispielhaft f r die Fuzzy Relation dargestellt Hier kann man einen Fuzzy Operator ausw hlen z B Not much greater than Er wird dem in
39. UNSCHARFE SUCHE IN DATENBANKEN KONZEPTUELLE GRUNDLAGEN SYSTEMENTWU URF UND PROTOTYPISCHE IMPLEMENTIERUNG Diplomarbeit vorgelegt von ERNST AUGUST WIEDEN Technische Universit t Hamburg Harburg Arbeitsbereich Softwaresysteme Betreuerin Ulrike Steffens 1 Korrektor Prof Florian Matthes 2 Korrektor Prof Joachim W Schmidt Meinen Eltern VORWORT Diese Arbeit verfolgt das Ziel den Abfragemechanismus von Datenbanken intelligenter zu gestalten dies insbesondere in Hinblick auf den Einsatz von Fuzzy Logic Methoden die bisher vorwiegend Einsatz in der Regelungstechnik finden Die Arbeit entstand im Umfeld des Forschungsprojekts PIA an der TU Harburg welches im Anschluss an ein einleitendes Kapitel n her beschrieben wird Darauffolgend findet sich eine Einf hrung in die Fuzzy Logic soweit es zum Verst ndnis der Ans tze dieser Arbeit notwendig ist Hierin werden auch die bisherigen Forschungsergebnisse auf dem Gebiet der Fuzzy Datenbanken dargestellt Das vierte Kapitel besch ftigt sich mit der Darstellung einer Applikation die der prototypischen Realisierung der Ans tze dieser Arbeit zugrunde liegt Diese konkrete Implementierung einer Fuzzy Datenbank hei t FfA Fuzzy for MS Access Nachdem somit die Grundlagen der Probleml sung beschrieben sind wird im f nften Kapitel ein Ideal System entworfen das Fuzzy Zugriffe auf beliebige Datens tze zur Verf gung stellt Es lernt ber einen Feedback Mechanismus indiv
40. above for the second operand appearing in a given atomic condition secop_value As Variant fv 4 As Double set once before querying Parameter des Attributs auge attrname As String fvname As String secopname As String impor As Single Die einzelnen Attribute der Atome sind weitestgehend selbsterkl rend Zu impor sei jedoch angemerkt dass dieser Wert nicht zur Verwendung in einzelnen Kriterien vorgesehen ist sondern lediglich zur Bewertung der einzelnen Interessen was sich nicht mit dem Objekt Ansatz von PIA deckt Hier k nnen auch die Kriterien eine Gewichtung weight tragen Um diesen Mangel zu berkommen wurde der zus tzliche Parameter st_FAG eingef hrt Er bergibt in Form eines Strings die lokalen Gewichtungen auf Ebene der Kriterien einer Alternative an FfA_ProcessQuery Sie sind durch Leerzeichen getrennte Gleitkommazahlen Falls dieser String leer ist wird eine lokale Gewichtung von Eins f r jedes Element angenommen Die Funktion des Attributs impor in obiger Typdefinition ist verwirrend Um einer Alternative eine globale Gewichtung zuzuschreiben wird ihr eine zus tzliches beliebiges Attribut hinzugef gt das mit der gew nschten Gewichtung belegt wird Bsp HOUSES BATHROOMS FfA_FI 0 5 Um dieser Verwirrung zumindest ein wenig entgegenzuwirken setzt die Delphi Schnittstelle das Pseudo Attribut IgnoreMe ein HOUSES ignoreMe FfA_FI 0 5 6 4 Administrationsinterface Wie oben angef
41. ai Y gt y 983 DB gt gt Response Interpreter Abbildung 5 1 Systementwurf 5 1 1 1 Regler AFR Kernst ck der Anlage ist der Regler An ihn werden Daten zur Bewertung angelegt Eingangssignal In dem Regler werden die Daten entsprechend dem Interesse bewertet und pr sentieren dann ausgangsseitig die Zugeh rigkeit zu diesem Interesse als MD Die Abbildung des Interesses in den Regler geschieht mit der Regleraktivierungseinheit s u in Abh ngigkeit von der Query und der individuellen Person respektive Personengruppe Individualisierung Der Regler wird aus diesem Grund adaptiv genannt AFR Zun chst sei jedoch angenommen die Regel bzw das Interesse sei fest implementiert Kriterien Fuzzifizierung Der Regler besitzt Dom nen spezifische Eing nge Geschwindigkeit Farbwert Die Attributwerte der Datens tze werden fuzzifiziert Uyshoch 0 7 Urzro 0 6 Alternativen Die Zugeh rigkeitswerte werden gewichtet und zu alterantive score zusammengefasst Interesse Die Zugeh rigkeitswerte der Alternativen werden zu interest score zusammengefasst und ausgegeben 5 1 1 2 Regleraktivierungseinheit RAE Damit der Regler f r verschiedene Interessen Zugeh rigkeitswerte berechnen kann wird er f r alle criterion score initialisiert D h die Zugeh rigkeit jedes Attributwertes zu dem gegebenen 45 Satz an linguistischen Variablen z B hoch mittel niedrig wird berechnet Gem dem spezifischen Interes
42. allgemeine Form 5 Im Falle der PIA Interpretation l sst sich zudem die Realisation der lokalen Gewichtung in die Fuzzifizierung vorverlegen so dass sich f r Alternative score ergibt MDatternative AND LV x nach PIA Sb Im konkreten Fall muss die Interpretation des Und s gekennzeichnet werden etwa ANDfagin min 3 ODER KOMPOSITION Die Oder Komposition verh lt sich ganz hnlich wie die Und Komposition Es entf llt aber die Problematik die durch die verschleppten Modifikatoren entstand Im Umkehrschlu bedeutet das dass es keine M glichkeit gibt einer Bedingung Alternative Nachdruck zu verleihen indem man sie mit sehr belegt respektive das sehr l sst sich nicht als beliebige Modifizierungsfunktion deuten sondern nur als multiplikative Gewichtung 60 Kapitel 5 Losungsentwurf Die Standarddeutung des Oder s ist der Max Operator An die Stelle des geometrischen Durchschnitts tritt der algebraische Durchschnitt Zadeh wird aus den gleichen Griinden wie in obiger Diskussion auch hier nicht betrachtet Fagin s Formel lautet hier ORragini x il OR x1 2 i2 13 OR x1 X2 3 i3 14 OR x1 X2 X3 k ip OR X1 Sa Xk 2 mit i ij 0 1 als Vektor der Gewichtung OR 0 1 0 1 z B Maximumbildung und k als Komplexit t der Oder Komposition Die PIA Interpretation der Gewichtung liefert xj ij Xj und bildet dann das Maximum ber alle x Aus der F lle mitt
43. arakteristischen Funktion um Die Werte von um liegen im normalisierten Fall der hier immer angenommen werden soll zwischen 0 keine Zugeh rigkeit und 1 volle Zugeh rigkeit Werte au erhalb dieses Bereichs k nnen bei der Regelerstellung entstehen wenn statistische Daten herangezogen werden Diese lassen sich aber i A wiederum normieren Mit diesen Funktionen k nnen im Gegensatz zur klassischen Mengenlehre auch flie ende berg nge der Elementzugeh rigkeit zu einer Menge bzw des Zutreffens einer Aussage beschrieben werden Es bietet sich die M glichkeit im Rahmen der Idealisierungen bei der 1 engl Membership function 2 Eine mathematische Definition der Zugeh rigkeitsfunktionen und unscharfen Mengen findet sich im Abschnitt 3 2 1D iskrete vs kontinuierliche Mengen Systembeschreibung elastisch zu modellieren Der Fall scharf begrenzter Mengen ist im Fall unscharf begrenzter Mengen insofern enthalten als dass dann die Zugeh rigkeitsfunktionen nur die Werte Null und Eins annehmen k nnen Beispiel 3 2 Die in Abbildung 3 2 gestrichelt dargestellte Zugeh rigkeitsfunktion um x beschreibt die Menge aller reellen Zahlen 18 Sie kann beispielsweise die Menge aller vollj hrigen Bundesb rger darstellen da der Begriff Vollj hrigkeit eindeutig scharf durch Gesetzesentschluss festgelegt ist zur Beschreibung der Menge aller erwachsenen Bundesb rger eignet sie sich dagegen nur als grobe vereinfache
44. ard FfA_FS fuzzy set name Formally a compatibility operator is a binary operation on fuzzy sets Let FS in a query and D in a database record be two fuzzy sets defined in the same universe of discourse U i e The compatibility operators mentioned above may be defined as follows Let md FS D denote the matching degree of a simple condition referring to the compatibility operator to be defined Then the following definitions are employed 1 Degree of possibility of matching For the general case when both FS and D are fuzzy we have while in case when both these sets are crisp we obtain and finally if is a single element crisp set then This compatibility operator is proper in situations where just non emptiness of the intersection of the value of an attribute and a corresponding pattern in a query is satisfactory In the case of the Main_products_purchased attribute it is adequate while looking for a customer who is mostly interested in at least one product mentioned in a query A possible fuzziness of both the sets FS and D allows to account for different levels of relevance of particular products Degree of necessity of matching For the general case of fuzzy FS and D we have while in case when both these sets are crisp we obtain and finally if is a single element crisp set then Obviously this operator is not symmetrical hence we can define two different operators corresponding to md FS D and md D FS respectively These
45. ass alle Alternativen eine Gewichtung von Null haben Dieser l sst sich allerdings auch nicht sinnvoll normieren und tr gt auch keine w nschenswerte Bedeutung Deshalb sei dieser Fall per Definition ausgeschlossen YI gt 0 Vorraussetzung a Weil alle in dieser Arbeit vorgestellten Ans tze zur Interpretation globaler Gewichtung Zadeh Fagin PIA sp testens auf der algorithmischen Ebene selbst eine Normalisierung vornehmen soll Voraussetzung 1 a zu einer Normierung versch rft werden 49 Pig mit Jj I sind globale Gewichtungen einzelner Alternativen und I sind die normierten Werte dieser Gewichtung Vorraussetzung 1 b Diese Normierung muss aber gem den in dieser Arbeit vorgestellten Ans tzen f r lokale Gewichtung nur dann berechnet werden wenn nicht gilt L Vij Andernfalls hat die Normierung keine Bedeutung Aus Gr nden der Performance wird man im Falle gleicher Gewichtung der Alternativen bestrebt sein ohne Gewichtung zu rechnen Im brigen ist dieser Vorgang Aufgabe der weiter unten beschriebenen RAE 2 Im Falle der Und verkn pften Kriterien muss hingegen mehr Obacht gegeben werden Lokaler Quantifier Zun chst sei der Fall eines gesetzten lokalen Quantifiers besprochen obwohl das Objektmodell diese Fuzzy Methode nicht vorsieht Beispielsweise Die meisten der folgenden Bedingungen m ssen erf llt sein In diesem Fall muss die Und Verkn fung der Alternative bei der Abbildung in den
46. ass die gewachsene Struktur des Prototyps diesen Anforderungen nicht gerecht wird so dass eine Implementierung des offenen Modellentwurfs erforderlich sein k nnte Dieser Schritt scheint auch angeraten f r den Fall dass PIA zu einem lernf higen System ausgebaut wird Der Einsatz Neuronaler Netzen mit Error Backpropagation Funktionalit t erfordert in jedem Fall ein sehr viel klarer strukturiertes System Eine Personalisierung der Fuzzy Zugeh rigkeitsfunktionen hingegen lie e sich wohl auch mit diesem System noch leisten F r zuk nftige Erweiterungen des Systems k nnte weiter der Einsatz von Fuzzy Thesauri in Betracht gezogen werden Darin wird einem Begriff wie Schrank explizit eine gewisse hnlichkeit zu Kommode zugeordnet Diese Methodik k nnte sich auch f r Fuzzy hnlichkeiten in hierarchischen Dom nen als zweckdienlich erweisen Eine weitere Methodik die gegebenenfalls eigenst ndige Untersuchungen rechtfertigen K nnte w re der Einsatz einer Fuzzy phonetischen hnlichkeitssuche die heute schon in einigen kommerziellen Systemen zum Einsatz kommt Pauschalreisedatenbank Bistro von IFF Zeichenketten werden hierbei nach komplizierten Algorithmen in Phonem Laut Folgen bersetzt Dann wird die hnlichkeit der Lautfolgen ermittelt die im Allgemeinen sehr viel aussagekr ftiger ist als die der Zeichenfolgen 79 Anhang A1 Unabh ngigkeitserkl rung Hiermit erkl re ich dass ich diese Arbeit selbstst ndig verfasst
47. ass man den Wert eines alternative score nicht direkt f r interest score weiterverarbeitet sondern ihn als Eingangssignal verarbeitet Um diesen Vorgang zu erm glichen muss von der bisherigen Linearit t des Signalwegs abgewichen werden Das Ergebnis findet sich durch einen iterativen Prozess der mehrere Durchl ufe umfassen kann 61 5 1 2 3 Pr sentation des Ergebnisses Die als interest score ermittelten Zugeh rigkeiten werden dem anliegenden Datensatz als neues Attribut hinzugef gt Zur Anzeige kommen dann die in der Ausgangsquery mittels select Clause angeforderten Attribute interest score sowie ggf zus tzlich angeforderte Zwischenergebnisse wie alternative score criterion score oder unscharfe Attribute aus rekursiven Prozessen Datens tze deren interest score Wert die cut off Grenze unterschreiten werden nicht mit einbezogen Je nach Implementierung werden die Datens tze iterativ also sofort nach der Evaluierung bergeben oder in einer Tabelle zwischengespeichert Die Tabelle wird gem der User Pr ferenzen sortiert Diesen Sortierkriterien wird der ermittelte Gesamt MD als vorrangiges Sortierkriterium bergeordnet 5 1 2 4 ANN Personalisierung und RAE RAE Um den Regler abfragespezifisch zu steuern werden die Aktivierungsgrade der Regeln von einem speziellen Modul gesteuert der Regleraktivierungseinheit RAE So l sst sich die f r eine Anfrage Ich m chte ein Billigauto spezifische Regel aktivie
48. auf der Ebene der atomaren Bedingungen Kriterien Au erdem sei erw hnt dass das Konzept des Fuzzy Quantifiers sich in zwei Alternativen spaltet je nachdem ob man die Interpretation nach Zadeh oder OWA w hlt Die verwendeten Begriffe lassen sich wie folgt weiter spezifizieren lt attribute gt Dieser Begriff beschreibt ein Attribut auf einer numerischen Dom ne Um als Fuzzy Term angesprochen werden zu k nnen muss eine obere UpperLimit und untere Grenze LowerLimit des betrachteten Wertebereichs definiert werden UL und LL werden bei der Berechnung des Matching Degrees als Transformationsparameter der Abbildung auf das Einheitsintervall benutzt auf dem die Fuzzy Funktionen definiert sind Beispielhaft sei ein Auszug aus der Tabelle FfA_Attributes f r das Beispiel der mitgelieferten houses mdb Datenbank gegeben Field rangel Field range HOUSES MDB HOUSE BATHROOMS 1 10 HOUSES MDB HOUSES BEDROOMS 1 10 HOUSES MDB HOUSES CAR SPACE 1 10 HOUSES MDB HOUSES PRICE 50000 1000000 lt fuzzy value gt Dies sind un re Fuzzy Funktionen die auf einem Einheitsintervall definiert sind FfA verwendet als Einheitsintervall 10 10 Die Form der Zugeh rigkeitsfunktionen wird auf Trapezfunktionen beschr nkt mit den oben 3 2 1 Diskrete vs kontinuierliche Mengen angef hrten Vorteilen Zur Definition einer jeden Funktion ist die Angabe von vier Parametern ausreichend Ausgehend von eine
49. avon abgesehen wird den Vorgang in einem einzigen durchgehenden Gedankengang umfassend zu beschreiben Stattdessen wird die L sung in zwei Schritten beschrieben Zun chst folgt eine nur anschauliche Beschreibung die einen berblick ber das Gesamtsystem erlaubt und Raum f r berlegungen bzgl m glicher Auspr gungen oder Erweiterungen des Systems gibt Hierbei werden die einzelne Komponenten des Systems beschrieben Danach findet dann eine eingehende Diskussion der Ph nomene statt die auftreten wenn man sich die Details der Implementierung vor Augen f hrt Hierbei wird der sequentielle Ablauf eines Evaluierungsvorgangs Berechnung einer Query beschrieben Kapitel 5 Losungsentwurf 5 1 1 Beschreibung der Komponenten des Systems Das System sei zun chst in einem raschen berblick in der vom Autor favorisierten Version beschrieben um als Diskussionsgrundlage f r nachfolgende berlegungen zu m glichen Variationen und Detailbetrachtungen des Abschnitts 5 1 2 Sequentielle Beschreibung des Systems zu dienen Das System besteht aus sechs Teilen Regler Regelaktivierungseinheit ANN Personalisierung Datenbank Ablaufsteuerung inkl Interpreter Feedback backprop long term pref s Personalisierung A v temp pref s 5 AN 2 score s Vv Regler S gt alternatives 2 Regeln ell criteria i y Fuzzyfikation Detuszyt Feedback A A de Quer N
50. bbildung unabh ngig vom spezifischen Interesse und br uchte nicht von der RAE gesteuert zu werden Dies kann als Vorteil bei der Implementierung gelten Man k nnte aber auch auf den Ansatz aus Abbildung 5 5 zur ckgreifen Dann m sste man allerdings einen entsprechend gr eren in diesem Fall 5 n zeiligen Sympathie Vektor in Kauf nehmen F r den vollst ndigen AFR wird im weiteren Verlauf der Erl uterungen eine kompakte Formel f r die Ermittlung der Zugeh rigkeit zum Interesse hergeleitet Den ersten Baustein hierf r liefert LV x 0 1 0 1 mit 2 n ist die Quantisierung der Linguistischen Variablen m ist Zahl der Attribute und ist Zahl der ungleichen Relationen LN stellt die Bewertung des aktuellen Datensatzes mit den Werten der standardisierten Linguistischen Variablen dar Dieser Vektor soll als linguistisch bewerteter Eingangswert bezeichnet werden 2 UND KOMPOSITION Zun chst sei der einfache in Abbildung 5 3 dargestellte Fall besprochen Dazu werden die Elemente E3 E33 und E3 betrachtet Sie stellen die Inferenz logischer Schluss IF Haltbarkeit mittel AND Kaufpreis niedrig THEN Interesse hoch f r die Daten Haltbarkeit 7 Jahre und Kaufpreis 1500 DM dar und ergeben ein Interesse von 0 4 Dieser Fall kann als einfach gelten da er keine Gewichtung mit Gewichtung keine Modifikatoren und keine Abbildung auf Zwischenwerte enth lt Die Und Komposition ist anders als die graphische
51. beispielsweise in der Abfrage C Programme sambar41 tmp bakw3 txt editierbar ist Der Ort dieser Datei wird im Modul selbst angegeben in der Funktion FfA_RunQuery Die Funktion von FfA_ProcessQuery l sst sich folgenderma en zusammenfassen Zun chst wird die Syntax auf Konformit t gepr ft Insbesondere wird kontrolliert ob die SELECT FROM WHERE Form eingehalten wurde und ob keiner der Operatoren IMP EQV XOR oder OR verwendet wurde Dann wird der Bedingungsteil der Query freigestellt und in wheres gespeichert Daraus werden die Alternativen extrahiert und in ands nacheinander zwischengespeichert w hrend wheres jeweils um ands verkleinert wird Aus den ands werden die einzelnen Kriterien extrahiert und im Vektor Atoms abgelegt Mit jeder Extraktion wird ein neues Objekt von Typ Atom_Type erzeugt und mit Werten belegt Der Typ hat folgende Definition Type Atom_Type type As Integer Fuzzy value FfA_FVType OR fuzzy relation FfA_FRType OR non fuzzy atomic condition FfA_CrispType attr 2 As Double range of the attribute copied from the table FFA_ATTRIBUTES attr_value As Variant Place for the values of the attribute or rather corresponding field appearing in given atomic condition in subsequent records Set during querying process In the case of FfA_CrispType contains logical value corresponding to fulfilment of this atomic condition secop 2 As Double as
52. beleuchtet werden wie sich Teile zusammengesetzter Bedingungen quantifizieren lassen Hierzu z hlen zum einen die Methoden zur Behandlung von Linguistischen Quantifizierern nach L Zadeh und OWA Ordered Weighted Average Diese lassen sich zus tzlich mit Gewichtung Importance verkn pfen und treten in diesem Sinne in eine Gruppe mit zwei weiteren Ans tzen zur Behandlung von Gewichtungen Einem neueren Ansatz von R Fagin und einer selbst entwickelten Theorie Diese Eigenentwicklung bietet einen besonders einfachen Ansatz den Projektanforderungen von PIA nach Gewichtung zu gen gen ohne den Ballast der Allgemeing ltigkeit der anderen Theorien gen gen zu m ssen Um einen Begriff wie Gewichtungs Behandlungsroutinen o zu vermeiden sei diese gesamte Gruppe vom Berechnungsvariationen f r Gewichtung in Folge als Quantifier bezeichnet Regul re Quantifier Quantifizierer seien durch Beispiele wie f r alle oder f r die meisten oder f r einige Werte gilt eingef hrt Die konventionelle Logik kennt derer Art Beispiele nur mit scharfen Werten wie f r alle oder f r einen Mit solchen Quantifizierern lassen sich unscharfe Regeln 22 Kapitel 3 Stand der Technik Fuzzy D atenbanken definieren wie Nur wenige gro e Autos sind billig oder wie in unserem Anwendungsfall Die meisten der angegebenen Bedingungen m ssen erf llt sein Diese regul ren Quantifier werden zwar vom PIA Projekt nicht gefordert s
53. booleschen Raum in eine Oder Verkn pfung umgewandelt werden da die Quantifier nach Zadeh und OWA unabh ngig von Verkn pfungen definiert sind und auf Mengen arbeiten Siehe Linguistic Quantifier Kriterien auf numerischen Dom nen F r den Fall von Kriterien die sich auf numerische Dom nen beziehen muss zwischen scharfen und unscharfen Bedingungen unterschieden werden Zur Unterscheidung dieser Bedingungen sieht das Objektmodell im Bereich der Pr dikate zur Zeit keine eigene Eigenschaft vor Die Objekte der Klasse Predicate haben drei Eigenschaften arity int name String description URL In erster N herung k nnte man allein den Namen eines Kriteriums als Bedingung daf r nutzen ob es sich um ein scharfes oder unscharfes Pr dikat handelt So k nnten bestimmte Funktionen wie gt lt exists u K nnten als scharfe Funktionen deklariert sein Im objektorientierten Sinn dagegen w re die Sch rfe eine vierte Objekteigenschaft Somit lie e sich der gesuchte Extraktionsfilter f r relevante Datens tze realisieren indem er die Pr dikate der Kriterien fragt ob ihre Eigenschaft scharf den Wert true hat Dies entspricht einer vierten Objekteigenschaft von predicate crisp Boolean Der Extraktionsfilter w rde in diesem vorl ufigen Modell also die Alternativen der Query auf ihre scharfen Bedingungen reduzieren In dem Fall dass eine der Alternativen keine scharfen Bedingungen enth lt z B
54. bungen als gegenw rtiger Stand des Systems zu betrachten Einleitend wird das verwendete Vokabular beschrieben 2 1 Das PIA Vokabular Um das Datenmodell von PIA zu erl utern seien zun chst einige Begriffe grunds tzlich beschrieben Produkt Item Ein Produkt ist die Beschreibung eines verkaufbaren Artikels und wird einer bestimmten Produktkategorie zugeordnet Es hat weitere beschreibende Attribute wie einen Namen oder auch eine Preisangabe sowie produktspezifische Attribute Ein Beispiel fiir ein Produkt ist Kategorie Auto Typ Mercedes E230 Baujahr 1998 Leistung 95 KW Preis 12 000 Attribut Attribute Merkmal Eigenschaft Eine mit einem Namen Bezeichner versehene Eigenschaft eines Produkts H ufig kommt ihre Bedeutung in ihrem Namen zum Ausdruck Beispielsweise informieren die Attribute Produktname Produktkategorie Preis Hersteller und Anbieter ber den Zustand eines Produktes in der realen Welt Auspr gung Value Attributwert Der Wert der einem Attribut f r ein bestimmtes Produkt zugeordnet ist Ein konkretes Vorkommen tats chliches Auftreten eines Attributes In einer tabellarischen Darstellung werden Attributauspr gungen als Tabelleneintr ge dargestellt w hrend ein Attribut durch die Spalten berschrift einer Tabelle repr sentiert wird Beispiel Im Produktkatalog wird die Produktkategorie Personal Computer genannt Attribut ist Produktkategorie Attributaus
55. bungsvariablen in interne Variablen einlesen erzeugen eines entsprechenden FQUERY Strings und Steuerung der Access Datenbank ber OLE Ergebnis berechnen und als Html Datei abspeichern Dabei werden typische Fehlerf lle abgefangen und gegebenenfalls in der Ergebnisdatei als Fehler benannt Im Falle einer Fagin Interpretation von Gewichtung wird die notwendige Sortierung und Normierung vorgenommen Die Anwendung wird l sst sich ber eine Datei d2a ini steuern die im gleichen Verzeichnis wie die Applikation selbst liegt Die Datei enth lt folgende Parameter config database dbms ffa_ole mdb default_in tmp debug default_ffa ini default_query tmp debug default_ffa txt default_out tmp debug default_ffa out Access_OLE Access Application 8 Die Pfadangaben sind relativ zur Wurzelverzeichnis des Webservers database ist die Datenbank die durchsucht werden soll Die anderen drei Dateien dienen Debugzwecken Zu Entwicklungszwecken arbeitet das Programm auch ohne Kommandozeilenparameter In diesem Fall werden die drei genannten Dateien verwendet Der Wert von Access_OLE findet sich in der Windows Registry unter HKEY_CLASSES_ROOT Access Application CurVer Es handelt sich um den internen OLE Namen der Access Version Er muss gegebenenfalls maschinenabh ngig angepasst werden 6 3 Ffa Ole als Realisation der FDBMS Die urspr ngliche Version von FfA 2 0 wurde f r die Zwecke von PIA umgeschrieben Der Original Code best
56. cess Beispiel 4 2 Portierung von FfA20 in 32 bit Windows Versionen Declare Function wu_GetWindowText Lib User32 Alias GetWindowTextA ByVal h ByVal lpstr ByVal n As Integer statt Declare Function wu_GetWindowText Lib User Alias GetWindowTextA ByVal h ByVal lpstr ByVal n As Integer Nach diesen Anderungen funktionierte FfA 2 0 weitestgehend auch unter Windows 95 bzw Windows NT mit Access 97 Da die Editierfunktionen von FfA97WWW funktionieren nicht aber die von FfA 2 0 es sich mit den Abfragefunktionen aber genau umgekehrt verh lt wird in der prototypischen Realisierung dieser Arbeit FFA9 WWW als Editier Interface benutzt und FfA 2 0 als Abfrage Schnittstelle 4 3 FfA Toolbar Mit FfA Toolbar stellt FfA ein User Interface zur Verfiigung Es ist als Simulation eines Meniis mit Hilfe eines Formulars realisiert FQUERY s Toolbar Pa Abbildung 4 3 FfA Toolbar Version 2 0 Wenn das Add In gestartet wird ffnet sich das Formular und stellt verschiedene Editierhilfen zur Verf gung Au erdem gibt es eine Hilfe Funktion einen Button um das Add In zu verlassen und einen um die Query auszul sen Dieser Button Go ist dem Access eigenen Button zur Ausl sung einer Query nachempfunden siehe Abbildung 4 4 Er ist notwendig um die von FfA erweiterte SQL Syntax in eine Access konforme Darstellung zu bersetzen Dies geschieht mittels der in VBA implementierten
57. chiedlichen Interpretationen zu evaluieren da auch der Prototyp allen obigen Anforderungen gen gt Das System erlaubt es ber ein Webinterface das derzeit stellvertretend f r die PIA Oberflache steht von einem beliebigen Rechner aus auf alle ODBC f higen mit dem Rechner verbundenen Datenbanken zuzugreifen 78 Kapitel 7 Zusammenfassung und Ausblick Von einem Prototyp muss indes trotzdem gesprochen werden da es sich keineswegs um eine saubere Implementation im Sinne des Software Engineerings handelt sondern vielmehr um die zurechtgebogene Version einer ber Jahre gewachsenen Software die technologisch auf unzeitgem en und hohen Anspr chen nicht gen genden Systemen aufsetzt So kann vom Einsatz des modifizierten Access Add Ins auf einem produktiven Webserver nur abgeraten werden da die Fehlerbehandlungsroutinen nicht nur unvollst ndig sondern auch nicht Web gerecht implementiert sind Dem Anspruch eines Testsystems indes schienen die vorgenommenen Modifikationen zu gen gen so dass die Implementation als L sung der gestellten Aufgabe gelten Kann Statt auf die Stabilit t wurde das Augenmerk auf die Erweiterung der Funktionsvielfalt gelegt Die Praxistauglichkeit des Systems wird sich zun chst im Zusammenspiel mit PIA erweisen m ssen Bei Erfolg im Zusammenspiel mit dem Gesamtsystem wird die n chste Klippe auf dem Weg zum praktischen Einsatz die Performance in einem realen Einsatz von PIA liegen Es steht zu vermuten d
58. chseln zu Favoriten 2 Se a amp Zur ck Abbrechen Aktualisieren Startseite Suchen Favoriten Verlaut Channels Adresse el bttp Jocalbostlco Auird ouer l form ee Zeller Z uep alter 2 ach anc ech true Zurucksetzen begoen 0 7 Fac ll DI Imp 1 DC bedrooms 1 0 FAG D 2 and medium e oz Quant 1 ia a Fa Lokale Intranetzone Zz Abbildung 6 3 Html Query 1 Parameter der Query Interest Threshhold Grenzwert den der Matching Degree eines jeden Datensatzes berschreiten muss damit er als der Query zugeh rig interpretiert wird Interpretation der Globalen Importance Methode mit der die Gewichtung der Subconditions interpretiert werden sollen nach Fagin OWA oder PIA Fuzzy Quantifier der Query Modifikator f r den Verkn pfungsoperator der Subconditions 2 Parameter der Subcondition Alternative Globale Importance Zuordnung einer Bedeutung weight zu einer Subcondition Interpretation der Lokalen Importance Methode mit der die Gewichtung der Conditions interpretiert werden sollen Fuzzy Quantifier der Subcondition 71 Modifikator fiir den Verkniipfungsoperator der Conditions 3 Parameter der Condition Criterion Attributname Angabe welcher Wert eines Datensatzes fiir eine Bedingung herangezogen werden soll Globale Importance Zuordnung einer Bedeutung weight zu einer Condition Fuzzy Value M glichkeit das Attribut mit einer un ren Funktion zu bewerten Fu
59. compatibility operators are proper when strong inclusion of the set representing the value of an attribute in the set corresponding to a pattern given in a query or vice versa is required In a customers database example when using a compatibility operator along with the Main_products_purchased attribute the first operator is adequate while looking for a customer particularly interested in all products specified in a query and maybe even some more On the other hand the second operator of this pair is adequate for the search of a customer particularly interested only in products specified in the query not necessarily all Generalized Jaccard coefficient For the general case of fuzzy and or crisp FS and D we have and this is one of most popular operators used in the classical crisp framework Again in the case of the Main_products_purchased attribute the Jaccard operator is proper while looking for a customer particularly interested in products specified in a query and not many other ones Parameters naming convention FfA_FC compatibility operator namelFfA_FS fuzzy set constant name Example FfA_FM Profile FfA_FC JaccardIFfA_FS Exact sciences A2 3 Single and multi valued attributes Both types of attributes may be used along with a fuzzy set constant in a query A single valued attribute may be considered as a special case of a multi valued attribute Namely only a special case of the compatibility operators IN is meaningfu
60. das Modul query befindet dessen Funktion FfA_processQuery die Interpretation der Query bernehmen soll Dann wird die Prozedur mit den aktuellen Parametern gestartet Access kompiliert den aus FfA 2 0 extrahierten VBA Code und berechnet in der Access Umgebung das Ergebnis der Anfrage Der Prozess endet mit einer Erfolgsmeldung an den OLE Server der dies an den Delphi Client meldet Der ruft wiederum einen Access Proze auf um die Ergebnisdatei in Html Form unter dem Namen der tempor ren Datei Wi out zu speichern die vom WIN CGI Interface beobachtet wird Monitoring Das Speichern dieser Datei l st ein OnClose Ereignis aus woraufhin sie von WIN CGI an den Client der die Anfrage gestellt hat zur ckgesandt wird und im Browser Fenster erscheint Da mehrere OLE Server Prozesse gleichzeitig auf Access gestartet werden k nnen und mit Replikationen der Original Datenbank arbeiten ist das System bzgl Abfragen Multi User f hig 6 1 Das Query Formular Das Formular siehe Abbildung 6 3 Html Query enth lt die Standard Schalter Submit und Reset und besteht au erdem aus einer Reihe von Auswahlfeldern mit denen die Anfrage formuliert werden kann 70 Kapitel 6 Ergebnis Die Auswahlfelder strukturieren sich nach e Parameter der Query Interest e Parameter der Subcondition Alternative e Parameter der Condition Criterion 3 dyn query Microsoft Internet Explorer von Lycos Bertelsmann GmbH amp Co KG Date Bearbeiten Ansicht We
61. dem AFR betrachten zu m ssen die relevant sein k nnen d h die m glicherweise eine Zugeh rigkeit gr er Null zum Interesse aufweisen Es muss also nicht f r alle Datens tze die gesamte Anzahl der Kriterien evaluiert werden was im Einklang mit dem Ansatz zur Effizienzsteigerung nach 3 3 3 Architekturmodelle c steht Weiterhin ist der AFR nur f r Bewertungen auf numerischen Dom nen ausgelegt Hierarchische und Volltext Dom nen hingegen m ssen zun chst weiter mit den klassischen Methoden behandelt werden So ist der AFR beispielsweise nicht in der Lage zu entscheiden ob ein Datensatz der Kategorie Auto angeh rt bzw wie sehr die Farbe Orange der Bedingung Farbe Rot gen gt Die hierf r noch zu entwickelnde Funktionalit t wird Module erfordern die sich m glicherweise zwischen die Datenbank Query und den AFR schalten lie en Sie k nnten etwa die hnlichkeit zwischen Stephan und Stefan ermitteln Die Aufteilung der Bewertung der Datens tze in mehrere Schritte hat somit auch den Vorteil das System modular zu entwickeln Mit dem modularen Ansatz wird also sowohl eine effiziente Berechnung als auch ein Gewinn an Flexibilit t verwirklicht Die Beschreibung der Vorbereitungsphase geschieht zweistufig Zun chst werden berlegungen angestellt wie die f r den AFR relevanten Datens tze ermittelt werden k nnen Danach wird beschrieben wie die so gewonnen Erkenntnisse sich in der Implementierung eines Extraktionsfilters nie
62. der scharfe Wert Im Fuzzy Sinne entspricht sie einer Zugeh rigkeitsfunktion in Form eines Graphen In unserem Gehirn dagegen ist das Ergebnis ein weitverzeigtes Erregungsmuster in einem komplexen Netz 12 Hier st t man an die Grenzen gegenw rtiger Mensch Maschine Schnittstellen Die Forschung arbeitet aber bereits an intelligenteren Schnittstelle F r den vorliegenden Fall b te sich beispielsweise ein differenziertes Ergebnis im Sinne einer Erhebung ber einer zwei dimensionalen Ebene an die von subjektivem und rationellem Gefallen aufgespannt sein k nnte Eine solche Projektion eines hochdimensionalen Ergebnisraum auf eine zweidimensionale Ebene wurde in den 80 Jahren mit bemerkenswerten Ergebnissen von dem Finnen Tuevo Kohonen entwickelt Ko89 So lie en sich z B Anfragen wie Gibt es in dieser Datenmenge etwas das mich interessiert sinnvoll beantworten Aufgrund seines umfassenden Ansatzes mag das System den Titel Konnektionistisches Modell eines adaptiven Fuzzy Reglers zur unscharfen Bewertung von Daten tragen 5 1 2 Sequentielle Beschreibung des Systems Die Beantwortung einer Query Interest in der FDBE l sst sich in vier aufeinanderfolgende Prozesse gliedern Vorbereitung Preprocessing Aufbereitung einer eingehenden Query zu einem sequentiellen Prozess der relevante Datens tze nacheinander an den Regler zur Bewertung anlegt Bewertung Processing Die Zugeh rigkeit eines jeden Datensatzes zu dem gegebene
63. derschlagen Ermittlung der relevanten Datens tze Die Anfragen an das System liegen gem Projekt Definition in der ersten Normalform vor Im Falle einer gew hnlichen Datenbank Query sind alle Und verkn pften Bedingungen Kriterien einer Alternative untereinander Ausschluss Kriterien d h wenn ein Kriterium einer Alternative nicht erf llt ist so ist die gesamte Alternative f r diesen Datensatz nicht erf llt Dagegen sind die Alternativen untereinander Oder verkn pft Hier gilt also wenn eine Alternative nicht erf llt ist so muss deswegen der Datensatz nicht zwingend irrelevant f r das gesamte Interesse sein Alternativen sind untereinander also keine Ausschlusskriterien 1 Im Falle der Oder verkn pften Alternativen erh lt sich diese Logik beim bergang aus der Fuzzy Logic in die boolesche Algebra u A auch unabh ngig vom Bewerten der Alternativen mit Gewichtung da die Leitlinie ist Datens tze nicht voreilig auszuschlie en nur weil die eine oder andere Alternative nicht erf llt ist Weder das Setzen eines globalen Quantifiers noch das einer globalen Gewichtung auf Ebene der Fuzzy Logic k nnen sich hier sinnverkehrend auf die boolesche Logik auswirken da der Datensatz nur in dem Fall von einer weiteren Betrachtung ausgeschlossen wird dass alle Alternativen nicht erf llt sind Dies kann in der Fuzzy Logic nur dann zu einer Gesamt Zugeh rigkeit gr er Null f hren wenn man den entarteten Gewichts Vektor zul sst d
64. die Aussage Das Auto ist schnell berf hrt in Es ist falsch dass das Auto schnell ist Diese Aussage ist nicht notwendigerweise gleich mit Das Auto ist nicht schnell Definition 3 3 Komplement Sei Ae P X Wenn ua X 0 1 gilt hei t A das Komplement von A auf X mit VxeX ur amp 1 uA amp Weitere einstellige Operatoren sind die oben eingef hrten Modifikatoren Im Rahmen der praktischen Umsetzung dieser Arbeit werden alle einstelligen Operatoren durch vordefinierte Zugeh rigkeitsfunktionen modelliert So wird etwa nicht Uschnen durch den Modifikator sehr transformiert sondern Usehr schnei direkt definiert 3 2 6 Verkn pfungsoperatoren Im Folgenden werden Verkn pfungsoperatoren behandelt mit denen sich komplexe unscharfe Bedingungen auswerten lassen Etwa Gr e ist gro und Preis ist mittel oder Gr e ist mittel und Preis ist niedrig Es handelt sich hierbei um die bertragungen boolescher Funktionen in die Methodik der Fuzzy Logic Bereits Lotfi A Zadeh Za65 gelang es ein allgemeines Prinzip zur Transformation beliebiger klassischer mathematischer Funktionen in die Algorithmik der Fuzzy Logic zu definieren Diese Methodik wird als Erweiterungsprinzip bezeichnet Auf diese Weise ergeben sich f r das Und und das Oder durch Herleitung aus der Booleschen Algebra folgende Definitionen 21 Definition 3 4 Und Oder Sei A x W X xe X Jini a mit Aye P X Dann bezeichnet man als
65. ehen Ein Beispiel daf r w re Kategorie ist Auto Preis zwischen 2000 und 10 000 Leistung mindestens 100 PS 4 Kapitel 2 PIA Personal Information Assistent Auf diesen Begriffen aufsetzend wird nun das Objektmodell mit Hilfe eines UML Diagramms beschrieben Abbildung 2 1 Das PIA Objektmodell Die Sprachwahl ist Englisch und wird hier in Dualit t mit den entsprechenden deutschen Begriffen verwendet 2 2 Das PIA Objektmodell Actor name String e mail String details URL Customer BB rergewithiother Customer void has 1 Interest has ame String utOffS core float utOffSize int p OrLikeAggregationO perator Decision exportedAs URL Reien Item float structured into Alternative Bee float p AndLikeAggregationO perator BE orten Item float combines al I Maintainer L is responsible for 0 Catalog description URL consists of rem catalogID String details URL Provider 1 is responsible 0 E arcote Attribute Value D toString String 11 Abbildung 2 1 Das PIA Objektmodell has L A itari E espion URL ia ight
66. eht aus insgesamt f nf Modulen die zu einem zusammengefasst wurden Der Quellcode reduzierte sich so von ehedem 3000 Zeilen auf ca 1000 Dieser Effekt ist haupts chlich darauf zur ckzuf hren dass die Funktionalit t der Software auf zwei Anwendungsformen aufgeteilt wurde Die Funktion Client Abfragen beantworten zu k nnen wird mit dieser Version realisiert Da diese Version ausschlie lich von der CGI Anwendung per OLE gesteuert wird konnte auf die aufwendigen Window Handels verzichtet werden Die Administrationsfunktionen Maintainer hingegen werden von einer gesonderten Version realisiert die in 6 4 Administrationsinterface beschrieben wird Die Administrationsfunktionen Provider werden derzeit noch von dieser Schnittstelle miterledigt Wie im L sungsentwurf beschrieben ist aber eine CGI Schnittstelle zu den Tabellen der Datenbank w nschenswert um eine Fernwartung der Daten zu gew hrleisten Die Trennung gilt der Modularisierung der Software Die aufwendigen Editierfunktionen machen die Client Version langsam und un bersichtlich Da sie nur gelegentlich ben tigt werden wurden sie ausgegliedert Das verbleibende Modul tr gt den Namen Query und enth lt die Objekte die im Klassen Diagramm Abbildung 6 4 dargestellt sind Ihr Zusammenwirken wird in Abbildung 6 5 process_query Sequnence Diagramm Query dargestellt Zu sehen sind MS Access als Hauptklasse die sich in Module unterteilt die Prozeduren enthalten die ihrerseits in funk
67. eiber f r die Datenbank haben was die schnellste Verbindung darstellen w rde Die Daten k nnten aber auch auf einem entfernten Server im Internet liegen und ber eine CGlI Schnittstelle abfragbar sein Die Datenbank funktioniert in klassischer Weise Aus einer gestellten Anfrage Ich m chte einen billigen roten Opel Manta werden die SQL spezfischen scharfen Teile herausgefiltert Select from PIAl dbf where Kategorie Auto Fabrikat Opel Typ Manta Farbe rot Hierin sind verschiedene Ph nomene zu erkennen Die unscharfe Bedingung billig ist nicht in der Datenbank Anfrage enthalten Sie wird im AFR realisiert repr sentiert die Bereitstellung aller Attribute der Datens tze Sie werden ben tigt um den Datensatz im AFR bewerten zu k nnen Das ungel ste Problem der unscharfen Bewertung in hierarchischen Dom nen verlangt eine pr zise scharfe Formulierung der Anfrage Anstatt nach einem billigen roten Manta zu fragen muss die ganze Hierarchie angegeben werden Auto Opel Manta 5 1 1 5 Ablaufsteuerung Es verbleibt die Erw hnung eines ausf hrenden prozeduralen Moduls dem die Interpretation und Zerteilung der Eingangsquery obliegt die zeitliche Synchronisation der Datenbank Query mit dem Regler sowie der sequentiellen Zuf hrung der Daten an den Regler und der Aufbereitung des Ergebnisses Es handelt sich gewisserma en um die steuernde Hauptprozedur des Systems respektive die Funktionalit t eines Objekts
68. eichnen dass die Bedingungen der nichtnumerischen Dom nen unter allen Gewichten den h chsten Wert haben Insbesondere weisen alle Kriterien die nicht durch ein Gewicht abgeschw cht werden vor der Normierung intuitiv den Wert Eins als Gewicht auf Mathematisch stellt aber auch jeder andere h chste Wert die gleiche Funktionalit t dar F r die Berechnungen mit der lokalen Gewichtung m ssen zus tzlich zu den bisher gefundenen Zugeh rigkeitswerten MDgesamt und MDattematives noch die der einzelnen Kriterien berechnet werden um sie gewichten zu K nnen Die Randbedingungen dieses dritten Falls legen nahe die Zugeh rigkeitswerte der scharfen wie unscharfen Kriterien auf numerischen Dom nen im Fuzzy Regler zu evaluieren w hrend die Zugeh rigkeitswerte der nichtnumerischen Dom nen mit der Nachevaluierung ermittelt werden Die Query f r den Extraktionsfilter darf dieses mal aber nur mit den Kriterien initialisiert werden die den h chsten Gewichtswert innerhalb einer Alternative haben Durch die Randbedingungen ist gew hrleistet dass damit alle Kriterien auf nichtnumerischen Dom nen ermittelt werden k nnen und alle relevanten Datens tze betrachtet werden Sowohl in der Interpretation lokaler Gewichtung nach Fagin als auch in der Interpretation nach PIA ist n mlich die Nichterf lltheit eines der Kriterien mit der h chsten Gewichtung innerhalb einer Alternative ein Ausschlusskriterium wie sich leicht beweisen l sst In diesem dritten
69. eitsfunktion einer unscharfen Menge A bei einer speziellen Problemstellung kann grunds tzlich auf zwei unterschiedliche Arten erfolgen B087 In beiden F llen werden die Elemente xeX bez glich eines definierten unscharfen Kriteriums von einem Experten nach Zugeh rigkeit bewertet Abbildung 3 8 Konstruktion einer Zugeh rigkeitsfunktion aus kontinuierlichen Teilmengen 18 Kapitel 3 Stand der Technik Fuzzy D atenbanken 1 Ausgehend von einer scharfen Teilmenge A CX wird angenommen dass die Zugeh rigkeit der Randelemente zur Menge A geringer ist als die der Zentralelemente und die Randelemente eine Ausstrahlung ber die scharfen Grenzen hinaus auf au erhalb liegende Nachbarelemente besitzen Diese erhalten damit ebenfalls eine gewisse Zugeh rigkeit Zum Modellieren von Hatz kann zun chst ein Randniveau a festgelegt und der Verlauf von Hax mit Hilfe von bekannten und gesch tzten Systemeigenschaften modelliert werden Ausgehend von einer gesch tzten scharfen Menge A kann eine realistische Zugeh rigkeitsfunktion a x dadurch konstruiert werden dass Nachbarschaftsbeziehungen zwischen den einzelnen Elementen x den scharfen Kurvenverlauf deformieren Die Nachbarschaftsbeziehungen k nnen sich beispielsweise aus einem stochastischen Systemwissen als Wahrscheinlichkeitsverteilungen oder aus einer subjektiven Einsch tzung ergeben 2 Alle Elemente bzw Objekte xeX sind a priori bekannt Beispielsweise kennt man alle Einst
70. eitswerte Uniedrig 18 C 0 2 und Umitter 18 C 0 5 zu den Termen niedrig und mittel der Temperatur ermittelt Fuzzifikation Diese werden als resultierende Aktivierungsgrade der Regeln angesehen und zum Ausf llen der beiden Zugeh rigkeitsfunktionen Una offen P und Ufast offen P der dazugeh renden unscharfen Terme der K hlventil ffnung bernommen Maximumbildung Der endg ltige unscharfe Ausgangswert entsteht durch berlagerung der beiden Einzelergebnisse Minimumbildung Er wird durch eine unscharfe Ausgangsmenge repr sentiert aus der man den ben tigten Einstellwert gewinnt siehe 3 1 9 Defuzzifikation 4 Falls ein Aktivierungsgrad gleich Null ist sagt man auch dass die dazugeh rende Regel nicht feuert 15 1B TPC 50 elal IF Temperotur niedrig THEN K hlventil halb offen uly Temperatur mittel K hlventil fast offen 0 18 TPC 50 p 2 IF Temperotur mittel THEN Kihlventil fast offen Bildung des Fl chenschwerpunkts Abbildung 3 6 Max Min Inferenz Methode Das Verhalten eines unscharfen Reglers zur Einstellung der K hlventil ffnung Pays in Abh ngigkeit von einer gemessenen Temperatur Tgm wird durch zwei linguistisch formulierte Regeln festgelegt Bei einem Eingabewert von 18 C wird als Ausgabewert eine ffnung 9 70 eingestellt 3 1 9 Defuzzifikation Um aus den unscharfen Ausgangsmengen f r die einzelnen Stellgr en als Repr sentanten der unscharfen Schlussfolgerungen scharfe
71. elle und ausgedr ckt durch das exists der ersten Zeile die Bedingung der ersten Zeile wird nur auf diese Tabelle angewandt So m ssen die Zugeh rigkeitswerte der ersten Bedingung nur auf den relevanten Datens tzen ausgef hrt werden Weitere verbesserte Algorithmen dieser Art finden sich auch in Bo95 Dieser zweite Ansatz umgeht die beschriebenen Restriktionen deklarativer Sprachen da er in dem Fuzzy Datenbanksystem eine prozedurale Sprache kapselt c Da weder der erste noch der zweite dargestellte Ansatz im Rahmen dieser Arbeit zu einem befriedigenden Ergebnis f hrt bzw zu realisieren ist wird diesen beiden im Abschnitt L sungsentwurf eine dritte Architektur gegen bergestellt die ein Pre und ein Postprocessing der Query vorsieht Im Preprocessing wird die Anfrage in einen Fuzzy und einen Datenbank relevanten Teil zerlegt Dann werden die relevanten Daten ber ein SQL Query aus der Datenbank abgefragt und sequentiell im Postprocessing genannten Teil von einem Fuzzy Regler bewertet Der Fuzzy Regler wird mittels Importance Koeffizienten von den Fuzzy spezifischen Teilen der Query gesteuert adaptiver Regler Dieser Ansatz vereint den Vorteil der ersten Strategie mit Standard Datenbank Systemen arbeiten zu k nnen mit denen der zweiten komplexe Anfragen zu erm glichen Sein Nachteil ist der Verlust von Effizienz Zu deren Steigerung m sste die Datenbank Query mit dem adaptiven Regler interagieren was die Implementi
72. ellungen eines Systems um sie bewerten zu k nnen Nachbarschaftsbeziehungen in Form von Ausstrahlungsmodellen sind nicht gefordert Die Elemente liegen diskret vor p x 1 Abbildung 3 9 Konstruktion einer Zugeh rigkeitsfunktion aus diskreten Teilmengen Eine gro e beziehungsweise repr sentative Auswahl diskreter Elemente ist bekannt und kann direkt bewertet werden Falls die Bewertung von Zwischenwerten notwendig wird kann sie durch Interpolation erfolgen Die Erzeugung von Zugeh rigkeitsfunktionen hat sich als grundlegendes Problem der Fuzzy Logic herausgestellt und war deshalb Thema intensiver Forschungen Neben der Definition von Unsch rfe mittels Normalisierung wurde der Einsatz Neuronaler Netze als m glicher Ansatz zur Behebung dieses Problems gefunden Typische Ans tze benutzen RBNF s Radial Basis Network Functions deren Ausgangssignale durch Gau Glocken f rmige Funktionen erzeugt werden und sich leicht als Fuzzy Zugeh rigkeitsfunktionen deuten lassen Mittels Erzeugung eines Fehlersignals am Ausgang d h eines Soll Ist Wert Vergleichs kann das Neuronale Netz seine ggf zuf llig initialisierten Parameter korrigieren ohne die Interpretierbarkeit zu verlieren F r den Fall der Definition von Unsch rfe mittels Normalisierung der im vorliegenden Fall zun chst einmal n her liegt lie en sich verschiedene M glichkeiten der Autoaggregation der Normierungsparameter vorstellen die sich vermutlich auf statistische W
73. em Objektmodell von PIA stellt ein besonderes Problem dar weil in diesem Objektmodell keine Unterscheidung zwischen den Preisdom nen von verschiedenen Kategorien vorgesehen ist So lie en sich zun chst keine unterschiedlichen Minimalwerte f r Autopreise und Streichholzpreise definieren Diese Problematik wird in 5 3 Erweiterung des PIA Objektmodells weiter diskutiert 3 1 5 Modifikator Eine weitere M glichkeit die Unsch rfe technisch zu vereinheitlichen besteht in der Verwendung linguistischer Modifikatoren Mit der funktionalen Beschreibung von Begriffen wie sehr nicht so sehr oder hnlichen lassen sich bestehende Terme einheitlich erweitern Hierzu z hlt auch die Komplementbildung nicht ziemlich ziemlich folsch unentschieden wohr obsolut wahr absolut folsch Abbildung 3 4 Auswirkung Linguistischer Modifikatoren auf die Linguistische Variable wahr 12 Kapitel 3 Stand der Technik Fuzzy D atenbanken Beispiel 3 3 Ein m glicher syntaktischer Aufbau der linguistischen Variable Geschwindigkeit mit dem Prim rterm schnell dem Antonym langsam sowie einer Auswahl m glicher Modifikatoren Linguistische Variable Geschwindigkeit Linguistische Primarterm schnell Werte Terme Antonyms langsom Modifikator x sehr mehr koum nicht Abbildung 3 5 Syntaktischer Aufbau der Linguistischen Variablen Geschwindigkeit 3 1 6 Weitere Schl sselkonzepte am Beispiel ein
74. en der Zugeh rigkeitsfunktionen wie in einer 4x6 Matrix referenziert E ist das tte Element in der i ten Zeile Dabei sind leere Felder als Nullwerte zu sehen Auch diese werden mitgez hlt Die Bewertung muss so ausgelegt werden dass mit ihr folgende Konzepte realisiert werden k nnen Fuzzy Vale N Fuzzy Relation o Fuzzy Value Fuzzy Relation Ci And C Or Or C And G 1 FUZZIFIKATION Der Vorgang der Fuzzifikation bedeutet frei bersetzt Verunsch rfung In Wirklichkeit ist aber die Abbildung von Eingangswerten auf linguistische Variablen gemeint Es handelt sich also nicht um die Verringerung des Informationsgehalts eines Wertes wie der Name nahe legt sondern vielmehr um eine Erh hung Dieses r hrt daher dass das Wissen eines Experten um die Interpretation des Grundbereichs des Wertes in den Wert hinein projiziert wird So kann indirekt die Zugeh rigkeitsfunktion des Wertes zu verschiedenen Linguistischen Variablen ermittelt werden Als Beispiel seien die Elemente E3 und E4 betrachtet Es handelt sich hierbei insofern um eine vereinfachte Darstellung als dass nur die Projektion auf den relevanten Wert einer linguistischen Variable dargestellt ist KP ist hoch Au erdem scheint es als w re die Linguistische Variable LV hoch auf dem Grundbereich KP definiert w hrend sie sich tats chlich auf das Einheitsintervall bezieht 1 a Projektion auf das Einheitsintervall Die Projektion auf das Einheitsintervall
75. en und stattdessen beispielsweise Gau Glocken oder sigmoide Zugeh rigkeitsfunktionen verwenden die mit erheblich mehr Rechenaufwand verbunden w ren Nur mit ihrer Hilfe lassen sich geeignete Fehlersignale erzeugen Wirklich performant k nnte ein solches Verfahren derzeit wohl nur sein wenn es gel nge den Regler in seiner derzeitigen Form mit trapezf rmigen Zugeh rigkeitsfunktionen zu belassen und die Funktion der Neuronalen Netze nur im ANN und der Personalisierung zu realisieren Mittels der Gewichtung k nnen ja auch im gew hnlichen Regler inhibitorische Reize ausge bt werden Ein schwieriges Problem d rfte dabei aber die Nichtlinearit t der Abbildungen im Regler sein Trapezfunktionen da es nicht einfach ist durch diese Abbildung hindurch das Fehlersignal zu propagieren Der Lernalgorithmus k nnte in diesem Fall als nebenl ufiger Prozess realisiert werden der die Evaluierung einer Query nicht behindert Trotz der angesprochenen Performance Probleme vertreten im Bereich der Neuronalen Netze und der Fuzzy Logic viele Forscher die Meinung dass die eine Technik ohne die andere nicht so richtig Sinn mache So beklagen die einen die Schwierigkeit in der Praxis stimmige Zugeh rigkeitsfunktionen zu finden und die anderen ihre Netze seien semantisch eine Blackbox da niemand sagen k nne was ein Neuronales Netz genau macht und wieso es funktioniert Der Erfinder der Fuzzy Logic Lotfi Zadeh gr ndete unter anderem aus dieser Misere heraus
76. er Wertepaare x uA X mit A x WA Ix X a x R eine unscharfe Menge auf X mit der Zugeh rigkeitsfunktion ua x Die Menge X hei t Grundbereich oder Grundmenge von A Beispiel 3 6 Die Menge aller reellen Zahlen ungef hr gleich 8 l sst sich darstellen als A X Ha x Ha x 1 x ST Der Zugeh rigkeitsverlauf U x stellt sich dann nach Abbildung 3 7 dar 5 D h gem klassischem Ansatz wird nur der kleinste bzw gr te Wert f r das Ergebnis in Betracht gezogen 17 0 5 8 x Abbildung 3 7 Zugeh rigkeitsfunktion u x Funktion 1 x WW Die hier verwendete Funktion 1 x a J ist wegen verschiedener mathematischer Eigenschaften f r theoretische Betrachtungen in der Fuzzy Logic sehr beliebt zur Darstellung von Zugeh rigkeitsfunktionen In der Praxis haben sich jedoch allgemein die Trapez und die Dreiecksfunktion durchgesetzt Obwohl diese Funktionen augenscheinlich nicht so pr zise die weichen berg nge der Bewertungen beschreiben k nnen gen gen sie in einer Vielzahl der F lle zum Modellieren der Unsch rfe Sie zeichnen sich dadurch aus dass die vier Grundoperationen und sich ebenso leicht berechnen lassen wie der Vergleich zweier Fuzzy Sets Die Bedeutung der Trapezfunktionen in der Fuzzy Logic wird in der Literatur ausgiebig behandelt siehe KaZa97b S 42 3 2 2 Konstruktion von Zugeh rigkeitsfunktionen Die Vorgehensweise zur Festlegung der Zugeh rigk
77. erte st tzen w rden So k nnten etwa zur Ermittlung eines blichen H chstwerts wie er in 3 1 4 Definition von 19 Unsch rfe mittels Normalisierung beschrieben ist Mittelwert und Varianz Verwendung finden und mit dem tats chlichen H chstwert abgeglichen werden 3 2 3 Zwischenbilanz Fuzzy Logic Mit der Definition von Fuzzy Mengen Geschwindigkeit ist hoch und Fuzzy Relationen Geschwindigkeit ist ungef hr gleich 130 km h oder Breite ist ungef hr zwischen 10cm und 20cm sind die wesentlichen Konzepte zur Behandlung von atomaren Queries gegeben Anders formuliert k nnte man sagen es sei eine Abbildungsfunktion definiert um jedem Datensatz bei gegebener atomarer unscharfer Bedingung einen Matching Degree MD f Datensatz zuzuordnen Zur Auswertung dieser MDs wird zun chst noch die Funktion des a cuts beschrieben und eine erste einstellige Mengenoperation das Komplement eingef hrt Damit ist dann die Betrachtung atomarer MDs abgeschlossen Es folgen mehrstellige Mengenoperationen um aus den atomaren MDs zun chst lokale und dann globale MDs zu errechnen d h die MDs der Alternativen und Interessen zu ermitteln In diesem Zusammenhang sei die Anforderungsdefinition von PIA noch einmal angef hrt Queries in der ersten Normalform unter Verwendung von Gewichtung zu realisieren select lt list of fields gt from lt list of tables gt where cond and cond and and cond or or cond and cond and cond Zur
78. erung h herer Intelligenz erforderte als sie hier vorgesehen ist 29 d Als vierter Gesichtspunkt m glicher Systemarchitekturen sei noch die Software FfA erw hnt der wegen ihrer grunds tzlichen Bedeutung f r diese Arbeit ein eigenes Kapitel zugeteilt wurde welches an dieses anschlie t Die mit dieser Software durchgef hrte L sung l sst sich als eine Art Simulation der zweiten Strategie direct evaluation deuten Die Implementierung setzt auf dem bekannten Datenbanksystem Access von Microsoft auf Die vor dem User gekapselte prozedurale Sprache die die Fuzzy Funktionen evaluiert ist Visual Basic for Applications VBA Von Simulation des zweiten Ansatzes muss man insofern sprechen als dass die Prozeduren nicht direkt in der DBE realisiert werden sondern die Datens tze hnlich der dritten Strategie nach dem Auslesen nachbewertet werden Damit gibt diese L sung auch die Vorteile der zweiten Architektur Preis eine hohe Effizienz zu gew hrleisten 3 4 Zusammenfassung Stand der Technik In diesem Kapitel wurden eine Vielzahl von M glichkeiten und Ans tzen aus der bisherigen Forschung dargestellt Es hat sich einerseits gezeigt dass die Fuzzy Logic aus dem Stadium eines sich erst entwickelnden Forschungsgebiets in die allt gliche Anwendung bergegangen ist Andererseits wurde sie offensichtlich vor gut zehn Jahren als Grundlage f r intelligente Datenbankzugriffe entdeckt Seitdem sind einige Forschungsaktivit ten zu ve
79. ervall 35 Fuzzy quantifiers a q Fuzzy quantifier Graph refreshing strategy Most Any change 1 5 Record change x i Refresh button push F 0 10 20 par2 Max Fuzzy 0 0 001 MIN Fuzzy 9 99 10 Most 5 8 E Datensatz ata 6 gt ri gt von 7 Abbildung 4 2 Fuzzy Quantifier most b Quantifier fiir Interessen Auf der Ebene der Gesamt Query findet sich dagegen folgendes Es gibt eine Reihe von Subqueries die Oder verkniipft sind Subqueryl oder Subquery2 oder Die MDs der einzelnen Subqueries werden nun aber nicht wie ohne Quantifier blich gem der Definition der Oder Bedingung zu einem Gesamt MD durch Maximumbildung verkniipft sondern zu ihrem arithmetischen Mittel Der Gesamt MD wird wie oben angegeben daraus mit der Zugeh rigkeitsfunktion des Fuzzy Quantifiers bewertet Dieser Konsistenzbruch durch Umdefinieren der Fuzzy Oder Funktion wird im Abschnitt tiber die OWA Operatoren noch n her erl utert Es sei allerdings schon hier auf Abschnitt 3 2 6 Verkn pfungsoperatoren zur ckverwiesen in der verschiedene Formen von Fuzzy Oder mit Hilfe des kompensatorischen Und s erl utert wurden Gem den dort gemachten Erl uterungen sind beide Formen des Oder s zul ssig lt Fuzzy importance coefficient gt c Wenn man verschiedene Subconditions Oder verkn pft in denen man beispielsweise zum Ausdruck bringt dass man ein besonderes Auto f r viel Geld kaufen m ch
80. es Reglers Will man die im Grunde geschichtlich scheinbar artfremden Disziplinen objektorientierter Programmierung und der Fuzzy Logic einander n her bringen so lie e sich an dieser Stelle res mieren dass mit den oben genannten Begriffen die Klassen der Fuzzy Logic beschrieben sind die Einf hrung ihrer Methoden aber noch aussteht Dies soll nun an einem regelungstechnischen Beispiel geschehen Nicht dass die hier zu l sende Aufgabe einen direkt regelungstechnischen Hintergrund h tte die Motivation hierf r r hrt eher daher dass die Regelungstechnik die Haupttriebfeder der Fuzzy Logic war und daher f r die Beschreibung der Fuzzy Logic Methoden besonders geeignet ist und im brigen die ganze Fuzzy Logic an sich auf der Anwendung von Fuzzy Reglern beruht Also wird auch hier versucht Fuzzy Logic Abfragen auf Datenbanken als regelungstechnische Aufgabe zu interpretieren Nenne alle Datenbank Eintr ge die schnelle Autos betreffen erzeugt einen Vorgang in dem alle Datenbank Eintr ge mit dem Attribut Objektart Auto ermittelt werden Deren Wert der Dom ne H chstgeschwindigkeit wird als Eingangssignal an einen Regler gelegt der ausgangsseitig den Zugeh rigkeitswert zur Linguistische Variablen schnell als Stellwert liefert Man sagt in dem Regler sei die Regel Wenn maximale Geschwindigkeit ist hoch dann Interesse ist hoch implementiert Wir erhalten damit drei m gliche Darstellungen f r die Beispielbedingung Nat
81. esesseseeseseese 66 Abbildung 5 9 Das EE 67 Abbildung 6 1 main class diagramm una eunoemiern 68 Abbildung 6 2 start Ouer sequence diagramm e sssssseesesseseesesseseesesetseesessesesseseseeseseesessesets 69 Abbildung 6 3 Html Query s ssesseessseeseseseesesseseesessesessessestssesesessestesessestesessesetsesseseesesseseesesseset 71 Abbildung 6 4 ffa Class Diagramm Ouer 74 Abbildung 6 5 process_query Sequnence Diagramm Ouer 75 84 Anhang A5 FfA97 Erweiterungen Die in 4 4 FfA97 Erweiterungen angef hrten in dieser Arbeit nicht verwendeten funktionalen Erweiterungen von FfA97 werden in der Online Hilfe wie folgt in englischer Sprache beschrieben A2 1 Fuzzy set constants Fuzzy set constant represents in a query the user s requirement as to the value of a single valued attribute or a multi valued attribute Its use may be exemplified in the following atomic conditions 1 1 COUNTRY In 1 0 Bulgaria 2 COUNTRY In 1 0 Belarus 1 0 Russia 1 0 Ukraine 3 3 COUNTRY In 1 0 CzechRepublic 1 0 Hungary 1 0 Poland 1 0 Slovakia 0 8 Belarus 0 8 Ukraine where COUNTRY is a field from a table The user looking for a customer from Bulgaria only will employ the first condition If a few countries are relevant the second condition may be relevant Finally if the choice of a customer s country of origin refers to a vague concept like e g the Central Europe or the developing countries the third f
82. ftung von Messungen wie sie in der Fehlerabsch tzung der Messtechnik theoretisch behandelt ist und ber cksichtigt eine subjektive bzw objektive Vorabbewertung der Toleranzintervalle Dieses Vorgehen ist dann sinnvoll wenn beispielsweise aus Kostengr nden relativ ungenaue Messwertaufnehmer oder A D Umsetzer gew hlt werden Im Falle eines Datensatzes einer Datenbank als Eingangswert entspricht dieses Vorgehen einem unscharf abgespeicherten Datensatz Dies kann sowohl explizit VB 1000 oder Fahrzeug ist schnell geschehen als auch implizit T V bis 2003 oder Marke BMW ohne Angabe des Typs 14 Kapitel 3 Stand der Technik Fuzzy D atenbanken 3 1 8 Approximatives Schlie en Mit Hilfe von Linguistischen Variablen werden zur Beschreibung des Systemverhalten eine Reihe von Aussagen getroffen die f r bestimmte Eingangskombinationen die dazugeh rigen Ausgangswertkombinationen in Form von IF THEN Regeln festlegen Es seien u und v zwei linguistische Variablen z B Geschwindigkeit Ankerstrom eines Elektrofahrzeugs a und b deren Terme z B gro und recht klein Dann k nnen die linguistisch formulierten Regeln zur Systembeschreibung auf folgende Art auch durch Implikationen u a gt v b beschrieben werden p uista q v ist b IF p THEN q u a gt v b modus ponens Einen anderen Ansatz mit gleichem Ergebnis verfolgen die modifizierten Horn Klauseln Diese k nnen zu Implementie
83. g die durch die bliche Maximumbildung realisiert sei und einer angenommenen Standard Gewichtung von 1 keine Normierung 0 1 wie bei Fagin 24 Kapitel 3 Stand der Technik Fuzzy D atenbanken bedeutet jede Gewichtung die kleiner als dieser Wert ist eine Abschw chung der Bedeutung dieser Bedingung siehe Abbildung 3 10 So kann aus der einfachen Oder Funktion Oder M Umax 0 1 0 1 mit M u ist ein Vektor von Zugeh rigkeitswerten mittels der linearen Funktion u 8 H die Oder Funktion f r gewichtete Bedingungen abgeleitet werden Oder Mira Li max WU i max 0 1 0 1 Abbildung 3 10 Gewichtung f r Oder Verkn pfungen Im Falle einer Und Verkn pfung dagegen die durch die bliche Minimumbildung realisiert sei soll aus der Nichterf lltheit unwichtiger Einzelbedingungen nicht auf die Nichterf lltheit der Komposition geschlossen werden siehe Abbildung 3 11 Insbesondere soll ein Element der Gewichtung 0 immer die Zugeh rigkeit 1 haben um im Rahmen der Minimumbildung nicht zur Bestimmung der L sungsmenge beizutragen w hrend ein Element der Gewichtung 1 immer auf seine reale Zugeh rigkeit abgebildet werden soll F r Zwischenwerte der Gewichtung soll die Erf lltheit der Bedingung zur 1 hingezogen werden um im Sinne des Und unwichtiger zu werden So wird aus der einfachen Minimum Bildung ungewichteter Bedingungen Und M Umin 0 1 7 0 1 mittel
84. gen Als Eindruck f r die Problemstellung m ge man sich den Bewertungsmechanismus vorstellen der notwendig ist um folgende Anfrage zu beantworten Ich suche einen schnellen Computer der nicht zu teuer ist Dabei gehe man davon aus dass in der zu durchsuchenden Datenbank nicht etwa Aussagen wie Geschwindigkeit ist hoch sondern CPU Takt 266MHz getroffen werden Im Informationszeitalter ist die technische Verarbeitung von Wissen zur wesentlichen Aufgabe geworden Wissen wird aus seiner urspr nglichen Umgebung dem menschlichen Gehirn heraus gel st und immer weiter zur Maschine hin verlagert Ged chtnisforscher haben drei Phasen des Vergessens in der Menschheitsgeschichte ausgemacht Die Erfindung der Schrift des Buchdrucks und des Computers Mit jedem Schritt verlagerte sich die T tigkeit des Gehirns mehr in Richtung Informationsverkn pfung und weg von der Informationshaltung Mit fortschreitender Komplexit t der Informationssysteme muss auch die T tigkeit der Informationsaufbereitung immer mehr in die Maschine verlagert werden da der menschliche Geist nicht nur mit dem Vorhalten der Informationen berfordert ist nein er kann sie auch nicht mehr vollst ndig berblicken und ihre Relevanz bewerten Eigens hierzu hat sich die neue Disziplin des Data Minings entwickelt Ein lterer Ansatz ist der des Decision Makings aus der Disziplin der K nstlichen Intelligenz KI engl AI Heute werden diese Ans tze in der Dis
85. gin s Formel bei der Interpretation des Und eine getrennte Behandlung von Modifikatoren und Gewichtung erfolgen muss Somit erg be sich eine in solcher Weise komplexe Abbildung AND Bew dass sie nicht gewinnbringend erscheint F r den PIA Ansatz hingegen bedeutet sie einen erheblichen Vorteil gegen ber Variante a Bew wird n mlich direkt von der RAE erzeugt und m sste f r Version a extra in Io und mod getrennt werden MD iternative AND Bew LV x 4 c Berechnung von Alternative score mit Modifikatoren in der Fuzzifikation Da die Behandlung der Modifikatoren innerhalb des AFR s einigen Aufwand bedeutet soll noch die Bereitstellung aller linguistisch bewerteten und modifizierten Eingangswerte betrachtet werden Diese werden dann w hrend der Fuzzifizierung berechnet vgl Abbildung 5 3 Signalverarbeitung AFR e 3 Damit erh ht die Zahl der zu betrachtenden Werte zun chst um den Faktor 2 f r die Bereitstellung aller Komplemente und zus tzlich noch um den Faktor der Anzahl aller weiteren Modifikatoren mit Dim mod ist die Anzahl aller definierten Modifikatoren Dies kann je nach erlaubter Komplexit t der einzelnen Kriterien und der Anfrage einen erheblichen Rechenaufwand vor allen Dingen auch in der Weiterbehandlung der Werte bedeuten Die Berechnung von Alternative score vereinfacht sich damit im Gegenzug zu MD 4iternative ANDragin iok gt LV x s nach Fagin 5a MD yiternative ANDy heat LV x
86. hat zwei Auspr gungen unterschiedlicher Komplexit t 54 Kapitel 5 Losungsentwurf Projektion zur Evaluierung von Fuzzy Values In diesem Fall m ssen die anliegenden Eingangssignale durch eine einfache lineare Transformation auf das Einheitsintervall projiziert werden Fiir diese Normierung werden die Parameter cUL common upper limit und cLL common lower limit verwendet die dem Grundbereich des Wertes zugeordnet sind Projektion zur Evaluierung von extended Fuzzy Relations Um Fuzzy Relations bewerten zu k nnen reicht diese einfache Projektion nicht da die Normierung vom zweiten und dritten Parameter der Relation abh ngig ist und von dessen deren Grundbereich Siehe FFA Fuzzy Relation Da innerhalb eines Interesses mehrere Kriterien Relationen mit unterschiedlichen Parametern auf dem gleichen Datum beschreiben k nnen muss f r jede dieser Relationen ein Eingang am Regler vorgesehen werden an dem als Signal die spezifische Projektion f r diese spezielle Relation anliegt Diesen Darstellungen folgend muss jedes Datum eines Datensatzes einmal in seiner Eigenschaft als Grundlage f r die Fuzzy Values normiert werden Au erdem ist eine Normierung vorzusehen f r jede im Interesse angef hrte Relation es sei denn der sekund re bzw sekund re und terti re Parameter erweiterte Relation mehrerer Relationen ist identisch dann werden diese Relationen von einer Projektion befriedigt Im vorrausgegangenen Abschnitt Vorbereitu
87. hrt wurde aus Performancegr nden und wegen der gegebenen Funktionalit t die Administrationsoberfl che von FFA97WWW als Realisierungsgrundlage f r die Verwaltung der Fuzzy Funktionen verwendet Da auf den Quellcode dieser Version nicht zugegriffen werden Konnte greift die f r PIA modifizierte Version von FfA20 auf die Tabellen dieses Add 76 Kapitel 6 Ergebnis In s zu anstatt wie es performanter gewesen w re FfA97 auf die Tabellen von FfA20 zugreifen zu lassen Um die Editierfunktionen zu nutzen wird FfA97 als Access DB ge ffnet Wenn man nun das Formular Toolbarl ausw hlt stehen einem die in 4 3 FfA Toolbar beschriebenen M glichkeiten zur Verf gung um die Parameter der verschiedenen Fuzzy Funktionen zu editieren 6 5 Zusammenfassung Das hier dargestellte Ergebnis der prototypischen Implementation erm glich mit Hilfe des Webservers des Web Formulars der Applikation c2a exe der OLE f higen Datenbank und des AddIns den unscharfen Zugriff auf numerische Datenbanken und das Editieren der steuernden Parameter Um den Prototyp zu nutzen wird lediglich die dieser Arbeit beigef gte CD ben tigt sowie MS Access in der Version 97 oder 2000 Alle Konfigurationsdateien lassen sich mit gew hnlichen Texteditoren bearbeiten Die Applikation l sst sich f r andere Datenbanken mittels Access anpassen Lediglich f r den Fall funktionaler nderungen der Schnittstelle c2a exe wird zus tzlich eine Version von Borlands Delphi ben
88. iduelle Bewertungen der Ergebnismenge und erf llt somit auch Personalisierungsanforderungen Als theoretischer Systementwurf ist es jedoch von einer konkreten Implementierung weit entfernt Das sechste Kapitel befasst sich mit dem im Rahmen dieser Arbeit realisierbaren Prototypen der die FfA Implementierung erweitert und korrigiert Das Ergebnis ist eine Software die von beliebigen Clients ber das http Protokoll angesprochen werden kann berschaubar und damit wartbar ist Implementierungsfehler des Originals korrigiert notwendige Erg nzungen enth lt und schlie lich auch den Anforderungen des PIA Objektmodells gerecht wird Abschlie end findet sich eine Zusammenfassung mit Ausblicken auf m gliche weiterf hrende Untersuchungen zu dem Thema dieser Arbeit Mit den gesteckten Zielen r ckt diese Arbeit ins Umfeld der viel gescholtenen K nstlichen Intelligenz die in der Vergangenheit viele ihrer selbstbesteckten Ziele nicht erreichen konnte Um solcher Art Entt uschungen vorzubeugen ist es kl ger sich schon im Vorfeld von diesem Anspruch zu distanzieren und sich selbst einer nicht weniger ehrgeizigen Disziplin zuzuordnen K nstliche Dummheit KD kann als der Versuch von Computerwissenschaftlern angesehen werden Computerprogramme zu entwerfen die in der Lage sind die Art von Problemen zu erzeugen die normalerweise in der menschlichen Denkweise begr ndet sind Wallace Marshal Journal of Irreproducible Results 1987 in Ku93 In
89. ieser Technik lassen sich Zuordnungen finden f r die Bedingung schnelles Auto oder auch graduelle Zugeh rigkeiten zu rotes Bild oder phonetischen hnlichkeiten in Worten Um Fuzzy Logic und Datenbanken in einem System zu vereinen m ssen die dazu n tigen Konzepte theoretisch untersucht werden Au erdem soll ein ideales System entworfen werden und zum Zwecke der Evaluation ausgew hlter Methoden eine prototypische Implementierung vorgelegt werden Bei der Behandlung dieser Aufgabe ist dem vorliegenden Objektmodell und den bergreifenden Projektanforderungen Rechnung zu tragen wie beispielsweise der Anforderung durch User Feedback das System weiterentwickeln zu k nnen Abschlie end sei der renommierte Forscher Marvin Minsky zitiert in Ku93 der auf einem Kongress zu seinen Kollegen aus einer fiktiven Zukunft sprach K nnen sie sich vorstellen dass es damals Bibliotheken gab in denen sich die B cher nicht miteinander unterhielten Diesem Ziel autointelligenter Datenhaltung hat sich auch diese Arbeit verschrieben Kapitel 2 PIA Die Anwendung elektronischer Massenmedien wie Internet und CD ROMs setzt sich zunehmend bei der Kommunikation zwischen Anbietern und Konsumenten von Dienstleistungen und Produkten durch Im bergang zwischen einem pers nlichen Beratungsgespr ch mit dem Kunden und der anonymen Informationsaufbereitung gegen ber einem Interessenten an einem Computer entsteht dabei eine L
90. in als eine m gliche Auspr gung eines solchen Systems Einleitend l sst sich hierzu feststellen dass sich im Rahmen des PIA Projekts keine Eigenentwicklung einer leistungsf higen FDBE wird realisieren lassen Deshalb muss das anvisierte FDBMS auf einer existierenden DBE aufsetzen und die dort mit scharfen Bedingungen abgefragten Datens tze selbst mit einem MD bewerten Diese Bewertung wird aus Gr nden der Anschaulichkeit mit einem Fuzzy Regler modelliert Das Konzept sieht also vor ein Standard DBMS als Datenquelle zu verwenden und die Datens tze gem ihrer Zugeh rigkeit zur Query zu bewerten Diese Bewertung geschieht mit Hilfe eines adaptiven Fuzzy Reglers AFR s u der von der Query gesteuert wird Dieser Entwurf bietet als weiteren Vorteil die M glichkeit in einer beliebigen Sprache implementiert werden zu K nnen insbesondere der in der PIA implementiert wird JAVA Er ben tigt auch keine Spracherweiterungen der SQL Syntax da die Fuzzy Funktionen s mtlich au erhalb des DBMS s realisiert werden Die SQL Query f r die Datenbankabfrage kannn aus der frei definierbaren Erscheinungsform gem Objektmodell generiert werden Au erdem wei t er eine hohe Modularit t auf so dass er in Teilschritten und f r den Fall wohldefinierter Schnittstellen auch von verschiedenen Personen realisiert werden kann Die Beantwortung einer unscharfen Query in allgemeiner Form erweist sich dabei in einer solchen Weise als komplex dass d
91. ind aber in der f r den Prototypen genutzten Software implementiert Au erdem stellen sie die bliche L sung dar um Gewichtungen zu unterscheiden Allgemein l sst sich schreiben Qy ssind F mit Q als Linguistic Quantifier z B die meisten Y y als Menge von Objekten z B Experten und F als Eigenschaft z B befragt worden Der gleiche Sachverhalt l sst sich noch mit einer Gewichtung Importance belegen Q Imp y s sind F In diesem Fall l sst sich eine Regel Bedingung wie Die meisten der wichtigen Experten sind befragt worden modellieren Quantifier nach Zadeh Der erste praktikable Weg mit Quantifiern umzugehen wurde von Zadeh beschrieben Za83 Der Einfachheit halber und weil sein Ansatz nur ein Schritt auf dem Weg zu einem anderen f r diese Arbeit wichtigen Ziel ist sei sein Ansatz nur mit Beispielen erl utert Er definierte 4 f r u gt 0 8 Umos 4 2u 0 6 f r 0 3 lt u lt 08 1 Lo f r u lt 0 3 Man erkennt hierin die Abbildung RI R eines Zugeh rigkeitswertes auf einen anderen Es wird gewisserma en die Erf lltheit einer Erf lltheit bewertet Dabei kann die zu bewertende Erf lltheit eine Komposition von Zugeh rigkeitswerten sein die besonders dann Sinn macht wenn ein nicht hartes Und eingesetzt wird F r den Fall vorhandener Gewichtung ist die Berechnungsgrundlage deutlich komplizierter Hier definierte Zadeh zun chst eine Nicht Fuzzy Kardinalit t ein sogenanntes sigma
92. it 1986 zur ckblicken kann Die einzelnen Entwicklungsstufen werden unter dem Dach der FQUERY Familie zusammengefasst Zun chst entstand eine Folge von dBASE basierten DBMSs FQUERY I bis Version M In den letzten Jahren dagegen konzentriert man sich am Institut ganz auf die Entwicklung in der Access Umgebung FQUERY for Access v l v 2 97WWW Dabei sprechen f r die Verwendung dieser verbreiteten Software verschiedene Aspekte In dem Artikel wird die offene Architektur und die einfache Implementierbarkeit des FfA Tools als Add In 4 2 3 Add In genannt Sicherlich ist aber auch die Verbreitung von Access und der Programmiersprache Visual Basic for Applications VBA ein wichtiger Aspekt der der Fortentwicklung der Software dienlich ist wie diese Arbeit zeigt Au erdem zeichnet sich Access mit dem Quasi Standard ODBC als offenes System aus ber diese Schnittstelle kann Access auf eine Vielzahl g ngiger Datenbanksysteme zugreifen Die enge Bindung der systeminternen prozeduralen Sprache VBA an die Datenbanksprache SQL tut ein briges hinzu Um die von der FQUERY Familie angestrebten Fuzzy Elemente unterst tzen zu k nnen m ssen im wesentlichen drei Dinge vorgehalten werden 1 Es muss eine Fuzzy Syntax definiert werden die in die bestehende SQL Sprachstruktur eingebunden werden kann 2 Die so entstandenen Fuzzy Objekte m ssen leicht editierbar sein d h es muss eine entsprechende Schnittstelle implementiert werden 3 Der Syntax
93. l Ban int Domain Z String han String escription URL Bewvaleis String Value Bert Item a Attribute args Value float 7 Da OF 1 a is defined on Value u Bos tring String b Nas as arguments Abbildung 2 2 Das PIA Dom nenmodell Kapitel 2 PIA Personal Information Assistent Umrechnungsfunktionen fangen dabei m gliche unterschiedliche Skalierungen ab m s versus km h Typische sprachliche Ungenauigkeiten wie schneller Prozessor lassen sich durch Pr zisierungen wie Prozessor Taktgeschwindigkeit ist hoch abfangen Ein ungel stes Problem hingegen stellt die Gleichbehandlung aller Items mit beispielsweise dem Attribut der numerischen Dom ne Preis dar So muss sich derzeit ein Gebrauchtwagen f r 1000 gefallen lassen als teuer bezeichnet zu werden da sein Preis der gleichen Dom ne entstammt wie der eines Bleistifts Diese Problematik wird in 5 3 Erweiterung des PIA Objektmodells noch n her erl utert Das Problem r hrt daher dass Pr dikate in diesem Modell auf Dom nen skalar hierarchisch definiert sind und nicht auf den Attributen einzelner Dom nen Um diesem Modell zu gen gen m ssen Pr dikate h heren Grades definiert werden Linguistic Value teuer Un re Funktion teuer hoch Preis bin re Funktion teuer hoch Preis Auto Dieses Prinzip wird in 5 3 Erweiterung des PIA Objektmodells noch in einer formal stre
94. l in the case of the former one while various types of compatibility operators may be employed in the case of the latter Both types of attributes may be exemplified by Country and Main_products_purchased 86 Anhang fields in a fictitious database of a trading company respectively In case of the former one a fuzzy set may be used in a corresponding atomic condition of a query as e g in Find customers from Central Europe what may be written using FQUERYs for Access extended SQL syntax as follows COUNTRY FfA_FS Central Europe assuming a fuzzy set constant Central Europe is defined by the user In case of the latter one a fuzzy set may be used in a query as well as in a record as a value of the attribute The value of such an attribute will be a list of relevant products The direct use of such types of data is inconsistent with the relational database paradigm Still such an attribute may exist in the user s view of the database even if the real arrangement of the data is different In the original database scheme a list of fields corresponds to such an virtual multi valued attribute Each of this fields is of logical or real type corresponding to the characteristic function of a crisp set or the membership function of a fuzzy set respectively The matching degree for an atomic condition involving a single valued attribute AT and a fuzzy set FS is calculated for each record in a straightforward manner as the value of the membe
95. le mit den relevanten Datens tzen stellt zwar alle f r die Ermittlung des Gesamt MDs wichtigen Informationen dar l sst aber bereits gefundene Zugeh rigkeiten des booleschen Raumes wieder fallen indem sie einzig den kumulierten Wert Eins f r die Gesamtzugeh rigkeit der scharfen Bedingungen wiedergibt So geht durch die Oder Verkn pfung die Information verloren welche der Alternativen erf llt war Da man diese Information nicht hat kann man nicht darauf schlie en welche der Alternativen vollst ndig erf llt wurden In diesem ersten Fall scheint es daher angebracht auf den ermittelten relevanten Datens tzen eine weitere Query zu evaluieren die die einzelnen Alternativen als Bedingung hat und ihre Erf lltheit in je einer zus tzlichen Spalte vorh lt Nachevaluierung Dieser Wert stellt dann 51 dem AFR die Information zur Verfiigung ob alle scharfen numerischen Bedingungen und die Volltext und hierarchischen Bedingungen der jeweiligen Alternative f r diesen Datensatz erf llt sind oder nicht Wie der AFR diese Information verarbeiten kann wird im n chsten Abschnitt erl utert Queries mit globaler Gewichtung In diesem Fall kann wie unter 1 verfahren werden da die f r die Gewichtung wichtigen Zugeh rigkeitswerte durch diese Verfahren f r alle gewichteten Gr en bekannt sind Queries mit globaler Gewichtung und lokaler Gewichtung auf numerischen Dom nen Die Aussage lokaler Gewichtung auf numerischen Dom nen m ge bez
96. lems mittels deklarariver K onstrukte Prozeduren auszuf hren 8 Die technische KI wie sie sich in den Ingenieurswissenschaften findet besch ftigt sich schwerpunktm ig mit der Optimierung von Suchalgorithmen in komplexen Losungsraumen 27 a Der Name der derivation engl Ursprung Strategie r hrt wohl daher dass hierbei die Fuzzy Query auf eine Standard Datenbank Query zur ckgef hrt wird Das genaue Vorgehen ist leider nicht angef hrt Statt dessen wird auf BoPi93 verwiesen Da sich aber die angef hrten Beschr nkungen nicht mit den f r diese Arbeit gestellten Anforderungen decken gen gt hier die angegebene Zusammenfassung des Artikels user fuzzy query query transformation database management system results A cut Abbildung 3 12 Architekturmodell Derivation Die Architektur der Strategie wird in Abbildung 3 12 beschrieben Die Fuzzy Query wird mittels query transformation auf eine gew hnliche SQL Query abgebildet Dabei wird gefordert dass die Query einen A cut enthalte Kern dieser L sung scheint die Implementierung eines nicht n her spezifizierten komplexen Pr dikats zu sein dass die Berechnung des A cuts vornimmt Es handelt sich dabei vermutlich um eine stored procedure im DBMS Als Einschr nkung dieses Systems wird angegeben es seien damit weder komplex verschachtelte Abfragen m glich noch die Verwendung von Linguistic Quantifiers die im PIA Sy
97. lerweile kombinierbarer Fallunterscheidungen wurden folgende zur kompakten Darstellung des vollst ndigen AFR s ausgew hlt 6a Interest score mit Faginscher Interpretation bei impliziten Modifikatoren 6b Dito mit PIA Interpretation Man beachte dass es sich hierbei um eine quasi lineare Verkettung handelt 6 Interest score 0 B d A MD interest Fagin ORp in UA gt ANDragindiok LV x 6a MD interest PIA OR I glob e AND iok e LV x 6b MD interest SS OR Fa AND Nok gt mod LV x 6 mit L 0 1 als Vektor der globalen Gewichtung mit der den einzelnen Alternativen Gewichtung zugeordnet wird ORO 0 1 0 1 als Realisation des Oder s OR 0 1 0 1 als Importance f hige Realisation des Oder s und MD interest Interest score 0 1 ist Zugeh rigkeitswert des Interesses Auch hier ist darauf zu achten dass im konkreten Fall die Interpretation des Oder s gekennzeichnet werden muss etwa ORpagin max 4 REKURSIVE PROZESSE F r den Fall dass man einen aus einer Verkn pfung gewonnenen Wert als Attribute nutzen m chte Beispiel Ich m chte ein Billigauto wenn der Kaufpreis sehr niedrig ist ben tigt man rekursive Prozesse In diesen kann man zun chst den Wert verkn pfter Attribute ermitteln und diesen dann wiederum als Eingangssignal des Reglers nutzen Siehe Abbildung 5 3 Signalverarbeitung AFR Dabei ist der Unterschied zum bisherigen Vorgehen d
98. likation ist es die FfA Software in ihrer MS Access Umgebung zug nglich zu machen Der Webserver Sambar bekommt die Query in Form von Post Parametern Diese werden gem der WIN CGI Spezifikation in einer tempor ren Ini Dateien abgelegt Daraufhin wird c2a exe mit drei Kommandozeilen Parametern aufgerufen die Verweise auf tempor re Dateien sind Dies sind die erw hnte Ini Datei eine Datei mit den Parametern im Get Format und eine Datei die zur Ergebnisausgabe vorgesehen ist Diese wird vom Webserver beobachtet Tritt ein Schlie en Ereignis auf ihr auf so wird sie als Ergebnis an den fragenden Client gesandt Um mit den beschriebenen Konzepten auf eine Formularanfrage mit einer html Seite zu reagieren m ssen verschiedene Funktionen implementiert werden e bernahme der Kommandozeilen Parameter Auslesen der Ini Datei bersetzung der Formularparameter in das FfA eigene SQL FQUERY Ergebnistabelle gem Query errechnen Ergebnistabelle als html Datei formatieren 72 Kapitel 6 Ergebnis e Ergebnis unter dem spezifischen Dateinamen speichern Das Access eigene Visual Basic erweist sich fiir diese Aufgabe als ungeeignet Es kann beispielsweise keine Kommandozeilen Parameter bernehmen und enth lt auch keine Methoden die der Syntax von Windows Ini Dateien Rechnung tragen Zur Steuerung der Abfrage wurde daher Delphi gew hlt Das FfA Access Modul wird als OLE Prozess angesprochen Das Programm besteht aus Initialisierung Query und Umge
99. lt und die Items nach MD und weiteren Kriterien sortiert werden Im Sinne einer verteilten Anwendung bieten sich zur Kommunikation der Application Objekte CGil Interfaces nach dem Beispiel der Internet Architekturen an wie sie in der prototypischen Realisation beschrieben sind oder aber andere Architekturen f r verteilte Anwendungen wie CORBA COM oder OLE Die bisher vorgesehen Form einer Condition sei mit folgendem Beispiel repr sentiert es handelt sich um eine einfache Folge Und verkn pfter Kriterien denen eine importance zugeordnet ist product category is car normal performance is very high normal comfort is not too low normal lifetime is high important 5 2 2 Administrationsschnittstelle Die Administrationsschnittstelle bezieht sich gem dem PIA Objektmodell auf den Maintainer und den Provider Dem Provider muss wegen der verteilten Struktur eine externe Schnittstelle zur Verf gung gestellt werden um seinen Datenbestand pflegen zu k nnen Hier bietet sich wiederum die Einrichtung eines CGl Interfaces an mit dem der Provider auf seine Daten zugreifen kann Hinzuf gen Entfernen und Editieren Dem Maintainer dagegen wird eine einfaches Interface innerhalb der Applikation gen gen da 1 A davon ausgegangen werden kann dass er ohne Einschr nkung etwaiger Sicherheitsanforderungen an das System einen direkten Zugriff auf das System haben kann Ihm obliegt mit den gegebenen Erweiterungen insbesondere auch die
100. m oder einem speziellen Interesse wie Gef llt mir das Auto dass ich dort sehe beantwortet unser Gehirn gem zeitgem er Theorien ber gedankliche Abl ufe indem es zun chst das Wahrgenommene mittels Spiegelneuronen auf die sogenannte Theaterebene im Gehirn abbildet Unser Gehirn macht sich gewisserma en ein Bild von den Gegebenheiten gem bisheriger Erfahrungen Dies entspricht der Ausl sung und Formulierung eines Wunsches oder Gedankens durch u ere und innere Reize Die zur ckliegenden Erfahrungen unseres Lebens entsprechen der Implementation von vorhandenem Expertenwissen in unserem FDBMS und den Lernerfolgen des ANN s Die Modellbildung und implementation Anlegen der Datenbank Implementierung der Fuzzy Methoden die Einspeisung bekannten Wissens Daten und Regeln und das Lernen mit dem Neuronalen Netz 47 Die Anfrage wird mit einer Suche im L sungsraum Menge aller m glichen Datens tze realisiert Die Daten werden vorselektiert ausgeschlossene Datens tze nicht beachtet Die relevanten Datens tze werden nach Zugeh rigkeit bewertet Wenn gr n dann Gefallen ist gro und linguistisch oder gedanklich bewertet Gef llt mir recht gut An dieser Stelle tritt ein kleiner Bruch auf da Gef llt mir recht gut deutlich unsch rfer ist als der von unserem System gefundene Gesamt Zugeh rigkeitswert des Interesses Gleichwohl ist die linguistische Formulierung ungleich aussagekr ftiger als
101. n 1 x 9 18 Abbildung 3 8 Konstruktion einer Zugeh rigkeitsfunktion aus kontinuierlichen Teilmengen 18 Abbildung 3 9 Konstruktion einer Zugeh rigkeitsfunktion aus diskreten Teilmengen 19 Abbildung 3 10 Gewichtung f r Oder Verkn pfungen A 25 Abbildung 3 11 Gewichtung f r Und Verkn pfungen ssssseesesseseesesseseesessesesseseesesseseesessesees 26 Abbildung 3 12 Architekturmodell Dertwvanon AAA 28 Abbildung 3 13 Architekturmodell Direct Evaluation eesserseessenssessensnensnnnennennnenne 29 Abbildung 4 1 Linguistischer Wert large 0 6 10 IO 33 Abbildung 4 2 Fuzzy Quantifier most 36 Abbildung 4 3 FfA Toolbar Version 2 0 E 41 Abbildung 44s Access ER cc a 22 eI I NEE 41 Abbildung 4 5 Administrations Fentster f r Fuzzv Relapons AA 42 Abbildung 4 6 Editier Fenster Fuzzy Values uucsssssesseessensenssensensnennennnennnnnennennennennen 43 Abbildung 5 1 Systementwurf EE 45 Abbildung 5 2 Daten und Steuerunsssignale een seekenseslsls 47 Abbildung 5 3 Signalverarbeitung AFR u csrssusonssnneonsennenossnnennsennessernesnnsnssnnsnnssnnennsennennnsnne 53 Abbildung 5 4 LV Bewertung vollst ndiger AR 56 Abbildung 5 5 LV Bewertung spezialisierter AR 56 Abbildung 5 6 0Objekts EE HE eelere eege 65 Abbildung 5 7 Objekt Presentation nei 66 Abbildung 5 8 Objekt Fuzzy Application e seeseseessseseesesseseeseseeseesesesesseseesessese
102. n Fuzzysignals Das ANN wiederum wird von den individuellen Mustern der Personalisierung variiert Die von dem K nstlichen Neuronalen Netz modifizierbaren Parameter w ren in der vollen Auspr gung eines solchen Systems die Projektionsparameter der numerischen Dom nen auf das Einheitsintervall der Verlauf der Zugeh rigkeitswerte der Linguistischen Variablen die Neuronen das Abbildungsverhalten der RAE und die Neuronen Initialisierung des RAE der Personalisierungseinheit Ein in dieser Weise mehrschichtiges komplexes Neuronales Netz kann durch ein geeignetes Fehlersignal lernen indem das Signal durch alle Schichten hindurch zuriick propagiert wird 62 Kapitel 5 Losungsentwurf Gleichzeitig l sst sich wegen der ihm innewohnenden Fuzzy Funktionalit t eine geeignete Anfangsinitialisierung implementieren die Abbild des Wissens von Spezialisten ist Auf diese Weise umgeht man mehrere typische Ph nomene Neuronaler Netze Schwierige Anfangsinitialisierung Nichtinterpretierbarkeit Verfangen in lokalen Minima Trotzdem die Erforschung Neuronaler Netze l ngst den Kinderschuhen entwachsen ist sollte man nicht bersehen dass dieser Forschungszweig immer noch mit vielen ungel sten Problemen k mpft von denen eines in unserem Fall besonders schwer wiegen d rfte das der mangelhaften Performance Wenn diese Technik im PIA angewandt werden sollte so m sste man von der effizienten Form der Trapeze als Zugeh rigkeitsfunktionen abkomm
103. n Interesse wird ermittelt Pr sentation Postprocessing Das Ergebnis wird in einer bestimmten vom Client festgelegten Form aufbereitet und zur ckgeliefert Feedback und Lernvorg nge Das gelieferte Ergebnis wird vom Client bewertet die Bewertung wird dem System mitgeteilt und dort in einem Lernvorgang verarbeitet 5 1 2 1 Vorbereitung In dem hier vorgeschlagenen System werden aus technischen Gr nden alle zu untersuchenden Datens tze zweimal bewertet Zun chst in der Vorbereitungsphase mit den Mitteln herk mmlicher DBMS s dann mit den speziellen Methoden der Fuzzy Logic in dem AFR Diese Zerlegung in ein zweistufiges System macht aus verschiedenen Gr nden Sinn Die Fuzzy Methoden in das DBMS zu verlagern w re wie in Architekturmodelle b beschrieben mit hohem Implementationsaufwand verbunden Andererseits sprechen mehrere Gr nde dagegen die scharfen Bedingungen s mtlich dem AFR zu bertragen 12 G efallen recht gut wird durch ein Erregungsmuster repr sentiert 48 Kapitel 5 Losungsentwurf Zum einen werden die Datens tze sowieso in einem DBMS vorgehalten Von dort werden sie gew hnlich mit SQL Statements abgefragt Die Statements enthalten zwingenderma en eine Where Clause deren effiziente Evaluierung mit dem AFR nicht nachzubilden ist Mit dem Aufwand diejenigen Bedingungen aus der Gesamt Query zu extrahieren die vom Standard DBMS evaluiert werden k nnen gewinnt man den Vorteil nur die Datens tze mit
104. n k nnen Diese Attribute entstammen bestimmten Dom nen Neben den Eintr gen der Datenbanken die im rechten unteren Teil des Diagramms beschrieben werden ist auf der anderen Seite die Beschreibung der Queries wichtig Sie werden bergeordnet als Interesse Attributanfragen beschrieben welches sich aus verschiedenen gewichteten Alternativen zusammensetzen kann Oder Verkniipfung Alternativen k nnen ihrerseits aus verschiedenen gewichteten Kriterien bestehen Und Verkn pfung Kriterien sind Bedingungen an bestimmte Eigenschaften der Produkte hier als Predicate Pr dikat bezeichnet Diesen Bedingungen ist eine Arity Wertigkeit zugeordnet im Sinne einer z B tern ren Funktion a liegt zwischen b und c arity 3 2 3 Das PIA Dom nenmodell Das Dom nenmodell von PIA stellt seit Anbeginn ein besonderes Problem innerhalb des Projekts dar Es sei durch einen Auszug aus dem PIA Objektmodell beschrieben Abbildung 2 2 Als Dom ne wird wie zuvor beschrieben die gesamte Menge m glicher Attributauspr gungen bezeichnet wie etwa Preis oder Geschwindigkeit oder Prozessortyp Attribute is Respon URL 1 Criterion Baue sting S B r float Property D Eihegated boolean 0 1 Borinvatuey oa B ns aale oat 0 0 vgValue float umberOfitems int u with 1 H S gt H o has arguments of 1 1 WE gt 1 Predicate L
105. nation lt oneg uoneyyizz 4 L so H uoneujqwoy pun yooy assaiajuy Ar jeu i ss ue u g slaidsyneyio slaidnon weueqey iwa palan et na PSildN EI OL elH H 0 4 l 1 l ron staudsineyuon lay NoyuegleH Bupatu s a dnan Bupayu y peqyeH Ina ps lan 0 181594 Abbildung 5 3 Signalverarbeitung AFR 53 In Aufw rtsrichtung 1 findet die Fuzzifikation statt In waagerechter Richtung 2 wird die Und Komposition vollzogen In Abw rtsrichtung 3 wird die Oder Komposition durchgef hrt Und in diagonaler Richtung 4 finden rekursive Prozesse statt fiir auf Basis von Und Kompositionen zusammengesetzte Fuzzy Terme Defuzzifikation ist nicht notwendig da die realisierten Verkn pfungen keine M glichkeitsverteilungen ergeben sondern diskrete Werte Dies liegt unter anderem an der Zugeh rigkeitsfunktion Uinteressant Um die bersichtlichkeit zu wahren wurden nicht alle Vorg nge in ihrer vollen Auspr gung dargestellt So geschieht die Fuzzifikation 1 eigentlich ber die Transformation der Dom ne auf das Einheitsintervall Die Gewichtung der Kriterien und Alternativen wurde nicht ber cksichtigt Au erdem beruht der dargestellte Regler auf einer Festverdrahtung und ist in dieser Form nicht von einer RAE steuerbar Die Prozesse seien nun im Einzelnen besprochen Um die Elemente der Zeichnung benennen zu k nnen werden die Graph
106. nd sind heute in den systemtheoretischen Grundlagen der objektorientierten Programmierung zu finden wenn es um die Vollst ndigkeit und Modellierbarkeit von Systemen geht Es steht jedenfalls fest dass die Funktionalisierung von Sprache einer der entscheidenden Schritte hin zu intelligenten Informationssystemen ist Die Fuzzy Logic liefert mit ihrem Konzept der linguistischen Variablen einen wichtigen Baustein daf r Die Werte einer linguistischen Variablen sind Worte bzw Terme einer nat rlichen oder synthetischen d h standardisierten Sprache Sie werden durch unscharfe Mengen A bzw deren Zugeh rigkeitsfunktionen u x in Form von Verteilungsfunktionen ber einer Basisvariablen x eines physikalischen Grundbereichs X repr sentiert Diese Zugeh rigkeitsfunktionen bilden eine linguistische auf eine numerische Werteskala ab Die Dimensionierung dieser Abbildung ist neben der Regelerstellung s u 1 A Aufgabe des Entwicklers Beispiel 3 1 Ein m glicher syntaktischer Aufbau der linguistischen Variable Geschwindigkeit 0 50 100 150 200 v kmh Abbildung 3 1 m glicher syntaktischer Aufbau der linguistischen Variable Geschwindigkeit 3 1 3 Unscharfe Mengen unscharfe Relationen und Zugeh rigkeitsfunktion Wesentliches Konzept der Fuzzy Logic sind unscharfe Bewertungen von Gr en Hier sind in erster Linie die unscharfe Menge und die unscharfe Relation zu nennen Die Definition einer unscharfen Menge M erfolgt mit Hilfe der ch
107. nde Darstellung da f r das Merkmal Erwachsensein keine scharfe Altersgrenze angebbar ist Ebenfalls unbefriedigend w re eine Festlegung aller nicht unangenehm k hlen Raumtemperaturen mit Hilfe einer einfachen Sprungfunktion Ein gleitender bergang durchgezogen gezeichnet eignet sich hier erheblich besser er erzeugt den Freiheitsgrad unter Umst nden auch ein auf 16 C aufgeheiztes Zimmer noch als nicht unangenehm k hl zu bezeichnen u x 0 10 18 20 x Abbildung 3 2 Zugeh rigkeitsfunktion UA f r eine scharf begrenzte Menge M und u m x f r eine unscharf begrenzte Menge M Das Modell der Unscharfen Menge beschreibt mathematisch betrachtet eine un re Funktion d h eine Funktion mit nur einem Parameter Warm T gt Uyarm T Neben dieser Definition auf der Grundgesamtheit der Definitionsmenge sind aber auch relative Funktionen w nschenswert unscharfe Relation die von einem oder mehreren Parametern abh ngen Beispiel sehr viel gr er als T Usehr viel gr er als T Tref 10 C Dabei handelt es sich um eine bin re Funktion mit der Ma gabe dass beide Parameter der gleichen physikalischen Dom ne entstammen So ist es nicht sinnvoll zu fragen ob die Geschwindigkeit eines Autos sehr viel gr er sei als die Grenztemperatur eines Transistors Schlie lich m ssen f r den Ansatz von PIA Abfragen der Form T liegt ungef hr zwischen Tp und Tc zuzulassen die vorgenannten Konzepte noch auf tern re Fu
108. ne explizit mit den zugeh rigen Werten einer Linguistischen Variablen verkn pfen zu K nnen Diese Funktionalit t spielt in nicht genau identifizierbarer Weise mit den anderen beiden Funktionen Compatibility operator und Single and multi valued attributes zusammen 43 Kapitel 5 L sungsentwurf Nachdem in den vorangegangenen Kapiteln Ans tze und L sungen f r Fuzzy Zugriffe auf relationale Datenbanken beschrieben wurden soll nunmehr als Ergebnis dieser berlegungen ein w nschenswerter L sungsentwurf dargestellt werden Im Gegensatz dazu wird im n chsten Kapitel die tats chlich durchgef hrte L sung beschrieben die den praktischen M glichkeiten der Diplomarbeit Rechnung tr gt Dieses Kapitel gliedert sich grob in drei Unterabschnitte Zun chst wird ein geschlossenes Modell eines Fuzzy DBMS FDBMS beschrieben dass den gegebenen Randbedingungen des Projekts Rechnung tr gt Anschlie end findet sich eine Diskussion ber die Schnittstelle des FDBMS Schlie lich wird das PIA Objektmodell Klassendiagramm diesen Theorien angepasst 5 1 Modellentwurf FDBMS Ziel dieser Arbeit ist es neben der prototypischen Realisierung einen L sungsvorschlag f r das Problem der Fuzzy Queries vorzulegen Das hierf r entwickelte Datenbank System wird in der Annahme dass dieser Begriff noch nicht f r ein bestehendes System als Eigenname verwendet wird als Fuzzy Database Management System FDBMS bezeichnet und will nicht mehr se
109. ner Dom nen beschreiben So wird aus schnell beispielsweise durch Geschwindigkeit ist hoch beschrieben Da die Unsch rfe auf einem Einheitsintervall definiert ist muss aber eine Transformation der Wertemenge der Dom ne auf das Einheitsintervall definiert werden Dies wird blicherweise durch lineare Abbildung geleistet Die daf r n tigen Abbildungsparameter m ssen f r jede Dom ne definiert werden In erster N herung bieten sich daf r Minimal und Maximalwert der Dom nen an Wegen der M glichkeit au ergew hnlich extremer Werte sollte man aber eher von blichen Minimal und Maximalwerten sprechen und die Ausrei er der Wertemenge auf diese abbilden Sei X x l LE X 11 X XMa f r alle Xi gt XMax T x t d x Xqin f r alle x lt xmin Xi Xi XMin XMax XMin f r alle Xmin 2 X i Z XMax mit XMax XMine X und x e 0 1 Auf diese Weise l sst sich durch geeignete Wahl der Stiitzwerte Min und Max auch eine Individualisierung der Unsch rfe gew hrleisten So kann der Preis eines Hauses generell als teuer bewertet werden wenn man als Minimalwert beispielsweise 0 annimmt Nimmt man dagegen einen blichen Mindestpreis von etwa 50 000 an so lassen sich f r Personen die sich mit den blichen Hauspreisen arrangieren k nnen auch g nstige H user identifizieren Andere Interessenten m gen einen Mindestpreis von 100 000 annehmen Die Bindung der St tzwerte an die Dom nen gem d
110. nfrage sein zu k nnen Essen Catdog Colectior catdoglD String det ls URL 9 aleOff Abbildung 5 7 Objekt Presentation Schlie lich wird aufsetzend auf Condition und Presentation die Klasse Fuzzy Application eingef hrt die von dem bestehenden PIA Frontend einem Objekt der Klasse GUI Application angesprochen werden kann und eine Offer generiert en En PRES GUl Applicaion sai ee er size ht Cer Aas as anna Aas IS anne Pscore Abbildung 5 8 Objekt Fuzzy Application 66 Kapitel 5 Losungsentwurf T Attribute Sg Ri unpon URL vc Criterion Baue String Beat fioa Property 0 Beats boolean 0 1 2 MBhinvale float Ll 0 Einawaluei float 0 x vgValue float o umberOfitems int 0 with has arguments of 1 1 d A DA Predicate BE Ban int Domain ame String Rz String lescription URL Bewvatuels String Value Borei Item a Attribute args Value float 7 0 4 OF La is defined on D Value e bas a5 arguments 0 4 Bos tring String il Abbildung 5 9 Das PIA Dom nenmodell Abschlie end sei noch eine Anregung zur Erweiterung der Klasse Predicate gegeben Wie bereits erw hnt entstehen bei der bisherigen Definition der Klasse semantische Defizite Derzeit ist wird die Methode score
111. ng wurde f r die noch zu entwickelnde Fuzzy Funktionalit t f r hierarchische und Volltextdom nen die Einf hrung unabh ngiger Module vorgeschlagen die zwischen das Preprocessing mit der Datenbank und die Bewertung durch den AFR zu schalten w ren Diesen Gedanken fortsetzend kann auch die Normalisierung als eingangsseitiges Modul verstanden werden Um hier eine Einheitlichkeit zu schaffen k nnte man noch einen Schritt weiter gehen und sagen Definition 5 1 AFR Normierungs Modul Zwischen die sequentielle Bereitstellung relevanter Datens tze aus einer Datenbank und die Bewertung dieser Daten durch Linguistische Variablen mit dem AFR werden AFR Normierungs Module zur Projektion der Daten auf numerische Einheitsintervalle geschaltet Diese Normierungsmodule haben also einerseits die Aufgabe numerische Daten zu normalisieren F r den Fall vorhandener Fuzzy Relationen in einer Query m ssen sie entsprechend viele Eing nge generieren Andererseits k nnen sie die Projektion numerischer und Volltext Dom nen auf eine numerische Skala realisieren So k nnte etwa ein Modul Text hnlichkeit definiert werden indem Distanzma e im Textraum auf das Einheitsintervall abgebildet werden Nach der Abbildung lie e sich das Datum dann vom AFR bewerten Bsp Relation Text hnlichkeit Content Suchstring ist hoch Auch hier m ssten Relationen bef higt sein eigene Eing nge zu kreieren Die Projektion des aktuellen Datensatze
112. ngeren Form beschrieben Wesentlich am Dom nenmodell ist weiterhin die Einteilung der Dom nen in Unterdom nen Diese Aufteilung bewirkt die Integration der unterschiedlichen Informationssysteme IR und RDBMS s zu einem Einzigen Die Dom nen werden hierf r unterschieden nach skalarem hierarchischem oder textuellem Charakter Diese drei Gruppen lie en sich etwa als Oberdom nen bezeichnen Jede Dom ne geh rt einer dieser Oberdom nen an Hierbei enth lt die hierarchische Oberdom ne mit einer Tiefe von Eins den Spezialfall Aufz hlungsdom ne Set Menge In dieser Arbeit wird dem Problem numerischer Dom nen das Hauptaugenmerk gewidmet 2 4 Zusammenfassung PIA Diese Arbeit besch ftigt sich mit der Evaluierung eines Interesses auf einem Katalog von Items so dass dem Customer ein entsprechendes Angebot unterbreitet werden kann Dabei wird auch die Pflegbarkeit des Angebots durch Maintainer und Provider mit in Betracht gezogen sowie die R ckwirkung des Relevance Feedbacks auf das Mutual Understanding Die Arbeit liefert somit den Unterbau f r das Frontend Vorrangig wird dabei das theoretische Fundament entwickelt und ein Prototyp bereitgestellt mit dem sich die Relevanz der Konzepte und die Geschlossenheit des Modells in praktischen Versuchen berpr fen lassen Kapitel 3 Stand der Technik Fuzzy Datenbanken In diesem Abschnitt soll der gegenw rtige Stand der Forschung und Entwicklung auf dem Gebiet der Fuzzy Datenbanken be
113. nktionen erweitert werden 10 Kapitel 3 Stand der Technik Fuzzy D atenbanken Liegt ungef hr zwischen T gt u Liegt ungef hr zwischen T Ts Tc Zur L sung dieses Problems lassen sich zwei Ans tze finden Zum einen k nnte ein eigenes mathematisches Konzept entwickelt werden wie im Kapitel L sungsentwurf angef hrt zum anderen lie e sich die tern re Funktion mit Verkn pfungsoperatoren in zwei bin re Funktionen zerlegen siehe hierzu auch Particularization and Conditional Possibility Distributions in KaZe84 S 91 T ist gr er als Tg und T ist kleiner als Tc bzw T ist ungef hr gr er als Tg und T ist ungef hr kleiner als To Auch dieser Ansatz erfordert im Sinne eine theoretischen Fundierung eine weiterf hrende Diskussion n mlich ber den Operator Und Siehe L sungsentwurf In der Literatur konnten zum Thema unscharf vergleichende Zwischenwerte leider keine Vorschl ge gefunden werden 3 1 4 Definition von Unsch rfe mittels Normalisierung Ein besonders eleganter Weg den Aufwand bei der Definition von Unsch rfe zu reduzieren besteht darin allgemeine unscharfe Terme zu verwenden und sie als Attribute f r i A alle Dom nen einer Oberdom ne zu verwenden Ein solcher Satz unscharfer Terme f r numerische Dom nen k nnte sein niedrig mittel hoch Abbildung 3 3 normierte Linguistische Werte Mit einer solchen Menge l sst sich gleichzeitig die Unsch rfe verschiede
114. nterpretationen Fagin oder PIA festlegen zu m ssen werden 3a und 3b 0 B d A zusammengefasst MDatternative AND lox mod LV x allgemeine Form 3 mit AND als Gewichtung ber cksichtigender Interpretation einer Und Komposition b Berechnung von Aternative score mit Modifikatoren auf Ebene der lokalen Gewichtung implizit Die lokale Gewichtung und die Modifikatoren hneln sich in ihrer Funktionalit t Sie geben einzelnen Kriterien eine Wertung Das gleichzeitige zur Verf gung stellen beider Methoden kann etwa zu einer Bedingung dass der Preis sehr niedrig ist ist sehr wichtig 1 Uniedrig Preis mit i sehr wichtig 1 als Repr sentation von sehr wichtig und modgen x x x als Repr sentation des Modifikators sehr 59 fiihren Die beiden Methoden widersprechen sich nicht sondern erg nzen sich Der Unterschied ist in erster Linie darin zu sehen dass die Gewichtung darauf beschr nkt ist Zugeh rigkeitswerte mit einem Faktor zu bewerten w hrend die Modifikatoren beliebige Funktionen mod 0 1 0 1 darstellen k nnen So liegt der Gedanke nahe die beiden Methoden zu einer zu verkn pfen Bew Ir ze mod e F PX 0 1 9 0 1 Px ist eine Matrix von Bewertungsfunktionen mit F F n ist der Raum aller Bewertungsfunktionen der dem Raum aller erlaubten Modifizierungsfunktionen gleich ist Dieses Verfahren kann nur nach der PIA Interpretation von Gewichtung angewendet werden da in Fa
115. olgenden Gewichtung ij ij und multipliziert diesen Wert mit i ANDpfagin i X 11 12 AND x1 2 2 13 AND x1 Xo 3 3 14 AND X2 X3 KAND g Xk 5 mit i ij 0 1 als Vektor der lokalen Gewichtung AND 0 1 0 1 z B Minimumbildung und k als Komplexit t der Und Komposition Dieser Vorgang l sst sich zwar nicht graphisch veranschaulichen aber es l sst sich denken dass erin waagerechter Richtung unseres symbolischen Ablaufs in Abbildung 5 3 durchgef hrt wird und eine Abbildung AND fagin i x 0 1 0 1 bewirkt Nach dem PIA Ansatz werden die Kriterien vor der Und Komposition einfach durch die Funktion D Xj eh 1 1 x j ij bewertet Dies l sst sich graphisch als Stauchung bzw Streckung der Zugeh rigkeitsfunktionen interpretieren Hierbei bleibt die M glichkeit des paarweise Approximativen Schlie ens erhalten Dies ist im Sinne eines einfachen Algorithmus vorteilhaft Abgebildet wird der so ermittelte Wert im Allgemeinen auf eine fiktive Variable namens Interesse die im Objektmodell 2 2 Das PIA Objektmodell der Eigenschaft score der Klasse Alternative entspricht alternative score In einem speziellen Fall kann die Abbildung aber auch auf eine Zwischenvariable stattfinden siehe rekursive Prozesse Es folgen drei Ans tze zur Implementation von Modifikatoren im Falle des vollst ndigen AFR s Zur Beschreibung der Abbildung wird die Definition einer Funktion e ben
116. on zusammen Damit ist die zu untersuchende Datenmenge gegeben und die darauf anzuwendende Bedingung gem derer die Datens tze zu bewerten sind Der Aufruf des Fuzzy Application Objekts initialisiert also die Ablaufsteuerung die ihrerseits die n tigen Schritte in die Wege leitet insbesondere die Parameter an den Interpreter bergibt Dem Objekt Fuzzy Application ist zu diesem Zweck eine Methode process_query QueryParameters queryparameters zuzuordnen die als Schnittstelle zum Frontend fungiert Die Parameter werden in der Form bergeben wie sie das Objektmodell vorsieht n mlich vom Typ Condition und Presentation Intern werden die Parameter dann zeitweise als SQL String f r Datenbankabfragen interpretiert Ausgangsseitig wird ein Objekt von Typ Offer erzeugt das die relevanten Datens tze repr sentiert Das Fuzzy Application Objekt antwortet auf die Methode process_query mit einem Offer wobei noch nicht festgelegt ist wer f r die Struktur der Offer zust ndig ist Diese 64 Kapitel 5 Losungsentwurf Frage kann erst bei der Implementation entschieden werden in Abh ngigkeit von einer zweckm igen Umsetzung Gem des bisherigen Modell Entwurfs liegt eine unsortierte Liste von Items in der Offer vor die von der GUI Application als pr sentierendem Part noch f r die Ausgabe aufbereitet werden muss In dieser Version enthielte Offer alle Daten der Items und es m ssten noch die relevanten Datenfelder vom Frontend ausgew h
117. orm should be employed The way a fuzzy set constant used along with a multi valued attribute takes part in the calculation of matching degree of an atomic condition depends on the compatibility operator employed Parameters naming convention 1 FfA_FS fuzzy set constant name when used along with a single valued attribute Example COUNTRY FfA_FS Central Europe 2 FfA_FC compatibility operator namelFfA_FS fuzzy set constant name when used along with a multi valued attribute Example PROFILE FfA_FC JaccardIFfA_FS Exact sciences A2 2 Compatibility operator Compatibility operators make it possible to express a relation that should be met by a single valued attribute or a multi valued attribute and a fuzzy set constant in an atomic condition In the case of a single valued attribute only one compatibility operator is applicable namely the IN operator The matching degree of an atomic condition involving a single valued attribute at and a fuzzy set FS is calculated as equal to where is the value of the attribute at in a given record R In case of a multi valued attribute the following operators may be employed by the user NAME QUERY PARAMETER the degree of possibility of matching FfA_FC Possibility FfA_FS fuzzy set name 85 the degr of necessity of matching FfA_FC Necessity lt FfA_FS fuzzy set name FfA_FC Necessity gt FfA_FS fuzzy set name the generalized Jaccard coefficient FfA_FC Jacc
118. pr gung ist Personal Computer Dom ne Domain In PIA ist jedem Attribut eine Dom ne zugeordnet Die Dom ne enth lt die Information ber die gesamte Menge der Attributauspr gungen die bei diesem Attribut vorkommen k nnten Dom nen lassen sich bestimmten Dom nenkategorien zuordnen wie numerisch hierarchisch oder Volltext Ein Beispiel daf r ist die Dom ne Preis die positive reelle Zahlen repr sentiert und weitere Informationen zu W hrungseinheiten z B Dollar oder Yen usw enth lt Objekt Entit t Eine Repr sentation eines konkreten oder abstrakten Gegenstandes die f r ein gegebenes Anwendungssystem von Bedeutung ist Ein Produkt ist z B eine Entit t Pr dikat Predicate Um die Eigenschaften von Objekten gezielt abfragen zu k nnen werden mit Pr dikaten Bedingungsoperatoren eingef hrt Sie k nnen etwa die Existenz einer Eigenschaft fordern oder die Relation zu einem Vergleichswert z B lt ungef hr gleich hoch Attributanfrage Criterion Kriterium Eine Attributanfrage gibt ein Kriterium eines Attributes wieder nach dem die Produkte gew hlt werden sollen Sie ist die konkrete Auspr gung eines Pr dikats mit den dazugeh rigen Parametern Wir bezeichnen z B Kategorie ist Auto als eine Attributanfrage Suchauftrag Alternative Query Interest Interesse Ein Suchauftrag besteht aus einer oder mehreren Attributanfragen die sich auf unterschiedliche Attribute bezi
119. r Zugeh rigkeit Null am Anfang und Ende des Intervalls reichen Beginn des Anstiegs auf Eins Beginn des Plateau s Ende des Plateau s und Ende des Abfalls auf Null aus um den Kurvenverlauf zu beschreiben Bildbeispiel gro 1 0 75 0 5 0 25 Abbildung 4 1 Linguistischer Wert large 0 6 10 10 33 Um einen Zugeh rigkeitswert zu ermitteln wird ein gegebener Datensatz zun chst mittels seiner UL und LL auf das Normintervall 10 10 abgebildet und dann auf den Fuzzy Value projiziert Die vordefinierten Fuzzy Values sind Any 5 13 10 8 8 5 Average 2 SCH 1 2 4 High 0 6 10 10 16 Large 0 10 10 9 Low 10 10 SS 0 10 Medium 5 2 2 5 15 Reasonable 10 10 2 8 14 Soon 10 10 5 0 11 Very high 2 8 10 10 12 Very low 10 10 8 2 lt fuzzy relation gt Eine unscharfe Relation wie not much greater than wird als bin re Fuzzy Funktion mit einer Trapezfunktion abgebildet Die Operanden k nnen Attributnamen oder Zahlen sein Um zwei Werte auf die genannte Weise zu vergleichen wird die Differenz der Werte D auf die Varianz der zugeh rigen Bereiche abgebildet LL1 UL2 UL1 LL2 wobei LL1 UL1 UL2 LL2 die Grenzen der beiden zu vergleichenden Werte bezeichnen Wenn nur ein Operand ein mit UL und LL definiertes Fuzzy Attribut ist und der zweite Operand eine Zahl dann wird f r den zweiten Operanden angenommen er habe die gleichen Grenzen wie der erste Der Zugeh
120. rch Definition von Schnittstellen gegen seine Umwelt abgegrenzt und soweit vereinfacht wie es f r die gew nschte Funktionalit t zul ssig erscheint Mit diesen systemtheoretischen Einschr nkungen lassen sich scharfe Systeme modellieren deren Objekte i A pr zise bestimmten Mengen zugeordnet werden k nnen In den komplexen Systemen der realen Welt hingegen l sst sich so eine Zuordnung oft nicht treffen und wir tragen dem mit unserer natiirlichen Sprache Rechnung indem wir von schnellen oder sehr schnellen Autos sprechen und den bergang dazwischen als flie end bezeichnen Obwohl wir mit solchen Formulierungen den Informationsgehalt aus technischer Sicht scheinbar verringern reduzieren wir doch in Wirklichkeit nur die Datenmenge und werten sie 1 A mit unserem Expertenwissen auf So kann es als unwesentlich angesehen werden ob ein Auto mit 180 oder 190 km h verungl ckt nicht aber ob es schnell oder langsam war Maria Zermankova Leech unterscheidet in ihrer oft zitierten Grundlagenarbeit Fuzzy relational data bases a key to expert systems KaZe84 zwischen Daten und Information und spricht der Information die Eigenschaft zu eine bedeutungstragende Interpretation von Daten zu sein die beispielsweise durch Messung oder Statistik gewonnen wurden Eine scheinbar andere Sicht der Dinge liefert ein Zitat von George Klir in McFr94 Wenn die Komplexit t zunimmt m ssen wir eines aufgeben Und das ist die Gewissheit
121. ren weight 1 w hrend das f r eine Anfrage Ich m chte ein gelbes Auto spezifische Kriterium unterdr ckt wird weight 0 Die RAE erh lt ihre Informationen aus der Fuzzy Query Wenn ein vollst ndiger AFR siehe 5 1 2 2 Bewertung AFR zu steuern ist so kann die RAE entweder mit einer linearen Abbildung oder mit einem k nstlichen Neuronalen Netz s u ein Eingangsmuster zu einem Erregungsmuster umsetzen Im Fall eines spezialisierten AFR s kommt der RAE die Erzeugung der festverdrahteten Regeln zu feedback Die Steuerung eines vollst ndigen AFR s mit einem neuronalen Netz bietet den besonderen Vorteil ein lernf higes System darzustellen das zudem noch hohe Individualit t in der Personalisierung zul sst Dieser Entwurf erlaubt es beispielsweise auch feine Nuancen eines Empfindens der Farbe Rot abzubilden Die Aktivierung w rde ber die Zuweisung von Gewichtung erfolgen In einer Query nicht gestellte Bedingungen erhielten die Gewichtung 0 was etwa interpretiert werden k nnte als interessiert mich nicht Es ist zweckm ig f r diesen Fall von Erregungsmustern zu sprechen wie es im Bereich Neuronaler Netze blich ist Ein am Regler anliegender Datensatz erregt dann wie oben beschrieben zun chst ein spezifisches Muster von Neuronen die als Matrix von Sympathievektoren darstellbar sind Die meisten alle nicht interessierenden Neuronenausg nge werden von dem steuernden ANN gehemmt gem des ihm anliegende
122. rigkeitswert wird schlie lich durch Projektion auf die Zugeh rigkeitsfunktion der Fuzzy Relation gefunden Die vordefinierten Fuzzy Relationen sind 10 Around 2 1 1 2 15 Definitely greater than 0 2 10 10 16 Definitely less than 10 10 2 0 5 Much greater than 0 5 10 10 2Much less than 10 10 gt 25 0 17 Not much greater than 10 10 0 3 19 Not much less than 2 0 10 10 13 Rather greater than 3 1 10 10 14 Rather less than 10 10 1 3 11 Slightly less than 2 2 0 0 12 Slightly more than 0 0 2 2 lt Fuzzy quantifier gt Im Folgenden werden verschiedene Formen von Quantifiern eingef hrt und ihr unterschiedliches Zusammenspiel mit Gewichtungen beleuchtet Es wird unterschieden nach gesetzter und nicht gesetzter Gewichtung nach lokaler und globaler Gewichtung und nach der Interpretation gem Zadeh oder OWA Es ergeben sich folgende Fallunterscheidungen 34 Kapitel 4 FfA Fuzzy for Access Keine importance OWA Zadeh Gewichtung Ja a Ja a Lokal ae oe We Nein Nein Ja Di Ja b Global an an Nein Jac Ja und Nein beschreiben ob das jeweilige Konzept in FfA realisiert wurde Die drei nicht realisierten Konzepte wurden im Rahmen der prototypischen Realisierung nachimplementiert Die Buchstaben stehen fiir die Referenzen der Erl uterungen Zun chst die Beispiele ohne Gewichtung Mit den Fuzzy Quantifiern wird ein besonderes
123. rlichsprachlich Nenne alle Datenbank Eintr ge die schnelle Autos betreffen Synthetische Sprache SELECT FROM PIA db WHERE Kategorie Auto AND SQL Syntax Geschwindigkeit schnell Fuzzy Regel IF Kategorie Auto AND max Geschwindigkeit ist hoch THEN Interesse ist hoch 3 Sp ter wird eine Mischform der zweiten und dritten D arstellung zur Realisation vorgeschlagen werden 13 Wenn das Ausgangssignal einen Schwellwert G cut s u berschreitet wird die Regel als erf llt angesehen und der Datensatz der Ergebnismenge zugeordnet Einen besonderen Reiz erh lt diese Sicht auf unscharfe Abfragen wenn man damit verschachtelte Definitionen realisiert So lie e sich durch eine Regel Wenn Gebrauchtwagenwert nach Durchschnittstabelle ist gr er als Kaufpreis dann Angebotsqualit t ist hoch ein vordefinierter unscharfer zusammengesetzter Wert Angebotsqualit t festlegen der seinerseits als Attribut einer Bedingung verwendet werden kann IF Angebotsqualit t ist hoch und Preis ist niedrig THEN Interesse ist hoch Mit dieser Umsetzung einer nat rlichsprachlichen Abfrage in den Bedingungsteil eines Reglers wird dieser zur Schnittstelle zwischen der Datenbank Query und der Fuzzy Logic Die Vorg nge in dem Regler werden durch drei Begriffe beschrieben die im folgenden n her erl utert werden Fuzzifikation approximatives Schlie en Defuzzifikation 3 1 7 Fuzzifikation Die Eingangswerte x des Reglers sind in der Regel in
124. rom lt list of tables gt where lt fuzzy quantifier gt lt sequence of subconditions gt lt sequence of subconditions gt lt subcondition gt lt subcondition gt or lt sequence of subconditions gt lt subcondition gt lt fuzzy quantifier gt lt importance coefficient gt lt sequence of atomic conditions gt nce of atomic conditions gt c condition gt c condition gt and nce of atomic conditions gt lt sequ lt atom lt atom lt sequ e i i e lt atomic condition gt lt attribute gt lt fuzzy value gt lt attribute gt lt fuzzy relation gt lt attribute gt lt attribute gt lt fuzzy relation gt lt number gt lt andere Formen in g ltiger Microsoft Access Syntax gt lt attribute gt lt numeric field gt lt fuzzy quantifier gt lt OWA tag gt lt quantifier name gt lt OWA tag gt OWA mit als Kennzeichen einer alternativen Erscheinungsform Wir sehen hierin im wesentlichen vier Fuzzy Konzepte realisiert fuzzy quantifier fuzzy relation fuzzy value importance coefficient 32 Kapitel 4 FfA Fuzzy for Access Bemerkenswert dabei ist dass die Gewichtung auf Ebene der Subconditions Alternativen die Quantifier auf Ebene der Subconditions und Sequence of Subconditions Alternativen und Interessen definiert sind Dagegen fordert das Objektmodell von PIA speziell f r die Gewichtung die Zul ssigkeit auch
125. rship function of the fuzzy set FS for the element being the value of the attribute AT in a given record The calculation of matching degree for multi valued attributes is discussed here Parameters naming convention Single valued attribute is referred directly using the name of a field in a table For multi valued attribute use FfA_FM multi valued attribute name Example FfA_FM Profile FfA_FC JaccardIFfA_FS Exact sciences 87
126. rungszwecken angemessener sein Der Ansatz findet sich in DeDo90 Bei Vorgabe konkreter scharfer oder unscharfer Eingangswerte f r den Regler m ssen zur Berechnung der Ausgangswerte zun chst die Einzelaussagen berpr ft werden Da die Eingangswerte i a nicht exakt die in den Implikationen festgelegten Bedingungen befriedigen werden k nnen nur unscharfe Schl sse bzw Folgerungen engl Inferences gezogen werden Der dazu erforderliche Vorgang wird als Approximatives Schlie en bezeichnet und leitet sich aus den Methoden des Schlie ens in der Bin rlogik ab Eine einfache und beliebte Methode zur Umsetzung eines approximativen Schlusses ist in Beispiel 3 5 dargestellt Sie wird als Max Min Inferenz Methode bezeichnet und setzt Regeln in der ersten Normalform voraus Das Modul das diesen Schluss leistet hei t auch Inference Engine Beispiel 3 5 Es soll der scharfe Stellwert aus der ffnung eines K hlventils aufgrund gemessener scharfer Werte Ten der Eingangsgr e Temperatur verstellt werden Es liegen zwei Regeln in linguistischer Form vor Die Terme werden der Abbildung 3 6 entsprechend durch unscharfe Mengen repr sentiert Die Regeln zur Beschreibung des Reglerverhaltens lauten IF Temperatur niedrig THEN K hlventil halb offen IF Temperatur mittel THEN K hlventil fast offen Es wird die Temperatur Tee ST gemessen Zur Berechnung des dazugeh rigen Stellwerts aus 18 C werden zun chst die beiden Zugeh rigk
127. rzeichnen gewesen Trotzdem sich schon einige Anwendungen beispielhaft im World Wide Web befinden siehe www heise de suchen h ngt die Selbstverst ndlichkeit mit der diese Anwendungen Verwendung finden doch denen der klassischen Fuzzy Logic hinterher Da die Anwendung in Informationssystemen aber wenigstens genauso vielversprechend und dringend erforderlich scheint wie in den klassischen Anwendungsgebieten ist bei der erkennbar hohen Dynamik des Informationsmarktes mit einer raschen Entwicklung und Verbreitung dieser Technologie zu rechnen Im folgenden Kapitel wird ein ber Jahre gepflegtes und fortentwickeltes Beispiel einer solchen Anwendung genauer dargestellt 30 Kapitel 4 FfA Fuzzy for Access Zur Realisation eines Prototyps wurde die Software FuzzyForAccess FfA eingehend betrachtet Sie wurde am Systems Research Institut der Polish Acadamy of Sciences entwickelt Federf hrend war dabei der renommierte Forscher und Verfechter der Fuzzy Logic Janusz Kacprzyk In einem Artikel zu diesem Thema KaZa97 beschreibt er das Ziel dieser Anwendung so Die Funktionalit t von Microsofts Access 2 0 wird exemplarisch f r alle g ngigen RDBMs um Fuzzy Techniken erweitert Ziel sei es der Anfragen oft eigenen Ungenauigkeit Rechnung zu tragen Die Anwendung werde in kommerziellen Projekten eingesetzt Hierf r lie en sich leider keine Beispiele finden Sicher jedoch ist dass die Software bereits auf eine geraume Entwicklungsgeschichte se
128. s A Formula for Incorporating Weights into Rules bezeichnet oder wegen ihrer Einfachheit The Magic Formula Sei f M eine beliebige Verkn pfungsfunktion z B Und oder Oder f r die gilt f M 0 1 0 1 mit M u ist ein Vektor von Zugeh rigkeitswerten Sei weiter 0 ein M zugeordneter absteigend geordneter Gewichtsvektor mit i 1 n D On V kcm und 0 1 Dann gilt f 8 M 0 1 0 1 mit f M 81 Dei f u 2 02 03 f H1 2 3 03 84 1 Masi n Om TU Un Bemerkung Der geforderte absteigend geordnete Gewichtsvektor erleichtert die Notierung und Evaluierung der Funktion Um die Sortierung zu gew hrleisten ist gegebenenfalls M umzustellen Quantifier f r PIA F r die Queries die mit PIA realisiert werden sollen sind weder die beliebigen Verkn pfungsfunktionen aus Fagin s Ansatz f M noch die Linguistic Quantifier Q aus Zadeh s Ansatz notwendig Es sollen lediglich Und bzw Oder verkn pfte Bedingungen gewichtet werden k nnen Zwar fand sich in der Literatur kein geeignetes einfaches Verfahren doch l sst sich durch berlegung leicht ein einfacher L sungsansatz finden dessen Widerspruchsfreiheit sich im Rahmen dieser Arbeit allerdings nicht belegen lie Hierf r unterscheide man die logische Bedeutung der Gewichtung einzelner Bedingungen im Rahmen einer Oder und im Rahmen einer Und Verkn pfung Im Falle einer Oder Verkn pfun
129. s Tool erlaubt es dem User sich Queries gewisserma en zusammenzuklicken Der Anwender gibt an aus welcher Tabelle er Daten abfragen m chte from clause welche Bedingungen die Abfrage erf llen muss where clause und welche Attribute angezeigt werden sollen select clause Au erdem kann er noch Sortierkriterien angeben order by clause Alle Felder au er der where clause lassen sich mittels Pulldown Men in der original Access Funktionalit t editieren so dass eine fehlerfreie Auswahl gew hrleistet wird FfA stellt nun mittels einer Toolbar genannten Form siehe FfA Toolbar eine M glichkeit zur Verf gung die where clause nach dem gleichen Prinzip zu editieren wie die select und from clause und zwar mit den spezifischen Fuzzy Funktionen Ein spezieller GO Button evaluiert dann die Anfrage Bei der Evaluierung wird zun chst ein matching degree threshhold FfA Notation f r o cut QO defaut Streng 0 abgefragt dann wird die Query bearbeitet Die Erzeugung der Antwort 38 Kapitel 4 FfA Fuzzy for Access geschieht in zwei Schritten Zun chst wird der SQL String der Query nach FfA eigenen Bestandteilen untersucht Dabei wird zum einen ein Syntaxcheck durchgef hrt zum anderen werden die Parameter der einzelnen Zugeh rigkeitsfunktionen der Fuzzy Operatoren eingelesen und in einer Matrix zur sp teren Berechnung vorgehalten So auf semantische und syntaktische Richtigkeit berpr ft wird der SQL String in eine
130. s der linearen Funktion uw ui 1 0 1 8 u 1 9 die Und Funktion f r gewichtete Bedingungen abgeleitet werden Und M pi 1 amp min Hd min 0 1 0 1 Die Graphen f r die Und und die Oder Verkn pfung realisieren f r 0 1 also die Standardgewichtung die Identit t der Zugeh rigkeitswerte Uu i F r 0 0 dagegen also der Auszeichnung einer Bedingung als unwichtig realisieren die Graphen das Unbeachtetlassen dieser Zugeh rigkeit unabh ngig vom seinem Wert also Uu 0 im Falle der Oder Verkn pfung und u i 1 im Falle der Und Verkn pfung 25 Abbildung 3 11 Gewichtung fiir Und Verkniipfungen Die Funktion des Graphen fiir die Oder Verkniipfung u 9 H ist offensichtlich die einfachste Funktion die den Fl chen begrenzenden Geraden H ui 0 0 u 0 0 0 vi Hi D 8 u 8 1 pi gen gt Die entsprechende Gleichung f r die Und Funktion u ui 1 O 1 findet sich durch die einfache lineare Transformation u T u 1 wi pi 1 0 6 so dass dieselbe Fl chenform gegeben ist Dass es noch weitere L sungen f r die gegebenen Randbedingungen gibt ist sicher Diese werden aber im Allgemeinen komplizierter ausfallen als die hier vorgestellte Die Gleichung ist eine Spezialfall der allgemeinen Quadrikengleichung mit der Fl chen zweiter Ordnung im Raum beschrieben werden Mit der gefundenen L sung schein
131. s liefert also einen Eingangsvektorx an den Regler mit x e 0 1 mit 1 l ist die Anzahl aller Daten eines Datensatzes und m ist die Anzahl aller Relationen des Interesses mit unterschiedlichen sekund ren und terti ren Parametern 55 1 b Fuzzyfikation der Werte In Einklang mit der Anforderungsdefinition kann von scharfen Eingangswerten ausgegangen werden Nach der Normalisierung werden sie mit den Werten einer standardisierten Linguistischen Variablen Bewertung fuzzifiziert Im einfachsten Fall hat diese Variable folgende Gestalt Linguistische Variable Bewertung Linguistische Primarterm hoch Werte Duchschnittswert mittel Terme Antonym niedrig Modifikator not sehr kaum Abbildung 5 4 LV Bewertung vollst ndiger AFR An diesem Punkt wird man bei der Wahl der Implementation eine strategische Entscheidung treffen m ssen Die Abbildung eines spezifischen Interesses in den AFR ist laut Entwurf der RAE bertragen worden Man kann nun einerseits die Zahl der Berechnungen minimieren wollen mit dem Preis f r jedes Interesse einen ganz spezifischen Regler initialisieren zu m ssen Dieser Ansatz ist in Bild Abbildung 5 3 dargestellt Diese Variante wird im Folgenden spezialisierter AFR genannt Oder aber man versucht den Regler zu standardisieren mit dem Preis m glicherweise berfl ssige Berechnungen durchzuf hren vollst ndiger AFR Der Vorteil des zweiten Ansatzes liegt
132. sbesondere und ausdr cklich nach dem Ansatz von PIA scharfe Werte Sie m ssen zun chst auf die linguistische Werteskala abgebildet werden auf der das Reglerverhalten in Form von IF THEN Regeln vorgegeben ist da die Ausgangswerte y x auf der Basis dieser Regeln hergeleitet werden Die x werden also zun chst in den Zugeh rigkeitsraum der beteiligten linguistischen Terme transformiert Wenn eine linguistische Variable durch n Terme beschrieben wird dann entsteht als fuzzifiziertes Signal ein n dimensionaler Vektor s x mit den Elementen u x e 0 1 i 1 n siehe auch Beispiel 3 4 Man spricht auch vom Sympathievektor des Eingangswertes So bedeutet s 22 C kalt 0 2 mittel 0 7 warm 0 7 in Zadeh Mengennotation s u dass 22 C zu 0 2 kalt ist und zu jeweils zu 0 7 den mittleren und den warmen Temperaturbereichen zuzuordnen ist Dieser Vektor wird beim Herleiten der Folgerungen weiterverarbeitet Die Transformation hei t Fuzzifikation der Eingangssignale Dieser Begriff ist insofern ungl cklich gew hlt als dass es sich weniger um eine Verunsch rfung handelt als vielmehr um die Abbildung der im allgemeinen scharfen Eingangswerte auf die linguistische Werteskala des Reglers Beispiel 3 4 Fuzzifikation In einigen F llen kann es sinnvoll sein die scharfen Eingangsmesswerte zun chst in unscharfe Werte umzuwandeln bevor sie in den unscharfen Regler gelangen die Motivation daf r liegt in der grunds tzlichen Toleranzbeha
133. schrieben werden Wegen der allgemeinen Verbreitung der Datenbanktechnologie wird auf eine n here Beschreibung dieser Technologie verzichtet Dagegen sei die Fuzzy Logic in einer einf hrenden Form beschrieben Konzepte der Fuzzy Logic und an den relevanten Stellen vertieft Mathematik der Fuzzy Logic Dabei werden die allgemeinen Fuzzy Theorien meist schon in ein Verh ltnis zu ihrer Anwendung in der Datenbanktechnologie gesetzt Abschlie end werden einige Literaturquellen herangezogen um spezielle Problematiken der Fuzzy Datenbanken n her zu betrachten 3 1 Konzepte der Fuzzy Logic 3 1 1 Begriff und Historie Fuzzy Logic wird h ufig mit dem paradoxen Ausdruck unscharfe Logik bersetzt Inhaltlich pr ziser ist jedoch der Ausdruck Die Logik der Unsch rfe Die Fuzzy Logic stellt eine Erweiterung des bin rlogischen Kalk ls dar Den mathematisch historischen Hintergrund bilden Arbeiten ber mehrwertige Logiken die insbesondere mit der Ereignisunbestimmtheit der Quantentheorie entstanden Darin wurden die in der klassischen bin ren Logik m glichen Wahrheitswerte wahr und falsch bzw 0 und 1 einer Aussage um weitere Zwischenzust nde z B unbestimmt bzw 2 erg nzt Lotfi A Zadeh Za65 erweiterte diese Theorie zur mathematisch exakten Beschreibung von Variablen mit linguistisch und damit unscharf vorgegebenen Werten Die Regeln f r die Verkn pfung dieser Variablen sind das axiomatische Grundger st f r die Fuzzy
134. se blendet er dann nicht relevante Zugeh rigkeitswerte durch weight 0 aus Hierbei muss beachtet werden dass in der gew hlten Interpretation lokaler Gewichtung weight 0 auch wirklich zu einem Nichtbeachten dieses criterion score f hrt Die RAE l sst sich idealerweise von einem neuronalen Netz ANN Artificial Neural Network realisieren dessen nat rliche Eigenschaft inhibitorische hemmende und exhibitorische verst rkende Reize sind Es bietet zudem mit seiner F higkeit zu maschinellem Lernen die M glichkeit ein User Feedback zur Verbesserung des Systems zu nutzen 5 1 1 3 Personalisierungs Einheit PE Das Neuronale Netz der RAE kann individuell d h personenbezogen initialisiert bzw parametrisiert werden Wenn es somit z B Anjas Ansicht von einem Billigauto von der von Bernd unterscheiden kann w ren damit alle Anforderungen des PIA Systems an das DBMS erf llt Diese PE w re idealerweise wiederum ein Neuronales Netz um aus dem User Verhalten R ckschl sse ziehen zu k nnen Wenn die RAE als Neuronales Netz ausgelegt wird w re die PE lediglich eine weitere Schicht in diesem Netz 5 1 1 4 Datenbank Das Standard Datenbank Management System muss keine besonderen Vorraussetzungen erf llen au er im Rahmen der Systemarchitektur erreichbar zu sein So kann es auf dem gleichen Rechner oder Rechnernetz liegen und seine Daten etwa per ODBC JDBC oder OLE zur Verf gung stellen Die Entwicklungsumgebung k nnte aber auch native Tr
135. sionen von FfA FfA 2 0 und Ff A97WWW sind f r unterschiedliche Systeme geschrieben und um es vorweg zu nehmen auf einem heutigen Standard PC funktioniert zun chst einmal keine der beiden Die im Prinzip interessantere Version FfA97 l sst sich zwar problemlos als Add In in Access installieren und als Tool aus einer Datenbank wie houses mdb aufrufen doch scheint im Code das Window Handling nicht sauber installiert zu sein Die bei ge ffnetem korrektem SQL String nicht zutreffende Fehlermeldung A select clause must be opened in the current window deutet darauf hin dass das aktuelle Fenster nicht erkannt wird Daf r lassen sich vielerlei Gr nde vorstellen Beispielhaft sei erw hnt das VBA landesspezifische Versionen herausgebracht hat so dass m glicherweise vergeblich nach einem Objekt gesucht wird das auf den polnischen Namen f r Window h rt Jedenfalls Konnte die Funktionalit t dieser Version nicht getestet werden FfA20 hingegen wurde f r ein heute veraltetes System geschrieben In einer Testumgebung unter Windows 3 11 arbeitete es einwandfrei mit Access 2 0 zusammen Allerdings funktionierte auch hier zun chst die Fensterreferenz nicht Dies lie sich allerdings wegen des editierbaren Quellcodes beheben Um es zu einer 32 bit Version von Windows zu portieren mussten im wesentlichen nur bestehende Aliase auf die neuen Windows32 DLL s Dynamic Link Libraries referenzieren 40 Kapitel 4 FfA Fuzzy for Ac
136. stem zum Anforderungsprofil geh ren Auf der anderen Seite sei das System in der Lage die effektiven Abfragemechanismen der g ngigen DBMS s zu nutzen b Bei der zweiten L sungsstrategie direct evaluation beruht die Architektur auf einem speziellen Fuzzy DBMS Abbildung 3 13 Dieses spezielle Datenbanksystem trennt die Query in elementare Unterfunktionen die mit Hilfe effizienter Algorithmen berechnet werden die als direkter Zugriff auf die Datenbank ausf hrbar sind Diese Funktionen k nnen beispielsweise Ermittlung des Sympathie Vektors Verkn pfung von Fuzzy Mengen Komplementbildung und hnliche sein Erste beispielhafte Implementierungen seien in Bo97 zu finden Das Erscheinungsdatum der Referenz war 1997 9 entspricht dem in dieser Arbeit beschriebenen cut 28 Kapitel 3 Stand der Technik Fuzzy D atenbanken user fuzzy query specific database BER or geen Seng processing system fuzzy queries results A cut Abbildung 3 13 Architekturmodell Direct Evaluation Die Effizienzsteigerung dieser Vorgehensweise l sst sich am Beispiel folgender Query nachvollziehen Select A from R where fq and exists select from S where fo and R A 0 S B Die Bedeutung der Terme im Einzelnen l sst sich in dem Artikel nachlesen erl utert sei aber der Zusammenhang zwischen der ersten und der zweiten Zeile der Query Die zweite Zeile der Query liefert n mlich eine eigene Tab
137. t ten Zugriff auf beispielsweise numerische Felder in Datenbanken vs unscharfe Abfragen in Information Retrival Systemen unabh ngig voneinander zu realisieren W hrend der Erl uterungen zu dem System wurde aufgezeigt unter welchen Bedingungen sich die Berechnung eines Zugeh rigkeitswertes auf einfache Matrizen Operationen beschr nkt womit dem Need for Speed Rechnung getragen wurde der f r kommerzielle Datenbank Anwendungen i A und im Falle umfangreicher Bewertungsfunktionen wie dieser im Besonderen als Nadel hr zu einer breiten Akzeptanz gesehen werden kann Ein weiteres wichtiges Augenmerk wurde darauf gelegt dass das System grunds tzlich lernf hig im Sinne der Theorie der Neuronalen Netze ist Das Problem des r ckwirkenden Fehlersignals kann zwar mit dem vorgestellten System nicht als gel st angesehen werden bietet aber eine gute Grundlage f r die Entwicklung eines solchen Systems Dabei wird sich das Performance Problem aber noch einmal deutlich versch rfen Zur L sung dieses Problems wird daher ein Offline Lernen in einem zweiten parallel laufenden System vorgeschlagen Mit dem vorgestellten System wird eine L sung f r alle gestellten Anforderungen bereitgestellt Existenz Fuzzy Value Fuzzy Relation Extended Fuzzy Relation Importance Complement 1 Normalform Mit der prototypischen Realisierung wird den Entwicklern von PIA ein Werkzeug an die Hand gegeben um die verschiedenen angeforderten Methoden in unters
138. t dessen ist er in digitalisierter Form auf CD beigef gt siehe Anhang A2 Inhalt der CD Die Software FfA fand sich auf dem FTP Server des Systems Research Instituts der Polish Acadamy of Sciences Mittlerweile existiert der Bereich auf dem Server nicht mehr Der WWW Server des Instituts http www ibspan waw pl schwieg sich seit jeher zum Thema FfA aus Ver ffentlichungen finden sich haupts chlich zur FfA Sprache FQUERY auf verschiedenen internationalen Konferenzen von den Autoren Kacprzyk J und Zadrozny S In dem erw hnten Verzeichnis fanden sich verschiedene Dateien und Versionen der Software Es sind dies die hier verwendete Version f r Access 2 0 und eine Version f r das neuere Access 6 0 gleichbedeutend mit Access97 Die neuere Version wartet zwar mit einigen neuen zum Teil w nschenswerten Features auf die in Abschnitt FfA97 Erweiterungen n her erl utert werden doch leider liegt sie nur in kompilierter Form vor so dass eine Anbindung an eine selbstdefinierte Schnittstelle nicht m glich war Die Vorg nger Version hingegen liegt mit Quelltext vor und das Institut hat auf Anfrage keine Einw nde gegen dessen Verwendung vorgebracht Man zeigte sich im Rahmen seiner zeitlichen M glichkeiten kooperativ Beide Versionen bestehen aus mehreren Dateien Eine readme txt gibt Installationshinweise houses mdb bietet eine Beispielsdatenbank in der H user angeboten werden Ffa_help hlp isteine Windows Hilfedatei zu dem Programm und
139. t es sich dass dieser Operator in der f r die prototypische Realisation verwendeten Software FfA implementiert ist Er bietet mit seiner F higkeit Verkn pfungsoperatoren frei zu definieren die M glichkeit sich von der Beschr nkung auf die 1 Normalform zu l sen 6 in SQL Notation siehe 4 4 Query D esign 20 Kapitel 3 Stand der Technik Fuzzy D atenbanken 3 2 4 cut In Fuzzy Mengen m ssen h ufig diejenigen Elemente identifiziert werden die gewissen Mindestanforderungen an eine Eigenschaft entsprechen Dieser Auswahlvorgang wird mittels des sogenannten Q cut s gel st Definition 3 2 a cut Sei A eine unscharfe Menge mit A x Hal xe X Dann hei t AoztxeXluu amp a der a Schnitt amp cut von A A ist eine scharfe Menge mit den Elementen xeX fiir deren Zugeh rigkeitsfunktion Ua x 2Q ist mit Oals positiver reeller Zahl Im Fall einer Normalisierung entsprechend Lait 0 1 muss oe 0 1 gelten Im Fall Vxe X ua x gt a spricht man auch von einem strengen a cut Dieser findet in der prototypischen Realisierung Anwendung Bildlich gesprochen werden alle Elemente des zu bewertenden Attributs deren Zugeh rigkeitswert einen bestimmten Schwellwert o berschreitet einer scharfen Menge Ag zugeordnet 3 2 5 Komplementbildung und weitere Modifikatoren Die Komplementbildung ist eine einfache einstellige Operation Ihre Bedeutung in der Fuzzy Logic ist eine Transformationsvorschrift zu liefern die beispielsweise
140. t jedenfalls eine deutlich einfachere Berechnung der Gewichtung als die in der Literatur vorgeschlagenen Varianten s o m glich zu sein 3 3 weitere Ans tze Neben den vorgenannten Ans tzen finden sich in der Literatur weitere Quellen die sich mit dem Thema Fuzzy Zugriffe auf Datenbanken in der einen oder anderen Weise auseinandersetzen Diese k nnen aus quantitativen Gr nden hier nur insofern angef hrt werden wie sie einen essentiellen Aspekt behandeln der noch einer genaueren Untersuchung bedarf oder als wichtige Literaturquelle dienen k nnen f r ein vertiefendes Studium bestimmter Problematiken 3 3 1 Erste Grundlagenarbeit FRDB Der vollst ndige Titel dieser Arbeit lautet Fuzzy relational data bases a key to expert systems KaZe84 verfa t von Maria Zermankova Leech als Dissertation an der Florida State University 26 Kapitel 3 Stand der Technik Fuzzy D atenbanken im Jahre 1984 mit Abraham Kandel als betreuendem Professor der noch heute eine wichtige Rolle in der Erforschung von Informationstechnologien spielt Die Arbeit als Buch weltweit ver ffentlicht wird zu Recht in beinahe jeder Arbeit zitiert die sich mit dem Themengebiet von Fuzzy Datenbanken auseinandersetzt da sie trotz ihres Alters von 16 Jahren ein solides theoretisches Fundament auf diesem Feld liefert Dem selbstgesteckten Ziel ein Schl ssel f r Expertensysteme zu liefern indes Kann sie heute nicht mehr gerecht werden Heutzutage beruhen E
141. tatements and Database Fuzzy Querying in Fuzzyness in Database Management Systems 1995 Heidelberg Physica Verlag eds P Bosc and J Kacprzyk BoPi93 Bosc P Pivert O On the Evaluation of Simple Fuzzy Relational Queries Principles and Measures in Fuzzy Logic State of the Art 1993 Boston Kluwer Acadenic Publishers eds R Lowen and M Roubens BoRu99 G Booch J Rumbaugh James I Jacobson Das UML Benutzerhandbuch 1999 Bonn Addison Wesley 3 8273 1486 0 Ca01 Celio Carreto Prototypische Realisierung einer interaktiven Benutzeroberfl che f r heterogene Kataloge Juli 2001 Technische Universit t Hamburg Harburg Arbeitsbereich Softwaresysteme Germany Diplomarbeit DeDo90 Deyi L Dongbo L A Fuzzy Prolog Database System 1990 Taunton England Research Studies Press Ltd 0 86380 102 1 Du91 Dutta S Approximate Reasoning by Analogy to Answer Null Queries International Journal of approximate Reasoning Vol 5 1991 pp 373 398 FaWi97 Fagin R Wimmers E Incorating User Preferences in Multimedia Queries 1997 Proc 6 International Conference on Database Theory Springer Verlag Lecture Notes 1 Computer Science 1186 KaYa84a Kacprzyk J Yager R R Linguistic Quantifier and belief Qualification in multi Criteria and multistage decision Making 1984 Control and Cybernetics 13 KaYa84b Kacprzyk J Yager R R Softer Optimisation and Control Models via Fuzzy Linguistic Quantifiers 19
142. te oder ein gew hnliches f r wenig so scheint es sinnf llig diesen unterschiedlichen M glichkeiten unterschiedliche Bedeutungen beizumessen So k nnte man z B mehr Wert auf ein besonderes Auto legen Diesem Zweck dient der Fuzzy importance coefficient der mit dem Wert Eins initialisiert ist und dem Intervall 1 0 entstammen muss Folglich lassen sich mit ihm einzelne subconditions abschw chen Dies kann einerseits bedeuten dass die Erf lltheit einer solchen abgeschw chten Subcondition in der ausgegebenen ranked list zu einer niedrigeren Einstufung f hrt oder aber dass sie wegen des a cuts dort gar nicht erscheint FfA erm glicht die Gewichtung der Subconditions nur in der Interpretation nach Zadeh 36 Kapitel 4 FfA Fuzzy for Access F r die Prototypische Implementierung gem dem PIA Objektmodell ist au erdem die Gewichtung der Kriterien Atoms notwendig Diese Funktionalit t und die Gewichtung von Subconditions nach OWA wurden im Rahmen dieser Arbeit zus tzlich implementiert 4 2 Implementierung 4 2 1 Versionen FfA bildet wie bereits erw hnt die Grundlage f r die prototypische Realisation der Fuzzy Datenbank Deshalb wird an dieser Stelle ein Abriss ber die Implementierung der Software gegeben Wegen der L nge des mehrere Tausend Zeilen umfassenden Quellcodes kann eine vollst ndige Erl uterung aber nicht erfolgen Der Code wird auch als zu lang erachtet um als Anhang beigef gt zu werden Stat
143. ten Modifizierungsfunktionen Jede Alternative ordnet jedem Element des linguistisch bewerteten Eingangswert eine Modifikation zu Im Falle dass kein Modifikator anzuwenden ist wird die Identit t verwendetet modgen X X Dagegen kann der Modifikator sehr durch mod en X X repr sentiert werden Nach den Modifikatoren wird die lokale Gewichtung ber cksichtigt Nach Fagin s Interpretation 3a muss dies im Zusammenspiel mit der Und Funktion geschehen Die PIA Interpretation 3b l sst dagegen ein sequentielles Vorgehen zu MDatternative ANDragin iok mod LV x Ys nach Fagin 3a MDatternative AND iok Ze mod LV x UI nach PIA 3b mit Lu 0 1 als Matrix der lokalen Gewichtung in der analog zu mod den Elementen des linguistisch bewerteten Eingangswerts Gewichtung zugeordnet wird jede Alternative ordnet jedem Element des linguistisch bewerteten Eingangswert eine Gewichtung zu ANDO ANDyagin 0 1 2 0 1 als Realisation des Und s und MDattemative 0 1 ist ZugehGrigkeitsvektor ber alle Alternativen Aternative score Diese kompakte Darstellung der Bewertung erfordert dass die Redundanzen im linguistisch bewerteten Eingangswert durch die Zuordnung von nullwertigen lokalen Gewichtungen eliminiert werden Dies l sst sich etwa mit Das Auto ist zu 0 4 rot aber das ist unwichtig interpretieren Um sich f r die weiteren Betrachtungen nicht unn tig auf eine der beiden I
144. tigt 77 Kapitel 7 Zusammenfassung und Ausblick In dieser Arbeit wurden fiir PIA die M glichkeiten des Einsatzes der Fuzzy Logic untersucht um die Zugeh rigkeit von Datens tzen zu ganz oder teilweise unscharfen Bedingungen zu ermitteln Die Bedingungen mussten der ersten Normalform gen gen und einzelne Bedingungen mussten sich mittels einer Gewichtung Importance abschw chen lassen Nach einer einf hrenden Betrachtung zu PIA die die Randbedingungen dieser Arbeit beschrieb wurden in knapper aber umfassender Form die Prinzipien St rken und Schw chen der Fuzzy Logic insbesondere in Hinblick auf Datenbankabfragen erl utert Anschlie end ergab ein ausf hrlicher Einblick in die Software FfA sowohl tiefere Einblicke in die praktischen Probleme des Einsatzes der Fuzzy Logic in Datenbanken als auch die Grundlagen zum Verst ndnis der prototypischen Realisierung die auf dieser Software basiert Nachdem solcherma en die Grundlagen des Problems erl utert waren wurden die beiden weiteren Ergebnisse dieser Arbeit pr sentiert Der L sungsentwurf und die prototypische Realisierung Der L sungsentwurf gr ndet auf dem Entwurf einer neuen selbstentwickelten Systemarchitektur die den Einsatz der Fuzzy Methodik als Modul zul sst dass in die Kommunikation zwischen DBMS und DBE geschaltet wird Dieser modulare Ansatz l sst einerseits die Integration in bestehende Systeme zu und bietet andererseits die M glichkeit einzelne Funktionali
145. tigt mit der sich gleichformatige Matrizen elementweise miteinander multiplizieren lassen Definition 5 2 e e V W R R E mit V Vik W Wik e R und e V W V eW Vik d Wix Im vorangegangenen Abschnitt 1 Fuzzifikation wurde dargestellt dass es im Falle des vollst ndigen AFR s n tzlich sein k nnte die Evaluierung der Modifikatoren nicht schon bei der Fuzzifizierung der Eingangswerte vorzunehmen um nicht unn tig viele linguistisch bewertete Eingangswerte vorzuhalten Wenn man die Modifikatoren in den AFR verlegt und definiert dass in einer Alternative nicht gleichzeitig verschieden modifizierte Linguistische Werte als Bedingung genannt werden 15 Anstelle des 9 in der Definition wird hier ein i verwendet 58 Kapitel 5 Losungsentwurf d rfen Bsp Ein Auto das klein und sehr klein ist so erh lt man zur Realisierung der Modifikatoren die nachfolgend beschriebenen Varianten a und b Dagegen beschreibt c die Und Komposition wenn die Modifikatoren w hrend der Fuzzifikation eingebunden wurden a Berechnung von Aternative score mit Modifikatoren auf Ebene der lokalen Gewichtung explizit Die Modifikation ist unabh ngig von der lokalen Gewichtung muss allerdings in der Reihenfolge zuerst ausgef hrt werden mod LV x Fr 0 1 4 0 1 Px ist eine Matrix von Modifizierungsfunktionen mit p ist Komplexit t der Oder Komposition von Interest und F n ist der Raum aller definier
146. tionale Unterklassen gegliedert wurden die als Pseudo Sub bezeichnet wurden 13 An Prozeduren wurden nur die beiden wichtigsten aufgefiihrt FfA_ProcessQuery und FfA_MD FfA_ProcessQuery ist ein vorbereitender Vorgang in dem der Pseudo SQL Code von FfA in giiltige Access Syntax transferiert wird Am Ende dieses Parse Vorgangs wird das entstandene SQL Statement evaluiert In ihm enthalten ist ein Prozeduraufruf FfA_MD quasi eine Access Stored Procedure Sie f hrt die Berechnung des MDs ber alle Datens tze aus und erzeugt das Neue Attribut MD Schlie lich wird eine tempor re Tabelle erzeugt die alle Datens tze enth lt deren MD die Threshhold Schwelle berschritten haben Per OLE wird diese von d2a exe als Html in der gemonitorten Datei gespeichert und vom Server an den Client weitergegeben rom Loic ew saveAsHtmid vop enCurrentD ata base d Ta ole db from Logica Mem er GFAP rocesQuend V El Era ProcesQue eege VDedare_Vara SP rocessSOLQ SunttledO Sdedare var VcloseD BD compute abm Sinitvars rund PO PseudoSub aed Pee m A SCheckCriteiaTypO PQ InitVars_TranstormSQL SfetchP arameten MD_P roces nterest o ncat pue Vordergloba Dan Sout OutCritenad PAggegateNew sq Ko PQ ProcessAltematives Be a Ss etOrderOptiond LE Fauantyfier loo PoutOutAltrem ative 10 globalQuant Abbildung 6 4 ffa Class Diagramm Query 74
147. turierter Information Datenbanken und unstrukturierter Information Texten soll ber cksichtigt werden St97 PIA ber cksichtigt dies in einem Dom nen Modell siehe 2 3 Das PIA Dom nenmodell Das offene Modell sieht weiter vor Beschreibungen beliebiger Produkte und Dienstleistungen als Daten verwalten zu k nnen Dieser Ansatz birgt einige Konflikte in semantischer Hinsicht So hat das Wort teuer eine andere Bedeutung wenn man es auf Butter bezieht als wenn es den Preis eines Hauses bewertet Das gegenw rtige Objektmodell ist im Abschnitt 2 2 Objektmodell beschrieben Es ist Ergebnis einer Studienarbeit am Arbeitsbereich STS Zh98 Die unscharfen Suchanfragen werden dagegen in dieser Arbeit theoretisch untersucht und prototypisch implementiert Sie umfassen Queries in der ersten Normalform auf numerischen hierarchischen und Volltext Dom nen wie im weiteren Verlauf der Arbeit noch erl utert werden wird Gerade wegen der Ma gabe einer prototypischen Umsetzung der Aufgabe wurde in dieser Arbeit ein besonderes Augenmerk auf eine solide theoretische Grundierung des Themas gelegt Die Realisierung der Personalisierung des Systems ist ein noch offenes Problem gleichwohl es m ndliche Anforderungsspezifikationen gibt die in den einzelnen Arbeiten zu PIA ber cksichtigt werden und auch im L sungsentwurf dieser Arbeit ihren Niederschlag finden Da diese Arbeit Teil eines fortlaufenden Entwicklungsprozesses ist sind die folgenden Beschrei
148. values list Graph refreshing strategy Any change Record change Refresh button push Refresh Close Name pari par2 par3 par4 Datensatz 14 4 I 1 gt gt t gt von 11 Abbildung 4 6 Editier Fenster Fuzzy Values Fuzzy Attribute editieren Bei der Zuordnung eines Minimal und Maximalwert zu Attributen gelangt man nach Ausl sen des FA Buttons der Toolbar direkt in den Editiermodus Es wird ein Formular ge ffnet mit dessen Hilfe sich die UL und LL Werte in eine Tabelle eintragen lassen Die vier genannten Fuzzy Funktionen lassen sich alternativ auch direkt in den Tabellen FfA_Attributes FfA_Fuzzy Relations FfA_Fuzzy Values und FfA_Linguistic Quantifiers editieren wenn das Add In direkt d h als Datenbank ge ffnet wurde 4 4 FfA97 Erweiterungen Die zweite unter den ffentlich zug nglichen Versionen der Software FfA97 zeichnet sich durch einige funktionale Erweiterungen aus die nicht untersucht werden konnten da sich die Software nicht starten lie Ihre englischsprachige Erl uterung die der Hilfefunktion des Systems entnommen wurde findet sich im Anhang Es handelt sich um Fuzzy set constants Compatibility operator Single and multi valued attributes Fuzzy set constants sind dabei nicht im Sinne eines kombinierten Fuzzy Attributs zu verstehen wie es im L sungsentwurf beschrieben ist Es scheint sich dabei vielmehr um eine M glichkeit zu handeln Elemente einer hierarchischen Dom
149. xpertensysteme n mlich nicht mehr prim r auf den Techniken der Fuzzy Logic sondern auf ausgefeilten Methoden der Wissensrepr sentation der Verkettung von Regeln und des approximativen Schlie ens sowie effizienten Suchalgorithmen in gro en L sungsr umen Die Fuzzy Logic spielt in diesen Ans tzen nur noch eine untergeordnete Rolle im Sinne eines mathematischen Instruments Maria Zermankova Leech hebt in ihrer Arbeit ausschlie lich auf die Aspekte der Speicherung und Verarbeitung unpr ziser Daten sowie des unscharfen Schlie ens ab Da in dieser Arbeit von pr zisen Daten ausgegangen wird und der Schlu folgerungsproze dem User bertragen wird sei diese Arbeit lediglich wegen Ihrer grunds tzlichen Relevanz erw hnt 3 3 2 Fuzzy Prolog databases In dieser Quelle finden sich wichtige Hinweise zur Behandlung des in der Datenbankwelt immer wieder kritischen Problems von Nullwerten Damit ist die Behandlung von Unbestimmtheit in einzelnen Datenfeldern gemeint also etwa wenn das Baujahr eines Autos schlicht nicht angegeben wird Neben der M glichkeit andere Merkmale des Datensatzes in semantische Beziehung zu dem fehlenden Wert zu setzen werden in dieser Arbeit Wege aufgezeigt ber Wahrscheinlichkeitsverteilungen sogenannte FEV s Fuzzy Expected Values zu definieren Vergleiche hierzu auch Du91 Approximate Reasoning by Analogy to Answer Null Queries 3 3 3 Architekturmodelle Bosc und Pivert beschreiben 1997 in ihrem
150. y Datenbank Anfragen wurde die Software FfA modifiziert Siehe Kapitel 4 FfA Das erzeugte System besteht aus mehreren Teilen und ist im Sinne des eben beschriebenen Objektmodells eine Realisation der Methode score des Objekts condition Neben dieser Schnittstelle FfA PIA ist die Zweite die relationale Datenbank die derzeit in PIA die angestrebte objektorientierte Datenbank simuliert 7 file system interenet server ae ra Zaue aller Sam onitorF ilet ogi interface action 0 posti action_executed d Ge E DW w Zoncloser GG Sat _ name created Jeleter aS cals A htn l docu ment ecutables Een unt A A dh file e es eg Sc reateGle Object MS DB engine A See Be 5 nitialize varst ScreateSOLStringt MS Access save AsHtm it Opent urrentDatabasel calls A ffa_ole db KC IDCeszGOusret als Abbildung 6 1 main class diagramm Client Abfragen werden in einer dreischichtigen Architektur bearbeitet 1 Ein Webbrowser erm glicht den komfortablen Entwurf einer Abfrage und dient der Darstellung des Ergebnisses 68 Kapitel 6 Ergebnis 2 Ein in Delphi geschriebenes CGI Programm bereitet die Daten auf und vermittelt zwischen einem Windows Webserver und der eigentlichen Applikation 3 Die in VBA geschriebene Access Applikation FfA wird per OLE von dem CGI Programm gesteuert und ermittelt die Ergebnismenge Das System wird mittels verschiedener
151. ziplin des Soft Computings vereint und erweitert Sie besteht aus Disziplinen wie Fuzzy Logic K nstlichen Neuronalen Netzen Genetischen Algorithmen verschiedenen Ausl ufern der KI u A Dies geschieht mit dem Ziel der Synergie Der Ansatz steht damit im Kontrast zu der oft als dogmatisch empfundenen Position der KI Die K nstliche Intelligenz wie sie sich in den Ingenieurswissenschaften etabliert hat versteht Denken als eine effektive Suche in gro en L sungsr umen Dies ist eine Spielart der KI bei der versucht wurde die verwertbaren Forschungsergebnisse praktisch umzusetzen Man unterscheidet beste L sung erste gefundene L sung und L sung einer bestimmten Mindestqualit t Hybridform der vorgenannten Der L sungsraum muss hierf r in Form eines Netzes von m glichen Varianten vorliegen Auf diesem Netz werden dann effektive Suchalgorithmen eingesetzt Neben der Effektivit t der Suche spielt die Sprache die zweite ma gebliche Rolle in der maschinellen Wissensverarbeitung Wir kennen verschiedene Formen von synthetischen und nat rlichen Sprachen Zu den synthetischen Sprachen geh ren z B die Systemmodellierungssprachen der objektorientierter Programmierung wie UML BoRu99 Unified Modeling Language die in dieser Arbeit verwendet wird Dabei versucht man zun chst Zusammenh nge und Abh ngigkeiten im System so pr zise wie m glich und n tig darzustellen um dann Abl ufe beschreiben zu K nnen Das System wird gedanklich du
152. zzy Relation M glichkeit das Attribut mit einer bin ren Funktion zu bewerten Vergleichswert der Fuzzy Relation Parameter f r den Fall einer gesetzten bin ren Bedingung Mit dem aus diesen Elementen gebildete Formular wird die Query formuliert Wenigstens eine Bedingung mu gesetzt sein Sowohl den Atomen als auch den Subconditions lassen sich Gewichtungen zuschreiben deren Interpretation sich einstellen l sst Voreingestellt ist die Interpretation nach Fagin Die Evaluierung wird ber den Go Button ausgel st Die Datei l sst sich als cgi win query form exe aufrufen Optional k nnen die Parameter zeilen spalten und advanced per get Parameter bergeben werden etwa http localhost cgi win query form exe zeilen 3 spalten 4 amp advanced true Das Formular kann damit auf bis zu 10 Zeilen und bis zu 10 Spalten erweitert werden Wenn advanced true gesetzt wird erscheinen die erweiterten Eingabeoptionen mit denen sich beispielsweise die Interpretation der Gewichtung w hlen l sst Ohne diesen Parameter erscheint das Formular nur mit den wichtigsten Eingabeoptionen Per Voreinstellung besteht die Query aus 2 Zeilen und 2 Spalten Der erzeugte Html Code l sst sich mit der Datei query cfg manipulieren Hier kann man beispielweise einstellen welche Fuzzy Values man zur Auswahl stellen m chte 6 2 Die Schnittstelle C2a exe Der Name der Schnittstelle steht f r CGI to Access Grundidee dieser Delphi App
Download Pdf Manuals
Related Search
Related Contents
AR-R5800 User Manual Informações Essenciais para o Aerospray" AFB Slide Stainer CÉLULA / SENSOR ION-SELETIVO CLORO LIVRE INORGÂNICO MS189 Soundsation User Manual Índice Model 260 and 260/Timer User`s Manual J A 全国大会 Intel Pentium 4 3.20 GHz Descargar - Zebra Technologies Corporation Copyright © All rights reserved.
Failed to retrieve file