Home

Entwicklung einer Querycollection (Diploma Thesis, Juli 97)

image

Contents

1. T Zuk nftige Top Domains ARTS Kunst REC Freizeit Erholung NOM Privatpersonen STORE Firmen INFO Informationen FIRM Firmen WEB Provider i Tabelle 3 zuk nftige Top Domains im Internet 2 INTERNET 22 2 4 Dienste Im Internet werden verschiedenste Dienste angeboten die zur Kommunikation synchron oder asynchron und f r den Transport von Daten verwendet werden Ihnen allen ist gemeinsam da sie weltweit genau definiert sind und daher im gesamten Internet verwendet werden k nnen Das Basiskommunikationsprotokoll ist immer das Internet Protokoll IP Auf dieses wird dann meist TCP oder UDP aufgesetzt Krol 94 2 4 1 Email Email ist das elektronische quivalent zum Versenden eines Briefes mit der Post Um emails verschicken oder empfangen zu k nnen ben tigt man einen Computer ein Modem eine g ltige email Adresse und ein email Programm Mit email ist es sehr einfach an eine einzelne Person oder an eine bestimmte Gruppe von Personen eine Nachricht zu schicken Weiters besteht auch die M glichkeit zus tzlich zum eigentlichen Text noch Dokumente Bilder Tabellenkalkulationen oder Programme mitzuschicken Email Programme bieten meist folgende Funktionen Ce Eine email wird gleichzeitig an mehrere Personen verschickt Jeder Empf nger erh lt zus tzlich eine Liste an wen diese email noch verschickt worden ist Bee Eine email wird gleichzeitig an
2. Ein weitere Einschr nkung des menschlichen Gehirns ist das es Informationen wesentlich leicher wiedererkennen kann als die gleichen Informationen aus dem Ged chtnis abzurufen Auch dies kann mit graphischen Benutzeroberfl chen ber cksichtigt werden Es f llt Menschen wesentlich leichter Icons das sind kleine Graphiken die eine ganz bestimmte Bedeutung haben z B die Zeichen an der T re zur Unterscheidung zwischen Herren und Damentoilette und ihre Bedeutung wiederzuerkennen als sich ein bestimmtes Kommando aus dem Ged chtnis abzurufen Als Klassisches Beispiel kann der Unterschied angef hrt werden wie in einem kommandoorientierten Betriebssystem z B MS DOS bei PCs und einem graphischen z B Apple Macintosh oder Microsoft Windows95 eine Datei gel scht werden kann Beim kommandoorientierten Systemen mu sich der Benutzer einen Befehl merken in diesem Fall delete beim graphischen klickt er die Datei mit der Maus an und zieht sie zu einem virtuellen Papierkorb in dem diese Datei dann verschwindet Wenn dieses Prinzip des Wiedererkennen anstatt Erinnern konsequent angewandt wird kann es die Benutzung eines Computers oder eines Programmes wesentlich vereinfachen 4 3 5 Wissen und mentale Modelle In der Erforschung der Mensch Maschine Kommunikation versucht man durch neue Erkenntnisse ber das menschliche Wissen und mentaler Modelle die Einlernzeit die oft auftretenden Fehler und die Einfachheit mit der Benutzer eine g
3. HTML und das World Wide Web O Reilly Internat Thomson Verlag 1995 JORGE STEFFEN HTML 3 2 Referenzhandbuch Sybex Verlag 1996 KROL ED The Whole Internet User s Guide O Reilly amp Associates Inc 1994 amp Catalog KRUGLINSKI DAVID J Inside Visual C Microsoft Press 1993 KUHLEN RAINER Datenbasen Datenbanken Netzwerke Praxis des Information Retrievals K G Saur 1980 KyAs OTHMAR Internet Utilities Datacom Verlag 1994 Zugang Nutzung LANCASTER F W Academic Press 1978 Toward Paperless Information Systems LAUREL BRENDA Publishing Company 1991 Computers as Theatre Addison Wesely LIPPMAN STANLEY B The C Primer Addison Wesley 1991 Liu CRICKET PEEK JENNY JONES RUSS Managing Internet Information Services O Reilly Verlag 1994 MARY E Morris S HINRICHS RANDY J Web Page Design SunSoft Press 1996 MAURER RAINER HTML und CGI Programmierung dpunkt Verlag fiir digitale Technologie 1996 MAURER HERMANN Hyper G now Hyperwave Addison Weseley 1996 The Windows Interface Guidelines for Software Design Microsoft Press 1995 MRESSE M Information Retrieval Eine Einf hrung B G Teubner 1984 NIEDERST J FREDDMAN E Designing for the Web O Reilly 1996 7 REFERENZEN 106 Preece 94 Raitt 84 Rowley 87 Salton 68 Schwartz 94 Sengstack 96 Shneider 92 Stroustrup 91 Till 95 Wilson 95 Witten 94 PREECE JE
4. e Im unteren Bereich befinden sich die Navigationselemente um sich durch die einzelnen Seiten des Wizards zu bewegen Back Next den Wizard abzubrechen Cancel die Hilfe aufzurufen Help oder den Queryform Wizard sofort das Formular mit den aktuellen Einstellungen fertigstellen lassen Finish e Im rechten Fenster befindet sich ein HTML Viewer in dem nach jedem Bet tigen des Kontrollelementes Refresh das aktuelle Aussehen des Such bzw Eingabeformulares dargestellt wird Mit dem Kontrollelement Maximize kann das Fenster des HTML Viewers vergr ert werden um einen besseren berblick zu erhalten e Im linken Bereich des Wizards befinden sich die Eingabeelemente zur Gestaltung des Formulares 6 QUERYCOLLECTION F R HYPERWAVE 93 6 5 3 1 Einstiegsseite Auf der ersten Seite des Wizards erh lt der Benutzer eine kurze Erkl rung ber die Nutzungsm glichkeiten dieses Wizards und wird dann gefragt ob er ein neues Formular erzeugen m chte oder ein bereits existierendes Formular ver ndern Wenn ein bereits existierendes Formular ver ndert werden soll so erscheint eine Dialogbox mit der man das gew nschte Formular ausw hlen und laden kann Durch Dr cken des Kontrollelementes Next gelangt man zur n chsten Seite des Wizards Einschr nkungen Wenn man sich f r eine der beiden M glichkeiten entschieden hat kann man diese Entscheidung nicht mehr r ckgangig machen Man mu den
5. Cancel Button dr cken und den Queryform Wizard erneut starten Alle weiteren Entscheidungen bez glich Inhalt und Design des zu erstellenden Formulares sind reversibel Die Kontrollelemente Refresh und Maximize sind auf dieser Bildschirmseite noch nicht aktiviert da noch keine Entscheidung ber das Aussehen des Formulares getroffen wurde Queryform Wizard In this window you This wizard will help you quickly create modify a queryform for your querycollection will see a previews of your form Do want to create a new or modify an existing querpform To update the content of this window you can press the Refresh button C Modify an existing queryform To begin working on your queryform click Next Bild 1 6 QUERYCOLLECTION F R HYPERWAVE 94 6 5 3 2 Titel und Beschreibung des Formulares Hier wird nach dem Titel des Formulares gefragt und nach einer kurzen Beschreibung Diese Beschreibung soll zuk nftigen Benutzern als Hinweis dienen wie diese Querycollection genutzt werden kann und welche Informationen der Benutzer erhalten kann Auf dieser Seite besteht jetzt die M glichkeit durch Dr cken des Navigationselementes Refresh sich einen berblick ber das vorl ufige Aussehen des Formulares zu machen Der Titel und die Beschriftung des Formulares k nnen auch sp ter jederzeit wieder modifiziert werden ohne die Eingabefunktionalit t zu beeeinflussen Queryfo
6. Duch eine gleichzeitige Aufnahme mit einem Tonbandger t oder einer Videokamera ist es dann bei der Auswertung leicht m glich die Gedankeng nge des Testers nachzuvollziehen Die Testergebnisse werden abschlie end ausgewertet und allen Mitarbeitern des Designteams zur Verf gung gestellt um auf deren Basis die aufgetretenen Probleme bei der Nutzung des Produktes zu beheben 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL 5 1 Was ist Information Retrieval IR Unter Information Retrieval wird im weitesten Sinne des Wortes jede Art der Wiedergewinnung maschinell gespeicherter Daten verstanden Mresse 84 Lancaster 78 Salton 68 Die Entwicklung dieses Wissenschaftszweiges der Informatik liegt an der zunehmenden Flut von Informationen in Form von B cher Zeitschriften und elektronischen Medien Ein weiterer Grund ist die zunehmende Automatisierung in B ros durch die Anwendung von kleinen leistungsf higen Computern im Zusammenhang mit den M glichkeiten die das Internet bietet Der Begriff Information Retrieval sagt aber noch nichts ber die Art der Wiedergewinnung der Information aus Erst seit einigen Jahren gibt es IR Systeme die einen interaktiven Dialog mit dem Benutzer erlauben Davor wurden Anfragen an das Informationssystem nicht pers nlich sondern nur ber einen Experten den Operator durchgef hrt und es konnte durchaus ein paar Tage dauern bis die Antwort gel
7. HTML ist das Standard Format bei der Gestaltung von Hypertexten 2 4 5 3 HyperText Markup Language HTML Der Grundstein f r die Entwicklung von Hypertext wurde 1945 von Vannevar Bush gelegt In seinem Artikel As We May Think im The Atlantic Monthly prognostizierte er da der Fortschritt der Wissenschaft stagnieren wird weil die Forscher nicht mehr in der Lage sein werden relevante Informationen schnell zu finden Um diesem Problem entgegenzuwirken stellte er sein System Memex vor Dieses System soll in der Lage sein Dokumente zu verwalten Die Verbindung zwischen den Dokumenten soll durch Links erfolgen Weiters soll es auch die M glichkeit sogenannter trails geben das sind vordefinierte Wege durch eine Auswahl von Dokumenten zu einem bestimmten Thema Wegen der damals begrenzten technischen M glichkeiten konnte Memex nicht in der Praxis erprobt werden Trotzdem hat Bush schon damals auf einige wichtige Funktionen hingewiesen die heute noch immer ihre Notwendigkeit haben schneller Zugriff auf Informationen die M glichkeit Dokumente zu annotieren Dokumente miteinander zu verlinken und die Links zu speichern 1965 stellte Theodor Holme Nelson erstmals den Begriff Hypertext vor Sein Ziel war es mit dem Projekt Xanadu ein System zu schaffen mit dem die gesamten Publikationen der Menschheit gespeichert werden k nnen Jeder Zugriff auf ein Dokument soll dem Nutzer einen sehr kleinen Geldbetrag kosten der dann dem Autor des Dokume
8. Wird momentan noch sehr selten verwendet da es noch keine Systeme gibt die die Komplexit t der menschlichen Sprache beherrschen Der Vorteil w re es den Anwendern eine Einlernphase die bei allen anderen Interaktionsstilen notwendig sind zu ersparen Nachteile liegen darin da der 4 MENSCH MASCHINE KOMMUNIKATION 58 Computer immer nachfragen mu ob er die Eingabe richtig interpretiert hat und das viel Text eingegeben werden mu um eine gew nschte Aufgabe zu umschreiben direkte Manipulation Der Anwender kann direkt mit Objekten arbeiten er sieht immer genau wie sich seine Befehle auf die Objekte auswirken Heute verwenden fast alle Systeme diesen Stil Die Vorteile sind eine visuelle Pr sentation der Daten die geringe Einlernzeit die hohe Merkbarkeit ber die Zeit die M glichkeit Fehler zu verhindern die hohe subjektive Zufriedenheit dem Gef hl das System zu beherrschen und die M glichkeit mit dem System zu experimentieren Die Nachteile bestehen aus dem gro en Aufwand diesen Stil zu programmieren in der Notwendigkeit schneller graphischer Darstellungsm glichkeiten und in Schwierigkeiten bei Personen die visuelle Probleme haben Allgemeine Designprinzipien nach Apple87 Micro95 Foley90 Metapher aus der realen Welt Verwendung von konkreter und klarer Metapher soda Anwender gewisse Erfahrungen der realen Welt in einem System anwenden k nnen Wenn die M glichkeit besteht sollen diese Metapher durch visuell
9. tzlich in einem Cache f r weitere Anfragen zur Verf gung gehalten Zus tzlich werden noch CGI Scripts gestartet und deren Ergebnisse an die Clients zur ckgeliefert 3 HYPER G HYPERWAVE 29 Link Server Object Server Dies ist eine objektorientierte Datenbank die Objekte und ihre Verbindung untereinander speichert und verwaltet M gliche Objekte in Hyperwave sind Dokumente Collections Anker User Usergruppen usw Der urspr ngliche Name Link Server liegt daran da hier auch die vollst ndigen Informationen ber die Hyperlinks gespeichert sind Eine weitere Aufgabe dieses Prozesses ist es jedem Objekt eine weltweit eindeutige ObjektID zuzuordnen unter der dieses Objekt angesprochen werden kann Beim Einf gen eines Objektes werden die Links von diesem Objekt getrennt und als eigenst ndige Objekte in der Datenbank abgelegt Zus tzlich werden hier noch die Attribute Metainformation eines Objektes und auch seine Zugriffsrechte verwaltet Full Text Server Dieser Proze verwaltet den inverted index aller Dokumente am Server um bei einer Suche schnell Ergebnisse lieferen zu k nnen Jedes Textdokument da im Server gespeichert wird wird zus tzlich in den Index aufgenommen 3 2 3 Datenmodell Hyperwave basiert auf einer objektorientierten Datenbank die speziell f r die Anforderungen eines verteilten Informationssystemes entwickelt wurden Die Daten in der Datenbank sind Objekte und ihre Beziehungen untereinander Je
10. Auswahl Hier entf llt das Eingeben der Deskriptoren Diese werden automatisch automatic indexing vom IRS nach einem bestimmten Auswahlverfahren gew hlt Alle automatischen Auswahlverfahren k nnen erst dann effizient eingesetzt werden wenn s mtliche Deskriptoren automatisch auf ihre Grundform oder ihren Wortstamm reduziert werden k nnen Unterschiedliche Schreibweisen sind auf eine Standardschreibweise zu reduzieren Einige bliche Methoden zur automatischen Deskriptorenauswahl e Auswahl aufgrund von Wortlisten Nur diejenigen W rter werden als Deskriptoren verwendet die auch in einer Wortliste Thesaurus enthalten sind Der Thesaurus mu unabh ngig von der Datenbank im Voraus definiert werden e Auswahl mit Hilfe von Stoppwortlisten Aus den Texten werden alle W rter ausgew hlt die nicht in einer Stoppwortliste auch Anti Thesaurus vorkommen Der Vorteil dieser Methode liegt darin begr ndet da durch die Stoppwortliste W rter wie und der die das nicht als Deskriptoren aufgenommen werden Nachteil Eine Suche nach z B dem Hamlet Zitat Sein oder Nichtsein funktioniert dadurch nicht Frakes 92 77 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL Auswahl aufgrund einer weitergehenden Textanalyse Als Erg nzung zu einer der genannten automatischen Verfahren kann der gesamte Text zur Bildung von zusammengesetzten Deskriptoren berpr ft werden Durch eine Analyse des Dokumentes kann ein einzelnes Wort das
11. Einbindung anderer Internetprotokolle Gopher Telnet ftp m glich 1993 entwickelte das National Center for Supercomputing NCSA den ersten graphischen Browser MOSAIC Mit diesem Browser war es erstmals m glich verschiedene Schriften und auch Bilder innerhalb des Hypertextes darzustellen Damit war das WWW das erste System mit dem es auf einfache Weise m glich war optisch 2 INTERNET 24 ansprechende Information anzubieten Dies war der Grundstein f r den gro en Erfolg und die weite Verbreitung des WWW 2 4 5 2 Konzept des WWW WWW ist in der offiziellen Beschreibung ein Internet wide distribution hypermedia informationretrieval system weltweites verteiltes Hypermedia Informations abfragesystem welches Zugriff auf eine sehr gro e Datenmenge bietet WWW benutzt wie viele ander Applikationen im Internet das Client Server Modell Die Clients sind nicht mehr als eine Sammlung von Programmen welche Anfragen an einen Server schicken k nnen und die Antworten des Servers dann am Bildschirm visualisieren Der Server ist ein Programm das auf die Anfragen der Clients wartet und dann entsprechende Information an die Clients zur ckliefert Damit dieser Informationsflu m glich wird wurden 3 Standards definiert Der Uniform Resource Locator URL dient als ein konsistentes und kompaktes Adressierunsschema Das Hypertext Transfer Protocol HTTP schafft die Voraussetzungen f r die Daten bertragung und die Hypertext Markup Language
12. Eingabe und die Suche der Metainformation Dieses Formular wird als HTML Dokument mit dem Attribut PresentationHint FullCollectionHead in der Querycollection gespeichert Bei jedem Dokument da der Autor in die Querycollection einf gt mu er zus tzlich das Formular f r die Metainformation ausf llen Danach wird das Dokument mit der Metainformation die sich im Attribut Keywords befindet am Server gespeichert 6 3 2 Benutzung Beim Betreten der Querycollection erscheint nur das Suchformular f r die Metainformation Durch Eingabe von Suchkriterien und Starten der Suche werden jene Dokumente in der Querycollection angezeigt deren Metainformation den Suchkriterien entspricht 6 QUERYCOLLECTION F R HYPERWAVE 91 6 4 Anwendungsbeispiele 6 4 1 Bibliotheksdatenbank Das Dokument selbst ist eine textuelle Zusammenfassung des Inhaltes des Buches M glichkeiten f r die Metainformation w ren Informationen ber das Buch Titel Autoren Verlag Erscheinungsjahr Auflage Kaufpreis Informationen ber die Verwaltung des Buches Signatur Fach oder Themenbereich Datum des Ankaufes Name und Adresse des Ausleihers des Buches Datum der Ausleihe 6 4 2 Personendatenbank Das Dokument selbst ist ein Bild der Person Metainformation Vorname Zuname Wohnadresse Geburtsdatum Geschlecht Arbeitsbereich Qualifikationen 6 4 3 Audio Videodatenbank Das Dokument selbst ist eine Audio oder Videodatei Metainformat
13. Menschen benutzt Daher ist es sehr wichtig Computersysteme so zu entwerfen da diese nicht nur von einigen wenigen Experten benutzt werden k nnen sondern von allen Personen die jemals auf diesem System arbeiten werden Mensch Maschine Kommunikation besch ftigt sich mit dem Verstehen Design Evaluierung und Implementierung von interaktiven Computersystemen 4 1 2 Warum Mensch Maschine Kommunikation Als 1950 die ersten kommerziell zu erwerbenden Computer auf dem Markt erschienen waren sie nur von speziell eingeschulten Experten nutzbar Die Gr nde daf r lagen auf der Hand Diese Ger te waren sehr teuer und im Vergleich dazu die Kosten f r die Experten sehr gering Sie wurden daher nur von einer kleinen Gruppe von Menschen Techniker Ingenieuere Wissenschaftler genutzt die auch in der Lage waren mit Lochkarten zu programmieren Au erdem wu te noch niemand wie man die Bedienung vereinfachen k nnte bzw erfolgten dar ber noch keine Forschungen Heute hat keiner dieser Gr nde mehr G ltigkeit Computer sind billig sehr viele Menschen arbeiten damit und es gibt etliche Forschungsergebnisse wie man die Nutzung vereinfacht Durch die Entwicklung des Siliziumchips und die damit verbundene Miniarturisierung und Kostensenkung bei gleichzeitiger Rechengeschwindigkeit und Speicherkapazit tssteigerung haben sich die Anwendungsm glichkeiten vervielfacht Ein weiterer Meilenstein war die Entwicklung der Personal Computer PC in den 7
14. Programmierer keine Probleme haben mit einer Kommandosprache zu arbeiten die auf der Basis von Erinnerungen und boolscher Logik arbeitet Allerdings sind die meisten Benutzer eines Computers keine Programmierer 4 MENSCH MASCHINE KOMMUNIKATION 59 e Konsistenz Gute Anwendungen sind in sich selbst und mit anderen Programmen konsistent In Microsoft Windows sind z B sehr viele Funktionen bei allen Programmen gleich Durch Konsistenz erh lt man das Gef hl da die Anwendung vertraut und ihr Verhalten vorhersagbar ist Konsistenz in einem System bedeutet Konsistenz in allen Produkten im Betriebssystem und in den verwendeten Metaphern e WYSIWYG What You See Is What You Get Der Anwender soll jederzeit und sofort sehen k nnen wie sich seine Befehle auf seine Daten auswirken Es sollen z B keine Unterschiede zwischen einen am Bildschirm dargestellten Brief und seinem auf Papier ausgedrucktem Gegenst ck sein e Anwender kontrolliert das System Die Aktion soll vom Benutzer ausgehen und nicht da er auf das System reagieren mu F r ihn ist es ein sehr positives Gef hl zu erkennen da er die Kontrolle ber den Computer hat und nicht umgekehrt Er w rde sich sehr bald eingeschr nkt f hlen wenn der Computer ihm jeden Schritt genau vorschreibt der ausgef hrt werden mu Eine Ausnahme sind Assistenten die ihn durch eine sehr komplexe Aufgabenstellung leiten e R ckmeldungen des Systems Der Anwender m chte immer genau ber d
15. Sinn der Abfrage ein wichtiger ein wichtiger sehr genau 5 6 6 Zusammenfassung Ein m gliches Vorgehen in der Praxis bei der Deskriptorenauswahl 1 Die einzelnen W rter im Volltext identifizieren 2 Mit einer Stoppwortliste die nicht relevanten W rter ausscheiden Agosti 96 3 Automatische Wortstammextraktion abschneiden von Pr und Suffixen stemming Agosti 96 Salton 68 Frakes 92 4 Zu seltende Deskriptoren werden unter Anwendung des Thesaurus durch andere Deskriptoren ersetzt 5 zu h ufige Deskriptoren werden mit anderen W rtern des gleichen Satzes kombiniert 6 Berechnung der IDF Funktion f r alle Wortst mme und alle abgeleiteten und zusammengesetzten Deskriptoren f r alle Texte 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL Einige dieser Methoden sind sehr zeitintensiv wi z B die textbezogene wiederholte Neuberechnung der IDF die bei jeder Neuaufnahme f r alle Dokumente durchgef hrt werden mu Andere erfordern wiederum viel Speicherplatz Der Umfang von Thesauri kann sehr gro werden und die Wortstammsuche erfordert unter Umst nden das Vorhandensein ganzer W rterb cher 5 7 Auswahl mit R ckkopplung relevance feedback Unter dem Namen Auswahl mit R ckkopplung werden alle Methoden zusammengefa t die nach folgendem Schema arbeiten Mresse 84 Agosti 96 Salton 68 1 Dem Benutzer wird aus der Menge der gefundenen Dokumente eine zuf llige Auswahl zur Beg
16. ber den Proze der gerade ausgef hrt wird 4 MENSCH MASCHINE KOMMUNIKATION 66 Richtlinien f r Texte in Assistenten e Verwendung von W rtern die den Benutzer pers nlich ansprechen z B Sie Ihre e Verwendung von Fragestellungen anstatt Befehlen Welche Option m chten sie nutzen statt W hlen sie eine Option e kurze allgemein bekannte W rter e Vermeidung technischer Terminologie die Anf nger m glicherweise verwirren Kann e m glichst kompakt formulierte S tze e kurze klare und verst ndliche Schreibweise 4 5 Designmethodik Effektives Interfacedesign ist mehr als das Verfolgen einiger Regeln Es ben tigt eine benutzerbezogene Designmethodik Weiters involviert es eine fr he Planung des Interfaces und eine kontinuierliche Weiterentwicklung w hrend des gesamten Entwicklungsprozesses der Software Micro95 Eine wichtige Entscheidung im Design eines Produktes ist die Zusammenstellung eines Teams welches das Design entwickelt und die Programmierung daf r durchf hrt Es ist wichtig immer ein Gleichgewicht zwischen den verschiedenen Disziplinen und den F higkeiten einzelner zu schaffen 4 5 1 Ein effektives benutzerbezogenes Design beinhaltet mehrere einzelne Phasen den sogenannten Designzyklus e Design Der Beginn der Arbeit an einem Design ist der kritischste Punkt da hier die Entscheidung ber das generelle Aussehen eines Produktes gef llt wird Fehler die hier entste
17. bereitet Dokumente hinzuzuf gen oder zu l schen 3 HYPER G HYPERWAVE 31 3 2 4 Links in Hyperwave Die Links in Dokumenten werden getrennt von den Dokumenten im Link Server gespeichert Dieses Prinzip bietet eine gro e Zahl von Vorteilen gegen ber der herk mmlichen Speicherung von Links innerhalb von Dokumenten e Links sind bidirektional Dadurch besteht die M glichkeit Informationen anzubieten die angeben welche Dokumente auf ein bestimmtes Dokument zeigen bzw welche Dokumente durch ein bestimmtes Dokument referenziert werden Weiters lassen sich dadurch Navigationshilfen wie z B eine Local Map realisieren e Durch diese Bidirektionalit t l t sich Link Konsistenz gew hrleisten Wenn beispielsweise ein Dokument gel scht wird dann werden auch alle Verweise zu diesem Dokument unsichtbar e In Hyperwave werden Links als Objekte realisiert Dadurch k nnen sie auch Metainformationen wie z B Zugriffsrechte oder Erstellungsdatum beinhalten e Dadurch da Links unabh ngig vom Dokument gespeichert werden k nnen sie in beliebigen Dokumenttypen aufscheinen z B auch in Audio oder Videodokumenten e Durch Erzeugen oder Ver ndern von Links wird das Dokument nicht beeinflu t Dadurch k nnen auch Links in Dokumenten erstellt werden auf denen man nur Lese und keine Schreibrechte hat z B bei einer CD ROM In Hyperwave besteht ein Link immer aus einen Source Anchor der beim Dokument von dem er ausgeht defi
18. definieren In verschiedenen Fachgebieten werden bereits umfassende Thesauri angeboten Der Vorteil dieser vordefinierten Listen liegt darin da bei der Datenaufnahme die terminologische Kontrolle d h die Kontrolle ber die einheitliche Verwendung der Terme generell verbessert werden kann 5 8 2 Synonymw rterbuch Als Synonyme werden unterschiedliche W rter mit gleicher Bedeutung bezeichnet Der Thesaurus hat bei der Verwendung als Synonymw rterbuch die Aufgabe synonyme W rter zu gruppieren Alle Synonyme bilden eine Klasse Es werden drei Varianten bei dieser Art der Verwendung eines Thesaurus unterschieden 83 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL Variante 1 Jeder Deskriptor wird bereits bei der Datenaufnahme durch die anderen Deskriptoren seiner Klasse erweitert Ein Dokument wird somit auch durch die Eingabe des synonymen Termes gefunden Generell wird dadurch die Ausbeute erh ht Der Thesaurus wird nur bei der Datenaufnahme verwendet Variante 2 Um die explizite Speicherung aller Klassenmitglieder eines Deskriptors zu vermeiden kann der Thesaurus auch nur bei der Abfrage fakultativ als Filter verwendet werden Der gro e Vorteil dieser Variante liegt in der beibehaltenen Flexibilit t Es k nnen weiterhin Deskriptoren nach Belieben erfunden werden Die Menge der Deskriptoren wird nicht durch Synonyme vergr ert Die Abfrage wird nicht durch eine zwangsweise Verwendung eines Thesaurus ver ndert und verlang
19. dem Computer gearbeitet haben werden sie aber feststellen da die Metapher Schreibmaschine nicht ausreichend ist um alle M glichkeiten eines Computers zu nutzen Es ist mit einer Schreibmaschine nicht m glich einen Text zu speichern Teile des Textes zu l schen zu kopieren einzuf gen den Text anders zu formatieren bzw die Schriftgr e zu ndern Gleichzeitig mit dieser Erkenntnis beginnen die Menschen die Metapher Schreibmaschine f r den Computer zu verwerfen und versuchen eine neue Metapher Computer aus ihren bisherigen Erkenntnissen zu entwickeln Nachdem diese Personen sich auch mit Tabellenkalkulationsprogrammen Spielprogrammen usw besch ftigt haben wird die Metapher Schreibmaschine f r Computer v llig verworfen und stattdessen die Metapher Computer st ndig weiterentwickelt und verbessert Mit dieser erlernten Computermetapher sind diese Menschen dann auch in der Lage sich auf anderen oder neuen Computersystemen relativ schnell einzuarbeiten weil sie die Lernphase der Metapher Schreibmaschine schon durch die bessere des Computers ersetzt haben Zusammenfassend l t sich erkennen da bei einer neuen Technologie zuerst eine hnliche schon bekannte Technologie zur Erkl rung verwendet wird um das Neue zu erforschen dann aber wird aus den gewonnenen Erkenntnissen ein neues gedankliches Modell gebildet Von Xerox wurde erstmals der Begriff der virtuellen Interfacemetap
20. der vorigen Begriffsdefinitionen besteht die M glichkeit IRS in verschiedene Klassen mit bestimmten Eigenschaften zu unterteilen Mresse 84 e Nach Art der zur Verf gung stehenden Information Die gesamten Texte stehen in elektronischer Form zur Verf gung Volltext IRS K rzungen oder Zusammenfassungen der Texte stehen in elektronischer Form zur Verf gung Die Information steht nicht in elektronischer Form zur Verf gung sondern der Benutzer mu eine subjektive Beschreibung eingeben e Nach dem Format der Texte Es sind nur strukturierte Texte zugelassen Nur unstrukturierte Texte sind zugelassen Strukturierte und unstrukturierte Texte sind erlaubt aber immer nur eine Art pro Datenbank Wie vorhin verschiedene Textarten d rfen jedoch auch in der selben Datenbank aufscheinen Innerhalb eines Textes k nnen oder m ssen strukturierte und unstrukturierte Teile vorhanden sein e Nach Art der Datenaufnahme Die Datenaufnahme wird durch das IRS abgedeckt Es stehen verschiedene Hilfsmittel zur Verf gung die verwendet werden m ssen Die Datenaufnahme wird nicht abgedeckt Eingabe bzw Editierprogramme m ssen vom Benutzer selbst geschrieben werden Das IRS umfa t lediglich einen Lade und einen Auswertungsteil Die Datenaufnahme kann entweder mit Hilfe des IRS erfolgen oder auch mit Hilfe einer definierten Schnittstelle umgangen werden e Nach Art des Ladevorganges Das Laden der Daten findet sofort nach jed
21. die Aufgaben korrekt die von ihm gefordert werden Installation Das System wird am Computer des Endanwenders plaziert Wartung Auftretende Fehlfunktionen werden korrigiert und zus tzliche W nsche des Anwenders werden in das System integriert In der Praxis werden diese Punkte oftmals nacheinander durchlaufen um die Qualit t des Produktes zu verbessern 4 MENSCH MASCHINE KOMMUNIKATION 41 4 2 Meilensteine in der Mensch Maschine Kommunikation Theoretische berlegungen da Computer f r mehr verwendet werden k nnen als nur mathematische Berechnungen durchzuf hren wurden schon in den 60er Jahren angestellt Dynabook eine Idee von Alan Kay und Kollegen bei Xerox s Palo Alto Reseach Center in Kalifornien in den fr hen 70ern sollte ein Computer in der Gr e eines dickeren Buches werden Er sollte mit einem hochaufl sendem Farbbildschirm einer Funkverbindung in weltweite Datennetze und einem Telefon ausgestattet sein Weiters sollte er die Funktionen einer Sekret rin eines Briefkastens einer Bibliothek und auch die der Unterhaltung und Entspannung bernehmen Aufgrund der damaligen Technologie konnte Dynabook nur eine Vision bleiben Aber in den sp ten 70er Jahren entwickelte die gleiche Gruppe ein Computersystem mit dem Namen Star welches gro en Einflu auf die sp tere Entwicklung des Personal Computers nahm Ein knapp schreibtischgro er Computer f r immer nur einen Benutzer ein gro er Bildschirm eine Mau
22. einem Internet Standard entwickeln soll mu drei Stadien erfolgreich absolvieren Zun chst wird gepr ft ob die beschriebene Spezifikation ausreichend stabil ist keine Probleme bekannt sind und der Vorschlag technisch ausgereift ist Danach wird das Dokument zu einem Standardvorschlag Standard Proposal ernannt Nachdem entsprechend dem Standardvorschlag mindestens 2 unabh ngige Implementationen im Internet realisiert sind und diese beiden Implementationen auch zusammenarbeiten k nnen wird das Dokument zu einem Draft Standard Nach weiteren 4 Monaten kann falls sich die Spezifikation bew hrt hat und gen gend Interesse innerhalb der Internet Organisationen besteht der Draft Standard in einen Internet Standard umgewandelt werden 2 INTERNET 15 2 2 5 Internet Assigned Numbers Authority IANA Bestimmte Dienste im Internet wie z B Telnet email ftp erfordern eine global einheitliche Konfiguration auf allen am Internet angeschlossenen Computern Das Kommunikationsprotokoll TCP IP legt aus diesem Grund f r die wichtigsten Funktionen einheitliche Softwareadressierungen fest unter denen global ein und dasselbe Funktionsmerkmal implementiert ist Diese Adressen werden als TCP IP Protokoll Ports oder kurz Ports bezeichnet Ein Port ist eine logische Zieladresse innerhalb eines Netzwerkknotens die wird sie angesprochen eine bestimmte Funktion ausf hrt Den wichtigsten Diensten im Internet werden von einer zentralen Stelle der IA
23. einfache und verst ndliche Bewegungsm glichkeiten f r den Cursor e Fehlerkorrektur f r einzelne Buchstaben und gesamte Felder e Fehlermeldungen bei unakzeptablen Eingabewerten e Eingabefelder welche nur optional sind m ssen deutlich gekennzeichnet werden Regeln f r Assistenten wizards Ein Assistent ist eine spezielle Form von Benutzerhilfe der die Automatisation einer Ablaufes bewirkt Micro95 Assistenten helfen bei der Durchf hrung einer Aufgabe die komplex ist und viel Erfahrung verlangt Sie werden meist f r selten verwendete oder un bersichtliche Aufgaben verwendet bei denen der Benutzer Schwierigkeiten hat sie zu lernen oder auszuf hren Assistenten sind aber nicht daf r geeignet einem Anwender zu lernen wie ein Problem gel st wird Sie werden so entworfen da viele Schritte und auch die Komplexit t eines Problemes vor dem Benutzer versteckt werden Es ist zu beachten da ein Assistent keine L sung f r ein ansonsten schlechtes Design darstellt Ein Assistent besteht aus mehreren Seiten die verschiedene Eingaben vom Anwender fordern Dieser kann durch die einzelnen Seiten navigieren Auf der ersten Seite sollte eine kurze Beschreibung der Intention des Assistenten erfolgen Alle weiteren Seiten sollen leicht verst ndlich designed werden Es ist meist besser eine gr ere Anzahl von Seiten zu haben als wenige die daf r un bersichtlich sind Der Anwender sollte immer das Gef hl haben er habe die Kontrolle
24. erfordert meist einen gro en Teil der Arbeit eines Anwenders Das Potential f r Frustration und Eingabefehlern ist daher entsprechend hoch Grundregeln f r Dateneingabe Konsistenz von Dateneingabeaktionen Gleiche Sequenzen von Aktionen sollten unter allen Umst nden beibehalten werden Minimale Eingabeaktionen vom Benutzer Je weniger Tasten der Benutzer dr cken mu umso effizienter kann er seine Daten eingeben Redundante Eingabe von Daten sollte vermieden werden Anwender soll sich m glichst wenig merken Er soll sich an keine speziellen Codes oder Kommandos mit komplexer Syntax erinnern m ssen Kompatibilit t zwischen Dateneingabe und Datenanzeige Das Format der Dateneingabe mu gleich dem Format der Datenanzeige sein 4 MENSCH MASCHINE KOMMUNIKATION 65 e Flexibilit t bei der Eingabe Der Benutzer soll die Reihenfolge in der er die Daten eingeben will selbst festlegen k nnen Designregeln bei Eingabeformularen Shneider92 e entsprechender Titel f r das Formular keine Fachbezeichnungen die nur f r Experten verst ndlich sind e verst ndliche Instruktionen zur Nutzung des Formulares e logische Gruppierungen und Aneinanderreihungen von zusammengeh rigen Elementen e visuell ansprechendes Layout e allgemein verst ndliche Bezeichnungen f r jedes Eingabefeld e konsistente Terminologie und Abk rzungen innerhalb des gesamten Formulares e gen gend Raum oder Trennlinien zwischen den einzelnen Feldern e
25. gerade laufende Script verworfen und dann improvisiert werden Dieses Problem der Schematas und Scripts l t sich auch auf den Computer anwenden Zum Beispiel beim Apple Macintosh oder unter Windows95 von Microsoft verl uft das Speichern von Daten immer nach einem gleichen Schema ndert nun ein Programm den Ablauf des Abspeicherns oder wechselt der Benutzer von einem System zu einem das sich v llig anderes verh lt wirkt sich das bisher erlernte Script fatal aus Der Benutzer wei zwar wie er es bisher gemacht hat er wei auch genau was er will aber er mu erst herausfinden wie er das an diesem neuen System bewerkstelligen kann Dieses Problem ist einer der Hauptgr nde warum 4 MENSCH MASCHINE KOMMUNIKATION 46 Menschen einem neuem System das das alte System und die erlernten Scripts ersetzen soll sich so ablehnend verhalten Eine M glichkeit dieses Problem zu l sen best nde darin gewisse Operationen bei allen Betriebssystemen zu vereinheitlichen Die Ans tze dazu sind gl cklicherweise schon vorhanden Der gr te Kritikpunkt an Schematas und Scripts liegt in deren Inflexibilit t F r die t glichen Situationen des Lebens sind sie recht praktisch bei komplexeren oder bei neuen Situationen haben sie berhaupt keinen Nutzen In diesen F llen greift der Mensch auf mentale Modelle zur ck Der Vorteil eines solchen Modelles liegt darin da man damit gedanklich experimentieren kann d h man kann sich berlegen was passiert
26. ist 675 Bytes minus den 40 Bytes f r den IP Header Jedes Segment wird vor seiner bertragung mit einer Nummer versehen Der Empf nger kann durch Bezugnahme auf diese Nummer den Empfang best tigen Bei einer Fenstergr e von n kann die Sendestation n Pakete bertragen ohne auf eine Empfangsbest tigung zu warten Aber sp testens nach Versenden des n ten Paketes mu einer Empfangsbest tigung f r Paket Nr 1 oder eins der nachfolgenden Pakete eingelangt sein Erst dann darf Paket n 1 gesendet werden Der Empf nger best tigt immer ganze Gruppen von Paketen Wird mit der ersten Empfangsbest tigung Paket n 1 best tigt so gelten damit auch alle vor Paket n 1 gesendeten Pakete als best tigt Eine TCP Verbindung kann aber nicht nur zwischen zwei Computern mit entsprechenden Internet Adressen bestehen Soll z B mit einem Computer der ein multitaskingf higes Betriebssystem besitzt eine Verbindung aufgebaut werden so mu vor dem Aufbau der Verbindung zus tzlich der sogenannte TCP Port bekannt sein Diese Ports sind Softwareadressen an denen sich die auf TCP aufsetzenden Dienstprogramme orientieren Multitaskingf hige Computer sind so in der Lage mehrere Kommunikationsprozesse gleichzeitig ablaufen zu lassen wobei jedem Proze eine Portnummer zugewiesen wird Einige Portadressen sind internetweit f r bestimmte Dienstprogramme reserviert andere Ports k nnen dynamisch w hrend des Verbindungsaufbaues zugeordnet werden 2 INTERNET 1
27. ist der erste Hyperwave PC Client f r das Betriebssystem Microsoft Windows Er wurde entwickelt um die Features von Hyperwave einfach nutzen zu k nnen Amadeus ist nicht nur ein Viewer sondern ein vollst ndiges authoring and document management tool Dietinger95 3 5 1 Collection Browser Der Collection Browser ist das entscheidende Tool von Amadeus Mit seiner Hilfe ist es m glich die hierachische Struktur der Daten am Hyperwave Server sehr einfach zu visualisieren Zus tzlich ist eine Drag and Drop Funktionalit t eingebaut die das Kopieren und Verschieben von Daten am Server sehr vereinfacht 3 5 2 Viewer In Amadeus ist eine Reihe von interen und externen Viewern eingebaut die eine Visualisierung von verschiedensten Dokumenttypen erlauben e TextViewer PlainText HTF HyperText Format HTML e ImageViewer GIF JPEG TIFF PCX BMP XBM e PostscriptViewer Postscript 1 und Postscript 2 e Scene Viewer VRML Viewer SDF Scene Description Format und VRML e MediaPlayer MPGEG Video und Audio AVI MID RMI WAV AU 4 MENSCH MASCHINE KOMMUNIKATION 36 4 MENSCH MASCHINE KOMMUNIKATION 4 1 Einleitung 4 1 1 Was ist Mensch Maschine Kommunikation Human Computer Interaction Mensch Maschine Kommunikation besch ftigt sich mit dem Design von Computersystemen um den Bed rfnissen der Menschen zu entsprechen die mit diesen Systemen arbeiten Preece94 Computer werden von sehr vielen und sehr unterschiedlichen
28. mehrere Personen verschickt Diesmal kann jeder Empf nger aber nicht erkennen wer au er ihm diese email noch erhalten hat Reply Mit Hilfe dieser Funktion ist es sehr einfach auf eine erhaltene email zu antworten bzw die erhaltene email zu kommentieren und an den Absender zur ckzuschicken Mit Reply lassen sich sehr einfach Diskussionen f hren Forward Eine erhaltene email wird an eine weitere Person weitergeleitet Der Absender hat zus tzlich noch die M glichkeit die weiterzuleitende email zu kommentieren Attachment Zus tzlich zur email K nnen noch beliebige Dateien mitgeschickt werden Nicknames Die meisten email Programme bieten die M glichkeit oft genutze email Adressen in einer eigenen Adressverwaltung zu speichern und wieder schnell abzurufen Empfangs und Lesebest tigung Manche Systeme erlauben die M glichkeit da der Sender der email eine Best tigung erh lt da seine email beim Empf nger ordnungsgem angekommen ist oder da der Empf nger diese email gerade aufgerufen hat G ngige Email Protokolle sind SMTP POP3 und IMAP 2 INTERNET 23 2 4 2 ftp file transfer protocol Mit ftp kann man beliebige Programme oder Dateien die auf einem speziellen Computer einem ftp Server im Internet angeboten werden herunterladen download Ebenso ist auch der umgekehrte Weg m glich da Dateien auf diese ftp Server geladen werden k nnen 2 4 3 telnet remote login Telnet erlaubt es von eine
29. oder auch nur Leserechte haben Zur Identifikation von Benutzern gibt es 4 verschiedene Arten Identified Mode Die Benutzer m ssen sich selbst mit Namen und Pa wort am Server identifizieren Dadurch k nnen sie Dokumente am Server erzeugen modifizieren oder l schen Semi Identified Mode Die Benutzer haben ebenfalls Schreibrechte Aber nur das System selbst wei wie der Name des Benutzers wirklich lautet Diese Identifikationsart kann sehr gut f r Gruppendiskussionen am Server verwendet werden Die einzelnen Gruppenmitglieder untereinander sind anonym Wenn es Probleme gibt kann aber der Systemadministrator den Verursacher herausfinden Anonymously Identified Mode Dieser Modus ist hnlich dem Semi Identified Mode nur mit dem Unterschied da der wirkliche Name des Benutzers dem System nicht bekannt ist Trotzdem haben Benutzer eine eigene Homecollection und k nnen dort ihre Einstellungen und Links speichern Anonymous Mode Der Benutzer ist nicht identifiziert und hat daher aus Sicherheitsgr nden keine Schreibrechte am Server Weiters hat er auch nur begrenzte Leserechte Er kann nur Dokumente betrachten die ffentlich freigegeben wurden Der anonymous identified mode ist zur Zeit noch nicht implementiert 3 HYPER G HYPERWAVE 33 3 2 7 Meta Information Attribute Jedes Objekt am Hyperwave Server besteht zus tzlich noch aus einer Reihe von Attributen die dieses Objekt beschreiben Jedes Attribut besteht aus 2
30. und einfach gute Interaktionsm glichkeiten f r eigene Anwendungen zu gestalten 4 1 4 Was ist ein Benutzerinterface Ein Benutzerinterface ist jener Teil eines Computersystems den der Benutzer sieht und mit dem er arbeitet Das bedeutet da ein Benutzerinterface nicht nur ein visuelles Display ist sondern die Summe aller Kommunikation zwischen Mensch und Computer Es pr sentiert Informationen dem Benutzer und akzeptiert Informationen z B Tastatureingaben vom Benutzer Apple87 4 MENSCH MASCHINE KOMMUNIKATION 39 4 1 5 Ziele und Rollenverteilungen bei der Entwicklung von Benutzerinterfaces Die Ziele sind das Entwickeln bzw Verbessern der Sicherheit N tzlichkeit Effektivit t Effizienz und Verwendbarkeit von Systemen Preece94 Laut Shneider92 sollten folgende Ziele immer erreicht werden e Standardisierung F r verschiedene Anwendungen sollte immer das gleiche oder zumindest ein sehr hnliches Interface verwendet werden Als Beispiel lie en sich hier die Apple Computer anf hren die schon sehr fr h 1987 einheitliches Aussehens bei verschiedensten Programmen benutzen e Konsistenz Bedeutet da bliche Aktionen Ausdr cke Layout Farben und Typographie f r das gesamte System gleich sind So findet man z B bei Microsoft Windows in der Menuzeile ganz rechts immer den Menupunkt Datei File und dort immer die M glichkeiten eine Datei zu laden zu speichern oder zu drucken e Portabilit t Ist
31. wenn man etwas Bestimmtes ausf hrt bzw was passiert wenn man es nicht ausf hrt Mentale Modelle sind eine Kombination von analogen und aussagenden Repr sentationen Sie sind nicht nur ein Bild von einer Sache sondern die Ansicht davon Dadurch bieten sie den Vorteil da der Mensch in der Lage ist Vorhersagen ber die zuk nftige Entwicklung eben dieser Sache zu t tigen Mentale Modelle haben allerdings auch einen gro en Nachteil der sich leicht demonstrieren l t Man stelle sich ein Haus mit einer elektrischen Heizung vor Diese Heizung wird durch ein Thermostat geregelt Das Haus wurde eine Zeitlang nicht geheizt weil deren Bewohner auf Urlaub waren Wenn sie wieder nachhause kommen merken sie das es nur 10 Grad Celsius hat sich alle Bewohner aber erst bei 23 Grad Celsius wohl f hlen Es wird meistens folgendes passieren Das Thermostat der Heizung wird nicht auf 23 Grad eingestellt sondern auf das maximal m gliche in der Hoffnung da es dadurch schneller w rmer wird In Wirklichkeit ist es aber vollkommen egal ob es auf 23 Grad oder auf z B 35 Grad eingestellt wird dadurch wird es nicht schneller w rmer Der Grund liegt darin da die Heizung durch ein Thermostat nur ein bzw ausgeschaltet werden kann Deswegen ist es v llig sinnlos das Thermostat auf das Maximum einzustellen Da sich Menschen aber trotzdem so verhalten liegt in diesem Beispiel daran da die elektrische Heizung noch mit einer lteren Form Holz Kohle
32. z B im verwandten Bereich der Datenbankverwaltung Es in den letzten Jahren begannen die gro en Informationssysteme die Antworten auf eine Abfrage nach Relevanz sortiert auszugeben Dieses Verhalten k nnte sich aber in Zukunft ndern da die Menge an angebotener Information die ber Computer abfragbar ist sehr stark anw chst und es daher notwendig ist effiziente IRS zur Verf gung zu stellen 88 6 QUERYCOLLECTION F R HYPERWAVE 89 6 QUERYCOLLECTION F R HYPERWAVE 6 1 Motivation In einer speziellen Collection genannt Querycollection soll die M glichkeit bestehen beliebige Objekte Dokumente verschiedensten Types mit genau spezifizierter Metainformation zu speichern Dabei soll die Struktur der Metainformation f r alle Objekte dieser Collection gleich sein Ein Anwendungsbeispiel w re eine Bibliotheksdatenbank die folgenderma en aufgebaut sein K nnte F r jedes Buch wird eine kurze Zusammenfassung Abstract erzeugt Beim Speichern jeder dieser Zusammenfassungen werden noch zus tzliche Informationen wie z B Autor Erscheinungsjahr Verlag und Auflage vom System abgefragt ev einer Plausibilit tskontrolle unterzogen und dann gemeinsam mit der Zusammenfassung als ein Textdokument mit zus tzlicher Metainformation in der Querycollection gespeichert D h in der Querycollection befinden sich die Zusammenfassungen aller B cher und deren Metainformation Ein Bibliotheksbenutzer der ein bestimmtes Buch sucht hat folg
33. 0 4 AC Algorithmus 88 5 11 abschlie ende Bemerkungen 88 6 Ouerycollection f r Hyperwave 89 6 1 Motivation 89 6 2 Vergleich Querycollection mit einer normalen Collection in Hyperwave 89 6 3 Typischer Verlauf der Erstellung und Benutzung einer Querycollection 90 6 3 1 Erstellung 90 6 3 2 Benutzung 90 6 4 Anwendungsbeispiele 91 6 4 1 Bibliotheksdatenbank 91 6 4 2 _ Personendatenbank 91 6 4 3 Audio Videodatenbank 91 6 5 Queryform Wizard 91 6 5 1 Was ist ein Wizard 91 1 EINF HRUNG 6 5 2 Ziel des Queryform Wizards 92 6 5 3 Funktionsweise 92 6 6 Eingabe der Metainformation in Amadeus 6 7 Suche und Suchergebnisse 6 8 Programmierung 101 102 103 103 6 8 1 Queryform Wizard 6 8 2 Enter Modify Keywords in Amadeus 103 6 8 3 CGl Script f r die Suche 103 7 Referenzen 104 1 EINF HRUNG 9 1 EINF HRUNG Diese Diplomarbeit besch ftigt sich mit der Entwicklung einer leicht verst ndlichen und effizienten Methode zur Speicherung und Abfrage gro er Datenmengen die in einer strukturierten Form vorliegen Das Kapitel 2 beschreibt die geschichtliche Entwicklung des Internets dessen Organisationsstrukturen und bertragungsmechanismen Weiters wird auch auf die verschiedenen existierenden Informations und Kommunikationsdienste eingegangen Dabei wird das WWW World Wide Web einer genaueren Betrachtung unterzogen Im Kapitel 3 wird auf das zur Zeit m chtigste Informationss
34. 0er Jahren Erst dadurch konnten Computer fast berall Einzug halten Damit nderte sich aber auch die Benutzergruppe von wenigen gut ausgebildeten Experten auf sehr viele Personen mit wenig Erfahrung im Umgang mit Computern Genau hier setzt der Forschungsbereich Mensch Maschine Kommunikation an Es wird daran gearbeitet 4 MENSCH MASCHINE KOMMUNIKATION 37 Systeme zu entwickeln die von jedermann ohne besondere Vorkenntnisse genutzt werden k nnen Weiters versucht man die Furcht oder Frustration die bei der Arbeit mit diesem Medium entstehen kann zu verringen Preece94 Shneider92 4 1 3 Mensch Maschine Kommunikation als f cher bergreifendes Forschungsgebiet Der Bereich Mensch Maschine Kommunikation umfa t einen gro en Bereich an verschiedenen Forschungsdisziplinen Preece94 e Computerwissenschaften e Kognitive Psychologie e Soziale und organisatorische Psychologie e Ergonomie und menschliche Faktoren e Ingenieurswissenschaften e Design e Antropologie e Soziologie e Philosophie e Linguistik e K nstliche Intelligenz Mensch Maschine Kommunikation l t sich nach Shneider92 in einzelne Forschungsrichtungen aufteilen e Reduktion der Angst vor der Verwendung Computer sind schon sehr weit verbreitet trotzdem werden sie nur von einem Teil der Bev lkerung genutzt Viele Personen meiden aus Angst den Umgang mit ihnen Vor allem ltere Menschen f rchten computer hnliche Ger te wie z B Bankomaten oder elek
35. 9 2 3 3 Internet Adressen Die im Internet benutzte Adressierungsstruktur wurde mit dem Ziel geschaffen eine m glichst effiziente bertragung der Datenpakete zu gew hrleisten Die Internet Adressen geben nicht nur Auskunft wo der betreffende Netzteilnehmer ist sondern dar ber hinaus auch ber welche bertragungswege die Daten transportiert werden Jedem Computer am Internet wird eine weltweit eindeutige 32bit 4Byte gro e Zahl zugeordnet Jede dieser Adressen setzt sich aus 2 Teilen zusammen e Netzwerkidentifikation netid e Benutzeridentifikation hostid Es gibt 5 verschiedene Klassen von Internetadressen Die Klassen A B und C unterscheiden sich durch die L nge der Netzwerkindentifikationsnummer Die Schreibweise von Internet Adressen ist blicherweise in der Form da jedes Byte durch eine Dezimalzahl dargestellt wird und durch einen Punkt von den anderen getrennt wird z B 127 29 181 74 Jedem an das Internet angeschlossene Netzwerk wird so eine eindeutige Identifikation zugeordnet Die zu der jeweiligen Netzidentifikation geh rende Benutzeridentifikation kann der lokale Netzwerkbetreiber selbst vergeben F r Klasse A Netzwerken stehen 254 Benutzeridentifikationen zur Verf gung Allerdings gibt es weltweit nur 126 Klasse A Netzwerke Die 16 383 Klasse B Netzwerke k nnen jeweils 254 Benutzer beinhalten die 2 097 151 Klasse C Netzwerke je 254 Benutzeridentifikationen Die Zahl der zu vergebenden Interneta
36. Doch sind die meisten sehr aufwendig da der zugrundeliegende Algorithmus meist die Ordnung O n hat 5 9 1 Unterschiedliche Eingaben aufgrund sprachlicher Gegebenheiten Bei unterschiedlichen Eingaben aufgrund sprachlicher Gegebenheiten sind die Eingaben an sich korrekt erschweren jedoch die Abfrage durch ihre u ere Erscheinungsform Angabe von Metazeichen Bei dieser Methode werden einzelne Buchstaben der Abfrage durch spezielle Zeichen z B oder ersetzt Diese Metazeichen werden bei internen Vergleichen als eine Art Joker verwendet Sie k nnen stellvertretend f r eine bestimmte oder beliebige Anzahl von anderen Zeichen stehen In eckigen Klammern k nnen auch mehrere Buchstaben zur Auswahl angeboten werden Ein Beispiel In einer Datenbank sollen alle Artikel im Zusammenhang mit Organisation und Datenbank gefunden werden Die Abfrage lautet 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL da ba amp amp organilsz Jation Diese Form der Abfrage ber chsichtigt sowohl die deutschen Deskriptoren Organisation und Datenbank als auch die englischen organization und database Soundex Methode Dies ist eine der ersten Methoden zur Ermittlung von hnlichkeiten Sie reduziert alle Deskriptoren auf Zeichenketten mit einem alphanumerischen und maximal 3 numerischen Zeichen Auf diese Weise werden hnlich klingende und teilweise falsch geschriebenen W rter auf gleiche Formen zur ckgef hrt Der erste Buchstabe
37. ET startete 1986 und l ste die alten und langsamen Hauptverbindungsleitungen des Internet ab Der Name ARPANET hatte sich inzwischen von ARPA Internet ber Federal Research Internet und TCP IP Internet zu Internet gewandelt 1987 beauftragte NSF das Unternehmen Merit Network Inc mit der Verwaltung und Wartung des Internet Hauptnetzes Bald erkannte man da die 1 5Mbit sek Leitungen die sprunghaft anwachsende Netzwerkbelastung nicht mehr bew ltigen konnten Zu Beginn der 90er Jahre wurde das NSF Backbone sukzessive auf bertragungsgeschwindigkeiten von 45Mbit sek umgestellt Seit 1993 wird an der Umstellung auf noch h here Geschwindigkeiten gearbeitet Die zugrundeliegende Technologie ist ATM Asynchronous Transfer Mode wobei Geschwindigkeiten von 155Mbit sek bis zu 622Mbit sek vorgesehen sind Zu Beginn der 80er Jahre konzentrierten sich die europ ischen Internet Aktivit ten vor allem auf die skandinavischen L nder Norwegen Schweden Finnland und D nemark waren im universit ren Bereich schon viel enger an Nordamerika als an Europa angebunden Deswegen fand eine rasche Verbreitung des Internet zu Beginn vor allem in Nordeuropa statt Unter NORDUnet erreichte dieses Netz eine gro e Ausdehnung In weiterer Folge entstand in den meisten europ ischen L ndern nationale Forschungsnetze mit Verbindungen Gateways in das weltweite Internet Bedeutende Netzwerke waren EARN EUnet und der europ ische Teil des nordamerikanischen CSNET
38. Ein gemeinsames europ isches TCP IP Netzwerk gab es jedoch erst zu Beginn der 90er Jahre Die EBONE Initiative European Backbone der europ ischen Internet Organisation RARE R seaux Associ s pour la Recherche Europ enne erm glichte 1992 den europaweiten Internet Betrieb Im Rahmen des EBONE Projektes wurden erstmals 2 INTERNET 13 zentrale europ ische Internet Hauptverkehrswege geschaffen Vor dieser Zeit war es durchaus m glich da die Kommunikation zwischen 2 europ ischen Netzen nicht direkt sondern ber Nordamerika erfolgte 1991 wurde das NREN National Research and Education Network im Rahmen des High Performance Computing Act HPCA des amerikanischen Kongresses als Nachfolger f r das NFSNET bestimmt Er legt Planung und Finanzierung eines Programmes zur F rderung der Forschung im Bereich Hochgeschwindigkeitsnetze fest 1994 wurden daf r mehr als 1 Milliarde US Dollar ausgegeben Diese Ergebnisse sollen die Grundlage f r die Realisierung einer neuen nationalen Informationsinfrastruktur National Information Infrastructure NND bilden Bis zum Jahr 2007 werden laut amerikanischen Vizepr sisenten Al Gore mehr als 500 Milliarden US Dollar f r eine Verbesserung des nordamerikanischen Internets auf der Basis der HPCA Technologien verwendet 2 2 Organisationsstrukturen im Internet Aufgrund der vielschichtigen Entwicklungen im Internet besteht auch eine organisatorische Infrastruktur aus einer Vielfalt von unterschiedl
39. Entwicklung einer Querycollection f r das Hyper G Authoring Tool Amadeus Diplomarbeit in Telematik 1997 Fessl Christian Erich Betreuer Univ Ass Dipl Ing Thomas Dietinger Begutachter o Univ Prof Dr Phil Dr h c Hermann Maurer Institut f r Informationsverarbeitung und Computergest tzte Neue Medien IICM Technische Universit t Graz 1 EINF HRUNG 2 Zusammenfassung Diese Diplomarbeit besch ftigt sich mit der Entwicklung einer leicht verst ndlichen und effizienten Methode zur Speicherung und Abfrage gro er Datenmengen die in einer strukturierten Form vorliegen Es wird auf das Internet dessen Organisation und Mechanismen eingegangen Es folgt eine Beschreibung des Hyperwave Informations Mangagement Systems Danach wird die Theorie der Mensch Maschine Kommunikation behandelt und wie eine praktische Implementation eines User Interfaces zu erfolgen hat Der Suche nach Information information retrieval ist ein weiters Kapitel gewidmet Schlie lich erfolgt eine genaue Erl uterung der Querycollection deren Anwendung Vorteile und Implementation 1 EINF HRUNG 3 Abstract This thesis is about the development of an understandable and efficient method for storing and retrieving huge amounts of structured data It deals with the Internet its organisation and mechanisms Then there is a description of the Hyperwave information management system The theory of human computer interaction and the possib
40. Ma zahlen bei Volltext IRS die zus tzlich einen Mechanismus ber eine automatische Deskriptorenauswahl verf gen Die Menge der gespeicherten Dokumente mu sehr gro sein um statistisch signifikante Aussagen t tigen zu k nnen 76 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL 5 6 Deskriptorenauswahl Unter dem Begriff Deskriptorenauswahl indexing werden alle Methoden und Verfahren zusammengefa t die der Bestimmung von Deskriptoren zur Charakterisierung eines Dokumentes dienen Mresse 84 5 6 1 Manuelle Auswahl Bei der manuellen Auswahl manual indexing werden die relevanten Merkmale eines Dokumentes vom Benutzer ausgew hlt Es besteht aber auch die M glichkeit diese manuelle Auswahl mit einer automatischen Auswahl zu kombinieren Das IRS schl gt eine Liste von Deskriptoren vor und der Benutzer kann Elemente in diese Liste hinzuf gen oder auch streichen Vorteile Es werden auch Terme ber cksichtigt die nicht direkt aus dem Dokument hervorgehen z B Deskriptoren die Urteile ber die Qualit t des Dokumentes oder Hinweise auf die Verwendung des Dokumentes geben Diese Art der Auswahl ist auch sehr einfach in das IRS zu implementieren Ihre Anwendung findet sich in Bereichen der Datenerfassung an denen nur wenige und gut ausgebildete Benutzer arbeiten Nachteile Die Datenaufnahme erfordert einen Mehraufwand durch die zweimalige Eingabe der relevanten Terme als Text und als Deskriptor 5 6 2 Automatische
41. NA Portnummern zugeordnet Zum Beispiel dient die Portnummer 23 dem Telnet Dienst und die Portnummer 21 dem ftp RFC 1060 enth lt eine Liste aller universell genutzer Portnummern 2 2 6 Network Information Center NIC Um sicherzustellen da jedes an das Internet angeschlossene Netzwerk unterschiedliche Adressen verwendet werden die Internetadressen von einer zentralen Stelle vergeben dem NIC Das NIC vergibt dabei die eigentliche Internet Adressvergabe an regionale Internet Registraturen Internet Registry F r Europa ist das RIPE NCC RIPE Network Coordination Center zust ndig 2 3 bertragungsmechanismen 2 3 1 Kommunikationsprotokolle im Internet Die Vorschriften nach denen die Kommunikation im Internet erfolgt werden als Protokoll bezeichnet blicherweise sind diese Protokolle in einzelne Module unterteilt wobei jedes Modul eine bestimmte Aufgabe innerhalb des Kommunikationsprozesses hat z B Verbindungsaufbau Daten bertragung Fehlerkontrolle Die Funktionen der einzelnen Module wurden 1983 von der International Standard Organisation ISO standardisiert und auf 7 Module festgelegt OSI 7 Schichten Modell OSI Schicht 1 Bit bertragungsschicht Physical Layer Die Bit bertragungsschicht legt die elektrischen und mechanischen Parameter einer Kommunikations bertragung fest Das Vorhandensein einer Schicht 1 Verbindung ist somit die Voraussetzung f r eine Kommunikation 2 INTERNET 16 OSI Schicht 2 S
42. NNY Human Computer Interaction Addison Wesely Publishing Company 1994 RAITT DAVID Introduction to Online Information Systems Oxford and New Jersey 1984 ROWLEY JENNIFER Organising Knowledge An Introduction to Information Retrieval Gower Verlag 1987 SALTON GERARD Automatic Information Organization and Retrieval McGraw Hill 1968 SCHWARTZ RANDAL L Learning Perl O Reilly 1994 SENGSTACK JEFF Hyper G The Next Generation Web Server Newmedia Mai 1996 SHNEIDERMAN BEN Designing the User Interface Strategies for Effective Human Computer Interaction Addison Wesely Publishing Company 1992 STROUSTRUP BJARN The C Programming Language Addison Wesley 1991 TILL DAVID Perl in 21 Days Sams Publishing 1995 WILSON STEPHEN World Wide Web Design Guide Hayden Books 1995 WITTEN IAN H MOFFAT ALISTAIR BELL TIMOTHY C Managing Gigabytes Compressing and Indexing Documents and Images Verlag Van Nostrand Reinhold 1994
43. Ol verglichen wird Bei diesen alten Formen lautete das Prinzip je mehr Brennmaterial desto schneller hei er Daran kann man erkennen da mentale Modelle unter gewissen Umst nden nicht zur L sung eines Problemes beitragen k nnen bzw k nnen sie das Verst ndnis f r eine richtige L sung des Problemes noch viel mehr erschweren da Menschen eher bereit sind ein Schema oder Script umzulernen als ein mentales Modell Um auf das vorherige Beispiel mit dem Haus und der Heizung zur ckzukommen Bisher wurde noch keine befriedigende L sung gefunden um das Aufdrehen des Thermostates auf das Maximum zu verhindern Es ist sogar nicht einmal m glich den Menschen zu erkl ren da dieses Verhalten absolut keinen Sinn ergibt 4 MENSCH MASCHINE KOMMUNIKATION 47 Mentale Modelle lassen sich in zwei Untergruppen auftrennen e strukturelles Modell wie funktioniert das Beschreibt die inneren Mechanismen eines Ger tes anhand dessen Komponenten Mit diesem Modell ist ein Benutzer in der Lage Vorhersagen ber das Verhalten eines Ger tes zu t tigen Bei der Reparatur eines nicht mehr funktionierenden wird immer dieses mentale Modell genutzt Es ist sehr schwierig nur mit Hilfe des strukturellen Modelles die Benutzung eines Ger tes abzuleiten Andererseits braucht man zur Bedienung eines Ger tes nicht unbedingt diese Informationen daf r reicht das nachfolgende Modell aus e funktionelles Modell wie benutzt man das Dieses lie
44. Option field Die einzelnen Auswahlm glichkeiten werden wieder zeilenweise eingegeben Bei den Auswahlfeldern kann man zwischen 2 Arten unterscheiden Es darf immer nur eine einzige Option gew hlt werden oder es d rfen auch mehrere Optionen gew hlt werden Diese Unterscheidung kann durch Only one option oder Several options getroffen werden Queryform Wizard T tigkeitsfeld Produktion Gro handel Einzelverkauf 6 QUERYCOLLECTION F R HYPERWAVE 98 Datumsfeld Date field Es besteht die M glichkeit nur die Jahreszahl oder Jahreszahl und Monat oder auch Jahreszahl Monat und Tag auszuw hlen Queryform Wizard erster Kontakt 6 QUERYCOLLECTION F R HYPERWAVE 99 6 5 3 5 Aussehen des Formulares Nachdem f r alle Eingabefelder die Eingabeart festgelegt wurde k nnen noch einige Angaben ber das Aussehen des Formulares eingegeben werden e Textfarbe Die Farbe in der der Text des Formulares erscheint Hintergrundfarbe Die Farbe in der der Hintergrund des Formulares dargestellt wird Es ist sehr wichtig darauf zu achten da der Kontrast zwischen Text und Hintergrundfarbe gro ist um eine gute Lesbarkeit zu erm glichen Ausrichtung des Textes Die Namen der Eingabefelder k nnen links zentriert oder rechts sein Schriftstil Beim Schriftstil kann man zwischen normal dick kursiv und dick kursiv w hlen Queryform Wizard Which colors would you like for your fo
45. Teilen Dem Namen des Attributes und seinem Wert Jedes Attribut hat unterschiedliche Aufgaben einige dienen zur Identifizierung des Objektes andere kontrollieren die Darstellung und weitere speichern den Autor und das Erstellungs bzw Modifikationsdatum Ein eigenes Attribut ist f r die Zugriffsrechte auf das Objekt vorgesehen In diesem Attribut ist festgelegt wer das Objekt lesen modifizieren oder l schen darf Benutzer mit Schreibrechten f r ein bestimmtes Objekt d rfen die Attribute desselben modifizieren bzw neue einf gen oder bestehende l schen 3 2 8 Mehrsprachigkeit In Hyperwave werden Dokumente in mehreren Sprachen automatisch unterst tzt Der jeweilige Benutzer legt seine Sprache fest und automatisch erscheinen die Dokumente in der gew nschten Sprache Falls das Dokument in der gew nschten Sprache nicht verf gbar ist wird die n chstpassende Sprache dargestellt Von Hyperwave werden zur Zeit folgende Sprachen unterst tzt e Deutsch e Englisch e Franz sisch e Italienisch e Spanisch e Japanisch e Koreanisch e Ungarisch Es ist aber m glich da beliebige Sprachen von Hyperwave unterst tzt werden 3 HYPER G HYPERWAVE 34 3 3 Wavemaster Der Wavemater ist das Gateway zwischen einem Hyperwave Server und einem WWW Browser Er kontrolliert den Aufbau und die Darstellung der Information am Browser Zus tzlich bietet er noch die M glichkeit da Daten direkt ber diesen Browser am Server gewarte
46. Vorteil da die Suche nach allen Dokumenten die einen bestimmten Deskriptor enthalten sehr rasch m glich ist Weiters ist auch eine boolsche Kombination von Deskriptoren einfach zu implementieren Im Vergleich zu einer sequentiellen Suche ist die Methode des inverted index wesentlich schneller hat aber den Nachteil da beim Laden eines Dokumentes in das IRS das Erstellen des inverted index eine gewisse Rechenzeit in Anspruch nimmt 5 6 5 Ma zahlen zur Gewichtung von Deskriptoren Diese Ma zahlen unterscheiden sich in der Aussage die sie erm glichen im Aufwand der f r ihre Berechnung notwendig ist und im Zeitpunkt ihrer Verwendung Alle Ma zahlen sind Relevanzfaktoren d h sie versuchen etwas ber die Wichtigkeit eines Deskriptors auszusagen dokumentweise Betrachtung Bei der dokumentweisen Betrachtung wird f r jeden Deskriptor ein Gewicht berechnet welches eine Aussage ber die Wichtigkeit des Deskriptors innerhalb des Dokumentes trifft Dieses Gewicht wird aufgrund der H ufigkeit des Erscheinens des Deskriptors im Dokument berechnet Das Gewicht eines Deskriptors D im Dokument Tj wird definiert als G Fehler Das Gewicht G kann Werte zwischen 0 und 1 annehmen Je n her das Gewicht bei 1 liegt desto wichtiger ist der Deskriptor in diesem Dokument Bei der Deskriptorenauswahl werden alle Terme deren Gewicht einen bestimmten Grenzwert nicht berschreiten ausgeschieden Die Berechnung des Gewichtes ist nur in Vollt
47. ab welche Sprachen am Computer des Servers m glich bzw installiert sind Die einzigen 2 Einschr nkungen f r CGI Programme sind da sie nicht zu langsam sind und da sie nach au en abgesichert sind damit Hacker keinen Zugriff auf den Server erhalten K nnen 3 HYPER G HYPERWAVE 27 3 HYPER G HYPERWAVE 3 1 Die Entstehung von Hyperwave Die Entwicklung von Hyperwave begann 1991 Hyperwave baut auf den Ideen des WWW auf verbessert jedoch einige Konzepte die im WWW vernachl ssigt worden sind Hyperwave speichert Links nicht im Dokument selbst sondern in einer eigenen Datenbank Hyperwave unterst tzt bidirektionale Links und auch automatische Link Konsistenz Links auf nicht mehr vorhandene Seiten werden automatisch gel scht auch ber Servergrenzen hinweg Hyperwave besteht aus einer orthogonalen hierarchischen Struktur integriertem Indizieren und verschiedenen Suchm glichkeiten Im Juni 1994 wurde der erste offizielle Hyperwave Server vorgestellt zusammen mit den Browsern Harmony f r UNIX und Amadeus f r Windows Da sich Hyperwave von einem Uhniversit tsprototypen immer mehr zu einem universellen Produkt entwickelte wurde im Herbst 1995 die Firma Hyper G R D in Graz gegr ndet Allm hlich stellten sich auch die ersten gr eren Verkaufserfolge ein wie z B der erste Auftrag von Sumitomo Electric Co in Japan die auch den Vertrieb von Hyperwave in Japan bernahm Ein weiterer Gro auftrag folgte von Motorola und
48. anf llig in der bertragungsinfrastruktur und sollte in den kommenden Jahren die Datenkommunikation revolutionieren Bei der paketorientierten Daten bertragung werden die zu versendenden Daten in einzelne Datenpakete aufgeteilt Jedes Paket wird f r sich und unabh ngig von allen anderen ber das Netzwerk verschickt Bei jedem Paket wird zus tzlich zu den Daten die Adresse des Senders und des Empf ngers und auch die Sequenznummer bertragen Die Sequenznummer dient dazu da die empfangenen Datenpakete wieder in der richtigen Reihenfolge zur urspr nglichen Information zusammengesetzt werden k nnen Der Transport der Pakete ber das Netzwerk wird von spezialisierten Computern Routern gesteuert welche entscheiden wie das Paket optimal zum Empf nger gelangen kann Es ist durchaus m glich da die einzelnen Pakete ein und derselben 2 INTERNET 11 bertragung sehr unterschiedliche Wege zur cklegen k nnen In weiterer Folge bedeutet das aber auch wenn eine bertragungsstrecke unterbrochen wird werden die Pakete ber eine andere Strecke transportiert Fehlerhafte Pakete oder Pakete die nicht am Empf nger eintreffen werden automatisch erneut angefordert und bertragen Dieses Prinzip der paketorientierten Daten bertragung ist wesentlich weniger fehleranf llig Im Semptember 1969 wurde von ARPA das erste experimentelle auf paketorienterter Daten bertragung basierende Netzwerk ARPANET in Betrieb genommen Dieses erste Ne
49. anten Dokumenten erscheint geht L gegen unendlich aufgrund einer Division durch 0 e Wenn alle Dokumente der Auswahl als relevant bezeichnet werden ist in weiterer Folge keine sinnvolle Berechnung m glich Die berechnete Ma zahl WT kann dazu verwendet werden dem Benutzer die selektierten Dokumente ihrer Wichtigkeit nach zu pr sentieren Der Hauptzweck der Berechnung von WT liegt jedoch in einer entspechenden Modifikation der Abfrage Bei einer Wiederholung der Abfrage soll die Ausbeute bei gleichbleibender oder erh hter Pr zision verbessert werden Dazu werden alle Dokumente in der Datenbank gesucht die mit mindestens einem der relevantesten Deskriptoren in Verbindung stehen F r s mtliche Deskriptoren dieser neuen Dokumente wird wiederum die DRF berechnet und f r alle Dokumente zur Gewichtung WT aufsummiert Es entsteht dadurch eine neue Folge von Dokumenten die dem Benutzer nach absteigender Relevanz sortiert pr sentiert werden Dieser Vorgang kann mehrmals wiederholt werden 5 8 Verwendungsarten von Thesauri Unter einem Thesaurus versteht man jede Art von W rterbuch Thesauri werden im Zusammenhang mit IRS auf verschiedene Arten verwendet Mresse 84 Salton 68 Frakes 92 e als vordefinierte Deskriptorenliste e als Synonymw rterbuch e zur Gruppierung Klassifizierung oder Strukturierung von Deskriptoren 5 8 1 vordefinierte Listen Das Hauptproblem bei Thesauri liegt in der Notwendigkeit den Thesaurus im Voraus zu
50. ben Preece94 e Konstruktive Theorie Sie geht davon aus da der Proze des Sehens ein aktiver ist Unsere Sicht der Dinge wird aus der Umgebungsinformation und dem gespeicherten Vorwissen konstruiert e kologische Theorie Die Wahrnehmung beinhaltet nur den Proze des Informationssammelns aus der Umgebung und ben tigt keine weiteren Prozesse der Konstruktion oder der Verfeinerung von Information 4 3 4 Aufmerksamkeit und Beschr nkungen bei der Informationsverarbeitung Durch unsere Sinnesorgane werden st ndig Informationen an das Gehirn geliefert Da diese Informationsmenge viel zu gro ist um sie zu verarbeiten hat das menschliche Gehirn Methoden entwickelt um diese Flut an Neuigkeiten einzud mmen Eine M glichkeit ist die Aufmerksamkeit nur auf eine bestimmte Sache oder Person zu lenken Dies ist der Fall wenn man sich mit vielen Personen gleichzeitig in einem Raum befindet sich mit einer angeregt unterh lt und alles andere um einen herum kaum wahrnimmt Eine zweite M glichkeit ist die geteilte Aufmerksamkeit Man arbeitet konzentriert an einer Sache und besch ftigt sich nebenbei mit etwas ganz anderem z B gleichzeitig Auto fahren und sich mit jemanden unterhalten Obwohl beide Prozesse ein gro es Ma an Informationsverarbeitung beinhalten ist das Gehirn in der Lage beides gleichzeitig auszuf hren Preece94 Im Bereich Benutzerinterface gibt es viele Beispiele die diese beiden Methoden der Informationsfilteru
51. d Falls trotzdem ein Fehler auftritt soll das System ihn erkennen und einen einfachen und verst ndlichen L sungsweg anbieten bzw eine M glichkeit anbieten den Fehler r ckg ngig zu machen Einfaches Zur cknehmen von Aktionen Wenn m glich sollte jede Aktion des Benutzers durch ihn selbst wieder r ckg ngig gemacht werden k nnen Dies soll Anwender in der Erforschung einer neuen L sungsm glichkeit f r ihr Problem unterst tzen Anwender agiert Computer reagiert Menschen f hlen sich unwohl wenn ihnen der Computer vorschreibt welche Aktion sie als n chstes t tigen m ssen Benutzer sollen das Gef hl haben die Kontrolle ber den Computer zu besitzen und nicht umgekehrt Anwender soll sich nichts merken m ssen Da das menschliche Gehirn nur wenige Informationen gleichzeitig im Arbeitsged chtnis halten kann mu der Bildschirminhalt einfach und informativ sein Wenn z B eine Datei geladen werden soll dann m ssen immer alle m glichen Dateien zur Auswahl angeboten werden anstatt nur nach einem Dateinamen zu fragen Regeln f r Datendisplays Shneider92 Bei jedem Schritt in einer Eingabesequenz sollen immer jene Daten am Schirm angeboten werden die der Benutzer f r die Eingabe ben tigen k nnte Daten f r die Anzeige sollen in einer direkten und verwendbaren Form dargestellt werden Der Anwender soll keine Konvertierungen vornehmen m ssen F r jeden einzelnen Datentyp soll ein konsistentes Layout w hrend d
52. der Testphase eine erneute Designphase In der Praxis werden diese 3 Phasen Design Prototyping Test sehr oft durchlaufen bis ein Produkt seine Marktreife erlangt hat Dieser gesamte Designzyklus sollte parallel mit der Entwicklung der Funktionalit t des eigentlichen Programmes ablaufen da der Beginn eines Interfacedesigns erst nach Fertigstellung aller anderen Programmteile meist keine Zeit mehr f r ein gutes Design l t Erfahrungsgem dauert die Entwicklung eines guten Interfaces genausolange wie die Entwicklung der eigentlichen Funktionalit t eines Programmes Das Testen der Verwendbarkeit eines Interfaces ist entscheidend f r den Designproze aber nur das Testen von Prototypen ist zuwenig Die Einsch tzung der Nutzbarkeit sollte gleichzeitig mit den ersten Schritten in der Produktentwicklung erfolgen Damit lassen sich sofort Ergebnisse erzielen die in den weiteren Designproze einflie en Es ist zu beachten da die Erfahrungen der Benutzer unbedingt beachtet werden mu Mirco95 4 5 2 M glichkeiten zum Testen der Verwendbarkeit eines Produktes usability testing Usability Tests beinhalten einen gro en Bereich von Techniken und Resourcen wie Spezialisten schallisolierte R ume Einwegspiegel und Aufnahmeger te Aber schon auch ein B ro oder Konferenzraum Kasettenrekorder Stopuhr und Notizblock reichen f r kleinere Tests aus Typischerweise gen gen kleine wohlformulierte Tests mit nur 6 10 Teilnehmern um 80 b
53. des Deskriptors wird als erste Stelle f r den Soundex Code verwendet F r die Transformation aller weiteren Buchstaben gilt es ist zu beachten da sich diese Tabelle bei unterschiedlichen Sprachen ndern kann Die Buchstaben ergeben aeiouhwy 0 bfpv 1 cgjkqsxz 2 Le u a Bei der Transformation werden alle Nullen ausgeschieden hintereinander vorkommende gleiche Zahlen auf eine Zahl reduziert und der ganze Code auf maximal 4 Zeichen beschr nkt Beispiel Die beiden Namen Neumann und Newman werden als gleich erkannt Ausgangspunkt Neumann Newman Transformation N005055 N00505 Nullen entfernen N555 N55 gleiche Zahlen entfernen N5 N5 Neumann und Newman wurden als gleich erkannt 86 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL 5 10 Vergleich von Zeichenketten Eine der h ufigsten Operationen in IRS ist der Vergleich von Zeichenketten Es ist daher notwendig die verf gbaren Algorithmen f r dieses Problem genauer zu analysieren Das Problem in allgemeiner Form lautet Mresse 84 Frakes 92 Finde in einer Zeichenkette eine andere k rzere Zeichenkette 5 10 1 Straight Forward SF Algorithmus Nach der SF Methode wird jeweils das erste Zeichen der gesuchten Zeichenkette im zu durchsuchenden Text gesucht Wird eines gefunden dann wird ein weiteres Zeichen verglichen Die Suche ist dann erfolgreich wenn alle gesuchten Zeichen mit dene
54. des dieser Objekte besitzt zus tzlich noch Metainformationen wie z B Erstellungsdatum Autor Zugriffsrechte Die wichtigsten Objekte in Hyperwave sind Document von diesem Basisobjekt sind viele weitere Typen abgeleitet e Text HTML Dokumente Plain Text Dokumente e Image in den Formaten GIF JPEG TIFF PNG e Movie Filmsequenzen z B AVI MPEG MOV e Sound Audiodaten z B AU WAV AIFF MIDI e 3D Scene VRML Objekte e Postscript Dokumente im Postscript Format e Remote Object Verbindungen zu weiteren Internet Diensten WWW Gopher WAIS FTP Telnet e Generic Object benutzerdefinierte Objekte z B Tabellen in Exel Winword Dokumente Autocad Zeichnungen PowerPoint Pr sentationen Collection Entspricht einem Directory Folder auf einem Dateisystem ist aber wesentlich m chtiger Dadurch l t sich ein Informationsangebot sehr leicht 3 HYPER G HYPERWAVE 30 strukturieren bzw ein bestehendes sehr leicht warten und modifizieren Es besteht die M glichkeit alle Informationen auf einem Server durch Collections in eine baumartige Struktur zu bringen die automatisch eine leicht verst ndliche und einfache Navigation durch das Informationsangebot zul t e Cluster Ein Cluster ist eine spezielle Collection die Dokumente die in irgendeiner Form zusammengeh ren zu einer Einheit zusammenfa t Es gibt unterschiedliche Arten von Clustern in Hyperwave Language Cluster Implem
55. die M glichkeit Programme oder Daten auf verschiedensten Computersystem zu verwenden ohne sie vorher mit gro em Aufwand konvertieren zu m ssen Beispiele f r gute Portabilit t sind Anwendungen in der Programmiersprache Java oder Videodaten im MPEG Format Mit Hilfe der Evaluierung Beurteilung des Systems besteht die M glichkeit zu erfahren wie gut Anwender damit arbeiten k nnen bzw welche Probleme wo auftreten Ausschlaggebende Kriterien sind laut Shneider92 e Einlernzeit Wie lange braucht ein typischer Anwender um mit dem Programm vern nftig arbeiten zu k nnen oder um bestimmte oft auftretende F lle zu bearbeiten e Geschwindigkeit der Durchf hrung Wie lange braucht man um oft gew nschte Aufgaben l sen zu k nnen Bei einem Textverarbeitungsprogramm w re es die Zeitdauer bis ein Brief geschrieben und ausgedruckt wurde e Fehlerrate Wieviele Fehler werden bei der Ausf hrung der Aufgabe gemacht und wie lange dauert es bis sie erkannt und behoben werden Da die Zeit die f r Fehlerkorrekturen aufgewendet wird sehr gro ist w re es w nschenswert da nur sehr wenige auftreten e Merkbarkeit ber die Zeit Wenn sich ein Anwender bei einem System eingelernt hat und dann erst wieder nach einer Woche oder einem Monat mit dem System konfrontiert wird wieviel hat er vergessen und mu wieder neu gelernt werden und wieviel wurde noch vom letztenmal gemerkt 4 MENSCH MASCHINE KOMMUNIKATION 40 Subjektive Zufr
56. die Umstellung aller ARPANET Knoten auf das bertragungsprotokoll TCP IP Weiters erfolgte eine Aufteilung des Netzes in einen milit rischen Teil MILNET und in einen forschungsorientierten Teil ARPANET Am 24 Juni 1983 wurde das von XEROX und DEC entwickelte Verfahren zur bertragung von Daten in lokalen Netzwerken Ethernet vom IEEE zum internationalen Standard 802 3 erhoben Diese Ethernet Technologie erm glichte eine einfache Verbindung von Computersystemen zu einem lokalen Verbund In weiterer 2 INTERNET 12 Folge wurde das Ethernet in Tausenden von kleinen Netzwerken verwendet die ihrerseits wieder ber das Internet miteinander verbunden wurden Neben dem ARPANET und dem MILNET entstanden in den 80er Jahren noch etliche Weitverkehrsnetze wie z B das USENET das Netz der NASA oder das BITNET Auch die NSF National Science Foundation richtete ein unabh ngiges wissenschaftlich orientiertes Netzwerk ein Ein weiteres Projekt an dem die NSF zu Beginn der 80er Jahre beteiligt war f hrte zu einer Erneuerung der Haupt bertragungswege Backbones des nordamerikanischen Internet Ziel war es die mit Supercomputern ausgestatteten Forschungszentren miteinander zu verbinden Dadurch sollte einem gr eren Kreis von Forschern der Zugang zu Hochleistungscomputern erleichtert werden Aus diesem Grund wurde das NFSNET geschaffen das zun chst mit einer bertragungsrate von 56kbit sek und sp ter mit 1 5Mbit sek arbeitete Das NFSN
57. digkeit bestehen dieses Paket zu fragmentieren In lokalen Netzwerken vom Typ Ethernet ist z B die maximale Paketl nge auf 1492 Bytes beschr nkt Auch manche Gateways sind nicht in der Lage Pakete mit der maximalen L nge von 65 535 Bytes zu bertragen IP spezifiziert deshalb da ein Internetgateway Pakete mit einer Mindestl nge von 576 Bytes verarbeiten k nnen mu Jedes IP Fragment hat selbst wieder das Format eines gew hnlichen IP Paketes Ein wichtiges Feld innerhalb von IP Paketen ist das TimeToLive TTL Feld Dieses gibt die maximale Zeitdauer an w hrend der sich das Paket im Internet befinden darf W hrend des Transportes des Paketes wird dieses Feld fortlaufend erniedrigt Erreicht es den Wert 0 so wird das Paket verworfen 2 3 2 2 Transmission Control Protocol TCP Das Transmission Control Protocol ist das zweitwichtigste Protokoll im Internet Comer 88 Der wesentliche Unterschied zu IP ist da TCP die Daten im Rahmen einer virtuellen Verbindung garantiert bertr gt D h TCP hat Mechanismen die 2 INTERNET 18 berpr fen ob ein Datenpaket tats chlich beim Empf nger eingetroffen ist oder nicht Geht ein Paket verloren oder wird es ver ndert wird automatisch dieses Paket erneut angefordert Das TCP unterteilt den zu bertragenden Datenstrom zun chst in Segmente Je nach Kapazit t der Bufferspeicher der kommunizierenden Systeme wird dazu eine maximale Segmentgr e ausgehandelt Die Standardgr e
58. dressen ist also beschr nkt und aufgrund des starken Wachstums des Internet werden unter Umst nden in absehbarer Zeit die Internetadressen verbraucht sein Aus diesem Grund wurde im November 1991 vom IAB Internet Activities Board die ROAD Gruppe Routing and Adressing gegr ndet Die Aufgabe dieser Gruppe ist es ein neues Adressierungs und Routingkonzept zu erarbeiten Die Internet Adressen der Klasse D werden als Mulitcastadressen bezeichnet Mit Hilfe von diesen Adressen k nnen Datenpakete an bestimmte Gruppen von Empf ngern gesendet werden Jeder Multicastgruppe ist eine bestimmte Klasse D Adresse zugeordnet Bestimmte Multicastadressen werden dabei wie alle anderen Internet Adressen zentral vergeben andere sind zur vor bergehenden Benutzung frei verf gbar Eine Multicastadresse kann aber immer nur als Zieladresse genutzt werden und nicht als Sendeadresse Die Klasse E ist fiir zukiinftige Anwendungen reserviert und wird zur Zeit nicht verwendet 2 INTERNET 20 2 3 3 1 Besondere Internet Adressen Einige Netzwerkadressen sind f r spezielle Funktionen reserviert Die beiden wichtigsten sind die Broadcast und Loopback Adresse Eine Broadcast Adresse dient dazu da ein bestimmtes Datenpaket an alle Knoten eines Netzwerkes verschickt wird Alle Bits des Feldes f r die Benutzeridentifikation werden auf 1 gesetzt So ist z B die Broadcast Adresse f r das Netzwerk 121 der Klasse A 121 255 255 255 Die Klasse A Adresse 127 i
59. e 31 3 2 6 Benutzerverwaltung und Zugriffsrechte 32 3 2 7 Meta Information Attribute 33 3 2 8 Mehrsprachigkeit 33 3 3 Wavemaster 34 3 4 Hyperwave Publishing Wizard 34 1 EINF HRUNG 6 3 5 Hyper G Client Amadeus 35 3 5 1 Collection Browser 35 3 5 2 Viewer 35 4 Mensch Maschine Kommunikation 36 4 1 Einleitung 36 4 1 1 Was ist Mensch Maschine Kommunikation Human Computer Interaction 36 4 1 2 Warum Mensch Maschine Kommunikation 36 4 1 3 Mensch Maschine Kommunikation als f cher bergreifendes Forschungsgebiet 37 4 14 Was ist ein Benutzerinterface 38 4 1 5 Ziele und Rollenverteilungen bei der Entwicklung von Benutzerinterfaces 39 4 1 6 Phasen der Softwareentwicklung 40 4 2 Meilensteine in der Mensch Maschine Kommunikation 41 4 3 Menschliche Informationsverarbeitung 41 4 3 1 Informationsspeicherung beim Menschen 41 4 3 2 Kognitive Modelle in der Mensch Maschine Kommunikation 42 4 3 3 Wahrnehmung und Repr sentation von Objekten 42 4 34 Aufmerksamkeit und Beschr nkungen bei der Informationsverarbeitung 43 4 3 5 Wissen und mentale Modelle 44 4 3 6 Interfacemetapher und Begriffsmodelle 47 4 3 7 Lernen in Zusammenh ngen 49 4 4 Gestaltung von Benutzerinterfaces 51 4 4 1 Allgemeines 51 4 4 2 Unterschiedliches Design f r unterschiedliche Anwendungen 54 4 4 3 Beachtung der Verschiedenheit der Benutzer 55 4 44 Hauptinteraktionsstile beim Umgang mit Com
60. e Effekte und Audio unterst tzt werden Viele Menschen verwenden heute Computer haben aber keine jahrelange Erfahrung damit Sie kennen sich nur in der realen Welt aus haben dort aber einen gro en Erfahrungsschatz Mit Hilfe von Metapher kann man diesen Erfahrungsschatz f r eine einfachere Nutzung des Computes verwenden Direkte Manipulation Die Anwender m chten das Gef hl haben da sie genau wissen welche Aktivit ten der Computer ausf hrt Personen erwarten von ihren physikalischen Aktionen physikalische Ergebnisse Wenn z B eine Taste auf der Tastatur gedr ckt wird dann soll ein Ger usch ert nen und gleichzeitig das Zeichen am Bildschirm erscheinen Wenn in einem Zeichenprogramm eine Linie gezeichnet werden soll dann mu diese Linie sofort sichtbar werden und sich auch ver ndern lassen Benutzer m chten zu jedem Zeitpunkt sehen welche M glichkeiten ihnen offen stehen sie m chten gewarnt werden bevor durch eine Unachtsamkeit Daten zerst rt werden Wenn ein Fehler auftritt soll er den Grund beinhalten und auch Alternativen anbieten Sehen und Zeigen anstatt Erinnern und Eintippen Anwendern soll die M glichkeit geboten werden aus am Bildschirm angebotenen Alternativen zu w hlen d h sie sollen etwas sehen und wiedererkennen anstatt sich erst m hsam zu erinnern In einem guten Benutzerinterface soll man sich an nichts erinnern m ssen sondern das System soll alle M glichkeiten anbieten Es ist zu beachten da sehr viele
61. en aktuellen Status des Systems informiert sein Daher ist es notwendig da f r jede get tigte Aktion vom Computer eine kurze R ckmeldung erfolgt Vor allem bei l nger andauernden Rechenoperationen ist eine st ndige R ckmeldung unbedingt notwendig e Wiederherstellen eines lteren Status Da Benutzer immer wieder Fehler begehen sollte ihnen eine einfache M glichkeit geboten werden den Fehler r ckg ngig zu machen Generell sollten alle Aktionen wieder r ckg ngig gemacht werden k nnen um damit den Benutzer zum Experimentieren einzuladen d h er kann nach dem Prinzip Versuch und Irrtum lernen Alle Aktionen die unumkehrbar sind m ssen dem Anwender immer vorher mitgeteilt werden e Stabilit t Personen f hlen sich nur in Programmen wohl die immer zuverl ssig verst ndlich und stabil arbeiten e sthetische Integrit t Schlechte visuelle Darstellung oder ein Design das nur beeindruckt und nicht informiert verringern die Effektivit t der Mensch Maschine Kommunikation e Einfachheit Ein Benutzerinterface sollte immer so einfach wie m glich zum Lernen und zum Verwenden sein Es mu au erdem den Zugang zur gesamten Funktionalit t eines Systems bieten 4 MENSCH MASCHINE KOMMUNIKATION 60 4 4 5 Regeln f r das Design von Benutzerinterfaces Regeln f r das visuelles Design Was wir sehen beeinflu t wie wir f hlen und was wir verstehen Micro95 Foley90 Visuelle Information kommuniziert nonverbal aber se
62. ende M glichkeiten durch Betreten der Querycollection e Er f hrt eine Volltextsuche in dieser Querycollection durch und je nachdem wie gut die Zusammenfassungen sind werden ihm entsprechende Ergebnisse angeboten e Er f hrt eine Suche ber die Metainformation Autor Erscheinungsjahr Verlag durch 6 2 Vergleich Querycollection mit einer normalen Collection in Hyperwave normale Collection 1 Die Metainformation der Dokumente in der Collection kann beliebig sein 2 Die Metainformation mu nicht angegeben werden 3 Beim Betreten der Collection werden alle Dokumente automatisch aufgelistet 4 Es k nnen alle unter Hyperwave definierten Dokumenttypen verwendet werden 6 QUERYCOLLECTION F R HYPERWAVE 90 Querycollection 1 Die Metainformation der Dokumente in der Querycollection ist genau festgelegt 2 Die Metainformation mu beim Einf gen eines Dokumentes immer angegeben werden 3 Beim Betreten der Querycollection wird ein Suchformular angezeigt mit dem nach bestimmten Dokumenten in der Querycollection gesucht werden kann Es k nnen alle unter Hyperwave definierten Dokumenttypen verwendet werden 6 3 Typischer Verlauf der Erstellung und Benutzung einer Querycollection 6 3 1 Erstellung Der Autor berlegt sich welche Metainformationen zu den Dokumenten ben tigt werden Der Autor erzeugt eine Querycollection am Hyperwave Server Mit Hilfe eines Queryform Wizards erstellt er das Formular f r die
63. entation der Multilingualit t von Hyperwave Dokumente in verschiedener Sprache werden in diesem Cluster zusammengefa t Je nach ausgew hlter Sprache wird ein Dokument entsprechend dieser Sprache dargestellt Multimedia Cluster Mehrere Objekte die die unterschiedlichen menschlichen Sinnesorgane ansprechen werden zu einer Einheit zusammengefa t z B ein Videofilm ein Audiodokument und dazu passende Untertitel als Text Multicluster Dieser Cluster hat die Eigenschaft da alle Dokumente die sich darin befinden sofort beim Betreten des Clusters gleichzeitig untereinander erscheinen Alternative Cluster Es besteht die M glichkeit da ein Objekt in unterschiedlicher Qualit t in diesem Cluster gespeichert wird Je nach Einstellung des Benutzers z B abh ngig von seiner m glichen bertragungsbandbreite wird dann das f r ihn passende Objekt dargestellt Eine weitere Anwendungsm glichkeit ist es Dokumente in verschiedenen Formaten anzubieten z B in HTML Postscript oder Winword Je nach Benutzereinstellung wird das passende Format ausgew hlt e Sequence In eine Sequence k nnen beliebige Objekte eingespielt werden Wird diese Sequence von einem Benutzer betreten erh lt dieser zun chst eine bersicht ber alle Dokumente dann kann er diese Dokumente in sequenzieller Reihenfolge nacheinander betrachten Die Navigation durch diese Liste von Dokumenten wird automatisch von Hyperwave generiert soda es keine Probleme
64. er nderung statt Online nderung Das Laden umfa t immer alle Texte Die bestehende alte Datenbank wird vor dem Laden gel scht 72 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL Kombination Das Laden findet nicht sofort nach jeder nderung oder Neueingabe statt Die bestehende Datenbank wird nicht gel scht Es werden nur die ge nderten bzw neu aufgenommenen Texte geladen e Nach der Bestimmung der Deskriptoren bei der Datenaufnahme Die Deskriptoren m ssen von Hand eingegeben werden Deskriptoren werden automatisch aus den Texten generiert z B jedes Wort des Textes ergibt einen Deskriptor Deskriptoren k nnen automatisch extrahiert werden die dazu notwendigen Programme m ssen jedoch vom Benutzer selbst geschrieben werden Deskriptoren k nnen nur aus bestimmten Teilen des Textes extrahiert werden Deskriptoren werden gem einer im Voraus bestimmten Tabelle Thesaurus extrahiert Mischformen Deskriptoren werden automatisch aus den Texten generiert und dem Benutzer zur Korrektur Auswahl und Erg nzung vorgelegt e Nach Art der nderungsm glichkeiten nderungen der Texte und der Deskriptoren Art Anzahl und Form sind m glich nderungen sind nur beschr nkt m glich nur nderung der Rohdaten oder nur nderung bestimmter Deskriptoren e Nach der Art der Speicherung der Deskriptoren Deskriptorentopologie Flache Systeme es besteht keine logische Verbindung zwischen den gespe
65. er Informationseinheiten Die Qualit t der Antwort h ngt davon ab wieviele der gespeicherten und relevanten Informationseinheiten gefunden werden und wieviele der gefundenen Informationseinheiten relevant sind Aus der Sicht einer Abfrage kann die Gesamtmenge der gespeicherten Dokumente in 4 unterschiedliche Mengen zerteilt werden Mresse 84 e Menge Y Menge der Informationseinheiten die bei der Recherche zurecht selektiert wurden und auch f r die Abfrage relevant sind e Menge Yo Menge der Informationseinheiten die bei der Recherche f lschlicherweise nicht selektiert wurden aber f r die Abfrage relevant sind e Menge Z Menge der Informationseinheiten die bei der Recherche f lschlicherweise selektiert wurden aber f r die Abfrage irrelevant sind e Menge Zo Menge der Informationseinheiten die bei der Recherche zurecht nicht selektiert wurden und auch f r die Abfrage irrelevant sind Mit diesen Mengendefinitionen lassen sich zwei Verh ltniszahlen definieren Witten 94 Agosti 96 Kuhlen 80 Pr zision Relevanzrate precision Die Pr zision ist die Messung der Genauigkeit der Suche wie nahe gelangt man an das gew nschte Ziel Fehler Fehler 74 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL Ausbeute Vollst ndigkeitsrate recall Fehler Fehler F r eine perfekte Beantwortung einer beliebigen Abfrage sollten die Mengen Yo und Z leer sein Die Pr zision und die Ausbeute konv
66. er Begriff und so haben die Menschen als Metapher daf r das Geld gew hlt man kann Zeit sparen Zeit verbrauchen Zeit verschwenden jemanden seine Zeit geben mit geborgter Zeit leben Die gesamte menschliche Sprache basiert auf den verschiedensten metaphorischen Abstraktionen Deswegen werden auch in der Mensch Maschine Kommunikation gerne Metapher f r abstrakte Begriffe verwendet Die Benutzeroberfl che graphischer 4 MENSCH MASCHINE KOMMUNIKATION 48 Systeme wird oft als Desktop Schreibtisch bezeichnet es gibt Men s Fenster windows man kann Texte ausschneiden cut kopieren copy und einf gen paste Verbale Metapher werden immer dann verwendet wenn Menschen eine neue Technologie erlernen wie z B einen Computer Zun chst versuchen sie eine Metapher zu finden mit der sich ein Computer vergleichen l t Meistens endet dieser Vergleich in der Metapher Schreibmaschine bzw Computer sind so hnlich wie Schreibmaschinen Mit Hilfe dieser Erkenntnis k nnen Menschen dann etwas ber das Verhalten des Computers aussagen wenn sie zum Beispiel eine Taste auf der Tastatur dr cken Sie sind mit dieser Metapher sogar in der Lage einen einfachen Brief in einer Textverarbeitung zu schreiben Das bedeutet also die Metapher Schreibmaschine hat ihnen geholfen das Ger t Computer ein wenig zu verstehen und damit auch bedienen zu k nnen Nachdem diese Menschen eine Zeitlang mit
67. ergieren dann jeweils zur Zahl 1 Aber dieser ideale Fall tritt nur in den seltensten F llen auf Bei der Bewertung der Gesamtleistung eines IRS werden hnliche Abfragen miteinander verglichen Unter hnlichen Abfragen versteht man jene die den gleichen Zweck verfolgen aber unterschiedlich formuliert sind Man kann f r jede Antwort der hnlichen Abfragen ein Wertepaar Ausbeute Pr zision berechnen und dieses graphisch mit Hilfe eines Ausbeute Pr zision Diagrammes darstellen Je h her die Leistung des verwendeten IRS und je besser die Datenbasis ist desto eher n hert man sich dem Idealpunkt mit Ausbeute 1 und Prazision 1 In der Praxis ergibt sich jedoch meist folgender Zusammenhang Je h her die Ausbeute ist desto geringer die Pr zision und je h her die Pr zision desto geringer die Ausbeute Eine weitere Ma zahl zur Beurteilung der Qualit t eines IRS ist die Ausfallsrate fallout ratio Sie repr sentiert den Anteil der f lschlich ausgew hlten irrelevanten Dokumente an allen irrelevanten Dokumenten in der Datenbasis Ausfallsrate fallout ratio Fehler Fehler Im Idealfall hat die Ausfallsrate den Wert 0 5 5 2 Berechnung der Ma zahlen Die Berechnung der Pr zision bietet keine Schwierigkeiten Der Anwender kann sie w hrend der Durchsicht der ausgew hlten Dokumente vornehmen Er braucht keine Kenntnis ber die Mengen der nicht ausgew hlten Dokumente Mengen Yo und Zo Die Ma zahl der Pr zision erlaubt jedoc
68. es gesamten Programmablaufes zur Verf gung gestellt werden 4 MENSCH MASCHINE KOMMUNIKATION 64 Verwendung von kurzen einfachen S tzen Die S tze sollen positiv formuliert werden Verwendung logischer Prinzipien bei der Sortierung von Listenelementen Wenn kein Prinzip anwendbar ist dann soll die Liste alphabetisch sortiert werden Die Bezeichnungen von Eingabefeldern sollen nahe genug beieinanderliegen um sie als zusammengeh rig zu erkennen Der Mindestabstand sollte aber ein Leerzeichen betragen Spalten die linkszentriert sind erm gliches ein schnelles lesen oder suchen nach einem bestimmten Element Bei Bildschirminhalten die auf mehrere Seiten verteilt sind soll jede Seite bezeichnet werden um die Beziehungen zwischen den Seiten erkennbar zu machen Jede Darstellung sollte mit einem Titel oder mit einer Kopfzeile beginnen um kurz den Inhalt oder die Intention dieser Anzeige zu erkl ren Es sollte sich mindestens eine Leerzeile zwischen dem Titel und dem Rest der Darstellung sein Bei Gr enkodierungen sollte das gr ere Symbol mindestens eineinhalb mal gr er sein als das kleinere Bei blinkender Information z B blinkender Text sollte die Blinkrate zwischen 2 und 5 Herz liegen mit einem sichtbaren Intervall von mindestens 50 der Gesamtzeit Bei gro en Tabellen sollen f r den Anwender die Spalten berschriften immer sichtbar sein Regeln f r Dateneingabe und Formulare Shneider92 Die Dateneingabe
69. estellte Aufgabe l sen vorherzusagen Weiters wird versucht den Proze des Einarbeitens in ein neues System zu analysieren und zu vereinfachen Ein Forschungsziel ist es zu erkennen wie Menschen ihr Wissen organisieren und wie mentale Modelle bei Benutzerinterfaces eingesetzt werden k nnen Preece94 Die Repr sentation menschliches Wissen kann in drei Typen aufgeteilt werden e analoge Repr sentationen sind Bilder hnlich wie Photos von einem Gegenstand e aussagende Repr sentationen abstrakte sprach hnliche Konstrukte z B das Bild h ngt an der Wand oder die T re ist geschlossen 4 MENSCH MASCHINE KOMMUNIKATION 45 e verteilte Repr sentationen Netzwerke von Knoten die Information befindet sich implizit in den Verbindungen zwischen den einzelnen Knoten Das Wissen des Menschen ist sehr stark organisiert Dies l t sich anhand eines einfachen Beispiels beschreiben Im Ged chtnis ist eine sehr gro e Anzahl von Informationen gespeichert und trotzdem ist es sehr leicht m glich bestimmte Fakten innerhalb sehr kurzer Zeit abzurufen Es bereitet niemandem Probleme sofort die Hauptstadt von Frankreich zu nennen oder eine Frucht deren Name mit dem Buchstaben A beginnt Die schnellen Antwortzeiten f r diese Fragen deuten darauf hin da das menschliche Wissen organisiert sein mu Wie dieses Wissen allerdings genau organisiert wird kann erst in Ans tzen vermutet werden Einer davon ist das semantische Ne
70. ext IRS sinnvoll abfrageweise Betrachtung Hier werden anstelle eines einzelnen Dokumentes alle Dokumente einer Abfrage ber cksichtigt Definition des Relevanzfaktors 79 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL RF Fehler Der Relevanzfaktor ist bei der Modifikation und Wiederholung von Abfragen von Bedeutung Um die Pr zision einer Abfrage bei gleichbleibender Ausbeute zu erh hen werden in der modifizierten Abfrage nur Deskriptoren verwendet deren Relevanzfaktor ber einen bestimmten Grenzwert liegt Die Verwendung dieses Faktors kann bei gro en Datenmengen auch in einem Nicht Volltext IRS sinnvoll sein dokumentspezifische Betrachtung Diese Ma zahl entstand aus der Erkenntnis da die Wichtigkeit der Deskriptoren eines Dokumentes vom Inhalt anderer Dokumente abh ngig ist z B ein Deskriptor computer in einer Artikelsammlung ber Datenverarbeitung hat einen geringen Wert der gleiche Deskriptor in einer Artikelsammlung ber Medizin einen wesentlich gr eren Wert Per definitionem wird die Inverse Document Frequency eingef hrt IDF Fehler Die IDF eines Deskriptors D im Dokument Tj steigt je h ufiger er in diesem Dokument erscheint Sie sinkt wenn er aber in vielen Dokumenten vorkommt Je kleiner der Wert von IDF ist desto unwichtiger ist dieser Deskriptor Die IDF solle im Idealfall f r alle in der Abfrage verwendeten Deskriptoren in allen ausgew hlten Dokumenten einen m glichst
71. fehler oder ein falsch angew hlter Menupunkt aufz hlen Allen diesen Fehler ist gemeinsam da der Benutzer genau wei wie er es richtig ausf hren mu und daher meistens sehr schnell den Fehler beheben kann In qualitativ hochwertigen Benutzerinterfaces wird versucht die Anzahl der Fehler die ein Benutzer machen kann m glichst gering zu halten bzw die Fehlermeldungen klar und verst ndlich zu formulieren Es ist allerdings darauf zu achten da Menschen gewohnt sind aus Fehlern zu lernen Scharf formuliert w rde es dann bedeuten Wenn jemand in einem System keine Fehler machen kann kann er auch nichts ber das System lernen 4 4 Gestaltung von Benutzerinterfaces 4 4 1 Allgemeines Nach Preece94 gelten folgende Punkte f r das Design von Benutzerinterfaces 4 MENSCH MASCHINE KOMMUNIKATION 52 e Design ist ein kreativer Proze aber trotzdem m ssen Entwicklungsprinzipien beachtet werden e Design involviert das Erzeugen einer Anzahl von zwischenzeitlichen Repr sentationen des endg ltigen Produktes e Benutzerbezogenes Systemdesign zentriert sich auf Menschen ihre Arbeit ihre Umgebung und wie das neue System am besten designed werden kann um diese Menschen zu unterst tzen e Benutzerbezogenes Design ben tigt benutzerbezogene Repr sentationen von Objekten Designprinzipien principles und Designregeln guidelines Preece94 k nnen folgenderma en unterschieden werden e Prinzipien sind abstrakt und auf
72. fert nur Informationen ber die Nutzung eines Ger tes und nichts ber den inneren Aufbau oder die Funktionsweise Viele Menschen k nnen etwas Neues allein mit Hilfe dieses Modelles benutzen ohne eine Ahnung von der inneren Funktionsweise zu haben Diese beiden Modelle lassen sich leicht unterscheiden Jeder der ein Telefon hat wei genau wie er es benutzen mu um eine andere Person anzurufen Dieses Wissen ist das funktionelle Modell Aber nur sehr wenige wissen wie ein Telefon genau funktioniert Diese Personen haben neben dem funkionellem Modell auch ein Wissen ber das strukturelle Modell Deswegen sind auch nur sie in der Lage Fehler zu erkennen zu analysieren und zu beheben Zusammenfassend l t sich sagen da zur Benutzung eines Systems das funktionelle Modell vollkommen ausreicht um aber Fehler zu beheben oder das System zu verbessern ist unbedingt das strukturelle Modell notwendig Aus diesem Grund besteht das Wissen das Menschen ber ein System haben fast immer nur aus einem funktionellem Modell 4 3 6 Interfacemetapher und Begriffsmodelle Der Begriff Metapher Preece94 wird aus traditionellen Gr nden mit der Sprache assoziiert Immer wenn Menschen ein abstraktes Konzept zu erkl ren versuchen verwenden sie bekannte f r jeden verst ndliche Begriffe sogenannte metaphorische Ausdr cke Als ein sehr gutes Beispiel f r die Verwendung von Metaphern Kann ein Gespr ch ber die Zeit dienen Zeit ist ein sehr abstrakt
73. ffektiv sind Die Benutzer brauchen eine lange Einlernzeit um auch unter Stre fehlerfrei zu arbeiten Die subjektive Zufriedenheit ist egal da die Personen hochmotiviert sind Mit ihnen werden auch immer wieder als bung die verschiedensten Extremsituationen durchgespielt industrielle und kommerzielle Anwendungen Typische Anwender sind Banken Versicherungen Fluglinien Hotels und Kreditkartenfirmen Sie legen Wert auf geringe Kosten schnelle Verarbeitungszeiten weniger Wert auf Einlernzeit und berhaupt keinen auf die subjektive Zufriedenheit ihrer Mitarbeiter B ro Heim und Unterhaltungsanwendungen Beispiele daf r sind Textverarbeitungen Tabellenkalkulationen Unterhaltungsprogramme und Spiele Wichtig ist hier eine m glichst kurze Einlernzeit geringe Fehlerrate kleiner Preis und subjektive Zufriedenheit der Benutzer Die Schwierigkeit im Design dieser Systeme liegt darin da die Anwender unterschiedlichstes Vorwissen ber Computer haben und trotzdem sollen ein absoluter Anf nger und ein Experte mit dem System zufrieden sein Forschungs Kreativit ts und Kooperationsanwendungen Das sind Datenbanken Visualisierungen gro er Datenmengen Expertensysteme Diagnosesysteme Designsysteme kooperative und kommunikative Systeme In diesem Bereich sind die Benutzer einerseits Experten auf ihrem Gebiet aber andererseits vielleicht 4 MENSCH MASCHINE KOMMUNIKATION 55 Anf nger im Umgang mit Computern F r diesen Anwende
74. gerade passiert Interpretationen verdecken die Sicht auf das eigentliche Problem und den richtigen L sungsweg e Lernende generalisieren aus ihrem bisherigen Wissen z B glauben sie eine Textverarbeitung arbeitet gleich wie eine Schreibmaschine daraus folgen Mi verst ndnisse und Probleme e Lernende haben Schwierigkeiten Anweisungen zu folgen Lernende lesen nicht immer Anweisungen oder f hren sie nicht immer aus sie verstehen Anweisungen oft nicht oder f hren sie nicht korrekt aus e Abh ngigkeit von Problemen Sie haben Schwierigkeiten zu erkennen da ein Problem weitere Probleme ausl sen kann e die M glichkeiten die das Interface anbietet sind nicht offensichtlich Lernende werden durch Seiteneffekte und R ckmeldungen des Computers verwirrt e die angebotene Hilfe des Computers hilft nicht wirklich Lernende wissen nicht immer welche Hilfe sie brauchen w rden die angebotene Hilfe ist nicht auf das aktuelle Problem des Benutzers zugeschnitten Wenn Menschen mit einem neuen System konfrontiert werden verwenden sie ihr bisheriges Wissen um das Verhalten des neuen Systems zu interpretieren und vorherzusagen Lernen durch Analogie versucht eine Br cke zu schlagen zwischen dem 4 MENSCH MASCHINE KOMMUNIKATION 51 bisherigen Wissen und dem Neuen Zum Beispiel mu sehr oft eine Schreibmaschine als Analogie f r eine Textverarbeitung dienen Interfacemetapher und mainstream instructions wie z B Laden Speichern Druc
75. gr ndet den Aufbau einer paneurop ischen Hochgeschwindigkeitsinfrastruktur f r die Daten bertragung zwischen den Forschungs und Entwicklungseinrichtungen der verschiedenen L ndern zu f rdern RARE ist einer der Mitbegr nder der ISOC und aktives Mitglied im europ ischen Standardisierungsgremium ETSI European TElecommunications Standards Institute RARE ist heute die Dachorganisation aller europaweiten Internetaktivit ten Die urspr nglich von verschiedenen europ ischen Internetbetreibern gegr ndete RIPE R seaux IP Europ ens hat die Aufgabe die unterschiedlichen das TCP IP betreffenden Aktivit ten in Europa zu koordinieren 2 2 4 Schaffung von Internet Standards Vorschl ge Ideen Richtlinien und Spezifikationen die das Internet betreffen werden in Form von RFCs Requests for Comments ver ffentlicht Seit 1989 ist die Struktur und der Aufbau von RFCs durch die RFC 1111 geregelt Ein RFC Editor koordiniert als Mitglied des IAB die Ver ffentlichung sowie die Verteilung im Internet Die einzelnen RFCs werden in der Reihenfolge ihres Erscheinens sequenziell numeriert RFC 1000 ordnet die RFCs 1 bis 999 die im Zeitraum 1969 bis 1987 erschienen sind nach thematischen Gebieten Die Verwaltung aller RFCs erfolgt durch das Informatik Institut der Universit t von S dkalifornien USC ISI Alle RFCs die den Status von offiziellen AB Internet Standards erreichen werden in der RFC 1600 zusammengefa t Ein Dokument welches sich zu
76. h erst im Zusammenhang mit anderen Ma zahlen Aussagen ber die Qualit t des IRS und der gespeicherten Daten Die Berechnung der Ausbeute und der Ausfallsrate setzt die Kenntnis der Mengen Yo und Zo voraus Diese Berechnung kann auf 3 unterschiedliche Arten erfolgen e berpr fung aller gespeicherter Dokumente Nach jeder Abfrage werden sowohl die Dokumente der Antwort als auch alle restlichen gespeicherten Dokumente der Datenbasis auf ihre Relevanz hin untersucht Das Resultat sind die gew nschten Mengen Diese Methode ist sehr zeitraubend und kann daher nur f r kleine Datenmengen durchgef hrt werden Allerdings ist die Berechnung der Qualit tsmasse jedoch vor allem f r gro e und inhaltlich unbekannte Dokumentemengen interessant 75 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL Anwendung von Stichprobenverfahren Aus den bei einer Abfrage nicht ausgew hlten Dokumenten Menge Yo und Zo werden Stichproben gezogen und auf ihre Relevanz bewertet Durch eine anschlie ende Hochrechnung kann dann Yo und Zo bestimmt werden Erweiterung der Abfrage Nach der ersten und zu bewertenden Abfrage wird diese Abfrage so erweitert da mit an Sicherheit grenzender Wahrscheinlichkeit alle relevanten Dokumente gefunden werden Dann werden alle Dokumente der beiden Antworten ausgez hlt Die Menge Y entspricht den relevanten Dokumenten aus der ersten Antwort Die Menge Yo ist die Differenzmenge Fehler Wobei Y gt die Menge der relevan
77. he Server werden als local server oder als proxy server bezeichnet Diese Architektur hat gegen ber der einfachen Client Server Architektur einige gro e Vorteile e Wenn der Server von einem anderen Server Informationen abfragt so werden diese in seinem lokalen Cache zwischengespeichert Wird dann dieses Dokument mehrmals angefordert so mu es nicht mehr vom anderen Server geholt werden sondern nur noch aus dem lokalen Cache Dies f hrt zu einer beachtlichen Verminderung des Datentransports auf den Leitungen und damit auch zu einer k rzeren Ladezeit e Die Clients kommunizieren immer nur mit einem Server Dadurch braucht immer nur die Verbindung zum Server aufgebaut und gehalten werden e Der Server kann auch die Aufgabe der Konvertierung von Dateiformaten oder Protokollen bernehmen Diese Funktionalit t mu dadurch nicht mehr vom Client wahrgenommen werden was zu einer Vereinfachung der Clients f hrt e F r Informationsanbieter besteht die M glichkeit den Datenverkehr der jeweiligen Clients zu berwachen und dadurch auch eine etwaige Verrechnung vorzunehmen 3 2 2 Kooperierende Prozesse Der Hyperwave Server besteht aus 3 miteinander kooperierenden Prozessen e Document Server Er stellt den Clients lokale Dokumente zur Verf gung bernimmt Dokumente vom Client und speichert sie Falls von den Clients Dokumente angefordert werden die auf anderen Servern liegen werden sie geholt den Clients zur Verf gung gestellt und zus
78. hen lassen sich sp ter nur mehr sehr schwierig korrigieren Dieser Teil des Zyklus beinhaltet nicht nur das Definieren des sachlichen Bereiches und der Features eines Produktes sondern auch das Verst ndnis wer die Anwender sind und welche Aufgaben Vorstellungen und Ziele sie verwirklichen wollen Es erfolgt eine Definition eines konzeptuellen Rahmens um das System dem Wissen und der Erfahrung der zuk nftigen Anwender anzupassen e Prototyping Nachdem die Designphase abgeschlossen wurde erfolgt die Erstellung einiger Prototypen die die grunds tzlichen Aspekte des neuen Interfaces beinhalten Dies kann einerseits mit Papier und Bleistift oder mit speziellen prototyping tools geschehen Diese Prototypen bilden die Basis f r Diskussionen und Weiterentwicklungen am Interface 4 MENSCH MASCHINE KOMMUNIKATION 67 e Test Benutzerbezogenes Design beinhaltet die Einbeziehung des Endanwenders in die Entwicklung Das Testen einiger Teile oder des gesamten Interfaces gibt Aufschlu ber die Qualit t des Designs Die Tests geben Auskunft ber das Empfinden des Anwenders ber seine subjektive Zufriedenheit und ber Fragen und Probleme die die Testperson bei der Anwendung des Interfaces aufwirft Es ist wichtig da die Tester keine Kollegen oder andere Softwareentwickler sondern nur Personen aus der tats chlichen Zielgruppe des Programmes sind e Iteration Da das Testen oft Programmier und Designfehler erkennen l t erfolgt nach
79. her verwendet Ihr System Star versuchte den Computer als einen Schreibtisch wie in einem B ro darzustellen Man hatte eine Tischfl che die durch den Bildschirm repr sentiert wurde Auf dieser Tischfl che befanden sich Icons f r die verschiedenen Dokumente und Ordner Durch einfaches Anklicken eines Dokumentes mit der Maus konnte das Dokument ge ffnet und bearbeitet werden Durch Verschieben der Dokumente in Ordner wurden sie darin abgelegt Es existierte sogar eine Metapher f r einen Papierkorb Ein Icon das die Form eines Papierkorbes hatte Dokumente und Ordner die 4 MENSCH MASCHINE KOMMUNIKATION 49 man nicht mehr brauchte wurden mit der Maus zum Papierkorb Icon gezogen und damit auch physikalisch vom Computer gel scht Dieser erste Versuch die Metapher B roschreibtisch f r Computer einzuf hren hatte in den fr hen 80er Jahren einen so gro en Erfolg da diese Metapher sogar noch heute verwendet wird Apple Macintosh Microsoft Windows X Windows unter Unix Allerdings stellte man schon damals fest da auch diese Schreibtischmetapher nur unzureichend ist denn bisher gibt es noch keinen Tisch bei dem die daraufliegenden Akten durch einen Knopfdruck zusammenger umt und vielleicht auch noch alphabetisch sortiert auf einer Seite des Tisches gestapelt werden Auch gibt es noch keinen Ordner der ein Dokument welches man darauflegt automatisch einheftet An diesen Beispielen erkennt man da auch diese Metapher B
80. hohen Wert erreichen Es kann wieder ein Grenzwert festgelegt werden und alle Deskriptoren unter diesem Grenzwert werden ausgeschieden Die IDF ist nur in Volltext IRS mit automatischer Indexierung sinnvoll abfragespezifische Betrachtung Bei der Gewichtung von ganzen Dokumenten wird mit folgender Ma zahl gearbeitet Sie wird bei jeder Abfrage f r alle Deskriptoren die in Verbindung mit einem der selektierten Dokumente stehen berechnet Die Berechnung von L setzt die Bewertung aller selektierten Dokumente oder einer Stichprobe aus der Menge der selektierten Dokumente durch den Benutzer voraus Die Definition von L lautet Lig Fehler Je gr er L f r einen bestimmten Deskriptor ist desto wichtiger ist er Die Berechnung von L wird w hrend der Abfrage vorgenommen Sie ist auch in Nicht Volltext IRS sinnvoll wenn die Menge der gespeicherten Dokumente gro genug ist 80 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL 81 Zusammenfassung der erl uterten Ma zahlen Wert f r Wert f r Ma zahl wichtigen unwichtigen Berechnung Aussage Deskriptor Deskriptor ein wichtiger G gegen gegen 0 beim Laden Deskriptor tritt nur in einem Dokument auf RF gegen 1 gegen 0 bei der Abfrage Deskriptor ist eng mit der Abfrage verbunden Deskriptor ist eng mit IDF gegen unendlich gegen beim Laden dem Dokument verbunden ein wichtiger L gegen unendlich gegen 0 bei der Abfrage Deskriptor bezeicinei den
81. hr effizient Sie kann motivieren leiten oder absto en Effektives visuelles Design leistet viel mehr als nur Dekoration Es ist ein sehr wichtiges Kommunikationsmittel Wie Information am Bildschirm angeboten wird kann einen gro en Unterschied bewirken der Benutzer ist informiert oder er ist verwirrt oder berlastet Auch die beste Funktionalit t eines Produktes leidet unter einer schlechten visuellen Pr sentation Von einem Bildschirm wird auf die gleiche Weise wie z B von einer Zeitung oder einem Plakat gelesen Das Auge wandert zuerst zu den bunten Elementen und dann zu den schwarzen und wei en zuerst zu isolierten dann zu gruppierten Elementen und dann zu Graphiken und dann erst zu Text Allgemeine Regeln f r das Design eines Layouts e Hierachie der Information Die Plazierung der Information erfolgt nach ihrer relativen Wichtigkeit Diese Ordnung beeinflu t welche Elemente ein Benutzer zuerst betrachtet bzw betrachten soll Hier sollten immer drei Fragen gestellt werden e Welche Information ist f r den Benutzer am wichtigsten e Was m chte der Benutzer als erstes zweites drittes ausf hren e Wassollte er als erstes zweites drittes am Bildschirm betrachten e Zentrum und Betonung Dienen zur Definition von Priorit ten Die Festlegung des Zentrums bedeutet die zentrale Idee zu identifizieren Wichtige Elemente m ssen betont werden um sie von anderen zu isolieren In internationaler Software ist dies schwierig da z B E
82. icherten Deskriptoren alle sind gleichrangig und gleichberechtigt Hierachische Systeme die gespeicherten Deskriptoren sind hierachisch miteinander verkn pft Netzwerkartige Systeme zwischen den Deskriptoren k nnen beliebige netzwerkartige Strukturen und Abh ngigkeiten definiert werden e Nach der Verwaltung der gespeicherten Daten Die Verwaltung erfolgt durch ein Datenbank Management System DBMS Die Verwaltung wird durch das IRS selbst erledigt Die Verwaltung obliegt dem Benutzer die Daten sind in einzelnen Dateien gespeichert welche f r den Benutzer transparent sind 73 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL e Mischformen Die Verwaltung wird normalerweise durch das IRS besorgt kann aber jederzeit vom Benutzer oder von einem DBMS bernommen werden 5 5 Beurteilung der G te eines IRS Die Beurteilung der G te eines IRS und der gespeicherten Daten kann aufgrund zwei unterschiedlicher Kriterien erfolgen Mresse 84 e quantitative oder technische Gesichtspunkte Angaben ber die L nge der Antwortzeiten des Systems oder ber die Anzahl der gespeicherten Informationseinheiten e qualitative Merkmale Diese werden im folgenden genauer beschrieben 5 5 1 Ma zahlen Der Benutzer eines IRS beschreibt seine Interessen durch eine Abfrage Recherche query Diese Abfrage dient als Grundlage f r eine Suche in der Datenbasis Die Antwort des IRS an den Benutzer umfa t eine Anzahl von Dokumenten od
83. icherungsschicht Data Link Layer Die Sicherungsschicht hat die Aufgabe die zu versendenden Daten in Datenpakete aufzuteilen Daf r werden bestimmte Bitmuster eingef gt die das Erkennen von Beginn und Ende der Datenpakete erm glichen Werden Datenpakete nicht oder nur fehlerhaft bertragen k mmert sich diese Schicht um eine erneute bertragung der zerst rten oder verlorengegangenen Daten OSI Schicht 3 Vermittlungsschicht Network Layer Die wichtigste Aufgabe der Vermittlungsschicht ist die Auswahl der bertragungswege f r die Datenpakete In dem weitverzweigten Netzwerk gibt es eine Vielzahl von m glichen Wegen vom Sender zum Empf nger Die Vermittlungsschicht w hlt nach verschiedenen Kriterien wie bertragungszeit und Auslastung des bertragungsweges den optimalen Weg f r die Datenpakete aus OSI Schicht 4 Transportschicht Transport Layer Die Transportschicht bernimmt die Daten der ihr bergeordneten Sitzungsschicht pa t sie an die Formate der OSI Schicht 3 an und reicht sie an diese weiter OSI Schicht 5 Kommunikationssteuerungsschicht Session Layer Bei Multi User Systemen haben mehrere Benutzer gleichzeitig die M glichkeit den gleichen Computer zu benutzen Die Aktivit t jedes Benutzers wird dabei als Sitzung session bezeichnet Die Kommunikation von Sessions mit der Au enwelt wird von dieser Schicht administriert OSI Schicht 6 Darstellungsschicht Presentation Layer Die Darstellungsschicht ko
84. ichkeit zur Definition der Struktur einer Informationseinheit e Benutzer Die Aufnahme der Texte Dabei erfolgt ein unterschiedliches Vorgehen wenn der Text Informationen ber ein Objekt eine Referenz zu einem Objekt oder das Objekt selbst enth lt e Benutzer Die Aufnahme der Deskriptoren In einigen F llen erfolgt dies auch automatisch durch das IRS Trotzdem kann es vorkommen da der Benutzer diese Deskriptoren noch manuell nachbearbeiten mu Das Resultat dieser Datenaufnahme sind Rohdaten welche aus einer Menge von Informationseinheiten bestehen Beim Ladevorgang wird durch Umorganisation der Rohdaten sowie durch Speicherung von Zusatzinformationen ber die Struktur der Daten eine Verbesserung der Zugriffsm glichkeiten bei der Abfrage erreicht Die Struktur der Daten welche beim Ladevorgang entsteht sowie die Beziehungen zwischen den Daten werden als Datenorganisation bezeichnet Die Datenaufnahme und deren Ladevorgang k nnen auf zwei unterschiedliche Arten behandelt werden e getrennt Aufgenommene Daten werden als Rohdaten zwischengespeichert und erst zu einen sp teren Zeitpunkt geladen e gemeinsam Jede Informationseinheit wird sofort nach Beendigung der Datenaufnahme in das System geladen Der Begriff Datenabfrage umfa t alle T tigkeiten die der Wiedergewinnung der Informationen dienen 71 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL 5 4 Klassifizierung von Information Retrieval Systemen Anhand
85. ichsten nationalen und internationalen Organisationen und Vertretungen Kyas 94 2 2 1 Internet Society ISOC 1991 wurde von CNRI Corporation for National Research Initiatives EDUCOM RARE und IAB die ISOC gegr ndet Ziel der ISOC ist es die internationale Weiterentwicklung des Internets zu koordinieren sowie bestehende Dienste zu verbessern bzw zu erweitern In einer viertelj hrlich erscheinenden Publikation Internet Society News wird ber die Aktivit ten informiert Einmal j hrlich erfolgt eine Konferenz die INET 2 2 2 IAB IETF und IRTF Die technischen Entscheidungen und Richtlinien f r das nordamerikanische Internet werden seit 1983 vom Internet Activities Board IAB getroffen Im Jahre 1989 wurde das IAB reorganisiert Die Aktivit ten wurden auf die beiden Hauptabteilungen Internet Reseach Task Force IRTF und Internet Engineering Task Force IETF aufgeteilt Das IRTF ist f r kurz und mittelfristige Projekte zust ndig die IETF f r die organisatorischen Bereiche Die verschiedenen Aufgaben sind dabei jeweils in Arbeitsgruppen organisiert 1991 wurde das IAB in die ISOC eingegliedert Seitdem arbeiten in den Arbeitsgruppen von IRTF und IETF zunehmend auch internationale 2 INTERNET 14 Vertreter mit Eine der wichtigsten Aufgaben der IETF ist es Spezifikationen zu entwickeln die in Zukunft zu Internet Standards werden sollen 2 2 3 RARE und RIPE Die europ ische Organisation RARE wurde 1986 mit dem Ziel ge
86. idaten f r die Erforschung der Wichtigkeit von Konsistenz F r Anf nger aber wenig geeignet da sie eine gewisse Einlernphase erfordern danach sind sie aber wesentlich effizienter als andere Interaktionsstile e Direkte Manipulation Objekte werden visuell dargestellt und der Benutzer kann direkt mit ihnen arbeiten Die Forschung versucht einerseits die Darstellung der Objekte zu verbessern und andererseits neue Formen der direkten Manipulation zu entwickeln r umliche Visualisierung Telepr senz virtuelle Realit t e Fin und Ausgabeger te In vielen Experimenten wird versucht die herk mmlichen Ger te zu verbessern und auch neue Formen der Eingabe zu finden Datenhandschuh r umlicher Joystick e Erforschung von Information Dieser Bereich hat durch das Internet sehr stark an Bedeutung gewonnen Man versucht die Probleme die bei der Navigation in sehr gro en Datenmengen entstehen zu erkennen und zu beheben Es werden neue Werkzeuge zur Datenvisualisierung entwickelt e Online Hilfe Viele Computersysteme sind sehr komplex und bieten daher Unterst tzung f r den Benutzer in Form einer Hilfefunktion an Das Forschungsziel ist eine so effiziente Unterst tzung des Anwenders da er weder eine Einschulung noch ein Handbuch braucht sondern selbstst ndig den Umgang mit dem System erlernen kann e Spezifikation und Implementation von Interaktionen Die Ausarbeitung von Prinzipien Regeln und Programmen um m glichst schnell
87. iedenheit Wie zufrieden war der Benutzer w hrend er mit dem Programm gearbeitet hat Dies l t sich am besten durch Befragungen feststellen Systeme bei denen die subjektive Zufriedenheit gering ist werden von Anwendern nur ungern und daher selten benutzt Die Rollenverteilung bei der Entwicklung von Benutzerinterfaces Anwender Ist der endg ltige Benutzer der an dem System arbeitet Systemdesigner Entwirft das Gesamtkonzept und die Spezifikation Interfacedesiger Bestimmt die Aufgaben und Problemstellungen mit denen der Anwender konfrontiert wird und entwickelt daraus die Funktionsweise des Interfaces Softwaredesigner f r die Funktionalit t des Systems Implementiert alle Funktionen bis auf das Benutzerinterface Softwaredesigner f r die Funktionalit t des Benutzerinterfaces Programmiert die Teile die dem Benutzerinterface zugrundeliegen Von der Gr e des zu entwickelnden Systemes ist es abh ngig ob diese Rollen auf ein und dieselbe Person vereint werden oder ob jede Rolle von einer speziell daf r geschulten Gruppe bernommen wird Bass91 4 1 6 Phasen der Softwareentwicklung Der Lebenszyklus der Softwareentwicklung und damit auch der Entwicklung des Benutzerinterfaces kann in 6 Bereiche gegliedert werden Bass91 Bedarfsdefinition Festlegung der Problemstellung Spezifikation Funktionelles und internes Design des Systems Implementation Programmierung des internen Designs Test Erf llt das System
88. iefert wurde Diese Arbeitsweise hatte aber den Vorteil da der Experte genauestens mit dem System vertraut war und daher relativ rasch relevante Informationen erhielt Bei den heutigen Systemen ist es meist genau umgekehrt Raitt 84 Jeder darf beim IR System anfragen erh lt recht schnell eine Antwort da er aber nicht oft damit arbeitet mu er aufgrund mangelnder Erfahrung viel fter Anfragen stellen bis er alle f r ihn relevanten Informationen erh lt Weiters wird beim IR Begriff keine Aussage ber die Art der Speicherung der Daten getroffen Diese k nnen in einer speziellen Datenbank oder in einzelnen Dateien gespeichert werden Im Fall der Datenbank ist das IR System nur das Bindeglied zwischen der Datenbank und dem Benutzer im zweiten Fall der Dateien ist es auch noch f r die Speicherung und Dateiverwaltung zust ndig Houghton 84 5 2 Grundidee Die Grundidee von Information Retrieval beruht auf der Vorstellung eines Karteisystemes in welchem sich die einzelnen Informationseinheiten auf Karteikarten befinden Mresse 84 Die Suche bezieht sich daher immer auf den Inhalt bestimmter Karteikarten Das Ziel des Information Retrieval ist es diese Karteikarten bzw deren 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL Inhalt maschinell bearbeiten zu k nnen d h Daten eingeben ver ndern l schen und vor allem wiederfinden und bersichtlich dem Benutzer pr sentieren Die manuellen Methoden zur Arbeit mit Karteikarten si
89. iel verschoben haben e f hlend denkend F hlende Typen wissen ber die Gef hle anderer Bescheid versuchen andere zufriedenzustellen und haben gute Beziehungen zu den meisten Personen ihrer Umgebung Denkende Typen sind unemotionell verhalten sich anderen Menschen gegen ber unpers nlich und bringen Dinge gerne in eine logische Ordnung Eine andere M glichkeit die auf dem unterschiedlichen Wissen von Benutzern aufbaut ist die Einteilung in 3 Gruppen von Shneider92 e Anf nger Sie haben kein Wissen wie das System funktioniert und wie es zu bedienen ist Auch haben sie meist nur wenig bis gar keine Erfahrung im Umgang mit Computern 4 MENSCH MASCHINE KOMMUNIKATION 56 e durchschnittliche Benutzer K nnen meist schon auf einige Erfahrungen mit verschiedenen Computersytemen zur ckgreifen Sie haben wenig bis keine Probleme die blicherweise anfallenden Aufgaben zu l sen e Experten Arbeiten schon viel und lange mit Computern und haben auch keine Schwierigkeiten beim L sen komplexer Probleme Sie erledigen ihre Aufgaben sehr schnell und erwarten vom System da es schnell und exakt auf ihre Eingaben reagiert Umst ndliche oder immer wiederkehrende Operationen die ihre Arbeitsgeschwindigkeit bremsen werden als unangenehm empfunden Einige Beispiele wie bei verschiedenen Benutzergruppen sehr unterschiedliche Probleme bei der Nutzung von graphischen Betriebssysteman auftreten Micro95 e Anf nger haben sehr oft Schw
90. ierigkeiten im Umgang mit der Maus Beim Verschieben oder Doppelklicken von Objekten brauchen sie Zeit um eine gewisse Fingerfertigkeit zu entwickeln Beim Verschieben ist es f r sie schwierig eine Maustaste gedr ckt zu halten und gleichzeitig die Maus auf ein Ziel hinzuzubewegen Ein Doppelklick mit der Maus ist nicht das gleiche wie zwei einzelne Klicks Anf nger m ssen erst lernen wieviel Zeit zwischen zwei Klicks vergehen darf damit es ein Doppelklick ist Sie glauben dann auch oft da immer wenn sie etwas ausf hren wollen ein Doppelklick notwendig ist e Anf nger haben Probleme mit der Verwaltung von Fenstern am Bildschirm Sie erkennen nicht da berlappende Fenster eine dreidimensionale Darstellung sind Daher kommt es immer wieder vor da Fenster die von anderen berlagert wurden von einem Anf nger nicht mehr gefunden werden e Anf nger verstehen nicht die Dateihierachie auf einem Speichermedium Sie haben auch Verst ndnisschwierigkeiten beim Verschieben und Kopieren von Daten e Experten wollen effiziente Programme Sie wollen sich keine Erkl rungen f r weniger erfahrene Benutzer anschauen m ssen sondern m glichst schnell mit dem System interagieren e Internationalisierung und Behinderungen Um ein System oder Programm f r m glichst viele Personen nutzbar zu machen mu man auch R cksicht auf internationale Nutzung oder behinderte Menschen R cksicht nehmen 4 4 4 Hauptinteraktionsstile beim Umgang mit C
91. ilities of information retrieval systems are dicussed At last there is an exact explanation of the so called Querycollection and their usage and implementation 1 EINF HRUNG Erkl rung der Selbst ndigkeit Ich versichere hiermit diese Arbeit selbstst ndig verfa t andere als die angegebenen Quellen und Hilfsmittel nicht benutzt und mich auch sonst keiner unerlaubten Hilfsmittel bedient zu haben 1 EINF HRUNG 5 INHALTSVERZEICHNIS 1 Einf hrung 9 2 Internet 10 2 1 Entwicklung des Internet 10 2 2 Organisationsstrukturen im Internet 13 2 2 1 Internet Society ISOC 13 2 2 2 JAB IETF und IRTF 13 2 2 3 RARE und RIPE 14 2 2 4 Schaffung von Internet Standards 14 2 2 5 Internet Assigned Numbers Authority LANA 15 2 2 6 Network Information Center NIC 15 2 3 bertragungsmechanismen 15 2 3 1 Kommunikationsprotokolle im Internet 15 2 3 2 TCP IP 17 2 3 3 Internet Adressen 19 2 3 4 Domain Name System DNS 21 2 4 Dienste 22 2 4 1 Email 22 2 4 2 ftp file transfer protocol 23 2 4 3 telnet remote login 23 2 44 Usenet News 23 2 4 5 World Wide Web WWW 23 3 Hyper G Hyperwave 2 3 1 Die Entstehung von Hyperwave 27 3 2 Konzept von Hyperwave 28 3 2 1 Client Server Architektur 28 3 2 2 Kooperierende Prozesse 28 3 2 3 Datenmodell 29 3 2 4 Links in Hyperwave 31 3 2 5 Suchm glichkeiten in Hyperwav
92. in Korea bernahm die Softwarefirma KIES den Vertrieb von Hyperwave Im Dezember bersiedelten zwanzig Hyperwave Mitarbeiter von der TU Graz in die neue Firma Hyperwave Ges m b H in Graz Diese Firma ist eine Tochtergesellschaft der Hyperwave Ges m b H in M nchen die f r das Marketing den Vertrieb den Support und die Schulungen verantwortlich ist 1997 gab es eine kleine Sensation das Produkt erhielt auf der CeBit 97 den Best of the Show Award von BYTE Etwas sp ter kam es dann zur offiziellen Er ffnung der Hyperwave R D Ges m b H durch den sterreichischen Bundeskanzler Viktor Klima Mit dabei waren auch der Rektor der Technischen Universit t Graz Dr I Killman und die Landesr te Ing Ressl und Dipl Ing Paierl 3 HYPER G HYPERWAVE 28 3 2 Konzept von Hyperwave 3 2 1 Client Server Architektur Die meisten Informationssysteme benutzen eine einfache Client Server Architektur Dalitz 95 Dalitz 96 Flohr 95 Flohr 96 MaurerH 96 Sengstack 96 Diese Architektur bedeutet da mehrere voneinander v llig unabh ngige Computer Clients ber Datenleitungen oder auch das Internet Dienste eines anderen Computers Server in Anspruch nehmen k nnen Dies k nnen Informationsangebote oder auch Rechenleistung sein In Hyperwave wird im Gegensatz dazu eine proxy Client Server Architektur verwendet Dabei wird jeder Client mit nur einem Server verbunden Dieser Server ist jener mit der besten Verbindung zum Client Solc
93. ion Themenbereich Qualit t der Aufnahme Format Aufnahmedatum zus tzliche Beschreibung der Datei Name der Person die die Aufnahme durchgef hrt hat 6 5 Queryform Wizard 6 5 1 Was istein Wizard Ein Wizard ist ein Programm da den Benutzer bei der Bew ltigung komplexer Aufgaben unterst tzt blicherweise besteht ein Wizard aus mehreren Bildschirmseiten die in sequentieller Reihenfolge betrachtet werden k nnen Auf diesen einzelnen Seiten werden Informationen vom Benutzer erfragt die zur L sung der Aufgabe ben tigt werden Die Abfrage dieser ben tigen Informationen erfolgt in einer m glichst einfachen Weise soda auch Benutzer mit wenig Hintergrundwissen ber die zu l sende Aufgabe diese einfach und effizient bew ltigen k nnen 6 QUERYCOLLECTION F R HYPERWAVE 92 6 5 2 Ziel des Queryform Wizards Dieser Wizard soll die M glichkeit bieten sehr einfach ohne Kenntnisse ber Programmierung und Gestaltung von WWW Seiten Chandler 95 Wilson 95 Mary 96 Niederst 96 mit HTML Hyper Text Markup Language Jones 95 Jorge 96 Graham 95 ein ansprechendes Such und Eingabeformular fiir die Metainformation zu gestalten 6 5 3 Funktionsweise Ablauf der Erstellung eines Such bzw Eingabeformulares mit Hilfe des Queryform Wizards Durch Erzeugen einer Querycollection am Hyperwave Server wird automatisch der Queryform Wizard gestartet Die einzelnen Seiten dieses Wizards sind in 3 Bereiche gegliedert
94. is 90 Prozent aller Designfehler zu erkennen Wie der Designproze selbst beginnen Usability Tests mit dem Definieren der Testpersonen und den Testzielen Bei der Entwicklung eines Tests ist auf die grunds tzliche Problemstellung und nicht auf das Testen von Features zu achten Auch wenn nur sehr spezielle Dinge getestet werden sollen der Endanwender wird diese immer im Zusammenhang mit dem gesamten System nutzen Es ist immer sinnvoll einen Probedurchlauf des Tests mit einer Person aus der Testgruppe durchzuf hren um zu erkennen ob die Szenarios der Prototype und die Aufnahmeger te korrekt arbeiten und sinnvolle Ergebnisse liefern K nnen 4 MENSCH MASCHINE KOMMUNIKATION 68 Bei der Ausf hrung des Tests soll eine angenehme Atmosph re f r die Testperson geschaffen werden ein stiller Raum mit einem entsprechenden Schild vor der T r um St rungen zu vermeiden F r die Testperson soll es bequem freundlich und komfortabel sein Sie mu wissen da nicht sie sondern das Produkt getestet wird W hrend des Testes soll gen gend Zeit vorhanden sein um alle Aufgaben l sen zu k nnen Die Testperson soll in ihrer Arbeit nicht unterbrochen werden wenn Probleme auftreten nur vorsichtig und eher mit allgemeinen Antworten helfen Dem Tester soll die M glichkeit geboten werden jederzeit die auszuf hrenden Aufgaben zu beenden Um die Tests auswerten zu k nnen ist es sehr hilfreich die Person zu bitten w hrend der Arbeit laut zu denken
95. istriert und f r einige zehntel Sekunden gespeichert Diese Ged chtnisform kann als Eingabebuffer f r die direkte Repr sentation von Sensorinformation betrachtet werden Nur ein kleiner Bruchteil der hier gespeicherten Information gelangt zur Weiterverarbeitung in das Kurzzeitged chtnis Die restlichen Daten werden ausgefiltert und wieder vergessen bzw von neu eingelangten Reizen berschrieben e Kurzzeitged chtnis Die Information die das sensorische Ged chtnis an das Kurzzeitged chtnis weiterreicht wird hier verarbeitet und eventuell im Langzeitged chtnis gespeichert Heute wird der Begriff des Kurzzeitged chtnisses durch den des Arbeitsged chtnisses ersetzt da in diesem Bereich jene Daten gespeichert werden mit denen aktiv gearbeitet wird wie z B eine Eingabe verarbeiten eine Auswahl treffen weitere Informationen holen und speichern planen und Ausgabe Sprache Bewegung vorbereiten Die Hauptcharakteristik dieser Ged chtnisform besteht darin da die speicherbare Information in der Menge und in der Zeit begrenzt ist blicherweise liegt die Grenze bei 5 9 gleichzeitig zu merkenden Einzelinformationen e Langzeitgeddchtnis Diese Informationen werden vom Kurzzeitged chtnis zur Verf gung gestellt unter Umst nden werden sie sogar f r den Rest des Lebens verf gbar gehalten und vom Kurzzeitged chtnis auch wieder abgerufen 4 3 2 Kognitive Modelle in der Mensch Maschine Kommunikation Kognitive Prozesse sind Ab
96. kann es einen negativen oder abschreckenden Effekt bewirken Bei der Verwendung von Farben sind einige Punkte zu beachten Aufzeigen von Beziehungen oder Gruppierungen Menschen glauben oft da Objekte mit gleicher Farbe auch eine Beziehung zu einander haben Allerdings glauben sie genausooft da die Farben schwarz und wei zusammengeh ren Setzen von Akzenten in einem uninteressantem Bildschirminhalt Unterst tzung der logischen Organisation eines Layouts Erregung der Aufmerksamkeit des Anwenders z B Fehlermeldungen in roter Farbe bewirken mehr als in grauer Farbe Die Farbkodierung sollte im gesamten System immer konsistent sein Die Verwendung einer Farbe f r eine spezielle Bedeutung z B rot bedeutet Liebe kann bei internationaler Software durchaus zu Problemen f hren die Farbe der Trauer ist in Mitteleuropa schwarz in Japan hingegen wei Das gleiche Problem kann auch schon bei nationaler Software problematische Nebeneffekte haben e f r Personen die sich viel mit Autos besch ftigen bedeutet rot Stop gelb Vorsicht und gr n losfahren e f r einen Wirtschaftsexperten bedeutet rot einen Verlust und schwarz einen Gewinn e f r Chemiker und Installateure ist rot hei und blau kalt 4 MENSCH MASCHINE KOMMUNIKATION 62 e f r Geographen ist blau Wasser gr n Wald bzw Wiese und gelb bedeutet W ste e Farbe hat sehr subjektive Eigenschaften Jeder hat einen anderen Farbgeschmack Wenn jemand vo
97. ke um beim Einf gen von neuen Dokumenten in die Querycollection ber Amadeus die Metainformation eingeben zu k nnen Die Eingabefelder des Formulares passen sich automatisch den Vorgaben durch den Queryform Wizard an Als Programmiersprache wurde ebenfalls Mircosoft Visual C mit der Microsoft Foundation Class 4 0 verwendet 6 8 3 CGI Script f r die Suche Um die Suche am Hyperwave Server durchzuf hren wird ein CGI Script December 95 Maurer 96 Liu 94 verwendet das in Perl Till 95 Schwartz 94 programmiert ist und unter Verwendung des Hyperwave Tools hwinfo die Suchergebnisse an den Benutzer als HTML Seite zur ckliefert 7 REFERENZEN 104 7 REFERENZEN Agosti 96 Apple 87 Bass 91 Berk 91 Chandler 95 Comer 88 Dalitz 95 Dalitz 96 December 95 Dietinger 95 Flohr 95 Flohr 96 Foly 90 Frakes 92 Graham 95 AGOSTI MARISTELLA Information Retrieval and Hypertext Kluwer Academic Publishers 1996 Human Interface Guidelines The Apple Desktop Interface Addison Wesely Publishing Company 1987 BASS LEN COUTAZ JOELLE Developing Software for the User Interface Addison Wesely Publishing Company 1991 BERK EMILY DEVLIN JOSEPH Hypertext Hypermedia Handbook McGraw Hill Verlag 1991 CHANDLER DAVID M Running a Perfect Corporation 1995 Web Site Que COMER DOUGLAS Internetworking with TCP IP Prentice Hall 1988 DALITZ WOLFGANG HEYER GERNOT Hype
98. keinen Wert als Deskriptor hat zu einem wichtigen Deskriptor erg nzt werden Der Effekt dieser Vorgehensweise ist da ein zu allgemeiner Deskriptor durch einen spezielleren ersetzt wird Die Auswahl der Dokumente wird dadurch pr ziser die Ausbeute sinkt aber gleichzeitig Gewichtete Auswahl Bei der gewichteten Auswahl wird versucht den einzelnen Deskriptor im Kontext seiner Umgebung zu betrachten Als Umgebung wird entweder das Dokument die Abfrage oder die gesamte Datenbank gesehen Diese Gewichtung der Deskriptoren setzt soweit sie bei der Datenaufnahme oder beim Laden der Daten in die Datenbank vorgenommen wird ein geeignetes Verfahren zur Selektion der m glichen Deskriptoren aus den Texten voraus Nach dieser Erstauswahl kann anhand einer Gewichtung eine definitive Auswahl und Speicherung vorgenommen werden Die Gewichtung bei der Abfrage setzt ebenfalls ein geeignetes Verfahren zur Deskriptorenauswahl voraus dieses hat aber keinen Einflu auf die gespeicherten Deskriptoren 5 6 3 Probleme bei der Deskriptorenauswahl Einige der Probleme die in einem IRS auftreten k nnten Lancaster 78 Die Dokumente sind in mehreren verschiedenen Sprachen gespeichert aber pro Dokument nur in einer Sprache Das bedeutet Dokumente werden abh ngig von der Sprache in der die Abfrage formuliert wurde gefunden Eine m gliche Abhilfe w re die automatische bersetzung der Abfrage in mehrere Sprachen Das gesamte IRS besteht aus mehreren einzel
99. ken einer Datei bauen ebenfalls auf dem Prinzip Lernen durch Analogie auf Immer wenn Menschen etwas Neues lernen machen sie auch Fehler Meistens ist das nicht problematisch es liefert nur ein Feedback da etwas falsch gemacht wurde Aber bei Computersystemen f rchten Menschen sich davor Fehler zu machen Einerseits weil sie glauben zu dumm f r den Computer zu sein und andererseits haben sie Angst etwas zu zerst ren Daten oder das Ger t selbst Aufgrund dieser Bef rchtungen sind Menschen stark gehemmt mit einem Computer herumzuprobieren und zu schauen was geschieht wenn sie einen Befehl ausf hren Diese Hemmschwelle bewirkt aber das sie nur sehr schwer den Umgang mit diesen Ger ten erlernen Fehler die Benutzer ausl sen werden grob in zwei Punkte unterteilt e Entscheidungsfehler entstehen durch eine falsche Entscheidung in der Nutzung des Programmes z B ein Benutzer verschiebt das Icon f r eine Festplatte auf den Papierkorb und glaubt damit den Inhalt der Festplatte zu l schen In Wirklichkeit mu er f r diese Operation aber einen bestimmten Menupunkt ausw hlen Damit der Benutzer diese Art von Fehlern beheben kann mu er meist zus tzliche Informationen aus einer Online Hilfe einem Handbuch oder einem Kollegen einholen Die Behebung dieser Fehler nimmt sehr viel Zeit ein e Unachtsamkeitsfehler entstehen dadurch da der Benutzer nicht gen gend konzentriert bei der Arbeit ist Als Beispiele lassen sich daf r Tipp
100. l ufe im menschlichen Gehirn bei denen wir lernen Dinge zu verstehen bzw ganz allgemein wie wir Wissen erwerben Preece94 Das Modell der menschlichen Informationsverarbeitung war die Basis f r die ersten Versuche in der Verbesserung der Mensch Maschine Kommunikation F r eine gegebene Aufgabe war man der Meinung der Informationsaufnahmeproze l uft in genau definierten Schritten ab Daraus wurde das Modell des menschlichen Prozessors entwickelt Diese ersten kognitiven Modelle schufen eine theoretische Basis um Vorhersagen ber die Lerngeschwindigkeit beim Menschen zu treffen Sie tendierten zu einer zu starken Vereinfachung des menschlichen Verhaltens und werden heute durch verbesserte Modelle die paralleles Denken beinhalten ersetzt Preece94 4 3 3 Wahrnehmung und Repr sentation von Objekten Das visuelle System des Menschen ist in der Lage Objekte bei extrem hellem Licht in sehr dunklen R umen und sich schnell bewegende Gegenst nde zu erkennen Aber trotzdem reagiert es nicht auf eine abgefeuerte Gewehrkugel oder infrarotes Licht Dies bedeutet da wir einerseits einen sehr gro en Bereich an angebotener Information 4 MENSCH MASCHINE KOMMUNIKATION 43 wahrnehmen k nnen aber ein weitaus gr erer Teil an m glicher Information bleibt ohne technische Hilfsmittel Zeitlupe Infrarotkamera f r uns verborgen Im Laufe der Zeit haben sich zwei Theorien entwickelt die versuchen die menschliche Wahrnehmung zu beschrei
101. m Computer aus auf ein unter Umst nden geographisch weit entferntes Computersystem zuzugreifen Es besteht dann die M glichkeit auf diesem Computersystem genauso zu arbeiten als ob man dort physikalisch anwesend w re 2 4 4 Usenet News Eine Art elektronisches Schwarzes Brett oder elektronisches Diskussionsforum Jeder Benutzer kann beliebige Beitr ge schreiben diese werden automatisch ber das Internet verbreitet und jede weitere Person die mit news arbeitet kann dann diesen Artikel lesen Aufgrund der sehr hohen Anzahl der Benutzer sind die Artikel in verschiedenste Diskussionsforen aufgeteilt 2 4 5 World Wide Web WWW 2 4 5 1 Geschichtliche Entwicklung 1989 begannen berlegungen von Tim Berners Lee und Robert Cailliau ber die Verwendung eines Hypertextsystemes f r die Vereinfachung von internationaler Zusammenarbeit Sie bauten auf einer Idee von Ted Nelson aus dem Jahre 1965 auf Das Problem das sie l sen wollten war folgendes Forscher im Bereich Hochenergiephysik bei CERN wollten Informationen untereinander austauschen Alle bisherigen Versuche sind aber fehlgeschlagen da es sehr viele verschiedene Netzwerke und auch verschiedenste bertragungsprotokolle gab Ein weiteres Problem waren die unterschiedlichen Computertypen die die Forscher benutzen Der erste technische Durchbruch gelang Nicola Pellow einem Studenten bei CERN Er entwickelte einen zeichenorientierten Browser im Jahr 1991 Ein Jahr sp ter war auch die
102. n einer Farbe begeistert ist findet sich sicher bald jemand anders der diese Farbe als absto end empfindet e Ein Teil der Endanwender arbeitet nur mit monochromen Bildschirmen und hat dadurch Schwierigkeiten Information die nur durch unterschiedliche Farben dargestellt wird zu erkennen Das gleiche gilt f r all jene die farbenblind sind Forschungen haben ergeben da ca 9 Prozent aller Menschen Probleme beim Erkennen von Farben haben e Farbe kann daher nur als zus tzliche sekund re M glichkeit der Information verwendet werden Es wird empfohlen ein Design zuerst in schwarz und wei zu gestalten und dann erst Farbe als zus tzliche Informationsquelle zu benutzen e Die Verwendung von Farben bei einer Status nderung kann vorteilhaft sein z B ein Wert gelangt in einen kritischen Bereich und wird dann rot dargestellt e Ausdrucken von Farbdarstellungen auf Papier kann problematisch sein bzw k nnen die Farben am Papier sich von denen am Bildschirm unterscheiden e Verwendung einer limitierten Anzahl von Farben gleichzeitig Obwohl das menschliche Auge Millionen von Farben unterscheiden kann k nnen zuviele Farben in einem Layout den Benutzer verwirren und ihn berfordern die eigentliche Information zu erkennen e Ged mpfte komplement re Farben sind meist besser als kr ftige helle Farben e Die Hintergrundfarbe sollte sehr neutral sein am besten ein helles grau Komplement re Farben als Vorder und Hintergrund zu ve
103. n im Text bereinstimmen Der SF Algorithmus zeigt im schlechtesten Fall worst case ein Verhalten von O L nge der gesuchten Zeichenkette L nge des gesamten Textes wenn zwei Bedingungen eintreffen l Wenn die gesuchte Zeichenkette irgendwo im Text und nicht nur am Anfang gesucht werden mu 2 Wenn der Vergleich immer erst beim letzten zu vergleichenden Zeichen abgebrochen werden kann Bsp suche die Zeichenkette aa ab im Text aaaaaaa aaaaaaaaa Da diese zweite Bedingung selten erf llt ist wird der Algorithmus in der Regel ein g nstigeres Verhalten zeigen Wenn auch die erste Bedingung nicht erf llt ist kann die Suche in der Regel schon nach wenigen Zeichen abgebrochen werden 5 10 2 KMP Algorithmus Dieser Algorithmus geht auf Knuth Morris und Pratt zur ck Er setzt sich das Ziel mehrfache Vergleiche gleicher Positionen zu vermeiden und die gesuchte Zeichenkette nach jedem mi lungenen Versuch um mehr als nur eine Position im zu durchsuchenden Text weiterzur cken In einer Tabelle wird f r jede Position der gesuchten Zeichenkette festgehalten auf welche Position sie bei einer Nicht bereinstimmung verschoben werden darf Im schlechtesten Fall zeigt dieser Algorithmus ein Verhalten von O L nge der gesuchten Zeichenkette L nge des gesamten Textes was bedeutend besser ist als der vorherige SF Algorithmus 87 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL 5 10 3 BM Algorithmus oder Algo
104. nd um sie vom eigentlichen Text zu unterscheiden in spitze Klammern eingeschlossen Ein Beispiel f r ein einfaches HTML Dokument lt HTML gt lt HEAD gt lt TITLE gt Dies ist der Titel lt TITLE gt lt HEAD gt lt BODY gt lt Hl gt berschrift lt Hl gt Hier befindet sich der eigentliche Textk rper lt BODY gt lt HTML gt 2 4 5 4 Hypertext Transfer Protocol HTTP Der Sinn dieses Protokolles ist es einen schnellen und flexiblen Mechanismus zur Verf gung zu stellen um Referenzen zwischen Informationseinheiten zu verfolgen Es dient nicht nur der bertragung von Hypertexten sondern auch jeder Art von Information die bei der Verfolgung von Links ben tigt wird Das Protokoll ist stateless und objektorientiert Das bedeutet zwischen einem Client und einem Server wird keine Verbindung aufrechterhalten Dies hat den Nachteil da bei Anfrage an den Server eine neue Verbindung aufgebaut werden mu 2 4 5 5 Common Gateway Interface CGI CGI ist ein Standard f r das Interface zwischen externen Applikationen und einem Server Ein HTML Dokument welches vom Server an den Client geschickt wird ist statisch Das bedeutet der Inhalt dieses Dokumentes ist immer gleich Ein CGI Programm wird aber in Echtzeit ausgef hrt so da sein Output als dynamisches HTML Dokument vom Server an den Client bertragen werden kann Die Programmiersprache eines CGI Programmes h ngt nur davon
105. nd Suchergebnisse Durch Betreten einer Querycollection wird automatisch das f r diese Collection entsprechende Suchformular angezeigt Durch Ausf llen dieses Suchformulares und Abschicken an den Hyperwave Server wird ein CGl Script aufgerufen welches das Suchformular auswertet Die Eingaben in das Formular werden zu einem Query String zusammengesetzt und dem Hyperwave Tool Hwinfo bergeben Die Suchergebnisse von Hwinfo werden aufbereitet und als HTML Dokument an den Client geschickt S Kundenkartei Microsoft Internet Explorer OO x File Edit View Go Favorites Help ec gt A fl N Gr Back Forward Stop Refresh Home Search Favorites Print Font Mail Address F wICHTIG_CHRISTIAN_WICHTIG Query htm v fl Links Kundenkartei Kunden der Firma Firmenname Stra e Ort DO Telefon i T tigkeitsfeld Produktion erster Kontakt i 3 fac EJ 1996 not 96 Anmerkungen H Bild 10 6 QUERYCOLLECTION F R HYPERWAVE 103 6 8 Programmierung 6 8 1 Queryform Wizard Der Queryform Wizard wurde speziell f r den Hyperwave Client Amadeus entwickelt Als Programmiersprache wurde C Lippman 91 Stroustrup 91 und als Entwicklungsumgebung Mircosoft Visual C Kruglinski 93 mit der Microsoft Foundation Class 4 0 verwendet Der HTML Viewer im Wizard ist eine vereinfache Version des HTML Viewers von Amadeus 6 8 2 Enter Modify Keywords in Amadeus Eine einfache Eingabemas
106. nd heute schon sehr ausgereift Existierende Systeme sind in der Lage eine begrenzte Anzahl von Karteikarten mit einer begrenzten Anzahl von Merkmalen zu bearbeiten Totz alledem haben manuelle Systeme einige Schw chen die durch computerunterst tzte Informationssysteme beseitigt werden k nnen Rowley 87 e Die auf einer Karteikarte speicherbare Informationsmenge ist immer begrenzt e Die Anzahl der mit vertretbarem Aufwand zu verwaltenden Karteikarten ist limitiert e Die Merkmale mit denen nach einzelnen Karteikarten gesucht werden kann m ssen im Voraus bestimmt werden und sind auch in ihrer Anzahl begrenzt e Die M glichkeit einzelne Suchmerkmale logisch miteinander zu verkn pfen ist entweder gar nicht oder nur beschr nkt vorhanden Aber manuell verwaltete Karteikarten haben auch zwei Vorteile deren Eigenschaften nicht einfach auf computerunterst tzten Systemen implementiert werden k nnen Rowley 87 e Die Karteikarten erfordern keine bestimmte Form der Eintragungen es kann sich z B ohne Probleme jederzeit neben oder inmitten eines Textes eine Skizze befinden e Das Erstellen oder Ausf llen von Karteikarten kann auch durch einen Laien erfolgen 5 3 Begriffsdefinitionen Um sich von der Vorstellung einer physikalischen Karteikarte als Datentr ger zu l sen kann man den Begriff der Informationseinheit definieren Mresse 84 Eine Informationseinheit umfa t einen Text und seine dazugeh rigen Deskriptoren Ein Text i
107. nen Datenbanken die unterschiedliche Abfragemethoden bereitstellen Eine L sung f r dieses Problem w re eine automatische Konvertierung der Abfrage in die jeweils notwendige Syntax Der Benutzer wird mit zu vielen Dokumenten als Ergebnis einer Abfrage berh uft Er mu sich sehr viele Dokumente betrachten bevor er das f r ihn relevante Dokument findet Dies entsteht entweder durch eine zu vage formulierte Abfrage oder durch eine zu gro e Datenbank ber ein Themengebiet wodurch gleiche Deskriptoren in zu vielen Dokumenten auftreten und dadurch eine einfache Unterscheidung bzw Selektion verhindern 5 6 4 Speicherung der Deskriptoren Methode des inverted index In der Geschichte der Erforschung von IRS wurde immer viel Aufwand get tigt um die Qualit t der zur ckgelieferten Dokumente zu verbessern Agosti 96 Der Aufwand um 78 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL die Suche effektiv auszuf hren wurde f r lange Zeit vernachl ssigt Die Zeit um eine sequentielle Suche durch alle Dokumente nach einem bestimmten Wort durchzuf hren ist viel zu gro um in Echtzeit mit diesem System arbeiten zu k nnen Um dieses Problem zu umgehen wurde die Methode des inverted index entwickelt Es wird jeder Deskriptor mit Verweis auf alle Dokumente in denen sich dieser Deskriptor befindet gespeichert Bei jedem Laden eines Dokumentes oder bei jeder nderung wird der Inhalt dieses inverted index aktualisiert Dies hat den
108. ng benutzen Graphische Benutzerinterfaces die meist optisch sehr gut strukturiert sind lenken die Aufmerksamkeit des Benutzers auf das Interface Dadurch kann er sich besser der L sung seiner Aufgabe widmen da Ablenkungen wie z B die Suche in Handb chern nach einem bestimmten Befehl sehr stark reduziert werden Neuere Betriebssysteme erlauben das Multitasking Das bedeutet ein Benutzer kann mehrere Aufgaben gleichzeitig von einem Computer bearbeiten lassen Dies zielt in den Bereich der geteilten Aufmerksamkeit In der Praxis entstehen aber oft Probleme Es wird an einer Aufgabe A gearbeitet nach einer gewissen Zeit wird zu der zweiten Aufgabe B bergegangen und wenn dann wieder zur ersten Aufgabe A gewechselt 4 MENSCH MASCHINE KOMMUNIKATION 44 wird hat der Benutzer schon meistens vergessen woran er gearbeitet hat wieviel er schon erledigt hat und wieviel er noch erledigen mu Im t glichen Leben wird diesem Problem mit kognitiven Hilfen Notizzettel Post it der sogenannte Knoten im Taschentuch begegnet Bei der Arbeit am Bildschirm sind diese M glichkeiten allerdings nicht sinnvoll und daher m ssen neue Methoden entwickelt werden Eine m gliche L sung w re eine Art Statusfenster f r jede Aufgabe das genaue Informationen dar ber enth lt welche Arbeiten schon ausgef hrt wurden und welche Arbeiten noch zu erledigen sind sozusagen ein virtueller Notizzettel der automatisch vom Computer erstellt wird
109. niert wird und einem Destination Anchor der als Ziel ein anderes Dokument oder einen bestimmten Teil eines Dokumentes hat 3 2 5 Suchm glichkeiten in Hyperwave In Hyperwave kann die Suche in zwei Arten unterteilt werden Suchbereiche Dienen zur Einschr nkung des Bereiches in dem gesucht werden soll In Hyperwave existieren die folgenden M glichkeiten die Suche auf einen bestimmten Bereich einzuschr nken e Activated Collections Die Suche erfolgt nur in jenen Collections die vom Benutzer f r die Suche ausgew hlt worden sind e Whole home Database Die Suche erfolgt am gesamten lokalen Server 3 HYPER G HYPERWAVE 32 Sucharten Objekttitel Es wird nach regul ren Ausdr cken im Titel eines Objektes gesucht Objekteigenschaften Spezielle Objekteigenschaften die bei einer Suchabfrage festgelegt werden k nnen sind z B der Autor das Erzeugungsdatum oder Schl sselw rter Volltextsuche Alle Textdokumente werden bei der Aufnahme in den Hyperwave Server indiziert Bei der Volltextsuche wird nach den Suchbegriffen innerhalb der Textdokumente gesucht 3 2 6 Benutzerverwaltung und Zugriffsrechte Damit unter Hyperwave gro e Datenmengen von vielen Personen gleichzeitig gewartet werden k nnen m ssen die Benutzer effizient verwaltet werden Jedes Dokument kann durch das Rechtefeld in den Attributen so definiert werden da eine bestimmte Benutzergruppe oder auch einzelne Benutzer bei diesem Dokument Schreib
110. noch nach einem feindlichen Atomschlag funktionieren sollte d h es sollte ein dezentrales Kommunikationssystem entwickelt werden da auch unter schlechten Bedingungen arbeiten kann Kyas 94 Als Reaktion auf den Start des Sputnik Satelliten der Sowjetunion 1957 wurden von der US Regierung verschiedenste Forschungsprogramme gestartet mit dem Ziel die milit rische Technologie der USA in eine weltweit f hrende Position zu bringen Unter anderem wurde die Advanced Reseach Projects Agency ARPA gegr ndet Eine der wesentlichen Ziele der ARPA war es Methoden zur zuverl ssigen Daten bertragung ber weite Strecken zu entwickeln Die bisher angewandten Techniken beruhten auf der leitungsorientierten Daten bertragung Circuit Switch und waren f r milit rische Anwendungen nicht zuverl ssig genug Bei der leitungsorientierten bertragung ist der Aufbau einer physikalischen Verbindung zwischen Sender und Empf nger notwendig bevor die Daten berhaupt bertragen werden k nnen Wird diese Leitung aufgrund u erer Einfl sse unterbrochen wird damit auch die Daten bertragung gest rt Ein Beispiel f r leitungsorientierte bertragung ist das analoge Telefonnetz Zwischen den beiden Teilnehmern wird immer eine physikalische Verbindung aufgebaut Aufgrund dieser Nachteile wurde von der ARPA auf die von Paul Barans bei RAND entwickelte paketorientierte Daten bertragung zur ckgegriffen Diese bertragungsmethode ist wesentlich weniger st r
111. ntes zur Verf gung gestellt wird 2 INTERNET 25 1983 wurde Intermedia entwicket Es war ein auf Hypertext basierendes Informationssystem welches Links in jedem Dokumenttyp erlaubte auch in Bildern Filmen oder Audiodokumenten Bild 2 Linearer Text Bild 3 Hypertext Ein linearer Text z B ein Buch wird sequentiell gelesen Ein Hypertext besteht aus vielen kleinen Informationseinheiten die durch Links miteinander verbunden sind Es ist kein Pfad vorgegeben in welcher Reihenfolge die Informationen betrachtet werden m ssen Der Anwender kann sich jene Informationen heraussuchen die ihn interessieren die restlichen Informationen zieht er in seine Betrachtung nicht ein Berk 91 HTML ist das wichtigste Dokumentformat im WWW Es ist eine Anwendung von SGML Structured Generalized Markup Language Das HTML Dokument wird in verschiedene Teile zerlegt einen Kopf Paragraphen Fu noten usw Es ist das Ziel einer Markup Language die logische Struktur eines Dokumentes zu beschreiben und nicht das aktuelle Layout an einem bestimmen Bildschirm Mit dieser Eigenschaft ist es auch m glich HTML Dokumente auf den verschiedensten Computersystemen darzustellen Ein HTML Dokument besteht aus dem eigentlichen Text und einer speziellen Zusatzinformation Markup der die logische Struktur des Textes beschreibt Alle 2 INTERNET 26 Textstellen sind von Markups eingeschlossen die den Typ der Textstelle beschreiben Die Markups selbst si
112. nvertiert die internen Datenformate von Computersystemen in die Standarddarstellung der Kommunikationsbeziehung bzw des Netzwerkes Diese Schicht erspart dem Anwender die manuellen Einstellungen und Anpassungen des eigenen Systems an die Netzwerkstandardeinstellungen OSI Schicht 7 Anwendungsschicht Application Layer Die Anwendungsschicht beinhaltet die Dienstprogramme f r die verschiedenen Funktionen die ber die Kommunikationsbeziehung bzw das Netzwerk realisiert werden sollen In diesen Bereich fallen z B Terminalprogramme email oder ftp 2 INTERNET 17 2 3 2 TCP IP terner FTP SMTP DNS NTP NFS TCP UDP IP Ethernet ISO 8802 2 X 25 SLIP PPP 1SO7776 CSMA CD Token Ring HDLC seriell Tabelle 1 Die Familie der TCP IP Protokolle 2 3 2 1 Internet Protocol IP Das Internet Protokoll ist das Basis Kommunikationsprotokoll im Internet Comer 88 Die Daten werden paketorientiert bertragen Damit legt IP das Paketformat aller Daten bertragungen im Internet fest Die Pakete werden verbindungslos bertragen d h da jedes Paket f r sich betrachtet wird und die bertragung unabh ngig von vorhergehenden oder nachfolgenden Paketen erfolgt Allerdings ist kein Mechanismus vorgesehen um verlorengegangene oder zerst rte Pakete erneut zu bertragen Die maximale L nge von IP Paketen ist auf 65 535 Bytes beschr nkt Je nachdem ber welche Netzwerke ein IP Paket bertragen wird kann die Notwen
113. omputern Nachdem die Aufgaben die ein System zu erf llen hat festgelegt wurden mu sich der oder die Designer des Benutzerinterfaces berlegen welche Interaktionsstile dem Anwender angeboten werden sollen Shneider92 Preece94 Foley90 4 MENSCH MASCHINE KOMMUNIKATION 57 Menuauswahl In Menuauswahlsystemen werden dem Anwender eine Reihe von M glichkeiten angeboten und er kann sich das Passende ausw hlen Wenn die Terminologie und die Bedeutung der einzelnen Menupunkte verst ndlich und leicht voneinander unterscheidbar ist ist die Einlernzeit f r den Benutzer sehr gering Der gro e Vorteil diesese Stiles liegt in der klaren Struktur des Entscheidens da immer nur wenige M glichkeiten angeboten werden Er bietet auch die M glichkeit eine Online Hilfe und Fehlermeldungen einfach zu integrieren Designer von Menusystemen m ssen sehr sorgf ltig die anfallenden Aufgaben absch tzen damit f r alle Funktionen entsprechende Menupunkte existieren Die Nachteile der Menuauswahl liegen in der Gefahr von zu vielen Menus Einbremsung von schnell arbeitenden Experten und da die Darstellung des Menus am Bildschrim sehr viel Platz erfordert Dieser Stil ist sehr gut f r Anf nger und Fortgeschrittene geeignet aber f r Experten kann er durchaus zu langsam sein Abhilfe dagegen schaffen sogenannte Shortcuts die die M glichkeit bieten durch Tastenkombinationen direkt einzelne Menupunkte aufzurufen Formular Wenn die Eingabe eine
114. putern 56 4 4 5 Regeln f r das Design von Benutzerinterfaces 60 4 5 Designmethodik 66 4 5 1 Ein effektives benutzerbezogenes Design beinhaltet mehrere einzelne Phasen den sogenannten Designzyklus 66 4 5 2 M glichkeiten zum Testen der Verwendbarkeit eines Produktes usability testing 67 5 Suchen nach Information Information Retrieval 69 5 1 Was ist Information Retrieval IR 69 5 2 Grundidee 69 5 3 Begriffsdefinitionen 70 5 4 Klassifizierung von Information Retrieval Systemen 72 1 EINF HRUNG 7 5 5 Beurteilung der G te eines IRS 74 5 5 1 Ma zahlen 74 5 5 2 Berechnung der Ma zahlen 75 5 6 Deskriptorenauswahl 77 5 6 1 Manuelle Auswahl 77 5 6 2 Automatische Auswahl 77 5 6 3 Probleme bei der Deskriptorenauswahl 78 5 6 4 Speicherung der Deskriptoren Methode des inverted index 78 5 6 5 Ma zahlen zur Gewichtung von Deskriptoren 79 5 6 6 Zusammenfassung 81 5 7 Auswahl mit R ckkopplung relevance feedback 82 5 7 1 Gewichtung der selektierten Dokumente 82 5 8 Verwendungsarten von Thesauri 83 5 8 1 vordefinierte Listen 83 5 8 2 Synonymw rterbuch 83 5 9 Erkennung physisch hnlicher Zeichenketten 84 5 9 1 Unterschiedliche Eingaben aufgrund sprachlicher Gegebenheiten 85 5 10 Vergleich von Zeichenketten 87 5 10 1 Straight Forward SF Algorithmus 87 5 10 2 KMP Algorithmus 87 5 10 3 BM Algorithmus oder Algorithmus von Boyer und Moore 88 5 1
115. r gro en Anzahl von Daten erforderlich ist Kann dem Benutzer eine Anzahl von Feldern angeboten werden in die er relativ einfach seine Werte eintippen kann Er hat auch die M glichkeit mit der Maus oder mit den Cursortasten von einem Eingabefeld zum n chsten zu springen Es wird also ein gedrucktes Formular auf Papier am Bildschirm nachgebildet Die Vorteile liegen in der Vereinfachung der Dateneingabe und einer geringen Einschulungszeit Die Nachteile sind da der Anwender wissen mu wo er welche Daten eingeben kann in der Gr e des Formulares welches meist den ganzen Bildschirm bedeckt und darin da der eintippenden Person die Initiative entzogen wurde Dieser Stil ist gut f r Benutzer geeignet die oft viele Daten eingeben m ssen Kommandosprache Die einzelnen Befehle werden direkt eingetippt und auch sofort vom System ausgef hrt Vorteile sehr flexibel schnell zu bedienen berl t dem Benutzer die Initiative mehrere Kommandos k nnen mit Macros zu einem neuen zusammengefa t werden Nachteile Online Hilfe und Fehlerbehandlung schwer zu implementieren gro e Einlernzeit Kommandos sind meist so komplex da sie bald wieder vergessen werden Dieser Interaktionsstil ist sehr gut f r Experten geeignet da sie damit schnell arbeiten k nnen und auch ber das entspechene Wissen ber die einzelnen Kommandos verf gen nat rliche Sprache In einfachen S tzen wird beschrieben welche Aktionen der Computer ausf hren soll
116. r users of your querycollection You can define the type of your query elements on the following pages Names of your query elements each name in one line Firmenname Anmerkungen Bild 3 6 QUERYCOLLECTION F R HYPERWAVE 96 6 5 3 4 Arten von Eingabefeldern Auf den weiteren Seiten k nnen die einzelnen Eingabefelder genauer festgelegt werden Es kann zwischen 3 verschiedenen Eingabem glichkeiten unterschieden werden Selbstverst ndlich kann diese Auswahl nachtr glich wieder ver ndert werden Textfeld Text field Es kann die Gr e des Textfeldes in Zeichen pro Zeile und Zeichen pro Spalte eingestellt werden Wenn die Zeilengr e auf 1 ist dann erh lt man ein einzeiliges Eingabefeld wenn sie gr er als 1 ist ein zweidimensionales Eingabefeld hnlich einem einfachen Editor Auch hier besteht die M glichkeit den Namen des Eingabeelementes nachtr glich zu modifizieren Bei der Angabe der Breite des Textfeldes ist darauf zu achten da die Anzahl der Zeichen pro Zeile die Zahl 80 nicht berschreiten soll da bei einer geringen Aufl sung des Bildschirmes nicht mehr das ganze Textfeld sichtbar w re Queryform Wizard Query element Firmenname Which type of edit field would you like Text field Option field Date field Which size do you want for your text field Characters g per line r Lines f 3 Bild 4 6 QUERYCOLLECTION F R HYPERWAVE 97 Auswahlfeld
117. rithmus von Boyer und Moore Im Unterschied zum KMP Algorithmus beginnt die Suche im BM Algorithmus jeweils beim letzten Zeichen der zu suchenden Zeichenkette die Suche geht immer r ckw rts Zur Positions und Sprungkontrolle werden mehrere Tabellen verwendet Dieser Algorithmus ben tigt weniger als O L nge der gesuchten Zeichenkette L nge des gesamten Textes Vergleiche 5 10 4 AC Algorithmus Der Algorithmus von Aho und Corasick beruht auf hnlichen berlegungen wie sie im KMP Algorithmus angestellt wurden Jedes Zeichen eines Textes soll nur einmal verglichen werden Im Fall des Nicht bereinstimmens wird eine Sprungtabelle failure function konsultiert aus welcher die weitere Vorgangsweise ersichtlich ist Zus tzlich verfolgt der AC Algorithmus das Ziel mehrere Zeichenketten gleichzeitig in einem Text zu suchen Zu diesem Zweck wird eine zweite Sprungtabelle aufgebaut goto function in welcher die Zusammenh nge zwischen den gesuchten Teilzeichenketten festgehalten werden Eine dritte Tabelle output function enth lt alle gesuchten Teilzeichenketten Die Anwendung dieses Verfahrens lohnt sich nur wenn die gesuchten Teilzeichenketten gemeinsame Unterzeichenketten beinhalten 5 11 abschlie ende Bemerkungen Eines der ungew hnlichsten Dinge im Forschungsbereich des Information Retrievals ist es da der Technologietransfer von der Forschung zu einem fertigen Endprodukt sehr langsam ist Agosti 96 Sehr viel langsamer als
118. rkreis sind Programme die eine direkte Manipulation der Daten erlauben am besten geeignet 4 4 3 Beachtung der Verschiedenheit der Benutzer Bei der Entwicklung benutzerfreundlicher Systeme ist sehr starkt darauf zu achten da geistige und k rperliche Unterschiede der zuk nftigen Anwender nicht untersch tzt werden Shneider92 Es gibt mehrere M glichkeiten Benutzer in verschiedene Gruppen aufzuteilen und dann zu analysieren ob das Benutzerinterface all diesen Gruppen gen gt Nach Carl Jung exisitiert eine Theorie die die Menschen in 4 zueinander entgegengesetzte Typen unterscheidet e extrovertiert introvertiert Extrovertierte lenken ihre Aufmerksamkeit auf u ere Reize und brauchen die Interaktion mit ihrer Umwelt Introvertierte dagegen bevorzugen Strukturen an die sie gew hnt sind beziehen sich auf ihre eigenen Ideen und arbeiten allein und inhaltsbezogen e gefiihisbezogen intuitiv Gef hlsbezogene Typen werden von feststehenden Routinen angesprochen sind gut auf dem Gebiet der Pr zisionsarbeit und wenden gerne bekannte oder erlernte F higkeiten an Intuitive Menschen l sen gerne neue Probleme und erforschen neue Zusammenh nge aber wollen sich keine Zeit f r Genauigkeit nehmen e einf hlsam bewertend Einf hlsame Personen lernen gerne ber neue Situationen aber haben Probleme Entscheidungen zu treffen Bewertende arbeiten nach einem genauen Plan und versuchen den Plan auch einzuhalten wenn neue Fakten das Z
119. rm Textcolor Change color Backgroundcolor Change color Which alignmenttype for your text do you want Left Center Right Which fontstyle for your text do you want Normal Bold Kursiv Bold and Kursiv Bild 7 6 QUERYCOLLECTION F R HYPERWAVE 100 6 5 3 6 M glichkeit zur Speicherung des erstellten Formulares f r eine sp tere Weiterbearbeitung Auf der letzten Seite des Queryform Wizard besteht noch die M glichkeit das soeben erzeugte Formular lokal auf dem Computer zu speichern um es sp ter weiterbearbeiten zu k nnen Durch Dr cken des Navigationselementes Save queryform erscheint eine Standard Dialogbox die nach dem Dateinamen fragt unter dem das Layout des erstellten Formulares gespeichert werden soll Queryform Wizard 6 QUERYCOLLECTION F R HYPERWAVE 101 6 6 Eingabe der Metainformation in Amadeus Um die jeweilige Metainformation eines neuen Dokumentes einzugeben oder diese Metainformation mit Amadeus zu modifizieren erscheint ein Eingabeformular mit dem diese Informationen editiert werden k nnen Das Aussehen dieses Eingabeformulares richtet sich nach den Angaben bei der Erstellung des Formulares im Queryform Wizard Enter Modify Keywords PO Zuname des Autors Po Vornamen des Autors PO ISBN Nummer Po Kategorie Roman Sachbuch Verlagsname Bild 9 6 QUERYCOLLECTION F R HYPERWAVE 102 6 7 Suche u
120. rm Wizard Which title would you like for your queryform K un den k a rt Kundenkartei E dan dar Please type in a short description which introduces the user to your queryform this text will be displayed below the title in your queryform Kunden der Firma 6 QUERYCOLLECTION F R HYPERWAVE 95 6 5 3 3 Bezeichnung der Metainformation Auf der n chsten Seite besteht die M glichkeit die einzelnen Metainformationen genauer zu spezifizieren F r jedes gew nschte Eingabefeld mu ein Name vergeben werden Die L nge und das Aussehen dieses Namens ist beliebig Als einzige Einschr nkung gilt da f r jeden Namen eine eigene Zeile verwendet werden mu Hinweis Es werden hier nur die Namen und die Reihenfolge der Eingabefelder festgelegt die Art jedes einzelnen Eingabefeldes wird erst auf den weitern Bildschirmseiten bestimmt Defaultm ig sind alle Eingabefelder auf eine einzeilige Texteingabe voreingestellt Es besteht jederzeit die M glichkeit nachtr glich Eingabefelder umzubenennen in ihrer Position zu verschieben zu l schen oder zus tzliche Eingabefelder zu definieren Auch wenn man schon alle Eingabefelder genau definiert hat besteht immer die M glichkeit durch Dr cken des Navigationselementes Back auf diese Seite zu gelangen und die Eingabefelder erneut zu bearbeiten Queryform Wizard Which names for your query elements do you want A query element is an input field fo
121. roblem sehr elegant l st und wo auch fast nie Schwierigkeiten auftreten Bei Zeichenprogrammen kann man mit der Maus z B einen Pinsel oder eine Spraydose ausw hlen und mit dieser dann am Bildschirm zeichnen Es besteht aber auch die 4 MENSCH MASCHINE KOMMUNIKATION 53 M glichkeit einen Radiergummi zu selektieren um bestimme Bereiche des Bildes zu l schen Das bedeutet da der Mauszeiger die unterschiedlichsten Moden zeichnen sprayen l schen annehmen kann und trotzdem sind die Benutzer berhaupt nicht verwirrt Da der Mauszeiger in jedem Modus eine genau definierte Form annimmt Pinsel zum Malen Spraydose zum sprayen Radiergumme zum l schen stellen die Menschen eine Analogie zur wirklichen Welt her Der Mauszeiger ist ihre verl ngerte Hand und diese h lt z B einen Pinsel e Ereignisschleife event loop Anwendungen erlauben dem Benutzer alles zu jedem beliebigen Zeitpunkt durchzuf hren Jedes Programm befindet sich in einer Warteschleife und der Benutzer ist jederzeit in der Lage jeden beliebigen Befehl auszuf hren Obwohl diese absolute Freiheit sehr angenehm ist hat sie doch auch einen Nachteil Ein Anf nger wei nicht in welcher Reihenfolge er die Menupunkte aufrufen soll um sein Problem zu l sen Deswegen wurden Assistenten agents wizards entwickelt die es dem Anf nger erlauben auch komplexe Probleme leicht zu l sen Die Aufgabe des Assistenten ist es ihn nach seinen W nschen zu fragen und dann darau
122. roschreibtisch Unzul nglichkeiten hat Trotzdem wurde sie von vielen Menschen akzeptiert und hat auch die Einlernzeit und die Fehler bei der Nutzung von Computern stark reduziert Vergleich von physikalischen Aktionen mit Mausaktionen bei der Schreibtischmetapher Mausaktion physikalische Aktion zeigen point mit dem Finger auf etwas zeigen anklicken click mit der Hand das gew nschte Objekt ber hren ausw hlen select das Objekt in die Hand nehmen verschieben drag and drop in die Hand nehmen halten woandershin tragen und fallenlassen 4 3 7 Lernen in Zusammenh ngen Wenn Menschen zum ersten Mal vor einem Computer sitzen ist ihre Reaktion meistens Angst und Verunsicherung Preece94 Sitzen aber die gleichen Menschen zum ersten Mal hinter dem Lenkrad eines Autos sind sie hochmotiviert und wollen gleich losfahren Warum gibt es in diesen beiden Situationen so gro e Gef hlsunterschiede Ein Grund liegt sicherlich darin da beim Autofahren der Sch ler sofort zu starten probiert dann anf hrt schaltet und weiterf hrt Vom Fahrlehrer werden nur wenige Erkl rungen gebracht und der Sch ler mu sich auch vorher keine Bedienungsanleitung durchlesen Das Lernen erfolgt dadurch das der Sch ler einfach losf hrt Erste Erfolge sind sofort da und nach wenigen Stunden kann der Sch ler schon einigerma en gut fahren Das bedeutet da ein sehr komplexer Proze wie das Autofahren in einigen Stunden gelern
123. rwave Das Internet Informationssystem der 2 Generation dpunkt Verlag fiir digitale Technologie Heidelberg 1995 DALITZ WOLFGANG HEYER GERNOT Hyperwave The New Generation Internet System Based on Hyper G Technology dpunkt Verlag fiir digitale Technologie Heidelberg 1996 DECEMBER JOHN GINSBURG MARK HTML and CGI Unleashed Sams net 1995 DIETINGER THOMAS Object oriented implementation of a multi protocol hyper G client for Ms Windows Diplomarbeit 1995 in Institut f r Telematik am Informationsverarbeitung und computergest tzte neue Medien Technische Universit t Graz FLOHR UDO Hyper G Organizes the Web BYTE November 1995 FLOHR UDO Hyper G ohne Geheimnis Verlag Heinz Heise 1996 FOLEY JAMES D VAN DAM ANDRIES Computer Graphics Principles and Practice Addison Wesely Publishing Company 1990 FRAKES WILLIAM Information Retrieval Data Structures amp Algorithms Prentice Hall 1992 GRAHAM IAN S The HTML Sourcebook Wiley Verlag 1995 7 REFERENZEN 105 Heller 89 Houghton 84 Jones 95 Jorge 96 Krol 94 Kruglinski 93 Kuhlen 80 Kyas 94 Lancaster 78 Laurel 91 Lippman 91 Liu 94 Mary 96 Maurer 96 MaurerH 96 Micro 95 Mresse 84 Niederst 96 HELLER EVA Wie Farben wirken Rowohlt Verlag 1989 HOUGHTON BERNARD CONVEY Retrieval Systems Clive Bingley 1984 JOHN Online Information JONES RUSS NYE ADRIAN MERZ THOMAS BEARB
124. rwenden bewirkt nur da das menschliche Auge Schwierigkeiten bei der Fokussierung hat Dunkle Farben erscheinen weiter entfernt als hellere e Es soll die M glichkeit geboten werden die Farben der Benutzeroberfl che ver nderbar zu gestalten damit sich jeder einzelne Benutzer jene Farben ausw hlen kann die er als angenehm empfindet Regeln f r das Dialogdesign In Shneider92 werden 8 goldende Regeln f r Dialogdesign empfohlen e Bem hung um Konsistenz Diese Regel wird am meisten mi achtet und ist aber gleichzeitig am einfachsten zu erf llen In hnlichen Situationen sollen konsistente Abl ufe von Aktionen erfolgen identische Terminologie in Menutexten 4 MENSCH MASCHINE KOMMUNIKATION 63 Dialogtexten und in der Online Hilfe Abweichungen von der Konsistenz sollen nur in Ausnahmef llen geschehen M glichkeit von Shortcuts f r Experten Funktionen und Befehle die oft ben tigt werden k nnen entweder ber ein Menu oder schneller durch Dr cken einer Funktionstaste aufgerufen werden Angebot informativer R ckmeldungen F r jede Aktion des Benutzers sollte eine Antwort des Systems erfolgen Dies ist besonders bei l ngeren Rechenzeiten notwendig Zusammenh nge in Dialogen kennzeichnen Abl ufe von Aktionen sollen in einen Anfang in einen Mittelteil und in ein Ende unterteilt werden Einfache Fehlerbehandlung Das System sollte so designed werden da dem Benutzer schwerwiegende Fehler nicht m glich sin
125. s eine entsprechende L sung zu ermitteln Ein Beispiel w re in Microsoft Word for Windows der Lebenslauf Agent der gezielte Fragen stellt und dann aus den Antworten einen optisch ansprechenden Lebenslauf erstellt e zur cknehmen von Aktionen reversible actions Immer einen Weg zur ck zur Verf gung stellen Da durch die Ereignisschleife der Benutzer aufgefordert wird zu experimentieren er sich aber vor der Vernichtung seiner bisherigen Arbeit f rchtet mu ihm die M glichkeit geboten werden alle nderungen an seinen Daten r ckg ngig zu machen Wird diese M glichkeit nicht angeboten haben Benutzer Angst davor eine Funktion eines Programmes auszuprobieren e Bildschirm screen Der Bildschirm ist die B hne der Mensch Maschine Kommunikation Am Bildschirm sollte f r den Benutzer immer leicht erkennbar sein was der Computer gerade ausf hrt Bei l ngeren Operationen sollte immer eine Anzeige sichtbar sein die den aktuellen Status und die ungef hre Zeit bis zum Ende der Operation anzeigt Es ist sehr wichtig da nicht nur der prozentuelle Verlauf sondern auch die noch abzuwartende Zeit angezeigt wird da nur aus einem prozentuellen Verlauf keine Aussage ber die zu verbleibende Wartezeit get tigt werden kann e einfache Sprache plain language Die Kommunikation mit dem Benutzer erfolgt in klaren und einfachen S tzen Es ist sehr wichtig da Meldungen besonders Fehlermeldungen klar und einfach formulier
126. s und ein Benutzerinterface mit Fenstern und Icons bei dem mit der Maus Objekte direkt manipuliert werden k nnen Star benutzte auch die Philosophie des WYSIWYG What You See Is What You Get Sie bedeutet da zum Beispiel in einem Textverarbeitungsprogramm der Text genauso angezeigt wird wie er nach dem Ausdrucken auf einem Blatt Papier aussehen w rde Auf diesen neuen Ideen baute Apple auf und entwickelte den Apple Lisa in den fr hen 80er Jahren Etwas sp ter entstand das verbesserte Modell der Apple Macintosh Er bernahm die Grundideen vom Star Computer war aber aufgrund der inzwischen fortgeschrittenen Technologie wesentlich kleiner billiger und schneller und wurde dadurch sehr erfolgreich Alle graphisch orientierten Betriebssysteme die danach entstanden basieren bis heute auf den Prinzipien des Star und des Apple Macintosh Preece94 Apple87 4 3 Menschliche Informationsverarbeitung Dieser Bereich spielt eine fundamentale Rolle in der Mensch Maschine Kommunikation Er liefert die theoretische Basis wie die Informationsverarbeitung beim Menschen erfolgt wie Wissen erworben wird und welche M glichkeiten existieren um das Lernen einfacher und effizienter zu gestalten 4 3 1 Informationsspeicherung beim Menschen Nach heutigem Wissensstand wird von einem Modell mit 3 verschiedenen Komponenten ausgegangen Preece94 4 MENSCH MASCHINE KOMMUNIKATION 42 e Sensorisches Ged chtnis Informationen der Umwelt werden hier reg
127. samt Der Nachteil ist da die Kontrollm glichkeiten ber fehlerhafte Deskriptorenangaben bei der Datenaufnahme begrenzt sind weil sie erst bei der Abfrage mit den Eintr gen im Thesaurus verglichen werden Variante 3 Wenn der Thesaurus benutzt wird um anstelle des aufgenommenen Deskriptors eine Art Stammwort aus der Deskriptorenklasse zu speichern spricht man von einer Speicherung in kanonischer Form Da die aus dem Deskriptor generierten kanonischen Formen dem Benutzer nicht unbedingt bekannt sind mu auch bei der Abfrage jeder Deskriptor durch den selben Thesaurus gefiltert werden nderungen im Thesaurus k nnen schwerwiegende Folgen haben Sie k nnen zu falschen Interpretationen oder zur Unauffindbarkeit f hren Die Vorteile sind da die Menge der gespeicherten Deskriptoren kleiner wird da pro Klasse nur ein Deskriptor gespeichert wird Bei der Abfrage nach Stammw rtern kann der Thesaurus umgangen werden Es ist dann mit optimalen Antwortzeiten zu rechnen Als Nachteile treten in Erscheinung da die urspr ngliche Form der Eingabe verloren geht da das Konzept sehr starr ist und bei der Aufnahme und bei der Abfrage mu derselbe Thesaurus verwendet werden 5 9 Erkennung physisch hnlicher Zeichenketten Um die Qualit t der Antwort eines IRS zu verbessern besteht oft der Wunsch nach nicht exakten Vergleichsmethoden zur Erkennung hnlicher Zeichenketten Es soll die M glichkeit bestehen Abfragen nur vage zu formulieren b
128. st blicherweise eine unstrukturierte und unformatierte Folge von Zeichen W rtern oder S tzen Ein Deskriptor Merkmal Attribut oder Eigenschaft ist eine Zeichenfolge bestehend aus einem oder mehrerer W rter die auf ein besonderes Merkmal des Textes hinweist Etwaige Regeln zur Darstellung der Informationseinheit werden meist unabh ngig vom Text gespeichert und als Ein bzw Ausgabemasken bezeichnet M gliche Daten die mit Hilfe eines Information Retrieval Systemes IRS gespeichert und wiedergefunden werden k nnen sind z B e alle Daten ber bestimmte Objekte Personal B cher Patienten oder Krankheiten oder Kunstgegenst nde 70 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL e Objekte k nnen aber auch als Ganzes gespeichert werden die Korrespodenz in einem Sekretariat Programme und deren Dokumentation pers nliche Notizen Zeichnungen oder Graphiken Bevor aber diese Daten mit einem IRS bearbeitet werden k nnen m ssen sie in eine f r die Wiedergewinnung geeignete Form gebracht werden Diese Umwandlung erfolgt meist in zwei Schritten e Daten aufnehmen e und anschlie end die Daten in das System laden Unter der Datenaufnahme sind alle T tigkeiten zu verstehen die mit dem Erstellen der einzelnen Informationseinheiten verbunden sind e IRS Das Bereitstellen einer benutzerfreundlichen Methode zur Dateneingabe siehe auch das Kapitel ber Mensch Maschine Kommunikation e JRS Das Bereitstellen einer M gl
129. st fiir Loopback reserviert Ein Paket mit der Zieladresse 127 0 0 0 wird deshalb ohne jemals wirklich in das Internet zu gelangen unmittelbar wieder beim Sender eintreffen Diese Loopback Funktion kann zum Uberpriifen von Netzwerksoftware verwendet werden Wird als Netzwerkidentifikation 0 angegeben so bezeichnet dies automatisch das eigene lokale Netzwerk Die Benutzeridentifikation mit dem Wert 0 entspricht dem eigenen Netzwerkknoten 2 3 3 2 IPv6 Internet Protocol version 6 Das IPv6 ist ein neues System welches zur Zeit entwickelt wird um die Adressierung von Computern im Internet zu verbessern Die Internet Engineering Task Force IETF hat beschlossen da dieses Protokoll die n chste Generation f r die IP Adressierung werden soll Dadurch wird diese Version 6 die bisher bestehende Version 4 ersetzen In der Version 4 besteht eine IP Adresse aus 4 8 bit Zahlen die durch einen Punkt voneinander getrennt sind z B 128 53 24 207 In diesem Schema sind mehr als 4 Milliarden Adressen m glich Die Hierachie dieser Adressen ist in 2 Ebenen aufgeteilt Die Adresse besteht aus einem Netzwerkteil und einen Host in diesem Netzwerk Die Praxis hat aber gezeigt da dies eine sehr ineffiziente Methode ist um den IP Adressraum aufzuteilen In der neuen Version 6 werden 128 bit IP Adressen vergeben Jede Adresse besteht aus 8 Teilen wovon jeder eine 16 bit Zahl enth lt z B 1023 0 24 A8 34 10A3 34E F03B Der Vorteil von IPv6 is
130. t werden kann Im Laufe der Zeit mu der Sch ler noch seine F higkeiten verbessern und 4 MENSCH MASCHINE KOMMUNIKATION 50 Erfahrungen sammeln aber der grunds tzliche Umgang mit dem Auto wurde sehr schnell gelernt Im krassen Gegensatz dazu verh lt sich das Lernen des Umgangs mit Computern Der Sch ler mu sich durch schlechtgeschriebene Handb cher arbeiten rgert sich mit ungenau beschriebenen Beispielen herum und ist weit davon entfernt nach wenigen Stunden einen Computer einigerma en bedienen zu k nnen Einlernzeiten bis zu einem halben Jahr um nur ein bi chen damit arbeiten zu k nnen sind sehr wahrscheinlich Au erdem ist in dieser Zeit die Anzahl der Mi erfolge wesenlich gr er als die der Erfolge Die Folgen die daraus entstehen sind meist eine subjektive Unzufriedenheit oder ein unangenehmes Gef hl bei der Arbeit mit dem Computer Lernschwierigkeiten bei Computern e Lernen ist schwierig Lernende erfahren Frustration und blamieren sich das Lernen dauert l nger als erwartet und Lernende haben Probleme ihr neuerworbenes Wissen auch anzuwenden e Lernenden fehlt Basiswissen Lernende wissen nicht wie man mit Computer umgeht sie verstehen auch nicht den Computer Jargon der in vielen Handb chern verwendet wird Lernende wissen nicht was relevant ist um Probleme zu verstehen und zu l sen e Lernende machen ad hoc Interpretationen sie versuchen zu interpretieren was sie gerade tun bzw was ihnen
131. t nicht nur der wesentlich gr ere Adressraum sondern auch die flexible Architektur Zus tzlich ist es noch voll kompatibel zur bestehenden Version 4 2 INTERNET 21 2 3 4 Domain Name System DNS F r Menschen ist es schwierig sich viele einzelne Internet Adressen zu merken da es immer nur 32bit gro e Zahlen sind Es ist wesentlich einfacher mit Namen anstatt mit Zahlen zu arbeiten Bis in die erste H lfte der 80er Jahre wurde jedem Computer einfach neben seiner numerischen Adresse ein Name zugeordnet 1986 enthielt die offizielle Namensliste des Internet ca 3600 Eintr ge Diese flache Namensstruktur wurde aber im Zuge des raschen Wachstums des Internets sehr schnell unbrauchbar Aus diesem Grund wurde 1986 mit dem Domain Name System ein hierachisches Namenssystem eingef hrt Die einer anderen Domain hierachisch untergeordnete Domain wird als Sub Domain bezeichnet Der Domain Name besteht aus einer Top Level Domain der rechteste Teil des Namens sowie aus Subdomains Die Domain Namen sind unabh ngig davon ob sie in Gro oder Kleinbuchstaben geschrieben werden Top Domains COM Kommerziell EDU Erziehung und Ausbildung Militar ORG Organisationen GOV Regierungsstellen NET Netzwerkbetreiber lt Tabelle 2 Top Domains im Internet Zus tzlich gibt es noch f r jeden Staat eine Kurzbezeichnung als Top Level Domain Zuk nftig sollen die Top Domains um weitere Elemente erweitert werden
132. t werden k nnen In der Kopfzeile jedes Dokumentes da vom Wavemaster erstellt wird befindet sich eine einfache Benutzeroberfl che mit denen ein Anwender den Hyperwave Server warten kann e Login Der Benutzer kann sich identifizieren um Daten in den Server einzuspielen oder zu modifizieren e Edit Im Edit Modus werden zus tzliche M glichkeiten angeboten um Dokumente am Server zu modifizieren e Search Mit diesem Menupunkt kann nach bestimmten Dokumenten am Server gesucht werden Als Suchm glichkeiten werden angeboten Suche nach Titel Schl sselw rtern Name Erstellungsdatum Autor oder Volltextsuche e Annotate Mit einem Hyperwave Server ist jeder identifizierte Benutzer in der Lage zu beliebigen Dokumenten seine Anmerkungen zu speichern e Preferences Hier kann die bevorzugte Sprache und die gew nschte Qualit t von Audio oder Videodaten definiert werden e Admin F r Benutzer mit Systemrechten besteht die M glichkeit hier den gesamten Server zu administrieren e Help Unter diesem Punkt befindet sich die Online Hilfe von Hyperwave 3 4 Hyperwave Publishing Wizard Dies ist ein Programm das es erm glicht sehr einfach eine gr ere Menge von Dokumenten vom File System in den Hyperwave Server zu laden Weiters ist es auch m glich ganze Directory B ume z B herk mmliche Web Seiten sehr schnell in den Hyperwave Server zu bernehmen 3 HYPER G HYPERWAVE 35 3 5 Hyper G Client Amadeus Amadeus
133. t werden und keine technischen Fachausdr cke beinhalten e testen des Benutzerinterfaces Nur der Test eines neuen Produktes kann seine Qualit t best tigen Im Verlauf des Designprozesses sollten immer wieder 4 MENSCH MASCHINE KOMMUNIKATION 54 Au enstehende in Tests involviert werden um zu erkennen ob das Interface den gew nschten Anforderungen entspricht Beachtung von Behinderungen an Menschen F r Personen die schlecht sehen sollte eine M glichkeit vorgesehen werden mit denen sie die Schriften und Graphiken vergr ern k nnen Information darf nicht nur farbkodiert angeboten werden da einige Personen farbenblind sein k nnten und dann diese Daten nicht interpretieren k nnen Keine Meldung des Systems sollte nur durch Audiosignale erfolgen Mindestens mu die M glichkeit angeboten werden eine zus tzliche visuelle Anzeige einzuschalten 4 4 2 Unterschiedliches Design f r unterschiedliche Anwendungen Bei Computersystemen kann man zwischen 4 Gruppen unterscheiden Shneider92 Die Unterschiede liegen in der Einlernzeit der Komplexit t des Systemes der m glichen Fehler und der subjektiven Zufriedenheit des Benutzers lebenskritische Systeme Sind Luft berwachungssysteme f r Flugzeuge Kontrollsysteme f r Kernreaktoren Energieversorgungssysteme bemannte Raumfahrt milit rische Operationen und medizinische Anwendungen All diesen Systemen ist gemeinsam da sie sehr teuer zuverl ssig und e
134. ten Dokumente aus der zweiten Antwort und Y die Menge der relevanten Antworten aus der ersten Antwort ist Die Menge Zo kann dann auch als eine Differenzmenge berechnet werden Die Qualit tszahlen die bei einem IRS mit einer Anzahl von Abfragen erreicht werden K nnen h ngen wesentlich von folgenden 3 Punkten ab Nach welchen Kriterien werden die Deskriptoren aus den Dokumenten ausgew hlt indexing Wenn generell nur Deskriptoren ausgew hlt werden die gut passen Kerndiskriptoren dann wird die Pr zision verbessert Werden dagegen auch Deskriptoren aufgenommen die nur teilweise zutreffen Randdeskriptoren dann wird die Ausbeute erh ht Wie wird die Abfrage formuliert Es ist leicht eine Abfrage so zu formulieren da die Ausbeute gleich 1 wird wenn daf r dann eine sehr geringe Pr zision in Kauf genommen wird Welche M glichkeiten bietet das IRS Schlie lich hat auch das IRS selbst M glichkeiten die es bei der Aufnahme und bei der Formulierung der Abfrage bietet einen Einflu auf die erreichbaren Verh ltniszahlen zu nehmen Mittel zur Fehlererkennung bei manueller Eingabe zur Erkennung hnlicher Deskriptoren bei der Aufnahme oder bei der Abfrage usw erh hen die Ausbeute bei gleichbleibender oder verbesserter Pr zision Die Berechnung aller Ma zahlen obliegt dem Benutzer er mu schlie lich eine subjektive Bewertung ber die Relevanz der einzelnen Dokumente durchf hren Die gr te Aussagekraft haben
135. tronische Schreibmaschinen weil sie Angst davor haben das Ger t zu besch digen einen schweren Fehler zu begehen oder weil sie f rchten keinen Erfolg zu haben Befragungen und Tests mit dieser Personengruppe zeigen Probleme auf die bei der Benutzung entstehen und lassen L sungen daf r erkennen e Sanfte Evolution Obwohl Anf nger ihre ersten Computererfahrungen bei der Arbeit mit Auswahlmen s erleben m chten sie sp ter wenn sie schon sicherer sind schnellere und effizientere M glichkeiten der Interaktion benutzen Daher werden Methoden gesucht die einen leichteren bergang vom Anf nger zu einem erfahrenen Benutzer erm glichen Weiters mu man auf die unterschiedlichen Anforderungen von Anf ngern und Experten achten Eine L sungsm glichkeit w re eine Reduktion der m glichen Interaktionen f r Anf nger nur die wichtigsten Interaktionen und Experten denen alle M glichkeiten offen stehen sollen e Menuauswahl und Eingabeformulare Der Inhalt die Anzahl die Plazierung und die Benennung von Men punkten haben einen gro en Einflu auf die Benutzbarkeit 4 MENSCH MASCHINE KOMMUNIKATION 38 eines Programmes Schon mit relativ geringem Aufwand kann man gro e Erleichterungen erzielen Die Einfachheit und richtige Anwendung von Eingabeformularen erlaubt schon Anf ngern schnelle Erfolge bei der Erfassung von Daten mit einem Computer e Kommandosprachen Sind ein traditioneller Interaktionsstii und damit ausgezeichnete Kand
136. tzwerk Es wird davon ausgegangen da Konzepte miteinander verbunden sind z B die Namen von Staaten und deren Hauptst dten werden verteilt gespeichert aber es besteht eine starke Verbindung zwischen jedem Staatsnamen und der dazugeh rigen Hauptstadt soda es relativ einfach ist zu einem Staat auch seine Hauptstadt zu nennen Eine weitere Theorie vermutet da das Wissen in Form von Schematas gespeichert wird Ein Schema ist in diesem Fall ein Netzwerk von Allgemeinwissen das sich aus bisherigen Erfahrungen ergab Schemas k nnen in Scripts unterteilt werden die den genauen Ablauf eines ganz bestimmten Szenarios beschreiben wie z B der Verlauf eines Essens in einem Restaurant Zuerst wird das Lokal betreten ein Platz zum Sitzen ausgesucht die Speisekarte betrachtet bestellt gegessen bezahlt und dann wird wieder das Lokal verlassen Diese Scripts dienen dazu die t glichen Abl ufe des Lebens einfach durchf hren zu k nnen Es sind sozusagen erlernte Verhaltensweisen die immer gleich ablaufen Interessant wird es wenn diese Scripts absichtlich durch u ere Einfl sse unterbrochen werden Es werden fast alle Menschen zun chst einmal v llig verwirrt sein wenn der Kellner sofort nach der Aufnahme der Bestellung die Rechnung pr sentiert und abkassieren will und dann erst das Essen bringt Daran lassen sich die Nachteile dieser erlernten Schematas erkennen Passiert etwas v llig Unerwartetes das eben nicht ins Schema pa t mu erst das
137. tzwerk bestand aus 4 Knoten University of California at Los Angeles SRI International Menlo Park Kalifornien University of Utah und University of California at Santa Barbara die untereinander ber Telefonleitungen verbunden waren Ein Jahr sp ter 1970 schlossen sich die Universit ten Harvard und MIT an das Netzwerk an 1971 befanden sich schon ber 30 Knoten im ARPANET Das Kommunikations protokoll des ARPANET war zwar paketorientiert hatte aber mit dem heute verwendeten bertragungsprotokoll TCP IP noch nichts gemeinsam 1973 begann die inzwischen in DARPA umbenannte Defense Advanced Reseach Projects Agency ein Projekt um die unterschiedlichen Implementierungen von paketorientierten bertragungsmechanismen die entstanden sind miteinander zu verbinden das Internet Projekt Vier Jahre sp ter entstand das erste arbeitsf hige Netz welches die unterschiedlichen paketorientierten Netzwerke verband Die ersten Teilnehmer des Internets waren das ARPANET ein paketorientiertes Funknetzwerk ein _ paketorientiertes Satellitennetzwerk und das von XEROX PARC entwickelte Ethernet Das Kommunikationsprotokoll da alle diese einzelnen Netzwerke verband war das TCP IP 1983 hatte das ARPANET eine solche Ausdehnung erreicht da es nicht mehr weiter unter dem Status eines Forschungsnetzwerkes betrieben werden konnte Die Kontrolle wurde deshalb von der DARPA an die Defense Communication Agency DCA bergeben Gleichzeitig geschah
138. urop er die linken Bereich zuerst erfassen Araber deren Schrift von rechts nach links geschrieben wird bevorzugen den rechten Bereich e Struktur und Balance Am Bildschirm mu immer eine Struktur der angebotenen Information erkennbar sein Genauso m ssen die Elemente ausgewogen auf der Fl che verteilt werden e Beziehungen zwischen Elementen Elemente die in direktem Zusammenhang zueinander stehen sollen auch r umlich nahe beisammen liegen um den Benutzer beim Erkennen eines Zusammenhanges zu unterst tzen e Lesbarkeit und Leseflu Bei der Entwicklung eines Layouts f r den Bildschirminhalt stellen sich folgende Fragen e Kann die Idee oder das Konzept in einer einfacheren Form pr sentiert werden 4 MENSCH MASCHINE KOMMUNIKATION 61 e Kann der Benutzer einfach durch die angebotene Information wandern e Haben alle Elemente die sich am Schirm befinden einen Grund f r ihre Anwesenheit Einheit und Integration e Wie verh lt sich ein neu entwickeltes Design zu seiner Umgebung e Wie verh lt sich das Design gegen ber anderen Programmen die bereits in Verwendung sind e Wird es in das Design des bergeordneten Systemes integriert e Wie arbeiten die verschiedenen Elemente die am Schirm dargestellt werden zusammen Allgemeine Regeln f r das Arbeiten mit Farben Micro95 Shneider92 Heller89 Farben sind eine sehr wichtige Eigenschaft eines visuellen Interfaces Wenn Farbe unkritisch benutzt wird
139. utachtung vorgelegt 2 Der Benutzer beurteilt die vorgelegten Dokumente indem er sie als relevant oder nichtrelevant bezeichnet 3 Das IRS versucht aufgrund der Auswahl auch alle anderen gefundenen Dokumente zu klassifizieren und dem Benutzer in entsprechender Reihenfolge zu pr sentieren 4 Wenn die Antwort noch unzureichend ist kann das IRS versuchen aufgrund der Auswahl eine neue Abfrage zu formulieren 5 7 1 Gewichtung der selektierten Dokumente Aufgrund der Benutzerauswahl wird f r jeden Deskriptor D der im Zusammenhang mit einem Dokument in der Abfrage A steht ein Relevanzfaktor L berechnet Hier ist aber zu beachten da sich die Anzahl relevanter und nicht relevanter Dokumente in der Berechnungsformel f r L auf die bewertete Stichprobe aus der Abfrage beziehen d h diese Zahlen sind nicht identisch mit den vorhin erw hnten Mengen Y und Z Aufgrund der Ma zahl L werden in einem ersten Schritt ein dokumentspezifisches Gewicht f r jeden Deskriptor berechnet Es wird L mit der H ufigkeit des Deskriptors in jedem Dokument multipliziert Anschlie end wird der Deskriptor Relevanz Faktor DRF wie folgt berechnet DRF L H ufigkeit von D in Tj F r jedes Dokumemt T berechnet man als Gewichtung WT die Summe ber alle DRF WT gt DRF Bei diesen Berechnungen sollte man auf zwei Spezialf lle R cksicht nehmen 82 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL e Wenn ein Deskriptor nur in relev
140. verschiedenste Gebiete anwendbar Designregeln entsprechen einfachen Instruktionen e Prinzipien m ssen interpretiert und in Relation zum aktuellen Problem gestellt werden e Designregeln basieren auf psychologischen Erkenntnissen und auf praktischer Erfahrung Zus tzlich zu den Prinzipien und Regeln f r Interfacedesign wurden von Apple87 noch Strategien erstellt deren G ltigkeit unabh ngig von Computersystemen und Programmen ist e keine unterschiedlichen Moden modelessness Eine vom Benutzer ausgef hrte Aktion sollte immer das gleiche Ergebnis liefern unabh ngig von den vergangenen Aktivit ten Wenn trotzdem verschiedene Moden verwendet werden m ssen diese deutlich gekennzeichnet werden Ein Modus ist ein Kontext in dem die Aktion eines Benutzers verschieden von einem anderen Kontext interpretiert wird Im wirklichen Leben verwenden Menschen keine Moden daher geben verschiedene Moden bei Computern ihnen das Gef hl da Computer unnat rlich und unfreundlich sind Als Beispiel f r einen Mode der immer wieder Probleme bei Anf ngern verursacht gilt die Verwendung des Scrollbars bei einem Fenster Um die Scrollbar zu bewegen mu der Benutzer die Maustaste gedr ckt halten w hrend er die Maus bewegt Aus seinen bisherigen Erfahrungen wei er aber nur da die Maus zum Zeigen und Anklicken verwendet werden kann Obwohl verschiedene Moden so problematisch sind gibt es doch auch eine Anwendung die dieses P
141. ystem im Internet eingegangen Hyperwave Es werden das zugrundeliegende Konzept und die wichtigsten M glichkeiten und Vorteile vorgestellt Es wird auch auf die verschiedenen Schnittstellen zum Hyperwave Server eingegangen Das Kapitel 4 befa t sich mit der Theorie der Mensch Maschine Kommunikation wie Menschen Informationen verarbeiten und wie eine gute Gestaltung von Benutzer interfaces zu erfolgen hat Der Suche nach Information ist das 5 Kapitel gewidmet Es wird die Grundidee des Information Retrieval vorgestellt die m glichen Klassifizierungen von Information Retrieval Systemen und die Beurteilung deren Qualit t Weiters wird die Problematik der Deskriptorenauswahl die Auswahl durch R ckkopplung relevance feedback die Verwendung von Thesauri und der effiziente Vergleich von Zeichenketten diskutiert Im 6 Kapitel wird der Terminus der Querycollection genau erl utert dessen Unterschied zu einer normalen Collection in Hyperwave und der typische Verlauf einer Erstellung und Benutzung dieser Querycollection Zus tzlich werden noch einige Anwendungsbeispiele vorgestellt und auf die genaue Funktionalit t des Queryform Wizdards zur Erstellung einer Querycollection eingegangen 2 INTERNET 10 2 INTERNET 2 1 Entwicklung des Internet Ende der F nfziger Jahre erhielt RAND eine Institution in Santa Monica Kalifornien den Auftrag ein milit risches Kommando und berwachungsnetzwerk zu entwerfen welches auch
142. zw soll mehr als nur die genaue Eingabe ber cksichtigt werden Die physische und semantische Umgebung eines Deskriptors soll miteinbezogen werden hnlichkeiten zwischen Deskriptoren k nnen auf unterschiedlicher Stufe behandelt werden Mresse 84 physische hnlichkeiten similarity Angabe von Metazeichen Vergleich hnlicher Zeichenketten 84 5 SUCHEN NACH INFORMATION INFORMATION RETRIEVAL 85 semantische hnlichkeiten equivalence auf der Basis einzelner Deskriptoren e Deskriptorenauswahl e Thesaurus bei der Datenaufnahme e Thesaurus bei der Abfrage semantische hnlichkeiten auf der Basis ganzer Texte bzw ihrer Deskriptoren e Deskriptorengewichtung e Riickkopplungstechniken Im folgenden wird die M glichkeit einer unterschiedlichen Eingabe gleicher Deskriptoren genauer untersucht Es l t sich eine Unterteilung in 2 Punkte vornehmen unterschiedliche Eingaben aufgrund sprachlicher Gegebenheiten e das gleiche Wort wird in verschiedenen Formen eingegeben Pr und Suffixproblem e das phonetisch gleiche Wort wird unterschiedlich geschrieben e eine Rechtschreibreform ndert per Definitionem die Schreibweise von W rtern unterschiedliche Eingaben als Folge von Fehlern e auslassen eines Buchstabens e einf gen eines falschen Buchstabens e vertauschen von zwei am Eingabeger t Tastatur benachbarter Buchstaben In der Literatur werden etliche L sungen dieses similarity Problemes vorgeschlagen

Download Pdf Manuals

image

Related Search

Related Contents

  Canon i900D Quick Start Manual  MCPOS for Restaurant  

Copyright © All rights reserved.
Failed to retrieve file