Home

SPSS Categories™ 16.0

image

Contents

1. In jeder Zeile f r sich Getrennt in jeder Quelle Alle Quellen gleichzeitig Abbrechen Hite Skalierungsmodell W hlen Sie eine der folgenden Alternativen aus m Identit t Alle Quellen weisen dieselbe Konfiguration auf m Euklidisch gewichtet Hierbei handelt es sich um ein Modell f r individuelle Differenzen Jede Quelle hat einen individuellen Raum in dem jede Dimension des gemeinsamen Raums unterschiedlich gewichtet ist m Euklidisch verallgemeinert Hierbei handelt es sich um ein Modell f r individuelle Differenzen Jede Quelle hat einen individuellen Raum der einer Rotation des gemeinsamen Raums und einer darauf folgenden differenzierten Gewichtung der Dimensionen entspricht hnlichkeiten Geben Sie an ob die Distanzmatrix hnlichkeits oder Un hnlichkeitsma e enth lt Dimensionen Standardm ig wird eine L sung in zwei Dimensionen berechnet Minimum 2 Maximum 2 Sie k nnen f r das Minimum und Maximum eine beliebige ganze Zahl zwischen 1 und der Anzahl der Objekte minus 1 angeben solange das Minimum kleiner oder gleich dem Maximum ist Die Prozedur berechnet eine L sung in der h chsten Dimension und reduziert die Dimensionalit t dann schrittweise bis die niedrigste Dimensionalit t erreicht ist 88 Kapitel 8 Ahnlichkeitstransformationen Wahlen Sie eine der folgenden Alternativen aus Keine Die hnlichkeiten werden nicht transformiert Sie k nnen opt
2. amp Zeitung die am h ufigsten gele amp Musikgeschmack music amp Bevorzugte Wohngegend live al Ergebnis Mathematiktest math al Ergebnis Sprachtest language Variablen ag D marital 1 Ordinal Bereich und Skala definieren Beschriftung f r Diagramme der Objektwerte Dimensionen in der L sung 2 Zur cksetzen Abbrechen J Definieren Sie mindestens zwei Variablen Sets W hlen Sie die Variablen aus die in das erste Set aufgenommen werden sollen Um zum n chsten Set zu wechseln klicken Sie auf Weiter und w hlen Sie die Variablen aus die in das zweite Set aufgenommen werden sollen Auf Wunsch k nnen Sie weitere Sets hinzuf gen Klicken Sie auf Zur ck um zum zuvor definierten Variablen Set zur ckzukehren Legen Sie f r jede Variable den Wertebereich und das Messniveau Niveau der optimalen Skalierung fest Klicken Sie auf OK Die folgenden Optionen sind verf gbar m Sie k nnen eine oder mehrere Variablen ausw hlen um Punktbeschriftungen f r Objektwertediagramme anzugeben Jede Variable erzeugt ein separates Diagramm dessen Punkte mit den Werten dieser Variablen beschriftet sind F r jede dieser Variablen zur Diagrammbeschriftung muss ein Bereich festgelegt werden In diesem Dialogfeld kann eine Variable nicht gleichzeitig in der Analyse und als Beschriftungsvariable verwendet werden Wenn Sie das Objektwertediagramm
3. Mehrfachkorrespondenzanalyse Speichern Mehrfachkorrespondenzanalyse Objektdiagramme Mehrfachkorrespondenzanalyse Variablendiagramme Zus tzliche Funktionen beim Befehl MULTIPLE CORRESPONDENCE 7 Multidimensionale Skalierung PROXSCAL hnlichkeiten in mehreren Spalten von Matrizen hnlichkeiten in Spalten 2 2 22 c seen hnlichkeiten in einer Spalte 2 2 2222 hnlichkeiten aus Daten erstellen 0 00 000 Distanzen aus Daten erstellen 0 00000 eee Definieren eines Modells f r die multidimensionale Skalierung Multidimensionale Skalierung Einschr nkungen Multidimensionale Skalierung Optionen Multidimensionale Skalierung Diagramme Version 1 Multidimensionale Skalierung Diagramme Version2 Multidimensionale Skalierung Ausgabe Zus tzliche Funktionen beim Befehl PROXSCAL 8 Multidimensionale Entfaltung PREFSCAL Definieren eines Modells f r die multidimensionale Entfaltung Multidimensionale Entfaltung Einschr nkungen Multidimensionale Entfaltung Optionen Multidimensionale Entfaltung Diagramme Multidimensionale Entfaltung Ausgabe 0 Zus tzliche Funktionen beim Befehl PREFSCAL viii Teil Il Beispiele 9 Kategoriale Regression
4. O Keine Kategorien m ssen gleich sein Erg nzende Kategorie 5 Erganzend Abbrechen Hilfe Geben Sie 6 als H chstwert ein und klicken Sie auf Aktualisieren W hlen Sie in der Liste Nebenbedingungen f r Kategorien den Wert 5 aus und w hlen Sie die Option Erg nzende Kategorie aus W hlen Sie in der Liste Nebenbedingungen f r Kategorien den Wert 6 aus und w hlen Sie die Option Erg nzende Kategorie aus Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Korrespondenzanalyse auf Modell 231 Korrespondenzanalyse Abbildung 12 18 Dialogfeld Modell Korrespondenzanalyse Modell X Dimensionen in der L sung 2 rDistanzma Chi Quadrat Euklidisch rStandardisierungsmethode G Zeilen und Spaltenmittel werden entfernt Zeilenmittel werden entfernt altenmittel werden entfernt eilensummen werden angeglichen und Mittelwerte entfernt Spaltensummen werden angeglichen und Mitt rte entfernt rNormalisierungsmethode Symmetrisch Zeilenprinzipal Anpassen O Spattenprinzipal W hlen Sie Prinzipal als Normalisierungsmethode gt Klicken Sie auf Weiter Klicken Sie im Dialogfeld Korrespondenzanalyse auf Diagramme 232 Kapitel 12 Abbildung 12 19 Dialogfeld Diagramme Korrespondenzanalyse Diagramme rStreudiagramme v Biplot
5. Abbildung 11 8 Nichtlineare kanonische Korrelationsanalyse Dialogfeld Nichtlineare kanonische Korrelationsanalyse all Ergebnis Mathematiktest math al Ergebnis Sprachtest language E Nichttineare kanonische Korrelationsanalyse OVERALS X Variablen live 1 Ordinal Bereich und Skala definieren Beschriftung f r Diagramme der Objektwerte Bereich definieren Einf gen Zur cksetzen Abbrechen Hilfe W hlen Sie Music preferred und Neighborhood preference als Variablen f r das dritte Set aus gt Wahlen Sie music aus und klicken Sie auf Bereich und Skala definieren Abbildung 11 9 Dialogfeld Bereich und Skala definieren Minimum 1 Maximum s E OVERALS Bereich und Skala definieren X Ordinal Mehrfach nominal Diskret numerisch gt Geben Sie 5 als H chstwert f r diese Variable ein W hlen Sie Einzeln nominal als Messniveau aus Klicken Sie auf Weiter gt W hlen Sie im Dialogfeld Nichtlineare kanonische Korrelationsanalyse die Variable Jive aus und klicken Sie auf Bereich und Skala definieren 198 Kapitel 11 Abbildung 11 10 Dialogfeld Bereich und Skala definieren E OVERALS Bereich und Skala definieren a Minimum 1 Maximum 3 Messniveau Ordinal Mehrfach nominal Diskret numerisch Abbrechen Hilfe Geben Sie 3 als H chstw
6. Neue Datendatei schreiben rModellinformation in XML Datei exportieren CL _ arte V Kovarianzmatrix speichern W hlen Sie in der Gruppe Residuen die Option Standardisiert Klicken Sie auf Weiter Klicken Sie im Dialogfeld Lineare Regression auf OK 101 Kategoriale Regression Modellzusammenfassung Abbildung 9 4 Modellzusammenfassung f r lineare Regression nach dem Standardverfahren Modellzusammenfassung Standardf Korrigiertes ehler des R Quadrat R Quadrat Sch tzers a Einflu yariablen Konstante Good Housekeeping seal Price Money back guarantee Brand name Package design b Abh ngige Variable Preference Die lineare Regression ist das Standardverfahren zum Beschreiben der Beziehungen in diesem Problem Das am weitesten verbreitete Ma f r die Anpassungsg te des Regressionsmodells ist R2 Diese Statistik zeigt inwieweit die Varianz in der Antwort durch die gewichtete Kombination der Einflussgr en erl utert wird Je dichter R2 an 1 liegt desto h her ist die Anpassungsg te des Modells Die Regression von Preference auf die f nf Einflu gr en f hrt zu einem Wert von 0 707 f r R2 Dies bedeutet dass etwa 71 der Varianz in der Einstufung der Bevorzugung durch die Einflu gr en in der linearen Regression erkl rt werden Koeffizienten Die standardisierten Koeffizienten sind in der Tabelle aufgef hrt Das Vorzeichen der Koeffizien
7. W hlen Sie Preference als abh ngige Variable aus W hlen Sie die Eintr ge Package design bis Money back guarantee als unabh ngige Variablen aus Klicken Sie auf Diagramme 99 Kategoriale Regression Abbildung 9 2 Dialogfeld Diagramme Lineare Regression Diagramme X rStreudiagramm 1 von 1 x fae Diagramme der standardisierten Resit C Ale partiellen Diagramme erzeugen C Histogramm Fi Normalverteilungsdiagramm Ges Jen Je W hlen Sie ZRESID als y Variable aus W hlen Sie ZPRED als x Variable aus Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Lineare Regression auf Speichern 100 Kapitel 9 Abbildung 9 3 Dialogfeld Speichern Lineare Regression Speichern X rVorhergesagte Werte rResiduen _ Nicht standardisiert C Nicht standardisiert C Standardisiert V Standardisiert C Korrigiert C Studentisiert C Standardfehler des Mittelwerts _ Ausgeschlossen C Studentisiert ausgeschl Distanzen Einflussstatistiken C Mahalanobis _ DfBeta C nach Cook C Standardisierte s DfBeta C Hebelwerte Cl DtFit Vorhersageintervalle _ Standardisiertes DfFit C Mittelwert C Individuell C Kovarianzverhattnis Konfidenzintervall 95 Koeffizientenstatistik C Koeffizientenstatistik erstellen Neues Set erstellen Daten Set Name
8. Weiter Abbrechen Hite Ausgangskonfiguration W hlen Sie eine der folgenden Optionen Klassisch Die rechtwinklige Distanzmatrix wird verwendet um die Zwischenbl cke Werte zwischen Zeilen und zwischen Spalten der vollst ndig symmetrischen MDS Matrix zu erg nzen Sobald die vollst ndige Matrix gebildet ist wird als Ausgangskonfiguration eine klassische Skalierungsl sung verwendet Die Zwischenbl cke k nnen durch Ableiten von Werten mithilfe der Ungleichung im Dreieck oder der Spearman Distanzen aufgef llt werden Ross Cliff Beim Ross Cliff Start werden die Ergebnisse einer Einzelwertzerlegung auf der zweifach zentrierten und quadratischen Distanzmatrix als Ausgangswerte f r die Zeilen und Spaltenobjekte verwendet Korrespondenz Beim Korrespondenzstart werden die Ergebnisse einer Korrespondenzanalyse der Daten in umgekehrter Reihenfolge hnlichkeiten anstelle von Un hnlichkeiten mit einer symmetrischen Normalisierung von Zeilen und Spaltenwerten verwendet Zentroide Die Prozedur beginnt mit der Positionierung von Zeilenobjekten in der Konfiguration auf der Grundlage einer Eigenwertzerlegung Anschlie end werden die Spaltenobjekte auf dem Zentroid der angegebenen Auswahl positioniert Geben Sie f r die Anzahl der Auswahl eine positive ganze Zahl zwischen 1 und der Anzahl der hnlichkeitsvariablen an 91 Multidimensionale Entfaltung PREFSCAL m Mehrere Zufallsstarts Die L sungen werden f r vers
9. Geben Sie trunc casenum 1 4 1 als numerischen Ausdruck ein Klicken Sie auf OK 182 Kapitel 10 Abbildung 10 47 Dialogfeld Variable berechnen Target Variable Numeric Expression diagnosis mod casenum 1 4 1 Type amp Label Table Number Tablet Asa Command All da Subtype_ Arithmetic Pa Label CDF amp Noncentral CDF Av 1 Conversion al Current Date Time L Centroids Projected or Date Arithmetic L Centroids Projected or Celte Date Creation E Centroids Projected or Date E Araction iy L time Eunctions and Special Variables optional case selection condition Rufen Sie das Dialogfeld Variable berechnen auf gt Geben Sie diagnosis als Zielvariable ein gt Geben Sie mod casenum 1 4 1 als numerischen Ausdruck ein Klicken Sie auf OK 183 Kategoriale Hauptkomponentenanalyse Abbildung 10 48 Projected_centroids sav 3 projected_centroids sav DatenSet4 SPSS Daten Editor Datei Bearbeiten Ansicht Daten Transformieren Analysieren Grafiken Extras Fenster Hilfe eBBE oOo BP AEE bn Table None None Nonna None None Nominal None None Nominal None None Nominal None None Nominal Centroids Proj None None i Scale Centroids Proj None None i Scale Centroids Proj None None i Scale None None i Scale None None i Nominal ing IY Metrisch fy Ordinal REGEN oO erie 8 _ String 6 String String String Nu
10. Kategoriale Regression Transformationsdiagramme Im Dialogfeld Diagramme k nnen Sie die Variablen angeben aus denen Transformationsdiagramme und Residuen Diagramme erzeugt werden 24 Kapitel 2 Abbildung 2 8 Dialogfeld Diagramme Kategoriale Regression Diagramme Transformationsdiagramme oll pref fi amp package kage amp brand amp price amp seal money Residuen Diagramme Weiter Abbrechen J Transformationsdiagramme F r jede dieser Variablen werden die Kategorienquantifikationen anhand der urspr nglichen Kategoriewerte dargestellt Leere Kategorien erscheinen auf der horizontalen Achse haben jedoch keine Auswirkungen auf die Berechnungen Diese Kategorien werden durch Unterbrechungen in der Verbindungslinie zwischen den Quantifikationen gekennzeichnet Residuen Diagramme F r jede dieser Variablen werden Residuen berechnet f r die abh ngige Variable die aus allen Einflu variablen mit Ausnahme der betreffenden Einflu variable prognostiziert wurde anhand der Kategorienummern und der optimalen Kategorienquantifikationen multipliziert mit dem Beta ber Kategorienummern grafisch dargestellt Zus tzliche Funktionen beim Befehl CATREG Sie k nnen die kategoriale Regression Ihren Anforderungen entsprechend anpassen wenn Sie ihre Auswahl in ein Syntax Fenster einf gen und die resultierende Befehlssyntax f r den Be
11. i Transformationen zuweisen O Obere Dreiecksmatrix Getrennt in jeder Quelle O Gesamte Matrix Alle Quellen gleichzeitig Ahnlichkeiten _ Dimensionen Un hnlichkeiten Minimum 3 hnlichkeiten Maximum 3 Weiter Abbrechen Hilfe gt Zum Erstellen einer dreidimensionalen L sung ffnen Sie erneut das Dialogfeld Multidimensionale Skalierung und klicken Sie auf Modell gt Geben Sie 3 als minimal und maximal zul ssige Anzahl der Dimensionen ein gt Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Multidimensionale Skalierung auf Optionen 281 Multidimensionale Skalierung Abbildung 14 10 Dialogfeld Optionen Multidimensionale Skalierung Optionen Xi Ausgangskonfiguration piterationskriterien O Simplex Stress Konyergenz Torgerson Mindest Stress O Einzeiner Zutallsstert Maximalzahl der Iterationen Mehrere Zufallsstarts Anzahl Starts 2 C Gelockerte Aktualisierungen Anpassen r ngepasste Konfiguration variablen einlesen aus kinship_ini say Anzahl muss H chstzahl Dimensionen im Modell entsprechen Aktuell 3 Verf gbar Ausgew hlt Abbrechen Hilfe W hlen Sie Anpassen als Anfangskonfiguration W hlen Sie die Datei kinship_ini sav als Datei aus der die Variablen ausgelesen werden sollen gt W hlen Sie dim0 dim02 und d
12. Meulman J J 1982 Homogeneity analysis of incomplete data Leiden DSWO Press Meulman J J 1986 A distance approach to nonlinear multivariate analysis Leiden DSWO Press Meulman J J 1992 The integration of multidimensional scaling and multivariate analysis with optimal transformations of the variables Psychometrika 57 539 565 Meulman J J 1993 Principal coordinates analysis with optimal transformations of the variables Minimizing the sum of squares of the smallest eigenvalues British Journal of Mathematical and Statistical Psychology 46 287 300 Meulman J J 1996 Fitting a distance model to homogeneous subsets of variables Points of view analysis of categorical data Journal of Classification 13 249 266 Meulman J J 2003 Prediction and classification in nonlinear data analysis Something old something new something borrowed something blue Psychometrika 4 493 517 Meulman J J als auch W J Heiser 1997 Graphical display of interaction in multiway contingency tables by use of homogeneity analysis In Visual Display of Categorical Data M Greenacre als auch J Blasius Hgg New York Academic Press 277 296 Meulman J J als auch P Verboon 1993 Points of view analysis revisited Fitting multidimensional structures to optimal distance components with cluster restrictions on the variables Psychometrika 58 7 35 Nishisato S 1980 Analysis of categorical data Dual scaling and its
13. Verwandte Prozeduren Wenn jedes Set eine Variable enth lt ist die nichtlineare kanonische Korrelationsanalyse quivalent zur Hauptkomponentenanalyse mit optimaler Skalierung Wenn jede dieser Variablen mehrfach nominal ist entspricht die Analyse der Mehrfachkorrespondenzanalyse Wenn zwei Variablen Sets vorhanden sind und eines dieser Sets nur eine Variable enth lt ist die Analyse identisch mit der kategorialen Regression mit optimaler Skalierung So berechnen Sie eine nichtlineare kanonische Korrelationsanalyse W hlen Sie die folgenden Befehle aus den Men s aus Analysieren Dimensionsreduktion Optimale Skalierung Abbildung 4 1 Dialogfeld Optimale Skalierung i Optimale Skalierung Messniveau der optimalen Skalierung Alle Yariablen sind mehrfach nominal Einige Yariablen sind nicht mehrfach nominal Anzahl der Variablen Sets Ein Set Mehrere Sets Ausgewahite Analyse Nichtlineare kanonische Korrelation Definieren J Abbrechen Hite 42 Kapitel 4 gt Wahlen Sie entweder Alle Variablen sind mehrfach nominal oder Einige Variablen sind nicht mehrfach nominal aus Wahlen Sie Mehrere Sets Klicken Sie auf Definieren Abbildung 4 2 Dialogfeld Nichtlineare kanonische Korrelationsanalyse OVERALS Nichtlineare kanonische Korrelationsanalyse OVERALS Set vont Optionen amp Haustiere pet P r ch weter
14. e 10 Village Village N c 054 2 2 Town E 00 a Country 054 o 1 0 1 0 0 5 0 0 0 5 1 0 1 5 Dimension 1 Um die Beziehungen zwischen den Variablen zu erkennen ermitteln Sie welche Kategorien Werte f r Cluster von Kategorien in den Diagrammen mit Zentroiden stehen Die Beziehungen zwischen Age in years Newspaper read most often und Neighborhood preference k nnen mit einem Blick in den oberen rechten und den unteren linken Bereich der Diagramme beschrieben werden Die Altersgruppen im oberen rechten Bereich umfassen die lteren Teilnehmer diese Personen lesen den Telegraaf und wohnen lieber in einem Dorf Aus dem unteren linken Bereich der Diagramme geht hervor dass die jungen Teilnehmer und die Teilnehmer mittleren Alters den Volkskrant oder NRC lesen und auf dem Land oder in einer Stadt wohnen m chten Eine Trennung der niedrigeren Altersgruppen ist allerdings sehr schwierig Dieselben Interpretationen k nnen f r die andere Richtung Music preferred Marital status und Pets owned vorgenommen werden hierbei werden entsprechend der obere linke und der untere rechte Bereich des Diagramms mit den Zentroiden betrachtet Aus dem oberen linken Bereich geht hervor dass Alleinstehende h ufig einen Hund halten und gern New Wave h ren Verheiratete und Angeh rige anderer Kategorien beim Familienstand halten Katzen wobei Verheiratete gern klassische Musik h ren und die anderen Personen keine Musik m gen Eine alternative An
15. Kategoriale Hauptkomponentenanalyse Ley le iHU ill se XY nare m v BEER ar wim Zee As o in Zeit Diagnose Wechselwirkung 2 1 00 0 50 0 00 Diagnose O Anorexia Nervosa Anorexia und Bulimia Nervosa Bullimia Nervosa nach Anorexia DO Atypische Essst rung Anorexia Nervosa Anorexia und Bulimia Nervosa Bullimia Nervosa nach Anorexia Atypische Essst rung 0 50 Zeit Diagnose Wechselwirkung 1 H 376 5 B 470 25 Punkt gt Doppelklicken Sie dann zur Verbindung der Punkte auf das Diagramm und klicken Sie im Diagramm Editor auf das Tool zum Hinzuf gen von Interpolationslinien gt Schlie en Sie den Diagramm Editor 178 Kapitel 10 Abbildung 10 43 Strukturen des Krankheitsverlaufs Patient Diagnosis O Anorexia Nervosa O Anorexia with Bulimia Nervosa Bullimia Nervosa after Anorexia Atypical Eating O Disorder 1 50 1 00 0 50 1 00 1 50 Time diagnosis interaction Quantification dimension 2 1 50 1 00 0 50 0 00 0 50 1 00 Time diagnosis interaction Quantification dimension 1 Durch Verbindung der Kategoriepunkte f r die einzelnen Diagnosekategorien im Verlauf der Zeit ergeben sich Muster die sofort nahelegen dass die erste Dimension eine Relation zur Zeit und die zweite Dimension eine Relation zur Diagnose aufweist wie wir zuvor aus den Objektwertediagrammen ermittelt haben Dieses D
16. Keine v G Zwischen den Vari Zwischen den F llen Abbrechen Hite Die multidimensionale Skalierung verwendet Un hnlichkeitsdaten um eine Skalierungsl sung zu erstellen Wenn Ihre Daten multivariate Daten darstellen Werte gemessener Variablen m ssen Sie Un hnlichkeitsdaten erstellen um eine multidimensionale Skalierungsl sung berechnen zu k nnen Sie k nnen Optionen f r das Erstellen von Un hnlichkeitsma en aus Ihren Daten festlegen Messniveau Hier k nnen Sie das Un hnlichkeitsma f r Ihre Analyse festlegen W hlen Sie aus dem Gruppenfeld Ma die Option aus die Ihrem Datentyp entspricht W hlen Sie dann aus dem Dropdown Listenfeld ein Ma aus das diesem Messwerttyp entspricht Die folgenden Optionen sind verf gbar m Intervall Euklidischer Abstand quadrierter Euklidischer Abstand Tschebyscheff Block Minkowski oder ein benutzerdefiniertes Ma H ufigkeiten Chi Quadrat Ma oder Phi Quadrat Ma Bin r Euklidischer Abstand quadrierter Euklidischer Abstand Gr endifferenz Musterdifferenz Varianz und Distanzma nach Lance und Williams Distanzmatrix erstellen Mit dieser Funktion k nnen Sie die Einheit der Analyse w hlen Zur Auswahl stehen Zwischen den Variablen oder Zwischen den F llen Werte transformieren In bestimmten F llen zum Beispiel wenn die Variablen mit sehr unterschiedlichen Skalen gemessen werden empfiehlt sich
17. Unter der Annahme dass eine H ufigkeitstabelle analysiert werden soll und dass die Daten eine Zufallsstichprobe aus einer unbekannten Gesamtheit umfassen folgen die Zellenh ufigkeiten einer multinomialen Verteilung Ausgehend hiervon k nnen die Standardabweichungen und die Korrelationen der Singul rwerte der Zeilenwerte und der Spaltenwerte berechnet werden 228 Kapitel 12 In einer eindimensionalen Korrespondenzanalysel sung k nnen Sie je ein Konfidenzintervall f r die einzelnen Werte in der Gesamtheit berechnen Bei einer gro en Standardabweichung bestehen in der Korrespondenzanalyse gro e Unsicherheiten hinsichtlich der Position an der sich der Punkt in der Gesamtheit befindet Bei einer kleinen Standardabweichung l t sich in der Korrespondenzanalyse dagegen relativ sicher sagen dass dieser Punkt sehr nahe an dem Punkt aus der L sung liegt Bei einer mehrdimensionalen L sung mit hoher Korrelation zwischen den Dimensionen ist es unter Umst nden nicht m glich einen Punkt mit angemessener Sicherheit in der richtigen Dimension aufzufinden In solchen F llen sind multivariate Konfidenzintervalle mithilfe der Varianz Kovarianz Matrix zu berechnen die in eine Datei geschrieben werden kann Die Konfidenzstatistiken f r die Zeilen und Spaltenwerte werden gezeigt Die Standardabweichungen f r die beiden Manager Kategorien sind gr er als die anderen Werte dies liegt wahrscheinlich an der relativ geringen Anzahl an Per
18. ccc ce cece eens 221 Konfidenzstatistiken 0 0 0 0 cece tenets 227 ZS AtZ PROTO iiis uia daia a ae ee Miho nein 228 Beispiel Wahrnehmung von Kaffeemarken 0 0 00 cece eee eee eee een 234 Durchf hrung der Analyse 0 0 0000 cect teen eee 234 Dimensionen aana a cece a aaa aa aa a a aon a d a Ka E a aaa E aE teen Eaa aE a EE aa 238 Beitr ge sesia sen iuge aa a a a lan a wh ee ee 239 Diagramme u 20 0 cu ne ae a nd seen 241 Symmetrische Normalisierung 0000 cece eect ete eee 242 Beispiel Flugmeilen zwischen Sta dten 00 0 cece eect teens 244 Korrespondenztabelle 00 0 0 cece teen eee 251 Zeilen und Spaltenwerte 00 00 ccc eee 252 Empfohlene Literatur 00 c ect e ete eee 253 13 Mehrfachkorrespondenzanalyse 254 Beispiel Eigenschaften von Eisenwaren 0 0 c cece eee 254 Durchf hrung der Analyse 22 00 cece tte eee 255 Modellzusammenfassung 0 00 cece eee eee eens 258 Objektwerte 1 0 2 teen ttt tenes 259 Diskriminationsmake 1 0 0 0 0 ttt teens 260 Kategorienquantifikationen 22 000 cette 261 Genauere Untersuchung der Objektwerte 0 0000 cece eee eee eee 263 Ausschlu von Ausrei ern 0 2 0 0 0c ene eens 266 Empfohlene Literatur 00 00 c ccc tenet eee eee 269 14 Multidimensionale Skalierung 271 Beispiel Untersuchung von Bezeichnungen des Verwandt
19. female 9 missing f r Cousin gener Anzahl der Generationen von Ihnen aus gerechnet wenn diese Bezeichnung f r Ihre Verwandtschaft verwendet wurde Niedrigere Zahlen bedeuten dabei ltere Generationen Gro eltern erhalten den Wert 2 Enkel den Wert 2 und Geschwister den Wert 0 degree Die Anzahl der Trennungsgrade im Stammbaum Ihre Eltern befinden sich 1 Knoten ber Ihnen Ihre Kinder entsprechend 1 Knoten unter Ihnen Um zu Ihren Geschwistern zu gelangen gehen Sie 1 Knoten nach oben zu Ihren Eltern und dann 1 Knoten abw rts zu Ihren Geschwistern Hier liegen also 2 Trennungsgrade vor Ihr Cousin ist 4 Trennungsgrade entfernt 2 Knoten nach oben zu Ihren Gro eltern dann 2 Knoten nach unten ber Tante Onkel bis zum Cousin Die externen Variablen befinden sich in kinship_var sav Au erdem befindet sich eine Anfangskonfiguration aus einer fr heren Analyse in kinship_ini sav F r weitere Informationen siehe Beispieldateien in Anhang A auf S 326 280 Kapitel 14 Durchf hrung der Analyse Abbildung 14 9 Dialogfeld Modell A Multidimensionale Skalierung Modell X rSkalierungsmodell Ahnlichkeitstransformationen Identit t Yerh ltnisskala Euklidisch gewichtet O Intervall Euklidisch verallgemeinert Ordinal Reduzierter Rang C Gebundene Beobachtungen l sen Rang 1 O Spline Grad Form Knoten innen 1 Untere Dreiecksmatrix
20. gt Diskriminationsma e v Diagramm anzeigen Alle Variablen verwenden Ausgew hlte Variablen verwenden gt Abbrechen Hite Kategoriendiagramme F r jede ausgew hlte Variable wird ein Diagramm mit Zentroidkoordinaten erstellt Die Kategorien werden in den Zentroiden der Objekte in den einzelnen Kategorien plaziert Verbundene Kategoriendiagramme Hierbei handelt es sich um ein einzelnes Diagramm mit Zentroidkoordinaten jeder ausgew hlten Variablen Transformationsdiagramme Hierbei wird ein Diagramm der optimalen Kategorienquantifikationen gegen die Kategorienummern erstellt Sie k nnen die gew nschte Anzahl von Dimensionen angeben Pro Dimension wird ein Diagramm erstellt Sie k nnen au erdem festlegen dass f r jede ausgew hlte Variable ein Diagramm der Residuen ausgegeben wird Diskriminationsma e Erstellt ein einzelnes Diagramm der Diskriminationsma e f r die ausgew hlten Variablen Zus tzliche Funktionen beim Befehl MULTIPLE CORRESPONDENCE Sie k nnen die Mehrfachkorrespondenzanalyse an Ihre Bed rfnisse anpassen wenn Sie Ihre Auswahl in ein Syntax Fenster einf gen und die resultierende Befehlssyntax f r den Befehl MULTIPLE CORRESPONDENCE bearbeiten Mit der Befehlssyntax Sprache verf gen Sie au erdem ber folgende M glichkeiten m Mit dem Unterbefehl SAVE k nnen Sie Stammnamen f r die transformierten Variablen Objektwerte und Approximationen festlegen we
21. A Spiro II F E Speizer als auch B G Ferris Jr 1984 Passive smoking gas cooking and respiratory health of children living in six cities American Review of Respiratory Diseases 129 366 374 Winsberg S als auch J O Ramsay 1980 Monotonic transformations to additivity using splines Biometrika 67 669 674 Winsberg S als auch J O Ramsay 1983 Monotone spline transformations for dimension reduction Psychometrika 48 575 595 Wolter K M 1985 Introduction to variance estimation Berlin Springer Verlag Young F W 1981 Quantitative analysis of qualitative data Psychometrika 46 357 387 Young F W J De Leeuw als auch Y Takane 1976 Regression with qualitative and quantitative variables An alternating least squares method with optimal scaling features Psychometrika 41 505 528 Young F W Y Takane als auch J De Leeuw 1978 The principal components of mixed measurement level multivariate data An alternating least squares method with optimal scaling features Psychometrika 43 279 281 Zeijl E Y te Poel M du Bois Reymond J Ravesloot als auch J J Meulman 2000 The role of parents and peers in the leisure activities of young adolescents Journal of Leisure Research 32 281 302 hnlichkeitstransformationen in Multidimensionale Entfaltung 87 Allgemeines euklidisches Modell in Multidimensionale Entfaltung 87 Anf ngliche Diagramme des gemeinsamen Raums in Mu
22. Abbildung 12 7 Tr gheit pro Dimension Anteil der Tr gheit Singul rwert f r Konfidenz Singul r Auswertung Chi Standardab Korrelation Dimension wert f r Tr gheit Quadrat ig Bedingen Kumuliert weichung Gesamt auswertung a 12 Freiheitsgrade Wenn Sie feststellen dass die ersten p Dimensionen einer q dimensionalen L sung einen ausreichenden Teil der Tr gheit zeigen k nnen Sie h here Dimensionen au er Acht lassen In diesem Beispiel reicht die zweidimensionale L sung v llig aus weil die dritte Dimension weniger als 1 0 der Gesamttr gheit repr sentiert Die Singul rwerte k nnen als die Korrelation zwischen den Zeilen und Spaltenwerten interpretiert werden Diese Werte entsprechen dem Korrelationskoeffizienten nach Pearson r in der Korrelationsanalyse In jeder Dimension ist der quadrierte Singul rwert Eigenwert gleich der Tr gheit und bildet so einen weiteren Messwert f r die Wichtigkeit der betreffenden Dimension Bei der Korrespondenzanalyse werden verschiedene Diagramme erzeugt die die zugrunde liegenden Beziehungen zwischen den Kategorien und zwischen den Variablen darstellen Dies ist das Streudiagramm der Zeilen und Spaltenwerte f r die zweidimensionale L sung 223 Korrespondenzanalyse Abbildung 12 8 Diagramm der Zeilen und Spaltenwerte symmetrische Normalisierung 0 8 i Junior Marf ger O Berufsgruppe Senior Manager o O Rauchgewohnheit 0 6 Q
23. Abbrechen Anzeige Wahlen Sie mindestens eine der folgenden Anzeigeoptionen aus Eingabedaten Zeigt die urspriinglichen Ahnlichkeiten und sofern vorhanden die Datengewichtungen die Ausgangskonfiguration und die festen Koordinaten an Mehrere Starts Zeigt den Startwert ftir Zufallszahlen und den penalisierten Stresswert f r jeden Zufallsstart an Anf ngliche Daten Zeigt die Koordinaten des anf nglichen gemeinsamen Raums an Iterationsprotokoll Zeigt das Iterationsprotokoll des Hauptalgorithmus an Anpassungsma e Zeigt verschiedene Ma e an Die Tabelle enth lt mehrere Ma e f r die G te bzw mangelhafte G te der Anpassung Korrelation Variation und Nichtdegenerierung Stress Zerlegung Zeigt die Zerlegung des penalisierten Stress von Objekten Zeilen und Quellen an einschlie lich der Mittelwerte und Standardabweichungen von Zeilen Spalten und Quellen Transformierte hnlichkeiten Zeigt die transformierten hnlichkeiten an Endg ltiger gemeinsamer Raum Zeigt die Koordinaten des gemeinsamen Raums an Raumgewichtungen Zeigt die individuellen Raumgewichtungen an Diese Option ist nur verf gbar wenn eines der Modelle f r individuelle Differenzen angegeben wird Je nach Modell werden die Raumgewichtungen in Rotations und Dimensionsgewichtungen zerlegt die ebenfalls angezeigt werden Individueller Raum Zeigt die Koordinaten der individuellen R ume an Diese Option ist nur verf gbar wenn eines der Mo
24. Daily ozone level Einflu variablen Day of the year Bei der Regression mit optimaler Skalierung wird Daily ozone level als numerisch behandelt und Day of the year als nominal Dies f hrt zu einem Wert von 0 549 f r R Obwohl nur 55 der Variation bei Daily ozone level in der kategorialen Regression beriicksichtigt sind ist dies eine deutliche Verbesserung gegen ber der urspr nglichen Regression Wenn Sie Day of the year transformieren kann Daily ozone level vorhergesagt werden 137 Kategoriale Regression Abbildung 9 55 Transformationsdiagramm von Day of the year nominal 2 j Quantifizierungen 12 34 5 6 7 9 1011 12 13 14 15 16 17 18 19 2 21 22 23 24 235 BH 7 A 23V AULIKKI Kategorien Diese Abbildung zeigt das Transformationsdiagramm von Day of the year Die Extremwerte f r Day of the year erhalten jeweils negative Quantifikationen die zentralen Werte besitzen dagegen positive Quantifikationen Mithilfe dieser Transformation zeigen die hohen und niedrigen Werte f r Day of the year hnliche Auswirkungen auf den vorhergesagten Wert f r Daily ozone level 138 Kapitel 9 Abbildung 9 56 Diagrammerstellung E Diagrammerstellung Variablen E Inversion E Pressure I visibility E Temperat E Day of th L Daily 020 E E Inversion E Pressure L Temperat L Daily 020 STEA Kategorien Kehe Kategorien fmatrinrha Diagrammvorschau verwend
25. Das Unternehmen beauftragte zwei Berater unabh ngig voneinander mit der Bewertung der Standorte Neben einem umfassenden Bericht gaben die Berater auch eine zusammenfassende Wertung f r jeden Standort als good gut fair mittelm ig oder poor schlecht ab 335 Beispieldateien siteratings sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Betatests der neuen Website eines E Commerce Unternehmens geht Jeder Fall entspricht einem Beta Tester der die Brauchbarkeit der Website auf einer Skala von 0 bis 20 bewertete smokers sav Diese Datendatei wurde aus der Umfrage National Household Survey of Drug Abuse aus dem Jahr 1998 abstrahiert und stellt eine Wahrscheinlichkeitsstichprobe US amerikanischer Haushalte dar Daher sollte der erste Schritt bei der Analyse dieser Datendatei darin bestehen die Daten entsprechend den Bev lkerungstrends zu gewichten smoking sav Hierbei handelt es sich um eine von Greenacre Greenacre 1984 vorgestellte hypothetische Tabelle Die relevante Tabelle wird durch eine Kreuztabelle der Rauchgewohnheiten und der Berufskategorie gebildet Die Variable Berufsgruppe enth lt die Berufskategorien Senior Manager Junior Manager Angestellter mit Erfahrung Angestellter ohne Erfahrung und Sekretariat sowie die Kategorie National Average die als Erg nzung der Analyse dienen kann Die Variable Rauchen enth lt die Rauchgewohnheiten Nichtraucher Leicht Mittel
26. Die nachstehende Tabelle zeigt die Flugmeilen zwischen den St dten Beachten Sie dass nur eine einzige Variable f r die Zeilen und die Spalten vorliegt und dass die Tabelle symmetrisch ist Die Distanz von Los Angeles nach Miami ist identisch mit der Distanz von Miami noch Los Angeles Dar ber hinaus ist die Distanz einer Stadt zu sich selbst gleich 0 Der aktive Rand zeigt die Gesamtflugmeilen von einer beliebigen Stadt zu allen anderen St dten Abbildung 12 37 Flugmeilen zwischen 10 St dten in den USA Spalte Los New San Washington Atlanta Chicago Denver Houston Angeles Miami York Francisco Seattle DC Gesamt 10652 10285 10663 11038 14282 14168 13239 15223 15939 12053 127542 247 Korrespondenzanalyse Im allgemeinen sind Distanzen Un hnlichkeiten gro e Werte deuten auf gro e Differenzen zwischen den Kategorien hin F r die Korrespondenzanalyse ist jedoch ein Zusammenhangsma erforderlich Die Un hnlichkeiten m ssen also in hnlichkeiten umgewandelt werden In anderen Worten Ein umfangreicher Tabelleneintrag muss einer kleinen Differenz zwischen den Kategorien entsprechen Um die Un hnlichkeiten in hnlichkeiten umzuwandeln subtrahieren Sie die einzelnen Tabelleneintr ge jeweils vom gr ten Tabelleneintrag gt Um die hnlichkeiten zu erstellen und in der neuen Variablen hnlichk zu speichern w hlen Sie die folgenden Befehle aus den Men s aus Transformieren Variable berec
27. Ein an anderer Stelle McCullagh als auch Nelder 1989 vorgestelltes und analysiertes Daten Set bezieht sich auf Schadensanspr che f r Autos Die durchschnittliche H he der Schadensanspr che l sst sich mit Gamma Verteilung modellieren Dazu wird eine inverse Link Funktion verwendet um den Mittelwert der abh ngigen Variablen mit einer linearen Kombination aus Alter des Versicherungsnehmers Fahrzeugtyp und Fahrzeugalter in Bezug zu setzen Die Anzahl der eingereichten Schadensanspr che kann als Skalierungsgewicht verwendet werden car_sales sav Diese Datendatei enth lt hypothetische Verkaufssch tzer Listenpreise und physische Spezifikationen f r verschiedene Fahrzeugfabrikate und modelle Die Listenpreise und physischen Spezifikationen wurden von edmunds com und Hersteller Websites entnommen carpet sav In einem beliebten Beispiel m chte Green als auch Wind 1973 einen neuen Teppichreiniger vermarkten und dazu den Einfluss von f nf Faktoren auf die Bevorzugung durch den Verbraucher untersuchen Verpackungsgestaltung Markenname Preis G tesiegel Good Housekeeping und Geld zur ck Garantie Die Verpackungsgestaltung liegt in drei Faktorstufen vor die sich durch die Position der Auftrageb rste unterscheiden Au erdem gibt es drei Markennamen K2R Glory und Bissell drei Preisstufen sowie je zwei Stufen Nein oder Ja f r die letzten beiden Faktoren 10 Kunden stufen 22 Profile ein die durch diese Faktoren definiert sind Die
28. English muffinnd margarine o Corn muffin and bytter 9 r 2 Hn ano DUNST O Toast and marmalade Buttered toast 39 Dimension 2 e 1 I OToast and margarine 2 11 832 Toast pop up O o Hard rolls and butter 37 2 1 0 1 N Dimension 1 Das verbundene Diagramm des gemeinsamen Raums zeigt eine endg ltige Konfiguration die der Zwei fach Analyse der allgemeinen Bevorzugung stark hnelt wobei die L sung an der 45 Grad Achse gespiegelt ist Daher scheint nun die vertikale Dimension eine Unterscheidung zwischen weichem und harten Brot oder Toast aufzuweisen wobei die Artikel nach oben entlang der Achse weicher werden Bei der horizontalen Dimension ist nun keine eindeutige Interpretation m glich jedoch ist m glicherweise eine Unterscheidung nach Bequemlichkeit vorhanden bei der die Artikel nach links entlang der Achse konventioneller werden Die durch die Zeilenobjekte dargestellten Personen sind immer noch deutlich nach der Bevorzugung von harten oder weichen Artikeln gruppiert und weisen in der horizontalen Dimension starke Variationen innerhalb der Gruppen auf 304 Kapitel 15 Individueller Raum Abbildung 15 14 Dimensionsgewichtungen Dimension 1 2 Spezifit t Quelle Overall preference Breakfast with juice bacon and eggs and beverage Breakfast with juice cold cereal and beverage Breakfast with juice pancakes sausage and beverage Breakfast with beverage only
29. Hauptdialogfeld Multidimensionale Entfaltung hnlichkeiten 2 Gender gender Gewichtungen Zeilen aes Quellen a ste _ Caton as Je gt W hlen Sie Toast pop up bis Corn muffin and butter als hnlichkeitsvariablen aus Klicken Sie auf Optionen 292 Kapitel 15 Abbildung 15 2 Dialogfeld Optionen Ausgangskonfiguration Klassisch Ross Cliff Korrespondenz Zentroide vah Mehrere Zufallsstarts ta tar Anpassen ial Multidimensionale Entfaltung Optionen Iterationskriterien Stress Konvergenz Berechnung nach Spearman Mindest Stress 000001 0001 Maximalzahl der tterationen 5000 rPenalisierungsterm St rke 05 Bereich 10 Angepasste Konfiguration ariablen einlesen au Anzahl muss der maximalen D Abbrechen Hite W hlen Sie Spearman als Annahmemethode f r die Ausgangskonfiguration Klassisch aus Geben Sie im Gruppenfeld Penalisierungsterm 1 0 f r St rke und 0 0 f r Bereich ein Dadurch wird der Penalisierungsterm deaktiviert Klicken Sie auf Weiter Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf OK Im Folgenden finden Sie die durch diese Optionen generierte Befehlssyntax PREFSCAL VARIABLES TP BT EMM JD CT BMM HRB TMd BTJ TM
30. Kategoriale Hauptkomponenten Speichern Im Dialogfeld Speichern k nnen Sie festlegen dass diskretisierte Daten Objektwerte transformierte Werte und Approximationen in einer SPSS Datendatei oder in einem Daten Set gespeichert werden Au erdem k nnen die transformierten Werte die Objektwerte und die Approximationen in der Arbeitsdatei gespeichert werden m Daten Sets sind in der aktuellen Sitzung verf gbar In nachfolgenden Sitzungen stehen Daten Sets nur zur Verf gung wenn Sie sie ausdr cklich als Datendateien speichern Die Namen von Daten Sets m ssen den Regeln zum Benennen von Variablen entsprechen m Die Namen f r die Dateien und Daten Sets m ssen sich bei allen Arten von gespeicherten Daten unterscheiden m Wenn Sie die Objektwerte oder die transformierten Werte in der Arbeitsdatei speichern k nnen Sie die Anzahl der mehrfach nominalen Dimensionen angeben Abbildung 3 8 Dialogfeld Speichern Kategoriale Hauptkomponenten Speichern Diskretisierte Daten Transformierte Yariablen Diskretisierte Daten erstellen In Arbeitsdatei speichern Neues Daten Set erstellen Yariablen erstellen Daten Set Name Diskretisierte_Daten Neues Daten Set erstellen Neue Datendatei schreiben Daten Set Name Transformierte_Vars Neue Datendatei schreiben Objektwerte Approximationen In Arbeitsdatei speichern In Arbeitsdatei speichern Objektwerte erstellen Approximationen erstellen Neues Daten Set erstellen Neues
31. Korrespondenzanalyse Es werden drei Beispiele vorgestellt Das erste Beispiel umfa t eine relativ kleine Korrespondenztabelle und zeigt die grundlegenden Konzepte dieser Analyse Das zweite Beispiel zeigt die praktische Anwendung im Marketing Bereich Im letzten Beispiel wird eine Distanztabelle in einer mehrdimensionalen Skalierung verwendet Normalisierung Bei der Normalisierung wird die Tr gheit ber die Zeilen und Spaltenwerte gestreut Einige Aspekte der Korrespondenzanalysenl sung z B die Singul rwerte die Tr gheit pro Dimension und die Beitr ge bleiben bei den verschiedenen Normalisierungsmethoden unver ndert Die Zeilen und Spaltenwerte und die zugeh rigen Varianzen werden von der nderung erfa t Die Tr gheit wird bei der Korrespondenzanalyse auf verschiedene Weise gestreut Die drei h ufigsten Verfahren streuen die Tr gheit nur ber die Zeilenwerte nur ber die Spaltenwerte oder symmetrisch ber Zeilen und Spaltenwerte Zeilenprinzipal Bei der Zeilenprinzipal Normalisierung n hern sich die Euklidischen Distanzen zwischen den Zeilenpunkten den Chi Quadrat Distanzen zwischen den Zeilen der Korrespondenztabelle Die Zeilenwerte entsprechen dem gewichteten Durchschnitt der Spaltenwerte Die Spaltenwerte werden so standardisiert dass eine gewichtete Summe der quadrierten Distanzen zum Zentroid 1 entsteht Bei dieser Methode werden die Distanzen zwischen den Zeilenkategorien maximiert Wenn Sie haupts chlich ermit
32. Varianz ber cksichtigt Cronbachs Gesamt Dimension Alpha i der Varianz Gesamtwert 4 Die Summe von Cronbachs Alpha basiert auf der Summe der Eigenwerte Eine dreidimensionale L sung weist die Eigenwerte 3 424 0 844 und 0 732 auf und erkl rt fast die gesamte Varianz Objektwerte Die Objektwerte f r die dreidimensionale L sung werden in einer Streudiagramm Matrix grafisch dargestellt In einer Streudiagramm Matrix wird jede Dimension gegen jede andere Dimension in einer Reihe von zweidimensionalen Streudiagrammen geplottet Beachten Sie Die ersten beiden Eigenwerte in der dreidimensionalen L sung stimmen nicht mit den Eigenwerten in der zweidimensionalen L sung berein Mit anderen Worten Die L sungen sind nicht verschachtelt Da die Eigenwerte in den Dimensionen 2 und 3 nun kleiner als 1 sind was zu einem negativen Wert f r Cronbachs Alpha f hrt sollten Sie der zweidimensionalen L sung den Vorzug geben Die dreidimensionale L sung wird zu Anschauungszwecken dargestellt Abbildung 10 16 Streudiagramm Matrix der Objektwerte mit drei Dimensionen Dimension 1 2 on Dimensi Dimension 3 Dimension 1 Dimension 2 Dimension 3 154 Kapitel 10 Die oberste Zeile l t erkennen dass die erste Dimension PRIMARY GROUPS und MOBS von den anderen Gruppen abtrennt Beachten Sie dass sich die Reihenfolge der Objekte entlang der vertikalen Achse in keinem der Plots in der obersten Zeile ndert Alle die
33. bacon and eggs and beverage f r Ausgangskonfiguration mit Korrespondenzanalyse einnamenitoast t oa muffin and butter i n uffin and margarine nel bun Shen per muffin and margarine Feels o 15 30 ch TERET aa 6195 4 71 02033 0 04 50 5 e ae oe o 3m a 99170 tb 27 Danish pany o8 19 O 41 141 36 9238 O 4037 oToast pop up P th 39 32 Buttered toast 5 Toast and marmalade Toast and margarine Hard rolls and butter Dimension 2 Dimension 1 Die h here Spezifit t ist im verbundenen Diagramm des individuellen Raums Breakfast with Juice bacon and eggs and beverage klar zu erkennen Die Quelle ist noch st rker an der ersten Dimension als beim klassischen Spearman Start beteiligt sodass die Zeilen und Spaltenobjekte auf der vertikalen Achse etwas weniger und auf der horizontalen Achse etwas mehr Variation aufweisen 313 Multidimensionale Entfaltung Abbildung 15 23 Verbundenes Diagramm des individuellen Raums Snack with beverage only f r Ausgangskonfiguration mit Korrespondenzanalyse Cinnamon toast 10 o e Corn muffin and butter English muffin and margarine O i AREAREN Blueberry muffin and margarine 5 Glazed donut 307 ee Jellydonut 15 33 0 28 gt 67S 6018 34 Coffee cake 0 8215 043 e 0 Danish eee me 17 042 A 2427 0 02 a 29 31 0939 11 o g 36 19 040 Buttered toast and jelly ar oO 2 o Buttered toast Toast and marmalade Hard rolls and butter Toa
34. die ausgew hlte Variable gesetzt Sie k nnen die Methode ausw hlen nach der die Werte gesetzt werden W hlen Sie Modalwert wenn fehlende Werte durch die h ufigste Kategorie ersetzt werden sollen Falls mehrere Modalwerte vorhanden sind wird der Modalwert mit der kleinsten Kategorienummer verwendet Wenn Sie Zusatzkategorie ausw hlen werden fehlende Werte durch die gleiche Quantifikation einer zus tzlichen Kategorie ersetzt Dies bedeutet aber auch dass Objekte mit einem fehlenden Wert f r diese Variable als zur gleichen Kategorie der zus tzlichen zugeh rig betrachtet werden Objekte mit fehlenden Werten f r diese Variable ausschlie en Objekte mit fehlenden Werten f r die ausgew hlte Variable werden aus der Analyse ausgeschlossen Diese Strategie ist f r Zusatzvariablen nicht verf gbar Mehrfachkorrespondenzanalyse Optionen Im Dialogfeld Kategoriale Hauptkomponenten Optionen k nnen Sie die anf ngliche Konfiguration ausw hlen Kriterien f r die Iterationen und die Konvergenz festlegen eine Normalisierungsmethode ausw hlen die Methode zum Beschriften der Diagramme ausw hlen und Zusatzobjekte angeben Abbildung 6 6 Dialogfeld Optionen BE MCA Optionen Maximalzahl der tterationen 1100 Diagramme beschriften mit G Yariablen oder WVertelabels L ngenbegrenzung f r Beschriftungen F Yariablennamen oder Werte Diagrammdimension
35. erdem liegt SCHRAUBEI wesentlich weiter vom Ursprung entfernt als die anderen Objekte was darauf hindeutet da insgesamt viele der Merkmale dieses Objekts bei den anderen Objekten nicht vorkommen Das Objektwertediagramm ist besonders hilfreich f r die Ermittlung von Ausrei ern SCHRAUBEI k nnte als Ausrei er betrachtet werden Sp ter werden wir untersuchen was passiert wenn wir dieses Objekt ausschlie en Diskriminationsma e Bevor wir den Rest der Objektwertediagramme untersuchen wollen wir berpr fen ob die Diskriminationsma e mit unseren bisherigen Aussagen bereinstimmen Bei jeder Variablen wird f r jede Dimension ein Diskriminationsma das als quadrierte Komponentenladung betrachtet werden kann berechnet Dieses Ma ist auch die Varianz der quantifizierten Variablen in dieser Dimension Der H chstwert f r dieses Ma ist 1 Dieser Wert wird erreicht wenn die Objektwerte in sich gegenseitig ausschlie enden Gruppen liegen und alle Objektwerte innerhalb einer Kategorie gleich sind Anmerkung Wenn fehlende Daten vorliegen kann dieses Ma gr er als 1 sein Gro e Diskriminationsma e entsprechen einer gro en Streubreite ber die 261 Mehrfachkorrespondenzanalyse Kategorien der Variablen und zeigen schlie lich einen hohen Grad an Diskrimination zwischen den Kategorien einer Variablen entlang dieser Dimension an Der Durchschnitt der Diskriminationsma e f r eine Dimension ist gleich dem Prozentsatz d
36. ngige Variable Daily ozone level Einflu variablen Inversion base height Pressure gradient mm Hg Visibility miles Temperature degrees F Day of the year Werden alle Einflu gr en als nominal behandelt ergibt sich ein Wert von 0 886 f r R2 Ein so gro er Wert f r die ber cksichtigte Varianz ist nicht weiter berraschend weil bei der nominalen Behandlung keine Einschr nkungen f r die Quantifikationen auftreten Die Interpretation der Ergebnisse kann sich allerdings recht schwierig gestalten 122 Kapitel 9 Abbildung 9 31 Regressionskoeffizienten alle Einflu gr en nominal Standardisierte Koeffizienten Standard fehler Inversion base height 144 187 Pressure gradient mm Hg Visibility miles 69 528 Temperature degrees F i f 468 542 Day ofthe year F 203 250 Abhangige Variable Daily ozone level 123 227 Diese Tabelle ziegt die standardisierten Regressionskoeffizienten f r die Einflu gr en Ein h ufiger Fehler beim Interpretieren dieser Werte ist es den Schwerpunkt auf die Koeffizienten zu legen und dabei die Quantifikationen zu vernachl ssigen Sie k nnen nicht voraussetzen dass der gro e positive Wert f r den Koeffizienten Temperature impliziert dass der vorhergesagte Wert f r Ozone automastisch steigt wenn die Temperatur ansteigt Umgekehrt l t der negative Koeffizient f r Inversion base height nicht darauf schlie en dass ein Anstieg bei Inversion base height
37. tsmodell verwendet Verwandte Prozeduren Eine Skalierung aller Variablen auf numerischem Niveau entspricht der standardm igen multidimensionalen Skalierung 69 70 Kapitel 7 So berechnen Sie eine multidimensionale Skalierung W hlen Sie die folgenden Befehle aus den Men s aus Analysieren Skalieren Multidimensionale Skalierung PROXSCAL Daraufhin wird das Dialogfeld Datenformat ge ffnet Abbildung 7 1 Dialogfeld Datenformat E Multidimensionale Skalierung Datenformat Datenformat Anzahl der Quellen Daten sind hnlichkeiten _ Eine Matrixquelle hnlichkeiten aus Daten erstellen Mehrere Matrixquellen Eine Quelle Mehrere Quellen hnlichkeiten sind in einer Spalte gestapett Definieren Abbrechen Hite Geben Sie das Format der Daten an Datenformat Geben Sie an ob die Daten aus hnlichkeitsma en bestehen oder ob Sie aus den Daten hnlichkeitsma e erstellen m chten Anzahl der Quellen Wenn es sich bei den Daten um hnlichkeiten handelt geben Sie an ob eine Quelle oder mehrere Quellen f r hnlichkeitsma e vorhanden sind Eine Quelle Wenn nur eine Quelle f r hnlichkeiten vorhanden ist geben Sie die Art der Formatierung des Daten Sets an Die hnlichkeiten befinden sich in einer Matrix ber mehrere Spalten verteilt oder in einer einzigen Spalte mit zwei verschiedenen Variablen zur Kennzeichnung der Zeile und Spa
38. wurde ein Teil der Daten durch fehlende Werte ersetzt telco_mva_complete sav Bei dieser Datendatei handelt es sich um eine Teilmenge der Datendatei telco sav allerdings mit anderen Variablennamen testmarket sav Diese hypothetische Datendatei bezieht sich auf die Pl ne einer Fast Food Kette einen neuen Artikel in ihr Men aufzunehmen Es gibt drei m gliche Kampagnen zur Verkaufsf rderung f r das neue Produkt Daher wird der neue Artikel in Filialen in mehreren zuf llig ausgew hlten M rkten eingef hrt An jedem Standort wird eine andere Form der Verkaufsf rderung verwendet und die w chentlichen Verkaufszahlen f r das neue Produkt werden f r die ersten vier Wochen aufgezeichnet Jeder Fall entspricht einer Standort Woche testmarket_1month sav Bei dieser hypothetischen Datendatei handelt es sich um die Datendatei testmarket sav wobei die w chentlichen Verkaufszahlen zusammengefasst sind sodass jeder Fall einem Standort entspricht Dadurch entfallen einige der Variablen die w chentlichen nderungen unterworfen waren und die verzeichneten Verkaufszahlen sind nun die Summe der Verkaufszahlen w hrend der vier Wochen der Studie tree_car sav Hierbei handelt es sich um eine hypothetische Datendatei die demografische Daten sowie Daten zum Kaufpreis von Fahrzeugen enth lt tree_credit sav Hierbei handelt es sich um eine hypothetische Datendatei die demografische Daten sowie Daten zu fr heren Bankkrediten enth lt tree_m
39. 13 14 15 16 18 Kategorien Diese Abbildung zeigt das Transformationsdiagramm von Pressure gradient Die anfanglichen diskretisierten Kategorien bis 6 erhalten nur kleine Quantifikationen und leisten daher nur einen minimalen Beitrag zur vorhergesagten Antwort Die n chsten drei Kategorien erhalten etwas h here positive Werte Dies f hrt zu einem m igen Anstieg beim vorhergesagten Ozonwert Die Quantifikationen sinken weiter bis zur Kategorie 6 in der Pressure gradient den gr ten absenkenden Effekt auf den vorhergesagten Ozonwert hat Die Linie f llt auch nach dieser Kategorie noch weiter ab ein ordinales Messniveau f r die Skalierung von Pressure gradient d rfte die Anpassungsg te nicht merklich verringern vereinfacht jedoch die Interpretation der Auswirkungen Das Ma 0 4 f r die Wichtigkeit und der Regressionskoeffizient f r Pressure gradient weisen allerdings darauf hin dass diese Variable bei der Regression nicht sonderlich n tzlich ist 124 Kapitel 9 Abbildung 9 34 Transformationsdiagramm von Visibility nominal 34 nn 1 Quantifizierungen 34 44 Fe REE AE CCE bh St OP a eee eee oe Pe 1234667484 9 1011 13 15 16 21 23 3 3 Kategorien Das Transformationsdiagramm von Visibility zeigt wie das Transformationsdiagramm f r Inversion base height kein erkennbares Muster Wenn Sie ordinale oder lineare Einschr nkungen f r die Quantifikationen dieser Variablen festlegen geht die Anpas
40. 15 x 15 Elementen Die Anzahl der Zellen ist dabei gleich der 332 Anhang A Anzahl der Personen in einer Quelle minus der Anzahl der gemeinsamen Platzierungen der Objekte in dieser Quelle kinship_ini sav Diese Datendatei enth lt eine Ausgangskonfiguration f r eine dreidimensionale L sung f r kinship_dat sav kinship_var sav Diese Datendatei enth lt die unabh ngigen Variablen gender Geschlecht gener Generation und degree Verwandtschaftsgrad die zur Interpretation der Dimensionen einer L sung f r kinship_dat sav verwendet werden k nnen Insbesondere k nnen sie verwendet werden um den L sungsraum auf eine lineare Kombination dieser Variablen zu beschr nken mailresponse sav Hierbei handelt es sich um eine hypothetische Datendatei in der es um die Bem hungen eines Bekleidungsherstellers geht der ermitteln m chte ob die Verwendung von Briefsendungen f r das Direktmarketing zu schnelleren Antworten f hrt als Postwurfsendungen Die Mitarbeiter in der Bestellannahme erfassen wie vielen Wochen nach der Postsendung die einzelnen Bestellungen aufgegeben wurden marketvalues sav Diese Datendatei betrifft Hausverk ufe in einem Neubaugebiet in Algonquin Illinois in den Jahren 1999 2000 Diese Verk ufe sind in Grundbucheintr gen dokumentiert mutualfund sav Diese Datendatei betrifft Aktienmarktdaten f r verschiedene Technologieaktien die in im Index S amp P 500 verzeichnet sind Jeder Fall entspricht einem
41. 2 ee eee eee tenn eee nnee 311 Beispiel Untersuchen der Angemessenheit von Verhaltensweisen in bestimmten Situationen 313 Durchf hrung der Analyse 22 00 cece ett tee eee 314 Mal ee a een carter Se en ee 319 Gemeinsamer Raum 0 ccc ee eee ene n eee eens 320 hnlichkeitstransformationen 2 ccc cece cece eee aaeeea 321 ndern der hnlichkeitstransformation Ordinal 2 2222 321 Mabe Santana e NEE neh A AR HERRER A NET ISERETERFRE EHER RER TREE STR ER a apn 323 xi Gemeinsamer Raum hnlichkeitstransformationen Empfohlene Literatur Anhang A Beispieldateien Bibliografie Index xii 326 338 344 Teil I Benutzerhandbuch Kapitel Einf hrung in die Prozeduren f r die optimale Skalierung von kategorialen Daten Bei den Prozeduren in Categories wird die optimale Skalierung f r die Analyse von Daten verwendet die mit statistischen Standardprozeduren nur schwer oder gar nicht analysiert werden k nnen In diesem Kapitel werden die einzelnen Prozeduren die Situationen in denen die einzelnen Prozeduren am besten geeignet sind die Beziehungen zwischen den Prozeduren und die Beziehungen der Prozeduren zu ihrem jeweiligen Gegenst ck aus der Standardstatistik beschrieben Anmerkung Diese Prozeduren und ihre Implementierung in SPSS wurden von der Data Theory Scaling System Group DTSS entwickelt die aus Mitgliedern der Institute f r P dagogik und Psychologie der s
42. 5 1J 15cm m v 0 5cm 05cm o o 0 12 gm 2cm cm o V Cum o 1cm OSem Tem o 1cm1 cm alba UNE A a N TR 15 10 05 00 05 10 1 un Dimension 1 Das mit L nge in cm beschriftete Diagramm zeigt da diese Variable in der ersten Dimension keine Diskrimination aufweist Ihre Kategorien weisen bei einer Projektion auf eine horizontale Linie keine Gruppierung auf In der zweiten Dimension jedoch liegt bei L nge in cm durchaus eine Diskrimination vor Die k rzeren Objekte entsprechen positiven Werten und die l ngeren Objekte entsprechen gro en negativen Werten Abbildung 13 12 Objektwerte beschriftet mit Messing n Dimension 2 Nein ja o Nein _Neil jein Nein o N a Nein Nein Nein Nein 15 10 05 00 05 10 15 Dimension 1 Das mit Messing beschriftete Diagramm zeigt dass diese Variable Kategorien aufweist die sich in der ersten und zweiten Dimension nicht gut trennen lassen Die Objektwerte liegen ber den gesamten Raum verteilt Die Objekte aus Messing k nnen nicht von den Objekten differenziert werden die nicht aus Messing bestehen 266 Kapitel 13 Ausschlu von Ausrei ern Bei der Homogenit tsanalyse sind Ausrei er Objekte die zu viele einzigartige Merkmale aufweisen Wie bereits erw hnt k nnte SCHRAUBE als Ausrei er betrachtet werden Um dieses Objekt zu l schen und die Analyse erneut durchzuf hren w hlen Sie folgende Optionen aus den Men s aus Daten F lle ausw
43. Achse zusammen Eine Richtung wird durch Age in years Newspaper read most often und Neighborhood preference bestimmt Die andere Richtung ist 204 Kapitel 11 durch die Variablen Marital status Music preferred und Pets owned definiert Die Variable Pets owned ist eine mehrfach nominale Variable hierf r werden also zwei Punkte aufgetragen Die Quantifikationen werden jeweils als einzelne Variable interpretiert Transformationsdiagramme Die verschiedenen Niveaus auf denen die einzelnen Variablen skaliert werden k nnen bringen Einschr nkungen f r die Quantifizierungen mit sich Transformationsdiagramme illustrieren die Beziehung zwischen den Quantifizierungen und den urspr nglichen Kategorien die sich aus dem jeweils ausgew hlten Messniveau der optimalen Skalierung ergibt Das Transformationsdiagramm f r die Variable Neighborhood preference die als nominal behandelt wurde zeigt ein U f rmiges Muster bei dem die mittlere Kategorie die niedrigste Quantifikation erh lt die u eren Kategorien dagegen hnliche Werte Dieses Muster weist auf eine quadratische Beziehung zwischen der urspr nglichen Variablen und der transformierten Variablen hin Ein alternatives Messniveau mit optimaler Skalierung f r Neighborhood preference wird nicht empfohlen Abbildung 11 18 Transformationsdiagramm f r die Variable Neighborhood preference nominal 1 0 0 0 Kategorienquantifikationen von Neighborhood preference Town Village C
44. Bereich und Skala definieren gt Beschriftung f r Diagramme der Objektwerte Bereich definieren Dimensionen in der L sung 2 Einf gen Zur cksetzen Abbrechen Hilfe W hlen Sie Pets owned und Newspaper read most often als Variablen f r das zweite Set aus W hlen Sie pet aus und klicken Sie auf Bereich und Skala definieren 196 Kapitel 11 Abbildung 11 6 Dialogfeld Bereich und Skala definieren E OVERALS Bereich und Skala definieren Minimum 1 Maximum Messniveau Ordinal Mehrfach nominal Einzeln nominal Diskret numerisch Abbrechen Hilfe Geben Sie 5 als H chstwert f r diese Variable ein W hlen Sie Mehrfach nominal als Messniveau aus Klicken Sie auf Weiter W hlen Sie im Dialogfeld Nichtlineare kanonische Korrelationsanalyse die Variable news aus und klicken Sie auf Bereich und Skala definieren Abbildung 11 7 Dialogfeld Bereich und Skala definieren E OVERALS Bereich und Skala definieren Minimum 1 Maximum Messniveau Ordinal Mehrfach nominal Diskret numerisch Abbrechen Hilfe Geben Sie 5 als H chstwert f r diese Variable ein W hlen Sie Einzeln nominal als Messniveau aus Klicken Sie auf Weiter Klicken Sie im Dialogfeld Nichtlineare kanonische Korrelationsanalyse auf Weiter um das letzte Variablen Set zu definieren 197
45. Diagramme und Zusatzvariablen bestimmen die in die gefundene L sung eingepa t werden Skala und Gewicht definieren in CATPCA Sie k nnen das Messniveau der optimalen Skalierung f r die Analysevariablen und die Zusatzvariablen festlegen In der Standardeinstellung werden sie als monotone Splines zweiten Grades ordinal mit zwei inneren Knoten skaliert Au erdem k nnen Sie die Gewichtung der Analysevariablen bestimmen 28 Kapitel 3 Abbildung 3 3 Dialogfeld Skala und Gewichtung definieren E Kategoriale Hauptkomponenten Skal Variablengewichtung 1 Messniveau der optimalen Skalierung Spline ordinal Ordinal Spline nominal Nominal Mehrfach nominal Numerisch Spline Weiter J Abbrechen Variablengewichtung Sie k nnen f r jede Variable eine Gewichtung festlegen Bei dem angegebenen Wert muss es sich um eine positive ganze Zahl handeln Der Standardwert ist 1 Messniveau der optimalen Skalierung Sie k nnen auch das f r die Quantifikation der einzelnen Variablen verwendete Skalierungsniveau ausw hlen Spline ordinal Die Reihenfolge der Kategorien bei der beobachteten Variable wird bei der optimal skalierten Variable beibehalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch den Koordinatenursprung plaziert Die resultierende Transformation ist ein glatter st ckweiser monotoner Polynom mit dem gew hlten Grad
46. Die Namen von Daten Sets m ssen den Regeln zum Benennen von Variablen entsprechen m Die Namen f r die Dateien und Daten Sets m ssen sich bei allen Arten von gespeicherten Daten unterscheiden m Wenn Sie die Objektwerte oder die transformierten Werte in der Arbeitsdatei speichern k nnen Sie die Anzahl der mehrfach nominalen Dimensionen angeben 65 Mehrfachkorrespondenzanalyse Abbildung 6 8 Dialogfeld Speichern Aca Speichern rDiskretisierte Daten Transformierte Variablen V Diskretisierte Daten erstellen v Transformierte Variablen in Arbeitsdatei speichern G Neues Daten Set erstellen V Transformierte Yariablen erstellen Daten Set Name disc_daten G Neues Daten Set erstellen Daten Set Name Neue Datendatei schreiben transformierte_vars Neue Datendatei schreiben Datei Objektwerte V Objektwerte in Arbeitsdatei speichern V Objektwerte erstellen G Neues Daten Set erstellen Daten Set Name objektwerte Neue Datendatei schreiben Mehrfach nominale Dimensionen 2 Alle Erste Weiter Abbrechen Hilfe Mehrfachkorrespondenzanalyse Objektdiagramme Im Dialogfeld Objektdiagramme k nnen Sie festlegen welche Diagramme und f r welche Variablen die Diagramme erstellt werden sollen 66 Kapitel 6 Abbildung 6 9 Dialogfeld Objektdiagramme MCA Ob
47. Die Transformationsdiagramme zeigen die urspr ngliche Kategorienummer auf den horizontalen Achsen an die vertikalen Achsen zeigen die optimalen Quantifizierungen 169 Kategoriale Hauptkomponentenanalyse Abbildung 10 32 Transformationsdiagramm f r die Menstruation Transformation Menstruation 104 Quantifizierungen oO o oO uo 1 t i o in I 104 IT OT 1 2 3 Kategorien Einige Variablen wie Menstruation Menstruation ergaben fast lineare Transformationen Daher k nnen Sie sie in dieser Analyse als numerisch interpretieren Abbildung 10 33 Transformationsdiagramm f r School employment record schulische berufliche Leistungen Transformation Schoollemployment record 1 0 o tn Quantifizierungen 6 un 1 0 1 2 3 Kategorien Die Quantifizierungen f r andere Variablen wie School employment record schulische berufliche Leistungen ergaben keine linearen Transformationen und sollten auf dem ordinalen Skalierungsniveau interpretiert werden Der Unterschied zwischen der zweiten und der dritten Kategorie ist wesentlich wichtiger als der Unterschied zwischen der ersten und der zweiten Kategorie Abbildung 10 34 Transformationsdiagramm f r Binge eating Fre attacken Transformation Binge eating 00 4 104 Quantifizierungen 1 2 3 4 Kategorien Ein interessanter Fall ergibt sich bei den Quantifizierungen f r Binge eating Fre attacken Die erzi
48. F Day of the year Abhangige Variable Daily ozone level Wichtigkeit Nach Vor Transfor Transfor mation mation Die Ma e f r die Wichtigkeit lassen zudem erkennen dass Temperature immer noch von gr erer Bedeutung f r die Regression ist als die anderen Variablen Als Ergebnis des Messniveaus mit ordinaler Skalierung f r Temperature und des positiven Regressionskoeffizienten k nnen Sie nun jedoch voraussetzen dass der vorhergesagte Ozonwert steigt sobald Temperature ansteigt 128 Kapitel 9 Abbildung 9 42 Transformationsdiagramm von Temperature ordinal 44 Quantifizierungen 1 3456 7 8 9 10 11 1213 14 15 16 17 18192021 22 23 24 25 23 77 28 239 3 3 2 3 3 35 8 y 3 Kategorien Das Transformationsdiagramm zeigt die ordinale Einschr nkung der Quantifikationen f r Temperature Die gezackte Linie aus der nominalen Transformationen ist hier durch eine glatte ansteigende Linie ersetzt Au erdem sind keine langen Plateaus mehr vorhanden Dies bedeutet dass eine Zusammenfassung der Kategorien nicht erforderlich ist Optimalit t der Quantifikationen Die transformierten Variablen aus einer kategorialen Regression k nnen bei einer linearen Regression im Standardverfahren genutzt werden dabei entstehen identische Ergebnisse Die Quantifikationen sind jedoch nur f r das Modell optimal mit dem sie erzeugt wurden Die Verwendung einer Untergruppe der Einflu gr en in einer linearen Regression
49. F J M Van Tuijl als auch J J Meulman 2000 Macro and micro goal setting In search of coherence Applied Psychology 49 579 595 De Leeuw J 1982 Nonlinear principal components analysis In COMPSTAT Proceedings in Computational Statistics Wien Physica Verlag 77 89 De Leeuw J 1984 Canonical analysis of categorical data 2nd Hg Leiden DSWO Press De Leeuw J 1984 The Gifi system of nonlinear multivariate analysis In Data Analysis and Informatics III E Diday et al Hg 415 424 De Leeuw J 1990 Multivariate analysis with optimal scaling In Progress in Multivariate Analysis S Das Gupta als auch J Sethuraman Hgg Kalkutta Indian Statistical Institute De Leeuw J als auch W J Heiser 1980 Multidimensional scaling with restrictions on the configuration In Multivariate Analysis Vol V P R Krishnaiah Hg Amsterdam North Holland 501 522 338 339 Bibliografie De Leeuw J als auch J Van Rijckevorsel 1980 HOMALS and PRINCALS Some generalizations of principal components analysis In Data Analysis and Informatics E Diday et al Hg Amsterdam North Holland 231 242 De Leeuw J F W Young als auch Y Takane 1976 Additive structure in qualitative data An alternating least squares method with optimal scaling features Psychometrika 41 471 503 Eckart C als auch G Young 1936 The approximation of one matrix by another one of lower rank Psychometrika 1 21
50. H 376 5 B 470 25 Pun gt Doppelklicken Sie dann zur Verbindung der Punkte auf das Diagramm und klicken Sie im Diagramm Editor auf das Tool zum Hinzuf gen von Interpolationslinien Schlie en Sie den Diagramm Editor Preoccupation with food and weight Besch ftigung mit Essen und Gewicht ist eine Variable die die Kernsymptome repr sentiert die allen vier Gruppen gemeinsam sind Anders als bei den Patienten mit atypischer E st rung weisen die anorektische Gruppe und die beiden bulimischen Gruppen sowohl am Anfang als auch am Ende sehr hnliche Niveaus auf 190 Kapitel 10 Empfohlene Literatur In folgenden Texten finden Sie weitere Informationen zur kategorialen Hauptkomponentenanalyse De Haas M J A Algera H F J M Van Tuijl als auch J J Meulman 2000 Macro and micro goal setting In search of coherence Applied Psychology 49 579 595 De Leeuw J 1982 Nonlinear principal components analysis In COMPSTAT Proceedings in Computational Statistics Wien Physica Verlag 77 89 Eckart C als auch G Young 1936 The approximation of one matrix by another one of lower rank Psychometrika 1 211 218 Gabriel K R 1971 The biplot graphic display of matrices with application to principal components analysis Biometrika 58 453 467 Gifi A 1985 PRINCALS Research Report UG 85 02 Leiden Department of Data Theory Universit t Leiden Gower J C als auch J J Meulman 1993 The trea
51. Kategoriale Hauptkomponenten Fehlende Werte k nnen Sie die Strategie f r die Verarbeitung von fehlenden Werten in den Analyse und Zusatzvariablen festlegen Abbildung 2 4 Dialogfeld Fehlende Werte Kategoriale Regression Fehlende Werte Strategie f r fehlende Werte Analysevariablen pref Modus vorschreiben package Ausschlie en brand Ausschlie en price Ausschlie en seal Ausschlie en money Ausschlie en Strategie C Objekte mit fehlenden verten f r diese Variable ausschlie en Fehlende Werte ersetzen G Modalwert Zusatzkategorie Weiter Abbrechen Hite Strategie Legen Sie fest ob Objekte mit fehlenden Werten ausgeschlossen werden sollen listenweiser Ausschluss oder ob fehlende Werte vorgeschrieben Aktivbehandlung m Objekte mit fehlenden Werten f r diese Variable ausschlie en Objekte mit fehlenden Werten f r die ausgew hlte Variable werden aus der Analyse ausgeschlossen Diese Strategie ist f r Zusatzvariablen nicht verf gbar Fehlende Werte ersetzen Fehlende Werte werden bei Objekten mit fehlenden Werten f r die ausgew hlte Variable gesetzt Sie k nnen die Methode ausw hlen nach der die Werte gesetzt werden W hlen Sie Modalwert wenn fehlende Werte durch die h ufigste Kategorie ersetzt werden sollen Falls mehrere Modalwerte vorhanden sind wird der Modalwert mit der kleinsten Kategorienummer verwendet Wenn Sie Zusatzkategori
52. Kombinationen ermitteln als kanonische Variablen bezeichnet bis zu einer Maximalzahl die der Anzahl der Variablen im kleineren Set entspricht Wenn in der Analyse zwei Variablen Sets vorliegen und alle Variablen als numerisch definiert sind entspricht die kanonische Korrelationsanalyse mit optimaler Skalierung einer kanonischen Standard Korrelationsanalyse SPSS beinhaltet zwar keine Prozedur f r die kanonische Korrelationsanalyse doch viele der relevanten Statistiken k nnen aus einer multivariaten Varianzanalyse gewonnen werden Die kanonische Korrelationsanalyse mit optimaler Skalierung bietet noch viele weitere Anwendungsm glichkeiten Bei zwei Variablen Sets von denen eines eine nominale Variable enth lt die als einfach nominal deklariert ist k nnen die Ergebnisse der kanonischen Korrelationsanalyse mit optimaler Skalierung hnlich wie die Ergebnisse einer Regressionsanalyse interpretiert werden Wenn Sie die Variable als mehrfach nominal betrachten ist die Analyse mit optimaler Skalierung eine Alternative zur Diskriminanzanalyse Durch die Gruppierung der Variablen in mehr als zwei Sets erhalten Sie eine Vielzahl von M glichkeiten zur Analyse der Daten Korrespondenzanalyse Ziel der Korrespondenzanalyse ist die Erstellung von Biplots f r Korrespondenztafeln In einer Korrespondenztafel wird davon ausgegangen dass die Zeilen und Spaltenvariablen ungeordnete Kategorien darstellen daher wird hier immer das nominale Messniveau de
53. M Zeilenpunkte Spaltenpunkte Breite f r Beschriftungen rLiniendiagramme Transformierte Zeilenkategorien Transformierte Spaltenkategorien eite f r Be riftunge Diagrammdimensionen Alle Dimensionen in der L sung anzeigen Anzahl der Dimensionen beschr nken W hlen Sie in der Gruppe Streudiagramme die Optionen Zeilenpunkte und Spaltenpunkte Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Korrespondenzanalyse auf OK Das Diagramm f r die Zeilenpunkte zeigt die ersten beiden Dimensionen f r die Zeilenpunkte und dazu den Zusatzpunkt f r National Average National Average liegt weit entfernt von Ursprung dies bedeutet dass die Stichprobe im Hinblick auf die Rauchgewohnheiten nicht als repr sentativ f r das Land gelten kann Die Gruppen Sekretariat und Angestellter mit Erfahrung befinden sich nahe am Landesdurchschnitt im Gegensatz zur Gruppe Junior 233 Korrespondenzanalyse Manager Sekretariatsangeh rige sowie Angestellte mit Erfahrung zeigen demnach hnliche Rauchgewohnheiten wie der Landesdurchschnitt Junior Manager dagegen nicht Abbildung 12 20 Zeilenpunkte Prinzipal Normalisierung 03 Junior Manager Senior Manager 024 014 Dimension 2 Angestellter mit Erf 0049 Angestellter ohne Er Sekretariat Dimension 1 Das Diagramm f r die Spaltenpunkte zeigt den Spaltenraum mi
54. Mitte Die Streuung der Kategorien ist im Vergleich zur bisherigen ordinalen Behandlung deutlich besser Abbildung 11 31 Zentroide und projizierte Zentroide f r Age in years nominal 10 ZZ Zentroide 66 70 O Projektiert on 5 prec B870 O Tats chlich 054 61 65 0 0 N c a 2 054 w E a 1044 154 2 0 1 0 0 5 0 0 0 5 1 0 1 5 2 0 Dimension 1 214 Kapitel 11 Das Diagramm mit den Zentroiden erm glicht nun die Interpretation der niedrigeren Altersgruppen Au erdem sind die Kategorien Volkskrant und NRC weiter voneinander entfernt als in der bisherigen Analyse so wird eine separate Interpretation dieser Elemente m glich Die Gruppen im Alter von 26 und 45 lesen den Volkskrant und leben gern auf dem Land Die Altersgruppen 20 25 und 56 60 lesen NRC wobei die j ngere Gruppe bevorzugt in der Stadt lebt und die ltere Gruppe lieber auf dem Land Die Gruppen mit dem h chsten Alter lesen den Telegraaf und wohnen gern in einem Dorf Die Interpretation der anderen Richtung Music preferred Marital status und Pets owned ist im Vergleich zur vorangegangenen Analyse praktisch unver ndert Der einzige offensichtliche Unterschied ist dass Personen mit dem Familienstand Marital Status Other entweder eine Katze halten oder gar kein Haustier besitzen Abbildung 11 32 Zentroide mit Variablen beschriftet Alter nominal O Age in years O Marital status Pets owned Village O Newspaper read 66 7
55. Objekte nach Variable beschriftet werden sollen gt W hlen Sie time und diag als die Variablen aus nach denen die Objekte beschriftet werden sollen gt Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Kategoriale Hauptkomponenten auf Kategorie 167 vv v vy y Kategoriale Hauptkomponentenanalyse Abbildung 10 30 Dialogfeld Kategoriendiagramme nponen en Kategorien agramme Kategoriendiagramme verbundene Kategoriendiagramme rTransformationsdiagramme Dimensionen f r mehrfach nominal E Residuen Diagramme einschlie en rZentroide projizieren von Fordern Sie Kategoriendiagramme f r tidi an Fordern Sie Transformationsdiagramme f r weight bis body an Wahlen Sie aus dass die Zentroide von tidi auf binge satt und preo projiziert werden sollen Klicken Sie auf Weiter Klicken Sie im Dialogfeld Kategoriale Hauptkomponenten auf OK Die Prozedur ergibt Werte f r die Subjekte mit Mittelwert 0 und Einheitsvarianz und Quantifizierungen der Kategorien die die mittlere quadrierte Korrelation der Subjektwerte und der transformierten Variablen maximieren Bei der vorliegenden Analyse wurden die Kategoriequantifikationen eingeschr nkt sodass sie die ordinalen Informationen widerspiegeln 168 Kapitel 10 gt gt Schlie lich m ssen Sie die OMS Anforderung beenden um die Informationen aus der Tabelle der projizierten Zentroide in
56. Preises kann der Hersteller dann feststellen welche Variablen f r die Produktwahrnehmung durch die Verbraucher wichtig sind und das Image des Produkts entsprechend ndern Statistiken und Diagramme Iterationsprotokoll Stressma e Stress Zerlegung Koordinaten des gemeinsamen Raums Objektdistanzen innerhalb der endg ltigen Konfiguration individuelle Raumgewichtungen individuelle R ume transformierte hnlichkeiten transformierte unabh ngige Variablen Stress Diagramme Streudiagramme des gemeinsamen Raums Streudiagramme der individuellen Raumgewichtungen Streudiagramme des individuellen Raums Transformationsdiagramme Shepard Residuen Diagramme und Transformationsdiagramme f r unabh ngige Variablen Daten Daten k nnen in Form von Distanz Matrizen oder Variablen die in Distanz Matrizen umgewandelt werden bereitgestellt werden Die Matrizen k nnen in einer Spalte oder ber mehrere Spalten formatiert sein Die hnlichkeiten k nnen auf dem Skalierungsniveau der Verh ltnisskala Intervallskala Ordinalskala oder Spline Skala behandelt werden Annahmen Es m ssen mindestens drei Variablen angegeben werden Die Anzahl der Dimensionen darf die Anzahl der Objekte minus 1 nicht bersteigen Bei der Kombination mit mehreren Zufallsstarts wird die Dimensionsreduktion ausgelassen Wenn nur eine Quelle angegeben ist sind alle Modelle quivalent zum Identit tsmodell In diesem Fall wird f r die Analyse standardm ig das Identit
57. Prozedur werden die quadrierten Abweichungen zwischen den urspr nglichen ggf transformierten Objekt hnlichkeiten und den zugeh rigen Euklidischen Distanzen im flachdimensionierten Raum minimiert Der flachdimensionierte Raum hat die Aufgabe die Beziehungen zwischen den Objekten offenzulegen Wenn Sie die L sung so einschr nken dass nur eine lineare Kombination unabh ngiger Variablen zul ssig ist k nnen Sie die Dimensionen der L sungen im Hinblick auf diese Variablen interpretieren Im nachfolgenden Beispiel sehen Sie wie 15 verschiedene Bezeichnungen des Verwandtschaftsgrades in drei Dimensionen dargestellt werden k nnen und wie dieser Raum im Hinblick auf das Geschlecht die Generation und den Trennungsgrad dieser Bezeichnungen interpretiert werden kann Beispiel Untersuchung von Bezeichnungen des Verwandtschaftsgrades Rosenberg und Kim Rosenberg als auch Kim 1975 haben 15 Bezeichnungen f r den Verwandtschaftsgrad untersucht Tante Bruder Cousin Tochter Vater Enkelin Gro vater Gro mutter Enkel Mutter Neffe Nichte Schwester Sohn Onkel Die beiden Analytiker baten vier Gruppen von College Studenten zwei weibliche und zwei m nnliche Gruppen diese Bezeichnungen auf der Grundlage der hnlichkeiten zu sortieren Zwei Gruppen eine weibliche und eine m nnliche Gruppe wurden gebeten die Bezeichnungen zweimal zu sortieren die zweite Sortierung sollte dabei nach anderen Kriterien erfolgen als die erste So wurden
58. Prozeduren k nnen die Daten mit verschiedenen Messniveaus der optimalen Skalierung analysiert werden Mit multidimensionaler Skalierung und multidimensionaler Entfaltung werden Beziehungen zwischen Objekten in einem Raum mit wenigen Dimensionen anhand der hnlichkeiten zwischen den Objekten beschrieben Es folgen kurze Richtlinien f r die einzelnen Prozeduren m Verwenden Sie die kategoriale Regression um die Werte einer abh ngigen kategorialen Variablen aus einer Kombination unabh ngiger kategorialer Variablen vorherzusagen m Verwenden Sie die kategoriale Hauptkomponentenanalyse um Variationsmuster in einem einzelnen Set von Variablen mit gemischten Messniveaus der optimalen Skalierung zu ber cksichtigen m Verwenden Sie die nichtlineare kanonische Korrelationsanalyse um zu bewerten wie stark zwei oder mehr Sets von Variablen mit gemischten Messniveaus der optimalen Skalierung korrelieren m Verwenden Sie die Korrespondenzanalyse um zweidimensionale Kontingenztafeln oder Daten zu analysieren die als zweidimensionale Tabelle ausgedr ckt werden k nnen beispielsweise Daten zur bevorzugten Marke oder zur soziometrischen Wahl m Verwenden Sie die Mehrfachkorrespondenzanalyse zur Analyse einer Matrix mit kategorialen multivariaten Daten wenn Sie von keiner st rkeren Annahme ausgehen m chten als von der dass alle Variablen auf dem nominalen Niveau analysiert werden m Verwenden Sie die multidimensionale Skalierung zur Analyse
59. Raumgewichtungen in Multidimensionale Entfaltung 91 in Multidimensionale Skalierung 81 Diagramme mit projizierten Zentroiden in der Kategorialen Hauptkomponentenanalyse 37 Dimensionen in der Korrespondenzanalyse 50 238 Dimensionsgewichtungen in Multidimensionale Entfaltung 304 311 Diskretisierung bei der Mehrfachkorrespondenzanalyse 59 in der Kategorialen Hauptkomponentenanalyse 29 in Kategoriale Regression 19 Diskriminationsma Diagramme bei der Mehrfachkorrespondenzanalyse 66 Diskriminationsma e bei der Mehrfachkorrespondenzanalyse 63 260 Distanzen in Multidimensionale Entfaltung 93 in Multidimensionale Skalierung 83 Distanzma e in der Korrespondenzanalyse 50 Drei fach Entfaltung in Multidimensionale Entfaltung 297 Eigenwerte in der Kategorialen Hauptkomponentenanalyse 147 153 170 in Nichtlineare kanonische Korrelationsanalyse 200 Einschr nkungen in Multidimensionale Skalierung 78 Einschr nkungen im gemeinsamen Raum in Multidimensionale Entfaltung 88 Endg ltige Diagramme des gemeinsamen Raums in Multidimensionale Entfaltung 91 Fehlende Werte bei der Mehrfachkorrespondenzanalyse 60 in der Kategorialen Hauptkomponentenanalyse 30 in Kategoriale Regression 20 Gelockerte Aktualisierungen in Multidimensionale Skalierung 79 Gemeinsame Raumkoordinaten in Multidimensionale Entfaltung 93 in Multidimensionale Skalierung 83 Gemeinsamer Rau
60. Regression wird die hnlichkeit der transformierten Responsevariablen und der gewichteten Kombination transformierter Einflu variablen unmittelbar bewertet Beziehung zu Standardverfahren Beim Standardverfahren der linearen Regression k nnen kategoriale Variablen entweder als Indikatorvariablen umkodiert oder genauso wie Variablen auf Intervallniveau behandelt werden Beim ersten Ansatz enth lt das Modell eine gesonderte Konstante und Steigung f r die einzelnen Niveaukombinationen f r die kategorialen Variablen Dies f hrt zu einer gro en Anzahl zu interpretierender Parameter Im zweiten Ansatz wird f r jede Variable nur ein einziger Parameter gesch tzt Durch die willk rliche Festlegung der Kategoriekodierungen werden jedoch Verallgemeinerungen unm glich Wenn einige Variablen nicht stetig sind stehen alternative Analysen zur Verf gung Bei stetiger Responsevariabler und kategorialen Einflu variablen wird h ufig eine Varianzanalyse durchgef hrt Bei kategorialer Responsevariabler und stetigen Einflu variablen kann eine logistische Regression oder eine Diskriminanzanalyse angemessen sein Wenn sowohl die Responsevariable als auch die Einflu variablen kategorial sind werden h ufig loglineare Modelle verwendet Die Regression mit optimaler Skalierung bietet drei Messniveaus f r die Skalierung der einzelnen Variablen Durch Kombinationen dieser Niveaus kann eine gro e Bandbreite an nichtlinearen Beziehungen behandelt werden f r
61. Triplots k nnen auf allen Variablen oder einer Teilmenge der Variablen basieren Objekte beschriften Objekte k nnen mit den Kategorien ausgew hlter Variablen im Dialogfeld Kategoriale Hauptkomponenten Optionen k nnen Sie Kategorienummern oder Wertelabels w hlen oder den Fallnummern beschriftet werden Wenn Variable ausgew hlt ist wird pro Variable ein Diagramm erstellt 37 Kategoriale Hauptkomponentenanalyse CATPCA Kategoriale Hauptkomponenten Kategoriendiagramme Im Dialogfeld Kategoriale Hauptkomponenten Kategoriendiagramme k nnen Sie festlegen welche Diagramme und f r welche Variablen die Diagramme erstellt werden sollen Abbildung 3 10 Dialogfeld Kategoriendiagramme Kategoriale Hauptkomponenten Kategoriendiagramme X Kategoriendiagramme Verbundene Kategoriendiagramme rTransformationsdiagramme Dimensionen f r mehrfach nominal _ Residuen Diagramme einschlie en rZentroide projizieren von Kategoriendiagramme F r jede ausgew hlte Variable wird ein Diagramm mit Zentroid und Vektorkoordinaten erstellt Bei Variablen mit mehrfach nominalem Skalierungsniveau befinden sich die Kategorien in den Zentroiden der Objekte in der jeweiligen Kategorie Bei allen anderen Skalierungsniveaus befinden sich die Kategorien auf einem Vektor der durch den Koordinatenursprung verl uft Verbundene Kategoriendiagramme Hierbei handelt es sich um ein einzelnes D
62. Variablen die Option Transformierte Variablen in Arbeitsdatei speichern aus Klicken Sie auf Weiter Klicken Sie im Dialogfeld Kategoriale Regression auf OK Abbildung 9 39 Modellzusammenfassung f r die Regression mit Temperature ordinal Korrigiertes R Quadrat R Quadrat Abh ngige Variable Daily ozone level Einflu yariablen Inversion base height Pressure gradient mm Hg Visibility miles Temperature degrees F Day of the year Dieses Modell ergibt einen Wert von 0 875 fiir R2 Die beriicksichtigte Varianz fallt daher geringf gig ab wenn die Quantifikationen f r Temperature in eine Reihenfolge gebracht werden 127 Abbildung 9 40 Regressionskoeffizienten mit Temperature ordinal Koeffizienten Pad Beta ehler df Inversion base height Pressure gradient mm Hg Visibility miles Temperature degrees F Day of the year Abhangige Variable Daily ozone level 132 628 111 757 72 360 517 262 173 158 Kategoriale Regression Diese Tabelle zeigt die Koeffizienten f r das Modell in dem Temperature als ordinal skaliert wurde Der Vergleich der Koeffizienten mit den Koeffizienten im Modell bei denen Temperature als nominal skaliert ist zeigt keine weitreichenden Ver nderungen Abbildung 9 41 Korrelationen Wichtigkeit und Toleranz Korrelationen Nullte Ordnung Partiell Inversion base height Pressure gradient mm Hg Visibility miles Temperature degrees
63. Variablen Sets maximiert sondern die Sets werden mit einem unbekannten durch die Objektwerte definierten Kompromiss Set verglichen Beispiel Mit der kategorialen kanonischen Korrelationsanalyse mit optimaler Skalierung kann die Beziehung zwischen zwei Variablen Sets grafisch dargestellt werden von denen das eine die Berufsgruppe und die Ausbildungsdauer in Jahren und das andere die Region des Wohnsitzes und das Geschlecht enth lt Die Analyse k nnte beispielsweise ergeben dass die Ausbildungsdauer und der Wohnsitz einen h heren Erkl rungswert haben als die brigen Variablen Au erdem k nnten Sie herausfinden dass der Erkl rungswert der Ausbildungsdauer in Jahren in der ersten Dimension am h chsten ist Statistiken und Diagramme H ufigkeiten Zentroide Iterationsprotokoll Objektwerte Kategorienquantifikationen Gewichtungen Komponentenladungen einfache und mehrfache Anpassung Diagramme der Objektwerte Diagramme der Kategorienkoordinaten Diagramme der Komponentenladungen Diagramme der Kategorienzentroide Transformationsdiagramme Daten Verwenden Sie zum Kodieren von kategorialen Variablen ganze Zahlen nominales oder ordinales Skalierungsniveau Um die Ausgabe zu minimieren verwenden Sie zum Kodieren jeder Variablen aufeinander folgende ganze Zahlen mit 1 beginnend Variablen die auf numerischem Niveau skaliert sind d rfen nicht in aufeinander folgende ganze Zahlen umkodiert werden Um die Ausgabe zu minimieren subtrahi
64. Variablen verwendet Die Variablen die angepa t werden m ssen als Analysevariablen ausgew hlt werden Da die Konfiguration aber fest ist werden Sie als Zusatzvariablen verarbeitet und m ssen deshalb nicht als Zusatzvariablen ausgew hlt werden Kategoriale Hauptkomponenten Ausgabe Im Dialogfeld Kategoriale Hauptkomponenten Ausgabe k nnen Sie festlegen dass Tabellen f r Objektwerte Komponentenladungen das Iterationsprotokoll Korrelationen der urspr nglichen und transformierten Variablen ber cksichtigte Varianz pro Variable und 34 Kapitel 3 Dimension Kategorienquantifikationen f r ausgew hlte Variablen und deskriptive Statistiken f r ausgew hlte Variablen erstellt werden sollen Abbildung 3 7 Dialogfeld Ausgabe Kategoriale Hauptkomponenten Ausgabe X Tabellen V Objektwerte C Korrelationen der Originalvariablen V Komponentenladungen V Korrelationen der transformierten Variablen C terationsprotokoll C Yarianz ber cksichtigt f r Quantifizierte Variablen Kategorienquantifikationen purge hyper Ee fami eman frie Deskriptive Statistik school satt sbeh 3 mood preo body Optionen f r Objektwerte Diese Kategorien ber cksichtigen Beschriftungsvariablen Objektwerte beschriften nach Abbrechen Hilfe Objektwerte Hiermit werden die Objektwerte angezeigt Die folgenden Optionen sind v
65. Verwenden Sie diese Methode wenn Sie die Distanzen zwischen den Zeilenpunkten und die Distanzen zwischen den Spaltenpunkten ermitteln m chten sofern der Zusammenhang zwischen den Zeilen und Spaltenpunkten dabei nicht relevant ist Biplots sind f r diese Normalisierungsoption nicht geeignet und stehen daher auch nicht zur Verf gung wenn Sie die Prinzipal Normalisierungsmethode ausw hlen 218 Kapitel 12 Beispiel Rauchgewohnheit nach Berufskategorie Das Ziel der Korrespondenzanalyse ist es die Beziehungen zwischen den Zeilen und Spalten einer Korrespondenztabelle aufzuzeigen Die grundlegenden Konzepte werden anhand einer von Greenacre Greenacre 1984 vorgestellten hypothetischen Tabelle erl utert Diese Informationen finden Sie in der Datei smoking sav F r weitere Informationen siehe Beispieldateien in Anhang A auf S 326 Die relevante Tabelle wird durch eine Kreuztabelle der Rauchgewohnheiten und der Berufskategorie gebildet Die Variable Berufsgruppe enth lt die Berufskategorien Senior Manager Junior Manager Angestellter mit Erfahrung Angestellter ohne Erfahrung und Sekretariat die bei der Bildung der L sung herangezogen werden au erdem die Kategorie National Average die als Erg nzung der Analyse dienen kann Die Variable Rauchen enth lt die Rauchgewohnheiten Nichtraucher Leicht Mittel und Stark die bei der Bildung der L sung herangezogen werden au erdem die Kategorien No Alcohol und Alcohol die als Erg nzun
66. W hlen Sie im Gruppenfeld Messniveau der optimalen Skalierung die Option Ordinal Klicken Sie auf Weiter gt Wahlen Sie im Dialogfeld Kategoriale Hauptkomponenten die Variable Cluster als Beschriftungsvariable aus Klicken Sie auf Ausgabe 145 Kategoriale Hauptkomponentenanalyse Abbildung 10 4 Dialogfeld Ausgabe Tabellen V Objektwerte C Korrelationen der Originalvariablen V Komponentenladungen _ Korrelationen der transformierten Variablen C terstionsprotokoll C Yarianz ber cksichtigt f r Quantifizierte Variablen Kategorienquantitikationen Deskriptive Statistik Optionen f r Objektwerte Diese Kategorien ber cksichtigen Beschriftungsvariablen cluster Objektwerte beschriften nach antreten nenn W hlen Sie im Gruppenfeld Tabellen die Option Objektwerte und heben Sie die Auswahl von Korrelationen der transformierten Variablen auf Aktivieren Sie die Erstellung von Kategoriequantifikationen f r intensit Intensit t bis formal Formalit t Wahlen Sie Objektwerte beschriften nach cluster Klicken Sie auf Weiter Klicken Sie im Gruppenfeld Diagramme des Dialogfelds Kategoriale Hauptkomponenten auf Objekt 146 Kapitel 10 Abbildung 10 5 Dialogfeld Objekt und Variablendiagramme Kategoriale Hauptkomponenten Objekt und Variablendiagramme X rDiagramme V Objektpunkte V Ob
67. Zeilenr nder angeglichen Spaltensummen werden angeglichen und Mittelwerte entfernt Vor dem Zentrieren der Spalten werden die Spaltenr nder angeglichen Normalisierungsmethode W hlen Sie eine der folgenden Optionen Symmetrisch F r jede Dimension sind die Zeilenwerte der gewichtete Durchschnitt der Spaltenwerte geteilt durch den entsprechenden Singul rwert und die Spaltenwerte sind der gewichtete Durchschnitt der Zeilenwerte geteilt durch den entsprechenden Singul rwert Verwenden Sie diese Methode wenn Sie die Unterschiede oder hnlichkeiten zwischen Kategorien der beiden Variablen untersuchen m chten Prinzipal Die Distanzen zwischen Zeilenpunkten und Spaltenpunkten sind Approximationen der Distanzen in der Korrespondenztabelle entsprechend dem gew hlten Distanzma Verwenden Sie diese Methode wenn Sie die Unterschiede zwischen Kategorien einer oder in beiden Variablen anstelle der Unterschiede zwischen den beiden Variablen untersuchen m chten Zeilenprinzipal Die Distanzen zwischen Zeilenpunkten sind Approximationen der Distanzen in der Korrespondenztabelle entsprechend dem gew hlten Distanzma Die Zeilenwerte entsprechen dem gewichteten Durchschnitt der Spaltenwerte Verwenden Sie diese Methode wenn Sie die Unterschiede oder hnlichkeiten zwischen Kategorien der Zeilenvariable untersuchen m chten Spaltenprinzipal Die Distanzen zwischen Spaltenpunkten sind Approximationen der Distanzen in der Korrespondenztabelle
68. Zentroide einschlie en gt Weiter Abbrechen Komponentenladungen anzeigen Bei Auswahl dieser Option wird ein Diagramm der Komponentenladungen angezeigt Ladungsvariablen Das Komponentenladungsdiagramm kann auf allen Variablen oder einer Teilmenge der Variablen basieren Zentroide einschlie en Bei Variablen mit mehrfach nominalem Skalierungsniveau sind keine Komponentenladungen vorhanden Bei diesen Variablen k nnen jedoch die Zentroide in das Diagramm aufgenommen werden Sie k nnen alle mehrfach nominalen Variablen verwenden oder eine Teilmenge ausw hlen 39 Kategoriale Hauptkomponentenanalyse CATPCA Zus tzliche Funktionen beim Befehl CATPCA Sie k nnen die kategoriale Hauptkomponentenanalyse an Ihre Bed rfnisse anpassen indem Sie Ihre Auswahl in ein Syntax Fenster einf gen und die daraus resultierende Befehlssyntax f r CATPCA bearbeiten Mit der Befehlssyntax Sprache verf gen Sie au erdem ber folgende M glichkeiten m Mit dem Unterbefehl SAVE k nnen Sie Stammnamen f r die transformierten Variablen Objektwerte und Approximationen festlegen wenn Sie diese in der Arbeitsdatei speichern m Mit dem Unterbefehl PLOT kann die H chstl nge f r Beschriftungen f r jedes Diagramm getrennt festgelegt werden m Mit dem Unterbefehl PLOT kann eine separate Variablenliste f r Residuen Diagramme festgelegt werden Vollst ndige Informationen zur Syntax finden Sie in der Com
69. auf den gewichteten Mittelwert f r das Zeilen oder Spaltenprofil Der Zeilenzentroid ist der Mittelwert f r das Zeilenprofil Punkte mit einer gro en Masse z B Angestellte ohne Erfahrung ziehen den Zentroid st rker an ihre Position Bei Punkten mit einer kleinen Masse z B Senior Manager wird der Zeilen Zentroid entsprechend nur geringf gig zur Position gezogen Anders gesagt Je gr er die Differenz zwischen den Zeilenprofilen ist desto gr er ist die Distanz zwischen den Punkten im Diagramm Wenn Sie beispielsweise die Zeilenprinzipal Normalisierung verwenden sind bei der endg ltigen Konfiguration die Euklidischen Distanzen zwischen den Zeilenpunkten im volldimensionierten Raum gleich den Chi Quadrat Distanzen zwischen den Zeilen in der Korrespondenztabelle In einem reduzierten Raum n hern sich die Euklidischen Distanzen den Chi Quadrat Distanzen Die Chi Quadrat Distanzen bestehen wiederum aus gewichteten Profildistanzen Diese gewichteten Distanzen beruhen auf der Masse 225 Korrespondenzanalyse Bei der Spaltenprinzipal Normalisierung sind die Euklidischen Distanzen zwischen den Spaltenpunkten im volldimensionierten Raum gleich den Chi Quadrat Distanzen zwischen den Spalten der Korrespondenztabelle Beachten Sie jedoch dass diese Werte bei symmetrischer Normalisierung nicht gleich sind Die Gesamttr gheit ist definiert als die gewichtete Summe aller quadrierten Distanzen zum Ursprung dividiert durch die Summe ber a
70. bis shout angegeben Mit der Variablen rowid werden die Zeilen identifiziert Der Unterbefehl INITIAL gibt an dass die Startwerte aus der Datei behavior_ini sav entnommen werden sollen Die Zeilen und Spaltenkoordinaten sind gestapelt wobei die Spaltenkoordinaten auf die Zeilenkoordinaten folgen Der Unterbefehl CONDITION gibt an dass alle hnlichkeiten miteinander verglichen werden k nnen Dies trifft auf die vorliegende Analyse zu da es m glich sein sollte die hnlichkeiten zwischen dem Laufen in einem Park und dem Laufen in einer Kirche zu vergleichen und zu erkennen dass das eine Verhalten als angemessener als das andere angesehen wird Der Unterbefehl TRANSFORMATION gibt eine lineare Transformation der hnlichkeiten mit einem konstanten Term an Diese Methode ist geeignet wenn ein Unterschied zwischen den hnlichkeiten von 1 Punkt im gesamten Bereich der 10 Punkte Skala quivalent ist Wenn die Lernende ihre Werte so vergeben haben dass der Unterschied zwischen 0 und 1 dem Unterschied zwischen 5 und 6 entspricht ist eine lineare Transformation daher geeignet Mit dem Unterbefehl PLOT werden Diagramme des gemeinsamen Raums und Transformationsdiagramme angefordert F r alle anderen Parameter gelten die Standardwerte 319 Ma e Abbildung 15 28 Ma e lterationen Endg ltiger Funktionswert Wertteile der Funktion Fehlende Anpassung G te der Anpassung Variationskoeffizienten Indizes f r Degenerati
71. den Koordinatenursprung plaziert Die resultierende Transformation ist besser angepa t aber weniger glatt als bei Spline nominal Numerisch Die Kategorien werden als geordnet mit gleichen Abst nden behandelt Intervallniveau Die Reihenfolge der Kategorien und die gleichen Abst nde zwischen den Kategorienummern in der beobachteten Variablenbleiben in der optimal skalierten Variablen erhalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch den Koordinatenursprung plaziert Wenn alle Variablen auf numerischem Niveau skaliert sind entspricht die Analyse der normalen Hauptkomponentenanalyse 19 Kategoriale Regression CATREG Kategoriale Regression Diskretisierung Im Dialogfeld Kategoriale Hauptkomponenten Diskretisierung k nnen Sie eine Methode zum Umkodieren der Variablen festlegen Sofern nicht anders angegeben werden Variablen mit Dezimalwerten in sieben Kategorien gruppiert die nahezu normalverteilt sind Wenn die Variable weniger als sieben unterschiedliche Werte aufweist entspricht die Anzahl der Kategorien der Anzahl der unterschiedlichen Werte Werte von String Variablen werden immer in positive ganze Zahlen umgewandelt indem in aufsteigender alphanumerischer Reihenfolge Kategorienummern zugewiesen werden Die Diskretisierung von String Variablen erfolgt anhand dieser Ganzzahlen Andere Variablen werden in der Standardeinstellung nicht modifiziert Die diskretisierten Variablen werde
72. den Zeilen und den Spaltenvariablen besteht d h wenn der Chi Quadrat Wert signifikant ist kann die Korrespondenzanalyse die Ermittlung der Art dieser Beziehung erleichtern Mehrfachkorrespondenzanalyse Bei der Mehrfachkorrespondenzanalyse wird versucht eine L sung zu erstellen bei der Objekte innerhalb derselben Kategorie eng zusammen und Objekte in verschiedenen Kategorien in gro em Abstand zueinander geplottet werden Jedes Objekt liegt so nah wie m glich an den Kategoriepunkten der Kategorien die f r dieses Objekt gelten So unterteilen die Kategorien die Objekte in homogene Untergruppen Variablen werden als homogen betrachtet wenn sie Objekte die in denselben Kategorien vorliegen auch in dieselben Untergruppen einordnen Bei einer eindimensionalen L sung weist die Mehrfachkorrespondenzanalyse jeder Kategorie jeder Variablen optimale Skalenwerte Kategoriequantifikationen zu dergestalt dass die Kategorien insgesamt im Durchschnitt die maximale Streubreite aufweisen Bei einer zweidimensionalen L sung ermittelt die Mehrfachkorrespondenzanalyse ein zweites Set von Quantifizierungen der Kategorien jeder Variablen das nicht mit dem ersten Set in Zusammenhang steht wobei wieder versucht wird die Streubreite zu maximieren usw Da die Kategorien einer Variablen so viele Bewertungen erhalten wie Dimensionen vorhanden sind wird davon ausgegangen dass die Variablen in der Analyse auf dem Messniveau der optimalen Skalierung mehrfac
73. der Dimension zum Ursprung Ob diese Feststellung jedoch f r Zeilen oder Spaltenwerte gilt oder f r beide Werte ist abh ngig von der verwendeten Normalisierungsmethode Jeder Zeilen und Spaltenpunkt tr gt zur Tr gheit bei Zeilen und Spaltenpunkte die betr chtlich zur Tr gheit einer Dimension beitragen sind f r diese Dimension wichtig Der Beitrag eines Punkts zur Tr gheit einer Dimension entspricht der gewichteten quadrierten Distanz vom projizierten Punkt auf den Ursprung dividiert durch die Tr gheit der Dimension Die Diagnose mit der die Beitr ge der Punkte gemessen wird ist eine wichtige Hilfe bei der Interpretation einer Korrespondenzanalysenl sung Dominante Punkte in der L sung sind leicht erkennbar Beispiel Die Angestellten mit und ohne Erfahrung tragen 84 der Tr gheit bei und bilden somit dominante Punkte in der ersten Dimension Keiner der Spaltenpunkte tr gt 65 der Tr gheit allein in der ersten Dimension bei Der Beitrag eines Punkts zur Tr gheit der Dimensionen ist abh ngig von der Masse und von der Distanz zum Ursprung Punkte die eine gro e Entfernung zum Ursprung und eine gro e Masse aufweisen tragen den gr ten Teil zur Tr gheit der Dimension bei Zusatzpunkte spielen keine Rolle bei der Definition der L sung und tragen somit auch nicht zur Tr gheit der Dimensionen bei Neben dem Beitrag der Punkte zur Tr gheit pro Dimension k nnen Sie den Beitrag der Dimensionen zur Tr gheit pro Punkt unters
74. die Anzahl der Dimensionen eine ber dem Maximalwert liegende Zahl angeben wird in jedem Fall der Maximalwert verwendet Verwandte Prozeduren Falls Sie mit mehr als zwei Variablen arbeiten verwenden Sie die Mehrfachkorrespondenzanalyse Wenn die Variablen ordinal skaliert werden sollen verwenden Sie die kategoriale Hauptkomponentenanalyse So lassen Sie eine Korrespondenzanalyse berechnen W hlen Sie die folgenden Befehle aus den Men s aus Analysieren Dimensionsreduktion Korrespondenzanalyse Abbildung 5 1 Dialogfeld Korrespondenzanalyse Korrespondenzanalyse 7 Zeile Modell ofl Rauchgewohnhet rauchen ketea SSS O ai Anzahl anzahl Bereich definieren SEU re Spalte Zur cksetzen Abbrechen W hlen Sie eine Zeilenvariable aus W hlen Sie eine Spaltenvariable aus Definieren Sie die Bereiche f r die Variablen Klicken Sie auf OK 49 Korrespondenzanalyse Definieren des Zeilenbereichs bei der Korrespondenzanalyse Sie m ssen einen Bereich f r die Zeilenvariable angeben Die angegebenen Minimal und Maximalwerte m ssen ganzzahlig sein Gebrochene Datenwerte werden in der Analyse abgeschnitten Ein Kategoriewert der au erhalb des angegebenen Bereiches liegt wird in der Analyse ignoriert Abbildung 5 2 Dialogfeld Zeilenbereich definieren E Korrespondenzanalyse Zeilenbereich definieren x Kategorienberei
75. die Datei projected_centroids sav zu schreiben Rufen Sie die OMS Systemsteuerung erneut auf Abbildung 10 31 Systemsteuerung des Ausgabeverwaltungssystems a Ausgabeverwaltungssystem OMS Bedienfeld X Anforderungen Beschriftungen CATPCA PROJECTED n CENTROIDS 1 Alle beenden Protokollierung Neue Anforderung Um eine Anforderung hinzuzuf gen w hlen Sie mindestens einen Eintrag aus den unten stehenden Listen sowie alle Hinzuf ge sonstigen gew nschten Eigenschaften aus und klicken Sie auf Hinzuf gen Unter Tabellenuntertypen werden nur Untertypen angezeigt die f r mindestens eine der ausgew hlten Prozeduren verf gbar sind Optionen Ausgabetypen Befehls IDs Tabellenuntertypen f r ausgew hlte Befehle Ausgabeziele Diagramme ARIMA Agglomeration Schedule Keine Protokolle Autoregression Els a re E O Datei Durchsuchen Tabellen Case Plot Analysis of Dispersion B _ Texte Cases to Variables namaly Case Index List Basierend auf Objektnamen berschriften CATPCA Anomaly Case PeerlD List Ordner Warnungen Catreg Anomaly Case Reason List Baume CCF oa EISEN Summary Neues Daten Set cD ANON z C Aus Viewer ausschlie en Durchsuchen ID Einf gen Zur cksetzen Abbrechen Hilfe Klicken Sie auf Beenden Klicken Sie auf OK und dann zur Best tigung noch einmal auf OK Transformationsdiagramme
76. die Mehrfachkorrespondenzanalyse funktioniert verwenden Sie Daten aus Hartigan Hartigan 1975 die Sie in der Datei screws sav finden F r weitere Informationen siehe Beispieldateien in Anhang A auf S 326 Dieses Daten Set enth lt Informationen zu den Eigenschaften von Schrauben Bolzen Muttern und Rei n geln Die folgende Tabelle zeigt die Variablen mit den zugeh rigen Variablenlabels und den Wertelabels die den Kategorien jeder Variablen im Daten Set f r Eisenwaren von Hartigan zugeordnet sind Tabelle 13 1 Daten Set f r Eisenwaren von Hartigan Variablenname Variablenlabel Wertelabels gewinde Gewinde Ja Nein kopf Head form Kopfform flach konisch rund gew lbt zylinderf rmig kerbe Einkerbung des Schlitz keine Kreuz Kopfes form Grundform flach scharf l nge L nge in cm 0 5 cm 1 cm 1 5 cm 2 cm 2 5 cm messing Messing Nein Ja object Objekt Rei nagel Nagell Nagel2 Nagel3 Nagel4 Nagel5 Nagel6 Nagel7 Nagel8 Schraubel Schraube2 Schraube3 Schraube4 Schraube Bolzen Bolzen2 Bolzen3 Bolzen4 Bolzen5 Bolzen6 Nagell nagel2 Nagelb Schraubeb 254 255 Durchf hrung der Analyse Mehrfachkorrespondenzanalyse gt Zum Erstellen einer Mehrfachkorrespondenzanalyse w hlen Sie die folgenden Befehle aus den Men s aus Analysieren Dimensionsreduktion Optimale Skalierung Abbildung 13 1 Dialogfeld Optimale Skalierung i Optimale Skali
77. eine hypothetische Datendatei bei der es um die Bem hungen einer Versicherungsgruppe geht vier verschiedene Pl ne zur Gesundheitsvorsorge f r Kleinbetriebe zu evaluieren Zw lf Inhaber von Kleinbetrieben Arbeitgeber wurden gebeten die Pl ne danach in eine Rangfolge zu bringen wie gern sie sie ihren Mitarbeitern anbieten w rden Jeder Fall entspricht einem Arbeitgeber und enth lt die Reaktionen auf die einzelnen Pl ne health_funding sav Hierbei handelt es sich um eine hypothetische Datei die Daten zur Finanzierung des Gesundheitswesens Betrag pro 100 Personen Krankheitsraten Rate pro 10 000 Personen der Bev lkerung und Besuche bei medizinischen Einrichtungen rzten Rate pro 10 000 Personen der Bev lkerung enth lt Jeder Fall entspricht einer anderen Stadt hivassay sav Hierbei handelt es sich um eine hypothetische Datendatei zu den Bem hungen eines pharmazeutischen Labors einen Schnelltest zur Erkennung von HIV Infektionen zu entwickeln Die Ergebnisse des Tests sind acht kr ftiger werdende Rotschattierungen wobei kr ftigeren Schattierungen auf eine h here Infektionswahrscheinlichkeit hindeuten Bei 2 000 Blutproben von denen die H lfte mit HIV infiziert war wurde ein Labortest durchgef hrt hourlywagedata sav Hierbei handelt es sich um eine hypothetische Datendatei zum Stundenlohn von Pflegepersonal in Praxen und Krankenh usern mit unterschiedlich langer Berufserfahrung insure sav Hierbei handelt es sich u
78. eine lineare Kombination angegeben haben geben Sie f r die Einschr nkungsvariablen eine Intervall Nominal Ordinal oder Spline Transformation an Die Anzahl der F lle muss in jedem Fall der Anzahl der Objekte entsprechen Multidimensionale Skalierung Optionen Das Dialogfeld Optionen erm glicht Ihnen die Auswahl der Anfangskonfiguration die Angabe von Iterations und Konvergenzkriterien und die Wahl zwischen standardm igen und gelockerten Aktualisierungen 80 Kapitel 7 Abbildung 7 9 Dialogfeld Optionen 7 E Multidimensionale Skalierung Optionen Ausgangskonfiguration lterationskriterien Simplex Stress Konyergenz 0001 Torgerson Mindest Stress 0001 SERIEN Maximalzahl der tterationen 100 _ Mehrere Zufallsstarts Gelockerte Aktualisierungen Anpassen Angepasste Konfiguration variablen einlesen aus Datei kinship_ini say Anzahl muss H chstzahl Dimensionen im Modell entsprechen Aktuell 3 Verf gbar dimD1 dimD2 dim03 weiter Abbrechen Hite Ausgangskonfiguration Wahlen Sie eine der folgenden Optionen Simplex Objekte werden in der h chsten Dimension in gleichen Abst nden voneinander plaziert Eine Iteration wird durchgef hrt um diese Konfiguration der h chsten Dimension zu optimieren und anschlie end wird eine Dimensionsreduktion vorgenommen um eine Ausgangskonfiguration mit der m
79. entlang der zweiten Dimension anzeigt Wie auch bei Gewinde in der vorherigen Analyse der Fall bilden die Objekte keine kompakten Gruppen doch die Differenzierung der Objekte nach Kategorien ist perfekt 269 Mehrfachkorrespondenzanalyse Abbildung 13 18 Objektwerte beschriftet mit Einkerbung des Kopfes nach der Entfernung des Ausrei ers 5 Keine Keine Keine Schlitz 14 0 o Schlitz Schlitz a Schlitz c o fe i w Schlitz Schlitz ane c 04 ae eine Schlitz A elne a Schlitz o Keine 14 Schlitz Keine Keine g o wW Vb ke AR e be 15 10 05 00 05 10 15 Dimension 1 Das Objektwertediagramm mit der Beschriftung Einkerbung des Kopfes zeigt da die erste Dimension perfekt zwischen Objekten mit und ohne Einkerbung diskriminiert wie auch in der vorherigen Analyse der Fall Im Gegensatz zur vorherigen Analyse kann die zweite Dimension nun zwischen den beiden Kategorien unterscheiden Die Auslassung von SCHRAUBEI dem einzigen Objekt mit einem Kreuzschlitz hat erhebliche Auswirkungen auf die Interpretation der zweiten Dimension Diese Dimension differenziert nun die Objekte auf der Grundlage von Messing Kopfform und L nge in cm Empfohlene Literatur In folgenden Texten finden Sie weitere Informationen zur Mehrfachkorrespondenzanalyse Benz cri J P 1992 Correspondence analysis handbook New York Marcel Dekker Guttman L 1941 The quantification of a class of attributes A theory and method of
80. es sich um eine Datendatei zum Thema Seasonal Patterns of Winnipeg Hospital Use Menec Roos Nowicki MacWilliam Finlayson als auch Black 1999 Saisonale Muster der Belegung im Krankenhaus von Winnipeg vom Manitoba Centre for Health Policy dvdplayer sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Entwicklung eines neuen DVD Spielers geht Mithilfe eines Prototyps hat das Marketing Team Zielgruppendaten erfasst Jeder Fall entspricht einem befragten Benutzer und enth lt demografische Daten zu dem Benutzer sowie dessen Antworten auf Fragen zum Prototyp flying sav Diese Datendatei enth lt die Flugmeilen zwischen zehn St dten in den USA german_credit sav Diese Daten sind aus dem Daten Set German credit im Repository of Machine Learning Databases Blake als auch Merz 1998 an der Universit t von Kalifornien in Irvine entnommen grocery_1month sav Bei dieser hypothetischen Datendatei handelt es sich um die Datendatei grocery_coupons sav wobei die w chentlichen Eink ufe zusammengefasst sind sodass jeder Fall einem anderen Kunden entspricht Dadurch entfallen einige der Variablen die w chentlichen nderungen unterworfen waren und der verzeichnete ausgegebene Betrag ist nun die Summe der Betr ge die in den vier Wochen der Studie ausgegeben wurden grocery_coupons sav Hierbei handelt es sich um eine hypothetische Datendatei die Umfragedaten enth lt die von einer Lebensmittelkette erf
81. fen Sie andernfalls die Stressma e ob eine Verbesserung bei der Anpassung vorliegt Ermitteln Sie au erdem anhand des Diagramms mit dem gemeinsamen Raum ob die Interpretation aussagekr ftigere Ergebnisse liefert Die unabh ngigen Variablen resultieren jeweils in einer ungef hr linearen Transformation diese Variablen sollten daher ggf als numerisch interpretiert werden Die hnlichkeiten liefern allerdings keine lineare Transformation sodass hier eine ordinale Transformation in Betracht gezogen werden sollte 287 Multidimensionale Skalierung Abbildung 14 18 Transformierte Ahnlichkeiten Quelle SRC_1 SRC_2 SRC_3 SRC_4 SRC_5 SRC_6 1 00 Transformierte Distanzen StressmaBe Der Stress fiir die aktuelle L sung stiitzt die Aussage dass die Ahnlichkeiten auf einem ordinalen Messniveau skaliert werden sollten Abbildung 14 19 Stress und Anpassungsma e Normalisierter Roh Stress Stress I Stress ll S Stress Erkl rte Streuung D A F Kongruenzkoeffizient nach Tucker PROXSCAL minimiert den normalisierten Roh Stress a Faktor f r optimale Skalierung 1 032 b Faktor f r optimale Skalierung 980 Der normalisierte Roh Stress f r die vorangegangene L sung liegt bei 0 06234 Durch die Skalierung der Variablen mit nicht standardm igen Transformationen wird der Wert f r den Stress auf 0 03137 halbiert Endg ltige Koordinaten des gemeinsamen Raums Diagra
82. flying sav F r weitere Informationen siehe Beispieldateien in Anhang A auf S 326 Tabelle 12 2 St dtenamen Ort Label Ort Label Atlanta Atl Miami Mia Chicago Chi New York NY Denver Den San Francisco SF Houston Hou Seattle Sea Los Angeles LA Washington DC DC 245 Korrespondenzanalyse gt Zum Anzeigen der Flugmeilen gewichten Sie die F lle zun chst nach der Variablen Distanz W hlen Sie die folgenden Befehle aus den Men s aus Daten F lle gewichten Abbildung 12 35 Dialogfeld F lle gewichten F lle gewichten x Zeile O F lle nicht gewichten L Spalte F lle gewichten mit H ufigkeitsvariable en Aktueller Status F lle nicht gewichten Einf gen Zur cksetzen Abbrechen Hilfe F lle gewichten nach Distanz Klicken Sie auf OK Zum Anzeigen der Meilen als Kreuztabelle w hlen Sie die folgenden Befehle aus den Men s aus Analysieren Deskriptive Statistiken Kreuztabellen 246 Kapitel 12 Abbildung 12 36 Dialogfeld Kreuztabellen it Kreuztabellen E Distanz da Stadt Zeile n Exakt Statistiken Zellen Format rSchicht 1von1 Zur ck E C Keine Tabellen C Gruppierte Balkendiagramme anzeigen Einf gen Zur cksetzen Abbrechen Hilfe W hlen Sie Zeile als Zeilenvariable aus W hlen Sie Spalte als Spaltenvariable aus Klicken Sie auf OK
83. gbar sind Ausgabetypen Befehls IDs Tabellenuntertypen f r ausgew hlte Befehle Ausgabeziele Diagramme Cases to Variables E Descriptive Statistics O Keine Protokolle Iteration History Tabellen Model Summary Datei d_centroids sav Durchsuchen Texte Notes berschriften Object Scores Basierend auf Objektnamen Ordner Warnungen Classification Tree B ume Cluster Quartifications Variance Accounted For Alarninc U Aus Viewer ausschlie en Durchsuchen Neues Daten Set Conjoint Analysis ID Beschriftungen Wahlen Sie Tabellen als Ausgabetyp Wahlen Sie CATPCA als Befehl Wahlen Sie Projected Centroids als Tabellentyp Wahlen Sie im Gruppenfeld Ausgabeziele die Option Datei und geben Sie als Dateinamen projected_centroids sav ein Klicken Sie auf Optionen 158 Kapitel 10 Abbildung 10 19 Dialogfeld Optionen OMS Optionen Eormet rGrafikbilder Bilder einschlie en Format jpg Gr e 100 Bildmappen einf gen rTabellen Pivots Keine Alle Dimensionen in einer einzelnen Zeile Liste der Positionen Liste O Liste der Dimensionsnamen Liste Statische Tabellen Tabellennummer und variable TableNumber_ Weiter Abbrechen Hilfe W hlen Sie als Ausgabeformat
84. gleich sein _Aktualisieren Erg nzende Kategorie Geben Sie 1 als Mindestwert ein Geben Sie 23 als H chstwert ein Klicken Sie auf Aktualisieren Klicken Sie auf Weiter Wahlen Sie Marke als Spaltenvariable aus vy vyv Vv Vy v y Klicken Sie im Dialogfeld Korrespondenzanalyse auf Bereich definieren Abbildung 12 25 Dialogfeld Spaltenbereich definieren E Korrespondenzanalyse Spaltenbereich definieren X rKategorienbereich f r Spaltenvariable brand Minimalwert rNebenbedingungen f r Kategorien Keine Kategorien m ssen gleich sein Erg nzende Kategorie Weiter Abbrechen Hilfe Geben Sie 1 als Mindestwert ein gt Geben Sie 6 als H chstwert ein 237 Korrespondenzanalyse gt Klicken Sie auf Aktualisieren Klicken Sie auf Weiter Klicken Sie im Dialogfeld Korrespondenzanalyse auf Modell Abbildung 12 26 Dialogfeld Modell Korrespondenzanalyse Modell X Dimensionen in der L sung rDistanzma Chi Quadrat Euklidisch rStandardisierungsmethode Zeilen und Spaltenmittel werden entfernt Zeilenmittel werden entfernt d Spaltenmittel werden entfernt Zeilensummen werden angeglichen und Mittelwerte entfernt ensummen werden angeglichen und Mittelwerte entfernt rNormalisierungsmethode Symmetrisch Zeilenprinzipal Anpassen Spaltenpri
85. gt SPSS Categories 16 0 Weitere Informationen zu SPSS Software Produkten finden Sie auf unserer Website unter der Adresse http www spss com oder wenden Sie sich an SPSS Inc 233 South Wacker Drive 11th Floor Chicago IL 60606 6412 USA Tel 312 651 3000 Fax 312 651 3668 SPSS ist eine eingetragene Marke und weitere Produktnamen sind Marken der SPSS Inc fiir Computerprogramme von SPSS Inc Die Herstellung oder Verbreitung von Materialien die diese Programme beschreiben ist ohne die schriftliche Erlaubnis des Eigent mers der Marke und der Lizenzrechte der Software und der Copyrights der ver ffentlichten Materialien verboten Die SOFTWARE und die Dokumentation werden mit BESCHR NKTEN RECHTEN zur Verf gung gestellt Verwendung Vervielf ltigung und Ver ffentlichung durch die Regierung unterliegen den Beschr nkungen in Unterabschnitt c 1 ii von The Rights in Technical Data and Computer Software unter 52 227 7013 Vertragspartner Hersteller ist SPSS Inc 233 South Wacker Drive 11th Floor Chicago IL 60606 6412 Patentnr 7 023 453 Allgemeiner Hinweis Andere in diesem Dokument verwendete Produktnamen werden nur zu Identifikationszwecken genannt und k nnen Marken der entsprechenden Unternehmen sein Windows ist eine eingetragene Marke der Microsoft Corporation Apple Mac und das Mac Logo sind Marken von Apple Computer Inc die in den USA und in anderen L ndern eingetragen sind Dieses Produkt verwend
86. hlen Abbildung 13 13 Dialogfeld F lle ausw hlen F lle ausw hlen X r usw hlen 5 gewinde Alle F lle e kopf B kerbe G Falls Bedingung zutrifft amp om amp l nge Zufallsstichprobe amp messing fH object Stichprobe Nach Zeit oder Fallbereich Bereich Fittervariable verwenden Ly C7 Ausgabe G Nicht ausgew hlte F lle filtern Ausgew hlte F lle in neues Daten Set kopieren Daten Set Name Nicht ausgew hlte F lle l schen Aktueller Status F lle nicht filtern Einf gen Zur cksetzen Abbrechen Hilfe gt Aktivieren Sie das Optionsfeld Falls Bedingung zutrifft Klicken Sie auf Falls 267 vv v y Mehrfachkorrespondenzanalyse Abbildung 13 14 Dialogfeld Falls F lle ausw hlen Falls X i object 16 Son E amp kerbe I amp form Funktionsquppe Alle a a amp ange i Arithmetisch E messing object CDF amp CDF nichtzentral Umwandlung Aktuelles Datum aktuelle Uhr iw Funktionen und Sondervariablen Weiter Abbrechen Hilfe Geben Sie object 16 als Bedingung ein Klicken Sie auf Weiter Klicken Sie im Dialogfeld F lle ausw hlen auf OK Rufen Sie schlie lich das Dialogfeld Mehrfachkorrespondenzanalyse auf und klicken Sie auf OK Abbildung 13 15 Modellzusam
87. hlen Hinzuf gen Teile Andern Zeilennummer entfernen Abbrechen Hilfe W hlen Sie in der Gruppe Diagramme die Option Individueller Raum Klicken Sie auf Weiter Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf OK Im Folgenden finden Sie die durch diese Optionen generierte Befehlssyntax PREFSCAL VARIABLES TP BT EMM JD CT BMM HRB TMd BTJ TMn CB DP GD CC CMB INPUT SOURCES srcid INITIAL CLASSICAL SPEARMAN CONDITION ROW TRANSFORMATION NONE PROXIMITIES DISSIMILARITIES MODEL WEIGHTED CRITERIA DIMENSIONS 2 2 DIFFSTRESS 000001 MINSTRESS 0001 MAXITER 5000 PENALTY LAMBDA 0 5 OMEGA 1 0 302 Kapitel 15 Ma e PRINT MEASURES COMMON PLOT COMMON WEIGHTS INDIVIDUAL ALL m Mit dieser Syntax wird eine Analyse der Variablen tp Toast pop up bis cmb Corn muffin and butter angegeben Mit der Variablen srcid werden die Quellen identifiziert m Der Unterbefehl INITIAL gibt an dass die Startwerte mithilfe der Spearman Distanzen festgelegt werden sollen m Der Unterbefehl MODEL gibt ein gewichtetes euklidisches Modell an bei dem in jedem individuellen Raum die Dimensionen des gemeinsamen Raums unterschiedlich gewichtet werden k nnen m Mit dem Unterbefehl PLOT werden Diagramme des gemeinsamen Raums individuelle R ume und individuelle Raumgewichtungen angefordert m F r alle anderen Parameter gelten die Standardwerte Abbi
88. in homogene Untergruppen Variablen werden als homogen betrachtet wenn sie Objekte die in denselben Kategorien vorliegen auch in dieselben Untergruppen einordnen Beispiel Mithilfe der Mehrfachkorrespondenzanalyse k nnte die Beziehung zwischen Berufsgruppe Minderheit und Geschlecht grafisch dargestellt werden Unter Umst nden stellt sich dabei heraus dass Minderheit und Geschlecht im Gegensatz zur Berufsgruppe klare Unterscheidungsmerkmale f r Personen darstellen Au erdem k nnte sich ergeben dass die Kategorien Latino und Afro Amerikaner einander sehr hnlich sind Statistiken und Diagramme Objektwerte Diskriminationsma e Iterationsprotokoll Korrelationen der urspr nglichen und transformierten Variablen Kategorienquantifikationen deskriptive Statistiken Objektpunktdiagramme Biplots Kategoriendiagramme verbundene Kategoriendiagramme Transformationsdiagramme und Diskriminationsma Protokolle Daten Werte von String Variablen werden immer in aufsteigender alphanumerischer Reihenfolge in positive Ganzzahlen umgewandelt Benutzerdefinierte und systemdefinierte fehlende Werte sowie Werte kleiner als 1 werden als fehlend betrachtet Sie k nnen die Daten umkodieren oder eine Konstante zu Variablen mit Werten kleiner als 1 addieren um die Werte als nichtfehlend zu deklarieren Annahmen Alle Variablen weisen ein mehrfach nominales Skalierungsniveau auf Die Daten m ssen mindestens drei g ltige F lle enthalten Di
89. insgesamt sechs Quellen erzielt die in der nachstehenden Tabelle dargestellt werden Tabelle 14 1 Quellstruktur der Verwandtschaftsdaten Quelle Geschlecht Bedingung Stichprobenumfang 1 Weiblich Einfache 85 Sortierung 2 M nnlich Einfache 85 Sortierung 3 Weiblich Erste 80 Sortierung 4 Weiblich Zweite 80 Sortierung 271 272 Kapitel 14 Quelle Geschlecht Bedingung Stichprobenumfang 5 M nnlich Erste 80 Sortierung 6 M nnlich Zweite 80 Sortierung Jede Quelle entspricht einer hnlichkeitsmatrix mit 15 x 15 Elementen Die Anzahl der Zellen ist dabei gleich der Anzahl der Personen in einer Quelle minus der Anzahl der Platzierungen der Objekte in diese Quelle Dieses Daten Set finden Sie in kinship_dat sav F r weitere Informationen siehe Beispieldateien in Anhang A auf S 326 Festlegen der Anzahl der Dimensionen Entscheiden Sie selbst wie viele Dimensionen die L sung erhalten soll Ein Screeplot kann Sie bei dieser Entscheidung unterst tzen Zum Erstellen eines Screeplots w hlen Sie die folgenden Befehle aus den Men s aus Analysieren Skalieren Multidimensionale Skalierung PROXSCAL Abbildung 14 1 Dialogfeld Datenformat E Multidimensionale Skalierung Datenformat Datenformat Anzahl der Quellen G Daten sind hnlichkeiten _ Eine Matrixquelle hnlichkeiten aus Daten erstellen Mehrere Matrixquellen Eine Quelle Mehrere Quellen hnlichkeiten stammen
90. ist nicht identisch mit einer Regression mit optimaler Skalierung f r diese Untergruppe Die berechnete kategoriale Regression besitzt beispielsweise einen Wert von 0 875 f r R2 Sie haben die transformierten Variablen gespeichert Um also die Anpassungsg te einer linearen Regression nur mit Temperature Pressure gradient und Inversion base height als Einflu gr en zu bestimmen w hlen Sie aus den Men s die folgenden Befehle aus Analysieren Regression Linear 129 Kategoriale Regression Abbildung 9 43 Dialogfeld Lineare Regression Lineare Regression X FE Variable Statistiken Block 1von41 Diagramme zo a Speichern Optionen Unabh ngige a Auswahlvariable Fallbeschriftungen CS WLS Gewichtung W hlen Sie Daily ozone level Quantification als abh ngige Variable aus gt W hlen Sie Inversion base height Quantification Pressure gradient mm Hg Quantification und Temperature degrees F Quantification als unabh ngige Variablen aus Klicken Sie auf OK Abbildung 9 44 Modellzusammenfassung f r die Regression mit einer Untergruppe von Einflu gr en mit optimaler Skalierung Standard Korrigiertes fehler des R Quadrat R Quadrat Schatzers 730 51999 a Einflu variablen Konstante Temperature degrees F Quantifikation Pressure gradient mm Hg Quantifikation Inversion base height Quantifikation Unt
91. linearen Kombinationen aus jedem Set und den Objektwerten zur Verf gung Wenn ein Set keine mehrfach nominalen Variablen enth lt k nnen Sie dieses Ma folgenderma en berechnen Multiplizieren Sie die Gewichtung und die Komponentenladung der einzelnen Variablen im Set addieren Sie diese Produkte und ziehen Sie dann die Quadratwurzel aus der Summe Abbildung 11 14 Gewichtungen Dimension Age in years Marital status Newspaper read most often Music preferred Neighborhood preference Abbildung 11 15 Komponentenladungen Dimension 1 2 Age in years 4 b Marital status b Pets owned4 e Dimension 1 2 Newspaper read most oftens gt Music preferred eb Neighborhood preferences gt a Optimales Skalierungsniveau Ordinal b Projektionen der einfach quantifizierten Variablen im Objektraum Optimales Skalierungsniveau Einfach nominal d Optimales Skalierungsniveau mehrfach nominal e Projektionen der mehrfach quantifizierten Variablen im Objektraum 202 Kapitel 11 Diese Zahlen geben die Gewichtungen und die Komponentenladungen f r die Variablen in diesem Beispiel an Die Mehrfachkorrelation R f r die erste gewichtete Summe optimal skalierter Variablen Age in years und Marital status in der ersten Dimension der Objekte lautet R 0 701 x 0 841 0 273 x 0 631 1 0 5895 0 1723 0 873 F r jede Dimension gilt 1 Verlust R2 Beispiel Aus der Tabelle mit der Zu
92. mit einer in der Analyse verwendeten Variablen beschriften m chten verwenden Sie die Funktion Berechnen verf gbar im Men Transformieren um eine Kopie dieser Variablen zu erstellen Verwenden Sie die 43 Nichtlineare kanonische Korrelationsanalyse OVERALS neue Variable um das Diagramm zu beschriften Wahlweise k nnen Sie dazu auch die Befehlssyntax verwenden m Sie k nnen die in der L sung gew nschte Anzahl der Dimensionen angeben Im allgemeinen sollten Sie nur so viele Dimensionen ausw hlen wie zum Erkl ren des gr ten Teils der Variation notwendig ist Wenn die Analyse mehr als zwei Dimensionen umfasst werden dreidimensionale Diagramme der ersten drei Dimensionen erzeugt Weitere Dimensionen k nnen durch die Bearbeitung des Diagramms angezeigt werden Bereich und Skala definieren Abbildung 4 3 Dialogfeld Bereich und Skala definieren E OVERALS Bereich und Skala definieren Minimum 1 Maximum 10 Messniveau 2 Ordinal Mehrfach nominal d Einzeln nominal lt F Diskret numerisch Abbrechen Hite Sie m ssen f r jede Variable einen Bereich definieren Der angegebene H chstwert muss eine Ganzzahl sein Gebrochene Datenwerte werden in der Analyse abgeschnitten Ein Kategoriewert der au erhalb des angegebenen Bereiches liegt wird in der Analyse ignoriert Um eine m glichst kleine Ausgabe zu erzielen erstellen Sie mithilfe der Funktion Au
93. oder numerisch Liegt ein hoher Einzelverlust vor sollten die Variablen eher als mehrfach nominal behandelt werden In diesem Beispiel sind die Einzelanpassung und die Mehrfachanpassung jedoch nahezu identisch die Mehrfachkoordinaten liegen also nahezu auf einer geraden Linie in der Richtung die durch die Gewichtungen vorgegeben ist Die Mehrfachanpassung ist gleich der Varianz der Mehrfachkategorienkoordinaten f r die einzelnen Variablen Diese Ma zahlen entsprechen den Diskriminationsma en bei der Homogenit tsanalyse Aus der Tabelle f r die Mehrfachanpassung geht hervor bei welchen 203 Nichtlineare kanonische Korrelationsanalyse Variablen der h chste Diskriminationswert vorliegt Beispiel Betrachten Sie die Tabelle der Mehrfachanpassung f r Marital status und Newspaper read most often Die Summe der Anpassungswerte ber die beiden Dimensionen ist gleich 1 122 f r Marital status und 0 911 f r Newspaper read most often Diese Information bedeutet dass der Familienstand einer Person einen h heren Diskriminationswert liefert als die abonnierte Zeitung Die Einzelanpassung entspricht der quadrierten Gewichtung f r die einzelnen Variablen und ist gleich der Varianz bei den Einzelkategoriekoordinaten Die Gewichtungen sind daher gleich den Standardabweichungen der Einzelkategoriekoordinaten Aus der Aufteilung der Einzelanpassung auf die verschiedenen Dimensionen geht hervor dass die Diskrimination der Variablen Newspaper read m
94. ordinale Transformation zu einer hnlichen Anpassung f hren Wenn dieser Trend linear ist ist m glicherweise eine numerische Behandlung geeignet Wenn jedoch die Zusammenfassung von Kategorien oder die nderung der Messniveaus f r die Skalierung angebracht ist ndert sich die Analyse nicht in signifikanter Weise Abbildung 1 1 Transformationsdiagramm f r Preise numerisch 004 Quantifizierungen 054 10 4 aAle falve vaky 1 19 1 39 1 59 Kategorien Kategoriecodes Bei der Kodierung kategorialer Variablen sollte mit Vorsicht vorgegangen werden da einige Kodierungsschemata zu einer unerw nschten Datenausgabe oder zu unvollst ndigen Analysen f hren k nnen M gliche Kodierungsschemata f r T tigkeit werden in der folgenden Tabelle angezeigt 5 Einf hrung in die Prozeduren f r die optimale Skalierung von kategorialen Daten Tabelle 1 2 Alternative Kodierungsschemata f r die T tigkeit Schema Kategorie A B C D Praktikant 1 1 5 1 Vertreter 2 2 6 5 Manager 3 7 7 3 F r einige Prozeduren von Categories muss der Bereich jeder verwendeten Variablen definiert werden Werte au erhalb dieses Bereichs werden als fehlende Werte betrachtet Der minimale Kategoriewert ist immer 1 Der maximale Kategoriewert wird vom Benutzer angegeben Dieser Wert gibt nicht die Anzahl der Kategorien f r eine Variable an sondern den gr ten Kategoriewert In der Tabelle beispielswe
95. poll_cs sav aufgef hrten W hler Die Stichprobe wurde gem dem in der Plandatei poll csplan angegebenen Stichprobenplan gezogen und in dieser Datendatei sind die Einschlusswahrscheinlichkeiten und Stichprobengewichtungen erfasst Beachten Sie jedoch Folgendes Da im Stichprobenplan die PPS Methode PPS probability proportional to size Wahrscheinlichkeit proportional zur Gr e verwendet wird gibt es au erdem eine Datei mit den gemeinsamen Auswahlwahrscheinlichkeiten poll_jointprob sav Die zus tzlichen Variablen zum demografischen Hintergrund der W hler und ihrer Meinung zum vorgeschlagenen Gesetzentwurf wurden nach der Ziehung der Stichprobe erfasst und zur Datendatei hinzugef gt property_assess sav Hierbei handelt es sich um eine hypothetische Datendatei in der es um die Bem hungen eines f r einen Bezirk County zust ndigen Immobilienbewerters geht trotz eingeschr nkter Ressourcen die Einsch tzungen des Werts von Immobilien auf dem aktuellsten Stand zu halten Die F lle entsprechen den Immobilien die im vergangenen Jahr in dem betreffenden County verkauft wurden Jeder Fall in der Datendatei enth lt die Gemeinde in der sich die Immobilie befindet den Bewerter der die Immobilie besichtigt hat die seit dieser Bewertung verstrichene Zeit den zu diesem Zeitpunkt ermittelten Wert sowie den Verkaufswert der Immobilie property_assess_cs sav Hierbei handelt es sich um eine hypothetische Datendatei in der es um die Bem h
96. r Nicht Degeneration in Multidimensionale Entfaltung 293 296 302 309 319 Skalierungsmodell in Multidimensionale Entfaltung 87 Spaltenprinzipal Normalisierung in der Korrespondenzanalyse 217 Spaltenwertdiagramme in der Korrespondenzanalyse 241 Spaltenwerte in der Korrespondenzanalyse 225 Standardisierung in der Korrespondenzanalyse 50 Stress Diagramme in Multidimensionale Entfaltung 91 in Multidimensionale Skalierung 81 Stressma e in Multidimensionale Entfaltung 93 in Multidimensionale Skalierung 83 283 287 Streudiagramm der Anpassung in Multidimensionale Entfaltung 91 Symmetrische Normalisierung in der Korrespondenzanalyse 217 Teilkorrelationen in Kategoriale Regression 111 Tr gheit in der Korrespondenzanalyse 52 221 225 Transformationsdiagramme bei der Mehrfachkorrespondenzanalyse 66 347 in der Kategorialen Hauptkomponentenanalyse 37 in Kategoriale Regression 113 in Multidimensionale Entfaltung 91 321 325 in Multidimensionale Skalierung 81 286 Transformierte hnlichkeiten in Multidimensionale Entfaltung 93 in Multidimensionale Skalierung 83 Transformierte unabh ngige Variablen in Multidimensionale Skalierung 83 Triplots in der Kategorialen Hauptkomponentenanalyse 36 Variablengewichtung bei der Mehrfachkorrespondenzanalyse 58 in der Kategorialen Hauptkomponentenanalyse 27 Varianz ber cksichtigt f r in der Kateg
97. r sechs separate Aufgaben an ob die Testperson sie erfolgreich ausf hren k nnte wheeze_steubenville sav Hierbei handelt es sich um eine Teilmenge der Daten aus einer Langzeitstudie zu den gesundheitlichen Auswirkungen der Luftverschmutzung auf Kinder Ware Dockery Spiro III Speizer als auch Ferris Jr 1984 Die Daten enthalten wiederholte bin re Messungen des Keuchens von Kindern aus Steubenville Ohio im Alter von 7 8 9 und 10 Jahren sowie eine unver nderlichen Angabe ob die Mutter im ersten Jahr der Studie rauchte oder nicht workprog sav Hierbei handelt es sich um eine hypothetische Datendatei zu einem Arbeitsprogramm der Regierung das versucht benachteiligten Personen bessere Arbeitspl tze zu verschaffen Eine Stichprobe potenzieller Programmteilnehmer wurde beobachtet Von diesen Personen wurden nach dem Zufallsprinzip einige f r die Teilnahme an dem Programm ausgew hlt Jeder Fall entspricht einem Programmteilnehmer Bibliografie Barlow R E D J Bartholomew D J Bremner als auch H D Brunk 1972 Statistical inference under order restrictions New York John Wiley and Sons Bell E H 1961 Social foundations of human behavior Introduction to the study of sociology New York Harper amp Row Benz cri J P 1969 Statistical analysis as a tool to make patterns emerge from data In Methodologies of Pattern Recognition S Watanabe Hg New York Academic Press 35 74 Benz cri J P 1992 Cor
98. sein Alter in Jahren und die Anzahl der Autounf lle in den letzten f nf Jahren band sav Diese Datendatei enth lt die hypothetischen w chentlichen Verkaufszahlen von CDs f r eine Musikgruppe Daten f r drei m gliche Einflussvariablen wurden ebenfalls aufgenommen bankloan sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen einer Bank geht den Anteil der nicht zur ckgezahlten Kredite zu reduzieren Die Datei enth lt Informationen zum Finanzstatus und demografischen Hintergrund von 850 fr heren und potenziellen Kunden Bei den ersten 700 F llen handelt es sich um Kunden denen bereits ein Kredit gew hrt wurde Bei den letzten 150 F llen handelt es sich um potenzielle Kunden deren Kreditrisiko die Bank als gering oder hoch einstufen m chte bankloan_binning sav Hierbei handelt es sich um eine hypothetische Datendatei die Informationen zum Finanzstatus und demografischen Hintergrund von 5 000 fr heren Kunden enth lt behavior sav In einem klassischen Beispiel Price als auch Bouffard 1974 wurden 52 Sch ler Studenten gebeten die Kombinationen aus 15 Situationen und 15 Verhaltensweisen auf einer 10 Punkte Skala von 0 ausgesprochen angemessen bis 9 ausgesprochen unangemessen zu bewerten Die Werte werden ber die einzelnen Personen gemittelt und als Un hnlichkeiten verwendet behavior_ini sav Diese Datendatei enth lt eine Ausgangskonfiguration f r eine zweidimension
99. the analysis of homogeneity and heterogeneity In Recent Advances in Descriptive Multivariate Analysis W J Krzanowski Hg Oxford Oxford University Press 51 89 Horst P 1961 Generalized canonical correlations and their applications to experimental data Journal of Clinical Psychology 17 331 347 Horst P 1961 Relations among m sets of measures Psychometrika 26 129 149 Isra ls A 1987 Eigenvalue techniques for qualitative data Leiden DSWO Press Kennedy R C Riquier als auch B Sharp 1996 Practical applications of correspondence analysis to categorical data in market research Journal of Targeting Measurement and Analysis for Marketing 5 56 70 Kettenring J R 1971 Canonical analysis of several sets of variables Biometrika 58 433 460 Kruskal J B 1964 Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis Psychometrika 29 1 28 Kruskal J B 1964 Nonmetric multidimensional scaling A numerical method Psychometrika 29 115 129 Kruskal J B 1965 Analysis of factorial experiments by estimating monotone transformations of the data Journal of the Royal Statistical Society Series B 27 251 263 Kruskal J B 1978 Factor analysis and principal components analysis Bilinear methods In International Encyclopedia of Statistics W H Kruskal als auch J M Tanur Hgg New York The Free Press 307 330 Kruskal J B als auch R N Shepard 1974 A nonmetri
100. transformierten hnlichkeiten und die transformierten unabh ngigen Variablen in eigenen SPSS Datendateien speichern Zus tzliche Funktionen beim Befehl PROXSCAL Sie k nnen die kategoriale Hauptkomponentenanalyse individuell anpassen indem Sie die Auswahl in ein Syntax Fenster einf gen und die daraus resultierende Befehlssyntax f r PROXSCAL bearbeiten Mit der Befehlssyntax Sprache verf gen Sie au erdem ber folgende M glichkeiten Geben Sie eigene Variablenlisten f r Transformationen und Residuen Diagramme an mit dem Unterbefehl PLOT Geben Sie eigene Quelllisten f r individuelle Raumgewichtungen Transformationen und Residuen Diagramme an mit dem Unterbefehl PLOT Geben Sie eine Untergruppe der Transformationsdiagramme f r unabh ngige Variablen an die angezeigt werden sollen mit dem Unterbefehl PLOT Vollst ndige Informationen zur Syntax finden Sie in der Command Syntax Reference Kapitel Multidimensionale Entfaltung PREFSCAL In der Prozedur Multidimensionale Entfaltung wird versucht eine gemeinsame quantitative Skala zu finden mit der Sie die Beziehung zwischen zwei Gruppen von Objekten visuell untersuchen k nnen Beispiele Sie haben 21 Personen geben 15 Fr hst cksartikel in der Vorzugsreihenfolge von 1 bis 15 zu ordnen Mit der Prozedur Multidimensionale Entfaltung k nnen Sie ermitteln dass die Personen die Fr hst cksartikel in erster Linie auf zwei Arten unterscheiden zwischen W
101. und Stark sowie die Kategorien No Alcohol und Alcohol die als Erg nzung der Analyse dienen k nnen storebrand sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen einer Verkaufsleiterin in einem Lebensmittelmarkt geht die die Verkaufszahlen des Waschmittels der Eigenmarke gegen ber den anderen Marken steigern m chte Sie erarbeitet eine Werbeaktion im Gesch ft und spricht an der Kasse mit Kunden Jeder Fall entspricht einem Kunden stores sav Diese Datendatei enth lt hypothetische monatliche Marktanteilsdaten f r zwei konkurrierende Lebensmittelgesch fte Jeder Fall entspricht den Marktanteilsdaten f r einen bestimmten Monat stroke_clean sav Diese hypothetische Datendatei enth lt den Zustand einer medizinischen Datenbank nachdem diese mithilfe der Prozeduren in der Option Data Preparation bereinigt wurde stroke_invalid sav Diese hypothetische Datendatei enth lt den urspr nglichen Zustand einer medizinischen Datenbank der mehrere Dateneingabefehler aufweist stroke_survival In dieser hypothetischen Datendatei geht es um die berlebenszeiten von Patienten die nach einem Rehabilitationsprogramm wegen eines isch mischen Schlaganfalls mit einer Reihe von Problemen zu k mpfen haben Nach dem Schlaganfall werden das Auftreten von Herzinfarkt isch mischem Schlaganfall und h morrhagischem Schlaganfall sowie der Zeitpunkt des Ereignisses aufgezeichnet Die Stichprobe ist auf der lin
102. zu k nnen Die projizierten Zentroide fallen in einen von vier Quadranten die aus der Verl ngerung zweier lotrechter Referenzlinien durch den Urspung gebildet werden Die Interpretation der Richtung von einzeln nominalen ordinalen oder numerischen Variablen ergibt sich aus der Position der projizierten Zentroide Beispiel Die Variable Newspaper read most often ist als einzeln nominal angegeben Die projizierten Zentroide zeigen dass Volkskrant und NRC im Gegensatz zu Telegraaf stehen Abbildung 11 24 Zentroide und projizierte Zentroide f r Age in years 10 4 Zentroide i 66 70 O Projektiert O Tats chlich Dimension 2 1 0 0 5 0 0 0 5 1 0 15 2 0 Dimension 1 Das Problem bei Age in years zeigt sich deutlich in den projizierten Zentroiden Wird Age in years als ordinal behandelt impliziert dies dass die Reihenfolge der Altersgruppen beibehalten werden muss Um diese Einschr nkung zu erf llen werden alle Altersgruppen bis 45 Jahre auf denselben 209 Nichtlineare kanonische Korrelationsanalyse Punkt projiziert Entlang der Richtung die durch Age in years Newspaper read most often und Neighborhood preference definiert ist findet keine Trennung der niedrigeren Altersgruppen statt Diese Erkenntnis legt nahe dass die Variable als nominal behandelt werden sollte Abbildung 11 25 Zentroide und projizierte Zentroide fur Neighborhood preference 15 Zentroide O Projektiert O Tats chlich
103. zwangsl ufig zu einem Absinken des vorhergesagten Werts f r Ozone f hrt Die gesamte Interpretation muss relativ zu den transformierten Variablen vorgenommen werden Wenn die Quantifikationen f r Temperature steigen oder die Quantifikationen f r Inversion base height sinken steigt der vorhergesagte Wert f r Ozone Um die Auswirkungen der urspr nglichen Variablen untersuchen zu k nnen m ssen die Kategorien in einen Zusammenhang mit den Quantifikationen gebracht werden Abbildung 9 32 Transformationsdiagramm von Inversion base height nominal i N Quantifizierungen 1 3 5 7 8 nn 67 He AaAaAaaAar aH BHM TB 4 49 Kategorien Das Transformationsdiagramm von Inversion base height zeigt kein erkennbares Muster Der gezackte Verlauf des Diagramms weist darauf hin dass der bergang von niedrigen zu hohen Kategorien in Fluktuationen bei den Quantifikationen in beide Richtungen f hrt Eine Beschreibung der Auswirkungen dieser Variablen muss sich daher auf die einzelnen Kategorien 123 Kategoriale Regression konzentrieren Wenn Sie ordinale oder lineare Einschr nkungen f r die Quantifikationen dieser Variablen festlegen geht die Anpassungsg te unter Umst nden deutlich zur ck Abbildung 9 33 Transformationsdiagramm von Pressure gradient nominal 1 4 S m 04 c 3 ku er P 14 E e 8 4 S 24 O 3 44 TT TT TT TT 1 1 1 1 1 11 1T T_T 1 2 3 4 5 6 7 8 9 10 114 12
104. 0 O most often 1 o N Music preferred lew wave o 20 25 no Neighborhood o la er 61 65 O preference dog s Single O Popular 36 40 PT lem Other 0 vario TE B688 Dont ike e 26 30 2 O OMarried 7 r t Volkskrant Cla a cat s O music Dimension 2 Country 41 45 i N N oO on N Dimension 1 Allgemeine Vorschl ge Nach der Untersuchung der ersten Ergebnisse soll die Analyse in der Regel weiter verfeinert werden indem Sie einen Teil der Angaben f r die nichtlineare kanonische Korrelationsanalyse ndern Hier finden Sie einige Tips wie Sie die Analyse strukturieren m Erstellen Sie so viele Sets wie m glich Wichtige Variablen f r die Vorhersage sollten dabei jeweils in ein separates Set eingebracht werden m Variablen die Ihrer Ansicht nach als Einflu gr en fungieren sollten gemeinsam in ein Set plaziert werden Falls zahlreiche Einflu gr en vorliegen teilen Sie sie nach M glichkeit auf mehrere Sets auf 215 Nichtlineare kanonische Korrelationsanalyse m Mehrfach nominale Variablen sollten jeweils in ein separates Set aufgenommen werden m Wenn Variablen hoch korreliert sind und diese Beziehung die L sung nicht dominieren soll platzieren Sie die betreffenden Variablen in einem einzigen Set Empfohlene Literatur In folgenden Texten finden Sie weitere Informationen zur nichtlinearen kanonischen Korrelationsanalyse Carroll J D 1968 Generalization of canonic
105. 1 Das mit Gewinde beschriftete Diagramm zeigt da die erste Dimension Jaund Nein perfekt trennt Alle Objekte mit Gewinde weisen negative Objektwerte auf w hrend alle Objekte ohne Gewinde positive Werte aufweisen Die beiden Kategorien bilden zwar keine kompakten Gruppen die perfekte Differenzierung zwischen den Kategorien wird jedoch allgemein als gutes Ergebnis betrachtet 264 Kapitel 13 Abbildung 13 10 Objektwerte beschriftet mit Kopfform 4 konisch N 5 5 ool 7 ce 5 17 gew lbt a konisch is o gew lbt konisch 0 rund syi yer zyliagarie mrmi O o ach flach eyikiderf rmig flachach flach 1 15 10 05 00 05 10 15 Dimension 1 Das mit Kopfform beschriftete Diagramm zeigt da diese Variable in beiden Dimensionen diskriminiert Die Objekte mit dem Wert FLACH bilden eine Gruppe in der rechten unteren Ecke des Diagramms w hrend die Objekte mit dem Wert GEW LBT eine Gruppe in der rechten oberen Ecke bilden Die Objekte mit dem Wert KONISCH liegen alle oben links Diese Objekte sind jedoch weiter verteilt als die anderen Gruppen und sind daher nicht so homogen Schlie lich k nnen die Objekte mit dem Wert ZYLINDERF RMIG nicht von den Objekten mit dem Wert RUND getrennt werden da beide in der linken unteren Ecke des Diagramms liegen 265 Mehrfachkorrespondenzanalyse Abbildung 13 11 Objektwerte beschriftet mit Lange in cm 4 o 2 5 cm 34 N 5 z 2 5 cm 7 c
106. 1 Objektwerte Cluster CR Normalisierung mit Yariablen Prinzipal Die erste Dimension scheint CROWDS und PUBLIC die relativ gro e negative Werte aufweisen von MOBS und PRIMARY GROUPS zu trennen die relativ gro e positive Werte aufweisen In der zweiten Dimension finden sich drei Klumpen PUBLIC und SECONDARY GROUPS mit gro en negativen Werten CROWDS mit gro en positiven Werten und die anderen sozialen Gruppen dazwischen Dies ist leichter zu sehen wenn man das Diagramm der Objektwerte untersucht Abbildung 10 12 Objektwertediagramm e CR AU O w PG o me o Dimension 2 1 Dimension 1 151 Kategoriale Hauptkomponentenanalyse Im Diagramm sehen Sie PUBLIC und SECONDARY GROUPS unten CROWDS oben und die anderen sozialen Gruppen in der Mitte Die Untersuchung der Muster zwischen einzelnen Objekten h ngt von den zus tzlichen Informationen ab die f r die Analyseeinheiten verf gbar sind Im vorliegenden Fall kennen Sie die Klassifikation der Objekte In anderen F llen k nnen Sie zur Beschriftung der Objekte Zusatzvariablen verwenden Sie sehen au erdem dass die kategoriale Hauptkomponentenanalyse MOBS nicht von PRIMARY GROUPS trennt Obwohl die meisten Personen ihre Familie nicht als Mob bezeichnen w rden haben diese beiden Gruppen bei vier der f nf verwendeten Variablen dieselbe Wertung erhalten Offensichtlich sollten die verwendeten Variablen und Kategorien auf m gliche Schw chen un
107. 1 218 Fisher R A 1938 Statistical methods for research workers Edinburgh Oliver and Boyd Fisher R A 1940 The precision of discriminant functions Annals of Eugenics 10 422 429 Gabriel K R 1971 The biplot graphic display of matrices with application to principal components analysis Biometrika 58 453 467 Gifi A 1985 PRINCALS Research Report UG 85 02 Leiden Department of Data Theory Universit t Leiden Gifi A 1990 Nonlinear multivariate analysis Chichester John Wiley and Sons Gilula Z als auch S J Haberman 1988 The analysis of multivariate contingency tables by restricted canonical and restricted association models Journal ofthe American Statistical Association 83 760 771 Gower J C als auch J J Meulman 1993 The treatment of categorical information in physical anthropology International Journal of Anthropology 8 43 51 Green P E als auch V Rao 1972 Applied multidimensional scaling Hinsdale Ill Dryden Press Green P E als auch Y Wind 1973 Multiattribute decisions in marketing A measurement approach Hinsdale Ill Dryden Press Greenacre M J 1984 Theory and applications of correspondence analysis London Academic Press Guttman L 1941 The quantification of a class of attributes A theory and method of scale construction In The Prediction of Personal Adjustment P Horst Hg New York Social Science Research Council 319 348 Guttman L 1968 A g
108. 90170 Variation der transformierten Ahnlichkeiten 0000924 Variation der Distanzen 1808765 Indizes f r Quadratsumme von Degeneration DeSarbos Indizes f r 117 3115413 Vermischung Shepards Index f r 0000000 Nicht Degeneration 6230788 Der Algorithmus findet eine L sung nach 154 Iterationen und konvergiert bei einem penalisierten Stress markierten endg ltigen Funktionswert von 0 0000990 Da die Penalisierung deaktiviert wurde entspricht der penalisierte Stress dem Kruskal Stress I der Stressanteil des Funktionswerts entspricht dem Ma f r die mangelhafte G te der Anpassung nach Kruskal Geringe Stresswerte deuten normalerweise darauf hin dass die L sung gut an die Daten angepasst ist Es gibt jedoch mehrere Hinweise auf eine degenerierte L sung m Der Variationskoeffizient f r die transformierten hnlichkeiten ist relativ zum Variationskoeffizienten f r die urspr nglichen hnlichkeiten sehr klein Dies weist darauf hin dass die transformierten hnlichkeiten f r jede Zeile nahezu konstant sind und die L sung somit keine Unterscheidung zwischen Objekten erm glicht 294 Kapitel 15 m Die Quadratsummen der Vermischungsindizes nach DeSarbo sind ein Ma f r die Vermischung der Punkte in den unterschiedlichen Gruppen Eine fehlende Vermischung deutet darauf hin dass die L sung m glicherweise degeneriert ist Je n her sich der Wert bei 0 befindet desto besser ist die Vermischung der L sung Der ausgegebene Wert
109. 97 Beispiel Daten f r Teppichreiniger 00 0 cece cece teens 97 Standardverfahren der linearen Regressionsanalyse nannan naa aaan 98 Kategoriale Regressionsanalyse 0 000 c eee eee eee eee 104 Beispiel Ozondaten 0 0 0 cette tte teens 117 Diskretisierung von Variablen 0 0000 cece eet eens 118 Auswahl des Transformationstyps 0 0 00 cece eee eee eee eee 118 Optimalit t der Quantifikationen 0 00 cect eee 128 Auswirkungen von Transformationen 0000 e cece ernennen 130 Empfohlene Literatur 00 00 c cette eee ae 139 10 Kategoriale Hauptkomponentenanalyse 141 Beispiel Untersuchung der Interrelationen sozialer Systeme 0 0000000ee 141 Durchf hrung der Analyse 22 ce ene nent n teen nee 142 Anzahl der Dimensionen sus nuana nnana 147 Quantifizierungen 0 0 0 teen ett 148 bjektwente 34 4 4402 zus an a ea a nt nr are doidoia 150 Komponentenladungen 0 0 0 c eee eee eee eee 151 Zus tzliche Dimensionen 0 00 c eee eens 152 Beispiel Symptomatologie von E st rungen 0 eee eee eee 154 Durchf hrung der Analyse 22 00 0c cect teens 156 Transformationsdiagramme 0006s 168 Modellzusammenfassung 0 0000 e cee ttt tte eee eee 170 Komponentenladungen 0 ccc ccc ee eee nee teen n teenies 171 Objektwerte 0 0 172 Untersuchung der Struk
110. Abbildung 9 25 Dialogfeld Kategoriale Regression Kategoriale Regression Z Fehlende Werte Skala definieren Unabh ngige Yariable n Optionen Ausgabe Speichern Diagramme Skala definieren W hlen Sie Daily ozone level als abh ngige Variable aus gt W hlen Sie nversion base height bis Day of the year als unabh ngige Variablen aus W hlen Sie Daily ozone level und klicken Sie auf Skala definieren Abbildung 9 26 Dialogfeld Skala definieren Kategoriale Regression Skala definieren X rMessniveau der optimalen Skalierung Spline ordinal Ordinal Spline nominal Nominal Numerisch rSpline Grad 2 Innere Knoten 2 ster W hlen Sie Numerisch als optimales Messniveau f r die Skalierung Klicken Sie auf Weiter gt W hlen Sie nversion base height bis Day of the year aus und klicken Sie im Dialogfeld Kategoriale Regression auf Skala definieren 120 Kapitel 9 Abbildung 9 27 Dialogfeld Skala definieren Kategoriale Regression Skala definie Zj rMessniveau der optimalen Skalierung Spline ordinal Ordinal Spline nominal Numerisch Spline Grad 2 Innere Knoten 2 W hlen Sie Nominal als optimales Messniveau fiir die Skalierung Klicken Sie auf Weiter Klicken Sie im Dialo
111. Attribute frisch und h sslich sehr nahe am Ursprung liegen dies bedeutet dass diese Attribute nur wenig vom durchschnittlichen Zeilenprofil abweichen Drei allgemeine Klassifizierungen werden deutlich Im oberen linken Bereich finden sich die Attribute stark M nner und Arbeit jeweils mit gro en hnlichkeiten Der untere linke Bereich enth lt s ss macht dick Kinder und premium Die Attribute gesund fettarm n hrstoffreich und neu dr ngen sich dagegen im rechten Teil des Diagramms 242 Kapitel 12 Abbildung 12 31 Diagramm der Image Attribute Prinzipal Normalisierung schwer Manner N 5 u Arbeit Heilmittel rbe 5 eilmitte neu fettarm 5 o unpopul r O E Koffein fri O On hrstgesseiath a o S ah attrirndiv O popul r h sslich Frauen O macht dick fe wenn o Suid Australien Yuppies O Kinder s ss O 1 0 0 5 0 0 0 5 1 0 15 Dimension 1 Im Spaltenpunktdiagramm liegen alle Marken weit enfernt vom Ursprung keine der Marken hnelt also dem Gesamt Zentroid Die Marken CC und DD liegen gemeinsam im rechten Bereich die Marken BB und FF treffen sich dagegen im unteren Teil des Diagramms Die Marken AA und EE weisen keine hnlichkeiten mit den anderen Marken auf Abbildung 12 32 Diagramm der Marken Prinzipal Normalisierung Dimension 2 1 0 0 5 0 0 0 5 Dimension 1 1 0 Symmetrische Normalisierung Wie h ngen die Marken mit den Image Attributen zusammen Die Prinzipal Normalisie
112. CORRESPONDENCE bearbeiten Mit der Befehlssyntax Sprache verf gen Sie au erdem ber folgende M glichkeiten m Angeben der Tabellendaten als Eingabedaten anstelle der Verwendung fallweise gebundener Daten Unterbefehl TABLE ALL m Angeben der Anzahl von Zeichen f r Wertelabels zur Beschriftung von Punkten f r jeden Typ der Streudiagramm oder Biplot Matrix mit dem Unterbefehl PLOT m Angeben der Anzahl von Zeichen f r Wertelabels zur Beschriftung von Punkten f r jeden Typ von Liniendiagramm mit dem Unterbefehl PLOT m Schreiben einer Matrix mit Zeilen und Spaltenscores in eine Matrixdatendatei mit dem Unterbefehl OUTFILE m Schreiben einer Matrix der Konfidenzstatistiken Varianzen und Kovarianzen f r die Singul rwerte und die Scores in eine Matrixdatendatei mit dem Unterbefehl OUTFILE m Festlegen der Gleichheit f r mehrere Kategoriegruppen mit dem Unterbefehl EQUAL Vollst ndige Informationen zur Syntax finden Sie in der Command Syntax Reference Kapitel Mehrfachkorrespondenzanalyse Die Mehrfachkorrespondenzanalyse quantifiziert nominale kategoriale Daten durch Zuweisung numerischer Werte zu den F llen Objekten und Kategorien sodass Objekte in derselben Kategorie eng beieinander und Objekte in verschiedenen Kategorien weit voneinander entfernt liegen Jedes Objekt liegt so nah wie m glich an den Kategoriepunkten der Kategorien die f r dieses Objekt gelten So unterteilen die Kategorien die Objekte
113. Daten Set erstellen Daten Set Name bjektwerte O Neue Datendatei schreiben Neue Datendatei schreiben Mehrfach nominale fe Den aAlle O Erste Weiter Abbrechen Hilfe 36 Kapitel 3 Kategoriale Hauptkomponenten Objekt und Variablendiagramme Im Dialogfeld Kategoriale Hauptkomponenten Objekt und Variablendiagramme k nnen Sie festlegen welche Diagramme und f r welche Variablen die Diagramme erstellt werden sollen Abbildung 3 9 Dialogfeld Objekt und Variablendiagramme Kategoriale Hauptkomponenten Objekt und Variablendiagramme Diagramme v Objektpunkte Objekte und Variablen Biplot Variablenkoordinaten Biplot und Triplotvariablen gt Objekte beschriften verf gbar Ausgew hlt Beschriften anhand mooa time 3 a a _ Fallnummer ka body amp Variable ich number Hite Objektpunkte Es wird ein Diagramm der Objektpunkte angezeigt Objekte und Variablen Biplot Es werden Objektpunkte und Variablenkoordinaten ausgegeben Hierbei bestehen die folgenden M glichkeiten Komponentenladungen oder Zentroide der Variablen Objekte Ladungen und Zentroide Triplot Es werden die Objektpunkte die Zentroide von Variablen mit mehrfach nominalem Skalierungsniveau und die Komonentenladungen von anderen Variablen ausgegeben Biplot und Triplotvariablen Die Biplots und
114. Die St cke werden durch die vom Benutzer festgelegte Anzahl und die durch die Prozedur bestimmte Lage der inneren Knoten definiert Spline nominal Die einzige Information aus der beobachteten Variable die in der optimal skalierten Variable beibehalten wird ist die Gruppierung der Objekte in Kategorien Die Reihenfolge der Kategorien bei der beobachteten Variablenwird nicht beibehalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch den Koordinatenursprung plaziert Die resultierende Transformation ist ein glatter st ckweiser m glicherweise nichtmonotoner Polynom mit dem gew hlten Grad Die St cke werden durch die vom Benutzer festgelegte Anzahl und die durch die Prozedur bestimmte Lage der inneren Knoten definiert Mehrfach nominal Die einzige Information aus der beobachteten Variable die in der optimal skalierten Variable beibehalten wird ist die Gruppierung der Objekte in Kategorien Die Reihenfolge der Kategorien bei der beobachteten Variablenwird nicht beibehalten Die Kategoriepunkte werden in den Zentroiden der Objekte in den einzelnen Kategorien plaziert Die Bezeichnung Mehrfach bedeutet dass f r jede Dimension andere Gruppen von Quantifikationen berechnet werden Ordinal Die Reihenfolge der Kategorien bei der beobachteten Variable wird bei der optimal skalierten Variable beibehalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch den Koordinatenursprung plaziert Die result
115. Diskrimination nahezu vollst ndig in der zweiten Dimension erfolgt Abbildung 11 27 Aufteilen der Anpassung und der Verluste Mehrfachanpassung Einzelne Anpassung Einzelne Verlustfunktion Dimension Dimension Summe 1 2 summe 1 2 summe Age in yearsa Marital statusa Pets ownedb Newspaper read most often Music preferred Neighborhood preferences a Optimales Skalierungsniveau Einfach nominal b Optimales Skalierungsniveau mehrfach nominal Betrachten Sie das Transformationsdiagramm f r Age in years Die Quantifikationen f r eine nominale Variable sind unbeschr nkt der nicht abnehmende Trend der bei der ordinalen Behandlung von Age in years vorlag ist daher nicht mehr vorhanden Bis zum Alter von 40 Jahren besteht ein abnehmender Trend ab diesem Alter liegt ein ansteigender Trend vor Dies 211 Nichtlineare kanonische Korrelationsanalyse entspricht einer U f rmigen quadratischen Beziehung Die beiden Kategorien mit den h heren Altersgruppen erhalten weiterhin hnliche Werte und in nachfolgenden Analysen k nnen diese Kategorien ggf kombiniert werden Abbildung 11 28 Transformationsdiagramm f r Age in years nominal 2 0 1 0 in Kategorienquantifikationen von Age in years oO in x 20 25 26 30 31 35 36 40 41 45 46 50 51 55 56 60 61 65 66 70 Age in years 212 Kapitel 11 Hier wird das Transformationsdiagramm f r Neighborhood preference dargestellt D
116. Einschr nkungen k nnen Sie Einschr nkungen f r den gemeinsamen Raum festlegen 79 Multidimensionale Skalierung PROXSCAL Abbildung 7 8 Dialogfeld Einschr nkungen E Muttidimensionale Skalierung Einschr nkungen Einschr nkungen im gemeinsamen Raum Keine Einschr nkungen Einige Koordinaten sind fest G Lineare Kombination der unabh ngigen variablen Einschr nkungsvariablen Variablen einlesen aus Datei kinship_var say Verf gbar gender gener degree Transformationen f r unabh ngige variablen Intervall v Abbrechen Einschr nkungen im gemeinsamen Raum Geben Sie die gew nschte Art der Einschr nkung an m Keine Einschr nkungen Es werden keine Einschr nkungen f r den gemeinsamen Raum festgelegt m Einige Koordinaten sind fest Die erste ausgew hlte Variable enth lt die Koordinaten der Objekte in der ersten Dimension die zweite Variable entspricht den Koordinaten der zweiten Dimension usw Ein fehlender Wert zeigt an dass eine Koordinate in einer Dimension frei ist Die Anzahl der ausgew hlten Variablen muss der angegebenen H chstanzahl von Dimensionen entsprechen m Lineare Kombination der unabh ngigen Variablen Der gemeinsame Raum muss eine lineare Kombination der ausgew hlten Variablen sein Einschr nkungsvariablen W hlen Sie die Variablen aus die die Einschr nkungen f r den gemeinsamen Raum definieren Wenn Sie
117. Endg ltiger gemeinsamer Raum Raumgewichtungen Individueller Raum M ransformationsdiagramme Shepard Diagramme C Streudiagramm der Anpassung _ Residuen Diagramme rStile f r Zeilenobjekte Diagramme der Quellen Alle Quellen _ Quellen ausw hlen Quellennummer Quellen Hinzuf gen Entfernen L Zeilendiagramme Alle Zeilen Zeilen ausw hlen Zeilennummer Zeilen Hinzuf gen Entfernen Abbrechen Hilfe Wahlen Sie in der Gruppe Diagramme die Option Transformationsdiagramme Klicken Sie auf Weiter Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf OK Im Folgenden finden Sie die durch diese Optionen generierte Befehlssyntax PREFSCAL VARIABLES Laufen Reden K ssen Schreiben Essen Schlafen Murmeln Lesen K mpfen R lpsen INPUT ROWS ROWID INITIALS diml dim2 CONDITION UNCONDITIONAL TRANSFORMATION LINEAR INTERCEPT PROXIMITIES DISSIMILARITIES MODEL IDENTITY CRITERIA DIMENSIONS 2 2 DIFFSTRESS 000001 Diskutieren Springen Weinen Lachen Schreien samplesDirectory behavior_ini sav MINSTRESS 0001 318 Kapitel 15 MAXITER 5000 PENALTY LAMBDA 0 5 OMEGA 1 0 PRINT MEASURES COMMON PLOT COMMON TRANSFORMATIONS Mit dieser Syntax wird eine Analyse der Variablen run
118. Entfaltung hnlichkeiten Einschr nkungen Optionen Diagramme Gewichtungen Ausgabe Zeilen Quellen z W hlen Sie Laufen bis Schreien als hnlichkeitsvariablen aus W hlen Sie ZeilenID als Zeilenvariable aus Klicken Sie auf Modell 315 Abbildung 15 25 Dialogfeld Modell rSkalierungsmodell Identit t Euklidisch gewichtet Euklidisch verallgemeinert hnlichkeiten Un hnlichkeiten hnlichkeiten rDimensionen Multidimensionale Entfaltung Modell x r hnlichkeitstransformationen O Keine Linear Spline Grad Innere Knoten Glatt Ordinal Minimum 2 Maximum 2 v Konstanten Term einschlie en a Gebundene Beobachtungen losen Transformationen zuweisen In jeder Zeile f r sich Getrennt in jeder Quelle Alle Quellen gleichzeitig Abbrechen Hilfe Multidimensionale Entfaltung W hlen Sie Linear als hnlichkeitstransformation aus und aktivieren Sie die Option Konstanten Term einschlie en gt W hlen Sie unter Transformationen zuweisen die Option Alle Quellen gleichzeitig aus Klicken Sie auf Weiter Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf Optionen 316 Kapitel 15 Abbildung 15 26 Dialogfeld Optionen Multidimensionale Entfaltung Opti
119. K rperwahrnehmung als Analysevariablen aus 161 Klicken Sie auf Skala und Gewicht definieren Abbildung 10 23 Dialogfeld Skala und Gewichtung definieren a Kategoriale Hauptkomponenten Skal X Yariablengewichtung Spline ordinal Spline nominal T rMessniveau der optimalen Skalierung brana Nominal Mehrfach nominal Numerisch Spline Grad 2 Knoten innen Abbrechen Hilfe Kategoriale Hauptkomponentenanalyse W hlen Sie als Messniveau der optimalen Skalierung die Option Ordinal aus Klicken Sie auf Weiter W hlen Sie Time diagnosis interaction Zeit Diagnose Interaktion als Zusatzvariable aus und klicken Sie im Dialogfeld Kategoriale Hauptkomponenten auf Skala definieren Abbildung 10 24 Dialogfeld Skala definieren Yariablengewichtung Spline ordinal Spline nominal Messniveau der optimalen Skalierung Ordinal Nominal Mehrfach nominal Numerisch Kategoriale Hauptkomponenten Skala und X Spline Grad Ee Knoten innen 2 rar Jansen J Wahlen Sie Mehrfach nominal als Messniveau der optimalen Skalierung Klicken Sie auf Weiter 162 Kapitel 10 Abbildung 10 25 Dialogfeld Kategoriale Hauptkomponenten In An iskrete umwandeln _ umwandeln jr Te nd ofl time2
120. Klicken Sie auf Definieren 58 Kapitel 6 Abbildung 6 2 Dialogfeld Mehrfachkorrespondenzanalyse E Mehrfac hkorrespondenzanalyse Analysevariablen In diskrete umwandeln Fehlend Optionen Ausgabe Speichern Yariablengewicht definieren Diagramme Zusatzyvariablen Beschriftungsvariablen Dimensionen in der L sung 2 Einf gen Zur cksetzen Abbrechen Hilfe gt Wahlen Sie mindestens zwei Analysevariablen aus und geben Sie die Anzahl der Dimensionen in der L sung an Klicken Sie auf OK Sie k nnen au erdem Beschriftungsvariablen f r die Diagramme und Zusatzvariablen bestimmen die in die gefundene L sung eingepa t werden Definition des Variablengewichts bei der Mehrfachkorrespondenzanalyse Sie k nnen das Gweicht f r die Analysevariablen festlegen Abbildung 6 3 Dialogfeld Variablengewicht definieren MCA Variablengewicht definieren EJ Yariablengewichtung 1 Abbrechen Hilfe Variablengewichtung Sie k nnen f r jede Variable eine Gewichtung festlegen Bei dem angegebenen Wert muss es sich um eine positive ganze Zahl handeln Der Standardwert ist 1 59 Mehrfachkorrespondenzanalyse Mehrfachkorrespondenzanalyse Diskretisierung Im Dialogfeld Kategoriale Hauptkomponenten Diskretisierung k nnen Sie eine Methode zum Umkodieren d
121. Korrespondenzanalyse Modell X Dimensionen in der L sung rDistanzma Chi Quadrat Euklidisch rStandardisierungsmethode Zeilen und Spaltenmittel werden entfernt Zeilenmittel werden entfernt d Spaltenmittel werden entfernt Zeilensummen werden angeglichen und Mittelwerte entfernt ensummen werden angeglichen und Mittelwerte entfernt rNormalisierungsmethode Symmetrisch Zeilenprinzipal Anpassen Spaltenprinzipal Abbrechen Hilfe W hlen Sie Prinzipal als Normalisierungsmethode Klicken Sie auf Weiter Klicken Sie im Dialogfeld Korrespondenzanalyse auf Diagramme 251 Korrespondenzanalyse Abbildung 12 44 Dialogfeld Diagramme Korrespondenzanalyse Diagramme rStreudiagramme Biplot eilenpunkte Spaltenpunkte Breite f r Beschriftungen 20 Liniendiagramme Transformierte Zeilenkategorien Transformierte Spaltenkategorien r Beschriftunger 20 Diagrammdimensionen Alle Dimensionen in der L sung anzeigen Anzahl der Dimensionen beschr nken _ Abbrechen J Hite gt Wahlen Sie in der Gruppe Streudiagramme die Option Zeilenpunkte gt Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Korrespondenzanalyse auf OK Korrespondenztabelle Die neue Distanz 0 zwischen Seattle und Miami bed
122. Liste der Reihenfolge der Spalten mit den hnlichkeiten entspricht W hlen Sie optional Gewichtungsvariablen aus Die Anzahl muss der Anzahl der ausgew hlten hnlichkeitsvariablen entsprechen Achten Sie darauf dass die Reihenfolge der Gewichtungen der Reihenfolge der damit gewichteten hnlichkeiten entspricht gt Wenn mehrere Quellen vorhanden sind w hlen Sie optional eine Quellenvariable aus Die Anzahl der F lle in jeder hnlichkeitsvariablen muss der Anzahl der hnlichkeitsvariablen multipliziert mit der Anzahl der Quellen entsprechen Dar ber hinaus k nnen Sie ein Modell f r die multidimensionale Skalierung angeben Einschr nkungen f r den gemeinsamen Raum festlegen Konvergenzkriterien festlegen die zu verwendende Ausgangskonfiguration angeben sowie Diagramme und die Ausgabe ausw hlen 73 Multidimensionale Skalierung PROXSCAL hnlichkeiten in Spalten Wenn Sie im Dialogfeld Datenformat das Modell mit mehreren Spalten f r mehrere Quellen ausw hlen wird das Hauptdialogfeld folgenderma en dargestellt Abbildung 7 3 Dialogfeld Ahnlichkeiten in Spalten Multidimensionale Skalierung hnlichkeiten in Spalten Dee Pa prox1 2 won Fon ern Spalten Gewichtungen ox Einf gen Zur cksetzen Abbrechen Hite W hlen Sie mindestens zwei hnlichkeitsvariablen aus Es wird davon ausg
123. Messniveau neu zu skalieren Bindungen werden beibehalten ffnen Sie erneut das Dialogfeld Multidimensionale Skalierung und klicken Sie auf Modell gt W hlen Sie Ordinal als hnlichkeitstransformation Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Multidimensionale Skalierung auf Einschr nkungen 286 Kapitel 14 Abbildung 14 17 Dialogfeld Einschr nkungen E Multidimensionale Skalierung Einschrankungen Einschrankungen im gemeinsamen Raum Keine Einschrankungen Einige Koordinaten sind fest Lineare Kombination der unabh ngigen variablen Einschr nkungsvariablen Variablen einlesen aus kinship_yar sav Verf gbar Ausgew hlt gender gender nominal gener gener ordinal degree degreetordinal Transformationen f r unabh ngige Variablen Ordinal Bindungen beibehatt weiter Abbrechen Hite J W hlen Sie gener und degree W hlen Sie in der Dropdown Liste f r die Transformationen unabh ngiger Variablen den Eintrag Ordinal Bindungen beibehalten Klicken Sie auf ndern Klicken Sie auf Weiter Klicken Sie im Dialogfeld Multidimensionale Skalierung auf OK Transformationsdiagramme Mithilfe der Transformationsdiagramme k nnen Sie rasch pr fen ob die urspr nglichen Transformationen angemessen waren Wenn die Diagramme ungef hr linear sind ist die lineare Annahme geeignet Pr
124. Modellzusammenfassung Varianz ber cksichtigt Cronbachs Gesamt Dimension Alpha Eigenwert Tragheit der Varianz 1 2 Gesamt Mittelwert a Der Mittelwert von Cronbachs Alpha basiert auf dem Mittelwert der Eigenwerte Fast die gesamte Varianz der Daten wird durch die L sung erkl rt 62 1 durch die erste Dimension und 36 8 durch die zweite Zusammen bieten die beiden Dimensionen eine Interpretation hinsichtlich der Distanzen Wenn Variablen gute Unterscheidungen bieten befinden sich die Objekte nahe bei den Kategorien zu denen sie geh ren Idealerweise befinden sich Objekte in derselben Kategorie nahe beieinander sie sollten also hnliche Bewertungen aufweisen und Kategorien mit unterschiedlichen Variablen befinden sich nahe beieinander wenn Sie zu denselben Objekten geh ren d h zwei Objekte die hnliche Werte f r eine bestimmte Variable aufweisen sollten auch hnliche Bewertungen f r die anderen Variablen in der L sung aufweisen Objektwerte Nach der Untersuchung der Modellzusammenfassung sollten Sie sich den Objektwerten zuwenden Sie k nnen eine oder mehrere Variablen f r die Beschriftung des Objektwertediagramms angeben Jede Beschriftungsvariable erzeugt ein separates Diagramm das mit den Werten dieser Variablen beschriftet ist Wir betrachten das Diagramm der Objektwerte das anhand des Variablenobjekts beschriftet ist Dies ist nur eine Fallidentifizierungsvariable die nicht bei Berechnungen verwe
125. REFSCAL bietet zahlreiche Verbesserungen gegen ber der in SPSS Base verf gbaren Entfaltungsprozedur ber ALSCAL Mit PREFSCAL kann der gemeinsame Raum eingeschr nkt werden Au erdem wird in PREFSCAL versucht ein penalisiertes Stressma zu minimieren was dazu beitr gt degenerierte L sungen zu vermeiden f r die ltere Algorithmen anf llig sind Seitenverh ltnis in Diagrammen mit optimaler Skalierung Das Seitenverh ltnis in Diagrammen mit optimaler Skalierung ist isotropisch Bei einem zweidimensionalen Diagramm ist die Distanz die in Dimension 1 f r eine 1 Einheit steht gleich der Distanz die in Dimension 2 f r eine 1 Einheit steht Wenn Sie bei einem zweidimensionalen Diagramm den Bereich einer Dimension ndern ndert das System die Gr e der anderen Dimension um die physischen Abst nde gleich gro zu halten Das isotropische Seitenverh ltnis kann f r die Prozeduren f r die optimale Skalierung nicht au er Kraft gesetzt werden Empfohlene Literatur In folgenden Texten finden Sie allgemeine Informationen zu den Verfahren zur optimalen Skalierung Barlow R E D J Bartholomew D J Bremner als auch H D Brunk 1972 Statistical inference under order restrictions New York John Wiley and Sons Benz cri J P 1969 Statistical analysis as a tool to make patterns emerge from data In Methodologies of Pattern Recognition S Watanabe Hg New York Academic Press 35 74 Bishop Y M S E Fe
126. SPSS Datendatei Geben Sie TableNumber_1 als Tabellennummernvariable ein Klicken Sie auf Weiter 159 Kategoriale Hauptkomponentenanalyse Abbildung 10 20 Systemsteuerung des Ausgabeverwaltungssystems Anforderungen a Ausgabeverwaltungssystem OMS Bedienfeld X K Neue Anforderung sonstigen gew nschten Eigenschaften aus und klicken Sie auf Hinzuf gen Unter Tabellenuntertypen werden nur Ausgabetypen Befehls IDs Tabellenuntertypen f r ausgew hlte Befehle Ausgabeziele Status ID Typen Untertypen Beschriftungen Beenden Alle beenden Protokollierung Um eine Anforderung hinzuzuf gen w hlen Sie mindestens einen Eintrag aus den unten stehenden Listen sowie alle Hinzuf gen Untertypen angezeigt die f r mindestens eine der ausgew hlten Prozeduren verf gbar sind Optionen Diagramme Cases to Variables 7 PtY Statistics Keine Pd iteration History Protokolle CATPCA E S Datei Tabellen O Dat Texte BER Basierend auf Objektnamen Durchsuchen berschriften Ordner Warnungen Classification Tree Durchsuchen B ume Cluster h ca Neues Daten Set Conjoint Analysis Warnings _ Bus Viewer ausschlie en ID hriftungen Klicken Sie auf Hinzuf gen Klicken Sie auf OK und dann noch einmal auf OK um die OMS Sitzung zu best tigen Das Ausgabeverwaltungssystem OMS ist nun so einge
127. SS Sie ben tigen diese Seriennummer wenn Sie sich an SPSS wenden um Informationen ber Kundendienst zu Zahlungen oder Aktualisierungen des Systems zu erhalten Die Seriennummer wird mit dem Base System ausgeliefert Kundendienst Wenden Sie sich mit Fragen bez glich der Lieferung oder Ihres Kundenkontos an Ihr regionales SPSS B ro das Sie auf der SPSS Website unter http www spss com worldwide finden Halten Sie bitte stets Ihre Seriennummer bereit Ausbildungsseminare SPSS bietet ffentliche und unternehmensinterne Seminare an Alle Seminare beinhalten auch praktische bungen Seminare finden in gr eren St dten regelm ig statt Wenn Sie weitere Informationen zu diesen Schulungen w nschen wenden Sie sich an Ihr regionales SPSS B ro das Sie auf der SPSS Website unter http www spss com worldwide finden Technischer Support Kunden von SPSS mit Wartungsvertrag k nnen den Technischen Support in Anspruch nehmen Kunden k nnen sich an den Technischen Support wenden wenn sie Hilfe bei der Arbeit mit SPSS oder bei der Installation in einer der unterst tzten Hardware Umgebungen ben tigen Informationen ber den Technischen Support finden Sie auf der Website von SPSS unter http www spss com oder wenden Sie sich an Ihr regionales SPSS B ro das Sie auf der SPSS Website unter http www spss com worldwide finden Bei einem Anruf werden Sie nach Ihrem Namen dem Namen Ihrer Organisation und Ihrer Seriennummer gefragt We
128. SS 0001 MAXITER 5000 PENALTY LAMBDA 0 5 OMEGA 1 0 PRINT MEASURES COMMON PLOT COMMON WEIGHTS INDIVIDUAL ALL m Die einzige nderung besteht im Unterbefehl INITIAL Die Ausgangskonfiguration wurde als CORRESPONDENCE festgelegt Dabei werden die Ergebnisse einer Korrespondenzanalyse der invertierten Daten hnlichkeiten anstelle von Un hnlichkeiten mit symmetrischer Normalisierung der Zeilen und Spaltenwerte verwendet 309 Ma e Abbildung 15 19 Ma e f r Ausgangskonfiguration mit Korrespondenzanalyse lterationen Endg ltiger Funktionswert Wertteile der Funktion Fehlende Anpassung G te der Anpassung Variationskoeffizienten Indizes f r Degeneration Stressteil Penalisierungsteil Normalisierter Stress Stress Inach Kruskal Stress Il nach Kruskal Stress nach Young 5 Stress Il nach Young Erklarte Streuung Erkl rte Yarianz Ermittelte Bevorzungsordnungen Spearman Rho Kendall Tau b Variation der hnlichkeiten Variation der transformierten hnlichkeiten Variation der Distanzen Quadratsumme von DeSarbos Indizes f r Vermischung Shepards Index f r Nicht Degeneration 385 8140741 3493640 18969229 1212145 3481587 1 0770522 4812632 6871733 3787855 5183498 7174981 6446272 5165230 5590170 6122308 4043695 17571887 7532124 Multidimensionale Entfaltung Der Algorithmus konvergiert nach 385 Iterationen bei einem endg ltigen pe
129. Snack with beverage only Wichtigkeitb a Die Spezifit t gibt an wie typisch eine Quelle ist Der Bereich f r die Spezifit t liegt zwischen null und eins Dabei weist null auf eine durchschnittliche Quelle mit identischen Dimensionsgewichtungen hin Eins weist auf eine sehr spezifische Quelle mit einer ungew hnlich gro en Dimensionsgewichtung und anderen Gewichtungen nahe null hin b Relative Wichtigkeit jeder Dimension als Verh ltnis der Quadratsumme einer Dimension zur Gesamtquadratsumme F r jede Quelle wird ein individueller Raum berechnet In den Dimensionsgewichtungen wird die Beteiligung der individuellen R ume an den Dimensionen des gemeinsamen Raums gezeigt Eine gr ere Gewichtung weist auf eine gr ere Distanz im individuellen Raum und somit auf eine gr ere Unterscheidung zwischen den Objekten in dieser Dimension f r diesen individuellen Raum hin m Spezifit t ist ein Ma der Abweichung eines individuellen Raums vom gemeinsamen Raum Ein individueller Raum der mit dem gemeinsamen Raum identisch ist hat identische Dimensionsgewichtungen und eine Spezifit t von 0 Ein individueller Raum der in einer bestimmten Dimension einzigartig ist weist hingegen eine einzige gro e Dimensionsgewichtung und eine Spezifit t von 1 auf In diesem Fall sind die Quellen mit den gr ten Abweichungen Breakfast with juice bacon and eggs and beverage sowie Snack with beverage only m Wichtigkeit ist ein Ma f r den rela
130. Stark 0 4 N S 02 gt Nichtraucher a o Mittel E 00 Angestellter mit Erf o a 0 2 Sekretariat o e Angestellter ohne Er 04 Leicht 0 6 T T T T Fi 0 8 0 6 0 4 0 2 0 0 0 2 0 4 0 6 Dimension 1 Die Interpretation des Diagramms ist unkompliziert Zeilen Spaltenpunkte die nahe beieinander liegen sind einander hnlicher als Punkte die weit voneinander entfernt sind Mit der zweiten Dimension werden Manager von anderen Angestellten getrennt mit der ersten Dimension dagegen Senior Kr fte von Junior Kr ften Die Sekretariatsangeh rigen befinden sich zwischen diesen Positionen Durch die symmetrische Normalisierung kann die Beziehung zwischen Berufsgruppe und Rauchgewohnheiten m helos untersucht werden Manager liegen beispielsweise n her an der Rauch Kategorie Stark Angestellte mit Erfahrung dagegen nahe an der Kategorie Nichtraucher Angestellte ohne Erfahrung fallen offensichtlich in die Kategorien Mittel oder Leicht Den Sekretariatsangeh rigen lassen sich keine bestimmten Rauchgewohnheiten zuordnen diese Mitarbeiter sind jedoch weit von der Kategorie Stark entfernt Profile und Distanzen Um die Distanz zwischen den Kategorien zu ermitteln werden bei der Korrespondenzanalyse nicht nur die Randverteilungen ber cksichtigt sondern auch die einzelnen Zellh ufigkeiten Es werden Zeilen und Spaltenprofile berechnet also die Zeilen und Spaltenanteile f r jede Zelle auf der Grundlage der Randsummen 224 Kap
131. Unternehmen nhis2000_subset sav Die National Health Interview Survey NHIS ist eine gro e bev lkerungsbezogene Umfrage in unter der US amerikanischen Zivilbev lkerung Es werden pers nliche Interviews in einer landesweit repr sentativen Stichprobe von Haushalten durchgef hrt F r die Mitglieder jedes Haushalts werden demografische Informationen und Beobachtungen zum Gesundheitsverhalten und Gesundheitsstatus eingeholt Diese Datendatei enth lt eine Teilmenge der Informationen aus der Umfrage des Jahres 2000 National Center for Health Statistics National Health Interview Survey 2000 Datendatei und Dokumentation ffentlich zug nglich ftp ftp cdc gov pub Health_Statistics NCHS Datasets NHIS 2000 Zugriff erfolgte 2003 ozone sav Die Daten enthalten 330 Beobachtungen zu sechs meteorologischen Variablen zur Vorhersage der Ozonkonzentration aus den brigen Variablen Bei fr heren Untersuchungen Breiman als auch Friedman 1985 Hastie als auch Tibshirani 1990 fanden Wissenschaftler einige Nichtlinearit ten unter diesen Variablen die die Standardverfahren bei der Regression behindern pain_medication sav Diese hypothetische Datendatei enth lt die Ergebnisse eines klinischen Tests f r ein entztindungshemmendes Medikament zur Schmerzbehandlung bei chronischer Arthritis Von besonderem Interesse ist die Zeitdauer bis die Wirkung des Medikaments einsetzt und wie es im Vergleich mit bestehenden Medikamenten abschneidet
132. Variable Preference enth lt den Rang der durchschnittlichen Einstufung f r die verschiedenen Profile Ein niedriger Rang bedeutet eine starke Bevorzugung Diese Variable gibt ein Gesamtma der Bevorzugung f r die Profile an carpet_prefs sav Diese Datendatei beruht auf denselben Beispielen wie f r carpet sav beschrieben enth lt jedoch die tats chlichen Einstufungen durch jeden der 10 Kunden Die Kunden wurden gebeten die 22 Produktprofile in der Reihenfolge ihrer Pr ferenzen einzustufen Die Variablen PREF bis PREF22 enthalten die IDs der zugeordneten Profile wie in carpet_plan sav definiert catalog sav Diese Datendatei enth lt hypothetische monatliche Verkaufszahlen f r drei Produkte die von einem Versandhaus verkauft werden Daten f r f nf m gliche Einflussvariablen wurden ebenfalls aufgenommen catalog_seasfac sav Diese Datendatei ist mit catalog sav identisch au er dass ein Set von saisonalen Faktoren die mithilfe der Prozedur Saisonale Zerlegung berechnet wurden sowie die zugeh rigen Datumsvariablen hinzugef gt wurden cellular sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Mobiltelefonunternehmens geht die Kundenabwanderung zu verringern Scores f r die Abwanderungsneigung von 0 bis 100 werden auf die Kunden angewendet Kunden mit einem Score von 50 oder h her streben vermutlich einen Anbieterwechsel an ceramics sav Hierbei handelt es sich um eine h
133. Verlag 207 217 Meulman J J A J Van der Kooij als auch W J Heiser 2004 Principal components analysis with nonlinear optimal scaling transformations for ordinal and nominal data In Handbook of Quantitative Methodology for the Social Sciences D Kaplan Hg Thousand Oaks Kalifornien Sage Publications Inc 49 70 Theunissen N C M J J Meulman A L Den Ouden H M Koopman G H Verrips S P Verloove Vanhorick als auch J M Wit 2003 Changes can be studied when the measurement instrument is different at different time points Health Services and Outcomes Research Methodology 4 109 126 191 Kategoriale Hauptkomponentenanalyse Tucker L R 1960 Intra individual and inter individual multidimensionality In Psychological Scaling Theory amp Applications H Gulliksen als auch S Messick Hgg New York John Wiley and Sons 155 167 Vlek C als auch P J Stallen 1981 Judging risks and benefits in the small and in the large Organizational Behavior and Human Performance 28 235 271 Wagenaar W A 1988 Paradoxes of gambling behaviour London Lawrence Erlbaum Associates Inc Young F W Y Takane als auch J De Leeuw 1978 The principal components of mixed measurement level multivariate data An alternating least squares method with optimal scaling features Psychometrika 43 279 281 Zeijl E Y te Poel M du Bois Reymond J Ravesloot als auch J J Meulman 2000 The role of pare
134. a e Bereich definieren Einf gen _ Zur cksetzen Abbrechen Hilfe W hlen Sie Zeile als Zeilenvariable aus Klicken Sie auf Bereich definieren 249 Abbildung 12 41 Dialogfeld Zeilenbereich definieren rKategorienbereich f r Zeilenvariable Zeile Minimalwert Maximalwert _Aktusiisieren E Korrespondenzanalyse Zeilenbereich definieren K rNebenbedingungen f r Kategorien Keine Kategorien m ssen gleich sein Erg nzende Kategorie Geben Sie 1 als Mindestwert ein Geben Sie 10 als H chstwert ein Klicken Sie auf Aktualisieren Klicken Sie auf Weiter vy vyv vv v y Abbildung 12 42 Dialogfeld Spaltenbereich definieren rKategorienbereich f r Spaltenvariable Spalte Minimalwert Maximalwert Wahlen Sie Spalte als Spaltenvariable aus Klicken Sie im Dialogfeld Korrespondenzanalyse auf Bereich definieren E Korrespondenzanalyse Spaltenbereich definieren X rNebenbedingungen f r Kategorien Keine Kategorien m ssen gleich sein Erg nzende Kategorie Weiter Abbrechen Hilfe Geben Sie 1 als Mindestwert ein Geben Sie 10 als H chstwert ein Korrespondenzanalyse 250 Kapitel 12 Klicken Sie auf Aktualisieren Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Korrespondenzanalyse auf Modell Abbildung 12 43 Dialogfeld Modell
135. abgebildet Transformierte unabh ngige Variablen Es werden Transformationsdiagramme f r die unabh ngigen Variablen erstellt Variablen und Dimensionskorrelationen Es wird ein Diagramm der Korrelationen zwischen den unabh ngigen Variablen und den Dimensionen des gemeinsamen Raums angezeigt Multidimensionale Skalierung Diagramme Version 2 Im Dialogfeld Diagramme k nnen Sie die zu erstellenden Diagramme festlegen Wenn ein beliebiges Datenformat au er dem Datenformat hnlichkeiten in Spalten ausgew hlt wurde wird das Dialogfeld Diagramme wie folgt angezeigt Geben Sie f r die Diagramme Individuelle Raumgewichtungen Urspr ngliche ber transformierte hnlichkeiten und Transformierte hnlichkeiten ber Distanzen die Quellen an f r die die Diagramme erzeugt werden sollen Die eingegebenen Quellennummern m ssen Werte der im Hauptdialogfeld angegebenen Quellenvariable sein und im Bereich von 1 bis zur Anzahl der Quellen liegen Abbildung 7 11 Dialogfeld Diagramme Version 2 E Muttidimensionale Skalierung Diagramme x Diagramme v Stress _ Urspr ngliche ber transformierte hnlichkeiten v Gemeinsamer Raum _ Transformierte hnlichkeiten gegen Distanzen Transformierte unabh ngige Yariablen v Variablen und Dimensionskorrelationen Diagramme der Quellen Weiter Abbrechen Hilfe 83 Multidimensionale Sk
136. ablen mit 5000 Kategorien ganz erheblich F r Pressure gradient mm Hg gilt ein Bereich von 69 bis 107 Bei der Prozedur werden alle Kategorien aus der Analyse ausgeschlossen die mit einem negativen Wert kodiert sind Wenn Sie diese Variable jedoch in gleiche Intervalle mit der L nge 10 diskretisieren ergeben sich etwa 19 Kategorien Temperature degrees F erstreckt sich von 25 bis 93 auf der Fahrenheit Temperaturskala Sollen diese Daten wie Daten auf der Celsius Temperaturskala analysiert werden diskretisieren Sie diese Variablen in gleiche Intervalle mit der L nge 1 8 Variablen k nnen auf unterschiedliche Weise diskretisiert werden Die hier angegebenen Werte sind rein subjektiv Wenn Sie weniger Kategorien erzielen m chten verwenden Sie l ngere Intervalle Day ofthe year k nnte beispielsweise in Monate oder in Jahreszeiten aufgegliedert werden Auswahl des Transformationstyps Jede Variable kann in einer von mehreren verschiedenen Ebenen analysiert werden Das Ziel ist jedoch die Vorhersage der Antwort darum sollten Sie die Antwort direkt mithilfe des numerischen Messniveaus der optimalen Skalierung skalieren Die Reihenfolge und die Differenzen zwischen den Kategorien werden entsprechend in der transformierten Variablen beibehalten Zum Ausf hren einer kategorialen Regressionsanalyse w hlen Sie die folgenden Befehle aus den Men s aus Analysieren Regression Optimale Skalierung 119 Kategoriale Regression
137. abweichung 2 132 5 Gesamtau swertung a 110 Freiheitsgrade 3746 97 Beitr ge Die bersicht der Zeilenpunkte zeigt die Beitr ge der Zeilenpunkte zur Tr gheit der Dimensionen sowie den Beitrag der Dimensionen zur Tr gheit der Zeilenpunkte Wenn alle Punkte gleichm ig zur Tr gheit beitr gen w re der Beitrag gleich 0 043 Die Attribute gesund und fettarm tragen beide einen betr chtlichen Anteil zur Tr gheit der ersten Dimension bei Die Attribute M nner und stark liefern die gr ten Beitr ge zur Tr gheit der zweiten Dimension Sowohl h sslich als auch frisch bringen nur sehr geringe Beitr ge zu den Dimensionen 240 Kapitel 12 Abbildung 12 29 Beitr ge der Attribute Dimension Beitrag der Tr gheit der der Dimension an der bersicht Dimension Tr gheit des Punktes u ata som Tragheit 2 1 2 bersicht macht dick 825 M nner 992 S d Australien 266 traditionell 715 premium 805 gesund i K 973 Koffein 55 neu 914 attraktiv 918 schwer 964 popul r 774 Heilmittel 655 fettarm f i 962 Kinder 559 Arbeit 948 s ss 550 unpopul r i 670 hasslich i 131 frisch 410 Yuppies 637 n hrstoffreich 951 Frauen 972 gering 600 Aktiver Gesamtwert Zwei Dimensionen tragen einen Gro teil der Tr gheit bei den meisten Zeilenpunkten bei Die gro en Anteile der ersten Dimension an gesund neu attraktiv fettarm n hrstoffreich
138. achtet werden m Fehlende Werte ersetzen Fehlende Werte werden bei Objekten mit fehlenden Werten f r die ausgew hlte Variable gesetzt Sie k nnen die Methode ausw hlen nach der die Werte gesetzt werden W hlen Sie Modalwert wenn fehlende Werte durch die h ufigste Kategorie ersetzt werden sollen Falls mehrere Modalwerte vorhanden sind wird der Modalwert mit der kleinsten Kategorienummer verwendet Wenn Sie Zusatzkategorie ausw hlen werden fehlende Werte durch die gleiche Quantifikation einer zus tzlichen Kategorie ersetzt Dies bedeutet aber auch dass Objekte mit einem fehlenden Wert f r diese Variable als zur gleichen Kategorie der zus tzlichen zugeh rig betrachtet werden m Objekte mit fehlenden Werten f r diese Variable ausschlie en Objekte mit fehlenden Werten f r die ausgew hlte Variable werden aus der Analyse ausgeschlossen Diese Strategie ist f r Zusatzvariablen nicht verf gbar Kategoriale Hauptkomponenten Optionen Im Dialogfeld Kategoriale Hauptkomponenten Optionen k nnen Sie die anf ngliche Konfiguration ausw hlen Kriterien f r die Iterationen und die Konvergenz festlegen eine Normalisierungsmethode ausw hlen die Methode zum Beschriften der Diagramme ausw hlen und Zusatzobjekte angeben 32 Kapitel 3 Abbildung 3 6 Dialogfeld Optionen Kategoriale Hauptkomponenten Optionen Zusatzobjekte Normalisierungsmethode G Bereich von F llen Va
139. agramm unter Verwendung der urspr nglichen Spaltenkategoriewerte und der entsprechenden Spaltenwerte Optional k nnen Sie angeben wie viele Zeichen in Wertelabels zur Beschriftung der Kategorienachse verwendet werden sollen Dieser Wert muss eine nichtnegative Ganzzahl sein die kleiner oder gleich 20 ist Diagrammdimensionen Hiermit legen Sie fest wie die Statistiken in der Ausgabe angezeigt werden 55 Korrespondenzanalyse Alle Dimensionen in der L sung anzeigen Alle Dimensionen in der L sung werden in einer Streudiagramm Matrix angezeigt m Anzahl der Dimensionen beschr nken Die angezeigten Dimensionen werden auf geplottete Paare beschr nkt Wenn Sie die Dimensionen beschr nken m ssen Sie die niedrigste und die h chste Dimension ausw hlen die jeweils geplottet werden soll Die niedrigste Dimension muss im Bereich von 1 bis zur Anzahl der Dimensionen in der L sung minus 1 liegen und wird gegen h here Dimensionen geplottet Der Wert f r die h chste Dimension muss im Bereich von 2 bis zur Anzahl der Dimensionen in der L sung liegen und gibt die h chste Dimension an die beim Plotten der Dimensionspaare verwendet wird Diese Spezifikation gilt f r alle angeforderten multidimensionalen Plots Zus tzliche Funktionen beim Befehl CORRESPONDENCE Sie k nnen die Korrespondenzanalyse an Ihre Bed rfnisse anpassen wenn Sie Ihre Auswahl in ein Syntax Fenster einf gen und die resultierende Befehlssyntax f r den Befehl
140. al F r diese Situation ist die Hauptkomponentenanalyse ideal da der Zweck der Studie darin besteht die Beziehungen zwischen den Symptomen und den verschiedenen Klassen von E st rungen zu bestimmen Au erdem ist die kategoriale Hauptkomponentenanalyse wahrscheinlich n tzlicher als die klassische Hauptkomponentenanalyse da die Wertung f r die Symptome auf einer ordinalen Skala erfolgt Durchf hrung der Analyse Um die Struktur des Krankheitsverlaufs f r die einzelnen Diagnosen ordnungsgem besser untersuchen zu k nnen sollten Sie die Ergebnisse der Tabelle der projizierten Zentroide als Daten f r Streudiagramme verf gbar machen Sie k nnen dies mithilfe des Ausgabeverwaltungssystems OMS erreichen gt Um eine OMS Anforderung zu starten w hlen Sie die folgenden Befehle aus den Men s aus Extras OMS Steuerung 157 vv v y Kategoriale Hauptkomponentenanalyse Abbildung 10 18 Systemsteuerung des Ausgabeverwaltungssystems i Ausgabeverwaltungssystem OMS Bedienfeld X Anforderungen Status ID Typen Befehle Untertypen Beschriftungen i Beenden Alle beenden Protokollierung Neue Anforderung Um eine Anforderung hinzuzuf gen w hlen Sie mindestens einen Eintrag aus den unten stehenden Listen sowie alle sonstigen gew nschten Eigenschaften aus und klicken Sie auf Hinzuf gen Unter Tabellenuntertypen werden nur Untertypen angezeigt die f r mindestens eine der ausgew hlten Prozeduren verf
141. al 2 2 a seal Spline ordinal 2 2 money Spline ordinal 2 2 L OK u Einf gen Zur cksetzen J Abbrechen Jl Hilfe W hlen Sie die abh ngige Variable und die unabh ngige n Variable n Klicken Sie auf OK ndern Sie bei Bedarf das Skalierungsniveau f r die einzelnen Variablen Definieren der Skala in der kategorialen Regression Sie k nnen das Messniveau der optimalen Skalierung f r die abh ngigen und unabh ngigen Variablen festlegen In der Standardeinstellung werden sie als monotone Splines zweiten Grades ordinal mit zwei inneren Knoten skaliert Au erdem k nnen Sie die Gewichtung der Analysevariablen bestimmen 18 Kapitel 2 Abbildung 2 2 Dialogfeld Skala definieren i Kategoriale Regression Skala definie Messniveau der optimalen Skalierung G Spline ordinal Ordinal Spline nominal Nominal Numerisch Spline PE Grad 2 Innere Knoten 2 Weiter Abbrechen Hilfe Messniveau der optimalen Skalierung Sie k nnen auch das Messniveau zur Quantifizierung jeder Variablen ausw hlen Spline ordinal Die Reihenfolge der Kategorien bei der beobachteten Variable wird bei der optimal skalierten Variable beibehalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch den Koordinatenursprung plaziert Die resultierende Transformation ist ein glatter stii
142. al correlation analysis to three or more sets of variables In Proceedings of the 76th Annual Convention of the American Psychological Association 3 Washington D C American Psychological Association 227 228 De Leeuw J 1984 Canonical analysis of categorical data 2nd Hg Leiden DSWO Press Horst P 1961 Generalized canonical correlations and their applications to experimental data Journal of Clinical Psychology 17 331 347 Horst P 1961 Relations among m sets of measures Psychometrika 26 129 149 Kettenring J R 1971 Canonical analysis of several sets of variables Biometrika 58 433 460 Van der Burg E 1988 Nonlinear canonical correlation and some related techniques Leiden DSWO Press Van der Burg E als auch J De Leeuw 1983 Nonlinear canonical correlation British Journal of Mathematical and Statistical Psychology 36 54 80 Van der Burg E J De Leeuw als auch R Verdegaal 1988 Homogeneity analysis with k sets of variables An alternating least squares method with optimal scaling features Psychometrika 53 177 197 Verboon P als auch I A Van der Lans 1994 Robust canonical discriminant analysis Psychometrika 59 485 507 Kapitel Korrespondenzanalyse Eine Korrespondenztabelle ist jede Zweifach Tabelle deren Zellen eine gewisse Korrespondenz zwischen den Zeilen und Spalten zeigen Das Korrespondenzma kann ein Hinweis auf die hnlichkeit Affinit t Konfusion Assoziation od
143. ale L sung f r behavior sav brakes sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Qualit tskontrolle in einer Fabrik geht die Scheibenbremsen f r Hochleistungsautomobile herstellt Die Datendatei enth lt Messungen des Durchmessers von 16 Scheiben aus 8 Produktionsmaschinen Der Zieldurchmesser f r die Scheiben ist 322 Millimeter breakfast sav In einer klassischen Studie Green als auch Rao 1972 wurden 21 MBA Studenten der Wharton School mit ihren Lebensgef hrten darum gebeten 15 Fr hst cksartikel in der Vorzugsreihenfolge von 1 am meisten bevorzugt bis 15 am wenigsten bevorzugt zu ordnen Die Bevorzugungen wurden in sechs unterschiedlichen Szenarien erfasst von Overall preference Allgemein bevorzugt bis Snack with beverage only Imbiss nur mit Getr nk breakfast overall sav Diese Datei enth lt die Daten zu den bevorzugten Fr hst cksartikeln allerdings nur f r das erste Szenario Overall preference Allgemein bevorzugt broadband_1 sav Hierbei handelt es sich um eine hypothetische Datendatei die die Anzahl der Abonnenten eines Breitband Service nach Region geordnet enth lt Die Datendatei enth lt die monatlichen Abonnentenzahlen f r 85 Regionen ber einen Zeitraum von vier Jahren broadband_2 sav Diese Datendatei stimmt mit broadband_1 sav berein enth lt jedoch Daten f r weitere drei Monate 328 Anhang A car_insurance_claims sav
144. alen Niveau skaliert wurden Beziehung zu Standardverfahren Die Mehrfachkorrespondenzanalyse kann als Analyse einer mehrdimensionalen Kontingenztafel betrachtet werden Mehrdimensionale Kontingenztafeln k nnen auch mit der Prozedur Crosstabs analysiert werden doch Crosstabs gibt getrennte Zusammenfassungsstatistiken f r die einzelnen Kategorien jeder Kontrollvariablen aus Bei der Mehrfachkorrespondenzanalyse kann h ufig die Beziehung zwischen allen Variablen in einem 13 Einf hrung in die Prozeduren f r die optimale Skalierung von kategorialen Daten einzelnen zweidimensionalen Diagramm zusammengefa t werden Eine erweiterte Verwendung der Mehrfachkorrespondenzanalyse besteht darin die urspr nglichen Kategoriewerte mit den optimalen Skalenwerten aus der ersten Dimension zu ersetzen und eine sekund re multivariate Analyse durchzuf hren Da die Mehrfachkorrespondenzanalyse die Kategoriebeschriftungen durch numerische Skalenwerte ersetzt k nnen nach der Mehrfachkorrespondenzanalyse viele verschiedene Prozeduren angewendet werden f r die numerische Daten erforderlich sind Die Prozedur Faktorenanalyse beispielsweise erstellt zun chst eine erste Hauptkomponente die der ersten Dimension der Mehrfachkorrespondenzanalyse entspricht Die Komponentenwerte in der ersten Dimension sind gleich den Objektwerten und die quadrierten Komponentenladungen sind gleich den Diskriminationsma en Die zweite Dimension der Mehrfachkorrespondenzanal
145. alerie Ausw hlen aus Favoriten Grundelemente Balken Linie Gruppen Punkt ID Fl che Kreis Polar Titel Fu noten Streu Punktdiagr Histogramm Hoch Tief Elementeigenschaft a Boxplot Doppelachsen Optionen A gt Rufen Sie die Diagrammerstellung erneut auf gt Heben Sie die Auswahl von Centroids Projected on Binge eating Zentroide auf Fre attacken projiziert als y Achsen Variable auf und w hlen Sie statt dessen Centroids Projected on Sexual attitude Zentroide auf sexuelle Einstellung projiziert als y Achsen Variable aus Klicken Sie auf OK 187 Kategoriale Hauptkomponentenanalyse Abbildung 10 52 Auf Sexual attitude sexuelle Einstellung projizierte Zentroide des Diagnosezeitpunkts im Verlauf der Zeit Datei Bearbeiten Ansicht Optionen Elemente Hilfe se HXYY MBS BR E wile Zee us Centroids Projected on Sexual attitude H 376 5 B 470 25 Pun gt Doppelklicken Sie dann zur Verbindung der Punkte auf das Diagramm und klicken Sie im Diagramm Editor auf das Tool zum Hinzufiigen von Interpolationslinien gt Schlie en Sie den Diagramm Editor Bei der sexuellen Einstellungen verlaufen die vier Kurven mehr oder weniger parallel und alle Gruppen zeigen Fortschritte Die bulimischen Gruppen weisen allerdings h here bessere Werte auf als die anorektische Gruppe 188 Kapitel 10 Abbildung 10 53 Diagrammer
146. alierung PROXSCAL Multidimensionale Skalierung Ausgabe Im Dialogfeld Ausgabe k nnen Sie die angezeigte Ausgabe steuern und Ausz ge davon in eigenen Dateien speichern Abbildung 7 12 Dialogfeld Ausgabe Multidimensionale Skalierung Ausgabe X Anzeige v Gemeinsame Raumkoordinaten kterationsprotokoll Multiple Stressma e _ Distanzen Stress Zerlegung HAsO Transformierte hnlichkeiten Transformierte unabh ngige Yariablen 4 V Eingabedaten M Variablen und Dimensionskorrelationen In neuer Datei speichern Gemeinsame Raumkoordinaten Distanzen Transformierte hnlichkeiten Transformierte unabh ngige Yariablen Weiter Abbrechen Hite Anzeige W hlen Sie mindestens eine der folgenden Anzeigeoptionen aus Gemeinsame Raumkoordinaten Zeigt die Koordinaten des gemeinsamen Raums an Individuelle Raumkoordinaten Zeigt nur dann die Koordinaten der individuellen R ume an wenn das Modell kein Identit tsmodell ist Individuelle Raumgewichtungen Zeigt nur dann die individuellen Raumgewichtungen an wenn eines der Modelle f r individuelle Differenzen angegeben ist Je nach Modell werden die Raumgewichtungen in Rotations und Dimensionsgewichtungen zerlegt die ebenfalls angezeigt werden Distanzen Zeigt die Distanzen zwischen den Objekten in der Konfiguration an Transformierte hnlichkeiten Zeigt die t
147. alyse Die Ergebnisse der Analyse legen nahe dass die Behandlung der Variablen Age in years als ordinal nicht ganz angemessen ist Age in years wird zwar auf ordinalem Messniveau gemessen die Beziehungen mit anderen Variablen sind jedoch nicht monoton Um die Auswirkungen zu untersuchen die beim Wechsel zum einzeln nominalen Messniveau mit optimaler Skalierung entstehen k nnen Sie die Analyse wiederholen 210 Kapitel 11 So f hren Sie die Analyse durch gt Rufen Sie das Dialogfeld Nichtlineare kanonische Korrelationsanalyse erneut auf und wechseln Sie zum ersten Set W hlen Sie age aus und klicken Sie auf Bereich und Skala definieren W hlen Sie im Dialogfeld Bereich und Skala definieren den Skalierungsbereich Einzeln nominal aus Klicken Sie auf Weiter Klicken Sie im Dialogfeld Nichtlineare kanonische Korrelationsanalyse auf OK Die Eigenwerte f r eine zweidimensionale L sung sind gleich 0 806 bzw 0 757 die Gesamtanpassung betr gt 1 564 Abbildung 11 26 Eigenwerte f r die zweidimensionale L sung GEBR pen Summe Yerlustfunktion Set1 Set2 Set3 Mittelwert Eigenwert Anpassung Die Tabellen f r die Mehrfachanpassung und Einzelanpassung zeigen dass Age in years immer noch einen hohen Diskriminationswert aufweist wie die Summe der Werte f r die Mehrfachanpassung belegt Im Gegensatz zu den fr heren Ergebnissen zeigt die Untersuchung der Einzelanpassungswerte jedoch dass die
148. amtanzahl der Zeilenkategorien minus 2 Definieren des Spaltenbereichs in der Korrespondenzanalyse Sie m ssen einen Bereich f r die Spaltenvariable angeben Die angegebenen Minimal und Maximalwerte m ssen ganzzahlig sein Gebrochene Datenwerte werden in der Analyse abgeschnitten Ein Kategoriewert der au erhalb des angegebenen Bereiches liegt wird in der Analyse ignoriert 50 Kapitel 5 Abbildung 5 3 Dialogfeld Spaltenbereich definieren E Korrespondenzanalyse Spaltenbereich definieren Kategorienbereich f r Spaltenvariable rauchen Minimalwert 4 Aktualisieren Maximalwert 4 Nebenbedingungen fiir Kategorien 2 3 Keine j Kategorien m ssen gleich sein Erg nzende Kategorie weiter Abbrechen Hite Alle Kategorien sind zun chst aktiv und nicht durch Nebenbedingungen eingesch nkt Sie k nnen festlegen dass bestimmte Spaltenkategorien anderen Spaltenkategorien entsprechen m ssen Au erdem k nnen Sie eine Spaltenkategorien als erg nzende Kategorie definieren m Kategorien m ssen gleich sein Die Kategorien m ssen gleiche Werte haben Verwenden Sie Gleichheitsbeschr nkungen wenn die erhaltene Ordnung der Kategorien nicht erw nscht oder nicht intuitiv ist Die maximale Anzahl der Spaltenkategorien f r die Gleichheitsbeschr nkungen festgelegt werden k nnen entspricht der Gesamtzahl aktiver Spaltenkategorien minus 1 Zum De
149. and margarine oO o 37 _ Toast and marmalade eh i Cinnamon bun 40 O 34 Buttered toast and jelR9 17 OGlazed donut 32 6 Seat tee a0 oO 25014 29 6 92 Hard rolls and butter i 0 Buttered toast O Danish pastry O o20 aai 31 74 1630 0 7 110 0 o 0 9 co 15 Coffee cake 27 442 23000 05 10 13 41 o 33 28 o blue pHRIMTUA Anst gaRRRANS a Cinnamon toast Dimension 2 Corn muffin and butter Dimension 1 Das verbundene Diagramm des gemeinsamen Raums erm glicht eine Interpretation der Dimensionen Die horizontale Dimension scheint eine Unterscheidung zwischen weichem und harten Brot oder Toast aufzuweisen wobei die Artikel nach rechts entlang der Achse weicher werden Bei der vertikalen Dimension ist keine eindeutige Interpretation m glich jedoch ist m glicherweise eine Unterscheidung nach blichkeit vorhanden bei der die Artikel nach unten entlang der Achse konventioneller werden Es entstehen mehrere Gruppen von Fr hst cksartikeln Zum Beispiel bilden Donuts Cinnamon Buns und Danish Pastry eine Gruppe von weichen und eher unkonventionellen Artikeln Muffins und Cinnamon Toast bilden eine Gruppe von h rteren jedoch auch konventionelleren Artikeln Die anderen Toasts und h rteren Br tchen bilden eine Gruppe von harten und eher unkonventionellen Artikeln Toast pop up ist ein harter und u erst unkonventioneller Artikel Die durch die Zeilenobjekte dargestellten Personen sind deutlich nach der Bevorz
150. ann und nicht nur die Ereigniswahrscheinlichkeit am Ende der Studie Sie wurde an anderer Stelle Collett et al 2003 vorgestellt und analysiert verd1985 sav Diese Datendatei enth lt eine Umfrage Verdegaal 1985 Die Antworten von 15 Subjekten auf 8 Variablen wurden aufgezeichnet Die relevanten Variablen sind in drei Sets unterteilt Set 1 umfasst alter und heirat Set 2 besteht aus pet und news und in Set 3 finden sich music und live Die Variable pet wird mehrfach nominal skaliert und die Variable Alter ordinal Alle anderen Variablen werden einzeln nominal skaliert virus sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Internet Dienstanbieters geht der die Auswirkungen eines Virus auf seine Netzwerke ermitteln m chte Dabei wurde vom Moment der Virusentdeckung bis zu dem Zeitpunkt zu dem die Virusinfektion unter Kontrolle war der ungef hre prozentuale Anteil infizierter E Mail in den Netzwerken erfasst waittimes sav Hierbei handelt es sich um eine hypothetische Datendatei zu den Wartezeiten f r Kunden bei drei verschiedenen Filialen einer Bank Jeder Fall entspricht einem Kunden und zeichnet die Wartezeit und die Filiale webusability sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um Tests zur Benutzerfreundlichkeit eines neuen Internetgesch fts geht Jeder Fall entspricht einer von f nf Testpersonen die die Benutzerfreundlichkeit bewerten und gibt f
151. ansche Guttman 1968 Adaptation einer Tabelle von Bell Bell 1961 untersucht Diese Daten werden auch von Lingoes Lingoes 1968 diskutiert Bell legte eine Tabelle zur Illustration m glicher sozialer Gruppen vor Guttman verwendete einen Teil dieser Tabelle bei der f nf Variablen die Aspekte beschreiben wie soziale Interaktion das Gef hl der Gruppenzugeh rigkeit die physische N he der Mitglieder und die Formalit t der Beziehung mit sieben theoretischen sozialen Gruppen gekreuzt wurden crowds Menschenmassen beispielsweise die Zuschauer eines Fu ballspiels audience Zuh rerschaften beispielsweise die Personen im Theater oder bei einer Vorlesung public ffentlichkeit beispielsweise Zeitungsleser oder Fernsehzuschauer mobs Mobs wie Menschenmassen jedoch mit wesentlich st rkerer Interaktion primary groups Prim rgruppen vertraulich secondary groups Sekund rgruppen freiwillig und modern community die moderne Gesellschaft eine lockere Konf deration die aus einer engen physischen N he und dem Bedarf an spezialisierten Dienstleistungen entsteht Die folgende Tabelle zeigt die Variablen im Daten Set die sich aus der Klassifizierung in sieben soziale Gruppen in den Guttman Bell Daten ergeben zusammen mit ihren Variablenlabeln und den Wertelabeln Kategorien die den Niveaus der einzelnen Variablen zugeordnet sind Dieses Daten Set finden Sie in guttman sav F r weitere In
152. aper read most often Music preferred Neighborhood preference Math test score Language test score Wertelabels 20 25 26 30 31 35 36 40 41 45 46 50 51 55 56 60 61 65 66 70 Single Married Other No Cat s Dog s Other than cat or dog Various domestic animals None Telegraaf Volkskrant NRC Other Classical New wave Popular Variety Don t like music Town Village Countryside 0 5 6 10 11 15 0 5 6 10 11 15 16 20 192 193 Nichtlineare kanonische Korrelationsanalyse Dieses Daten Set finden Sie in verd 985 sav F r weitere Informationen siehe Beispieldateien in Anhang A auf S 326 Die ersten sechs Variablen sind relevant diese Variablen sind in drei Sets gegliedert Set 1 umfasst alter und heirat Set 2 besteht aus pet und news und in Set 3 finden sich music und live Die Variable per ist mehrfach nominal skaliert die Variable age ordinal Alle anderen Variablen sind einzeln nominal skaliert F r diese Analyse ist eine zuf llige Anfangskonfiguration erforderlich Standardm ig ist diese Anfangskonfiguration numerisch Wird ein Teil der Variablen jedoch als einzeln nominal behandelt ohne dass eine M glichkeit zum Sortieren besteht sollten Sie eine zuf llige Anfangskonfiguration verwenden Bei den meisten Variablen in dieser Untersuchung ist dies der Fall Untersuchen der Daten gt Zum Erstellen einer nichtlinearen kanonischen Korrelationsanalyse f r dieses Daten Set w h
153. applications Toronto University of Toronto Press Nishisato S 1984 Forced classification A simple application of a quantification method Psychometrika 49 25 36 Nishisato S 1994 Elements of dual scaling An introduction to practical data analysis Hillsdale N J Lawrence Erlbaum Associates Inc Pratt J W 1987 Dividing the indivisible Using simple symmetry to partition variance explained In Proceedings of the Second International Conference in Statistics T Pukkila als auch S Puntanen Hgg Tampere Finnland Universit t Tampere 245 260 Price R H als auch D L Bouffard 1974 Behavioral appropriateness and situational constraints as dimensions of social behavior Journal of Personality and Social Psychology 30 579 586 Ramsay J O 1989 Monotone regression splines in action Statistical Science 4 425 441 Rao C R 1973 Linear statistical inference and its applications 2 Hg New York John Wiley and Sons Rao C R 1980 Matrix approximations and reduction of dimensionality in multivariate statistical analysis In Multivariate Analysis Vol 5 P R Krishnaiah Hg Amsterdam North Holland 3 22 342 Bibliografie Rickman R N Mitchell J Dingman als auch J E Dalen 1974 Changes in serum cholesterol during the Stillman Diet Journal of the American Medical Association 228 54 58 Rosenberg S als auch M P Kim 1975 The method of sorting as a data gathering pro
154. arit ten unter diesen Variablen die die Standardverfahren bei der Regression behindern Tabelle 9 2 Urspr ngliche Variablen Variable Beschreibung ozon daily ozone level kategorisiert in eine von 38 Kategorien ibh inversion base height dpg pressure gradient mm Hg vis visibility miles temp temperature degrees F doy day of the year 118 Kapitel 9 Dieses Daten Set finden Sie in ozone sav F r weitere Informationen siehe Beispieldateien in Anhang A auf S 326 Diskretisierung von Variablen Wenn eine Variable so viele Kategorien enth lt dass eine Interpretation nicht mehr praktikabel w re bearbeiten Sie die Kategorien im Dialogfeld Discretization F r die Variable Day of the year gilt ein Mindestwert von 3 und ein H chstwert von 365 Wird diese Variable in einer kategorialen Regression eingesetzt entspricht dies einer Variablen mit 365 Kategorien Bei Visibility miles gilt ein Bereich von 0 bis 350 Um die Interpretation der Analysen zu erleichtern diskretisieren Sie diese Variablen in gleiche Intervalle mit der L nge 10 Die Variable Inversion base height erstreckt sich ber einen Bereich von 111 bis 5000 Eine Variable mit so vielen Kategorien resultiert in u erst komplexen Beziehungen Wenn Sie diese Variable jedoch in gleiche Intervalle mit der L nge 100 diskretisieren erhalten Sie etwa 50 Kategorien Eine Variable mit nur 50 Kategorien vereinfacht die Interpretation gegen ber einer Vari
155. asst wurden die sich f r die Kaufgewohnheiten ihrer Kunden interessiert Jeder Kunde wird ber vier Wochen beobachtet und jeder Fall entspricht einer Kundenwoche und enth lt Informationen zu den Gesch ften in denen der Kunde einkauft sowie zu anderen Merkmalen beispielsweise welcher Betrag in der betreffenden Woche f r Lebensmittel ausgegeben wurde guttman sav Bell Bell 1961 legte eine Tabelle zur Darstellung m glicher sozialer Gruppen vor Guttman Guttman 1968 verwendete einen Teil dieser Tabelle bei der f nf Variablen die Aspekte beschreiben wie soziale Interaktion das Gef hl der Gruppenzugeh rigkeit die 331 Beispieldateien physische N he der Mitglieder und die Formalit t der Beziehung mit sieben theoretischen sozialen Gruppen gekreuzt wurden crowds Menschenmassen beispielsweise die Zuschauer eines Fu ballspiels audience Zuh rerschaften beispielsweise die Personen im Theater oder bei einer Vorlesung public ffentlichkeit beispielsweise Zeitungsleser oder Fernsehzuschauer mobs Mobs wie Menschenmassen jedoch mit wesentlich st rkerer Interaktion primary groups Prim rgruppen vertraulich secondary groups Sekund rgruppen freiwillig und modern community die moderne Gesellschaft ein lockerer Zusammenschluss der aus einer engen physischen N he und dem Bedarf an spezialisierten Dienstleistungen entsteht healthplans sav Hierbei handelt es sich um
156. ation der transformierten Ahnlichkeiten Variation der Distanzen Quadratsumme von DeSarbos Indizes f r Vermischung Shepards Index f r Nicht Degeneration 268 6044671 1747239 2 0911875 0305285 1747239 4444641 2707147 3978003 9694715 8454483 6574206 9032676 532788 5138436 4930018 4284849 3610680 7469043 Multidimensionale Entfaltung Der Algorithmus konvergiert nach 268 Iterationen bei einem endgiiltigen penalisierten Stress von 0 6044671 Diese Statistik und die anderen Ma e sind f r diese L sung etwas besser geeignet als die entsprechenden Werte bei einer linearen Transformation der hnlichkeiten 324 Kapitel 15 Gemeinsamer Raum Abbildung 15 33 Verbundenes Diagramm des gemeinsamen Raums f r eine L sung mit ordinaler Transformation 150 100 Movies Eat o ODinner er 50 o Date _ e Shout Game Baro O Sidewalk EN o e oO O T Ofi O Park OTalk a P Fight OO Mire Laugh Elevator o T Run lump pena cryo A Belch YO Room Lounge Bus zo Sleep O o2 Argue Mumble amp Class Write Bann Church 100 2 150 150 100 50 0 50 100 150 Dimension 1 Die Interpretation des gemeinsamen Raums ist bei beiden L sungen identisch M glicherweise weist diese L sung mit ordinaler Transformation relativ geringere Variationen in der vertikalen Dimension als in der horizontalen Dimension auf als sich in der L sung mit linearer Transformation zeigt 325 Multidimensionale E
157. aus mehreren Spalten in gestapelten Matrizen _Definieren Abbrechen Hite W hlen Sie in der Gruppe Anzahl der Quellen die Option Mehrere Matrixquellen Klicken Sie auf Definieren 273 Multidimensionale Skalierung Abbildung 14 2 Dialogfeld Multidimensionale Skalierung Gewichtungen Quellen Ge W hlen Sie Tante bis Onkel als hnlichkeitsvariablen aus W hlen Sie quelle als Variable f r die Bezeichnung der Quelle aus Klicken Sie auf Modell 274 Kapitel 14 Abbildung 14 3 Dialogfeld Modell E Multidimensionale Skalierung Modell x rSkalierungsmodell r hnlichkeitstransformationen Identit t Yerh ttnisskala Euklidisch gewichtet O Intervall Euklidisch verallgemeinert O Ordinal Reduzierter Rang Gebundene Beobachtungen l sen Rang 1 O Spline Grad rForm Knoten innen Untere Dreiecksmatrix j Transformationen zuweisen Getrennt in jeder Quelle Alle Quellen gleichzeitig Obere Dreiecksmatrix Gesamte Matrix Ahnlichkeiten _ Dimensionen Un hnlichkeiten Minimum 2 hnlichkeiten Maximum 10 Weiter Abbrechen Hilfe gt Geben Sie 10 als maximal zul ssige Anzahl der Dimensionen ein gt Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Multidimensionale Skalierung auf Eins
158. aximalen im Dialogfeld Modell angegebenen Anzahl von Dimensionen zu erhalten Torgerson Als Ausgangskonfiguration wird eine klassische Skalierungsl sung verwendet Einzelner Zufallsstart Eine Konfiguration wird zuf llig ausgew hlt Mehrere Zufallsstarts Es werden mehrere Konfigurationen nach dem Zufallsprinzip ausgew hlt Die Konfiguration mit dem niedrigsten normalisierten Roh Stress wird als Ausgangskonfiguration verwendet Anpassen W hlen Sie Variablen aus die die Koordinaten Ihrer eigenen Ausgangskonfiguration enthalten Die Anzahl der ausgew hlten Variablen muss der angegebenen H chstanzahl von Dimensionen entsprechen wobei die erste Variable den Koordinaten von Dimension 1 die zweite Variable den Koordinaten von Dimension 2 entspricht usw Die Anzahl der F lle in jeder Variablen muss der Anzahl der Objekte entsprechen Iterationskriterien Geben Sie Werte f r Iterationskriterien an Stress Konvergenz Der Algorithmus f hrt keine weiteren Iterationen durch wenn die Differenz von aufeinander folgenden normalisierten Roh Stress Werten unter dem hier angegebenen Wert liegt der zwischen 0 0 und 1 0 liegen muss Mindest Stress Der Algorithmus wird beendet wenn der normalisierte Roh Stress unter den hier angegebenen Wert f llt der zwischen 0 0 und 1 0 liegen muss 81 Multidimensionale Skalierung PROXSCAL m Maximalzahl der Iterationen Der Algorithmus f hrt die angegebene Anzahl von Iterationen durch fa
159. bessere Ergebnisse liefern w rde als die Regression im Standardverfahren Die U Form der Residuendiagramme weist darauf hin dass Package design nominal behandelt werden sollte Alle anderen Einflu gr en werden auf dem entsprechenden numerischen Skalierungsniveau behandelt Die Antwortvariable verdient besondere Aufmerksamkeit Es sollen die Werte f r Preference vorhergesagt werden Aus diesem Wert sollten so viele Eigenschaften der zugeh rigen Kategorien wie m glich in den Quantifikationen eingebracht werden Bei einem ordinalen oder nominalen Messniveau f r die Skalierung werden die Differenzen zwischen den Antwortkategorien ignoriert Werden die Antwortkategorien dagegen linear transformiert bleiben die Differenzen zwischen den Kategorien erhalten Die Antwort sollte somit numerisch skaliert werden diese Vorgehensweise wird hier verfolgt 105 Kategoriale Regression Durchf hrung der Analyse gt Zum Ausf hren einer kategorialen Regressionsanalyse w hlen Sie die folgenden Befehle aus den Men s aus Analysieren Regression Optimale Skalierung Abbildung 9 9 Dialogfeld Kategoriale Regression Kategoriale Regression X Standardized Residu pret Spline ordinal22 Se ee Fehlende Verte Optionen 4 Unabh ngige Yariable n m package Spline ordinal 2 2 ausgabe lt a and Spline ordinal 2 2 Speichern Spine ordinal 2 2 Diagramme Skala definieren Ei
160. ble 258 Kapitel 13 Abbildung 13 4 Dialogfeld Variablendiagramme ii MCA Variablendiagramme Kategoriendiagramme gewinde kopf kerbe form VYerbundene Kategoriendiagramme lange messing rTransformationsdiagramme i s Dimensionen 2 al Residuen Diagramme einschlie en rDiskriminationsma e Diagramm anzeigen Alle Variablen verwenden Abbrechen Hilfe O Ausgew hlte Yariablen verwenden W hlen Sie aus da ein verbundenes Kategoriendiagramm f r gewinde bis l nge erstellt werden soll Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Mehrfachkorrespondenzanalyse auf OK Modellzusammenfassung Mit der Homogenit tsanalyse kann eine L sung f r mehrere Dimensionen berechnet werden Die maximale Anzahl an Dimensionen ist entweder die Anzahl der Kategorien abz glich der Anzahl der Variablen ohne fehlende Daten oder die Anzahl der Beobachtungen minus 1 je nachdem welche Zahl kleiner ist Die maximale Anzahl an Dimensionen sollte jedoch nur selten verwendet werden Eine kleinere Anzahl an Dimensionen l t sich leichter interpretieren Au erdem wird nach einer gewissen Anzahl an Dimensionen der Grad an Zusammenhang der zus tzlich erkl rt wird vernachl ssigbar Eine ein zwei oder dreidimensionale L sung bei der Homogenit tsanalyse ist sehr h ufig 259 Mehrfachkorrespondenzanalyse Abbildung 13 5
161. c variety of linear factor analysis Psychometrika 39 123 157 Krzanowski W J als auch F H C Marriott 1994 Multivariate analysis Part I distributions ordination and inference London Edward Arnold Lebart L A Morineau als auch K M Warwick 1984 Multivariate descriptive statistical analysis New York John Wiley and Sons Lingoes J C 1968 The multivariate analysis of qualitative data Multivariate Behavioral Research 3 61 94 Max J 1960 Quantizing for minimum distortion Proceedings IEEE Information Theory 6 7 12 McCullagh P als auch J A Nelder 1989 Generalized Linear Models 2nd Hg London Chapman amp Hall Menec V N Roos D Nowicki L MacWilliam G Finlayson als auch C Black 1999 Seasonal Patterns of Winnipeg Hospital Use Manitoba Centre for Health Policy 341 Bibliografie Meulman J J A J Van der Kooij als auch A Babinec 2000 New features of categorical principal components analysis for complicated data sets including data mining In Classification Automation and New Media W Gaul als auch G Ritter Hgg Berlin Springer Verlag 207 217 Meulman J J A J Van der Kooij als auch W J Heiser 2004 Principal components analysis with nonlinear optimal scaling transformations for ordinal and nominal data In Handbook of Quantitative Methodology for the Social Sciences D Kaplan Hg Thousand Oaks Kalifornien Sage Publications Inc 49 70
162. caling PROXSCAL of symmetric data matrices Leiden Department of Data Theory Universitat Leiden De Leeuw J als auch W J Heiser 1980 Multidimensional scaling with restrictions on the configuration In Multivariate Analysis Vol V P R Krishnaiah Hg Amsterdam North Holland 501 522 Heiser W J 1981 Unfolding analysis of proximity data Leiden Department of Data Theory Universitat Leiden 289 Multidimensionale Skalierung Heiser W J als auch F M T A Busing 2004 Multidimensional scaling and unfolding of symmetric and asymmetric proximity relations In Handbook of Quantitative Methodology for the Social Sciences D Kaplan Hg Thousand Oaks Kalifornien Sage Publications Inc 25 48 Kruskal J B 1964 Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis Psychometrika 29 1 28 Kruskal J B 1964 Nonmetric multidimensional scaling A numerical method Psychometrika 29 115 129 Shepard R N 1962 The analysis of proximities Multidimensional scaling with an unknown distance function I Psychometrika 27 125 140 Shepard R N 1962 The analysis of proximities Multidimensional scaling with an unknown distance function II Psychometrika 27 219 246 Kapitel Multidimensionale Entfaltung In der Prozedur Multidimensionale Entfaltung wird versucht eine gemeinsame quantitative Skala zu finden mit der Sie die Beziehung zwischen zwei Gruppen von Ob
163. cedure in multivariate research Multivariate Behavioral Research 10 489 502 Roskam E E 1968 Metric analysis of ordinal data in psychology Voorschoten VAM Shepard R N 1962 The analysis of proximities Multidimensional scaling with an unknown distance function I Psychometrika 27 125 140 Shepard R N 1962 The analysis of proximities Multidimensional scaling with an unknown distance function II Psychometrika 27 219 246 Shepard R N 1966 Metric structures in ordinal data Journal of Mathematical Psychology 3 287 315 Tenenhaus M als auch F W Young 1985 An analysis and synthesis of multiple correspondence analysis optimal scaling dual scaling homogeneity analysis and other methods for quantifying categorical multivariate data Psychometrika 50 91 119 Theunissen N C M J J Meulman A L Den Ouden H M Koopman G H Verrips S P Verloove Vanhorick als auch J M Wit 2003 Changes can be studied when the measurement instrument is different at different time points Health Services and Outcomes Research Methodology 4 109 126 Tucker L R 1960 Intra individual and inter individual multidimensionality In Psychological Scaling Theory amp Applications H Gulliksen als auch S Messick Hgg New York John Wiley and Sons 155 167 Van der Burg E 1988 Nonlinear canonical correlation and some related techniques Leiden DSWO Press Van der Burg E als auch J De Leeuw 1983 No
164. ch fur Zeilenvariable beruf Minimalwert 1 Aktualisieren Maximalwert 5 Aktualisieren Nebenbedingungen f r Kategorien G Keine Kategorien m ssen gleich sein n Be QUN Erg nzende Kategorie weiter Abbrechen Hite Alle Kategorien sind zun chst aktiv und nicht durch Nebenbedingungen eingesch nkt Sie k nnen festlegen dass bestimmte Zeilenkategorien anderen Zeilenkategorien entsprechen m ssen Au erdem k nnen Sie eine Zeilenkategorie als erg nzende Kategorie definieren m Kategorien m ssen gleich sein Die Kategorien m ssen gleiche Werte haben Verwenden Sie Gleichheitsbeschr nkungen wenn die erhaltene Ordnung der Kategorien nicht erw nscht oder nicht intuitiv ist Die maximale Anzahl der Zeilenkategorien f r die Gleichheitsbeschr nkungen festgelegt werden k nnen entspricht der Gesamtzahl aktiver Zeilenkategorien minus 1 Zum Definieren anderer Gleichheitsbeschr nkungen f r Kategoriegruppen k nnen Sie die Syntax verwenden Beispielsweise k nnen Sie mithilfe der Syntax festlegen dass die Kategorien 1 und 2 sowie die Kategorien 3 und 4 gleich sein m ssen m Erg nzende Kategorie Erg nzende Kategorien haben keine Auswirkungen auf die Analyse werden jedoch in dem durch die aktiven Kategorien definierten Raum dargestellt Erg nzende Kategorien spielen keine Rolle bei der Definition von Dimensionen Die maximale Anzahl der erg nzenden Zeilenkategorien entspricht der Ges
165. che Werte aufweist entspricht die Anzahl der Kategorien der Anzahl der unterschiedlichen Werte Werte von String Variablen werden immer in positive ganze Zahlen umgewandelt indem in aufsteigender alphanumerischer Reihenfolge Kategorienummern zugewiesen werden Die Diskretisierung von String Variablen erfolgt anhand dieser Ganzzahlen Andere Variablen werden in der Standardeinstellung nicht modifiziert Die diskretisierten Variablen werden dann in der Analyse verwendet Abbildung 3 4 Dialogfeld Diskretisierung Kategoriale Hauptkomponenten Diskretisierung Variablen weight angegeben mens Nicht angegeben fast Nicht angegeben binge Nicht angegeben vomit Nicht angegeben purge Nicht angegeben hyper Nicht angegeben fami Nicht angegeben eman Nicht angegeben v Methode Gruppieren Andern Gruppieren Anzahl Kategorien Fr Verteilung G Normal _ Gleichvert Gleiche Intervalle Abbrechen Hite Methode Verf gbar sind die Optionen Gruppieren Einstufen oder Multiplizieren Gruppieren Hierbei werden die Daten in eine bestimmte Anzahl von Kategorien oder nach Intervall umkodiert 30 Kapitel 3 Einstufen Die Variable wird durch Bilden einer Rangfolge diskretisiert Multiplizieren Die aktuellen Werte der Variablen werden standardisiert mit 10 multipliziert und gerundet Anschlie end wird eine Konstante zu de
166. chen Lage gedreht um den Ursprung Weiter s dlich liegende St dte zeigen gr ere Werte in der zweiten Dimension weiter westlich liegende St dte dagegen gr ere Werte in der ersten Dimension Empfohlene Literatur In folgenden Texten finden Sie weitere Informationen zur Korrespondenzanalyse Fisher R A 1938 Statistical methods for research workers Edinburgh Oliver and Boyd Fisher R A 1940 The precision of discriminant functions Annals of Eugenics 10 422 429 Gilula Z als auch S J Haberman 1988 The analysis of multivariate contingency tables by restricted canonical and restricted association models Journal ofthe American Statistical Association 83 760 771 Kapitel 13 Mehrfachkorrespondenzanalyse Der Zweck der Mehrfachkorrespondenzanalyse die auch als Homogenit tsanalyse bekannt ist besteht darin Quantifizierungen zu finden die in dem Sinne optimal sind da die Kategorien so weit wie m glich voneinander getrennt sind Dies bringt mit sich da Objekte innerhalb derselben Kategorie eng beieinander und Objekte in unterschiedlichen Kategorien m glichst weit entfernt voneinander dargestellt werden Der Ausdruck Homogenit t bezieht sich auch auf die Tatsache da die Analyse am erfolgreichsten ausf llt wenn die Variablen homogen sind d h wenn sie die Objekte in Klumpen mit der gleichen Kategorie oder hnlichen Kategorien aufteilen Beispiel Eigenschaften von Eisenwaren Um festzustellen wie
167. chiedene zuf llig ausgew hlte Ausgangskonfigurationen berechnet Die L sung mit dem kleinsten penalisierten Stress wird als beste L sung angezeigt m Anpassen Sie k nnen Variablen ausw hlen die die Koordinaten Ihrer eigenen Ausgangskonfiguration enthalten Die Anzahl der ausgew hlten Variablen muss der angegebenen H chstanzahl von Dimensionen entsprechen wobei die erste Variable den Koordinaten von Dimension 1 die zweite Variable den Koordinaten von Dimension 2 entspricht usw Die Anzahl der F lle in jeder Variablen muss der Gesamtzahl der Zeilen und Spaltenobjekte entsprechen Die Zeilen und Spaltenkoordinaten m ssen gestapelt sein wobei die Spaltenkoordinaten den Zeilenkoordinaten folgen Iterationskriterien Geben Sie Werte f r Iterationskriterien an m Stress Konvergenz Der Algorithmus beendet die Iterationen wenn die relative Differenz von aufeinander folgenden penalisierten Stresswerten unter dem hier angegebenen Wert liegt Dieser Wert darf nicht negativ sein m Mindest Stress Der Algorithmus wird beendet wenn der penalisierte Stress unter den hier angegebenen Wert f llt Dieser Wert darf nicht negativ sein m Maximalzahl der Iterationen Der Algorithmus f hrt die hier angegebene Anzahl von Iterationen durch falls nicht vorher eines der oben genannten Kriterien erf llt wird Penalisierungsterm Der Algorithmus versucht den penalisierten Stress zu minimieren Der penalisierte Stress ist ein Ma f r die G te
168. chr nkungen 275 Abbildung 14 4 Dialogfeld Einschr nkungen E Muttidimensionale Skalierung Einschr nkungen x rEinschr nkungen im gemeinsamen Raum Keine Einschr nkungen Einige Koordinaten sind fest Lineare Kombination der unabh ngigen Variablen rEinschr nkungsvariablen Variablen einlesen aus Verf gbar Ausgew hlt gt Transformationen f r unabh ngige variablen Grad Knoten Intervall 2 1 W hlen Sie Lineare Kombination der unabh ngigen Variablen Weiter Abbrechen Hilfe Multidimensionale Skalierung gt Klicken Sie auf Datei und w hlen Sie die Quelle der unabh ngigen Variablen aus W hlen Sie die Datei kinship_var sav aus 276 Kapitel 14 Abbildung 14 5 Dialogfeld Einschr nkungen Multidimensionale Skalierung Einschr nkungen K Einschr nkungen im gemeinsamen Raum Keine Einschr nkungen Einige Koordinaten sind fest Lineare Kombination der unabh ngigen Variablen rEinschr nkungsvariablen Variablen einlesen aus kinship_var sav Verf gbar Ausgew hlt Transformationen f r unabh ngige Variablen ipteryall v Grad 2 Knoten 1 weiter Abbrechen Hilfe W hlen Sie gender gener und degree als Einschr nkungsvariablen aus Beachten Sie dass die Variable gender einen benutzerdefiniert
169. ck auf die Regression senkt die zweite Kategorie die vorhergesagte Einstufung der Bevorzugung die erste und dritte Kategorie zeigen dagegen den umgekehrten Effekt 115 Kategoriale Regression Abbildung 9 22 Transformationsdiagramm f r Package design nominal 004 Quantifizierungen A Bt c Kategorien Analyse der Residuen Mit den transformierten Daten und Residuen die in der Arbeitsdatei gespeichert wurden k nnen Sie ein Streudiagramm der vorhergesagten Werte ber die transformierten Werte von Package design erstellen ffnen Sie hierzu erneut die Diagrammerstellung und klicken Sie auf Zur cksetzen Die bisherige Auswahl wird gel scht und die Standardoptionen werden wiederhergestellt 116 Kapitel 9 Abbildung 9 23 Diagrammerstellung E Diagrammerstellung Variablen Good Hou db Money b Preferenc in E Standardi E Preferenc E Package E Brand na L Price Qua E E Good Hou E Money b a Kategorien Keine Kategorien Diagrammvorschau verwendet Beispieldaten Galerie Auswahlen aus Favoriten Grundelemente Balken Linie Gruppen Punkt ID Fl che Kreis Polar Titel Fu noten Streu Punktdiagr nn Histogramm Hoch Tief Elementeigenschaft Boxplot Doppelachsen Optionen gt Wahlen Sie die Galerie Streu Punktdiagramm aus und w hlen Sie die Option Einfaches Streudiagramm W hlen Sie Residual als Variable f r
170. ckweiser monotoner Polynom mit dem gew hlten Grad Die St cke werden durch die vom Benutzer festgelegte Anzahl und die durch die Prozedur bestimmte Lage der inneren Knoten definiert Spline nominal Die einzige Information aus der beobachteten Variable die in der optimal skalierten Variable beibehalten wird ist die Gruppierung der Objekte in Kategorien Die Reihenfolge der Kategorien bei der beobachteten Variablenwird nicht beibehalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch den Koordinatenursprung plaziert Die resultierende Transformation ist ein glatter stiickweiser m glicherweise nichtmonotoner Polynom mit dem gew hlten Grad Die St cke werden durch die vom Benutzer festgelegte Anzahl und die durch die Prozedur bestimmte Lage der inneren Knoten definiert Ordinal Die Reihenfolge der Kategorien bei der beobachteten Variable wird bei der optimal skalierten Variable beibehalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch den Koordinatenursprung plaziert Die resultierende Transformation ist besser angepa t aber weniger glatt als bei Spline ordinal Nominal Die einzige Information aus der beobachteten Variable die in der optimal skalierten Variable beibehalten wird ist die Gruppierung der Objekte in Kategorien Die Reihenfolge der Kategorien bei der beobachteten Variablenwird nicht beibehalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch
171. d Dieses Diagramm wird nur erstellt wenn die H chstanzahl von Dimensionen gr er als die Mindestanzahl von Dimensionen ist Gemeinsamer Raum Eine Streudiagramm Matrix der Koordinaten des gemeinsamen Raums wird angezeigt Individueller Raum F r jede Quelle werden die Koordinaten der individuellen R ume in Streudiagramm Matrizen angezeigt Dies ist nur m glich wenn im Dialogfeld Modell eines der Modelle f r individuelle Differenzen angegeben ist 82 Kapitel 7 Individuelle Raumgewichtungen Ein Streudiagramm der individuellen Raumgewichtungen wird erstellt Dies ist nur m glich wenn im Dialogfeld Modell eines der Modelle f r individuelle Differenzen angegeben ist F r das Modell Euklidisch gewichtet werden die Gewichtungen in Diagrammen mit einer Dimension pro Achse ausgegeben F r das Modell Euklidisch verallgemeinert wird ein Diagramm pro Dimension erstellt das Rotation und Gewichtung der jeweiligen Dimension anzeigt Das f r das Modell Reduzierter Rang erstellte Diagramm gleicht dem Diagramm f r das Modell Euklidisch verallgemeinert die Anzahl der Dimensionen f r die individuellen R ume ist jedoch reduziert Urspr ngliche ber transformierte hnlichkeiten Es werden Diagramme der urspr nglichen hnlichkeiten im Vergleich zu den transformierten hnlichkeiten erstellt Transformierte hnlichkeiten ber Distanzen Die transformierten hnlichkeiten werden ber die Distanzen
172. das Standardisieren der Werte vor dem Berechnen der hnlichkeiten nicht auf bin re Daten anwendbar W hlen Sie eine Standardisierungsmethode aus dem Dropdown Listenfeld Standardisieren aus Wenn keine Standardisierung erforderlich ist w hlen Sie Keine aus 77 Multidimensionale Skalierung PROXSCAL Definieren eines Modells f r die multidimensionale Skalierung Im Dialogfeld Modell k nnen Sie ein Skalierungsmodell die minimale und maximale Anzahl seiner Dimensionen die Struktur der Distanzmatrix und die f r die hnlichkeiten zu verwendende Transformation angeben sowie festlegen ob hnlichkeiten f r jede Quelle getrennt oder unabh ngig von der Quelle transformiert werden Abbildung 7 7 Dialogfeld Modell Multidimensionale Skalierung Modell Skalierungsmodell hnlichkeitstransformationen Identit t Yerh ltnisskala Euklidisch gewichtet Intervall Euklidisch verallgemeinert Ordinal Reduzierter Rang Spline Form G Untere Dreiecksmatrix u my Transformationen zuweisen U Obere Dreiecksmatrix Getrennt in jeder Quelle U Gesamte Matrix Alle Quellen gleichzeitig hnlichkeiten Dimensionen Minimum 2 Un hnlichkeiten hnlichkeiten Maximum 10 Abbrechen Hite Skalierungsmodell W hlen Sie eine der folgenden Alternativen aus m Identit t Alle Quellen weisen dieselbe Ko
173. delle f r individuelle Differenzen angegeben wird Angepasste Distanzen Zeigt die Distanzen zwischen den Objekten in der Konfiguration an In neuer Datei speichern Sie k nnen die Koordinaten des gemeinsamen Raums die individuellen Raumgewichtungen die Distanzen und die transformierten hnlichkeiten in eigenen SPSS Datendateien speichern 95 Multidimensionale Entfaltung PREFSCAL Zus tzliche Funktionen beim Befehl PREFSCAL Sie k nnen die multidimensionale Entfaltung der hnlichkeiten individuell anpassen indem Sie die Auswahl in ein Syntaxfenster einf gen und die daraus resultierende Befehlssyntax f r PREFSCAL bearbeiten Mit der Befehlssyntax Sprache verf gen Sie au erdem ber folgende M glichkeiten m Wenn mehrere Quellen verf gbar sind k nnen Sie f r individuelle R ume Streudiagramme der Anpassung und Residuendiagramme bei Transformationen von Matrizen auch f r Transformationsdiagramme und Shepard Diagramme Listen mit mehreren Quellen angeben mit dem Unterbefehl PLOT m Bei Transformationen von Zeilen k nnen Sie f r Transformationsdiagramme und Shepard Diagramme Listen mit mehreren Zeilen angeben mit dem Unterbefehl PLOT m Sie k nnen anstelle einer Zeilen ID Variablen eine Anzahl von Zeilen angeben mit dem Unterbefehl INPUT m Sie k nnen anstelle einer Quellen ID Variablen eine Anzahl von Quellen angeben mit dem Unterbefehl INPUT Vollst ndige Informationen zur Syntax finden Sie
174. der Anpassung das dem Produkt des Kruskal Stress I und einem Penalisierungsterm auf der Basis des Variationskoeffizienten der transformierten hnlichkeiten entspricht In diesen Feldern k nnen Sie die St rke und den Bereich des Penalisierungsterms festlegen m St rke Je kleiner der Wert des St rkeparameters ist desto st rker wird die Penalisierung Geben Sie einen Wert zwischen 0 0 und 1 0 an m Bereich Mit diesem Parameter legen Sie den Moment fest ab dem die Penalisierung erfolgt Bei 0 0 erfolgt keine Penalisierung H here Wert f hren dazu dass der Algorithmus eine L sung mit einer gr eren Variation innerhalb der transformierten hnlichkeiten sucht Geben Sie einen nichtnegativen Wert an Multidimensionale Entfaltung Diagramme Im Dialogfeld Diagramme k nnen Sie die zu erstellenden Diagramme festlegen 92 Kapitel 8 Abbildung 8 5 Dialogfeld Diagramme E Multidimensionale Entfaltung Diagramme Diagramme v Endg ltiger gemeinsamer Raum Transformationsdiagramme Anf nglicher gemeinsamer Raum Y Raumgewichtungen Shepard Diagramme v Individueller Raum Streudiagramm der Anpassung Residuen Diagramme Stile f r Zeilenobjekte Menu scenarios srcid Gender gender 9 Farben gt Markierungen 4 Toast pop up TP Buttered toast BT Diagramme der Quellen Zeilend
175. deutlich getrennt sind Die Kategorien mit den niedrigeren Altersgruppen sind im linken Bereich des Diagramms gruppiert Wie bereits erw hnt wurde ist das Messniveau mit ordinaler Skalierung f r Age in years wahrscheinlich zu streng Abbildung 11 22 Zentroide mit Variablen beschriftet a 0 Age in years r log s O Marital status ee R Pets owned 104 Vilage O Newspaper read Sange za f most often raa os no S 66 70 Music preferred Neighborhood 4 O preference Dimension 2 oO oO 054 Volkskrant NRC Married SB 5 Country O cat s Classical 2 1 0 1 2 Dimension 1 208 Kapitel 11 Wenn Sie Diagramme der Zentroide anfordern werden auch Diagramme mit einzelnen Zentroiden und mit projizierten Zentroiden f r jede Variable erstellt und jeweils mit den Wertelabels beschriftet Die projizierten Zentroide befinden sich auf einer Linie im Objektraum Abbildung 11 23 Zentroide und projizierte Zentroide fur Newspaper read most often Zentroide 0 6 Telegraaf O Projektiert o O Tats chlich 04 Telegraaf N c 02 7 5 Other Other g 00 1 Pat None None 0 2 0 4 0 5 0 0 0 5 1 0 Dimension 1 Die eigentlichen Zentroide werden auf die Vektoren projiziert die durch die Komponentenladungen definiert sind Diese Vektoren wurden in die Diagramme der Zentroide aufgenommen um so leichter zwischen den projizierten Zentroiden und den eigentlichen Zentroiden unterscheiden
176. die eine einzelne Standard Methode nicht geeignet ist Folglich bietet die optimale Skalierung eine gr ere Flexibilit t als die Standardans tze bei kaum h herer Komplexit t Au erdem werden durch nichtlineare Transformationen der Einflu variablen normalerweise die Abh ngigkeiten zwischen den einzelnen Einflu variablen verringert Wenn Sie die Eigenwerte der Korrelationsmatrix f r die Einflu variablen mit den Eigenwerten der Korrelationsmatrix f r die optimal skalierten Einflu variablen vergleichen ist die zweite Gruppe zumeist weniger variabel als die erste Mit anderen Worten bei der kategorialen Regression werden durch die optimale Skalierung die gro en Eigenwerte der Korrelationsmatrix f r die Einflu variablen kleiner und die kleinen Eigenwerte gr er 9 Einf hrung in die Prozeduren f r die optimale Skalierung von kategorialen Daten Kategoriale Hauptkomponentenanalyse Die kategoriale Hauptkomponentenanalyse ist am besten geeignet wenn Variationsmuster in einem einzelnen Set von Variablen mit gemischten Messniveaus der optimalen Skalierung ber cksichtigt werden sollen Dieses Verfahren versucht die Dimensionalit t eines Variablen Sets zu verringern und dabei gleichzeitig die Variation soweit wie m glich zu ber cksichtigen Jeder Kategorie jeder Variablen werden Skalenwerte zugewiesen dergestalt dass diese Werte in Bezug auf die Hauptkomponentenl sung optimal sind Die Objekte in der Analyse erhalten Komp
177. die y Achse aus W hlen Sie Package design Ouantification als Variable f r die x Achse aus gt Klicken Sie auf OK Das Streudiagramm zeigt die standardisierten Residuen anhand der optimalen Werte f r Package design Alle Residuen liegen innerhalb von zwei Standardabweichungen von 0 Die U Form im Streudiagramm aus der linearen Regression nach dem Standardverfahren wird durch eine zuf llige Streuung von Punkten ersetzt Die Vorhersagekraft wird durch die optimale Quantifikation der Kategorien erreicht 117 Kategoriale Regression Abbildung 9 24 Residuen bei der kategorialen Regression 0 604 o 0404 o o o24 8 o E e 3 o oo4 i 8 8 w x o gt o 0 204 o 0 40 o o 0 60 T T T T T 1 00 0 50 0 00 0 50 1 00 Package design Quantifikation Beispiel Ozondaten In diesem Beispiel werden die Auswahl und die Auswirkungen von Transformationen mit optimaler Skalierung anhand eines gr eren Daten Sets verdeutlicht Die Daten umfassen 330 Beobachtungen f r sechs meteorologische Variablen die unter anderem bereits von Breiman und Friedman Breiman als auch Friedman 1985 sowie von Hastie und Tibshirani Hastie als auch Tibshirani 1990 analysiert wurden In der nachstehenden Tabelle werden die urspr nglichen Variablen beschrieben Die kategoriale Regression soll die Ozonkonzentration aus den verbleibenden Variablen vorhersagen Bei fr heren Untersuchungen fanden Wissenschaftler einige Nichtline
178. duen 115 speichern 23 Statistiken 16 Transformationsdiagramme 113 Wichtigkeit 111 zus tzliche Funktionen beim Befehl 24 Kategoriekoordinaten in Nichtlineare kanonische Korrelationsanalyse 206 Kategoriendiagramme bei der Mehrfachkorrespondenzanalyse 66 in der Kategorialen Hauptkomponentenanalyse 37 Kategorienquantifikationen bei der Mehrfachkorrespondenzanalyse 63 261 in der Kategorialen Hauptkomponentenanalyse 33 in Kategoriale Regression 21 Index in Nichtlineare kanonische Korrelationsanalyse 44 Kategoriepunkte in der Kategorialen Hauptkomponentenanalyse 174 Koeffizienten in Kategoriale Regression 110 Komponentenladungen in der Kategorialen Hauptkomponentenanalyse 33 151 154 171 in Nichtlineare kanonische Korrelationsanalyse 44 203 Komponentenladungsdiagramme in der Kategorialen Hauptkomponentenanalyse 38 Konfidenzstatistik in der Korrespondenzanalyse 52 227 Korrelationen in Multidimensionale Skalierung 83 Korrelationen nullter Ordnung in Kategoriale Regression 111 Korrelationsdiagramme in Multidimensionale Skalierung 81 Korrelationsmatrix bei der Mehrfachkorrespondenzanalyse 63 in der Kategorialen Hauptkomponentenanalyse 33 Korrespondenzanalyse 47 49 50 52 53 216 218 234 Beitr ge 225 239 Biplots 222 Diagramme 47 Dimensionen 238 Konfidenzstatistik 227 Korrespondenztabellen 221 251 Normalisierung 217 Permutationen 227 Profile 223 Spaltenwertdia
179. dung 10 36 Komponentenladungsdiagramme 0 75 vomit mood 0 00 Dimension 2 fami 0 0 0 2 0 4 0 6 0 8 Dimension 1 Die zweite Dimension trennt die Variablen Die Variablen Binge eating Fre attacken Vomiting Erbrechen und Purging Abf hrmittel bilden ein B ndel mit gro en positiven Ladungen in der zweiten Dimension Diese Symptome werden blicherweise als charakteristisch f r bulimisches Verhalten betrachtet Die Variablen Emancipation from family Emanzipation von der Familie School employment record schulische berufliche Leistungen Sexual attitude sexuelle Einstellung Body weight K rpergewicht und Menstruation Menstruation bilden ein weiteres B ndel in das auch Restriction of food intake fasting Einschr nkung der Nahrungsaufnahme Fasten und Family relations Familienbeziehungen aufgenommen werden kann da die Vektoren dieser Variablen eng beim Hauptklumpen liegen und diese Variablen als Symptome f r Anorexie gelten Fasten Gewicht Menstruation oder psychosozialer Natur sind Emanzipation schulische berufliche Leistungen sexuelle Einstellung Familienbeziehungen Die Vektoren dieses B ndels sind rechtwinklig lotrecht zu den Vektoren von binge vomit und purge was bedeutet dass diese Gruppe von Variablen nicht mit der Gruppe der Bulimie Variablen korreliert ist Die Variablen Friends Freunde Mental state mood psychische Verfassung Stimmung und Hyperactivi
180. e Markierungen unter Verwendung der Patientennummern festlegen Ein Vergleich des nach Zeitpunkt beschrifteten Objektwertediagramms mit dem nach Diagnose beschrifteten Diagramm kann Aufschluss ber ungew hnliche Objekte gew hren So gibt es in dem nach Zeitpunkt beschrifteten Diagramm einen Patienten dessen Diagnose zum Zeitpunkt 4 links von allen anderen Punkten im Diagramm liegt Dies ist ungew hnlich da der allgemeine Trend der Punkte dahin geht dass die sp teren Zeitpunkte weiter rechts liegen Interessanterweise weist dieser Punkt der zeitlich deplaziert zu sein scheint auch eine ungew hnliche Diagnose auf der Patient ist ein Anorektiker dessen Werte im Bulimie Klumpen liegen Wenn wir die Tabelle der Objektwerte betrachten ergibt sich dass es sich hierbei um Patient 43 handelt bei dem Anorexia nervosa diagnostiziert wurde Die Objektwerte diese Patienten finden Sie in folgender Tabelle Tabelle 10 4 Objektwerte f r Patient 43 Zeit Dimension 1 Dimension 2 1 2 031 1 250 2 2 067 0 131 3 1 575 1 467 4 2 405 1 807 174 Kapitel 10 Die Werte des Patienten zum Zeitpunkt 1 sind prototypisch f r Anorektiker mit einem hohen negativen Wert in Dimension 1 der einem schlechten K rperbild entspricht und dem positiven Wert in Dimension 2 der Anorexie Symptomen bzw schlechtem psychosozialem Verhalten entspricht Jedoch ist anders als bei der Mehrzahl der Patienten kaum oder gar kein Fortschritt in Dimension 1 zu ve
181. e Analyse basiert auf Daten die aus positiven ganzen Zahlen bestehen Mit der Option zur Diskretisierung werden Variablen mit Dezimalwerten automatisch kategorisiert indem die Werte in nahezu normalverteilte Kategorien gruppiert werden und Werte von String Variablen werden automatisch in positive Ganzzahlen umgewandelt Sie k nnen andere Diskretisierungsmethoden bestimmen Verwandte Prozeduren Bei zwei Variablen entspricht die Mehrfachkorrespondenzanalyse der Korrespondenzanalyse Wenn Sie annehmen dass die Variablen ordinale oder numerische Eigenschaften besitzen sollte die kategoriale Hauptkomponentenanalyse verwendet werden Wenn Variablen Sets untersucht werden sollen verwenden Sie die nichtlineare kanonische Korrelationsanalyse 56 57 Mehrfachkorrespondenzanalyse So lassen Sie eine Mehrfachkorrespondenzanalyse berechnen gt Wahlen Sie die folgenden Befehle aus den Men s aus Analysieren Dimensionsreduktion Optimale Skalierung Abbildung 6 1 Dialogfeld Optimale Skalierung Optimale Skalierung rMessniveau der optimalen Skalierung Alle Variablen sind mehrfach nominal Einige Variablen sind nicht mehrfach nominal rAnzahl der Variablen Sets Ein Set Mehrere Sets Ausgew hlte Analyse Mehrfachkorrespondenzanalyse Nic Abbrechen J Hilfe W hlen Sie die Option Alle Variablen sind mehrfach nominal aus W hlen Sie die Option Ein Set
182. e Reaktionen wurden aufgezeichnet customers_model sav Diese Datei enth lt hypothetische Daten zu Einzelpersonen auf die sich eine Marketingkampagne richtete Zu diesen Daten geh ren demografische Informationen eine bersicht ber die bisherigen Eink ufe und die Angabe ob die einzelnen Personen auf die Kampagne ansprachen oder nicht Jeder Fall entspricht einer Einzelperson customers_new sav Diese Datei enth lt hypothetische Daten zu Einzelpersonen die potenzielle Kandidaten f r Marketingkampagnen sind Zu diesen Daten geh ren demografische Informationen und eine bersicht ber die bisherigen Eink ufe f r jede Person Jeder Fall entspricht einer Einzelperson debate sav Hierbei handelt es sich um eine hypothetische Datendatei die gepaarte Antworten auf eine Umfrage unter den Zuh rern einer politischen Debatte enth lt Antworten vor und nach der Debatte Jeder Fall entspricht einem Befragten debate_aggregate sav Hierbei handelt es sich um eine hypothetische Datendatei in der die Antworten aus debate sav aggregiert wurden Jeder Fall entspricht einer Kreuzklassifikation der bevorzugten Politiker vor und nach der Debatte demo sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um eine Kundendatenbank geht die zum Zwecke der Zusendung monatlicher Angebote erworben wurde Neben verschiedenen demografischen Informationen ist erfasst ob der Kunde auf das Angebot geantwortet hat 330 Anhang A d
183. e ausw hlen werden fehlende Werte durch die gleiche Quantifikation einer zus tzlichen Kategorie ersetzt Dies 21 Kategoriale Regression CATREG bedeutet aber auch dass Objekte mit einem fehlenden Wert f r diese Variable als zur gleichen Kategorie der zus tzlichen zugeh rig betrachtet werden Kategoriale Regression Optionen Im Dialogfeld Kategoriale Regression Optionen k nnen Sie die Ausgangskonfiguration ausw hlen Kriterien f r die Iterationen und die Konvergenz festlegen Zusatzobjekte ausw hlen und die Beschriftung der Diagramme definieren Abbildung 2 5 Dialogfeld Optionen Kategoriale Regression Optionen Zusatzobjekte Ausgangskonfiguration Bereich von F llen Numerisch i O Zut lig Letzter u Kriterien _ Einzelner Fall Konvergenz 00001 Maximalzahl der Iterationen 400 Diagramme beschriften mit G Yariablen oder Wertelabels L ngenbegrenzung f r Beschriftungen 20 Yariablennamen oder Werte Weiter Abbrechen Hite Zusatzobjekte Mit dieser Option k nnen Sie die Objekte angeben die als Zusatzobjekte behandelt werden sollen Geben Sie die Nummer eines Zusatzobjekts ein und klicken Sie auf Hinzuf gen Zusatzobjekte k nnen nicht gewichtet werden Gewichtungen werden ignoriert Ausgangskonfiguration Wenn keine Variablen als nominal behandelt werden w hlen Sie die Konfigurati
184. e quadrierte partielle Korrelation entspricht dem Anteil an der Varianz der relativ zur residuellen Varianz der Antwort erkl rt werden kann die wiederum nach dem Beseitigen der Auswirkungen auf die anderen Variablen verbleibt Beispiel Package design weist eine partielle Korrelation von 0 955 auf Werden die Auswirkungen der anderen Variablen entfernt erkl rt Package design 0 955 0 91 91 der Variation in den Einstufungen der Bevorzugung Auch Price und Good Housekeeping seal erkl ren einen Gro teil der Varianz wenn die Auswirkungen der anderen Variablen beseitigt werden Sie k nnen die Auswirkungen anderer Variablen nicht nur aus der Antwort und aus einer Einflu gr e entfernen sondern alternativ auch nur aus der Einflu gr e Die Korrelation zwischen der Antwort und den Residuen aus der Regression einer Einflu gr e auf die anderen Einflu gr en wird als Teilkorrelation bezeichnet Wird dieser Wert quadriert entsteht eine Messzahl f r den Anteil der Varianz der relativ zur Gesamtvarianz der Antwort erkl rt wird Wenn Sie die Auswirkungen von Brand name Good Housekeeping seal Money back guarantee und Price aus Package design entfernen erkl rt der verbleibende Teil von Package design 0 733 2 0 54 54 der Variation bei den Einstufungen der Bevorzugung Wichtigkeit Neben den Regressionskoeffizienten und den Korrelationen hilft das Ma f r die relative Wichtigkeit nach Pratt Pratt 1987 bei der Int
185. ear Eine lineare Regression von Daily ozone level ber Day ofthe year ergibt einen Wert von 0 004 f r R Diese Anpassungsg te l t erkennen dass Day of the year keinen vorhersagbaren Wert f r Daily ozone level aufweist Beim vorliegenden Muster in der Abbildung ist dies nicht weiter berraschend Wenn Sie jedoch die optimale Skalierung verwenden k nnen Sie die quadratische Beziehung linearisieren und die Antwort mithilfe der transformierten Variablen Day of the year vorhersagen 134 Kapitel 9 Abbildung 9 50 Dialogfeld Kategoriale Regression E Kategoriale Regression K Abh ngige maraca In diskrete umwandeln lozon Numeric Fehlende Verte Skala definieren Optionen Unabh ngige Yariable n BoytSpine ordinal 22 Dep Speichern Diagramme Skala definieren Einf gen Zur cksetzen Abbrechen Hilfe Soll eine kategoriale Regression von Daily ozone level ber Day of the year erstellt werden rufen Sie erneut das Dialogfeld Kategoriale Regression auf gt Deaktivieren Sie Inversion base height bis Temperature degrees F als unabh ngige Variablen W hlen Sie Day ofthe year als unabh ngige Variable aus Klicken Sie auf Skala definieren Abbildung 9 51 Dialogfeld Skala definieren Spline ordinal Numerisch Spline nominal E Kategoriale Regression Skala definie x rMessniveau der optimal
186. ece Sister Son Uncle Mittelwert Mit der Stress Zerlegung erkennen Sie welche Quellen und Objekte die gr ten Beitr ge zum Gesamtstress der L sung liefern In diesem Fall kann der Gro teil des Stresses zwischen den Quellen den Quellen 1 und 2 zugeordnet werden Bei den Objekten l t sich der meiste Stress dagegen mit Bruder Enkelin Gro vater Gro mutter Enkel und Schwester in Verbindung bringen 284 Kapitel 14 Die beiden Quellen die den gr ten Teil des Stresses liefern sind die beiden Gruppen die die Bezeichnungen nur einmal sortiert hatten Diese Information legt nahe dass die Studenten beim Sortieren der Bezeichnungen mehrere Faktoren in Betracht gezogen hatten und dass sich die Studenten die die Bezeichnungen zweimal sortierten bei der ersten Sortierung auf einen Teil dieser Faktoren konzentrierten und dann die verbleibenden Faktoren bei der zweiten Sortierung anwendeten Die Objekte mit dem gr ten Anteil am Stress sind die Objekte mit einem Wert von 2 f r degree also Verwandte die nicht zur Kernfamilie geh ren Mutter Vater Tochter Sohn aber dennoch n her verwandt sind als andere Diese Mittelposition k nnte leicht eine differentielle Sortierung dieser Terme verursachen Endg ltige Koordinaten des gemeinsamen Raums Im Diagramm mit dem gemeinsamen Raum werden die Beziehungen zwischen den Objekten anschaulich dargestellt Abbildung 14 15 Gemeinsame Raumkoordinaten broth theep
187. egangen dass es sich bei den Variablen um Distanzmatrizen aus verschiedenen Quellen handelt gt W hlen Sie eine Zeilenvariable zum Festlegen der Zeilenpositionen f r die hnlichkeiten in jeder hnlichkeitsvariablen aus gt W hlen Sie eine Spaltenvariable zum Festlegen der Spaltenpositionen f r die hnlichkeiten in jeder hnlichkeitsvariablen aus Zellen der Distanzmatrix denen keine Zeilen Spaltenposition zugewiesen ist werden als fehlend behandelt W hlen Sie optional Gewichtungsvariablen aus Die Anzahl muss der Anzahl der ausgew hlten hnlichkeitsvariablen entsprechen Dar ber hinaus k nnen Sie ein Modell f r die multidimensionale Skalierung angeben Einschr nkungen f r den gemeinsamen Raum festlegen Konvergenzkriterien festlegen die zu verwendende Ausgangskonfiguration angeben sowie Diagramme und die Ausgabe ausw hlen 74 Kapitel 7 hnlichkeiten in einer Spalte Wenn Sie im Dialogfeld Datenformat das Ein Spalten Modell ausw hlen entweder aus einer oder mehreren Quellen wird das Hauptdialogfeld folgenderma en dargestellt Abbildung 7 4 Dialogfeld Ahnlichkeiten in einer Spalte E Multidimensionale Skalierung hnlichkeiten in einer Spalte hnlichkeiten ma Ro E prox Einschr nkungen Zeilen gt Bina Optionen Spalten Diagramme gt ow Quellen v Saou Gewichtungen gt x Einf gen Zur cks
188. egorien Kategorienkoordinaten Dimension Dimension Randh ufigke Quantifikation Fehlend it 3 5 0 1 1 0 0 2 1 2 0 Jede Kategorie f r die keine F lle erfasst wurden erh lt die Quantifikation 0 F r Age in years umfasst dies die Kategorien 31 35 46 50 und 51 55 Diese Kategorien m ssen nicht gemeinsam mit dem anderen Kategorien eingeordnet werden und wirken sich nicht auf die Berechnungen aus Bei mehrfach nominalen Variablen erhalten die einzelnen Kategorien jeweils eine andere Quantifikation in den verschiedenen Dimensionen Bei allen anderen Transformationstypen besitzt jede Kategorie nur eine einzige Quantifikation unabh ngig von der Anzahl der Dimensionen in der L sung Jedes Set von Einzelkategoriekoordinaten stellt die Position der Kategorie auf einer Linie im Objektraum dar Die Koordinaten einer gegebenen Kategorie entsprechen der Quantifikation multipliziert mit der Dimensionsgewichtungen f r die Variable Beispiel In der Tabelle f r Age in years entsprechen die Einzelkategoriekoordinaten f r die Kategorie 56 60 0 142 0 165 der Quantifikation 0 209 multipliziert mit den Gewichtungen 0 680 0 789 Die Mehrfachkategoriekoordinaten f r Variablen die als einzeln nominal ordinal oder numerisch behandelt werden stellen die Koordinaten der Kategorien im Objektraum vor dem Anwenden von ordinalen oder linearen Einschr nkungen dar Diese Werte sind 207 Nichtlineare kanonische Korrelationsana
189. ehr viele leere Kategorien zwischen 1 und dem H chstwert liegen Die Gr e der Datenausgabe kann durch Umkodierung verringert werden Bei numerischen Variablen sollte die Funktion f r die automatische Umkodierung jedoch nicht verwendet werden Die Kodierung in aufeinander folgende Ganzzahlen f hrt zur Differenz 1 zwischen allen aufeinander folgenden Kategorien und damit dazu dass alle Quantifizierungen dieselben Abst nde aufweisen Die metrischen Merkmale die bei der Behandlung einer Variablen als nominal f r bedeutsam erachtet werden werden durch die Neukodierung in aufeinander folgende Ganzzahlen zerst rt Beispiel Schema C in der Tabelle entspricht der automatischen Umkodierung von Alter Die Differenz zwischen den Kategorien 22 und 25 hat sich von 3 auf 1 ge ndert und die Quantifizierungen spiegeln die neue Differenz wider Ein alternatives Umkodierungsschema bei dem die Differenzen zwischen den Kategorien erhalten bleiben besteht darin den kleinsten Kategoriewert von jeder Kategorie zu subtrahieren und zu der Differenz den Wert 1 zu addieren Schema B ergibt sich aus dieser Transformation Der kleinste Kategoriewert 20 wurde von jeder Kategorie subtrahiert und zu dem Ergebnis wurde der Wert addiert Die transformierten Codes weisen mindestens den Wert auf und alle Differenzen sind mit denen der urspr nglichen Daten identisch Der maximale Kategoriewert ist nun 8 und die Null Quantifizierungen vor der ersten Nicht Null Quantif
190. ei und Vollkornbrot und zwischen kalorienhaltigen und armen Artikeln In einer anderen Umfrage haben Sie eine Gruppe von Fahrern gebeten 26 Fahrzeugmodelle anhand von 10 Attributen auf einer 6 Punkte Skala von 1 trifft berhaupt nicht zu bis 6 trifft vollst ndig zu zu bewerten Die Werte werden ber die einzelnen Personen gemittelt und als hnlichkeiten verwendet Mit der Prozedur Multidimensionale Entfaltung finden Sie Gruppen von hnlichen Modellen sowie von Attributen mit denen diese am ehesten in Verbindung gebracht werden Statistiken und Diagramme Mit der Prozedur Multidimensionale Entfaltung k nnen Sie ein Iterationsprotokoll Stressma e Stress Zerlegung Koordinaten des gemeinsamen Raums Objektdistanzen innerhalb der endg ltigen Konfiguration individuelle Raumgewichtungen individuelle R ume transformierte Distanzen Stress Diagramme Streudiagramme des gemeinsamen Raums Streudiagramme der individuellen Raumgewichtungen Streudiagramme des individuellen Raums Transformationsdiagramme und Shepard Residuen Diagramme erstellen Daten Die Daten werden in Form von rechtwinkligen Distanzmatrizen bereitgestellt Jede Spalte wird als separates Spaltenobjekt betrachtet Jede Zeile einer Distanzmatrix wird als separates Zeilenobjekt betrachtet Wenn es mehrere Quellen f r die Distanzen gibt werden die Matrizen gestapelt Annahmen Es m ssen mindestens zwei Variablen angegeben werden Die Anzahl der Di
191. eigt jedoch auBerdem wo sich die Endpunkte befinden die den niedrigsten Quantifizierungen entsprechen z B sehr schwach f r Intensit t der Interaktion und keine f r Zugeh rigkeit Die beiden Variablen die die Interaktion messen Intensit t und H ufigkeit Frequenz erscheinen sehr eng beieinander und erkl ren einen Gro teil der Varianz in Dimension 1 Formalit t erscheint ebenfalls nah bei Entfernung Wenn Sie sich auf die Kategoriepunkte konzentrieren k nnen Sie die Beziehungen noch deutlicher sehen Intensit t und H ufigkeit Frequenz liegen nicht nur eng beieinander sondern die Richtungen ihrer Skalen sind hnlich d h sehr schwache Intensit t liegt eng bei schwacher H ufigkeit und h ufige Interaktion liegt nahe bei hoher Intensit t der Interaktion Au erdem ist ersichtlich dass eine enge N he mit einem nicht f rmlichen Beziehungstyp Hand in Hand zu gehen scheint und dass eine weite Entfernung mit Keine Beziehung in Verbindung steht Objektwerte Au erdem k nnen Sie eine Auflistung und ein Diagramm der Objektwerte anfordern Das Diagramm der Objektwerte kann f r die Erkennung von Ausrei ern typischen Objektgruppen oder speziellen Mustern hilfreich sein Die Objektwertetabelle zeigt die Auflistung der Objektwerte f r die Guttman Bell Daten nach sozialer Gruppe beschriftet Durch die Untersuchung der Werte f r die Objektpunkte k nnen Sie spezielle Objekte im Diagramm identifizieren Abbildung 10 1
192. einmal pro Woche purge Purging Abf hrmittel Greater than once aweek No purging Keine Mehr als einmal pro Abf hrmittel Woche hyper Hyperactivity Not able to be atrest Kann No hyperactivity Keine Hyperaktivit t nicht zur Ruhe kommen Hyperaktivit t 156 Kapitel 10 Variablen name fami eman frie school satt sbeh mood preo body Variablenlabel Family relations Familienbeziehungen Emancipation from family Emanzipation von der Familie Friends Freunde School employment record Schulische berufliche Leistungen Sexual attitude Sexuelle Einstellung Sexual behavior Sexualverhalten Mental state mood Psychische Verfassung Stimmung Preoccupation with food and weight Besch ftigung mit Essen und Gewicht Body perception K rperwahrnehmung Unteres Ende Wert 1 Poor Schlecht Very dependent Sehr abh ngig No good friends Keine guten Freunde Stopped school work Schule Arbeit abgebrochen Inadequate Unangemessen Inadequate Unangemessen Very depressed Sehr niedergeschlagen Complete Vollst ndig Disturbed Gest rt Oberes Ende Wert 3 oder 4 Good Gut Adequate Angemessen Two or more good friends Mindestens zwei gute Freunde Moderate to good record Mittel bis gut Adequate Angemessen Can enjoy sex Kann Sex genie en Normal Normal No preoccupation Keine Besch ftigung Normal Norm
193. elen Fachgebieten auf Problem der reihenweisen Anordnung bei der Arch ologie Ordinationsproblem bei der Pflanzensoziologie sowie das Skalogrammproblem nach Guttman in den Gesellschaftswissenschaften Zum Sortieren k nnen die Zeilen und Spaltenwerte als Sortiervariablen herangezogen werden Wenn Zeilen und Spaltenwerte in p Dimensionen vorliegen k nnen p Permutationstabellen erstellt werden Ist der erste Singul rwert gro zeigt die erste Tabelle eine bestimmte Struktur bei der sich die relativen H ufigkeiten die gr er sind als erwartet nahe an der Diagonalen befinden Die nachstehende Tabelle zeigt die Permutation der Korrespondenztabelle in der ersten Dimension Wenn Sie die Zeilenwerte f r Dimension 1 betrachten wird die folgende Rangfolge von unten nach oben ersichtlich Angestellte mit Erfahrung 0 728 Sekretariatsangeh rige 0 385 Senior Manager 0 126 Angestellte ohne Erfahrung 0 446 Junior Manager 0 495 Aus den Spaltenwerten f r Dimension 1 geht die Rangliste Nichtraucher Leicht Mittel und Stark hervor Diese Ranglisten werden beim Sortieren der Zeilen und Spalten in der Tabelle ber cksichtigt Abbildung 12 13 Permutation der Korrespondenztabelle Rauchgewohnheit Berufsgruppe Nichtraucher Leicht Mittel Stark Aktiver Rand Angestellter mit Erfahrung Sekretariat Senior Manager Angestellter ohne Erfahrung Junior Manager Aktiver Rand Konfidenzstatistiken
194. elte Transformation ist linear f r die Kategorien 1 bis 3 doch die quantifizierten Werte f r die Kategorien 3 und 4 sind gleich Dieses Ergebnis zeigt dass die Werte f r 3 und 4 zu keiner Unterscheidung zwischen den Patienten f hren und deutet darauf hin dass Sie das numerische Skalierungsniveau in einer Zwei Komponenten L sung verwenden k nnten indem Sie die Werte f r 4 als Werte f r 3 aufzeichnen Modellzusammenfassung Abbildung 10 35 Modellzusammenfassung Modellzusammenfassung Varianz ber cksichtigt Cronbachs Gesamt Dimension Alpha Eigenwert der Varianz 1 374 5 550 34 690 2 22 1 957 12 234 Gesamtwert 9252 7 508 46 924 a Die Summe von Cronbachs Alpha basiert auf der Summe der Eigenwerte Um zu sehen wie gut das Modell an die Daten angepa t ist untersuchen wir die Modellzusammenfassung Etwa 47 der gesamten Varianz wird durch das Zwei Komponenten Modell erklart 35 durch die erste Dimension und 12 durch die zweite Also wird fast die H lfte der Variabilit t auf der Ebene der einzelnen Objekte durch das Zwei Komponenten Modell erklart 171 Kategoriale Hauptkomponentenanalyse Komponentenladungen Zu Beginn der Interpretation der beiden Dimensionen der L sung betrachten wir die Komponentenladungen Alle Variablen weisen eine positive Komponentenladung in der ersten Dimension auf was bedeutet dass ein gemeinsamer Faktor vorliegt der mit allen Variablen positiv korreliert Abbil
195. emo_cs_1 sav Hierbei handelt es sich um eine hypothetische Datendatei f r den ersten Schritt eines Unternehmens das eine Datenbank mit Umfrageinformationen zusammenstellen m chte Jeder Fall entspricht einer anderen Stadt Au erdem sind IDs f r Region Provinz Landkreis und Stadt erfasst demo_cs_2 sav Hierbei handelt es sich um eine hypothetische Datendatei f r den zweiten Schritt eines Unternehmens das eine Datenbank mit Umfrageinformationen zusammenstellen m chte Jeder Fall entspricht einem anderen Stadtteil aus den im ersten Schritt ausgew hlten St dten Au erdem sind IDs f r Region Provinz Landkreis Stadt Stadtteil und Wohneinheit erfasst Die Informationen zur Stichprobenziehung aus den ersten beiden Stufen des Stichprobenplans sind ebenfalls enthalten demo_cs sav Hierbei handelt es sich um eine hypothetische Datendatei die Umfrageinformationen enth lt die mit einem komplexen Stichprobenplan erfasst wurden Jeder Fall entspricht einer anderen Wohneinheit Es sind verschiedene Informationen zum demografischen Hintergrund und zur Stichprobenziehung erfasst dietstudy sav Diese hypothetische Datendatei enth lt die Ergebnisse einer Studie der Stillman Di t Rickman Mitchell Dingman als auch Dalen 1974 Jeder Fall entspricht einem Teilnehmer und enth lt dessen Gewicht vor und nach der Di t in amerikanischen Pfund sowie mehrere Messungen des Triglyceridspiegels in mg 100 ml dischargedata sav Hierbei handelt
196. en gt Alle Dimensionen in der L sung anzeigen Fr Anzahl der Dimensionen beschr nken Konfiguration Keine Abbrechen Hilfe Zusatzobjekte Normalisierungsmethode G Bereich von F llen 5 Variablenprinzipal Erster Letzter 2 Kriterien O Einzelner Fall Konvergenz 00001 20 62 Kapitel 6 Zusatzobjekte Geben Sie die Fallnummer des Objekts oder die erste und letzte Fallnummer einer Reihe von Objekten an die als Zusatzobjekte deklariert werden sollen und klicken Sie dann auf Hinzuf gen Wiederholen Sie diesen Vorgang bis Sie alle Zusatzobjekte festgelegt haben Wenn ein Objekt als Zusatzobjekt deklariert ist werden Fallgewichtungen f r das Objekt ignoriert Normalisierungsmethode Sie k nnen eine von f nf Optionen f r die Normalisierung der Objektwerte und Variablen ausw hlen In einer Analyse kann nur eine Normalisierungsmethode gleichzeitig verwendet werden m Variablenprinzipal Bei dieser Option wird die Assoziation zwischen Variablen optimiert Die Komponentenladungen Korrelationen mit Hauptkomponenten wie Dimensionen und Objektwerten stellen die Koordinaten der Variablen im Objektraum dar Dies ist n tzlich wenn Sie haupts chlich an der Korrelation zwischen den Variablen interessiert sind Objektprinzipal Bei dieser Option werden die Distanzen zwischen den Objekten optimiert Dies ist n tzlich wenn Sie haupts chlich an den Unterschieden ode
197. en Punkte definiert ist Falls die Reihenfolge der Kategorien gem den Werten nicht erw nscht oder nicht intuitiv ist stehen Ordnungs Einschr nkungen zur Verf gung mit denen Sie festlegen k nnen dass die Werte f r einige Kategorien gleich sein m ssen Beispiel Bei der Variablen Rauchgewohnheit mit den Kategorien Nichtraucher Leicht Mittel und Stark werden Werte erwartet die dieser Reihenfolge entsprechen Werden die Kategorien in der Analyse jedoch als Nichtraucher Leicht Stark und Mittel geordnet k nnen Sie die Werte f r Stark und Mittel gleichsetzen und so die Reihenfolge der Kategorien in den Werten beibehalten Die Interpretation der Korrespondenzanalyse hinsichtlich der Distanzen ist abh ngig von der verwendeten Normalisierungsmethode Mit der Korrespondenzanalyse k nnen Sie wahlweise die Differenzen zwischen den Kategorien einer Variablen oder die Differenzen zwischen mehreren Variablen untersuchen Bei der Standard Normalisierung werden die Differenzen zwischen den Zeilen und Spaltenvariablen analysiert Der Algorithmus f r die Korrespondenzanalyse erm glicht viele verschiedene Spielarten Bei der Standard Korrespondenzanalsye werden die Zeilen und Spalten zentriert und es werden Chi Quadrat Distanzen herangezogen Wenn Sie jedoch alternative Zentrierungsoptionen in Kombination mit Euklidischen Distanzen verwenden entsteht eine alternative Repr sentation einer Matrix in einem flachdimensionierten Raum 216 217
198. en Skalierung Ordinal Spline Grad 2 Innere Knoten W hlen Sie Nominal als optimales Messniveau f r die Skalierung Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Kategoriale Regression auf In diskrete umwandeln 135 Kategoriale Regression Abbildung 9 52 Dialogfeld Diskretisierung Kategoriale Regression Diskretisierung x Variablen ozon Nicht angegeben doy Nicht angegeben eee _Andern_ Gruppieren Anzahl Kategorien Verteilung No Gleichvert Gleiche Intervalle Abbrechen Hilfe W hlen Sie doy aus Wahlen Sie Gleiche Intervalle Geben Sie 10 als L nge f r das Intervall ein Klicken Sie auf ndern Klicken Sie auf Weiter Klicken Sie im Dialogfeld Kategoriale Regression auf Diagramme 136 Kapitel 9 Abbildung 9 53 Dialogfeld Diagramme ea Kategoriale Regression Diagramme Transformationsdiagramme Residuen Diagramme gt Abbrechen J Hilfe W hlen Sie doy f r die Transformationsdiagramme aus Klicken Sie auf Weiter Klicken Sie im Dialogfeld Kategoriale Regression auf OK Abbildung 9 54 Modellzusammenfassung f r die kategoriale Zusammenfassung von Daily ozone level auf Day of the year Korrigiertes Multiples R R Quadrat R Quadrat Abh ngige Variable
199. en Variablen und Wertlabels oder Variablennamen und Werte verwendet werden sollen Sie k nnen auch eine H chstl nge f r die Beschriftungen festlegen Diagrammdimensionen Hiermit legen Sie fest wie die Statistiken in der Ausgabe angezeigt werden Alle Dimensionen in der L sung anzeigen Alle Dimensionen in der L sung werden in einer Streudiagramm Matrix angezeigt m Anzahl der Dimensionen beschr nken Die angezeigten Dimensionen werden auf geplottete Paare beschr nkt Wenn Sie die Dimensionen beschr nken m ssen Sie die niedrigste und die h chste Dimension ausw hlen die jeweils geplottet werden soll Die niedrigste Dimension muss im Bereich von 1 bis zur Anzahl der Dimensionen in der L sung minus 1 liegen und wird gegen h here Dimensionen geplottet Der Wert f r die h chste Dimension muss im Bereich von 2 bis zur Anzahl der Dimensionen in der L sung liegen und gibt die h chste Dimension an die beim Plotten der Dimensionspaare verwendet wird Diese Spezifikation gilt f r alle angeforderten multidimensionalen Plots Konfiguration Sie k nnen die Koordinaten einer Konfiguration aus einer Datei einlesen Die erste Variable in der Datei muss die Koordinaten der ersten Dimension die zweite Variable die Koordinaten der zweiten Dimension usw enthalten m Initial Die in der Datei angegebene Konfiguration wird als Ausgangspunkt f r die Analyse verwendet m Fest Die in der Datei angegebene Konfiguration wird zum Anpassen der
200. en aus Elementeigenschaften Einf gen Zur cksetzen Abbrechen W hlen Sie die Galerie Streu Punktdiagramm aus und w hlen Sie die Option Gruppiertes Streudiagramm 176 Kapitel 10 Abbildung 10 41 Diagrammerstellung E Diagrammerstellung Variablen al Sexual at al Sexual be al Mental st al Preoccup al Body per ofl Time of in amp Time diag is Patient N amp Diagnosis timez tim Ve Kategorian E Time diagnosis interaction EI Anorexia Quantification dimension 1 ba LEE Anewavis Diagrammvorschau verwendet Beispieldaten Galerie Ausw hlen aus Favoriten Grundelemente Balken Linie Gruppen Punkt ID Fl che Kreis Polar Titel Fu noten Streu Punktdiagr ne Histogramm Hoch Tief Elementeigenschaft Boxplot Doppelachsen Optionen Einf gen Abbrechen A W hlen Sie Time diagnosis interaction Quantification dimension 2 Zeit Diagnose Interaktion Quantifizierung Dimension 2 als y Achsen Variable und Time diagnosis interaction Quantification dimension 1 Zeit Diagnose Interaktion Quantifizierung Dimension 1 als x Achsen Variable W hlen Sie aus dass die Farbe anhand von Patient Diagnosis Patientendiagnose festgelegt werden soll Klicken Sie auf OK 177 Abbildung 10 42 Strukturen des Krankheitsverlaufs Datei Bearbeiten Ansicht Optionen Elemente Hilfe
201. eneral nonmetric technique for finding the smallest coordinate space for configurations of points Psychometrika 33 469 506 Hartigan J A 1975 Clustering algorithms New York John Wiley and Sons Hastie T als auch R Tibshirani 1990 Generalized additive models London Chapman and Hall Hastie T R Tibshirani als auch A Buja 1994 Flexible discriminant analysis Journal of the American Statistical Association 89 1255 1270 Hayashi C 1952 On the prediction of phenomena from qualitative data and the quantification of qualitative data from the mathematico statistical point of view Annals of the Institute of Statitical Mathematics 2 93 96 Heiser W J 1981 Unfolding analysis of proximity data Leiden Department of Data Theory Universit t Leiden 340 Bibliografie Heiser W J als auch F M T A Busing 2004 Multidimensional scaling and unfolding of symmetric and asymmetric proximity relations In Handbook of Quantitative Methodology for the Social Sciences D Kaplan Hg Thousand Oaks Kalifornien Sage Publications Inc 25 48 Heiser W J als auch J J Meulman 1994 Homogeneity analysis Exploring the distribution of variables and their nonlinear relationships In Correspondence Analysis in the Social Sciences Recent Developments and Applications M Greenacre als auch J Blasius Hgg New York Academic Press 179 209 Heiser W J als auch J J Meulman 1995 Nonlinear methods for
202. enschaft Boxplot Doppelachsen Optionen A 7A gt Wahlen Sie die Galerie Streu Punktdiagramm aus und w hlen Sie die Option Einfaches Streudiagramm gt W hlen Sie Daily ozone level als y Achsen Variable aus und Day of the year als x Achsen Variable Klicken Sie auf OK 132 Kapitel 9 Abbildung 9 48 Streudiagramm von Daily ozone level und Day of the year 40 00 30 00 20 00 Daily ozone level 0 00 0 00 100 00 200 00 300 00 400 00 Day ofthe year Diese Abbildung zeigt das Verh ltnis zwischen Daily ozone level und Day of the year Wenn Day ofthe year auf etwa 200 ansteigt steigt auch Daily ozone level Bei Werten gr er 200 f r Day of the year sinkt Daily ozone level jedoch ab Diese invertierte U Form weist auf eine quadratische Beziehung zwischen den beiden Variablen hin Eine lineare Beziehung kann diese Beziehung nicht erfassen gt Um die am besten geeignete Linie ber die Punkte im Streudiagramm anzeigen zu lassen aktivieren Sie die Grafik indem Sie darauf doppelklicken W hlen Sie im Diagramm Editor einen Punkt aus gt Klicken Sie auf das Werkzeug zum Einf gen einer Anpassungslinie beim Gesamtwert und schlie en Sie den Diagramm Editor 133 Kategoriale Regression Abbildung 9 49 Streudiagramm mit Anpassungslinie 40 00 30 00 20 00 Daily ozone level 10 00 0 00 0 00 100 00 200 00 300 00 400 00 Day ofthe y
203. entenanalyse und die multidimensionale Skalierung beteiligt Au erdem leistete Anita van der Kooij Beitr ge insbesondere zu CATREG CORRESPONDENCE und CATPCA Willem Heiser Jacques Commandeur Frank Busing Gerda van den Berg und Patrick Groenen waren an der Entwicklung der Prozedur PROXSCAL beteiligt Frank Busing Willem Heiser Patrick Groenen und Peter Neufeglise waren an der Entwicklung der Prozedur PROXSCAL beteiligt Inhalt Teil I Benutzerhandbuch 1 Einf hrung in die Prozeduren f r die optimale Skalierung von kategorialen Daten 1 Was ist optimale Skalierung 2 2222 ccc cect tenet eee 1 Warum sollte optimale Skalierung verwendet werden 0 02 eee eee eens 1 Messniveau der optimalen Skalierung 00000 e eect teens 2 Auswahl des Messniveaus der optimalen Skalierung 000000 cece eee 3 Transformationsdiagramme 00 e eects 3 Kategoriecodes zur 000 a ee ee rien 4 Welche Prozedur ist f r Ihre Anwendung am besten geeignet 0 cc eee eee 7 Kategoriale Regression n nunnana 0c cece cette eee 8 Kategoriale Hauptkomponentenanalyse 000 cece cece tee eee ee 9 Nichtlineare kanonische Korrelationsanalyse 000 000 cece ee eee eaee 9 Korrespondenzanalyse 00 0 cece cette eee eee eee 10 Mehrfachkorrespondenzanalyse 0 cc ee ene tent n ene 12 Multidimensionale Skalierung 2 2 00 0c cece ee 13 Multidimensi
204. entsprechend dem gew hlten Distanzma Die Spaltenwerte entsprechen dem gewichteten Durchschnitt der Zeilenwerte Verwenden Sie diese Methode wenn Sie die Unterschiede oder hnlichkeiten zwischen Kategorien der Spaltenvariablen untersuchen m chten Anpassen Sie m ssen einen Wert zwischen 1 und 1 angeben Der Wert 1 entspricht dem Spaltenprinzipal Der Wert 1 entspricht dem Zeilenprinzipal Der Wert 0 entspricht der Einstellung Symmetrisch Bei allen brigen Werten wird die Tr gheit in unterschiedlichem Ma e ber Zeilen und Spaltenwerte gestreut Mit dieser Methode k nnen Sie Biplots genau an Ihre Bed rfnisse anpassen Korrespondenzanalyse Statistiken Im Dialogfeld Statistiken k nnen Sie festlegen welche numerische Ausgabe erzeugt werden soll 53 Korrespondenzanalyse Abbildung 5 5 Dialogfeld Statistiken Korrespondenzanalyse Statistiken v Korrespondenztabelle bersicht der Zeilenpunkte v v bersicht der Spaltenpunkte v Permutationen der Korrespondenztabelle H chste Dimension f r Permutationen 4 v Zeilenprofile v Spaltenprofile Konfidenzstatistiken fur V Zeilenpunkte Y Epattenpunkte Weiter Abbrechen Hilfe Korrespondenztabelle Eine Kreuztabelle f r die Eingabevariable mit Randh ufigkeiten der Zeilen und Spalten bersicht der Zeilenpunkte F r jede Zeilen
205. eoccupatio Bingeeating ER N nwithfoodand weight Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids oon nme WN Variablenansicht Die Variablen Bingeeating Sexualattitude und Preoccupationwithfoodandweight enthalten die Werte der Zentroide die auf die einzelnen relevanten Symptome projiziert wurden Die Fallnummer 1 bis 16 entspricht Time diagnosis interaction Zeit Diagnose Interaktion Sie miissen neue Variablen berechnen die die Zeit und Diagnosewerte trennen W hlen Sie die folgenden Befehle aus den Men s aus Transformieren Variable berechnen 181 Abbildung 10 46 Dialogfeld Variable berechnen Target Variable Numeric Expression time trunc casenum 1 4 1 Type amp Label Kategoriale Hauptkomponentenanalyse amp Table Number Tablet da Command_ da Subtype_ Ga Label Ava 8 Centroids Projected or 2 Centroids Projected or E Centroids Projected or optional case selection condition gt Geben Sie time als Zielvariable ein Function group All Arithmetic CDF amp Noncentral CDF Conversion Current Date Time Date Arithmetic Date Creation Date Extraction bie eee gt DTC m Functions and Special Variables
206. er kann die kategoriale Hauptkomponentenanalyse als eine Art Mehrfachkorrespondenzanalyse betrachtet werden bei der einige der Variablen als ordinal oder numerisch deklariert sind Beziehung zu Standardverfahren Wenn alle Variablen auf dem numerischen Niveau skaliert sind entspricht die kategoriale Hauptkomponentenanalyse der normalen Hauptkomponentenanalyse Allgemeiner gesagt Die kategoriale Hauptkomponentenanalyse ist eine Alternative zur Berechnung der Korrelationen zwischen nichtnumerischen Skalen und ihrer Analyse mithilfe der normalen Hauptkomponentenanalyse oder der Faktoranalyse Die unreflektierte Verwendung des blichen Korrelationskoeffizienten nach Pearson als Zusammenhangsma f r ordinale Daten kann zu einer nicht trivialen Verzerrung in der Sch tzung der Korrelationen f hren Nichtlineare kanonische Korrelationsanalyse Die nichtlineare kanonische Korrelationsanalyse ist eine sehr allgemeine Prozedur mit vielen verschiedenen Anwendungen Ziel der nichtlinearen kanonischen Korrelationsanalyse ist die Analyse der Beziehungen zwischen zwei oder mehr Sets von Variablen anstatt zwischen den Variablen selbst wie bei der Hauptkomponentenanalyse So k nnen beispielsweise zwei Variablen Sets vorliegen wobei es sich bei einem Variablen Set um Items zum demografischen Hintergrund f r eine Gruppe von Befragten handelt w hrend das zweite Set aus Antworten auf eine Gruppe von Items zur Einstellung der Personen besteht Die Skalierungsn
207. er 50 und die 206 Kapitel 11 beiden h heren Altersgruppen in einer zweiten Kategorie zusammengefasst werden Die genaue bereinstimmung der Quantifikationen f r die niedrigeren Altersgruppen weist jedoch darauf hin dass eine Einschr nkung der Quantifikationen auf die Reihenfolge der urspr nglichen Kategorien ggf nicht empfehlenswert w re Dei Quantifikationen f r die Gruppen 26 30 36 40 und 41 45 k nnen nicht niedriger sein als die Quantifikation f r die Gruppe 20 25 Diese Werte werden daher auf den Grenzwert gesetzt Wenn Sie angeben dass diese Werte kleiner sein k nnen als die Quantifikation f r die niedrigste Altersgruppe also das Alter als nominal behandeln kann dies die Anpassungsg te erh hen Das Alter kann somit zwar als ordinale Variable angesehen werden eine Behandlung als ordinale Variable ist in diesem Fall wohl eher nicht angebracht W rde das Alter als numerisch behandelt werden und so die Distanzen zwischen den Kategorien aufrechterhalten w rde dies zu einer betr chtlichen Verringerung der Anpassungsg te f hren Einzelkategoriekoordinaten im Vergleich mit Mehrfachkategoriekoordinaten Bei jeder Variablen mit Behandlung als einfach nominal ordinal oder numerisch werden Quantifikationen Einzelkategoriekoordinaten und Mehrfachkategoriekoordinaten ermittelt Diese Statistiken werden f r Age in years dargestellt Abbildung 11 21 Koordinaten f r Age in years Koordinaten von Mehrere Einzelkat
208. er Variablen festlegen Sofern nicht anders angegeben werden Variablen mit Dezimalwerten in sieben Kategorien gruppiert die nahezu normalverteilt sind Wenn die Variable weniger als sieben unterschiedliche Werte aufweist entspricht die Anzahl der Kategorien der Anzahl der unterschiedlichen Werte Werte von String Variablen werden immer in positive ganze Zahlen umgewandelt indem in aufsteigender alphanumerischer Reihenfolge Kategorienummern zugewiesen werden Die Diskretisierung von String Variablen erfolgt anhand dieser Ganzzahlen Andere Variablen werden in der Standardeinstellung nicht modifiziert Die diskretisierten Variablen werden dann in der Analyse verwendet Abbildung 6 4 Dialogfeld Diskretisierung MCA Discretisierung xi Variablen kopf Nicht angegeben kerbe Nicht angegeben form Nicht angegeben lange Nicht angegeben messing Nicht angegeben Methode Gruppieren M ndern Gruppieren Anzahl Kategorien 7 Verteilung Normal Gleichvert Gleiche Intervalle Abbrechen Hite Methode Verf gbar sind die Optionen Gruppieren Einstufen oder Multiplizieren m Gruppieren Hierbei werden die Daten in eine bestimmte Anzahl von Kategorien oder nach Intervall umkodiert Einstufen Die Variable wird durch Bilden einer Rangfolge diskretisiert Multiplizieren Die aktuellen Werte der Variablen werden standardisiert mit 10 multi
209. er Varianz die f r diese Dimension erkl rt werden kann Folglich sind die Dimensionen nach durchschnittlicher Diskrimination geordnet Die erste Dimension weist die gr te durchschnittliche Diskrimination auf die zweite Dimension weist die zweitgr te durchschnittliche Diskrimination auf usw Auf diese Weise werden alle Dimensionen in der L sung geordnet Abbildung 13 7 Diagramm der Diskriminationsma e 1 0 L nge in cm 0 8 N Einkerbung des Kgpfe c 06 K f 2 a c 04 A 02 ssing Grundform gewinde 0 0 0 0 02 0 4 0 6 0 8 1 0 Dimension 1 Wie beim Objektwertediagramm angezeigt zeigt das Diagramm der Diskriminationsma e an da die erste Dimension mit den Variablen Gewinde und Grundform in Zusammenhang steht Diese Variablen weisen gro e Diskriminationsma e in der ersten Dimension und kleine Diskriminationsma e in der zweiten Dimension auf Daher weisen f r diese beiden Variablen die Kategorien nur in der ersten Dimension eine gro e Streubreite auf L nge in cm weist einen gro en Wert in der zweiten Dimension auf jedoch einen kleinen Wert in der ersten Dimension Als Ergebnis liegt L nge am n chsten an der zweiten Dimension was mit der Beobachtung aus dem Objektwertediagramm bereinstimmt da die zweite Dimension die l ngsten Objekte vom Rest zu trennen scheint Einkerbung des Kopfes und Kopfform weisen in beiden Dimensionen relative gro e Werte auf was eine Diskrimination sowohl in der ersten als auch
210. er Verwendung der Quantifikationen f r die Antwort f hren Temperature Pressure gradient und nversion base height in einer linearen Regression nach dem Standardverfahren zu einer Anpassungsg te von 0 733 Soll dieser Wert mit der Anpassungsg te einer kategorialen Regression verglichen werden die sich ebenfalls nur auf diese drei Einflu gr en erstreckt ffnen Sie erneut das Dialogfeld Kategoriale Regression 130 Kapitel 9 Abbildung 9 45 Dialogfeld Kategoriale Regression ti Kategoriale Regression Abh ngige Variable ep angige are In diskrete umwandeln Jozon Spline ordinal 2 2 Fehlende Verte kala definierer Optionen Unabh ngige Variable n ibh Spline ordinal 2 2 dpg Spline ordinal 2 2 Speichern temp Spline ordinal 2 2 Ausgabe Diagramme Skala definiere Einf gen Zur cksetzen Abbrechen Hilfe gt Deaktivieren Sie die Eintr ge Visibility miles und Day of the year als unabh ngige Variablen Klicken Sie auf OK Abbildung 9 46 Modellzusammenfassung f r die kategoriale Regression mit drei Einflu gr en Korrigiertes Multiples R R Quadrat R Quadrat Abhangige Variable Daily ozone level Einflu variablen Inversion base height Pressure gradient mm Hg Temperature degrees F Die kategoriale Regressionsanalyse ergibt eine Anpassungsg te von 0 798 also einen besseren Wert a
211. er Wechselwirkung zwischen den Zeilen und Spaltenvariablen sein Ein sehr h ufiger Typ einer Korrespondenztabelle ist eine Kreuztabelle bei der die Zellen H ufigkeitsz hlungen enthalten Diese Tabellen k nnen schnell und einfach mit der Prozedur Kreuztabellen erstellt werden Eine Kreuztabelle gibt den Charakter der Beziehung zwischen den beiden Variablen jedoch nicht immer klar wieder Dies gilt insbesondere dann wenn die relevanten Variablen nominal sind ohne nat rliche Reihenfolge oder nat rlichen Rang und zahlreiche Kategorien besitzen Eine Kreuztabelle kann zwar aussagen dass die beobachteten Zellh ufigkeiten deutlich von den erwarteten Werten in einer 10x9 Kreuztabelle von Berufsgruppe und Fr hst cksflocken abweichen Es kann jedoch sehr schwierig zu bestimmen sein welche Berufsgruppen einen hnlichen Geschmack aufweisen oder welcher genau dies ist Mit einer Korrespondenzanalyse k nnen Sie die Beziehung zwischen zwei nominalen Variablen grafisch in einem mehrdimensionalen Raum untersuchen Hierbei werden Zeilen und Spaltenwerte berechnet und Diagramme auf der Grundlage dieser Werte angelegt hnliche Kategorien werden in den Diagrammen nahe beieinander dargestellt Auf diese Weise ist leicht ersichtlich welche Kategorien einer Variablen einander hneln oder welche Kategorien beider Variablen zusammenh ngen Bei der Korrespondenzanalyse ist es au erdem m glich Zusatzpunkte in den Raum einzugliedern der durch die aktiv
212. er im Spaltenraum 229 Korrespondenzanalyse liegt Die Zeilen und Spalten werden getrennt voneinander betrachtet verwenden Sie daher die Prinzipal Normalisierung Durchf hrung der Analyse Abbildung 12 16 Dialogfeld Zeilenbereich definieren ti Korrespondenzanalyse Zeilenbereich definieren rKategorienbereich f r Zeilenvariable beruf Minimalwert 4 Maximalwert 6 Nebenbedingungen f r Kategorien 1 O Keine e O N Kategorien m ssen gleich sein Erg nzende Kategorie an Weiter Abbrechen JI Hilfe J gt Um die Zusatzkategorien hinzuzuf gen und eine Prinzipal Normalisierungsl sung zu erstellen ffnen Sie erneut das Dialogfeld Korrespondenzanalyse W hlen Sie staffund klicken Sie auf Bereich definieren gt Geben Sie 6 als H chstwert ein und klicken Sie auf Aktualisieren W hlen Sie in der Liste Nebenbedingungen f r Kategorien den Wert 6 aus und w hlen Sie die Option Erg nzende Kategorie aus Klicken Sie auf Weiter W hlen Sie Rauchen und klicken Sie im Dialogfeld Korrespondenzanalyse auf Bereich definieren 230 Kapitel 12 Abbildung 12 17 Dialogfeld Spaltenbereich definieren E Korrespondenzanalyse Spaltenbereich definieren amp rKategorienbereich f r Spaltenvariable rauchen Minimalwert 4 Maximalwert 6 rNebenbedingungen f r Kategorien
213. erden F r Categories gibt es drei grundlegende Messniveaus Beim nominalen Niveau wird davon ausgegangen dass die Werte einer Variablen f r nicht geordnete Kategorien stehen Beispiele f r m glicherweise nominale Variablen sind Bundesland Postleitzahl Religionszugeh rigkeit und Multiple Choice Kategorien m Beim ordinalen Niveau wird davon ausgegangen dass die Werte einer Variablen f r geordnete Kategorien stehen Beispiele sind Einstellungsskalen die f r den Grad der Zufriedenheit oder der Zuversicht stehen sowie Werte f r Pr ferenzen m Beim numerischen Niveau wird davon ausgegangen dass die Werte einer Variablen f r Kategorien mit einer sinnvollen Metrik stehen sodass man sinnvolle Aussagen ber die Abst nde zwischen den Kategorien machen kann Metrische Variablen sind beispielsweise Alter in Jahren oder Einkommen in Geldeinheiten Nehmen wir beispielsweise an die Variablen Region T tigkeit und Alter seien wie in der folgenden Tabelle kodiert Tabelle 1 1 Kodierungsschema f r Region T tigkeit und Alter Region T tigkeit Alter 1 Norden 1 Praktikant 20 zwanzig Jahre alt 2 S den 2 Vertreter 22 zweiundzwanzig Jahre alt 3 Osten 3 Manager 25 f nfundzwanzig Jahre alt 4 Westen 27 siebenundzwanzig Jahre alt 3 Einf hrung in die Prozeduren f r die optimale Skalierung von kategorialen Daten Die angezeigten Werte stehen f r die Kategorien der einzelnen Variablen Re
214. eren Sie f r jede auf numerischem Niveau skalierte Variable 40 41 Nichtlineare kanonische Korrelationsanalyse OVERALS den kleinsten beobachteten Wert von jedem Wert und addieren Sie 1 Gebrochene Werte werden hinter der Dezimalstelle abgeschnitten Annahmen Variablen k nnen in ein oder mehr Sets klassifiziert werden Variablen in der Analyse werden mehrfach nominal einzeln nominal ordinal oder numerisch skaliert Die in der Prozedur verwendete maximale Anzahl von Dimensionen h ngt vom Messniveau der optimalen Skalierung der Variablen ab Wenn alle Variablen als ordinal einzeln nominal oder numerisch angegeben sind entspricht die maximale Anzahl von Dimensionen dem kleineren der folgenden beiden Werte die Anzahl der Beobachtungen minus 1 oder die Gesamtanzahl der Variablen Wenn jedoch nur zwei Variablen Sets definiert sind entspricht die maximale Anzahl von Dimensionen der Anzahl von Variablen im kleineren Set Wenn einige Variablen mehrfach nominal sind entspricht die maximale Anzahl von Dimensionen der Gesamtanzahl von mehrfach nominalen Kategorien plus der Anzahl von nicht mehrfach nominalen Variablen minus der Anzahl von mehrfach nominalen Variablen Wenn die Analyse beispielsweise f nf Variablen umfasst von denen eine mehrfach nominal mit vier Kategorien ist ist die maximale Anzahl von Dimensionen gleich 4 4 1 also 7 Wenn Sie eine Zahl angeben die gr er als der H chstwert ist wird der H chstwert verwendet
215. erf gbar m Diese Kategorien ber cksichtigen Hiermit werden die Kategorienummern der ausgew hlten Analysevariablen angezeigt m Objektwerte beschriften nach Sie k nnen eine der in der Liste Beschriftungsvariablen enthaltenen Variablen ausw hlen um die Objekte zu beschriften Komponentenladungen Hiermit werden Komponentenladungen f r alle Variablen angezeigt bei denen keine mehrfach nominalen Skalierungsniveaus vorliegen Iterationsprotokoll F r jede Iteration werden ber cksichtigte Varianz Verlust sowie Steigerung der ber cksichtigten Varianz ausgegeben Korrelationen der Originalvariablen Hiermit werden die Korrelationsmatrix der urspr nglichen Variablen und die Eigenwerte dieser Matrix ausgegeben Korrelationen der transformierten Variablen Hiermit werden die Korrelationsmatrix der transformierten optimal skalierten Variablen und die Eigenwerte dieser Matrix ausgegeben 35 Kategoriale Hauptkomponentenanalyse CATPCA Varianz ber cksichtigt f r Hiermit wird die ber cksichtigte Varianz nach Zentroidkoordinaten und nach Vektorkoordinaten sowie die Gesamtsumme kombinierte Zentroid und Vektorkoordinaten pro Variable und Dimension ausgegeben Kategorienquantifikationen Dies sind die Kategoriequantifikationen und koordinaten pro Dimension jeder ausgew hlten Variable Deskriptive Statistik Hiermit werden H ufigkeiten Anzahl der fehlenden Werte und Modalwert f r die ausgew hlten Variablen ausgegeben
216. erpretation des Beitrags der Einflu gr en zur Regression Hohe einzelne Wichtigkeitswerte relativ zu anderen Wichtigkeitswerten bezeichnen Einflu gr en die f r die Regression von entscheidender Bedeutung sind Dar ber hinaus weist eine geringe Wichtigkeit f r eine Variable deren Koeffizient etwa gleich gro ist wie die wichtigen Einflu gr en auf die Pr senz von Suppressorvariablen hin Im Gegensatz zu den Regressionskoeffizienten definiert diese Messzahl die Wichtigkeit der Einflu gr en additiv Die Wichtigkeit einer Gruppe von Einflu gr en entspricht also der Summe der einzelnen Werte f r die Wichtigkeit dieser Einflu gr en Pratts Ma ist gleich dem Produkt des Regressionskoeffizienten und der Korrelation nullter Ordnung f r eine Einflu gr e Diese Produkte werden zu R addiert und anschlie end durch R dividiert dies ergibt die Summe 1 Die Gruppe der Einflu gr en Package design und Brand name besitzt beispielsweise eine Wichtigkeit von 0 654 Die h chste Wichtigkeit liegt bei Package design vor Package design 113 Kategoriale Regression Price und Good Housekeeping seal tragen 95 der Wichtigkeit in dieser Kombination von Einflu gr en bei Multi Kollinearit t Hohe Korrelationen zwischen Einflu gr en f hren zu einer drastisch niedrigeren Stabilit t des Regressionsmodells Die korrelierten Einflu gr en resultieren in instabilen Parametersch tzungen Die Toleranz gibt wieder inwi
217. erschiedliche Koeffizienten wodurch ein analysen bergreifender Vergleich gleicher Variablen erschwert wird CATREG erweitert die Standardmethode durch eine gleichzeitige Skalierung nominaler ordinaler und numerischer Variablen Die Prozedur quantifiziert kategoriale Variablen sodass in den Quantifikationen die Merkmale der urspr nglichen Kategorien zum Ausdruck kommen Dadurch werden quantifizierte kategoriale Variablen auf dieselbe Weise wie numerische Variablen behandelt Durch die Verwendung nichtlinearer Transformationen k nnen Variablen auf einer Vielzahl von Ebenen analysiert und somit das jeweils geeignetste Modell gefunden werden Beispiel Mithilfe der kategorialen Regression k nnte beispielsweise beschrieben werden wie die Zufriedenheit im Beruf von der Berufsgruppe der geografischen Region und der Fahrtzeit abh ngt Unter Umst nden k nnte sich herausstellen dass bei leitenden Angestellten und geringer Fahrtzeit zum Arbeitsplatz ein hohes Zufriedenheitsniveau zu verzeichnen ist Mithilfe der resultierenden Regressionsgleichung k nnte die Zufriedenheit im Beruf f r eine beliebige Kombination der drei unabh ngigen Variablen prognostiziert werden Statistiken und Diagramme H ufigkeiten Regressionskoeffizienten ANOVA Tabelle Iterationsprotokoll Kategorienquantifikationen Korrelationen zwischen nicht transformierten Einflu variablen Korrelationen zwischen transformierten Einflu variablen Residuen Diagramme und Transformati
218. ert f r diese Variable ein W hlen Sie Einzeln nominal als Messniveau aus Klicken Sie auf Weiter vy v v y Klicken Sie im Dialogfeld Nichtlineare kanonische Korrelationsanalyse auf Optionen Abbildung 11 11 Dialogfeld Optionen E OVERALS Optionen Anzeige H ufigkeiten Einfache und mehrfache Anpassung a Zentroide Kategorienquantifikationen kterationsprotokoll a Objektwerte V Gewichte und Komponentenladungen rDiagramm Kategorienkoordinaten V Kategorienzentroide Objektwerte V Transformationen M Komponentenladungen Objektwerte speichern V Zuf llige Anfangskonfiguration verwenden rKriterien Anzahl der tterationen 100 Konvergenz 00001 v Abbrechen Hilfe Deaktivieren Sie die Option Zentroide und w hlen Sie in der Gruppe Anzeige die Option Gewichte und Komponentenladungen M W hlen Sie in der Gruppe Diagramm die Optionen Kategorienzentroide und Transformationen W hlen Sie Zuf llige Anfangskonfiguration verwenden Klicken Sie auf Weiter v v Klicken Sie im Dialogfeld Nichtlineare kanonische Korrelationsanalyse auf OK 199 Nichtlineare kanonische Korrelationsanalyse Bei der kategorialen kanonischen Korrelationsanalyse mit optimaler Skalierung wird zun chst eine Liste der Variablen erzeugt in der das zugeh rige Messniveau mit o
219. erte unabh ngige Variablen V Individuelle Raumgewichtungen Yariablen und Dimensionskorrelationen Diagramme der Quellen Alle Quellen _ Quellen ausw hlen Hinzuf gen Quellennt immer Entfernen Abbrechen Hilfe Wahlen Sie in der Gruppe Diagramme die Option Stress gt Klicken Sie auf Weiter Klicken Sie im Dialogfeld Multidimensionale Skalierung auf OK Abbildung 14 8 Screeplot 0 14 0 12 0 10 0 08 0 06 0 04 Normalisierter unbearbeiteter Stress 2 3 4 5 6 7 8 9 10 Dimensionalitat Die Prozedur beginnt mit einer zehndimensionalen L sung und wird dann auf eine zweidimensionale L sung reduziert Der Screeplot zeigt den normalisierten Roh Stress f r die L sung in jeder Dimension Aus dem Diagramm geht hervor dass ein Anstieg der Dimensionen 279 Multidimensionale Skalierung von 2 auf 3 sowie von 3 auf 4 eine gro e Verbesserung beim Stress nach sich zieht Ab 4 werden nur noch geringf gige Verbesserungen erzielt Sie entscheiden sich die Daten mithilfe einer dreidimensionalen L sung zu interpretieren weil die Ergebnisse hier einfacher zu interpretieren sind Eine dreidimensionale L sung Die unabh ngigen Variablen gender gener generation und degree der Trennung wurden speziell f r die Interpretation der Dimensionen in der L sung erstellt Die unabh ngigen Variablen wurden wie folgt gebildet gender 1 male 2
220. erung Messniveau der optimalen Skalierung G Alle Variablen sind mehrfach nominal Einige Variablen sind nicht mehrfach nominal rAnzahl der Yariablen Sets Ausgew hlte Analyse Mehrfachkorrespondenzanalyse iale Hauptkomponenter kanonische Kor Abbrechen J Hilfe klicken Sie auf Definieren gt Vergewissern Sie sich da Alle Variablen sind mehrfach nominal und Ein Set ausgew hlt sind und 256 Kapitel 13 Abbildung 13 2 Dialogfeld Mehrfachkorrespondenzanalyse Analysevariablen Dimensionen in der L sung 2 Abbrechen W hlen Sie Gewinde bis L nge in cm als Analysevariablen aus gt Wahlen Sie object als Beschriftungsvariable gt Klicken Sie im Gruppenfeld Diagramme auf Objekt 257 Mehrfachkorrespondenzanalyse Abbildung 13 3 Dialogfeld Objektdiagramme rDiagramme V Objektpunkte oO Objekte und Zentroide Biplot Biplot Variablen verf gbar Ausgew hlt Einschlie en Alle Variablen Ausgew hlte Variablen messing Objekte beschriften Verf gbar Beschriften anhand Fallnummer v Variable W hlen Sie aus da Objekte nach Variable beschriftet werden sollen W hlen Sie gewinde bis object als Beschriftungsvariablen aus Klicken Sie auf Weiter und dann im Gruppenfeld Diagramme des Dialogfelds Mehrfachkorrespondenzanalyse auf Varia
221. es Installationsverzeichnisses Beschreibungen Im Folgenden finden Sie Kurzbeschreibungen der in den verschiedenen Beispielen in der Dokumentation verwendeten Beispieldateien accidents sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um eine Versicherungsgesellschaft geht die alters und geschlechtsabh ngige Risikofaktoren f r Autounf lle in einer bestimmten Region untersucht Jeder Fall entspricht einer Kreuzklassifikation von Alterskategorie und Geschlecht adl sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um Bem hungen geht die Vorteile einer vorgeschlagenen Therapieform f r Schlaganfallpatienten zu ermitteln rzte teilten weibliche Schlaganfallpatienten nach dem Zufallsprinzip jeweils einer von zwei Gruppen zu Die erste Gruppe erhielt die physische Standardtherapie die zweite erhielt eine zus tzliche Emotionaltherapie Drei Monate nach den Behandlungen wurden die F higkeiten der einzelnen Patienten bliche Alltagsaktivit ten auszuf hren als ordinale Variablen bewertet advert sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Einzelh ndlers geht die Beziehungen zwischen den in Werbung investierten Betr gen und den daraus resultierenden Ums tzen zu untersuchen Zu diesem Zweck hat er die Ums tze vergangener Jahre und die zugeh rigen Werbeausgaben zusammengestellt aflatoxin sav Hierbei handelt es sich um eine hypoth
222. et Beispieldaten Galerie Ausw hlen aus Favoriten Grundelemente Balken F ee Linie Pp Gruppen Punkt ID Fl che Kreis Polar I Titel Fu noten Streu Punktdiagr Histogramm Hoch Tief Elementeigenschaft Boxplot Doppelachsen Optionen 7 Zum Anzeigen eines Streudiagramms f r die transformierten Variablen ffnen Sie erneut die Diagrammerstellung und klicken Sie auf Zur cksetzen Die bisherige Auswahl wird gel scht W hlen Sie die Galerie Streu Punktdiagramm aus und w hlen Sie die Option Einfaches Streudiagramm gt W hlen Sie Daily ozone level Quantification TRA1_3 als y Achsen Variable aus und Day of the year Quantification TRA2_3 als x Achsen Variable Klicken Sie auf OK 139 Kategoriale Regression Abbildung 9 57 Streudiagramm der transformierten Variablen Daily ozone level Quantifikation 2 00 1 00 0 00 1 00 2 00 Day ofthe year Quantifikation Diese Abbildung zeigt die Beziehungen zwischen den transformierten Variablen Die umgekehrte U Form wird durch einen steigenden Trend ersetzt Die Regressionslinie besitzt eine positive Steigung dies weist darauf hin dass der vorhergesagte Wert f r Daily ozone level steigt wenn die transformierte Variable Day ofthe year ansteigt Die Beziehung wird mithilfe der optimalen Skalierung linearisiert sodass Interpretationen m glich sind die ansonsten unbemerkt geblieben w ren Empfohlene Literatur I
223. et WinWrap Basic Copyright 1993 2007 Polar Engineering and Consulting http Avww winwrap com SPSS Categories 16 0 Copyright 2007 SPSS Inc Alle Rechte vorbehalten Ohne schriftliche Erlaubnis der SPSS GmbH Software darf kein Teil dieses Handbuchs fiir irgendwelche Zwecke oder in irgendeiner Form mit irgendwelchen Mitteln elektronisch oder mechanisch mittels Fotokopie durch Aufzeichnung oder durch andere Informationsspeicherungssysteme reproduziert werden Vorwort SPSS 16 0 ist ein umfassendes System zum Analysieren von Daten Das optionale Zusatzmodul Categories Kategorien bietet die zus tzlichen Analyseverfahren die in diesem Handbuch beschrieben sind Die Prozeduren im Zusatzmodul Categories Kategorien m ssen zusammen mit SPSS 16 0 Base verwendet werden Sie sind vollst ndig in dieses System integriert Installation Zur Installation von SPSS Categories Kategorien Erweiterungsmodul f hren Sie den Lizenzautorisierungsassistenten mit dem Autorisierungscode aus den Sie von SPSS erhalten haben Weitere Informationen finden Sie in den Installationsanweisungen im Lieferumfang von SPSS Categories Kategorien Erweiterungsmodul Kompatibilit t SPSS kann auf vielen Computersystemen ausgef hrt werden Mindestanforderungen an das System und Empfehlungen finden Sie in den Unterlagen die mit Ihrem System geliefert werden Seriennummern Die Seriennummer des Programms dient gleichzeitig als Identifikationsnummer bei SP
224. etische Datendatei bei der es um Tests von Maisernten auf Aflatoxin geht ein Gift dessen Konzentration stark zwischen und innerhalb von Ernteertr gen schwankt Ein Kornverarbeitungsbetrieb hat aus 8 Ernteertr gen je 16 Proben erhalten und das Aflatoxinniveau in Teilen pro Milliarde parts per billion PPB gemessen aflatoxin20 sav Diese Datendatei enth lt die Aflatoxinmessungen aus jeder der 16 Stichproben aus den Ertr gen 4 und 8 der Datendatei aflatoxin sav anorectic sav Bei der Ausarbeitung einer standardisierten Symptomatologie anorektischen bulimischen Verhaltens f hrten Forscher Van der Ham Meulman Van Strien als auch Van Engeland 1997 eine Studie mit 55 Jugendlichen mit bekannten Ess St rungen durch Jeder Patient wurde vier Mal ber einen Zeitraum von vier Jahren untersucht es fanden also insgesamt 220 Beobachtungen statt Bei jeder Beobachtung erhielten die Patienten Scores f r jedes von 16 Symptomen Die Symptomwerte fehlen f r Patient 71 326 327 Beispieldateien zum Zeitpunkt 2 Patient 76 zum Zeitpunkt 2 und Patient 47 zum Zeitpunkt 3 wodurch 217 g ltige Beobachtungen verbleiben autoaccidents sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Versicherungsanalysten geht ein Modell zur Anzahl der Autounf lle pro Fahrer unter Ber cksichtigung von Alter und Geschlecht zu erstellen Jeder Fall stellt einen Fahrer dar und erfasst das Geschlecht des Fahrers
225. etzen Abbrechen Hite W hlen Sie eine hnlichkeitsvariable aus Es wird davon ausgegangen dass es sich dabei um eine oder mehrere Distanzmatrizen handelt W hlen Sie eine Zeilenvariable zum Festlegen der Zeilenpositionen f r die hnlichkeiten in der hnlichkeitsvariablen aus W hlen Sie eine Spaltenvariable zum Festlegen der Spaltenpositionen f r die hnlichkeiten in der hnlichkeitsvariablen aus Wenn mehrere Quellen vorhanden sind w hlen Sie eine Quellenvariable aus Zellen der Distanzmatrix denen keine Zeilen Spaltenposition zugewiesen ist werden f r jede Quelle als fehlend behandelt W hlen Sie optional eine Gewichtungsvariable aus Dar ber hinaus k nnen Sie ein Modell f r die multidimensionale Skalierung angeben Einschr nkungen f r den gemeinsamen Raum festlegen Konvergenzkriterien festlegen die zu verwendende Ausgangskonfiguration angeben sowie Diagramme und die Ausgabe ausw hlen 75 Multidimensionale Skalierung PROXSCAL hnlichkeiten aus Daten erstellen Wenn Sie im Dialogfeld Datenformat die Option zum Erstellen von hnlichkeiten aus Daten ausw hlen wird das Hauptdialogfeld folgenderma en dargestellt Abbildung 7 5 Dialogfeld Ahnlichkeiten aus Daten erstellen E Multidimensionale Skalierung hnlichkeiten aus Daten erstellen Variablen Bruder bruder Fea Cousin cousin Einschr nkungen g Enkelin enkelin 8 G
226. eutet dass diese St dte am weitesten voneinander entfernt sind geringste hnlichkeit die Distanz 2529 zwischen New York und Washington D C bedeutet dagegen dass diese St dte einander am n chsten liegen gr te hnlichkeit 252 Kapitel 12 Abbildung 12 45 R Korrespondenztabelle f r Ahnlichkeiten Spalte Los New San Washington Aktiver Zeile Atlanta Chicago Denver Houston Angeles Miami York Francisco Seattle DC Rand See DC Aktiver Rand Zeilen und Spaltenwerte Durch die Verwendung von Flugmeilen anstelle von Stra enmeilen wirken sich die Gegebenheiten am Boden der USA nicht auf die Distanzen aus Alle hnlichkeiten sollten daher in nur zwei Dimensionen dargestellt werden k nnen Zentrieren Sie sowohl die Zeilen als auch die Spalten und verwenden Sie die Prinzipal Normalisierung Aufgrund der Symmetrie der Korrespondenztabelle und der Prinzipal Normalisierung sind die Zeilen und Spaltenwerte identisch und die Gesamttr gheit befindet sich sowohl in den Zeilen als auch in den Spalten Aus diesem Grund k nnen Sie wahlweise die Zeilen oder Spaltenwerte untersuchen und dabei jeweils dieselben Ergebnisse erzielen Abbildung 12 46 Punkte f r 10 St dte 0 4 02 o Mia Hou N OLA c s O Atl o 00 O Den SF E O Chi oDC 024 ONY o Sea Dimension 1 253 Korrespondenzanalyse Die Positionen der St dte besitzen gro e hnlichkeit mit der tats chlichen geografis
227. eweit ein linearer Zusammenhang zwischen den unabh ngigen Variablen besteht Diese Messzahl ist der Anteil an der Varianz einer Variablen der durch die anderen unabh ngigen Variablen in der Gleichung nicht erkl rt wird Falls die anderen Einflu gr en einen gro en Teil der Varianz einer Einflu gr e erkl ren k nnen wird diese Einflu gr e im Modell nicht ben tigt Ein Toleranzwert nahe 1 bedeutet dass die Variable nicht ohne weiteres aus den anderen Einflu gr en vorhergesagt werden kann Eine Variable mit sehr geringer Toleranz tr gt dagegen wenig zum Informationsgehalt eines Modells bei und kann zu Problemen bei der Berechnung f hren Gro e negative Werte beim Ma f r die Wichtigkeit nach Pratt weisen zudem auf Multi Kollinearit t hin Alle Toleranzmesswerte sind sehr hoch Keine der Einflu gr en kann ohne weiteres aus den anderen Einflu gr en vorhergesagt werden und es besteht keine Multi Kollinearit t Transformationsdiagramme Das Diagramm mit den urspr nglichen Werten und den zugeh rigen Quantifikationen kann Trends aufdecken die in einer Quantifikationsliste nicht ohne weiteres ersichtlich sind Diese Diagramme werden in der Regel als Transformationsdiagramme bezeichnet Kategorien mit hnlichen Quantifikationen sollten besonders beachtet werden Diese Kategorien wirken sich auf dieselbe Weise auf die vorhergesagte Antwort aus Das grundlegende Erscheinungsbild des Diagramms wird allerdings durch den Transfo
228. ezeichnet um Vertraulichkeit zu gew hrleisten contacts sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Kontaktlisten einer Gruppe von Vertretern geht die Computer an Unternehmen verkaufen Die einzelnen Kontaktpersonen werden anhand der Abteilung in der sie in ihrem Unternehmen arbeiten und anhand ihrer Stellung in der Unternehmenshierarchie in Kategorien eingeteilt Au erdem werden der Betrag des letzten Verkaufs die Zeit seit dem letzten Verkauf und die Gr e des Unternehmens in dem die Kontaktperson arbeitet aufgezeichnet creditpromo sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Kaufhauses geht die Wirksamkeit einer k rzlich durchgef hrten Kreditkarten Werbeaktion einzusch tzen Dazu wurden 500 Karteninhaber nach dem Zufallsprinzip ausgew hlt Die H lfte erhielt eine Werbebeilage die einen reduzierten Zinssatz f r Eink ufe in den n chsten drei Monaten ank ndigte Die andere H lfte erhielt eine Standard Werbebeilage customer_dbase sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Unternehmens geht das die Informationen in seinem Data Warehouse nutzen m chte um spezielle Angebote f r Kunden zu erstellen die mit der gr ten Wahrscheinlichkeit darauf ansprechen Nach dem Zufallsprinzip wurde eine Untergruppe des Kundenstamms ausgew hlt Diese Gruppe erhielt die speziellen Angebote und di
229. fehl CATREG bearbeiten Mit der Befehlssyntax Sprache verf gen Sie au erdem ber folgende M glichkeiten m Mit dem Unterbefehl SAVE k nnen Sie Stammnamen f r die transformierten Variablen festlegen wenn Sie diese in der Arbeitsdatei speichern Vollst ndige Informationen zur Syntax finden Sie in der Command Syntax Reference Kapitel 3 Kategor ale Hauptkomponentenanalyse CATPCA Bei diesem Verfahren werden kategoriale Variablen quantifiziert und gleichzeitig die Dimensionen der Daten reduziert Die kategoriale Hauptkomponentenanalyse ist auch unter dem Akronym CATPCA bekannt Categorical Principal Components Analysis Das Ziel bei der Hauptkomponentenanalyse besteht darin ein urspr ngliches Set von Variablen in ein kleineres Set von unkorrelierten Komponenten umzuwandeln das soviel wie m glich von den Informationen aus den urspr nglichen Variablen enth lt Diese Methode ist besonders dann n tzlich wenn eine hohe Anzahl von Variablen eine effektive Interpretation der Beziehungen zwischen den Objekten Subjekten und Einheiten verhindert Nach einer Dimensionsreduktion werden nur einige Komponenten anstelle einer gro en Anzahl von Variablen interpretiert Beim Standardverfahren der Hauptkomponentenanalyse wird von linearen Beziehungen zwischen numerischen Variablen ausgegangen Bei der Methode der optimalen Skalierung k nnen die Variablen jedoch auf verschiedenen Niveaus skaliert werden Kategoriale Variablen werden o
230. fehlenden Wert aufweist 9 Fehlend f r Cousin Im Rahmen der Prozedur wird dies als g ltige Kategorie behandelt Die lineare Transformation nach dem Standardverfahren ist daher eher ungeeignet Verwenden Sie statt dessen eine nominale Transformation 277 Multidimensionale Skalierung Abbildung 14 6 Dialogfeld Einschr nkungen A Multidimensionale Skalierung Einschr nkungen X Einschr nkungen im gemeinsamen Raum Keine Einschr nkungen Einige Koordinaten sind fest Lineare Kombination der unabh ngigen Variablen rEinschr nkungsvariablen Variablen einlesen aus kinship_yar sav Verf gbar Ausgew hlt gender nominal gener intervall degreetintervall ndern Transformationen f r unabh ngige Variablen Nominal v Grad 2 Knoten 1 weiter Abbrechen Hilfe Wahlen Sie gender aus W hlen Sie in der Dropdown Liste f r die Transformationen unabh ngiger Variablen den Eintrag Nominal Klicken Sie auf ndern Klicken Sie auf Weiter Klicken Sie im Dialogfeld Multidimensionale Skalierung auf Diagramme 278 Kapitel 14 Abbildung 14 7 Dialogfeld Diagramme Multidimensionale Skalierung Diagramme rDiagramme Stress Urspr ngliche ber transformierte hnlichkeiten _ Individueller Raum ad Gemeinsamer Raum a Transformierte hnlichkeiten gegen Distanzen O Transformi
231. finieren anderer Gleichheitsbeschr nkungen f r Kategoriegruppen k nnen Sie die Syntax verwenden Beispielsweise k nnen Sie mithilfe der Syntax festlegen dass die Kategorien 1 und 2 sowie die Kategorien 3 und 4 gleich sein m ssen m Erg nzende Kategorie Erg nzende Kategorien haben keine Auswirkungen auf die Analyse werden jedoch in dem durch die aktiven Kategorien definierten Raum dargestellt Erg nzende Kategorien spielen keine Rolle bei der Definition von Dimensionen Die maximale Anzahl der erg nzenden Spaltenkategorien entspricht der Gesamtanzahl der Spaltenkategorien minus 2 Korrespondenzanalyse Modell Im Dialogfeld Modell k nnen Sie die Anzahl der Dimensionen die Distanzma e sowie die Standardisierungsmethode und die Normalisierungsmethode angeben 51 Korrespondenzanalyse Abbildung 5 4 Dialogfeld Modell Korrespondenzanalyse Modell Dimensionen in der L sung 2 Distanzma Chi Quadrat Euklidisch Standardisierungsmethode Zeilen und Spattenmittel werden entfernt Normalisierungsmethode Zeilenprinzipal Anpassen O Prinzipal Spaltenprinzipal Weiter J Abbrechen Hite Dimensionen in der L sung Legen Sie die Anzahl der Dimensionen fest Im allgemeinen sollten Sie nur so viele Dimensionen ausw hlen wie zum Erkl ren des gr ten Teils der Variation notwendig ist Die maximal zul ssige Dimensionszahl h ngt von der Anzahl de
232. fizierungen beibehalten die Kategoriewerte selbst sind nicht von Bedeutung Alle Kodierungsschemata die zur selben Kategoriereihenfolge f hren weisen identische Ergebnisse auf Beispiel Die ersten drei Schemata in der Tabelle sind funktional quivalent wenn T tigkeit auf ordinaler Ebene analysiert wird Die Reihenfolge der Kategorien ist in diesen Schemata identisch Bei Schema D dagegen werden die zweite und die dritte Kategorie invertiert und es ergeben sich andere Ergebnisse als bei den anderen Schemata Obwohl viele Kodierungsschemata f r eine Variable funktional quivalent sind werden Schemata mit kleinen Werten f r die Differenz zwischen den Codes bevorzugt da die Codes sich auf die Menge an Ausgabedaten auswirken die sich aus der Prozedur ergeben Alle Kategorien die mit Werten zwischen und dem benutzerdefinierten H chstwert kodiert sind sind g ltig Wenn eine dieser Kategorien leer ist sind die entsprechenden Quantifizierungen je nach Prozedur entweder systemdefiniert fehlend oder 0 Obwohl sich keine dieser Zuordnungen auf die Analysen auswirkt wird f r die betreffenden Kategorien eine Ausgabe erstellt So weist T tigkeit bei Schema B vier Kategorien auf die systemdefiniert fehlende Werte erhalten Bei Schema C gibt es au erdem vier Kategorien die Indikatoren f r systemdefiniert fehlende Werte erhalten Im Gegensatz dazu gibt es bei Schema A keine systemdefiniert fehlenden Quantifizierungen Die 6 Kapitel 1 Ver
233. folgenden zwei Beispiele zeigen dass das naheliegendste Messniveau nicht unbedingt das beste Niveau f r die optimale Skalierung sein muss Angenommen eine Variable ordnet Objekte in Altersgruppen ein Alter kann zwar als numerische Variable skaliert werden aber dennoch steht Sicherheit f r Personen unter 25 Jahren m glicherweise in einer positiven Relation zum Alter wohingegen sie f r Personen ber 60 Jahren in einer negativen Relation zum Alter steht In diesem Fall kann es besser sein das Alter als nominale Variable zu behandeln Zweites Beispiel Eine Variable die Personen nach politischen Neigungen ordnet scheint ihrem Wesen nach nominal zu sein Wenn Sie jedoch die Parteien von politisch links nach politisch rechts sortieren w re es sinnvoll wenn die Quantifizierung der Parteien diese Reihenfolge ber cksichtigen w rde Dazu m te ein ordinales Niveau f r die Analyse verwendet werden Auch wenn es keine vordefinierten Eigenschaften gibt die eine Variable ausschlie lich einem bestimmten Messniveau zuordnen gibt es einige allgemeine Richtlinien nach denen sich unerfahrene Benutzer richten k nnen Bei einzeln nominaler Quantifizierung kennen Sie normalerweise nicht die Reihenfolge der Kategorien m chten jedoch dass durch die Analyse eine festgelegt wird Wenn die Reihenfolge der Kategorien bekannt ist sollten Sie eine ordinale Quantifizierung verwenden Wenn sich die Kategorien nicht ordnen lassen sollten Sie eine mehrfach nomi
234. formationen siehe Beispieldateien in Anhang A auf S 326 Neben der Auswahl von Variablen die in die Berechnung der kategorialen 141 142 Kapitel 10 Hauptkomponentenanalyse eingeschlossen werden sollen k nnen Sie Variablen ausw hlen die zur Beschriftung der Objekte in Diagrammen dienen sollen In diesem Beispiel sind die ersten f nf Variablen in den Daten in die Analyse eingeschlossen w hrend Cluster ausschlie lich als Beschriftungsvariable verwendet wird Bei Angabe einer kategorialen Hauptkomponentenanalyse m ssen Sie das optimale Skalierungsniveau f r jede Analysenvariable angeben In diesem Beispiel wird f r alle Analysevariablen ein ordinales Niveau angegeben Tabelle 10 1 Variablen im Guttman Bell Daten Set Variablenname Variablenlabel Wertelabels intensit Intensit t Sehr schwach schwach mittel hoch frequenz H ufigkeit Frequenz Schwach nicht wiederkehrend selten h ufig zugeh r Zugeh rigkeit Keine schwach variable hoch entfern Entfernung Weit nah formal Formalitat Keine Beziehung f rmlich nicht f rmlich cluster CR Crowds AU audiences PU public MB mobs PG primary groups SG secondary groups MC modern community Durchf hrung der Analyse gt Um aus diesem Daten Set Ausgaben f r die kategoriale Hauptkomponentenanalyse zu erstellen w hlen Sie folgende Befehle aus den Men s aus Analysieren Dimensionsreduktion Optimale Skal
235. formations for dimension reduction Psychometrika 48 575 595 Young F W J De Leeuw als auch Y Takane 1976 Regression with qualitative and quantitative variables An alternating least squares method with optimal scaling features Psychometrika 41 505 528 Kapitel Kategoriale Hauptkomponentenanalyse Die kategoriale Hauptkomponentenanalyse kann als Methode der Dimensionsreduktion betrachtet werden Ein Variablen Set wird analysiert um gr ere Variationsdimensionen aufzudecken Die urspr ngliche Datenmenge kann danach unter minimalem Informationsverlust durch eine neue kleinere Datenmenge ersetzt werden Die Methode zeigt Beziehungen zwischen Variablen zwischen F llen und zwischen Variablen und F llen auf Das von der kategorialen Hauptkomponentenanalyse f r die Quantifizierung der beobachteten Daten verwendete Kriterium besteht darin dass die Objektwerte Komponentenwerte starke Korrelationen mit jeder der quantifizierten Variablen aufweisen sollten Eine L sung ist gut in dem Grad in dem dieses Kriterium erf llt wird Es werden zwei Beispiele der kategorialen Hauptkomponentenanalyse vorgestellt Beim ersten wird eine eher kleine Datenmenge verwendet anhand derer die Grundkonzepte und Interpretationen in Verbindung mit der Prozedur illustriert werden sollen Im zweiten Beispiel wird eine praktische Anwendung untersucht Beispiel Untersuchung der Interrelationen sozialer Systeme In diesem Beispiel wird die Guttm
236. g der Analyse dienen k nnen Durchf hrung der Analyse gt Bevor Sie die Prozedur Korrespondenzanalyse vornehmen k nnen m ssen die F lle gem dem Aufbau der Daten nach der Variablenanzahl gewichtet werden W hlen Sie hierzu die folgenden Befehle aus den Men s aus Daten F lle gewichten Abbildung 12 1 Dialogfeld F lle gewichten i Falle gewichten amp b Berufsgruppe beruf F lle nicht gewichten JB Anzahl anzahl F lle gewichten mit H ufigkeitsvariable Aktueller Status F lle gewichten nachanzahl kJ Einf gen Zur cksetzen Abbrechen Hilfe F lle gewichten nach Anzahl Klicken Sie auf OK 219 Korrespondenzanalyse Zum Erstellen einer Korrespondenzanalyse in zwei Dimensionen mit der Zeilenprinzipal Normalisierung w hlen Sie dann die folgenden Befehle aus den Men s aus Analysieren Dimensionsreduktion Korrespondenzanalyse Abbildung 12 2 Dialogfeld Korrespondenzanalyse FB Korrespondenzanalyse X P paperaren eaa i alll Anzahl anzai Bereich definieren Sashes Spalte J Yy Bereich definieren Einf gen Zur cksetzen Abbrechen Hilfe W hlen Sie Berufsgruppe als Zeilenvariable aus Klicken Sie auf Bereich definieren Abbildung 12 3 Dialogfeld Zeilenbereich definieren E Korrespondenzanalyse Zeilenbereich definieren x Kategorienbereich f r Zeilenvariable ber
237. gfeld Kategoriale Regression auf In diskrete umwandeln Abbildung 9 28 Dialogfeld Diskretisierung Kategoriale Regression Diskretisierung X Yariablen ozon Nicht angegeben ibh Gruppieren Normalverteilung 10 dpg Gruppieren Normalverteilung 10 vis Gruppieren Normalverteilung 10 doy Gruppieren Normalverteilung 10 Gruppieren Anzahl Kategorien a Verteilung Normal O gleichvert Gleiche Intervalle 4 g astresten J te W hlen Sie ibh aus gt W hlen Sie Gleiche Intervalle und geben Sie 100 als Intervall ein Klicken Sie auf ndern W hlen Sie dpg vis und doy aus 121 Kategoriale Regression Geben Sie 10 als L nge f r das Intervall ein Klicken Sie auf ndern W hlen Sie temp aus Geben Sie 1 8 als L nge f r das Intervall ein Klicken Sie auf ndern Klicken Sie auf Weiter vy v Vv V V vy YW Klicken Sie im Dialogfeld Kategoriale Regression auf Diagramme Abbildung 9 29 Dialogfeld Diagramme a Kategoriale Regression Diagramme a Transformationsdiagramme Residuen Diagramme gt PE P pee W hlen Sie Transformationsdiagramme f r Inversion base height bis Day of the year aus Klicken Sie auf Weiter Klicken Sie im Dialogfeld Kategoriale Regression auf OK Abbildung 9 30 Modellzusammenfassung Korrigiertes Multiples R R Quadrat R Quadrat Abh
238. gion ist eine nominale Variable Die Variable Region weist vier Kategorien ohne implizierte Reihenfolge auf Die Werte 1 bis 4 stehen einfach f r die vier Kategorien das Kodierungsschema ist v llig willk rlich T tigkeit dagegen k nnte als ordinale Variable betrachtet werden Die urspr nglichen Kategorien stellen eine Steigerung vom Praktikanten bis hin zum Manager dar H here Codewerte stehen f r eine T tigkeit die auf der innerbetrieblichen Karriereleiter weiter oben liegt Es ist jedoch nur die Reihenfolge bekannt ber den Abstand zwischen benachbarten Kategorien wird nichts ausgesagt Im Gegensatz dazu kann Alter als numerische Variable betrachtet werden Bei Alter haben die Abst nde zwischen den Werten eine implizite Bedeutung Der Abstand zwischen 20 und 22 ist genauso gro wie der Abstand zwischen 25 und 27 wohingegen der Abstand zwischen 22 und 25 gr er als die beiden anderen ist Auswahl des Messniveaus der optimalen Skalierung Es ist wichtig zu begreifen dass es keine intrinsischen Eigenschaften einer Variablen gibt die automatisch vordefinieren welches Messniveau der optimalen Skalierung daf r angegeben werden sollte Sie k nnen die Daten so analysieren wie es sinnvoll erscheint und die Interpretation erleichtert Bei der Analyse einer Variablen mit eigentlich numerischem Niveau auf dem ordinalen Niveau kann durch die Verwendung einer nichtlinearen Transformation eine L sung in weniger Dimensionen m glich sein Die
239. gnose getrennt werden Es gibt jedoch Informationen ber die zweite Dimension Patienten mit Anorexie 1 und Patienten die an einer atypischen E st rung leiden 4 bilden eine Gruppe die sich oberhalb der Personen befindet die eine Art von Bulimie aufweisen 2 und 3 Die zweite Dimension trennt also bulimische Patienten von den anderen wie auch im vorherigen Abschnitt deutlich wurde die Variablen im Bulimie B ndel weisen gro e positive Komponentenladungen in der zweiten Dimension auf Dies ergibt einen Sinn wenn man bedenkt dass die Komponentenladungen der Symptome die traditionell mit Bulimie assoziiert werden gro e Werte in der zweiten Dimension aufweisen 173 Kategoriale Hauptkomponentenanalyse Die folgende Abbildung zeigt ein Diagramm der Objektwerte bei denen die Subjekte mit dem jeweiligen Diagnosezeitpunkt beschriftet sind Abbildung 10 38 Objektwerte mit Time of interview Zeitpunkt der Befragung beschriftet Dimension 2 N Dimension 1 Wenn die Objektwerte nach Zeitpunkt beschriftet werden zeigt sich dass die erste Dimension eine Relation zur Zeit aufweist da die Diagnosezeitpunkte f r 1 gr tenteils links und die anderen eher weiter rechts liegen Sie k nnen die Zeitpunkte in diesem Diagramm verbinden indem Sie die Objektwerte speichern und ein Streudiagramm mit den Werten Scores von Dimension 1 auf der x und den Scores von Dimension 2 auf der y Achse erstellen und anschlie end di
240. gramme 241 Statistiken 47 Tr gheit pro Dimension 221 Zeilen und Spaltenwerte 225 Zeilenwertdiagramme 241 252 zus tzliche Funktionen beim Befehl 55 Korrespondenztabellen in der Korrespondenzanalyse 221 251 Mehrfachkorrespondenzanalyse 56 61 254 Ausrei er 266 Diskriminationsma e 260 Kategorienquantifikationen 261 Messniveau der optimalen Skalierung 58 Modellzusammenfassung 258 Objektwerte 259 263 Variablen speichern 64 zus tzliche Funktionen beim Befehl 67 Messniveau der optimalen Skalierung bei der Mehrfachkorrespondenzanalyse 58 in der Kategorialen Hauptkomponentenanalyse 27 Modellzusammenfassung bei der Mehrfachkorrespondenzanalyse 258 Multidimensionale Entfaltung 85 290 313 hnlichkeitstransformationen 321 325 346 Index Ausgabe 93 degenerierte L sungen 290 Diagramme 85 91 Drei fach Entfaltung 297 Einschr nkungen im gemeinsamen Raum 88 Gemeinsamer Raum 294 297 303 310 320 324 Individueller Raum 304 311 Ma e 293 296 302 309 319 323 Modell 87 Optionen 89 Statistiken 85 zus tzliche Funktionen beim Befehl 95 Multidimensionale Skalierung 69 72 76 271 Ausgabe 83 Diagramme 69 81 82 Einschr nkungen 78 Gemeinsamer Raum 284 287 Modell 77 Optionen 79 Statistiken 69 Stressma e 283 287 Transformationsdiagramme 286 zus tzliche Funktionen beim Befehl 84 Multiples R in Kategoriale Regression 21 Nichtlineare kanonisc
241. gung der optimalen Skalierung Kategorienquantifikationen Tabellen mit den transformierten Werten der gew hlten Variablen werden angezeigt 23 Kategoriale Regression CATREG Deskriptive Statistiken Tabellen mit den H ufigkeiten fehlenden Werten und Modalwerten der gew hlten Variablen werden angezeigt Kategoriale Regression Speichern Im Dialogfeld Speichern k nnen Sie festlegen dass die vorhergesagten Werte Residuen und transformierten Werte in der Arbeitsdatei gespeichert werden Au erdem k nnen die diskretisierten Daten und die transformierten Werte in einer SPSS Datendatei oder einem Daten Set gespeichert werden m Daten Sets sind in der aktuellen Sitzung verf gbar In nachfolgenden Sitzungen stehen Daten Sets nur zur Verf gung wenn Sie sie ausdr cklich als Datendateien speichern Die Namen von Daten Sets m ssen den Regeln zum Benennen von Variablen entsprechen m Die Namen f r die Dateien und Daten Sets m ssen sich bei allen Arten von gespeicherten Daten unterscheiden Abbildung 2 7 Dialogfeld Speichern is Kategoriale Regression Speichern __ Morhergesagte Werte in Arbeitsdatei speichern Residuen in Arbeitsdatei speichern Diskretisierte Daten Diskretisierte Daten erstellen Transformierte Variablen _ Transformierte Variablen in Arbeitsdatei speichern Transtormierte Variablen erstellen Weiter J Abbrechen
242. h mit kategorialen Daten zu tun 2 Kapitel 1 Es gibt zwar von den meisten Standardmodellen Anpassungen f r die Analyse kategorialer Daten doch diese funktionieren h ufig nicht gut f r Daten Sets mit folgenden Eigenschaften m Zu wenige Beobachtungen m Zu viele Variablen m Zu viele Werte pro Variable Bei der Quantifizierung von Kategorien k nnen Verfahren zur optimalen Skalierung die Probleme in diesen F llen vermeiden Au erdem sind sie selbst dann n tzlich wenn spezialisierte Verfahren angebracht sind Anstatt auf der Interpretation von Parametersch tzern beruht die Interpretation der Ausgabe bei der optimalen Skalierung h ufig auf grafischen Darstellungen Verfahren zur optimalen Skalierung bieten hervorragende explorative Analysen die eine gute Erg nzung zu anderen SPSS Modellen darstellen Durch Einengung des Fokus der Untersuchung kann die Visualisierung der Daten durch optimale Skalierung die Grundlage einer Analyse bilden die sich auf die Interpretation von Modellparametern konzentriert Messniveau der optimalen Skalierung Dieses Konzept kann bei der Verwendung der Prozeduren von Categories zun chst sehr verwirrend sein Bei der Angabe des Niveaus geben Sie nicht das Niveau an auf dem die Variablen gemessen werden sondern das Niveau auf dem sie skaliert werden Der Grund daf r ist dass die zu quantifizierenden Variablen m glicherweise nichtlineare Relationen aufweisen unabh ngig davon wie sie gemessen w
243. h nominal sind Die Mehrfachkorrespondenzanalyse weist auch den Objekten in der Analyse solche Werte zu dass die Kategoriequantifizierungen die Durchschnittswerte bzw Zentroide der Objektwerte der Objekte in dieser Kategorie sind Beziehung zu anderen Prozeduren von Categories Die Mehrfachkorrespondenzanalyse wird auch als Homogenit tsanalyse oder Doppelskalierung bezeichnet Sie f hrt zu vergleichbaren jedoch nicht identischen L sungen wie die Korrespondenzanalyse wenn nur zwei Variablen vorhanden sind Die Korrespondenzanalyse f hrt zu einer eindeutigen Ausgabe bei der die Anpassung und die Qualit t der Darstellung der L sung einschlie lich der Stabilit tsinformationen zusammengefa t werden Daher ist bei zwei Variablen die Korrespondenzanalyse normalerweise der Mehrfachkorrespondenzanalyse vorzuziehen Ein weiterer Unterschied zwischen den beiden Prozeduren besteht darin dass es sich bei der Eingabe f r die Mehrfachkorrespondenzanalyse um eine Datenmatrix handelt bei der die Zeilen Objekte und die Spalten Variablen sind wohingegen es sich bei der Eingabe f r die Korrespondenzanalyse um dieselbe Datenmatrix eine allgemeine Distanzmatrix oder eine verbundene Kontingenztafel handeln kann die eine aggregierte Matrix ist bei der sowohl die Zeilen als auch die Spalten Kategorien von Variablen repr sentieren Die Mehrfachkorrespondenzanalyse kann auch als Hauptkomponentenanalyse von Daten betrachtet werden die auf dem mehrfach nomin
244. hawle gs nmkew gftamde 0000000 z cousin father 3 o an Ocousin 5 5 motrother aunt niece aungmother oa 0000 o9 their NECE gdaughdaugipeither cousin cousin PEES N BERE nephew NigRPHEW awe Ey dee A o S garaira her Bgther o ga a er If r Gnawa sister meateer daughter son siaughter 0 gmother gfather gratlarr e urge aunt aunfather uncle cousin e 2 momeistag fg o pi Prsionner O 5 moMeistagian i i a ephatece gelang Dimension 1 Dimension 2 Dimension 3 Betrachten Sie die endg ltigen Koordinaten f r die Objekte in den Dimensionen 1 und 3 dies ist das Diagramm im unteren linken Bereich der Streudiagramm Matrix Dieses Diagramm zeigt dass Dimension 1 auf der x Achse mit der Variablen gender korreliert Dimension 3 auf der y Achse dagegen mit der Variablen gener Von links nach rechts wird ersichtlich dass Dimension 1 die weiblichen und m nnlichen Bezeichnungen trennt die im Grunde genommen geschlechtslose Bezeichnung Cousin befindet sich in der Mitte Steigende Werte entlang der Achse von unten nach oben im Diagramm geh ren zu Bezeichnungen lterer Familienmitglieder Betrachten Sie nun die endg ltigen Koordinaten f r die Objekte in den Dimensionen 2 und 3 dies ist das Diagramm im mittleren rechten Bereich der Streudiagramm Matrix Aus diesem Diagramm geht hervor dass die zweite Dimension auf der y Achse der Variablen degree entspricht gr ere Werte an der Achse entsprechen dabei Be
245. he Korrelationsanalyse 40 43 44 192 Diagramme 40 Gewichtungen 201 Kategoriekoordinaten 206 Komponentenladungen 201 203 Quantifizierungen 204 Statistiken 40 Zentroide 207 Zusammenfassung der Analyse 200 zus tzliche Funktionen beim Befehl 45 Normalisierung in der Korrespondenzanalyse 50 217 Objektpunktdiagramme bei der Mehrfachkorrespondenzanalyse 65 in der Kategorialen Hauptkomponentenanalyse 36 Objektwerte bei der Mehrfachkorrespondenzanalyse 63 259 263 in der Kategorialen Hauptkomponentenanalyse 33 150 153 172 in Nichtlineare kanonische Korrelationsanalyse 44 Partielle Korrelationen in Kategoriale Regression 111 Penalisierter Stress in Multidimensionale Entfaltung 293 302 309 319 323 Penalisierungsterm in Multidimensionale Entfaltung 89 Permutationen in der Korrespondenzanalyse 227 PREFSCAL 85 Prinzipal Normalisierung in der Korrespondenzanalyse 217 Profile in der Korrespondenzanalyse 223 Projizierte Zentroide in Nichtlineare kanonische Korrelationsanalyse 207 Quantifizierungen in der Kategorialen Hauptkomponentenanalyse 148 168 in Nichtlineare kanonische Korrelationsanalyse 204 R2 in Kategoriale Regression 110 Regressionskoeffizienten in Kategoriale Regression 21 Residuen in Kategoriale Regression 115 Residuen Diagramme ce in Multidimensionale Entfaltung 91 Shepard Diagramme in Multidimensionale Entfaltung 91 Shepards Index f
246. hlen Sie Zeilenprofile und Spaltenprofile Wahlen Sie Permutationen der Korrespondenztabelle W hlen Sie Konfidenzstatistiken f r Zeilenpunkte und Spaltenpunkte 221 Korrespondenzanalyse Klicken Sie auf Weiter Klicken Sie im Dialogfeld Korrespondenzanalyse auf OK Korrespondenztabelle Die Korrespondenztabelle zeigt die Verteilung der Rauchgewohnheiten fiir fiinf Ebenen der Berufskategorie Die Zeilen der Korrespondenztabelle stehen fiir die Berufskategorien Die Spalten entsprechen den Rauchgewohnheiten Abbildung 12 6 Korrespondenztabelle Rauchgewohnheit Berufsgruppe Nichtraucher Leicht Mittel Stark Aktiver Rand Senior Manager Junior Manager Angestellter mit Erfahrung Angestellter ohne Erfahrung Sekretariat Aktiver Rand Die Zeilenrandsummen zeigen dass das Unternehmen deutlich mehr Angestellte mit und ohne Erfahrung als Manager und Sekretariatsangeh rige besch ftigt Die Aufteilung der Manager in Senior und Junior Manager entspricht jedoch in etwa der Aufteilung der Angestellten in Personen mit und ohne Erfahrung Aus den Spaltensummen geht hervor dass Nichtraucher und mittelschwere Raucher in etwa gleich h ufig anzutreffen sind Des weiteren sind die starken Raucher gegen ber den anderen drei Kategorien deutlich in der Minderheit Haben diese Berufskategorien jedoch etwas bei den Rauchgewohnheiten gemeinsam und wenn ja was Und welche Beziehung besteht zwischen Berufsgru
247. hnen Abbildung 12 38 Dialogfeld Variable berechnen E variable berechnen Zielvariable Numerischer Ausdruck sim 2734 Distanz Typ amp Label L Teile E Spalte 8E Distanz da Stadt Funktionsquppe Alle Arithmetisch CDF amp CDF nichtzentral Umwandlung Aktuelles Datum aktuelle Uhrzeit Datumsarithmetik ha ga Ss SS Funktionen und Sondervariablen E optionale Fallauswahlbedingung OK Einf gen Zur cksetzen Abbrechen Hilfe Geben Sie sim als Zielvariable ein Geben Sie 2734 Distanz als numerischen Ausdruck ein Klicken Sie auf OK 248 Kapitel 12 Abbildung 12 39 Dialogfeld F lle gewichten F lle gewichten X F lle nicht gewichten F lle gewichten mit Hautigkeitsvariable 2 Aktueller Status F lle gewichten nachDistanz Einf gen Zur cksetzen Abbrechen Hilfe Gewichten Sie die F lle nun nach dem hnlichkeitsma neu ffnen Sie dazu erneut das Dialogfeld F lle gewichten F lle gewichten nach sim gt Klicken Sie auf OK gt Zum Erstellen einer Korrespondenzanalyse f r die hnlichkeiten w hlen Sie schlie lich die folgenden Befehle aus den Men s aus Analysieren Dimensionsreduktion Korrespondenzanalyse Abbildung 12 40 Dialogfeld Korrespondenzanalyse A Korrespondenzanalyse X Aa
248. hsen Variable aus W hlen Sie aus dass die Farben anhand von diagnosis Diagnose festgelegt werden sollen Klicken Sie auf OK 185 Kategoriale Hauptkomponentenanalyse Abbildung 10 50 Auf Binge eating Fre attacken projizierte Zentroide des Diagnosezeitpunkts im Verlauf der Zeit Datei Bearbeiten Ansicht Optionen Elemente Hilfe oo DXYEABE M Lez Ceme EU Ell Il Al At Mt E W Ae We Diagnose Qi B w w m c o v w o s o i a u Oo o RA c w H 376 5 B 470 25 Pun Doppelklicken Sie dann zur Verbindung der Punkte auf das Diagramm und klicken Sie im Diagramm Editor auf das Tool zum Hinzuf gen von Interpolationslinien Schlie en Sie den Diagramm Editor Was die Fre attacken betrifft so ist klar dass die anorektischen Gruppen andere Anfangswerte aufweisen als die bulimischen Gruppen Dieser Unterschied nimmt im Laufe der Zeit ab da sich die anorektischen Gruppen kaum ndern w hrend bei den bulimischen Gruppen ein Fortschritt zu verzeichnen ist 186 Kapitel 10 Abbildung 10 51 Diagrammerstellung E Diagrammerstellung Variablen Table Numbe da Command_ fac PA Subtype_ Soi PALabel_ Label_ davar ar1 Centroids Pr E Centroids Pr E Centroids Pr E time time diagnosis di SE Kategorien Keine Kategorien _maseircha Vavishia Diagrammvorschau verwendet Beispieldaten G
249. i Kollinearit t aufgrund einer hohen Korrelation zwischen einer Einflu gr e und einer Kombination anderer Einflu gr en kann nicht erkannt werden 110 Kapitel 9 Abbildung 9 16 Korrelationen der urspr nglichen Einflu gr en Good Package Housekee Money back design Brand name Price ping seal guarantee 066 Package design Brand name Price Good Housekeeping seal Money back guarantee Dimension Eigenwert Abbildung 9 17 Korrelationen der transformierten Einflu gr en Good Package Housekee Money back design Brand name Price ping seal guarantee Package design Brand name Price Good Housekeeping seal Money back guarantee Dimension Eigenwert Die Interkorrelationen der Einflu gr en f r die nicht transfomierten und die transfomierten Einflu gr en werden dargestellt Alle Werte liegen nahe 0 dies bedeutet dass Multi Kollinearit t zwischen einzelnen Variablen kein Problem ist Beachten Sie dass ge nderte Korrelationen nur bei Package design auftreten Alle anderen Einflu gr en werden numerisch behandelt die Differenzen zwischen den Kategorien und die Reihenfolge der Kategorien bleiben f r diese Variablen also erhalten Das bedeutet wiederum dass die Korrelationen sich nicht ndern Anpassungsg te des Modells und Koeffizienten Die Prozedur Kategoriale Regression liefert einen Wert von 0 948 f r R2 Dies bedeutet dass nahezu 95 der Varianz in der Einstufung der t
250. iablen enthaltenen Variablen ausw hlen um die Objekte zu beschriften Diskriminationsma e Zeigt die Diskriminationsma e pro Variable und Dimension an Iterationsprotokoll F r jede Iteration werden ber cksichtigte Varianz Verlust sowie Steigerung der ber cksichtigten Varianz ausgegeben Korrelationen der Originalvariablen Hiermit werden die Korrelationsmatrix der urspr nglichen Variablen und die Eigenwerte dieser Matrix ausgegeben Korrelationen der transformierten Variablen Hiermit werden die Korrelationsmatrix der transformierten optimal skalierten Variablen und die Eigenwerte dieser Matrix ausgegeben Kategorienquantifikationen und Beitr ge Dies sind die Kategoriequantifikationen und Koordinaten darunter Masse Tr gheit und Beitr ge pro Dimension jeder ausgew hlten Variable Deskriptive Statistik Hiermit werden H ufigkeiten Anzahl der fehlenden Werte und Modalwert f r die ausgew hlten Variablen ausgegeben Mehrfachkorrespondenzanalyse Speichern Im Dialogfeld Speichern k nnen Sie festlegen dass diskretisierte Daten Objektwerte und transformierte Werte in einer SPSS Datendatei oder in einem Daten Set gespeichert werden Au erdem k nnen die transformierten Werte und die Objektwerte in der Arbeitsdatei gespeichert werden m Daten Sets sind in der aktuellen Sitzung verf gbar In nachfolgenden Sitzungen stehen Daten Sets nur zur Verf gung wenn Sie sie ausdr cklich als Datendateien speichern
251. iablen zusammengefasst Es sind zwei weitere Variablen erforderlich welche die Zeile und Spalte jeder Zelle angeben Hiermit ffnen Sie das Dialogfeld hnlichkeiten in Spalten m hnlichkeiten sind in einer Spalte gestapelt Die Ahnlichkeits Matrizen sind in einer einzigen Spalte bzw Variablen zusammengefasst Es sind drei weitere Variablen erforderlich welche die Zeile Spalte und Quelle jeder Zelle angeben Hiermit ffnen Sie das Dialogfeld hnlichkeiten in einer einzigen Spalte Klicken Sie auf Definieren 72 Kapitel 7 hnlichkeiten in mehreren Spalten von Matrizen Wenn Sie im Dialogfeld Datenformat das Datenmodell mit hnlichkeiten in Matrizen ausw hlen aus einer oder mehreren Quellen wird das Hauptdialogfeld folgenderma en dargestellt Abbildung 7 2 Dialogfeld Ahnlichkeiten in mehreren Spalten von Matrizen E Multidimensionale Skalierung hnlichkeiten in mehreren Spalten von Matrizen ern amp Mutter mutter a FA Neffe neffe Einschr nkungen Nichte nichte inl amp Onkel onkel amp Schwester schweste Diagramme Aston O L Tante tante E Tochter tochter Lie Veter vater M Gewichtungen gt aa Quellen x Einf gen Zur cksetzen Abbrechen J Hilfe gt W hlen Sie mindestens drei hnlichkeitsvariablen aus Achten Sie darauf dass die Reihenfolge der Variablen in der
252. iagramm mit Zentroid und Vektorkoordinaten jeder ausgew hlten Variablen Transformationsdiagramme Hierbei wird ein Diagramm der optimalen Kategorienquantifikationen gegen die Kategorienummern erstellt Bei Variablen mit mehrfach nominalem Skalierungsniveau k nnen Sie die gew nschte Anzahl von Dimensionen angeben Pro Dimension wird ein Diagramm erstellt Sie k nnen au erdem festlegen dass f r jede ausgew hlte Variable ein Diagramm der Residuen ausgegeben wird 38 Kapitel 3 Zentroide projizieren von Sie k nnen eine Variable ausw hlen und ihre Zentroide auf ausgew hlte Variablen projizieren Es kann jedoch nicht auf Variablen mit mehrfach nominalem Skalierungsniveau projiziert werden Wenn dieses Diagramm angefordert wird wird au erdem eine Tabelle mit den Koordinaten der projizierten Zentroiden ausgegeben Kategoriale Hauptkomponentenanalyse Ladungsdiagramme Im Dialogfeld Ladungsdiagramme k nnen Sie die Variablen angeben die in das Diagramm aufgenommen werden sollen und festlegen ob Zentroide darin aufgenommen werden sollen Abbildung 3 11 Dialogfeld Ladungsdiagramme is Kategoriale Hauptkomponenten Ladungsdiagramme Komponentenladungen anzeigen Ladungsvariablen verf gbar Ausgew hlt Einschlie en purge gt weight Alle Variablen hyper mens er fami fast Ausgew hlte Yariablen leman 1 binge trie 7 u kot T school satt sbeh mood E
253. iagramm zeigt jedoch zus tzlich dass sich die Krankheiten im Verlauf der Zeit tendenziell aneinander angleichen Au erdem ist der Fortschritt bei allen Gruppen zwischen den Zeitpunkten 1 und 2 am gr ten die anorektischen Patienten zeigen noch einen gewissen weiteren Fortschritt von 2 bis 3 bei den anderen Gruppen ist jedoch kaum weiterer Fortschritt zu verzeichnen Unterschiedliche Entwicklung f r ausgew hlte Variablen Aus jedem der durch die Komponentenladungen identifizierten Symptomb ndel wurde eine Variable als Repr sentant des B ndels ausgew hlt Binge eating Fre attacken wurde aus dem Bulimie B ndel ausgew hlt Sexual attitude sexuelle Einstellung aus dem B ndel Anorexie psychosoziales Verhalten und Preoccupation with food and weight Besch ftigung mit Essen und Gewicht aus dem dritten B ndel Um die m glichen unterschiedlichen Krankheitsverl ufe zu untersuchen wurden die Projektionen von Time diagnosis interaction Zeit Diagnose Interaktion auf Binge eating Fre attacken Sexual attitude sexuelle Einstellung und Preoccupation with food and weight 179 Kategoriale Hauptkomponentenanalyse Besch ftigung mit Essen und Gewicht berechnet und in der folgenden Abbildung grafisch dargestellt Abbildung 10 44 Projizierte Zentroide von Time diagnosis interaction Zeit Diagnose Interaktion auf Binge eating Fre attacken Sexual attitude sexuelle Einstellung
254. iagramme Weiter J Abbrechen Hite Diagramme Folgende Diagramme sind verf gbar Mehrere Starts Zeigt ein gestapeltes Histogramm des penalisierten Stress mit Stress und Penalisierung an Anf nglicher gemeinsamer Raum Zeigt eine Streudiagramm Matrix der Koordinaten des anf nglichen gemeinsamen Raums an Stress pro Dimension Erstellt ein Liniendiagramm des penalisierten Stress im Vergleich zur Dimensionalit t Dieses Diagramm wird nur erstellt wenn die H chstanzahl von Dimensionen gr er als die Mindestanzahl von Dimensionen ist Endg ltiger gemeinsamer Raum Eine Streudiagramm Matrix der Koordinaten des gemeinsamen Raums wird angezeigt Raumgewichtungen Ein Streudiagramm der individuellen Raumgewichtungen wird erstellt Dies ist nur m glich wenn im Dialogfeld Modell eines der Modelle f r individuelle Differenzen angegeben ist F r das Modell Euklidisch gewichtet werden die Gewichtungen 93 Multidimensionale Entfaltung PREFSCAL f r alle Quellen mit einer Dimension auf jeder Achse in einem Diagramm angezeigt F r das Modell Euklidisch verallgemeinert wird ein Diagramm pro Dimension erstellt das f r jede Quelle die Rotation und Gewichtung der jeweiligen Dimension anzeigt Individueller Raum Eine Streudiagramm Matrix der Koordinaten des individuellen Raums jeder Quelle wird angezeigt Dies ist nur m glich wenn im Dialogfeld Modell eines der Modelle f r individ
255. iale Hauptkomponenten Kategoriendiagramme 0 00 eee eee eee Kategoriale Hauptkomponentenanalyse Ladungsdiagramme 000 0e eee aee Zus tzliche Funktionen beim Befehl CATPCA 0 00 c cece eee eee 4 Nichtlineare kanonische Korrelationsanalyse OVERALS Bereich und Skala definieren 0 0 ccc eee ene e teen ee nees Bereichidefinieren 22 2 2 a Bb i eit bathed aver OE ded ded acer eee a ceed Nichtlineare kanonische Korrelationsanalyse Optionen 020eee eee Zus tzliche Funktionen beim Befehl OVERALS 0 0 cc cece eens 5 Korrespondenzanalyse Definieren des Zeilenbereichs bei der Korrespondenzanalyse 0 cece eaee Definieren des Spaltenbereichs in der Korrespondenzanalyse 2 0 000 Korrespondenzanalyse Modell 0 ccc ccc eee een ene eee tenes Korrespondenzanalyse Statistiken 000 0c cece tee eee Korrespondenzanalyse Diagramme 1 0 ete nents Zus tzliche Funktionen beim Befehl CORRESPONDENCE 2 0000 6 Mehrfachkorrespondenzanalyse Definition des Variablengewichts bei der Mehrfachkorrespondenzanalyse Mehrfachkorrespondenzanalyse Diskretisierung 00 ccc cece eee eee eee Mehrfachkorrespondenzanalyse Fehlende Werte 00 0 c cece eee eens Mehrfachkorrespondenzanalyse Optionen 0 0c cece eee eee vii Mehrfachkorrespondenzanalyse Ausgabe
256. ichen hnlichkeiten auf Sie k nnen angeben ob die Bindung von gebundenen hnlichkeiten erhalten bleiben muss oder aufgehoben werden darf Transformationen zuweisen Geben Sie an ob nur die hnlichkeiten innerhalb jeder Zeile oder nur die hnlichkeiten innerhalb jeder Quelle miteinander verglichen werden sollen oder ob die Vergleiche unabh ngig von Zeile oder Quelle sind also ob die Transformationen f r einzelne Zeilen f r einzelne Quellen oder f r alle hnlichkeiten gleichzeitig durchgef hrt werden sollen Multidimensionale Entfaltung Einschr nkungen Im Dialogfeld Einschr nkungen k nnen Sie Einschr nkungen f r den gemeinsamen Raum festlegen 89 Multidimensionale Entfaltung PREFSCAL Abbildung 8 3 Dialogfeld Einschr nkungen E Multidimensionale Entfaltung Einschrankungen Einschrankungen im gemeinsamen Raum _ Einschr nkungen f r Zeilenkoordinaten v Einschr nkungen f r Spaltenkoordinaten Variablen f r Zeileneinschr nkungen Variablen einlesen aus Datei Die Anzahl muss der maximalen Dimensionalitat des Modells entsprechen Aktuell 2 Verf gbar Ausgew hlt Variablen f r Spalteneinschr nkungen Yariablen einlesen aus Datei Die Anzahl muss der maximalen Dimensionalit t des Modells entsprechen Aktuell 2 Verf gbar Ausgew hlt Abbrechen Hite Einschr nkungen im gemei
257. ie Richtung der h chsten Kategorie der Variablen F r Entfernung und Zugeh rigkeit sind die h chsten 152 Kapitel 10 Kategorien nah bzw hoch Daher zeichnen sich CROWDS durch physische N he und kein Zugeh rigkeitsgef hl aus wohingegen SECONDARY GROUPS durch weite physische Entfernung und ein hohes Zugeh rigkeitsgef hl charakterisiert sind Abbildung 10 14 Biplot Objekte beschriftet mit Cluster Objekte CR O die anhand der Skala der 1 0 Entfernung Ladungen korrigiert wurden on panentenkackungen Dimension 2 15 1 0 0 5 0 0 0 5 1 0 Dimension 1 Zus tzliche Dimensionen Durch die Erh hung der Anzahl der Dimensionen wird der Umfang der erkl rten Variation erh ht und es k nnen eventuell Unterschiede aufgedeckt werden die bei L sungen mit weniger Dimensionen verborgen bleiben Wie zuvor angemerkt k nnen bei zwei Dimensionen MOBS und PRIMARY GROUPS nicht voneinander getrennt werden Bei einer Erh hung der Dimensionalit t lassen sich die beiden Gruppen jedoch m glicherweise differenzieren Durchf hrung der Analyse gt Um eine dreidimensionale L sung zu erzielen m ssen Sie das Dialogfeld Kategoriale Hauptkomponenten erneut aufrufen gt Geben Sie 3 als Anzahl der Dimensionen in der L sung ein Klicken Sie im Dialogfeld Kategoriale Hauptkomponenten auf OK 153 Kategoriale Hauptkomponentenanalyse Modellzusammenfassung Abbildung 10 15 Modellzusammenfassung
258. ie an SPSS Inc Attn Director of Product Planning 233 South Wacker Drive 11th Floor Chicago IL 60606 6412 Uber dieses Handbuch In diesem Handbuch wird die grafische Benutzeroberfl che f r die in SPSS Categories Kategorien Erweiterungsmodul enthaltenen Prozeduren erl utert Die Abbildungen der Dialogfelder stammen aus SPSS Detaillierte Informationen zur Befehlssyntax f r die Funktionen in SPSS Categories Kategorien Erweiterungsmodul sind auf zwei Arten verf gbar als Bestandteil des umfassenden Hilfesystems und als separates Dokument im PDF Format im Handbuch SPSS 16 0 Command Syntax Reference das auch ber das Men Hilfe verf gbar ist Kontakt zu SPSS Wenn Sie in unseren Verteiler aufgenommen werden m chten wenden Sie sich an eines unserer B ros die Sie auf unserer Website unter http www spss com worldwide finden iv Danksagung Die Prozeduren f r die optimale Skalierung und ihre Implementierung in SPSS wurden von der Data Theory Scaling System Group DTSS entwickelt die aus Mitgliedern der Institute f r P dagogik und Psychologie der sozialwissenschaftlichen Fakult t der Universit t Leiden besteht Willem Heiser Jacqueline Meulman Gerda van den Berg und Patrick Groenen waren an den urspr nglichen Prozeduren aus dem Jahr 1990 beteiligt Jacqueline Meulman und Peter Neufeglise waren an der Entwicklung von Prozeduren f r die kategoriale Regression die Korrespondenzanalyse die kategoriale Hauptkompon
259. ie nominale Behandlung von Age in years wirkt sich nicht nennenswert auf die Quantifikationen f r Neighborhood preference aus Die mittlere Kategorie erh lt die niedrigste Quantifikation die u eren Kategorien dagegen gro e positive Werte Abbildung 11 29 Transformationsdiagramm f r die Variable Neighborhood preference Alter nominal 1 0 0 0 1 5 Kategorienquantifikationen von Neighborhood preference Town Village Country Neighborhood preference 213 Nichtlineare kanonische Korrelationsanalyse Beim Transformationsdiagramm f r Newspaper read most often hat sich eine nderung ergeben Bislang bestand ein ansteigender Trend in den Quantifikationen der unter Umst nden eine ordinale Behandlung dieser Variablen nahelegt Durch die nominale Behandlung von Age in years wurde dieser Trend jedoch aus den Quantifikationen f r news entfernt Abbildung 11 30 Transformationsdiagramm f r Newspaper read most often Alter nominal i 10 2 uw o z c 5 E 05 gt S cr vo cy ow E o 0 0 x E ew 5 co oN 3 5 a 05 E D 2 1 0 uci x None Telegraaf Volkskrant NRC Other Newspaper read most often Dies ist das Diagramm der Zentroide f r Age in years Beachten Sie dass die Kategorien entlang der Linie die die projizierten Zentroide verbindet nicht in chronologischer Reihenfolge vorliegen Die Gruppe 20 25 befindet sich nicht am Ende sondern in der
260. ierende Transformation ist besser angepa t aber weniger glatt als bei Spline ordinal 29 Kategoriale Hauptkomponentenanalyse CATPCA m Nominal Die einzige Information aus der beobachteten Variable die in der optimal skalierten Variable beibehalten wird ist die Gruppierung der Objekte in Kategorien Die Reihenfolge der Kategorien bei der beobachteten Variablenwird nicht beibehalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch den Koordinatenursprung plaziert Die resultierende Transformation ist besser angepa t aber weniger glatt als bei Spline nominal m Numerisch Die Kategorien werden als geordnet mit gleichen Abst nden behandelt Intervallniveau Die Reihenfolge der Kategorien und die gleichen Abst nde zwischen den Kategorienummern in der beobachteten Variablenbleiben in der optimal skalierten Variablen erhalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch den Koordinatenursprung plaziert Wenn alle Variablen auf numerischem Niveau skaliert sind entspricht die Analyse der normalen Hauptkomponentenanalyse Kategoriale Hauptkomponenten Diskretisierung Im Dialogfeld Kategoriale Hauptkomponenten Diskretisierung k nnen Sie eine Methode zum Umkodieren der Variablen festlegen Sofern nicht anders angegeben werden Variablen mit Dezimalwerten in sieben Kategorien gruppiert die nahezu normalverteilt sind Wenn die Variable weniger als sieben unterschiedli
261. iert werden m ssen Abbildung 9 19 Standardisierte Koeffizienten f r transformierte Einflu gr en Standardisierte Koeffizienten PA Standardf Beta ehler df F Sig Package design 165 289 Brand name i l 578 Price A 39 312 Good Housekeeping seal i 35 299 Money back guarantee 7 175 Abhangige Variable Preference Der gr te Koeffizient liegt f r Package design vor Eine Erh hung von Package design um eine Standardabweichung f hrt zu einem Abfall der vorhergesagten Einstufung der Bevorzugung um 0 748 Standardabweichungen Package design wird jedoch nominal behandelt sodass ein Anstieg der Quantifikationen nicht unbedingt mit einem Anstieg bei den urspr nglichen Kategoriecodes einhergeht Standardisierte Koeffizienten werden h ufig fehlinterpretiert es wird meist angenommen dass diese Koeffizienten die Wichtigkeit der einzelnen Einflu gr en widerspiegeln Regressionskoeffizienten k nnen jedoch die Auswirkungen einer Einflu gr e auf die Beziehungen zwischen den Einflu gr en nicht vollst ndig beschreiben Um die Auswirkungen von Einflu gr en eingehend untersuchen zu k nnen m ssen alternative Statistiken in Verbindung mit den standardisierten Koeffizienten verwendet werden Korrelationen und Wichtigkeit Um den Beitrag der Einflu gr en zur Regression korrekt zu interpretieren reicht es nicht wenn Sie lediglich die Regressionskoeffizienten betrachten Dar ber hinaus sollten auch die K
262. ierung 143 Kategoriale Hauptkomponentenanalyse Abbildung 10 1 Dialogfeld Optimale Skalierung Messniveau der optimalen Skalierung O Alle Yariablen sind mehrfach nominal Einige variablen sind nicht mehrfach nominal Anzahl der Variablen Sets G Ein Set Mehrere Sets Ausgew hlte Analyse Mehrfachkorrespondenzanalyse Kategoriale Hauptkomponenten Nichtlineare kanonische Korrelation W hlen Sie im Gruppenfeld Messniveau der optimalen Skalierung die Option Einige Variablen sind nicht mehrfach nominal Klicken Sie auf Definieren Abbildung 10 2 Dialogfeld Kategoriale Hauptkomponenten Analysevariablen In diskrete umwandeln Fehlend Ausgabe Speichern Skala und Gewicht definieren F Zusatzvariablen biekt Kategorie Ladung Beschriftungsvariablen fF O O Dimensionen in der L sung e W hlen Sie Intensit t bis Formalit t als Analysevariablen aus amp 5 3 5 3 Klicken Sie auf Skala und Gewicht definieren 144 Kapitel 10 Abbildung 10 3 Dialogfeld Skala und Gewichtung definieren Kategoriale Hauptkomponenten Skal Yariablengewichtung 1 rMessniveau der optimalen Skalierung Spline ordinal Spline nominal Nominal O Mehrfach nominal O Numerisch rSpline Grad 2 Knoten innen 2 Abbrechen Hilfe
263. ige Anzahl Als allgemeine Regel sollte der Eigenwert f r eine Dimension gr er als 1 sein wenn alle Variablen entweder einzeln nominal ordinal oder numerisch sind Da die zweidimensionale L sung 94 52 der Varianz erkl rt w rde eine dritte Dimension vermutlich kaum weitere Informationen ergeben Bei mehrfach nominalen Variablen gibt es also keine einfache Faustregel f r die Bestimmung der angemessenen Anzahl an Dimensionen Wenn die Anzahl der Variablen durch die Gesamtzahl der Kategorien minus der Anzahl der Variablen ersetzt wird gilt die oben angegebene Regel noch immer Doch diese Regel allein w rde vermutlich mehr Dimensionen zulassen als erforderlich sind Bei der Auswahl der Anzahl an Dimensionen ist die n tzlichste Richtlinie die Anzahl so klein zu halten dass sinnvolle Interpretationen m glich sind Die Modellzusammenfassungstabelle zeigt au erdem Cronbachs Alpha ein Reliabilit tsma das durch die Prozedur maximiert wird Quantifizierungen F r die einzelnen Variablen werden die Quantifizierungen die Vektorkoordinaten und die Zentroid Koordinaten angezeigt Die Quantifizierungen sind die den einzelnen Kategorien zugewiesenen Werte Die Zentroid Koordinaten sind der Durchschnitt der Objektwerte von Objekten in derselben Kategorie Die Vektorkoordinaten sind die Koordinaten der Kategorien wenn sie sich auf einer Linie befinden m ssen die die Variable im Objektraum repr sentiert Dies ist f r Variablen mit ordinalem u
264. im03 als Variablen aus Klicken Sie auf Weiter Klicken Sie im Dialogfeld Multidimensionale Skalierung auf Diagramme 282 Kapitel 14 Abbildung 14 11 Dialogfeld Diagramme Multidimensionale Skalierung Diagramme rDiagramme Stress V Urspr ngliche ber transformierte hnlichkeiten V Gemeinsamer Raum C Transtormierte hnlichkeiten gegen Distanzen Individueller Raum Y Transformierte unabh ngige variablen J Individuelle Raumgewiehtungen V Variablen und Dimensionskorrelationen rDiagramme der Quellen Alle Quellen Quellen Quellen ausw hlen u Auelle x ndern Quellennummer entfernen W hlen Sie Urspr ngliche ber transformierte hnlichkeiten und Transformierte unabh ngige Variablen Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Multidimensionale Skalierung auf Ausgabe Abbildung 14 12 Dialogfeld Ausgabe Multidimensionale Skalierung Ausgabe a r nzeige M Gemeinsame Raumkoordinaten Stress f r Zufallstarts Individuelle Raumkoordinaten kterationsprotokoll v Individuelle Raumgewichtungen Multiple Stressma e Distanzen Stress Zerlegung Transformierte hnlichkeiten Transformierte unabh ngige Yariablen Id ID M Eingabedaten Variablen und Dimensionskorrelationen neuer Datei speichern C Gemeinsame Raumkoordinaten Da
265. in der Command Syntax Reference Teil II Beispiele Kapitel Kategoriale Regression Das Ziel der kategorialen Regression mit optimaler Skalierung liegt darin die Beziehung zwischen einer Antwortvariablen und einer Gruppe von Einflu gr en zu beschreiben Durch die Quantifizierung dieser Beziehung k nnen Werte der Antwort f r jede Kombination von Einflu gr en vorhergesagt werden In diesem Kapitel werden die Analysen im Rahmen der Regression mit optimaler Skalierung anhand von zwei Beispielen dargestellt Das erste Beispiel erl utert die grundlegenden Konzepte mithilfe eines kleinen Daten Sets Im zweiten Beispiel wird eine deutlich gr ere Gruppe von Variablen und Beobachtungen herangezogen Beispiel Daten f r Teppichreiniger In einem beliebten Beispiel m chte die Firma Green als auch Wind 1973 einen neuen Teppichreiniger vermarkten und dazu den Einfluss von f nf Faktoren auf die Bevorzugung durch den Verbraucher untersuchen Verpackungsgestaltung Markenname Preis G tesiegel Good Housekeeping und Geld zur ck Garantie Die Verpackungsgestaltung liegt in drei Faktorstufen vor die sich durch die Position der Auftrageb rste unterscheiden Au erdem gibt es drei Markennamen K2R Glory und Bissell drei Preisstufen sowie je zwei Stufen Nein oder Ja f r die letzten beiden Faktoren Die nachstehende Tabelle zeigt die Variablen in der Teppichreiniger Untersuchung mit den zugeh rigen Beschriftungen und Werten Tabe
266. in der zweiten Dimension anzeigt Die Variable Messing die sehr nah am Ursprung liegt bietet in den ersten beiden Dimensionen berhaupt keine Unterscheidung Dies ergibt einen Sinn da alle Objekte aus Messing oder auch nicht aus Messing bestehen k nnen Kategorienquantifikationen Erinnern wir uns da ein Diskriminationsma die Varianz der quantifizierten Variablen entlang einer bestimmten Dimension ist Das Diagramm der Diskriminationsma e enth lt diese Varianzen wodurch angezeigt wird welche Variablen entlang welcher Dimension eine Unterscheidung 262 Kapitel 13 bieten Dieselbe Varianz k nnte jedoch vorliegen wenn alle Kategorien m ig weit voneinander entfernt liegen oder wenn die meisten Kategorien eng zusammen liegen einige Kategorien jedoch von dieser Gruppe abweichen Das Diskriminationsdiagramm bietet keine Unterscheidung zwischen diesen beiden Zust nden Diagramme zur Kategorienquantifikation bieten eine alternative Methode zur Anzeige der Diskrimination von Variablen durch die Kategoriebeziehungen identifiziert werden k nnen In diesem Diagramm werden die Koordinaten der einzelnen Kategorien in jeder Dimension angezeigt So k nnen Sie bestimmen welche Kategorien f r welche Variable hnlich sind Abbildung 13 8 Kategorienquantifikationen 4 oO z i Kreuz O Einkerbung des Kopfes O gewinde 3 2 5 cm Grundform O Kopfform L nge in cm N 5 ze x o konisch a 5 ew lbt E on a 15cm a scharf chl
267. inberg als auch P W Holland 1975 Discrete multivariate analysis Theory and practice Cambridge Massachusetts MIT Press De Leeuw J 1984 The Gifi system of nonlinear multivariate analysis In Data Analysis and Informatics III E Diday et al Hg 415 424 De Leeuw J 1990 Multivariate analysis with optimal scaling In Progress in Multivariate Analysis S Das Gupta als auch J Sethuraman Hgg Kalkutta Indian Statistical Institute De Leeuw J als auch J Van Rijckevorsel 1980 HOMALS and PRINCALS Some generalizations of principal components analysis In Data Analysis and Informatics E Diday et al Hg Amsterdam North Holland 231 242 De Leeuw J F W Young als auch Y Takane 1976 Additive structure in qualitative data An alternating least squares method with optimal scaling features Psychometrika 41 471 503 Gifi A 1990 Nonlinear multivariate analysis Chichester John Wiley and Sons 15 Einf hrung in die Prozeduren f r die optimale Skalierung von kategorialen Daten Heiser W J als auch J J Meulman 1995 Nonlinear methods for the analysis of homogeneity and heterogeneity In Recent Advances in Descriptive Multivariate Analysis W J Krzanowski Hg Oxford Oxford University Press 51 89 Isra ls A 1987 Eigenvalue techniques for qualitative data Leiden DSWO Press Krzanowski W J als auch F H C Marriott 1994 Multivariate analysis Part I distributions ordi
268. ineare kanonische Korrelationsanalyse So lassen Sie eine kategoriale Hauptkomponentenanalyse berechnen W hlen Sie die folgenden Befehle aus den Men s aus Analysieren Dimensionsreduktion Optimale Skalierung Abbildung 3 1 Dialogfeld Optimale Skalierung Optimale Skalierung Messniveau der optimalen Skalierung F Alle Yariablen sind mehrfach nominal Anzahl der Variablen Sets Ein Set Mehrere Sets Ausgew hlte Analyse Kategoriale Hauptkomponenten Abbrechen Hite W hlen Sie Einige Variablen sind nicht mehrfach nominal aus W hlen Sie die Option Ein Set Klicken Sie auf Definieren 27 Kategoriale Hauptkomponentenanalyse CATPCA Abbildung 3 2 Dialogfeld Kategoriale Hauptkomponenten Kategoriale Hauptkomponenten s Analysevariablen amp Diagnose diag2 weight 1 Spline ordinal 2 2 cll timez mens 1 Spline ordinal 2 2 fast 1 Spline ordinal 2 2 binge 1 Spline ordinal 2 2 vomit 1 Spline ordinal 2 2 Skala und Gewicht definieren Zusatzvariablen ici Spline ordinal 2 2 Skala definieren Beschriftungsvariablen Jn Dimensionen in der L sung Einf gen Zur cksetzen Abbrechen Hilfe W hlen Sie mindestens zwei Analysevariablen aus und geben Sie die Anzahl der Dimensionen in der L sung an Klicken Sie auf OK Sie k nnen au erdem Beschriftungsvariablen f r die
269. ional Konstanten Term einschlie en ausw hlen In diesem Fall werden die hnlichkeiten durch einen konstanten Term verschoben Linear Die transformierten hnlichkeiten sind proportional zu den urspr nglichen hnlichkeiten Hierbei wird in der Transformationsfunktion eine Steigung gesch tzt und der Schnittpunkt mit der y Achse auf 0 festgelegt Dies wird auch als Verh ltnistransformation bezeichnet Sie k nnen optional Konstanten Term einschlie en ausw hlen In diesem Fall werden die hnlichkeiten durch einen konstanten Term verschoben Dies wird auch als Intervalltransformation bezeichnet Spline Die transformierten hnlichkeiten sind eine gegl ttete nicht fallende st ckweise polynomiale Transformation der urspr nglichen hnlichkeiten Sie k nnen den Grad des Polynoms und die Anzahl der inneren Knoten angeben Sie k nnen optional Konstanten Term einschlie en ausw hlen In diesem Fall werden die hnlichkeiten durch einen konstanten Term verschoben Glatt Die transformierten hnlichkeiten weisen dieselbe Ordnung wie die urspr nglichen hnlichkeiten auf Es gilt jedoch eine Einschr nkung die die Unterschiede zwischen aufeinander folgenden Werten ber cksichtigt Das Ergebnis ist eine glatte ordinale Transformation Sie k nnen angeben ob die Bindung von gebundenen hnlichkeiten erhalten bleiben muss oder aufgehoben werden darf Ordinal Die transformierten hnlichkeiten weisen dieselbe Ordnung wie die urspr ngl
270. ional linear transformation with intercept Die hnlichkeiten wurden in dieser Analyse als linear behandelt sodass das Diagramm der transformierten Werte im Vergleich zu den urspr nglichen hnlichkeiten eine gerade Linie bildet Die Anpassungsg te dieser L sung ist gut mit einer anderen Transformation der hnlichkeiten kann jedoch m glicherweise eine bessere Anpassung erreicht werden ndern der hnlichkeitstransformation Ordinal gt Um eine L sung mit einer ordinalen Transformation der hnlichkeiten zu erstellen klicken Sie auf die Schaltfl che Zuletzt verwendete Dialogfelder und w hlen Sie Multidimensionale Entfaltung aus 322 Kapitel 15 gt Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf Modell Abbildung 15 31 Dialogfeld Modell E Muttidimensionale Entfaltung Modell Skalierungsmodell r hnlichkeitstransformationen Identit t O Keine Euklidisch gewichtet Linear Euklidisch verallgemeinert Spline r hnlichkeiten 2 Un hnlichkeiten Fe Glatt O hnlichkeiten w rDimensionen Minimum 2 Maximum 2 Gebundene Beobachtungen l sen Transformationen zuweisen In jeder Zeile f r sich Getrennt in jeder Quelle Alle Quellen gleichzeitig Abbrechen W hlen Sie Ordinal als hnlichkeitstransformation Klicken Sie auf Weiter gt Klicken Sie im Dia
271. ise weist Schema A einen maximalen Kategoriewert von 3 und Schema B einen maximalen Kategoriewert von 7 auf obwohl beide Schemata dieselben drei Kategorien kodieren Der Variablenbereich bestimmt welche Kategorien aus der Analyse ausgeschlossen werden Alle Kategorien mit Codes au erhalb des definierten Bereichs werden aus der Analyse ausgeschlossen Dies ist eine einfache Methode fiir den Ausschluss von Kategorien die jedoch zu unerw nschten Analysen f hren kann Wenn der maximale Kategoriewert falsch definiert ist werden m glicherweise g ltige Kategorien aus der Analyse ausgeschlossen Beispiel Bei Schema B wird durch die Festsetzung des maximalen Kategoriewerts auf den Wert 3 angegeben dass f r T tigkeit Kategorien von 1 bis 3 kodiert sind Die Kategorie Manager wird als fehlend behandelt Da tats chlich keine Kategorie als 3 kodiert wurde enth lt die dritte Kategorie in der Analyse keine F lle Wenn Sie alle Managerkategorien ausschlie en m chten ist diese Analyse geeignet Wenn die Manager eingeschlossen sein sollen muss der maximale Kategoriewert als 7 definiert sein und fehlende Werte m ssen mit Werten ber 7 oder unter 1 kodiert sein Bei als nominal oder ordinal behandelten Variablen hat die Reihenfolge der Kategorien keine Auswirkungen auf die Ergebnisse Bei nominalen Variablen ist nur das Label und nicht der dem Label zugeordnete Wert von Bedeutung Bei ordinalen Variablen wird die Reihenfolge der Kategorien in den Quanti
272. issing_data sav Hierbei handelt es sich um eine hypothetische Datendatei die demografische Daten sowie Daten zu fr heren Bankkrediten enth lt und eine gro e Anzahl fehlender Werte aufweist tree_score_car sav Hierbei handelt es sich um eine hypothetische Datendatei die demografische Daten sowie Daten zum Kaufpreis von Fahrzeugen enth lt tree_textdata sav Eine einfache Datendatei mit nur zwei Variablen die vor allem den Standardzustand von Variablen vor der Zuweisung von Messniveau und Wertelabels zeigen soll tv survey sav Hierbei handelt es sich um eine hypothetische Datendatei zu einer Studie die von einem Fernsehstudio durchgef hrt wurde das berlegt ob die Laufzeit eines erfolgreichen Programms verl ngert werden soll 906 Personen wurden gefragt ob sie das Programm unter verschiedenen Bedingungen ansehen w rden Jede Zeile entspricht einem Befragten jede Spalte entspricht einer Bedingung ulcer_recurrence sav Diese Datei enth lt Teilinformationen aus einer Studie zum Vergleich der Wirksamkeit zweier Therapien zur Vermeidung des Wiederauftretens von Geschw ren Es stellt ein gutes Beispiel f r intervallzensierte Daten dar und wurde an anderer Stelle Collett 2003 vorgestellt und analysiert 337 Beispieldateien ulcer_recurrence_recoded sav In dieser Datei sind die Daten aus ulcer_recurrence sav so umstrukturiert dass das Modell der Ereigniswahrscheinlichkeit f r jedes Intervall der Studie berechnet werden k
273. ist n tzlich wenn Sie haupts chlich an den Unterschieden oder bereinstimmungen zwischen den Objekten interessiert sind m Symmetrisch Verwenden Sie diese Normalisierungsmethode wenn Sie haupts chlich an den Beziehungen zwischen den Objekten und den Variablen interessiert sind 33 Kategoriale Hauptkomponentenanalyse CATPCA m Unabh ngig Verwenden Sie diese Normalisierungsmethode wenn Sie die Distanzen zwischen den Objekten und die Korrelationen zwischen den Variablen getrennt untersuchen m chten m Benutzerdefiniert Sie k nnen einen beliebigen reellen Wert aus dem abgeschlossenen Intervall 1 1 eingeben Der Wert 1 entspricht der Methode Objektprinzipal der Wert 0 der Methode Symmetrisch und der Wert 1 der Methode Variablenprinzipal Bei Werten gr er als 1 und kleiner als 1 wird der Eigenwert sowohl ber Objekte als auch Variablen gestreut Mit dieser Methode k nnen Sie Biplots und Triplots genau an Ihre Bed rfnisse anpassen Kriterien Sie k nnen die maximale Anzahl von Iterationen festlegen die in der Prozedur bei den Berechnungen durchlaufen werden Au erdem k nnen Sie einen Wert f r das Konvergenzkriterium ausw hlen Die Prozedur wird abgebrochen wenn die Differenz der Gesamtanpassung zwischen den letzten zwei Iterationen kleiner als der Konvergenzwert ist oder die Maximalzahl von Iterationen erreicht wurde Diagramme beschriften mit Hiermit k nnen Sie festlegen ob in den Diagramm
274. ist sehr gro Dies deutet darauf hin dass die L sung nicht vermischt ist m Shepards Index f r Nicht Degeneration ein Prozentwert verschiedener Distanzen ist gleich 0 Dies ist ein deutlicher Hinweis auf unzureichend unterschiedliche Abst nde und die L sung ist wahrscheinlich degeneriert Gemeinsamer Raum Abbildung 15 4 Verbundenes Diagramm des gemeinsamen Raums f r eine degenerierte L sung 39 19 10 5 37 29 Oo 40 a z 36 English muffin and margarine o 615 S 32 Butteredtoast Jelydonut 25 Q14 22 n Toast pop up o o 3 3 E 21 o 13 81 7 0 2 20 31 068 E 27 o 18 9 a 0 Dimension 1 Eine visuelle Best tigung f r die Degeneration der L sung kann dem verbundenen Diagramm des gemeinsamen Raums von Zeilen und Spaltenobjekten entnommen werden Die Zeilenobjekte Personen befinden sich im Umfang eines Kreises mit den Spaltenobjekten Fr hst cksartikeln als Mittelpunkt deren Koordinaten in einem einzigen Punkt zusammenfallen 295 Multidimensionale Entfaltung Durchf hren einer nicht degenerierten Analyse Abbildung 15 5 Dialogfeld Optionen E Muttidimensionale Entfaltung Optionen Ausgangskonfiguration Iterationskriterien G Klassisch Stress Konvergenz 000001 Berechnung nach v Mindest Stress 0001 Ross Cliff i Maximalzahl der tterationen 5000 _ Korrespondenz Zentroide Penalisierungsterm Mehrere Zufallssta
275. itel 12 Abbildung 12 9 Zeilenprofile symmetrische Normalisierung Rauchgewohnheit Berufsgruppe Nichtraucher Leicht Mittel Stark Aktiver Rand Senior Manager Junior Manager Angestellter mit Erfahrung Angestellter ohne Erfahrung Sekretariat Masse Die Zeilenprofile geben den Anteil der Zeilenkategorie in den einzelnen Spaltenkategorien an Die Angestellten mit Erfahrung sind beispielsweise zum gr ten Teil Nichtraucher nur wenige Personen in dieser Gruppe sind starke Raucher Unter den Junior Managern finden sich dagegen viele mittelschwere Raucher jedoch nur sehr wenige leichte Raucher Die Spaltenprofile geben den Anteil der Spalte in den einzelnen Zeilenkategorien an Die meisten leichten Raucher sind beispielsweise Angestellte ohne Erfahrung Auch die meisten mittleren und starken Raucher fallen in die Gruppe der Angestellten ohne Erfahrung Denken Sie daran dass die Stichprobe zum gr ten Teil Angestellte ohne Erfahrung enth lt Es ist also nicht weiter berraschend dass diese Berufskategorie in den Rauchkategorien vorherrscht Abbildung 12 10 Spaltenprofile Rauchgewohnheit Berufsgruppe Nichtraucher Leicht Mittel Stark Senior Manager Junior Manager Angestellter mit Erfahrung Angestellter ohne Erfahrung Sekretariat Aktiver Rand Die Masse ist ein Messwert der die Wichtigkeit eines Objekts auf der Grundlage der marginalen H ufigkeit angibt Die Masse wirkt sich auf den Zentroid aus also
276. itere Ver ffentlichungen Weitere Exemplare von Produkthandb chern k nnen direkt bei SPSS Inc bestellt werden Besuchen Sie den SPSS Web Store unter http www spss com estore oder wenden Sie sich an Ihr regionales SPSS B ro das Sie auf der SPSS Website unter http www spss com worldwide finden Wenden Sie sich bei telefonischen Bestellungen in den USA und Kanada unter 800 543 2185 direkt an SPSS Inc Wenden Sie sich bei telefonischen Bestellungen au erhalb von Nordamerika an Ihr regionales SPSS B ro das Sie auf der SPPS Website finden Das Handbuch SPSS Statistical Procedures Companion von Maria NoruSis wurde von Prentice Hall ver ffentlicht Eine neue Fassung dieses Buchs mit Aktualisierungen fiir SPSS 16 0 ist geplant Das Handbuch SPSS Advanced Statistical Procedures Companion bei dem auch SPSS 16 0 ber cksichtigt wird erscheint demn chst Das Handbuch SPSS Guide to Data Analysis fiir SPSS 16 0 wird ebenfalls derzeit erstellt Ank ndigungen f r Ver ffentlichungen die ausschlie lich ber Prentice Hall verf gbar sind finden Sie auf der SPSS Website unter http www spss com estore w hlen Sie Ihr Land aus und klicken Sie auf Books Kundenmeinungen Ihre Meinung ist uns wichtig Teilen Sie uns bitte Ihre Erfahrungen mit SPSS Produkten mit Insbesondere haben wir Interesse an neuen interessanten Anwendungsgebieten von SPSS Categories Kategorien Erweiterungsmodul Senden Sie uns eine E Mail an suggest spss com oder schreiben S
277. ithilfe der Komponentenladungen ermittelt Die erste Dimension entspricht in erster Linie Zugeh rigkeit Intensit t und Formalit t die zweite Dimension trennt H ufigkeit Frequenz und Entfernung und die dritte Dimension trennt diese Elemente von den anderen Beispiel Symptomatologie von E st rungen E st rungen sind schw chende Krankheiten die mit St rungen im E verhalten schwerer Abweichung des K rperbilds und einer Besessenheit von Gewicht einhergehen die Geist und K rper gleichzeitig betrifft Jedes Jahr sind Millionen von Menschen betroffen wobei Heranwachsende besonders gef hrdet sind Eine Behandlung ist m glich und am hilfreichsten wenn der Zustand fr hzeitig erkannt wird 155 Kategoriale Hauptkomponentenanalyse Mediziner k nnen versuchen E st rungen durch eine psychologische und medizinische Bewertung zu diagnostizieren Es kann sich jedoch als schwierig erweisen einen Patienten einer von mehreren Klassen von E st rungen zuzuordnen da es keine standardisierte Sympomatologie anorektischen bulimischen Verhaltens gibt Gibt es Symptome anhand deren die Patienten deutlich in die vier Gruppen unterteilt werden k nnen Welche Symptome haben sie gemeinsam Um diese Fragen zu beantworten f hrten Wissenschaftler Van der Ham Meulman Van Strien als auch Van Engeland 1997 eine Studie an 55 Jugendlichen mit bekannten E st rungen durch wie in der folgenden Tabelle gezeigt Tabelle 10 2 Patientendiag
278. itz Nein 2 fach SRF 0 5cm o o9 00 r Keine zylindekf rmig en flach T T T T T T 15 10 05 00 05 10 1 i un Dimension 1 L nge in cm weist f nf Kategorien auf von denen drei im oberen Bereich des Diagramms gruppiert sind Die beiden anderen Kategorien befinden sich in der unteren H lfte des Diagramms wobei die Kategorie 2 5 cm sehr weit von der Gruppe entfernt liegt Die gro e Diskrimination f r die L nge entlang Dimension 2 ergibt sich aus der Tatsache da sich diese eine Kategorie sehr stark von den anderen L ngenkategorien unterscheidet hnlich liegt bei Kopfform die Kategorie KREUZ sehr weit von den anderen Kategorien entfernt und bietet ein gro es Diskriminationsma entlang der zweiten Dimension Diese Muster k nnen nicht in einem Diagramm der Diskriminationsma e dargestellt werden Die Verteilung der Kategorienquantifikationen f r eine Variable ber cksichtigt die Varianz und zeigt so an wie gut diese Variable in den einzelnen Dimensionen diskriminiert ist In Dimension 1 liegen die Kategorien f r Gewinde weit auseinander Entlang Dimension 2 jedoch liegen die Kategorien f r diese Variable sehr eng beieinander Gewinde weist also in Dimension 1 eine bessere Diskrimination auf als in Dimension 2 Die Kategorien f r Kopfform sind in beiden Dimensionen weit verstreut was nahelegt dass diese Variable in beiden Dimensionen eine gute Diskrimination bietet Zus tzlich zur Bestimmung der Dimensionen entlang de
279. iveaus in der Analyse k nnen aus einer beliebigen Mischung aus nominalen ordinalen und numerischen 10 Kapitel 1 Messniveaus bestehen Die kanonische Korrelationsanalyse mit optimaler Skalierung bestimmt die hnlichkeit zwischen den Sets und vergleicht gleichzeitig die kanonischen Variablen aus den einzelnen Sets mit einem Kompromi Set das aus den Werten besteht die den Objekten zugewiesen wurden Beziehung zu anderen Prozeduren von Categories Wenn zwei oder mehr Variablen Sets mit jeweils nur einer einzigen Variablen vorliegen entspricht die kanonische Korrelationsanalyse mit optimaler Skalierung der Hauptkomponentenanalyse mit optimaler Skalierung Wenn alle Variablen in einer Analyse mit einer Variablen pro Set mehrfach nominal sind entspricht die kanonische Korrelationsanalyse mit optimaler Skalierung der Mehrfachkorrespondenzanalyse Bei zwei Variablen Sets von denen eine nur eine einzige Variable enth lt entspricht die kanonische Korrelationsanalyse mit optimaler Skalierung der kategorialen Regression mit optimaler Skalierung Beziehung zu Standardverfahren Die kanonische Standard Korrelationsanalyse ist ein statistisches Verfahren bei der eine lineare Kombination eines Variablen Sets und eine lineare Kombination eines zweiten Variablen Sets ermittelt werden die maximal korreliert sind Ausgehend von diesem Set mit linearen Kombinationen kann die kanonische Korrelationsanalyse darauf folgende unabh ngige Sets mit linearen
280. izierung werden gel scht Allerdings sind die Nicht Null Quantifizierungen f r die einzelnen Kategorien die sich aus Schema B ergeben mit den Quantifizierungen aus Schema A identisch 7 Einf hrung in die Prozeduren f r die optimale Skalierung von kategorialen Daten Welche Prozedur ist f r Ihre Anwendung am besten geeignet Die in vier dieser Prozeduren Korrespondenzanalyse Mehrfachkorrespondenzanalyse kategoriale Hauptkomponentenanalyse und nichtlineare kanonische Korrelationsanalyse enthaltenen Verfahren fallen in den allgemeinen Bereich der multivariaten Datenanalyse die als Dimensionsreduzierung bekannt ist Dies bedeutet dass die Beziehungen zwischen den Variablen so oft wie m glich in wenigen Dimensionen beispielsweise zwei oder drei dargestellt werden Dadurch k nnen Sie Strukturen oder Muster in den Beziehungen beschreiben die in ihrer urspr nglichen Komplexit t schwer zu ergr nden w ren Bei Marktforschungsanwendungen k nnen diese Verfahren eine Art Wahrnehmungszuordnung sein Ein wichtiger Vorteil dieser Prozeduren besteht darin dass sie mit Daten mit verschiedenen Messniveaus der optimalen Skalierung umgehen k nnen Die kategoriale Regression beschreibt die Beziehung zwischen einer kategorialen Responsevariablen und einer Kombination kategorialer Einflu variablen Der Einflu jeder Einflu variablen auf die Responsevariable wird durch das entsprechende Regressionsgewicht beschrieben Wie in den anderen
281. jektdiagramme rDiagramme v Objektpunkte _ Objekte und Zentroide Biplot Biplot Variablen Verf gbar Einschlie en gewinde Alle Variablen kopf kerbe _ Ausgew hlte Variablen EA form l nge messing rObjekte beschriften verf gbar Beschriften anhand Fallnummer Variable Objektpunkte Es wird ein Diagramm der Objektpunkte angezeigt Objekte und Zentroide Biplot Die Objektpunkte werden mit den Variablen Zentroiden geplottet Biplot Variablen Die Biplots k nnen auf allen Variablen oder einer Teilmenge der Variablen basieren Objekte beschriften Objekte k nnen mit den Kategorien ausgew hlter Variablen im Dialogfeld Kategoriale Hauptkomponenten Optionen k nnen Sie Kategorienummern oder Wertelabels w hlen oder den Fallnummern beschriftet werden Wenn Variable ausgew hlt ist wird pro Variable ein Diagramm erstellt Mehrfachkorrespondenzanalyse Variablendiagramme Im Dialogfeld Variablendiagramme k nnen Sie festlegen welche Diagramme und f r welche Variablen die Diagramme erstellt werden sollen 67 Mehrfachkorrespondenzanalyse Abbildung 6 10 Dialogfeld Variablendiagramme E ca Variablendiagramme Kategoriendiagramme gewinde kopf g kerbe form Yerbundene Kategoriendiagramme l nge form a messing lange Transformationsdiagramme
282. jektdiagramme Biplots Triplots und Diagramme der Komponentenladungen 25 26 Kapitel 3 Daten Werte von String Variablen werden immer in aufsteigender alphanumerischer Reihenfolge in positive Ganzzahlen umgewandelt Benutzerdefinierte und systemdefinierte fehlende Werte sowie Werte kleiner als 1 werden als fehlend betrachtet Sie k nnen die Daten umkodieren oder eine Konstante zu Variablen mit Werten kleiner als 1 addieren um die Werte als nichtfehlend zu deklarieren Annahmen Die Daten m ssen mindestens drei g ltige F lle enthalten Die Analyse basiert auf Daten die aus positiven ganzen Zahlen bestehen Mit der Option zur Diskretisierung werden Variablen mit Dezimalwerten automatisch kategorisiert indem die Werte in Kategorien gruppiert werden die nahezu normalverteilt sind und die Werte von String Variablen automatisch in positive Ganzzahlen umgewandelt Sie k nnen andere Diskretisierungsmethoden bestimmen Verwandte Prozeduren Eine Skalierung aller Variablen auf numerischem Niveau entspricht der normalen Hauptkomponentenanalyse Wenn Sie die transformierten Variablen in einer normalen linearen Hauptkomponentenanalyse verwenden stehen Ihnen andere Diagrammfunktionen zur Verf gung Wenn alle Variablen ein mehrfach nominales Skalierungsniveau besitzen ist die kategoriale Hauptkomponentenanalyse identisch mit der Mehrfachkorrespondenzanalyse Wenn Variablen Sets untersucht werden sollen verwenden Sie die kategoriale nichtl
283. jekte und Variablen Biplot Variablenkoordinaten O Ladungen Zentroide d Objekte Ladungen und Zentroide Triplot rBiplot und Triplotvariablen Verf gbar Ausgew hlt Einschlie en Alle Variablen Ausgew hlte Variablen rObjekte beschriften Verf gbar Ausgew hlt Beschriften anhand Y Fallnummer Variable Abbrechen Hilfe W hlen Sie im Gruppenfeld Diagramme die Option Objekte und Variablen Biplot W hlen Sie im Gruppenfeld Objekte beschriften aus dass die Objekte nach Variable beschriftet werden sollen und w hlen Sie dann c uster als die Variable aus nach der die Objekte beschriftet werden sollen Klicken Sie auf Weiter gt Klicken Sie im Gruppenfeld Diagramme des Dialogfelds Kategoriale Hauptkomponenten auf Kategorie 147 Kategoriale Hauptkomponentenanalyse Abbildung 10 6 Dialogfeld Kategoriendiagramme Kategoriale Hauptkomponenten Kategoriendiagramme X Kategoriendiagramme Yerbundene a rTransformationsdiagramme Dimensionen f r mehrfach nominal Residuen Diagramme einschlie en rZentroide projizieren von Aktivieren Sie die Erstellung von verbundenen Kategoriendiagrammen f r intensit Intensit t bis formal Formalit t Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Kategoriale Hauptk
284. jekten visuell untersuchen k nnen Beispiel Bevorzugte Fr hst cksartikel In einer klassischen Studie Green als auch Rao 1972 wurden 21 MBA Studenten der Wharton School mit ihren Lebensgef hrten darum gebeten 15 Fr hst cksartikel in der Vorzugsreihenfolge von am meisten bevorzugt bis 15 am wenigsten bevorzugt zu ordnen Diese Informationen finden Sie in der Datei breakfast_overall sav F r weitere Informationen siehe Beispieldateien in Anhang A auf S 326 Die Ergebnisse der Studie stellen ein typisches Beispiel des in den meisten Algorithmen f r die multidimensionale Entfaltung anzutreffenden Degenerationsproblems dar das durch Penalisieren des Variationskoeffizienten f r die transformierten hnlichkeiten gel st wird Busing Groenen als auch Heiser 2005 Es wird eine degenerierte L sung vorgestellt und erl utert wie das Problem mit der multidimensionalen Entfaltung gel st werden kann Auf diese Weise k nnen Sie die Unterscheidung der einzelnen Personen zwischen den Fr hst cksartikeln ermitteln Syntax mit denen Sie diese Analysen nachvollziehen k nnen befindet sich in der Datei prefscal_breakfast overall sps Erstellen einer degenerierten L sung gt Um eine Analyse vom Typ Multidimensionale Entfaltung durchzuf hren w hlen Sie die folgenden Befehle aus den Men s aus Analysieren Skalieren Multidimensionale Entfaltung 290 291 Multidimensionale Entfaltung Abbildung 15 1
285. k donut GD Einschr nkungen A Coffee cake CC Optionen di Corn muffin and butt Diagramme Gewichtungen Ausgabe a S Quellen Free Einf gen Zur cksetzen Abbrechen Hilfe W hlen Sie Toast pop up bis Corn muffin and butter als hnlichkeitsvariablen aus W hlen Sie Menu scenarios als Ursprungsvariable Klicken Sie auf Modell 299 Abbildung 15 9 Dialogfeld Modell rSkalierungsmodell O Identit t Euklidisch gewichtet Euklidisch verallgemeinert r hnlichkeiten G Un hnlichkeiten hnlichkeiten rDimensionen Muttidimensionale Entfaltung Modell Eg Ahnlichkeitstransformationen O Keine O Linear Spline Grad Innere Knoten O Glatt Ordinal Minimum 2 Wahlen Sie Euklidisch gewichtet als Skalierungsmodell Klicken Sie auf Weiter _ Konstanten Term einschlie en C Gebundene Beobachtungen l sen Transformationen zuweisen In jeder Zeile f r sich Getrennt in jeder Quelle Alle Quellen gleichzeitig Multidimensionale Entfaltung gt Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf Optionen 300 Kapitel 15 Abbildung 15 10 Dialogfeld Optionen Ausgangskonfiguration _ r Iterationskriterien Klassisch Stress Konvergenz 000001 Berechnung nach v Mindest Stre
286. kategorie werden die Werte die Masse die Tr gheit der Anteil der Dimension an der Tr gheit und der Anteil der Dimension an der Tr gheit des Punkts angezeigt bersicht der Spaltenpunkte F r jede Spaltenkategorie werden die Werte die Masse die Tr gheit der Anteil der Dimension an der Tr gheit und der Anteil der Dimension an der Tr gheit des Punkts angezeigt Zeilenprofile F r jede Zeilenkategorie wird die Verteilung ber die Kategorien der Spaltenvariablen angezeigt Spaltenprofile F r jede Spaltenkategorie wird die Verteilung ber die Kategorien der Zeilenvariablen angezeigt Permutationen der Korrespondenztabelle Die Korrespondenztabelle wird so umstrukturiert dass die Zeilen und Spalten entsprechend den Werten der ersten Dimension in aufsteigender Reihenfolge angezeigt werden Optional k nnen Sie auch eine maximale Dimensionszahl angeben f r die Permutationstabellen erzeugt werden sollen Dadurch wird f r jede Dimension von 1 bis zur angegebenen Zahl eine Permutationstabelle erzeugt Konfidenzstatistiken f r Zeilenpunkte Bezieht die Standardabweichung und Korrelationen f r alle nicht erg nzenden Zeilenpunkte mit ein Konfidenzstatistiken f r Spaltenpunkte Bezieht die Standardabweichung und Korrelationen f r alle nicht erg nzenden Spaltenpunkte mit ein Korrespondenzanalyse Diagramme Im Dialogfeld Diagramme k nnen Sie festlegen welche Diagramme erzeugt werden sollen 54 Kapitel 5 Abbi
287. ken Seite abgeschnitten da sie nur Patienten enth lt die bis zum Ende des Rehabilitationprogramms das nach dem Schlaganfall durchgef hrt wurde berlebten stroke_valid sav Diese hypothetische Datendatei enth lt den Zustand einer medizinischen Datenbank nachdem diese mithilfe der Prozedur Daten validieren berpr ft wurde Sie enth lt immer noch potenziell anomale F lle tastetest sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um Bewertung der Auswirkungen der Mulchfarbe auf den Geschmack von Pflanzenprodukten geht Der Geschmack von Erdbeeren die in rotem blauem und schwarzem Rindenmulch gezogen wurden wurde von Testpersonen auf einer ordinalen Skala weit unter bis weit ber dem Durchschnitt bewertet Jeder Fall entspricht einem Geschmackstester 336 Anhang A telco sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Telekommunikationsunternehmens geht die Kundenabwanderung zu verringern Jeder Fall entspricht einem Kunden und enth lt verschiedene Informationen zum demografischen Hintergrund und zur Servicenutzung telco_extra sav Diese Datendatei hnelt der Datei telco sav allerdings wurden die Variablen tenure und die Log transformierten Variablen zu den Kundenausgaben entfernt und durch standardisierte Log transformierte Variablen ersetzt telco_missing sav Diese Datendatei entspricht der Datei telco_mva_complete sav allerdings
288. kt Fall in einer bestimmten Dimension zugewiesen wird Diagramm Sie k nnen Diagramme von Kategorienkoordinaten Objektwerten Komponentenladungen Kategorienzentroiden und Transformationen erzeugen Objektwerte speichern Sie k nnen die Objektwerte als neue Variablen in der Arbeitsdatei speichern Objektwerte werden f r die im Hauptdialogfeld angegebene Anzahl von Dimensionen gespeichert Zuf llige Anfangskonfiguration verwenden Wenn einige oder alle Variablen einzeln nominal sind sollte eine zuf llige Ausgangskonfiguration verwendet werden Wenn diese Option nicht ausgew hlt wird wird eine verschachtelte Ausgangskonfiguration verwendet Kriterien Sie k nnen die maximale Anzahl von Iterationen festlegen die in der nichtlinearen kanonischen Korrelationsanalyse bei den Berechnungen durchlaufen werden Au erdem k nnen Sie einen Wert f r das Konvergenzkriterium ausw hlen Die Analyse wird abgebrochen wenn die Differenz der Gesamtanpassung zwischen den letzten zwei Iterationen kleiner als der Konvergenzwert ist oder die Maximalzahl von Iterationen erreicht wurde Zus tzliche Funktionen beim Befehl OVERALS Sie k nnen die kategoriale Hauptkomponentenanalyse an Ihre Bed rfnisse anpassen indem Sie Ihre Auswahl in ein Syntax Fenster einf gen und die daraus resultierende Befehlssyntax f r OVERALS bearbeiten Mit der Befehlssyntax Sprache verf gen Sie au erdem ber folgende M glichkeiten m Festlegen der in Diagrammen darzus
289. ldung 15 12 Ma e lterationen 481 Endg ltiger Funktionswert 8199642 Wertteile der Funktion Stressteil 3680994 Penalisierungsteil 1 8265211 Fehlende Anpassung Normalisierter Stress 1335343 Stress Inach Kruskal 3654234 Stress Il nach Kruskal 9780824 Stress nach Young 4938016 5 Stress Il nach Young 6912352 Gite der Anpassung Erklarte Streuung Erklarte Yarianz Ermittelte 8664657 5024853 Bevorzungsordnungen 7025321 Spearman Rho 6271702 Kendall Tau b 4991188 Variationskoeffizienten Variation der Ahnlichkeiten 5590170 Variation der transformierten Ahnlichkeiten Variation der Distanzen 4484515 Indizes f r Quadratsumme von Degeneration DeSarbos Indizes f r Vermischung 2199287 Shepards Index f r Nicht Degeneration 7643613 6378878 Der Algorithmus konvergiert nach 481 Iterationen bei einem endg ltigen penalisierten Stress von 0 8199642 Die Variationskoeffizienten und Shepards Index sind ausreichend gro und die Indizes nach DeSarbo ausreichend klein um den Schluss zuzulassen dass keine Degenerationsprobleme vorliegen 303 Multidimensionale Entfaltung Gemeinsamer Raum Abbildung 15 13 Verbundenes Diagramm des gemeinsamen Raums 25 Jelly donut 26 i F A 7 30 Bi 14 ul lulh bun 1 135 0880 Po 8150 Oo 0472 e Glazed donut 100 85417 9 29 9 Danish pastry 5 o 53 18 2238 31 Coffeecake 4 o Blueberry muffin and margarine 19 o 36 41o 24 42 fo 27 Buttered toast and jelly 21
290. ldung 5 6 Dialogfeld Diagramme i Korrespondenzanalyse Diagramme Streudiagramme Biplot 4 Zeilenpunkte Spaltenpunkte Breite f r Beschriftungen 20 Liniendiagramme Transformierte Zeilenkategorien Transformierte Spaltenkategorien Diagrammdimensionen Alle Dimensionen in der L sung anzeigen Anzahl der Dimensionen beschr nken Abbrechen Hie Streudiagramme Erzeugt eine Matrix mit allen paarweisen Diagrammen der Dimensionen Folgende Streudiagramme sind verf gbar m Biplot Erzeugt eine Matrix mit verbundenen Diagrammen der Zeilen und Spaltenpunkte Bei Wahl der Normalisierungsmethode Prinzipal ist die Option Biplot nicht verf gbar Zeilenpunkte Erzeugt eine Matrix mit Diagrammen der Zeilenpunkte m Spaltenpunkte Erzeugt eine Matrix mit Diagrammen der Spaltenpunkte Optional k nnen Sie angeben wie viele Zeichen in Wertelabels zur Beschriftung der Punkte verwendet werden sollen Dieser Wert muss eine nichtnegative Ganzzahl sein die kleiner oder gleich 20 ist Liniendiagramme Erzeugt ein Diagramm f r jede Dimension der gew hlten Variable Folgende Liniendiagramme sind verf gbar m Transformierte Zeilenkategorien Erzeugt ein Diagramm unter Verwendung der urspr nglichen Zeilenkategoriewerte und der entsprechenden Zeilenwerte m Transformierte Spaltenkategorien Erzeugt ein Di
291. len Sie die folgenden Befehle aus den Men s aus Analysieren Dimensionsreduktion Optimale Skalierung Abbildung 11 1 Dialogfeld Optimale Skalierung Optimale Skalierung Messniveau der optimalen Skalierung Alle Yariablen sind mehrfach nominal Einige Variablen sind nicht mehrfach nominal Anzahl der Variablen Sets Ein Set Mehrere Sets Ausgew hlte Analyse Nichtlineare kanonische Korrelation Abbrechen Hie W hlen Sie im Gruppenfeld Messniveau der optimalen Skalierung die Option Einige Variablen sind nicht mehrfach nominal gt W hlen Sie in der Gruppe Anzahl der Variablen Sets die Option Mehrere Sets Klicken Sie auf Definieren 194 Kapitel 11 Abbildung 11 2 Dialogfeld Nichtlineare kanonische Korrelationsanalyse Nichtlineare kanonische Korrelationsanalyse OVERALS X rSet 1 von 1 amp Haustiere pet De weter Zur ck iter amp Zeitung die am h ufigsten gele __Weter amp Musikgeschmack music amp Bevorzugte Wohngegend live all Ergebnis Mathematiktest math il Ergebnis Sprachtest language Variablen marital 1 Ordinal Bereich und Skala definieren Beschriftung f r Diagramme der Objektwerte Bereich definieren Dimensionen in der L sung Einf gen Zur cksetzen Abbrechen Hilfe W hlen Sie Age in years und Ma
292. lende Werte vorschreiben Objekte mit fehlenden Werten f r diese Variable ausschlie en Abbrechen Hite Strategie Fehlende Werte k nnen ausgeschlossen Passivbehandlung oder vorgeschrieben Aktivbehandlung werden oder Objekte mit fehlenden Werten k nnen ausgeschlossen werden listenweiser Fallausschluss 31 Kategoriale Hauptkomponentenanalyse CATPCA m Fehlende Werte ausschlie en f r Korrelationen nach Quantifizierung vorschreiben Objekte mit fehlenden Werten bei der ausgew hlten Variablen tragen nicht zur Analyse dieser Variablen bei Wenn alle Variablen passiv behandelt werden werden Objekte mit fehlenden Werten f r alle Variablen als Zusatzobjekte behandelt Wenn im Dialogfeld Kategoriale Hauptkomponenten Ausgabe Korrelationen ausgew hlt sind werden fehlende Werte nach der Analyse anhand der h ufigsten Variablenkategorie Modalwert f r die Korrelationen der urspr nglichen Variablengesetzt Sie k nnen die Methode ausw hlen nach der Werte f r die Korrelationen der optimal skalierten Variablen gesetzt werden Wenn Sie Modalwert ausw hlen werden fehlende Werte durch den Modalwert der optimal skalierten Variablen ersetzt Wenn Sie Zusatzkategorie ausw hlen werden fehlende Werte durch die Quantifikation einer zus tzlichen Kategorie ersetzt Dies bedeutet aber auch dass Objekte mit einem fehlenden Wert f r diese Variable als zur gleichen Kategorie der zus tzlichen zugeh rig betr
293. licht Ihnen Einschr nkungen f r den gemeinsamen Raum festzulegen Au erdem versucht PROXSCAL den normalisierten Roh Stress zu minimieren und nicht den S Stress auch als Belastung bezeichnet Der normalisierte Roh Stress wird im allgemeinen bevorzugt da es sich dabei um ein Ma handelt das auf den Distanzen beruht w hrend S Stress auf den quadrierten Distanzen beruht Multidimensionale Entfaltung Die multidimensionale Entfaltung ist am besten geeignet wenn das Ziel der Analyse darin besteht die Struktur eines Sets von Distanzma en zwischen zwei Gruppen von Objekten den Zeilen und Spaltenobjekten zu ermitteln Dies wird durch das Zuweisen von Beobachtungen zu bestimmten Positionen in einem konzeptuellen Raum mit wenigen Dimensionen erzielt wobei die Abst nde zwischen den Punkten des Raumes mit den vorgegebenen Un hnlichkeiten bzw hnlichkeiten so gut wie m glich bereinstimmen Als Ergebnis werden die Zeilen und Spaltenobjekte in 14 Kapitel 1 diesem schwachdimensionierten Raum mithilfe der Methode der kleinsten Quadrate dargestellt was h ufig zu einem besseren Verst ndnis der Daten beitr gt Beziehung zu anderen Prozeduren von Categories Wenn die Daten aus Distanzen innerhalb einer einzelnen Gruppe von Objekten eine quadratische und symmetrische Matrix bestehen verwenden Sie die multidimensionale Skalierung Beziehung zu Standardverfahren Die Prozedur Multidimensionale Entfaltung in SPSS Categories P
294. lle 9 1 Erkl rende Variablen in der Teppichreiniger Untersuchung Variablenname Variablenlabel Wertelabels package Package design A B C brand Brand name K2R Glory Bissell price Price 1 19 1 39 1 59 seal G tesiegel Good Nein Ja Housekeeping money Money back Nein Ja guarantee 10 Kunden stufen 22 Profile ein die durch diese Faktoren definiert sind Die Variable Preference enth lt den Rang der durchschnittlichen Einstufung f r die verschiedenen Profile Ein niedriger Rang bedeutet eine starke Bevorzugung Diese Variable gibt ein Gesamtma der Bevorzugung f r die Profile an Mithilfe der kategorialen Regression untersuchen Sie wie die f nf Faktoren mit der Bevorzugung zusammenh ngen Dieses Daten Set befindet sich in carpet sav F r weitere Informationen siehe Beispieldateien in Anhang A auf S 326 97 93 Kapitel 9 Standardverfahren der linearen Regressionsanalyse gt Zum Erzeugen der Ausgabe nach dem Standardverfahren der linearen Regression w hlen Sie die folgenden Befehle aus den Men s aus Analysieren Regression Linear Abbildung 9 1 Dialogfeld Lineare Regression E Lineare Re GS Abh ngige Variable Package design pac ill Preference pref Brand name brand rBlock 1von1 Price price Good Housekeeping Money back guarante Unabh ngige Coton Auswahlvariable Fallbeschriftungen o ne WLS Gewichtung CO een zanesen atest
295. lle Zellen wobei die Gewichtung anhand der Massen erfolgt Zeilen mit geringer Masse beeinflussen die Tr gheit nur dann wenn sie weit entfernt vom Zentroiden sind Zeilen mit gro er Masse wirken sich auch dann auf die Gesamttr gheit aus wenn sie sich dicht am Zentroid befinden Dies gilt entsprechend f r die Spalten Zeilen und Spaltenwerte Die Zeilen und Spaltenwerte sind die Koordinaten der Zeilen und Spaltenpunkte im Biplot Abbildung 12 11 Zeilenwerte symmetrische Normalisierung Wert in Dimension Beitrag des Punktes an der Tr gheit der der Dimension an der bersicht Dimension Tr gheit des Punktes ber Gesamt Berufsgruppe Tr gheit 1 2 bersicht Senior Manager Junior Manager Angestellter mit Erfahrung Angestellter ohne Erfahrung Sekretariat Aktiver Gesamtwert Abbildung 12 12 Spaltenwerte symmetrische Normalisierung Wert in an der Tr gheit der Dimension an der bersicht der Dimension Tr gheit des Punktes el tat es 1 2 Tr gheit 1 2 1 2 bersicht Rauchgewohnheit Nichtraucher Leicht Mittel Stark Aktiver Gesamtwert a Symmetrische Normalisierung Die Spaltenwerte h ngen ber die Profile und den Singul rwert aus der Tabelle mit der Tr gheit pro Dimension mit den Zeilenwerten zusammen Genauer gesagt die Zeilenwerte sind das Matrixprodukt der Zeilenprofile und der Spaltenwerte skaliert mit dem Singul rwert 226 Kapitel 12 f r jede Dimension Der Wer
296. lls nicht vorher eines der oben genannten Kriterien erf llt wird m Gelockerte Aktualisierungen Gelockerte Aktualisierungen beschleunigen den Algorithmus Diese Aktualisierungen k nnen mit keinem anderen Modell als dem Identit tsmodell und nicht zusammen mit Einschr nkungen verwendet werden Multidimensionale Skalierung Diagramme Version 1 Im Dialogfeld Diagramme k nnen Sie die zu erstellenden Diagramme festlegen Wenn das Datenformat hnlichkeiten in Spalten ausgew hlt wurde wird das Dialogfeld Diagramme wie folgt angezeigt Geben Sie f r die Diagramme Individuelle Raumgewichtungen Urspr ngliche ber transformierte hnlichkeiten und Transformierte hnlichkeiten ber Distanzen die Quellen an f r die die Diagramme erzeugt werden sollen Die Liste der verf gbaren Quellen entspricht der Liste der hnlichkeitsvariablen im Hauptdialogfeld Abbildung 7 10 Dialogfeld Diagramme Version 1 E Multidimensionale Skalierung Diagramme x Diagramme 4 Urspriingliche ber transformierte hnlichkeiten 4 Gemeinsamer Raum _ Transformierte hnlichkeiten gegen Distanzen Diagramme der Quellen Alle Quellen Quellen ausw hlen Verf gbar Ausgew hlt prox1 proxt prox2 u 77 prox3 el Weiter J Abbrechen Hite Stress Ein Diagramm wird erstellt in dem der normalisierte Roh Stress ber die Dimensionen abgebildet wir
297. logfeld Multidimensionale Entfaltung auf OK Im Folgenden finden Sie die durch diese Optionen generierte Befehlssyntax PREFSCAL VARIABLES Laufen Reden K ssen Schreiben Essen Schlafen Murmeln Lesen K mpfen R lpsen Diskutieren Springen Weinen Lachen Schreien INPUT ROWS ROWID INITIAL samplesDirectory behavior_ini sav dim1 dim2 CONDITION UNCONDITIONAL TRANSFORMATION ORDINAL KEEPTIES PROXIMITIES DISSIMILARITIES MODEL IDENTITY CRITERIA DIMENSIONS 2 2 DIFFSTRESS 000001 MINSTRESS 0001 MAXITER 5000 PENALTY LAMBDA 0 5 OMEGA 1 0 PRINT MEASURES COMMON PLOT COMMON TRANSFORMATIONS m Die einzige nderung besteht im Unterbefehl TRANSFORMATION Die Transformation wurde als ORDINAL festgelegt Dabei wird die Ordnung der hnlichkeiten beibehalten die transformierten Werte m ssen jedoch nicht proportional zu den urspr nglichen Werten sein 323 Ma e Abbildung 15 32 Ma e f r L sung mit ordinaler Transformation lterationen Endg ltiger Funktionswert Wertteile der Funktion Fehlende Anpassung G te der Anpassung Variationskoeffizienten Indizes f r Degeneration Stressteil Penalisierungsteil Normalisierter Stress Stress Inach Kruskal Stress Il nach Kruskal Stress nach Young Stress Il nach Young Erklarte Streuung Erklarte Varianz Ermittelte Bevorzungsordnungen Spearman Rho Kendall Tau b Variation der Ahnlichkeiten Vari
298. ls bei der G te 0 733 Dies belegt die Eigenschaft der Skalierung dass die in der urspr nglichen Regression erzielten Quantifikationen nur dann optimal sind wenn alle f nf Variablen im Modell ber cksichtigt werden Auswirkungen von Transformationen Beim Transformieren der Variablen wird eine nichtlineare Beziehung zwischen der urspr nglichen Antwort und der urspr nglichen Gruppe von Einflu gr en in eine lineare Beziehung f r die transformierten Variablen umgewandelt Wenn jedoch mehrere Einflu gr en vorliegen werden paarweise Beziehungen durch die anderen Variablen im Modell durcheinandergebracht Soll sich die Analyse auf die Beziehung zwischen Daily ozone level und Day of the year konzentrieren betrachten Sie zun chst ein Streudiagramm W hlen Sie die folgenden Befehle aus den Men s aus Grafiken Diagrammerstellung 131 Kategoriale Regression Abbildung 9 47 Dialogfeld Diagrammerstellung E Diagrammerstellung Variablen L vh vh L Daily 020 L Inversion E Pressure L Yisibility E Temperat Day of th L Daily 020 E Inversion E Pressure L Yisibility A lt Kategorien Keine Kategorien fmatvircha Wariahla Diagrammvorschau verwendet Beispieldaten Galerie Ausw hlen aus Favoriten Grundelemente Balken Linie Gruppen Punkt ID Fl che Kreis Polar Titel Fu noten Streu Punktdiagr Histogramm Hoch Tief Elementeig
299. lte jeder hnlichkeit m hnlichkeiten stammen aus mehreren Spalten einer Matrix Die hnlichkeits Matrix erstreckt sich ber mehrere Spalten deren Anzahl der Anzahl der Objekte entspricht Hiermit ffnen Sie das Dialogfeld hnlichkeiten in Matrizen ber mehrere Spalten m hnlichkeiten stammen aus einer einzigen Spalte Die Ahnlichkeits Matrix befindet sich in einer einzigen Spalte bzw Variablen Es sind zwei weitere Variablen erforderlich welche die Zeile und Spalte jeder Zelle angeben Hiermit ffnen Sie das Dialogfeld hnlichkeiten in einer einzigen Spalte 71 Multidimensionale Skalierung PROXSCAL Mehrere Quellen Wenn mehrere Quellen f r hnlichkeiten vorhanden sind geben Sie die Art der Formatierung des Daten Sets an Die hnlichkeiten befinden sich ber mehrere Spalten verteilt in gestapelten Matrizen in mehreren Spalten mit einer Quelle pro Spalte oder in einer einzigen Spalte hnlichkeiten stammen aus mehreren Spalten in gestapelten Matrizen Die hnlichkeits Matrizen erstrecken sich ber mehrere Spalten deren Anzahl der Anzahl der Objekte entspricht und sind bereinandergestapelt in mehreren Zeilen deren Anzahl der Anzahl der Objekte mal der Anzahl der Quellen entspricht Hiermit ffnen Sie das Dialogfeld hnlichkeiten in Matrizen ber mehrere Spalten m hnlichkeiten stammen aus Spalten eine Quelle pro Spalte Die hnlichkeits Matrizen sind in mehreren Spalten bzw Var
300. ltidimensionale Entfaltung 91 ANOVA in Kategoriale Regression 21 Anpassung in Nichtlineare kanonische Korrelationsanalyse 44 Anpassungswerte in Nichtlineare kanonische Korrelationsanalyse 200 Ausgangskonfiguration in Kategoriale Regression 21 in Multidimensionale Entfaltung 89 in Multidimensionale Skalierung 79 in Nichtlineare kanonische Korrelationsanalyse 44 Ausrei er bei der Mehrfachkorrespondenzanalyse 266 Beispieldateien Speicherort 326 Beitr ge in der Korrespondenzanalyse 225 239 Biplots bei der Mehrfachkorrespondenzanalyse 65 in der Kategorialen Hauptkomponentenanalyse 36 in der Korrespondenzanalyse 53 222 Cronbachs Alpha in der Kategorialen Hauptkomponentenanalyse 147 DeSarbos Indizes f r Vermischung in Multidimensionale Entfaltung 293 296 302 309 319 Deskriptive Statistiken in Kategoriale Regression 21 Diagramme in der Korrespondenzanalyse 53 in Kategoriale Regression 23 in Multidimensionale Skalierung 81 82 in Nichtlineare kanonische Korrelationsanalyse 44 Diagramme des gemeinsamen Raums in Multidimensionale Entfaltung 91 in Multidimensionale Skalierung 81 Diagramme des individuellen Raums in Multidimensionale Entfaltung 91 in Multidimensionale Skalierung 81 Diagramme f r mehrere Starts in Multidimensionale Entfaltung 91 Index Diagramme f r Raumgewichtungen in Multidimensionale Entfaltung 91 Diagramme mit individuellen
301. lyse Verlustminimierungen ohne Nebenbedingungen Bei mehrfach nominalen Variablen repr sentieren diese Koordinaten die Quantifikationen der Kategorien Der Vergleich der Einzelkategoriekoordinaten mit den Mehrfachkategoriekoordinaten zeigt wie sich die Einschr nkungen auf die Beziehung zwischen den Kategorien und deren Quantifikationen auswirken In der ersten Dimension sinken die Mehrfachkategoriekoordinaten f r Age in years in Kategorie 2 und bleiben bis Kategorie 9 etwa auf demselben Niveau in dieser Kategorie erfolgt dann ein deutlicher Anstieg Ein hnliches Muster ist bei der zweiten Dimension zu sehen Diese Beziehungen werden in den Einzelkategoriekoordinaten entfernt bei denen die ordinale Einschr nkung angewendet wird In beiden Dimensionen findet nun kein Abfall der Koordinaten mehr statt Die unterschiedliche Struktur der beiden Koordinaten Sets legt nahe dass ggf eine nominale Behandlung angebrachter w re Zentroide und projizierte Zentroide Das Diagramm der Zentroide die mit Variablen beschriftet sind sollte auf dieselbe Weise interpretiert werden wie das Diagramm der Kategoriequantifikationen bei der Homogenit tsanalyse oder wie die Mehrfachkategoriekoordinaten bei der nichtlinearen Hauptkomponentenanalyse Ein solches Diagramm zeigt klar inwieweit die Variablen die Objektgruppen voneinander trennen Die Zentroiden befinden sich am Schwerpunkt der Objekte Beachten Sie dass die Kategorien f r Age in years nicht sehr
302. m in Multidimensionale Entfaltung 294 297 303 310 320 324 344 345 in Multidimensionale Skalierung 284 287 Gewichtetes euklidisches Modell in Multidimensionale Entfaltung 87 Gewichtungen in Nichtlineare kanonische Korrelationsanalyse 44 201 Identit tsmodell in Multidimensionale Entfaltung 87 Individuelle Raumgewichtungen in Multidimensionale Entfaltung 93 in Multidimensionale Skalierung 83 Individuelle Raumkoordinaten in Multidimensionale Entfaltung 93 Individueller Raum in Multidimensionale Entfaltung 304 311 Interkorrelationen in Kategoriale Regression 109 Iterationskriterien in Multidimensionale Entfaltung 89 in Multidimensionale Skalierung 79 Iterationsprotokoll bei der Mehrfachkorrespondenzanalyse 63 in der Kategorialen Hauptkomponentenanalyse 33 147 in Multidimensionale Entfaltung 93 in Multidimensionale Skalierung 83 Kategoriale Hauptkomponentenanalyse 25 31 141 154 Iterationsprotokoll 147 Kategoriepunkte 174 Komponentenladungen 151 154 171 Messniveau der optimalen Skalierung 27 Modellzusammenfassung 147 153 170 Objektwerte 150 153 172 Quantifizierungen 148 168 Variablen speichern 35 zus tzliche Funktionen beim Befehl 39 Kategoriale Regression 16 97 Anpassungsg te des Modells 110 Diagramme 16 Interkorrelationen 109 Korrelationen 110 111 Messniveau der optimalen Skalierung 17 Resi
303. m eine hypothetische Datendatei bei der es um eine Versicherungsgesellschaft geht die die Risikofaktoren untersucht die darauf hinweisen ob ein Kunde die Leistungen einer mit einer Laufzeit von 10 Jahren abgeschlossenen Lebensversicherung in Anspruch nehmen wird Jeder Fall in der Datendatei entspricht einem Paar von Vertr gen je einer mit Leistungsforderung und der andere ohne wobei die beiden Versicherungsnehmer in Alter und Geschlecht bereinstimmen judges sav Hierbei handelt es sich um eine hypothetische Datendatei mit den Wertungen von ausgebildeten Kampfrichtern sowie eines Sportliebhabers zu 300 Kunstturnleistungen Jede Zeile stellt eine Leistung dar die Kampfrichter bewerteten jeweils dieselben Leistungen kinship_dat sav Rosenberg und Kim Rosenberg als auch Kim 1975 haben 15 Bezeichnungen f r den Verwandtschaftsgrad untersucht Tante Bruder Cousin Tochter Vater Enkelin Gro vater Gro mutter Enkel Mutter Neffe Nichte Schwester Sohn Onkel Die beiden Analytiker baten vier Gruppen von College Studenten zwei weibliche und zwei m nnliche Gruppen diese Bezeichnungen auf der Grundlage der hnlichkeiten zu sortieren Zwei Gruppen eine weibliche und eine m nnliche Gruppe wurden gebeten die Bezeichnungen zweimal zu sortieren die zweite Sortierung sollte dabei nach einem anderen Kriterium erfolgen als die erste So wurden insgesamt sechs Quellen erzielt Jede Quelle entspricht einer hnlichkeitsmatrix mit
304. mand Syntax Reference Kapitel Nichtlineare kanonische Korrelationsanalyse OVERALS Die nichtlineare kanonische Korrelationsanalyse entspricht der kategorialen kanonischen Korrelationsanalyse mit optimaler Skalierung Ziel dieser Prozedur ist es den Grad der gegenseitigen hnlichkeit von Sets kategorialer Variablen zu bestimmen Die nichtlineare kanonische Korrelationsanalyse ist auch unter der Akronym OVERALS bekannt Die kanonische Standard Korrelationsanalyse ist eine Erweiterung der mehrfachen Regression wobei das zweite Set nicht nur eine Antwortvariable sondern mehrere Antwortvariablen enth lt Ziel ist es einen m glichst gro en Teil der Varianz in der Beziehung zwischen zwei Sets von numerischen Variablen in einem Raum mit wenigen Dimensionen zu erkl ren Zun chst werden die Variablen in jedem Set linear so kombiniert dass die linearen Kombinationen maximal miteinander korrelieren Nach diesen Kombinationen werden weitere lineare Kombinationen ermittelt die nicht mit den vorherigen Kombinationen korrelieren und ber die h chstm gliche Korrelation verf gen Der Einsatz der optimalen Skalierung erweitert die Standardanalyse in drei entscheidenden Punkten Erstens erm glicht OVERALS mehr als zwei Variablen Sets Zweitens k nnen Variablen nominal ordinal oder numerisch skaliert werden Als Folge davon k nnen nichtlineare Beziehungen zwischen Variablen analysiert werden Drittens werden nicht die Korrelationen zwischen den
305. menfassung nach der Entfernung des Ausrei ers Yarianz ber cksichtigt Cronbachs Gesamt PERE Dimension Alpha Eigenwert Tragheit der Varianz 1 2 Gesamt Mittelwert a Der Mittelwert von Cronbachs Alpha basiert auf dem Mittelwert der Eigenwerte Die Eigenwerte sind leicht verschoben Die erste Dimension erkl rt nun einen etwas gr eren Teil der Varianz 268 Kapitel 13 Abbildung 13 16 Diskriminationsma e 1 0 0 8 L nge in cm N c OG 2 messing c a 0 4 0 2 Rida deze Mande 00 00 0 2 0 4 0 6 0 8 1 0 Dimension 1 Wie im Diskriminationsdiagramm gezeigt bietet Einkerbung des Kopfes keine Diskrimination in der zweiten Dimension mehr w hrend Messing nun nicht mehr wie zuvor gar keine Diskrimination aufweist sondern zumindest in der zweiten Dimension eine Diskrimination bietet Die Diskrimination f r die brigen Variablen bleibt weitgehend unver ndert Abbildung 13 17 Objektwerte beschriftet mit Messing nach der Entfernung des Ausrei ers 2 Nein Nein Nein Nein Nein 17 0 0 Nein Nein o 9 z Nein 2 Nein w Nein s 07 Nein Neln Nein o 2 A Nein Nein 1 Ja Ja Ja o o 4 ole Hee oe aes ays ck ode 15 10 05 00 0 5 1 0 1 in Dimension 1 Das Objektwertediagramm mit der Beschriftung Messing zeigt da die vier Messingobjekte alle ziemlich weit unten im Diagramm erscheinen drei Objekte nehmen exakt dieselbe Position ein was eine hohe Diskrimination
306. mensionen in der L sung darf die Anzahl der Objekte minus 1 nicht bersteigen Wenn nur eine Quelle angegeben ist sind alle Modelle quivalent zum Identit tsmodell In diesem Fall wird f r die Analyse standardm ig das Identit tsmodell verwendet 85 86 Kapitel 8 So lassen Sie eine multidimensionale Entfaltung berechnen W hlen Sie die folgenden Befehle aus den Men s aus Analysieren Skalieren Multidimensionale Entfaltung PREFSCAL Abbildung 8 1 Hauptdialogfeld Multidimensionale Entfaltung E Multidimensionale Entfaltung hnlichkeiten N Danish pastry DP N Glazed donut GD E Gender gender F Einschr nkungen tld N Coffee cake cc or Optionen SB Corn muffin and butt T Gewichtungen Ausgabe gt gt Ra Zeilen gt cenarios srcid Quellen 9 Menu scenarios 4 OK d Einf gen Zur cksetzen Abbrechen Hilfe W hlen Sie zwei oder mehre Variablen aus mit denen die Spalten in der rechtwinkligen Distanzmatrix identifiziert werden Jede Variable stellt ein separates Spaltenobjekt dar W hlen Sie optional Gewichtungsvariablen aus Die Anzahl der Gewichtungsvariablen muss der Anzahl der ausgew hlten Spaltenobjektvariablen entsprechen Die Reihenfolge der Gewichtungsvariablen muss mit der Reihenfolge der Spaltenobjekte bereinstimmen die sie gewichten W hlen Sie optional ei
307. meric Numeric i Numeric Numeric Numeric N N Go w w SPSS Prozessor ist bereit ndern Sie in der Variablenansicht das Ma f r diagnosis Diagnose von Metrisch in Nominal 184 Kapitel 10 Abbildung 10 49 Diagrammerstellung E Diagrammerstellung Variablen Table Numbe Farbe festlegen da Command_ fac dasubtype_ S PALabel_ Label_ davar ar1 E Centroids Pr L Centroids Pr E Centroids Pr E time time diagnosis di apee Kategorien Keine Kategorien fmasvincha Vaxiahia Diagrammvorschau verwendet Beispieldaten Galerie Ausw hlen aus Favoriten Grundelemente Balken Linie Gruppen Punkt ID Fl che Kreis Polar Titel Fu noten Streu Punktdiagr _ Histogramm Hoch Tief Elementeigenschaft Boxplot Doppelachsen Optionen Abbrechen 4 gt Um schlieBlich die auf die Binge eating Fressattacken projizierten Zentroide des Diagnosezeitpunkts im Verlauf der Zeit zu betrachten m ssen Sie die Diagrammerstellung erneut ffnen und durch Klicken auf Zur cksetzen die vorherige Auswahl l schen W hlen Sie die Galerie Streu Punktdiagramm aus und w hlen Sie die Option Gruppiertes Streudiagramm W hlen Sie Centroids Projected on Binge eating Zentroide auf Fre attacken projiziert als y Achsen Variable und fime Zeit als x Ac
308. mit diesen vermischt zu sein 311 Multidimensionale Entfaltung Individueller Raum Abbildung 15 21 Dimensionsgewichtungen f r Ausgangskonfiguration mit Korrespondenzanalyse Spezifit t Overall preference 279 Breakfast with juice bacon and eggs and beverage Breakfast with juice cold cereal and beverage 636 263 Breakfast with juice pancakes sausage and 389 beverage Breakfast with beverage only Snack with beverage only 552 Wichtigkeitb 351 a Die Spezifit t gibt an wie typisch eine Quelle ist Der Bereich f r die Spezifit t liegt zwischen null und eins Dabei weist null auf eine durchschnittliche Quelle mit identischen Dimensionsgewichtungen hin Eins weist auf eine sehr spezifische Quelle mit einer ungew hnlich gro en Dimensionsgewichtung und anderen Gewichtungen nahe null hin b Relative Wichtigkeit jeder Dimension als Verh ltnis der Quadratsumme einer Dimension zur Gesamtquadratsumme In der Ausgangskonfiguration mit Korrespondenzanalyse weist jeder individuelle Raum eine h here Spezifit t auf d h die Situationen in denen die Teilnehmer den Fr hst cksartikeln ordneten sind st rker einer bestimmten Dimension zugeordnet Die Quellen mit den gr ten Abweichungen bleiben Breakfast with juice bacon and eggs and beverage und Snack with beverage only 312 Kapitel 15 Abbildung 15 22 Verbundenes Diagramm des individuellen Raums Breakfast with juice
309. mit dem h chsten Koffeingehalt Zu den s en dick 244 Kapitel 12 machenden Marken z hlen die Marken BB und FF Die Marken CC und DD werden zwar als neu und gesund empfunden sind jedoch auch die unpopul rsten Marken Abbildung 12 34 Biplot der Marken und Attribute symmetrische Normalisierung 7 O image eens O marka M nner EEO Arbeit N o 3 Heilmittel fettarm 2 Ge Koffein ak m WA aon BB 0 v popul r O i en oH frisch j cc E OAA 00 av OO A en Frauen A h sslich BB o Q Yuppies premium _ O Kinder 1 traditionell Oo ee lag siiss T T 1 0 i 2 Dimension 1 Zur weiteren Interpretation k nnen Sie eine Linie durch den Ursprung und die beiden Image Attribute M nner und Yuppies ziehen und dann die Marken auf diese Linie projizieren Die beiden Attribute stehen einander gegen ber Dies bedeutet dass das Assoziationsmuster der Marken f r M nner dem Muster f r Yuppies entgegen l uft M nner werden also am h ufigsten mit der Marke EE und am wenigsten h ufig mit der Marke CC verbunden Yuppies dagegen am h ufigsten mit der Marke CC und am wenigsten h ufig mit der Marke EE Beispiel Flugmeilen zwischen St dten Die Korrespondenzanalyse ist nicht auf blo e H ufigkeitstabellen beschr nkt Die Eintr ge k nnen eine beliebige positive Messzahl der Korrespondenz darstellen In diesem Beispiel verwenden Sie die Flugmeilen zwischen zehn St dten in den USA Dieses Daten Set finden Sie in
310. mme des gemeinsamen Raums erm glichen im wesentlichen dieselbe Interpretation der Dimensionen wie die vorangegangene L sung 288 Kapitel 14 Abbildung 14 20 Koordinaten des gemeinsamen Raums hyethpticle jbtetmer uncle gher ate 00 death S nephew w cousin O Ocousin o er gmother a ars nec ae aunt o Bozen a eee ae uncle 5 gfher a sail aughter Rer gmother unchfether oO c S g a Dimension 1 Dimension 2 Dimension 3 Diskussion Die Ahnlichkeiten sollten am besten als ordinale Variablen behandelt werden da eine deutliche Verbesserung bei den Stressma en vorliegt Als n chsten Schritt k nnten Sie die ordinalen Variablen l sen d h zulassen dass quivalente Werte der urspr nglichen Variablen verschiedene transformierte Werte erhalten Beispiel In der ersten Quelle betragen die hnlichkeiten zwischen Tante und Sohn und zwischen Tante und Enkel 85 Der gebundene Ansatz f r ordinale Variablen erzwingt dass die transformierten Werte dieser hnlichkeiten bereinstimmen es gibt jedoch eigentlich keinen Grund f r die Annahme dass sie wirklich bereinstimmen sollten In diesem Fall wird durch die M glichkeit die hnlichkeiten zu l sen eine unn tige Beschr nkung aufgehoben Empfohlene Literatur In folgenden Texten finden Sie weitere Informationen zur multidimensionalen Skalierung Commandeur J J F als auch W J Heiser 1993 Mathematical derivations in the proximity s
311. money back var oistatus_ sr E Standardized p Kategorien Br ar Bu gk Diagrammvorschau verwendet Beispieldaten Galerie Ausw hlen aus Favoriten Grundelemente Balken Linie Gruppen Punkt ID Fl che Kreis Polar Titel FuBnoten Streu Punktdiagr ee Histogramm Hoch Tief Elementeigenschaft Boxplot Doppelachsen Optionen A 74 W hlen Sie die Galerie Streu Punktdiagramm aus und w hlen Sie die Option Einfaches Streudiagramm W hlen Sie Standardisiertes Residuum als y Achsen Variable aus und Package design als x Achsen Variable Klicken Sie auf OK 104 Kapitel 9 Abbildung 9 8 Residuen im Vergleich mit der Verpackungsgestaltung 1 00000 0 00000 1 00000 Standardized Residual 2 00000 1 00 1 50 2 00 2 50 3 00 Package design Die U Form ist im Diagramm der standardisierten Residuen im Vergleich mit der Verpackung st rker ausgepr gt Alle Residuen f r Design B sind negativ bei den anderen beiden Designs sind dagegen alle Residuen bis auf eines positiv Beim linearen Regressionsmodell wird je ein Parameter f r die einzelnen Variablen herangezogen Die Beziehung kann daher nicht ber das Standardverfahren festgehalten werden Kategoriale Regressionsanalyse Der kategoriale Charakter der Variablen und die nichtlineare Beziehung zwischen Preference und Package design legen nahe dass die Regression mit optimalen Werten
312. n Neues Daten S tellen Daten Set Name Neue Datendatei schreiben Datei Abbrechen Hilfe W hlen Sie die Option Residuen in Arbeitsdatei speichern aus W hlen Sie Im Gruppenfeld Transformierte Variablen die Option Transformierte Variablen in Arbeitsdatei speichern aus Klicken Sie auf Weiter Klicken Sie im Dialogfeld Kategoriale Regression auf Diagramme 109 Kategoriale Regression Abbildung 9 15 Dialogfeld Diagramme Kategoriale Regression Diagramme Transformationsdiagramme Residuen Diagramme Abbrechen J Hilfe gt Legen Sie fest dass Transformationsdiagramme f r Package design und Price angelegt werden sollen Klicken Sie auf Weiter Klicken Sie im Dialogfeld Kategoriale Regression auf OK Interkorrelationen ber die Interkorrelationen zwischen den Einflu gr en wird die Multi Kollinearit t in der Regression ersichtlich Hoch korrelierte Variablen f hren zu instabilen Regressionssch tzungen Durch die hohe Korrelation w rde das Auslassen einer dieser Variablen aus dem Modell die Vorhersage jedoch nur minimal beeinflussen Die Varianz in der Antwort die sich aus der ausgelassenen Variablen ergibt kann durch die verbleibende korrelierte Variable erkl rt werden Korrelationen nullter Ordnung sind allerdings empfindlich gegen ber Ausrei ern Auch die Mult
313. n CB DP GD CC CMB INITIAL CLASSICAL SP TRANSFORMATION NONE PROXIMITIES DISSIMILA CRITERIA DIMENSIONS 2 MAXITER 5000 EARMAN RITIES 2 DIFFSTRESS 000001 PENALTY LAMBDA 1 0 OMEGA 0 0 PRINT MEASURES COMMON PLOT COMMON MINSTRESS 0001 m Mit dieser Syntax wird eine Analyse der Variablen tp Toast pop up bis cmb Corn muffin and butter angegeben 293 Ma e Multidimensionale Entfaltung m Der Unterbefehl INITIAL gibt an dass die Startwerte mithilfe der Spearman Distanzen festgelegt werden sollen m Mit den angegebenen Werten f r den Unterbefehl PENALTY wird im Wesentlichen die Penalisierung deaktiviert und somit das Kruskal Stress I minimiert Dies f hrt zu einer degenerierten L sung Mit dem Unterbefehl PLOT werden Diagramme des gemeinsamen Raums angefordert m F r alle anderen Parameter gelten die Standardwerte Abbildung 15 3 Ma e f r degenerierte L sung lterationen 154 Endg ltiger Funktionswert 0000990 Wertteile der Funktion Stressteil 0000990 Penalisierungsteil 1 0000000 Fehlende Anpassung Normalisierter Stress OO00000 Stress Inach Kruskal 0000990 Stress Il nach Kruskal 6129749 Stress nach Young 0001980 8 Stress Il nach Young 7703817 G te der Anpassung Erkl rte Streuung 1 0000000 Erkl rte Yarianz Ermittelte Bevorzungsordnungen 7074830 Spearman Rho 7450748 Kendall Tau b 6218729 Variationskoeffizienten Variation der Ahnlichkeiten 55
314. n Werten addiert sodass der niedrigste diskretisierte Wert 1 betr gt Gruppieren Folgende Optionen sind bei der Diskretisierung von Variablen durch Gruppierung verf gbar m Anzahl Kategorien Geben Sie eine Anzahl von Kategorien an Legen Sie au erdem fest ob die Werte der Variablen ber die Kategorien ungef hr normal oder gleichverteilt werden sollen m Gleiche Intervalle Die Variablen werden in Kategorien umkodiert die durch diese gleich gro en Intervalle definiert werden Sie m ssen die Gr e der Intervalle angeben Kategoriale Hauptkomponenten Fehlende Werte Im Dialogfeld Kategoriale Hauptkomponenten Fehlende Werte k nnen Sie die Strategie f r die Verarbeitung von fehlenden Werten in den Analyse und Zusatzvariablen festlegen Abbildung 3 5 Dialogfeld Fehlende Werte Kategoriale Hauptkomponenten Fehlende Werte Strategie fiir fehlenden Wert Analysevariablen mens VVerte ausschlie en Modalwert fast VVerte ausschlie en Modalyert hinge VVerte ausschlie en Modalwert vomit Verte ausschlie en Modalwert purge VVerte ausschlie en Modalwrert hyper VVerte ausschlie en Modalwert fami Verte ausschlie en Modalwert eman VVerte ausschlie en Modalwert 4 Zusatzvariablen tidi YVerte ausschlie en Modalwert G Fehlende Werte ausschlie en f r Korrelationen nach Quantifizierung vorschreiben Strategie Modalwert Zusatzkategorie Feh
315. n dann in der Analyse verwendet Abbildung 2 3 Dialogfeld Diskretisierung Kategoriale Regression Diskretisierung Variablen pref R nge verwenden package Nicht angegeben brand Nicht angegeben price Nicht angegeben seal Nicht angegeben money Nicht angegeben Methode R nge verwenden Y ndern Gruppieren weiter Abbrechen Hite Methode Verf gbar sind die Optionen Gruppieren Einstufen oder Multiplizieren Gruppieren Hierbei werden die Daten in eine bestimmte Anzahl von Kategorien oder nach Intervall umkodiert Einstufen Die Variable wird durch Bilden einer Rangfolge diskretisiert Multiplizieren Die aktuellen Werte der Variablen werden standardisiert mit 10 multipliziert und gerundet Anschlie end wird eine Konstante zu den Werten addiert sodass der niedrigste diskretisierte Wert 1 betr gt 20 Kapitel 2 Gruppieren Folgende Optionen sind bei der Diskretisierung von Variablen durch Gruppierung verf gbar Anzahl Kategorien Geben Sie eine Anzahl von Kategorien an Legen Sie au erdem fest ob die Werte der Variablen ber die Kategorien ungef hr normal oder gleichverteilt werden sollen Gleiche Intervalle Die Variablen werden in Kategorien umkodiert die durch diese gleich gro en Intervalle definiert werden Sie m ssen die Gr e der Intervalle angeben Fehlende Werte in kategorialer Regression Im Dialogfeld
316. n folgenden Texten finden Sie weitere Informationen zur kategorialen Regression Buja A 1990 Remarks on functional canonical variates alternating least squares methods and ACE Annals of Statistics 18 1032 1069 Hastie T R Tibshirani als auch A Buja 1994 Flexible discriminant analysis Journal of the American Statistical Association 89 1255 1270 Hayashi C 1952 On the prediction of phenomena from qualitative data and the quantification of qualitative data from the mathematico statistical point of view Annals of the Institute of Statitical Mathematics 2 93 96 Kruskal J B 1965 Analysis of factorial experiments by estimating monotone transformations of the data Journal of the Royal Statistical Society Series B 27 251 263 140 Kapitel 9 Meulman J J 2003 Prediction and classification in nonlinear data analysis Something old something new something borrowed something blue Psychometrika 4 493 517 Ramsay J O 1989 Monotone regression splines in action Statistical Science 4 425 441 Van der Kooi A J als auch J J Meulman 1997 MURALS Multiple regression and optimal scaling using alternating least squares In Softstat 97 F Faulbaum als auch W Bandilla Hgg Stuttgart Gustav Fischer 99 106 Winsberg S als auch J O Ramsay 1980 Monotonic transformations to additivity using splines Biometrika 67 669 674 Winsberg S als auch J O Ramsay 1983 Monotone spline trans
317. nale Quantifizierung verwenden Transformationsdiagramme Die verschiedenen Niveaus auf denen die einzelnen Variablen skaliert werden k nnen bringen verschiedene Einschr nkungen f r die Quantifizierungen mit sich Transformationsdiagramme illustrieren die Beziehung zwischen den Quantifizierungen und den urspr nglichen Kategorien die sich aus dem jeweils ausgew hlten Messniveau der optimalen Skalierung ergibt So ergibt sich beispielsweise ein lineares Transformationsdiagramm wenn eine Variable als numerisch behandelt wird Als ordinal behandelte Variablen f hren zu einem nicht fallenden 4 Kapitel 1 Transformationsdiagramm Transformationsdiagramme f r als nominal behandelte Variablen die die Form eines U oder eines umgedrehten U aufweisen stellen eine quadratische Beziehung dar Nominale Variablen k nnen auch Transformationsdiagramme ohne offensichtliche Trends ergeben indem die Reihenfolge der Kategorien vollst ndig ge ndert wird Folgende Abbildung zeigt ein Beispiel Transformationsdiagramm Transformationsdiagramme sind besonders gut geeignet um zu bestimmen wie gut das ausgew hlte Messniveau f r die optimale Skalierung funktioniert Wenn mehrere Kategorien hnliche Quantifizierungen erhalten kann die Zusammenfassung dieser Kategorien zu einer einzigen Kategorie gerechtfertigt sein Wenn umgekehrt eine als nominal behandelte Variable Quantifizierungen erh lt die einen steigenden Trend anzeigen kann eine
318. nalisierten Stress von 0 8140741 Diese Statistik die mangelhafte G te der Anpassung die G te der Anpassung die Variationskoeffizienten und Shepards Index hneln stark der L sung mit dem klassischen Spearman Start DeSarbos Indizes weichen mit einem Wert von 1 7571887 gegen ber 0 2199287 ab Dies deutet darauf hin dass die L sung mit dem Korrespondenzstart nicht gleich gut vermischt ist Sie k nnen dem verbundenen Diagramm des gemeinsamen Raums entnehmen wie sich dies auf die L sung auswirkt 310 Kapitel 15 Gemeinsamer Raum Abbildung 15 20 Verbundenes Diagramm des gemeinsamen Raums f r Ausgangskonfiguration mit Korrespondenzanalyse Cinnamon toast o Corn muffin and butter O English muffin and margarina N Blueberry muffin and margarine Cinnamon bun g7 10 20 o 1 28 reales ck Pr Jelsenutionut 4 2 2123 280 2 gt Qanteh nakt yO 3 Boo 38 41 2 8 0038 30 5 B oo vo 26 00 9 000 12 o 14 3 17 41342970 14 o O 3124 35 o a 29 36 o Oo 40 i 019 396 37 320 O O Buttere Buttered toast and jelly o HaAFlols and butter OToast and marmalade Toast and margarine o Toast pop up 2 1 0 1 Dimension 1 N w Das gemeinsame Diagramm des gemeinsamen Raums weist eine endg ltige Konfiguration auf die der Analyse mit klassischer Spearman Ausgangskonfiguration hnelt Die Spaltenobjekte Fr hst cksartikel befinden sich jedoch im Umkreis der Zeilenobjekte Personen anstatt
319. nation and inference London Edward Arnold Lebart L A Morineau als auch K M Warwick 1984 Multivariate descriptive statistical analysis New York John Wiley and Sons Max J 1960 Quantizing for minimum distortion Proceedings IEEE Information Theory 6 7 12 Meulman J J 1986 A distance approach to nonlinear multivariate analysis Leiden DSWO Press Meulman J J 1992 The integration of multidimensional scaling and multivariate analysis with optimal transformations of the variables Psychometrika 57 539 565 Nishisato S 1980 Analysis of categorical data Dual scaling and its applications Toronto University of Toronto Press Nishisato S 1994 Elements of dual scaling An introduction to practical data analysis Hillsdale N J Lawrence Erlbaum Associates Inc Rao C R 1973 Linear statistical inference and its applications 2 Hg New York John Wiley and Sons Rao C R 1980 Matrix approximations and reduction of dimensionality in multivariate statistical analysis In Multivariate Analysis Vol 5 P R Krishnaiah Hg Amsterdam North Holland 3 22 Roskam E E 1968 Metric analysis of ordinal data in psychology Voorschoten VAM Shepard R N 1966 Metric structures in ordinal data Journal of Mathematical Psychology 3 287 315 Wolter K M 1985 Introduction to variance estimation Berlin Springer Verlag Young F W 1981 Quantitative analysis of qualitative data Psychome
320. nd numerischem Skalierungsniveau erforderlich 149 Kategoriale Hauptkomponentenanalyse Abbildung 10 9 Quantifizierungen f r die Intensit t der Interaktion Zentroidkoordinaten Vektorkoordinaten Dimension Dmmension Kategorie Quantifikation r r r Iar sehr schwach schwach mittel hoch Normalisierung mit Yariablen Prinzipal Ein kurzer Blick auf die Quantifizierungen im verbundenen Diagramm der Kategoriepunkte gen gt um zu sehen dass bei manchen Variablen einige Kategorien durch die kategoriale Hauptkomponentenanalyse nicht so klar getrennt wurden wie bei einem echt ordinalen Niveau zu erwarten gewesen w re Die Variablen Intensit t und H ufigkeit Frequenz beispielsweise weisen gleiche oder fast gleiche Quantifzierungen f r ihre beiden mittleren Kategorien auf Bei dieser Art von Ergebnis sollten Sie alternative kategoriale Hauptkomponentenanalysen versuchen vielleicht mit einigen reduzierten Kategorien oder vielleicht mit einem anderen Niveau f r die Analyse beispielsweise mehrfach nominal Abbildung 10 10 Kategoriepunkte im verbundenen Diagramm Entfernung O Formalit t 15 4 keine H ufigkeit K Frequenz O Intensit t 104 Zugeh rigkeit nah 054 a schwach S schwach _picht f rmlich p sehr schwa rel schwach c 004 hoch w E h ufig A o5 Beziehung 10 4 Dimension 1 Das verbundene Diagramm der Kategoriepunkte hnelt dem Diagramm fiir die Komponentenladungen z
321. ndet wurde Die Distanz von einem Objekt bis zum Ursprung zeigt die Variation gegen ber dem durchschnittlichen Antwortmuster an Dieses durchschnittliche Antwortmuster entspricht der h ufigsten Kategorie f r jede Variable Objekte bei denen viele Merkmale den h ufigsten Kategorien entsprechen liegen in der N he des Ursprungs Objekte mit einzigartigen Merkmalen befinden sich hingegen weit vom Ursprung entfernt 260 Kapitel 13 Abbildung 13 6 Objektwertediagramm mit Objekt beschriftet 4 Le SCREW1 o NAIL6 Dimension 2 17 NAIL7 BOLT2 NAILS o O SCREWB 0 4 SCREBGREW2 15 10 05 00 05 10 15 Dimension 1 Bei der Untersuchung des Diagramms stellen wir fest dass die erste Dimension horizontale Achse eine Unterscheidung zwischen Schrauben und Bolzen weisen ein Gewinde auf einerseits und N geln und Rei n geln kein Gewinde andererseits bietet Dies ist im Diagramm ganz einfach zu erkennen da sich die Schrauben und Bolzen an einem Ende der horizontalen Achse befinden und die N gel und Rei zwecken am anderen In geringerer Sch rfe trennt die erste Dimension auch die Bolzen mit flacher Grundform von allen anderen mit spitzer Grundform Die zweite Dimension vertikale Achse scheint SCHRAUBE und NAGEL6 von allen anderen Objekten zu trennen Die Gemeinsamkeit zwischen SCHRAUBEI und NAGEL6 besteht in ihren Werten bei der Variablen l nge Sie sind die l ngsten Objekte in der Datenmenge Au
322. ndige Informationen zur Syntax finden Sie in der Command Syntax Reference Kapitel Korrespondenzanalyse Ein Ziel der Korrespondenzanalyse besteht darin die Beziehungen zwischen zwei nominalen Variablen in einer Korrespondenztabelle in einem flachdimensionierten Raum und gleichzeitig die Beziehungen zwischen den Kategorien f r jede Variable zu beschreiben F r jede Variable werden die Beziehungen zwischen den Kategorien durch die Distanzen zwischen den Kategoriepunkten in einem Diagramm dargestellt wobei hnliche Kategorien jeweils nahe beieinander liegen Durch die Projizierung von Punkten f r eine Variable auf dem Vektor vom Ursprung zu einem Kategoriepunkt einer anderen Variablen wird die Beziehung zwischen den Variablen beschrieben Bei einer Analyse der Kontingenztafeln werden h ufig Zeilen und Spaltenprofile untersucht und Tests auf Unabh ngigkeit mithilfe der Chi Quadrat Statistik durchgef hrt Die Anzahl der Profile kann jedoch unter Umst nden relativ gro sein wobei durch die Chi Quadrat Statistik die Abh ngigkeitsstruktur nicht erkennbar wird Die Prozedur Kreuztabelle bietet verschiedene Zusammenhangsma e und tests kann jedoch keine Beziehungen zwischen den Variablen darstellen Die Faktorenanalyse ist ein Standardverfahren zur Beschreibung von Beziehungen zwischen Variablen in einem flachdimensionierten Raum Zur Faktorenanalyse werden jedoch Intervalldaten ben tigt Au erdem muss die Anzahl der Beobachtungen da
323. ne Zeilenvariable aus Die Werte oder Wertelabels dieser Variable werden verwendet um die Zeilenobjekte in der Ausgabe zu beschriften Wenn mehrere Quellen vorhanden sind w hlen Sie bei Bedarf eine Quellenvariable aus Die Anzahl der F lle in der Datendatei muss der Anzahl der Zeilenobjekte multipliziert mit der Anzahl der Quellen entsprechen Dar ber hinaus k nnen Sie ein Modell f r die multidimensionale Entfaltung angeben Einschr nkungen f r den gemeinsamen Raum festlegen Konvergenzkriterien festlegen die zu verwendende Ausgangskonfiguration angeben sowie Diagramme und die Ausgabe ausw hlen 87 Multidimensionale Entfaltung PREFSCAL Definieren eines Modells f r die multidimensionale Entfaltung Im Dialogfeld Modell k nnen Sie ein Skalierungsmodell die minimale und maximale Anzahl seiner Dimensionen die Struktur der Distanzmatrix und die f r die hnlichkeiten zu verwendende Transformation angeben sowie festlegen ob hnlichkeiten abh ngig von der Zeile abh ngig von der Quelle oder unabh ngig von der Quelle transformiert werden Abbildung 8 2 Dialogfeld Modell E Multidimensionale Entfaltung Modell Skalierungsmodell Ahnlichkeitstransformationen Identit t Keine Euklidisch verallgemeinert Spline hnlichkeiten Un hnlichkeiten hnlichkeiten Dimensionen Minimum 2 Maximum RB ss Gebundene Beobachtungen l sen Transformationen zuweisen
324. nen z B mit einem Korrespondenzstart der Drei fach Analyse der Fr hst cksdaten k nnen jedoch Einzelheiten st rker herausgestellt werden gt Um eine L sung mit einem Korrespondenzstart zu erstellen klicken Sie auf die Schaltfl che Zuletzt verwendete Dialogfelder und w hlen Sie Multidimensionale Entfaltung aus 308 Kapitel 15 gt Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf Optionen Abbildung 15 18 Dialogfeld Optionen E Multidimensionale Entfaltung Optionen x Ausgangskonfiguration riterationskriterien Klassisch Stress Konyergenz 000001 Z Mindest Stress 0001 Ross Cliff 3 Maximalzahl der Iterationen 5000 Korrespondenz Zentroide af rPenalisierungsterm Mehrere Zufallsstarts St rke 0 5 Anzahl Start Bereich 0 0 Anpassen r ngepasste Konfiguration Weiter l Abbrechen gt W hlen Sie im Gruppenfeld Ausgangskonfiguration die Option Korrespondenz Klicken Sie auf Weiter Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf OK Im Folgenden finden Sie die durch diese Optionen generierte Befehlssyntax PREFSCAL VARIABLES TP BT EMM JD CT BMM HRB TMd BTJ TMn CB DP GD CC CMB INPUT SOURCES srcid INITIAL CORRESPONDENCE TRANSFORMATION NONE PROXIMITIES DISSIMILARITIES CRITERIA DIMENSIONS 2 2 DIFFSTRESS 000001 MINSTRE
325. nen eine Variable Diskriminationen bietet und der Art und Weise in der sie diskriminiert vergleicht das Diagramm der Kategoriequantifikationen auch die Variablendiskrimination Eine Variable mit Kategorien die weit auseinander liegen bietet eine bessere Diskrimination als eine Variable mit Kategorien 263 Mehrfachkorrespondenzanalyse die eng beieinander liegen So liegen entlang Dimension 1 die beiden Kategorien von Messing wesentlich enger beieinander als die beiden Kategorien von Gewinde was bedeutet da Gewinde entlang dieser Dimension eine bessere Diskrimination aufweist als Messing Entlang Dimension 2 sind die Abst nde jedoch sehr hnlich was nahelegt da diese Variablen entlang dieser Dimension bis zum selben Grad diskriminieren Das weiter oben er rterte Diskriminationsma identifiziert diese Beziehungen indem Varianzen verwendet werden um die Verteilung der Kategorien widerzuspiegeln Genauere Untersuchung der Objektwerte Tiefere Einblicke in die Daten k nnen durch Untersuchung der nach den einzelnen Variablen beschrifteten Objektwertediagramme gewonnen werden Idealerweise sollten hnliche Objekte ausschlie liche Gruppen bilden und diese sollten weit voneinander entfernt liegen Abbildung 13 9 Objektwerte beschriftet mit Gewinde 4 je Ja 3 N 9 5 F Nein 7 e wo E l O sne Ja o 2 an Nein 0 Jia Ja on Nein Neilein Ja Ja o NeinO Nein 15 10 05 00 05 10 1 5 Dimension
326. nen kombiniert werden was ebenfalls eine Variable mit 12 Kategorien ergibt Oder man kann Region und Alter kombinieren was zu einer neuen Variablen mit 16 Kategorien f hrt Alle diese Interaktionsvariablen ergeben zusammen mit der verbleibenden Variablen eine zweidimensionale Tabelle Die Korrespondenzanalysen dieser drei Tabellen f hren nicht zu identischen Ergebnissen aber dennoch ist jeder der Ans tze g ltig Au erdem k nnen bei vier oder mehr Variablen zweidimensionale Tabellen erstellt werden die eine Interaktionsvariable mit einer weiteren Interaktionsvariablen vergleichen Die Anzahl der m glichen Tabellen f r die Analyse kann recht gro werden selbst bei nur relativ wenigen Variablen Sie k nnen eine dieser Tabellen f r die Analyse ausw hlen oder alle analysieren Alternativ kann die Prozedur der Mehrfachkorrespondenzanalyse verwendet werden um alle Variablen gleichzeitig zu untersuchen ohne dass Interaktionsvariablen konstruiert werden m ssen Beziehung zu Standardverfahren Mit der Prozedur Crosstabs k nnen ebenfalls Kontingenztabellen analysiert werden wobei Unabh ngigkeit einen gemeinsamen Fokus der Analysen darstellt Selbst bei kleinen Tabellen kann es jedoch schwierig sein die Ursache von Abweichungen von 12 Kapitel 1 der Unabh ngigkeit zu ermitteln Der Nutzen der Korrespondenzanalyse besteht in der Anzeige derartiger Muster f r zweidimensionale Tabellen beliebiger Gr e Wenn ein Zusammenhang zwischen
327. nf gen Zur cksetzen Abbrechen Hilfe W hlen Sie Preference als abh ngige Variable aus W hlen Sie die Eintr ge Package design bis Money back guarantee als unabh ngige Variablen aus W hlen Sie Preference aus und klicken Sie auf Skala definieren Abbildung 9 10 Dialogfeld Skala definieren Kategoriale Regression Skala definieren amp rMessniveau der optimalen Skalierung Spline ordinal Ordinal Spline nominal Nominal Numerisch Spline Grad 2 Innere Knoten 2 Wahlen Sie Numerisch als optimales Messniveau f r die Skalierung Klicken Sie auf Weiter 106 Kapitel 9 W hlen Sie Package design aus und klicken Sie im Dialogfeld Kategoriale Regression auf Skala definieren Abbildung 9 11 Dialogfeld Skala definieren A Kategoriale Regression Skala definie Messniveau der optimalen Skalierung Spline ordinal C Ordinal Spline nominal Numerisch rSpline Grad 2 Innere Knoten 2 j Abbrechen Hilfe W hlen Sie Nominal als optimales Messniveau f r die Skalierung Klicken Sie auf Weiter gt Wahlen Sie Brand name bis Money back guarantee aus und klicken Sie im Dialogfeld Kategoriale Regression auf Skala definieren Abbildung 9 12 Dialogfeld Skala definieren Kategoriale Regression Skala definieren Messniveau der optimalen Skalieru
328. nfiguration auf m Euklidisch gewichtet Hierbei handelt es sich um ein Modell f r individuelle Differenzen Jede Quelle hat einen individuellen Raum in dem jede Dimension des gemeinsamen Raums unterschiedlich gewichtet ist m Euklidisch verallgemeinert Hierbei handelt es sich um ein Modell f r individuelle Differenzen Jede Quelle hat einen individuellen Raum der einer Rotation des gemeinsamen Raums und einer darauf folgenden differenzierten Gewichtung der Dimensionen entspricht m Reduzierter Rang Bei diesem Modell handelt es sich um ein verallgemeinertes euklidisches Modell f r das Sie den Rang des individuellen Raums angeben k nnen Der angegebene Rang muss gr er oder gleich 1 und kleiner als die H chstanzahl von Dimensionen sein Form Geben Sie an ob die hnlichkeiten der unteren oder oberen Dreiecksmatrix der Distanzmatrix entnommen werden sollen Sie k nnen angeben dass die gesamte Matrix verwendet werden soll In diesem Fall wird die gewichtete Summe der unteren und oberen Dreiecksmatrix analysiert Obwohl nur die angegebenen Abschnitte verwendet werden muss in jeden Fall die gesamte Matrix einschlie lich der Diagonalen angegeben werden hnlichkeiten Geben Sie an ob die Distanzmatrix hnlichkeits oder Un hnlichkeitsma e enth lt 78 Kapitel 7 hnlichkeitstransformationen W hlen Sie eine der folgenden Alternativen aus m Verh ltnisskala Die transformierten hnlichkeiten sind proportional zu den u
329. ng Spline ordinal Ordinal Spline nominal Nominal Numerisch Spline Grad Ro Innere Knoten 2 Abbrechen Hilfe W hlen Sie Numerisch als optimales Messniveau f r die Skalierung gt Klicken Sie auf Weiter Klicken Sie im Dialogfeld Kategoriale Regression auf Ausgabe 107 Kategoriale Regression Abbildung 9 13 Dialogfeld Ausgabe Kategoriale Regression Ausgabe X Tabellen V Multiples R V Korrelationen der Originalvariablen V Koeffizienten V Korrelationen der transformierten Variablen terationsprotokoll O Analysevariablen Kategorienquantifikationen pref package brand price seal money Deskriptive Statistik W hlen Sie Korrelationen der Originalvariablen und Korrelationen der transformierten Variablen gt Deaktivieren Sie die Option ANOVA Klicken Sie auf Weiter Klicken Sie im Dialogfeld Kategoriale Regression auf Speichern 108 Kapitel 9 Abbildung 9 14 Dialogfeld Speichern Kategoriale Regression Speichern x C Vorhergesagte Werte in Arbeitsdatei speichern Residuen in Arbeitsdatei speichern rDiskretisierte Daten _ Diskretisierte Daten erstellen Neues Daten 3 Neue Datendatei schreiben Datei rTransformierte Variablen M ransformierte Variablen in Arbeitsdatei speichern Transformierte Variablen erstelle
330. nge f r die Beschriftungen festlegen Diagrammdimensionen Hiermit legen Sie fest wie die Statistiken in der Ausgabe angezeigt werden Alle Dimensionen in der L sung anzeigen Alle Dimensionen in der L sung werden in einer Streudiagramm Matrix angezeigt m Anzahl der Dimensionen beschr nken Die angezeigten Dimensionen werden auf geplottete Paare beschr nkt Wenn Sie die Dimensionen beschr nken m ssen Sie die niedrigste und die h chste Dimension ausw hlen die jeweils geplottet werden soll Die niedrigste Dimension muss im Bereich von 1 bis zur Anzahl der Dimensionen in der L sung minus 1 liegen und wird gegen h here Dimensionen geplottet Der Wert f r die h chste Dimension muss im Bereich von 2 bis zur Anzahl der Dimensionen in der L sung liegen und gibt die h chste Dimension an die beim Plotten der Dimensionspaare verwendet wird Diese Spezifikation gilt f r alle angeforderten multidimensionalen Plots 63 Mehrfachkorrespondenzanalyse Konfiguration Sie k nnen die Koordinaten einer Konfiguration aus einer Datei einlesen Die erste Variable in der Datei muss die Koordinaten der ersten Dimension die zweite Variable die Koordinaten der zweiten Dimension usw enthalten m Initial Die in der Datei angegebene Konfiguration wird als Ausgangspunkt f r die Analyse verwendet m Fest Die in der Datei angegebene Konfiguration wird zum Anpassen der Variablen verwendet Die Variablen die angepa t werden m ssen als Analy
331. ngegebene H chstwert muss eine Ganzzahl sein Gebrochene Datenwerte werden in der Analyse abgeschnitten Ein Kategoriewert der au erhalb des angegebenen Bereiches liegt wird in der Analyse ignoriert Um eine m glichst kleine Ausgabe zu erzielen erstellen Sie mithilfe der Funktion Automatisch umkodieren verf gbar im Men Transformieren aufeinander folgende Kategorien die mit 1 beginnen Ferner m ssen Sie einen Bereich f r jede Variable definieren mit deren Hilfe die Diagramme der Objektwerte beschriftet werden Beschriftungen f r Kategorien mit Datenwerten die au erhalb des f r die Variable definierten Bereichs liegen werden in den Diagrammen jedoch angezeigt Nichtlineare kanonische Korrelationsanalyse Optionen Das Dialogfeld Optionen erm glicht Ihnen die Auswahl von optionalen Statistiken und Diagrammen die Speicherung von Objektwerten als neue Variablen in der Arbeitsdatei die Angabe von Iterations und Konvergenzkriterien sowie die Angabe einer Ausgangskonfiguration f r die Analyse Abbildung 4 5 Dialogfeld Optionen E OVERALS Optionen Anzeige V H ufigkeiten v Einfache und mehrfache Anpassung Zentroide v Kategorienquantifikationen lterationsprotokoll Objektwerte v Gewichte und Komponentenladungen Diagramm Kategorienkoordinaten Kategorienzentroide 4 4 Objektwerte Transformationen 4 Komp
332. nlinear canonical correlation British Journal of Mathematical and Statistical Psychology 36 54 80 Van der Burg E J De Leeuw als auch R Verdegaal 1988 Homogeneity analysis with k sets of variables An alternating least squares method with optimal scaling features Psychometrika 53 177 197 Van der Ham T J J Meulman D C Van Strien als auch H Van Engeland 1997 Empirically based subgrouping of eating disorders in adolescents A longitudinal perspective British Journal of Psychiatry 170 363 368 Van der Kooi A J als auch J J Meulman 1997 MURALS Multiple regression and optimal scaling using alternating least squares In Softstat 97 F Faulbaum als auch W Bandilla Hgg Stuttgart Gustav Fischer 99 106 Van Rijckevorsel J 1987 The application of fuzzy coding and horseshoes in multiple correspondence analysis Leiden DSWO Press Verboon P als auch I A Van der Lans 1994 Robust canonical discriminant analysis Psychometrika 59 485 507 Verdegaal R 1985 Meer sets analyse voor kwalitatieve gegevens in niederl ndischer Sprache Leiden Department of Data Theory Universit t Leiden Vlek C als auch P J Stallen 1981 Judging risks and benefits in the small and in the large Organizational Behavior and Human Performance 28 235 271 343 Bibliografie Wagenaar W A 1988 Paradoxes of gambling behaviour London Lawrence Erlbaum Associates Inc Ware J H D W Dockery
333. nn Sie diese in der Arbeitsdatei speichern 68 Kapitel 6 m Mit dem Unterbefehl PLOT kann die H chstl nge f r Beschriftungen f r jedes Diagramm getrennt festgelegt werden m Mit dem Unterbefehl PL festgelegt werden OT kann eine separate Variablenliste f r Residuen Diagramme Vollst ndige Informationen zur Syntax finden Sie in der Command Syntax Reference Kapitel 7 Multidimensionale Skalierung PROXSCAL Bei der multidimensionalen Skalierung wird versucht die Struktur in einem Set von hnlichkeitsma en zwischen Objekten zu ermitteln Dies wird durch das Zuweisen von Beobachtungen zu bestimmten Positionen in einem konzeptuellen Raum mit wenigen Dimensionen erzielt wobei die Abst nde zwischen den Punkten des Raumes mit den vorgegebenen Un hnlichkeiten bzw hnlichkeiten so gut wie m glich bereinstimmen Als Ergebnis werden die Objekte in diesem Raum mit wenigen Dimensionen mithilfe der Methode der kleinsten Quadrate dargestellt was h ufig zu einem besseren Verst ndnis der Daten beitr gt Beispiel Die multidimensionale Skalierung kann das Ermitteln von Wahrnehmungsbeziehungen erheblich erleichtern Der Hersteller eines Produkts kann zum Beispiel eine Umfrage durchf hren um das Produktimage zu ermitteln und ein Daten Set zu erhalten das die wahrgenommene hnlichkeit N he des Produkts mit Konkurrenzprodukten beschreibt Unter Verwendung dieser hnlichkeitswerte und unabh ngiger Variablen z B des
334. nose Diagnose Anzahl der Patienten Anorexia nervosa 25 Anorexia mit Bulimia nervosa 9 Bulimia nervosa nach Anorexia 14 Atypische E st rung 7 Gesamt 55 Jeder Patient wurde vier Mal ber einen Zeitraum von vier Jahren untersucht es fanden also insgesamt 220 Beobachtungen statt Bei jeder Beobachtung wurden die Patienten anhand der 16 Symptome bewertet die in der folgenden Tabelle dargestellt sind Die Symptomwerte fehlen f r Patient 71 zum Zeitpunkt 2 Patient 76 zum Zeitpunkt 2 und Patient 47 zum Zeitpunkt 3 wodurch 217 g ltige Beobachtungen verbleiben Diese Daten finden Sie in anorectic sav F r weitere Informationen siehe Beispieldateien in Anhang A auf S 326 Tabelle 10 3 Modifizierte Morgan Russell Unterskalen zur Messung des Wohlbefindens Variablen Variablenlabel Unteres Ende Wert 1 Oberes Ende Wert 3 oder 4 name weight Body weight Outside normal range Normal Normal K rpergewicht Au erhalb des normalen Bereichs mens Menstruation Amenorrhea Amenorrh Regular periods Regelm ige Menstruation Periode fast Restriction of food intake Less than 1200 calories Normal regular meals fasting Einschr nkung Weniger als 1200 Kalorien Normale regelm ige der Nahrungsaufname Mahlzeiten Fasten binge Binge eating Greater than once aweek No bingeing Keine Fre attacken Mehr als einmal pro Fre attacken Woche vomit Vomiting Erbrechen Greater than once aweek No vomiting Kein Erbrechen Mehr als
335. nsamen Raum Sie k nnen die Koordinaten von Zeilen und oder Spaltenobjekten im gemeinsamen Raum festlegen Variablen f r Zeilen Spalteneinschr nkungen W hlen Sie die Datei aus die die Einschr nkungen enth lt und w hlen Sie die Variablen aus die die Einschr nkungen im gemeinsamen Raum definieren Die erste ausgew hlte Variable enth lt die Koordinaten der Objekte in der ersten Dimension die zweite Variable entspricht den Koordinaten der zweiten Dimension usw Ein fehlender Wert zeigt an dass eine Koordinate in einer Dimension frei ist Die Anzahl der ausgew hlten Variablen muss der angegebenen H chstanzahl von Dimensionen entsprechen Die Anzahl der F lle jeder Variablen muss der Anzahl der Objekte entsprechen Multidimensionale Entfaltung Optionen Im Dialogfeld Optionen k nnen Sie die Ausgangskonfiguration ausw hlen Iterations und Konvergenzkriterien angeben und den Penalisierungsterm f r den Stress festlegen 90 Kapitel 8 Abbildung 8 4 Dialogfeld Optionen ir E Multidimensionale Entfaltung Optionen Ausgangskonfiguration Iterationskriterien G Klassisch Stress Konvergenz 000001 Berechnung nach v Mindest Stress 0001 Ross Cliff 2 Maximalzahl der tterationen 5000 _ Korrespondenz ZZ Z Zentroide Penalisierungsterm Mehrere Zufallsstarts St rke 0 5 Bereich 1 0 Anpassen Angepasste Konfiguration
336. nsionale Entfaltung Verbundenes Diagramm des individuellen Raums Snack with beverage only un oO 35 34 9a N in 28 38 Se 5 22 Coffee cake 40 7 1 Jelly donut 2 15 o 10 o8 Pog an O Ginnamon bun 0 ge 10 Glazed donut 1613 amp 20 892931 o Danish pastry 19 a 00 Blueberry muffin and margarine c 23 0 O 3 21 7 41 24 57 o3 s 2 5 20 Buttered toast and jelly a English muffin and margarioe o Cinnamon toast Corn muffin and butter oO o OButtered toast 12 40 O Toast and margarine 10 0 Hard rolls and butter O 32 37 Dimension 1 039 OToast and marmalade 11 Toast pop up 8 pop uf Im verbundenen Diagramm des individuellen Raums Snack with beverage only sind die Auswirkungen dieses Szenarios auf die Bevorzugungen dargestellt Diese Quelle ist st rker an der zweiten Dimension beteiligt sodass die Unterscheidung zwischen den Artikeln meist auf die zweite Dimension zur ckzuf hren ist Aufgrund der geringen Spezifit t dieser Quelle ist entlang der ersten Dimension jedoch immer noch eine deutliche Unterscheidung vorhanden Verwenden einer anderen Ausgangskonfiguration Die endg ltige Konfiguration kann von den Startpunkten abh ngen die dem Algorithmus bergeben werden Im Idealfall sollte die allgemeine Struktur der L sung gleich bleiben andernfalls f llt das Ermitteln der richtigen L sung m glicherweise schwer Durch die Verwendung verschiedener Ausgangskonfiguratio
337. ntfaltung hnlichkeitstransformationen Abbildung 15 34 Transformationsdiagramm f r eine L sung mit ordinaler Transformation Transformed Proximity Raw Proximity Unconditional ordinal transformation with ties kept tied Abgesehen von den Werten mit den gr ten hnlichkeiten die gegen ber den restlichen Variablen aufw rts abweichen ist die ordinale Transformation der hnlichkeiten recht linear Auf diese hnlichkeiten ist wahrscheinlich der gr te Teil der Unterschiede zwischen der ordinalen und der linearen L sung zur ckzuf hren Es liegen jedoch nicht gen gend Informationen vor um zu ermitteln ob es sich bei diesem nicht linearen Trend in den h heren Werten um einen tats chlichen Trend oder um eine Anomalie handelt Empfohlene Literatur In den folgenden Texten finden Sie weitere Informationen Busing F M T A P J F Groenen als auch W J Heiser 2005 Avoiding degeneracy in multidimensional unfolding by penalizing on the coefficient of variation Psychometrika 70 71 98 Green P E als auch V Rao 1972 Applied multidimensional scaling Hinsdale Ill Dryden Press Price R H als auch D L Bouffard 1974 Behavioral appropriateness and situational constraints as dimensions of social behavior Journal of Personality and Social Psychology 30 579 586 Anhang A Beispieldateien Die zusammen mit dem Produkt installierten Beispieldateien finden Sie im Unterverzeichnis Samples d
338. nts and peers in the leisure activities of young adolescents Journal of Leisure Research 32 281 302 Kapitel Nichtlineare kanonische Korrelationsanalyse Die nichtlineare kanonische Korrelationsanalyse dient zur Bestimmung wie hnlich zwei oder mehr Gruppen von Variablen einander sind Wie bei der linearen kanonischen Korrelationsanalyse ist das Ziel die Varianz in den Beziehungen unter den Gruppen in einem flachdimensionierten Raum so gut wie m glich zu ber cksichtigen Anders als bei dei der linearen kanonischen Korrelationsanalyse wird bei der nichtlinearen kanonischen Korrelationsanalyse nicht von einem linearen Messniveau oder von linearen Beziehungen ausgegangen Ein weiterer wichtiger Unterschied besteht darin dass bei der nichtlinearen kanonischen Korrelationsanalyse die hnlichkeit zwischen den Gruppen durch den gleichzeitigen Vergleich linearer Kombinationen der Variablen in jeder Gruppe mit einer unbekannten Gruppe durchgef hrt wird Objektwerte Beispiel Analyse der Umfrageergebnisse Das Beispiel in diesem Kapitel stammt aus einer Umfrage Verdegaal 1985 Die Antworten von 15 Subjekten auf 8 Variablen wurden aufgezeichnet Die Variablen Variablenlabels und Wertelabels Kategorien im Daten Set werden in der folgenden Tabelle angezeigt Tabelle 11 1 Umfragedaten Variablenname age marital pet news music live math language Variablenlabel Age in years Marital status Pets owned Newsp
339. nzipal Abbrechen Hilfe W hlen Sie Prinzipal als Normalisierungsmethode Klicken Sie auf Weiter Klicken Sie im Dialogfeld Korrespondenzanalyse auf Diagramme 238 Kapitel 12 Abbildung 12 27 Dialogfeld Diagramme itl Korrespondenzanalyse Diagramme rStreudiagramme v Biplot v Zeilenpunkte Spaltenpunkte Breite f r Beschriftungen 20 Liniendiagramme Transformierte Zeilenkategorien Transformierte Spaltenkategorien r Beschriftunger 20 Diagrammdimensionen G Alle Dimensionen in der L sung anzeigen Anzahl der Dimensionen beschr nken Abbrechen W hlen Sie in der Gruppe Streudiagramme die Optionen Zeilenpunkte und Spaltenpunkte Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Korrespondenzanalyse auf OK Dimensionen Die Tr gheit pro Dimension zeigt die Zerlegung der Gesamttr gheit auf die einzelnen Dimensionen Zwei Dimensionen machen 83 der Gesamttr gheit aus Bei einer dritten Dimension w rden nur weitere 8 6 der Tr gheit ber cksichtigt Sie entscheiden sich daher f r eine zweidimensionale Darstellung 239 Korrespondenzanalyse Abbildung 12 28 Tr gheit pro Dimension Singul rwert f r Anteil der Tr gheit Konfidenz Singul rwer Auswertung Chi Standard Dimension t f r Tr gheit Quadrat ig Bedingen Kumuliert
340. omponenten auf OK Anzahl der Dimensionen Die folgenden Abbildungen zeigen einen Teil der urspr nglichen Ausgabe f r die kategoriale Hauptkomponentenanalyse Nach dem Iterationsprotokoll des Algorithmus wird die Modellzusammenfassung einschlie lich der Eigenwerte der einzelnen Dimensionen angezeigt Diese Eigenwerte entsprechen denen der klassischen Hauptkomponentenanalyse Es gibt Ma e daf r wie die Varianz von den einzelnen Dimensionen ber cksichtigt wird 148 Kapitel 10 Abbildung 10 7 terationsprotokoll Yarianz ber cksichtigt Verlustfunktion Beschrankung des Zentroidko Zentroids auf die Iterationszahl Zunahme ordinaten Yektorkoordinaten 0a 4 515315 000000 5 484685 4 075583 1 409101 316 4 726009 000008 5 273991 4 273795 1 000196 a Iteration 0 zeigt die Statistik der L sung mit allen als numerisch behandelten variablen au er solchen mit dem Me niveau der optimalen Skalierung mehrfach nominal an b Der Iterationsvorgang wurde angehalten weil der Konvergenztestwert erreicht wurde Abbildung 10 8 Modellzusammenfassung Yarianz ber cksichtigt Cronbachs Gesamt Dimension Alpha Eigenwer der Varianz 1 2 Gesamtwert a Die Summe von Cronbachs Alpha basiert auf der Summe der Eigenwerte Die Eigenwerte k nnen als Anzeichen daf r verwendet werden wie viele Dimensionen erforderlich sind In diesem Beispiel wurde die Standardanzahl von Dimensionen 2 verwendet Ist das die richt
341. on Stressteil Penalisierungsteil Normalisierter Stress Stress Inach Kruskal Stress Il nach Kruskal Stress nach Young S Stress Il nach Young Erklarte Streuung Erklarte Varianz Ermittelte Bevorzungsordnungen Spearman Rho Kendall Tau b Variation der Ahnlichkeiten Variation der transformierten Ahnlichkeiten Variation der Distanzen Quadratsumme von DeSarbos Indizes f r Vermischung Shepards Index f r Nicht Degeneration 169 6427725 1900001 2 1745069 0361000 1900001 5224663 2760971 4525933 9639000 6082862 6608333 6981120 7202452 5138436 4751934 3912592 4957969 173810 Multidimensionale Entfaltung Der Algorithmus konvergiert nach 169 Iterationen bei einem endg ltigen penalisierten Stress von 0 6427725 Die Variationskoeffizienten und Shepards Index sind ausreichend gro und die Indizes nach DeSarbo ausreichend klein um den Schluss zuzulassen dass keine Degenerationsprobleme vorliegen 320 Kapitel 15 Gemeinsamer Raum Abbildung 15 29 Verbundenes Diagramm des gemeinsamen Raums 4 o Date Movies Eat ae o 2 Kiss o Game Dinner a Shout Park En Sidewalk Run o 2 E o0 c Laugh o o oe Ir y E Talk Elevator c Room Interview g e o Sleep o Bus o Belch 90 Lounge a Mumble Argue Read Restroom 3 i o Write Class 4 Church o Dimension 1 Die horizontale Dimension scheint enger mit den Spaltenobjekten Verhalten zusammenzuh ngen
342. on Numerisch Wenn mindestens eine Variable als nominal behandelt wird w hlen Sie die Konfiguration Zuf llig Kriterien Sie k nnen die H chstzahl an Iterationen festlegen die bei den Regressionsberechnungen durchlaufen werden sollen Au erdem k nnen Sie einen Wert f r das Konvergenzkriterium ausw hlen Die Regression wird abgebrochen wenn die Differenz der Gesamtanpassung zwischen den letzten zwei Iterationen kleiner als der Konvergenzwert ist oder die Maximalzahl von Iterationen erreicht wurde Diagramme beschriften mit Hiermit k nnen Sie festlegen ob in den Diagrammen Variablen und Wertlabels oder Variablennamen und Werte verwendet werden sollen Sie k nnen auch eine H chstl nge f r die Beschriftungen festlegen Kategoriale Regression Ausgabe Im Dialogfeld Ausgabe k nnen Sie die Statistiken ausw hlen die in der Ausgabe angezeigt werden sollen 22 Kapitel 2 Abbildung 2 6 Dialogfeld Ausgabe ir Kategoriale Regression Ausgabe Tabellen v Korrelationen der Originalvariablen v Koeffizienten Korrelationen der transformierten Variablen tterationsprotokoll v ANOVA Analysevariablen Kategorienquantifikationen pret package brand v price seal money Deskriptive Statistik dr Weiter Abbrechen Hite Tabellen Es werden die folgenden Tabellen erstellt Multiples R Umfa t R2 korrigierte
343. onale Entfaltung 000 cect eens 13 Seitenverh ltnis in Diagrammen mit optimaler Skalierung 2 000 0c ee eee 14 Empfohlene Literatur 2 0 ee tence nent e nent nee nen 14 2 Kategoriale Regression CATREG 16 Definieren der Skala in der kategorialen Regression 000 cece eee cece eeaee 17 Kategoriale Regression Diskretisierung 00 cece cece eee 19 Fehlende Werte in kategorialer Regression 0000 cece cence eee eee 20 Kategoriale Regression Optionen 0 00 cece teeta 21 Kategoriale Regression Ausgabe 0 cece et ent e enn ene nes 21 Kategoriale Regression Speichern 0 000 e eee eee eee 23 Kategoriale Regression Transformationsdiagramme 2 0000 e cece eee eee 23 Zus tzliche Funktionen beim Befehl CATREG 22 00 0 cece cece eee ees 24 vi 3 Kategoriale Hauptkomponentenanalyse CATPCA Skala und Gewicht definieren in CATPCA 00 cece eee Kategoriale Hauptkomponenten Diskretisierung 0 0 0 c eee ee eee eee eee Kategoriale Hauptkomponenten Fehlende Werte 0 cc cece eee eee Kategoriale Hauptkomponenten Optionen 0 00 c cece eee eee Kategoriale Hauptkomponenten Ausgabe ccc ccc cece ee eee eee eee Kategoriale Hauptkomponenten Speichern 0 0 cece eee eee eee Kategoriale Hauptkomponenten Objekt und Variablendiagramme Kategor
344. ondenzma au er H ufigkeiten eine Gewichtungsvariable mit positiven hnlichkeitswerten Sie k nnen f r Tabellendaten auch die Syntax zum Lesen der Tabelle verwenden 47 48 Kapitel 5 Annahmen Die maximale Anzahl der in der Prozedur verwendeten Dimensionen ist von der Zahl der aktiven Zeilen und Spaltenkategorien und der Anzahl der Gleichheitsbedingungen abh ngig Wenn keine Gleichheitsbedingungen verwendet werden und alle Kategorien aktiv sind ist die maximale Dimensionalit t um eins kleiner als die Anzahl der Kategorien in der Variablen mit den wenigsten Kategorien Wenn beispielsweise eine Variable ber f nf und eine andere ber vier Kategorien verf gt betr gt die maximale Anzahl an Dimensionen drei Zus tzliche Kategorien sind nicht aktiv Wenn beispielsweise eine Variable ber f nf Kategorien davon zwei Zusatzkategorien und eine andere ber vier Kategorien verf gt betr gt die maximale Anzahl an Dimensionen zwei Behandeln Sie alle Kategoriegruppen die auf Gleichheit beschr nkt sind als eine Kategorie Wenn beispielsweise eine Variable ber f nf Kategorien verf gt von denen drei auf Gleichheit beschr nkt sein m ssen muss diese Variable bei der Bestimmung der maximalen Dimensionalit t so behandelt werden als ob sie drei Kategorien besitzen w rde F r zwei der Kategorien gelten keine Nebenbedingungen und die dritte Kategorie entspricht den drei Kategorien mit der Gleichheitsbeschr nkung Wenn Sie f r
345. onen X rAusgangskonfiguration rlterationskriterien Klassisch Stress Konvergenz 000001 Berechnung nach Spearman Mindest Stress 0001 O Ross Cliff Maximalzahl der tterationen 5000 Korrespondenz Zentroide Auswahl Penalisierungsterm Mehrere Zufallsstarts St rke Anzahl Starts Bereich Anpassen r ngepasste Konfiguration variablen einlesen aus behavior_ini sav Die Anzahl muss der maximalen Dimensionalit t des Modells entsprechen Aktuell 2 Variablen mit Zeilenkoordinaten m ssen vor Variablen mit Spaltenkoordinaten stehen Verf gbar Ausgew hlt lm Abbrechen Hilfe gt W hlen Sie im Gruppenfeld Ausgangskonfiguration die Option Anpassen gt Wechseln Sie zu behavior_ini sav und w hlen Sie diese Datei als die Datei aus die die benutzerdefinierte Ausgangskonfiguration enth lt F r weitere Informationen siehe Beispieldateien in Anhang A auf S 326 gt W hlen Sie dim und dim2 als Variablen f r die Ausgangskonfiguration aus Klicken Sie auf Weiter Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf Diagramme 317 Abbildung 15 27 Dialogfeld Diagramme Multidimensionale Entfaltung Multidimensionale Entfaltung Diagramme X rDiagramme _ Mehrere Starts Anf nglicher gemeinsamer Raum Stress pro Dimension
346. onentenladungen Ohjektwerte speichern V Eut lige Anfangskonfiguration verwenden Kriterien Anzahl der tterationen 100 Konvergenz 0000 Weiter Abbrechen Hite 45 Nichtlineare kanonische Korrelationsanalyse OVERALS Anzeigen Die verf gbaren Statistiken umfassen marginale H ufigkeiten Zentroide Iterationsprotokoll Gewichte und Komponentenladungen Kategorienquantifikationen Objektwerte und einfache und mehrfache Anpassung Zentroide Kategorienquantifikationen sowie die prognostizierten und tats chlichen Mittelwerte der Objektwerte f r die in jedem Set enthaltenen Objekte F lle die zur gleichen Kategorie wie die Variable geh ren Gewichte und Komponentenladungen Der Regressionskoeffizient in jeder Dimension f r jede quantifizierte Variable in einem Set wobei f r die Objektwerte eine Regression auf die quantifizierten Variablen durchgef hrt wird sowie die Projektion der quantifizierten Variablen im Objektraum Liefert einen Hinweis ber den Beitrag den jede Variable zu der Dimension innerhalb eines Sets liefert m Einfache und mehrfache Anpassung Ma e f r die Anpassungsg te der einfachen und multiplen Kategorienkoordinaten bzw Kategorienquantifizierungen hinsichtlich der Objekte m Kategorienquantifikationen Zuordnung optimaler Skalenwerte zu den Kategorien einer Variablen m Objektwerte Der optimale Wert Score der einem Obje
347. onentenwerte auf der Grundlage der quantifizierten Daten Diagramme der Komponentenwerte lassen Muster in Bezug auf die Objekte in der Analyse sichtbar werden und k nnen ungew hnliche Objekte in den Daten kenntlich machen Die L sung einer kategorialen Hauptkomponentenanalyse maximiert die Korrelationen der Objektwerte mit den einzelnen quantifizierten Variablen f r die Anzahl der angegebenen Komponenten Dimensionen Eine wichtige Anwendung der kategorialen Hauptkomponentenanalyse ist die Untersuchung von Pr ferenzdaten bei der die Befragten eine Reihe von Items nach Ihrer Pr ferenz einstufen oder bewerten Bei der blichen SPSS Datenkonfiguration stellen die Zeilen Einzelwerte und die Spalten Ma e f r die Items dar Die zeilen bergreifenden Scores sind Pr ferenzscores beispielsweise auf einer Skala von 0 bis 10 Dadurch werden die Daten zeilenabh ngig Bei Pr ferenzdaten kann es sinnvoll sein die Einzelwerte als Variablen zu behandeln Mit der Prozedur Transponieren k nnen Sie die Daten transponieren Die Bewerter werden die Variablen und alle Variablen werden als ordinal deklariert In CATPCA k nnen problemlos mehr Variablen als Objekte verwendet werden Beziehung zu anderen Prozeduren von Categories Wenn alle Variablen als mehrfach nominal deklariert werden f hrt die kategoriale Hauptkomponentenanalyse zu einer Analyse die einer Mehrfachkorrespondenzanalyse die f r dieselben Variablen durchgef hrt wurde entspricht Dah
348. onsdiagramme Daten Mit CATREG werden Kategorienummervariablen verarbeitet Diese Kategorienummern m ssen positive Ganzzahlen sein Im Dialogfeld Diskretisierung k nnen Sie Variablen mit Dezimalbr chen und String Variablen in positive Ganzzahlen umwandeln 16 17 Kategoriale Regression CATREG Annahmen Es ist nur eine Antwortvariable zul ssig die maximale Anzahl der Einflussvariablen betr gt jedoch 200 Die Daten m ssen mindestens drei g ltige F lle enthalten Die Anzahl g ltiger F lle muss die Anzahl der Einflussvariablen plus eins bersteigen Verwandte Prozeduren CATREG entspricht der kategorialen kanonischen Korrelationsanalyse mit optimaler Skalierung OVERALS und zwei Sets von denen ein Set jeweils nur eine Variable enth lt Eine Skalierung aller Variablen auf numerischem Niveau entspricht der normalen Mehrfachregressionsanalyse So lassen Sie eine kategoriale Regression berechnen W hlen Sie die folgenden Befehle aus den Men s aus Analysieren Regression Optimale Skalierung Abbildung 2 1 Dialogfeld Kategoriale Regression Kategoriale Regression Yariable i In diskrete umwandeln Abhangige amp Standardized Residu pref Spline ordinal 2 2 Fehlende Verte Skala definieren Optionen Unabh ngige Yariable n me package Spline ordinal 2 2 SS brand Spline ordinal 2 2 Speichern price Spline ordin
349. orialen Hauptkomponentenanalyse 33 147 170 Variationskoeffizient in Multidimensionale Entfaltung 293 296 302 309 319 Verbundene Kategoriendiagramme bei der Mehrfachkorrespondenzanalyse 66 in der Kategorialen Hauptkomponentenanalyse 37 Verbundenes Diagramm der individuellen R ume in Multidimensionale Entfaltung 304 311 Verbundenes Diagramm des gemeinsamen Raums in Multidimensionale Entfaltung 294 297 303 310 320 324 Verlustwerte in Nichtlineare kanonische Korrelationsanalyse 200 Wichtigkeit in Kategoriale Regression 111 Zeilenprinzipal Normalisierung in der Korrespondenzanalyse 217 Zeilenwertdiagramme in der Korrespondenzanalyse 241 252 Zeilenwerte in der Korrespondenzanalyse 225 Zentroide in Nichtlineare kanonische Korrelationsanalyse 44 207 Zusatzobjekte in Kategoriale Regression 21 Zusatzpunkte in der Korrespondenzanalyse 228 Index
350. orrelationen die partiellen Korrelationen und die Teilkorrelationen ber cksichtigt werden Die nachstehende Tabelle zeigt diese korrelationalen Messwerte f r die einzelnen Variablen Die Korrelation nullter Ordnung ist die Korrelation zwischen der transformierten Einflu gr e und der transformierten Antwort Bei diesen Daten besteht die gr te Korrelation bei Package design Wenn Sie jedoch einen Teil der Variation bei der Einflu gr e oder der Antwort erkl ren k nnen erhalten Sie einen besseren Einblick inwieweit die Einflu gr e ihren Zweck erf llt 112 Kapitel 9 Abbildung 9 20 Korrelationen nullter Ordnung Teilkorrelationen und partielle Korrelationen transformierte Variablen Korrelationen Toleranz Nach Vor Nullte Transfor Transfor Ordnung Partiell Teil Wichtigkeit mation mation Package design Brand name Price Good Housekeeping seal Money back guarantee Abh ngige Yariable Preference Andere Variablen im Modell k nnen die Wichtigkeit einer gegebenen Einflu gr e bei der Vorhersage der Antwort durcheinanderbringen Der partielle Korrelationskoeffizient beseitigt die linearen Auswirkungen anderer Einflu gr en sowohl aus der Einflu gr e als auch aus der Antwort Diese Messzahl entspricht der Korrelation zwischen den Residuen aus der Regression der Einflu gr en ber die anderen Einflu gr en und den Residuen aus der Regression der Antwort ber die anderen Einflu gr en Di
351. ost often haupts chlich in der ersten Dimension erfolgt die Diskrimination der Variablen Marital status dagegen nahezu vollst ndig in der zweiten Dimension Die Kategorien von Newspaper read most often sind also in der ersten Dimension weiter voneinander entfernt als in der zweiten f r Marital status gilt dagegen der umgekehrte Fall Im Gegensatz dazu findet die Diskrimination von Age in years sowohl in der ersten als auch in der zweiten Dimension statt die Streuung der Kategorien ist daher in beiden Dimensionen gleich Komponentenladungen Die nachstehende Abbildung zeigt das Diagramm der Komponentenladungen f r die Untersuchungsdaten Wenn keine Daten fehlen sind die Komponentenladungen identisch mit den Pearson Korrelationen zwischen den quantifizierten Variablen und den Objektwerten Die Distanz vom Ursprung zu den einzelnen Variablenpunkten ist etwa gleich der Wichtigkeit dieser Variable Die kanonischen Variablen werden nicht in das Diagramm aufgenommen k nnen jedoch mit horizontalen und vertikalen Linien durch den Ursprung dargestellt werden Abbildung 11 17 Komponentenladungen 0 75 Pets owned o 0 50 0 25 N Age in years c 2 0 00 E a 0 25 Newspaper read most often o Music preferred 0 50 g bach preference Pets owned o Marital status 0 75 0 5 0 0 0 5 1 0 Dimension 1 Die Beziehungen zwischen den Variablen sind offensichtlich Zwei Richtungen fallen nicht mit der horizontalen oder vertikalen
352. ountry Neighborhood preference Im Gegensatz dazu deuten die Quantifikationen f r Newspaper read most often auf einen ansteigenden Trend in den drei Kategorien hin in denen beobachtete F lle vorliegen Die erste Kategorie erh lt die niedrigste Quantifikation die zweite Kategorie den n chsth heren Wert und 205 Nichtlineare kanonische Korrelationsanalyse die dritte Kategorie schlie lich die h chste Quantifikation Die Variable wird zwar als nominal skaliert die Reihenfolge der Kategorien wird jedoch in den Quantifikationen beibehalten Abbildung 11 19 Transformationsdiagramm f r Newspaper read most often nominal i 10 a Qa 5 Qa u 3 0 5 z 5 gt 5 E o6 0 0 oh Bo SE EU 05 Boe OA c o of a o c 2 1 0 7 o a a u gi x None Telegraaf Volkskrant NRC Other Newspaper read most often Abbildung 11 20 Transformationsdiagramm f r Age in years ordinal 21 1 871 Kategorienquantifikationen von Age in years o a l 06 oe 8 r 20 25 26 30 31 35 36 40 41 45 46 50 51 55 56 60 61 65 66 70 Age in years Das Transformationsdiagramm f r Age in years zeigt eine S f rmige Kurve Die vier beobachteten Kategorien mit dem niedrigsten Alter erhalten jeweils dieselbe negative Quantifikation die beiden Kategorien mit dem h chsten Alter dagegen hnliche positive Werte In diesem Fall k nnten die niedrigeren Altersgruppen in einer gemeinsamen Kategorie z B unt
353. ozialwissenschaftlichen Fakult t der Universit t Leiden besteht Was ist optimale Skalierung Der Sinn der optimalen Skalierung ist es den Kategorien jeder Variablen numerische Quantifizierungen zuzuweisen und dadurch zu erm glichen dass Standardprozeduren verwendet werden k nnen um eine L sung f r die quantifizierten Variablen zu erhalten Die optimalen Skalenwerte werden den Kategorien der einzelnen Variablen anhand des Optimierungskriteriums f r die verwendete Prozedur zugewiesen Anders als die urspr nglichen Labels der nominalen oder ordinalen Variablen in der Analyse haben diese Skalenwerte metrische Eigenschaften In den meisten Prozeduren in Categories wird die optimale Quantifizierung f r die einzelnen skalierten Variablen ber eine iterative Methode alternierende kleinste Quadrate genannt erzielt bei der zun chst die aktuellen Quantifizierungen verwendet werden um eine L sung zu finden und dann die Quantifizierungen anhand dieser L sung aktualisiert werden Anschlie end werden die aktualisierten Quantifizierungen verwendet um eine neue L sung zu finden anhand derer wiederum die Quantifizierungen aktualisiert werden usw Dieser Vorgang wird fortgesetzt bis ein Stopp Kriterium erreicht wird Warum sollte optimale Skalierung verwendet werden Kategoriale Daten finden sich oft bei der Marktforschung der Auswertung von Umfragen und in der Sozial und Verhaltensforschung Zahlreiche Forscher haben fast ausschlie lic
354. patient_los sav Diese hypothetische Datendatei enth lt die Behandlungsaufzeichnungen zu Patienten die wegen des Verdachts auf Herzinfarkt in das Krankenhaus eingeliefert wurden Jeder Fall entspricht einem Patienten und enth lt diverse Variablen in Bezug auf den Krankenhausaufenthalt 333 Beispieldateien patlos_sample sav Diese hypothetische Datendatei enth lt die Behandlungsaufzeichnungen f r eine Stichprobe von Patienten denen w hrend der Behandlung eines Herzinfarkts Thrombolytika verabreicht wurden Jeder Fall entspricht einem Patienten und enth lt diverse Variablen in Bezug auf den Krankenhausaufenthalt polishing sav Hierbei handelt es sich um die Datendatei Nambeware Polishing Times aus der Data and Story Library Sie bezieht sich auf die Bem hungen eines Herstellers von Metallgeschirr Nambe Mills Santa Fe New Mexico zur zeitlichen Planung seiner Produktion Jeder Fall entspricht einem anderen Artikel in der Produktpalette F r jeden Artikel sind Durchmesser Polierzeit Preis und Produkttyp erfasst poll_cs sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um Bem hungen geht die ffentliche Unterst tzung f r einen Gesetzentwurf zu ermitteln bevor er im Parlament eingebracht wird Die F lle entsprechen registrierten W hlern F r jeden Fall sind County Gemeinde und Wohnviertel des W hlers erfasst poll_cs_sample sav Diese hypothetische Datendatei enth lt eine Stichprobe der in
355. pliziert und gerundet Anschlie end wird eine Konstante zu den Werten addiert sodass der niedrigste diskretisierte Wert 1 betr gt Gruppieren Folgende Optionen sind bei der Diskretisierung von Variablen durch Gruppierung verf gbar m Anzahl Kategorien Geben Sie eine Anzahl von Kategorien an Legen Sie au erdem fest ob die Werte der Variablen ber die Kategorien ungef hr normal oder gleichverteilt werden sollen m Gleiche Intervalle Die Variablen werden in Kategorien umkodiert die durch diese gleich gro en Intervalle definiert werden Sie m ssen die Gr e der Intervalle angeben 60 Kapitel 6 Mehrfachkorrespondenzanalyse Fehlende Werte Im Dialogfeld Kategoriale Hauptkomponenten Fehlende Werte k nnen Sie die Strategie f r die Verarbeitung von fehlenden Werten in den Analyse und Zusatzvariablen festlegen Abbildung 6 5 Dialogfeld Fehlende Werte MCA Fehlende Werte Strategie f r fehlenden Wert Analysevariablen kopf Verte ausschlie en Modalwert kerbe VVerte ausschlie en Modalwert form VVerte ausschlie en Modalwert l nge Verte ausschlie en Modalwert messing VVerte ausschlie en Modalwert Zusatzyariablen Fehlende Werte ausschlie en f r Korrelationen nach Quantifizierung vorschreiben Strategie G Modalwert _ Zusatzkategorie Fehlende Werte vorschreiben 3 Objekte mit fehlenden Werten f r diese Variable ausschlie en Abb
356. ppe und Rauchen Dimensionen Im Idealfall sollte eine Korrespondenzanalysenl sung erstellt werden die die Beziehung zwischen den Zeilen und Spaltenvariablen in so wenigen Dimensionen wie m glich zeigt H ufig empfiehlt es sich jedoch die H chstanzahl der Dimensionen zu betrachten um so den relativen Beitrag der einzelnen Dimensionen zu erkennen Die maximal zul ssige Anzahl an Dimensionen f r eine Korrespondenzanalysenl sung entspricht der Anzahl der aktiven Zeilen minus 1 bzw der Anzahl der aktiven Spalten minus 1 niedrigerer Wert ma geblich Eine Zeile oder Spalte gilt als aktiv wenn eine eindeutige Wertegruppe f r diese Zeile bzw Spalte existiert Erg nzende Zeilen oder Spalten sind nicht aktiv Im vorliegenden Beispiel ist die maximale Anzahl an Dimensionen gleich min 5 4 1 3 Die erste Dimension zeigt den gr tm glichen Anteil an Tr gheit Messwert f r die Variation in den Daten die zweite Dimension verl uft orthogonal zur ersten und zeigt den gr tm glichen Anteil an der verbleibenden Tr gheit usw Die Gesamttr gheit kann in Komponenten aufgeteilt und dann den einzelnen Dimensionen zugeordnet werden Anschlie end k nnen Sie die Tr gheit 222 Kapitel 12 Biplot einer bestimmten Dimension mit der Gesamttr gheit vergleichen und so die Dimensionstr gheit auswerten Beispiel Die erste Dimension zeigt 87 8 0 075 0 085 der Gesamttr gheit die zweite Dimension dagegen nur 11 8 0 010 0 085
357. ptimal in der angegebenen Dimensionalit t quantifiziert Aufgrund dessen k nnen nichtlineare Beziehungen zwischen Variablen modelliert werden Beispiel Eine kategoriale Hauptkomponentenanalyse lie e sich verwenden um den Zusammenhang zwischen Berufsgruppe beruflicher Stellung Region Anzahl von Dienstreisen hoch mittel und gering und der Zufriedenheit im Beruf grafisch darzustellen Das Ergebnis k nnte sein dass ein Gro teil der Varianz mit zwei Dimensionen erkl rt werden kann In der ersten Dimension lie en sich Berufsgruppe von Region trennen und in der zweiten Dimension k nnten berufliche Stellung und H ufigkeit von Dienstreisen getrennt werden Au erdem k nnte sich ein Zusammenhang zwischen hoher Zufriedenheit im Beruf und einer mittleren H ufigkeit von Dienstreisen ergeben Statistiken und Diagramme H ufigkeiten fehlende Werte Messniveau der optimalen Skalierung Modalwert ber cksichtige Varianz nach Koordinaten der Zentroiden Vektorkoordinaten Gesamtsumme pro Variable und Dimension Komponentenladungen f r vektorquantifizierte Variablen Quantifikationen und Koordinaten der Kategorien Iterationsprotokoll Korrelationen der transformierten Variablen und Eigenwerte der Korrelationsmatrix Korrelationen der urspr nglichen Variablen und Eigenwerte der Korrelationsmatrix Objektwerte Diagramme der Kategorien und verkn pften Kategorien Transformationsdiagramme Residuen Diagramme Diagramme der projizierten Zentroide Ob
358. ptimaler Skalierung vermerkt ist und dann eine Tabelle aus der die H ufigkeit der Objekte in den Kategorien hervorgeht Diese Tabelle ist besonders wichtig wenn Daten fehlen weil nahezu leere Kategorien die L sung eher dominieren In diesem Beispiel fehlen keine Daten Bei einer zweiten Vorab berpr fung untersuchen Sie ob Ausrei er im Diagramm der Objektwerte vorliegen Die Quantifikationen von Ausrei ern weichen so deutlich von anderen Objekten ab dass diese Elemente an den Grenzen des Diagramms liegen und so eine oder auch mehrere Dimensionen dominieren Bei Ausrei ern stehen zwei M glichkeiten zur Auswahl Sie k nnen die Ausrei er schlicht aus den Daten entfernen und dann die nichtlineare kanonische Korrelationsanalyse wiederholen Sie k nnen die extremen Antworten der Ausrei erobjekte aber auch umkodieren indem Sie einige Kategorien zusammenfassen zusammenf hren Aus dem Diagramm der Objektwerte geht hervor dass keine Ausrei er f r die Untersuchungsdaten vorhanden sind Abbildung 11 12 Objektwerte 1 O N c 0 E E a 14 2 1 0 1 2 Dimension 1 Falle gewichtet nach Anzahl der Objekte Beriicksichtigen der Ahnlichkeiten zwischen Sets Der Zusammenhang zwischen den Sets in einer nichtlinearen kanonischen Korrelationsanalyse kann auf verschiedene Weise gemessen werden die Ergebnisse werden dabei jeweils in einer separaten Tabelle oder Gruppe von Tabellen aufgef hrt 200 Kapi
359. r bereinstimmungen zwischen den Objekten interessiert sind m Symmetrisch Verwenden Sie diese Normalisierungsmethode wenn Sie haupts chlich an den Beziehungen zwischen den Objekten und den Variablen interessiert sind m Unabh ngig Verwenden Sie diese Normalisierungsmethode wenn Sie die Distanzen zwischen den Objekten und die Korrelationen zwischen den Variablen getrennt untersuchen m chten m Benutzerdefiniert Sie k nnen einen beliebigen reellen Wert aus dem abgeschlossenen Intervall 1 1 eingeben Der Wert 1 entspricht der Methode Objektprinzipal der Wert 0 der Methode Symmetrisch und der Wert 1 der Methode Variablenprinzipal Bei Werten gr er als 1 und kleiner als 1 wird der Eigenwert sowohl ber Objekte als auch Variablen gestreut Mit dieser Methode k nnen Sie Biplots und Triplots genau an Ihre Bed rfnisse anpassen Kriterien Sie k nnen die maximale Anzahl von Iterationen festlegen die in der Prozedur bei den Berechnungen durchlaufen werden Au erdem k nnen Sie einen Wert f r das Konvergenzkriterium ausw hlen Die Prozedur wird abgebrochen wenn die Differenz der Gesamtanpassung zwischen den letzten zwei Iterationen kleiner als der Konvergenzwert ist oder die Maximalzahl von Iterationen erreicht wurde Diagramme beschriften mit Hiermit k nnen Sie festlegen ob in den Diagrammen Variablen und Wertlabels oder Variablennamen und Werte verwendet werden sollen Sie k nnen auch eine H chstl
360. r in der Analyse und in den Gleichheitsbeschr nkungen verwendeten aktiven Kategorien ab Die maximale Anzahl an Dimensionen ist jeweils der kleinere von folgenden Werten m Die Anzahl der aktiven Zeilenkategorien minus der Anzahl der Zeilenkategorien die gleich sein m ssen plus der Anzahl der eingeschr nkten Zeilenkategoriengruppen m Die Anzahl der aktiven Spaltenkategorien minus der Anzahl der Spaltenkategorien die gleich sein m ssen plus der Anzahl der eingeschr nkten Spaltenkategoriengruppen Distanzma Sie k nnen das Distanzma f r Zeilen und Spalten der Korrespondenztabelle ausw hlen W hlen Sie eine der folgenden Optionen m Chi Quadrat Verwendet eine gewichtete Profildistanz wobei die Gewichtung der Masse der Zeilen oder Spalten entspricht Dieses Ma ist f r die Standard Korrespondenzanalyse erforderlich m Euklidisch Verwendet die Quadratwurzel der Summe aus den quadrierten Differenzen von Zeilen und Spaltenpaaren Standardisierungsmethode W hlen Sie eine der folgenden Optionen Zeilen und Spaltenmittel werden entfernt Sowohl Zeilen als auch Spalten werden zentriert Diese Methode ist f r die Standard Korrespondenzanalyse erforderlich Zeilenmittel werden entfernt Nur die Zeilen werden zentriert m Spaltenmittel werden entfernt Nur die Spalten werden zentriert 52 Kapitel 5 Zeilensummen werden angeglichen und Mittelwerte entfernt Vor dem Zentrieren der Zeilen werden die
361. r optimalen Skalierung verwendet Beide Variablen werden hinsichtlich ihrer nominalen Informationen untersucht Es wird also nur die Tatsache ber cksichtigt dass sich einige Objekte in derselben Kategorie befinden andere jedoch nicht ber die Distanz oder die Reihenfolge der verschiedenen Kategorien derselben Variablen werden keine Annahmen gemacht Eine spezielle Verwendung der Korrespondenzanalyse besteht in der Analyse von zweidimensionalen Kontingenztafeln Wenn eine Tabelle r aktive Zeilen und c aktive Spalten aufweist betr gt die Anzahl der Dimensionen in der Korrespondenzanalyse mindestens d r minus 1 bzw c minus 1 der kleinere der beiden Werte wird verwendet Anders 11 Einf hrung in die Prozeduren f r die optimale Skalierung von kategorialen Daten ausgedr ckt Die Zeilen oder Spaltenkategorien einer Kontingenztafel k nnten perfekt in einem mehrdimensionalen Raum dargestellt werden In der Praxis w rde man jedoch die Zeilen und Spaltenkategorien einer zweidimensionalen Tabelle in einem Raum mit wenigen beispielsweise zwei Dimensionen darstellen wollen da zweidimensionale Diagramme leichter verst ndlich sind als mehrdimensionale r umliche Darstellungen Wenn weniger als die H chstzahl der m glichen Dimensionen verwendet werden beschreibt die in der Analyse erstellte Statistik wie gut die Zeilen und Spaltenkategorien in der flachdimensionierten Darstellung repr sentiert werden Vorausgesetzt die Darstellung der
362. ransformierten hnlichkeiten zwischen den Objekten in der Konfiguration an Eingabedaten Schlie t die urspr nglichen hnlichkeiten und sofern vorhanden die Datengewichtungen die Ausgangskonfiguration und die festen Koordinaten der unabh ngigen Variablen ein Stress f r Zufallstarts Zeigt den Startwert f r Zufallszahlen und den normalisierten Roh Stress Wert f r jeden Zufallsstart an Iterationsprotokoll Zeigt das Iterationsprotokoll des Hauptalgorithmus an 84 Kapitel 7 Multiple Stressma e Zeigt verschiedene Stress Werte an Die Tabelle enth lt Werte f r normalisierten Roh Stress Stress I Stress II S Stress erkl rte Streuung und den Kongruenzkoeffizienten nach Tucker Stress Zerlegung Zeigt eine Objekte und Quellenzerlegung des endg ltigen normalisierten Roh Stress einschlie lich des Durchschnitts pro Objekt und des Durchschnitts pro Quelle an Transformierte unabh ngige Variablen Wenn eine Einschr nkung der linearen Kombination ausgew hlt wurde werden die transformierten unabh ngigen Variablen und die entsprechenden Regressionsgewichtungen angezeigt Variablen und Dimensionskorrelationen Wenn eine Einschr nkung der linearen Kombination ausgew hlt wurde werden die Korrelationen zwischen den unabh ngigen Variablen und den Dimensionen des gemeinsamen Raums angezeigt In neuer Datei speichern Sie k nnen die Koordinaten des gemeinsamen Raums die individuellen Raumgewichtungen die Distanzen die
363. ransformierten Bevorzugung durch die Regression der optimal transformierten Einflu gr en erkl rt werden Durch Transformieren der Einflu gr en erzielen Sie eine h here Anpassungsg te im Vergleich zum Standardverfahren Abbildung 9 18 Modellzusammenfassung f r kategoriale Regression Korrigiertes Multiples R R Quadrat R Quadrat Abh ngige Variable Preference Einflu variablen Package design Brand name Price Good Housekeeping seal Money back guarantee 111 Kategoriale Regression Die nachstehende Tabelle zeigt die standardisierten Regressionskoeffizienten Bei der kategorialen Regression werden die Variablen standardisiert aus diesem Grund werden nur standardisierte Koeffizienten zur ckgegeben Diese Werte werden durch die zugeh rigen Standardfehler dividiert und ergeben so jeweils einen F Test f r die einzelnen Variablen Der Test f r jede Variable ist allerdings davon abh ngig dass die anderen Einflu gr en im Modell vorliegen Mit dem Test wird also ermittelt ob das Auslassen einer Einflu variable aus dem Modell w hrend alle anderen Einflu gr en vorhanden sind zu einer deutlichen Verschlechterung der Vorhersagefunktionen des Modells f hren w rde Diese Werte sollten nicht beim Auslassen mehrerer Variablen gleichzeitig f r ein nachfolgendes Modell verwendet werden Alternierende kleinste Quadrate optimieren zudem die Quantifikationen dies impliziert dass diese Tests auf konservative Weise interpret
364. rd dieser Maximalwert erreicht bedeutet dies dass die Beziehung perfekt ist Der durchschnittliche Verlustwert ber die S tze und Dimensionen zeigt die Differenz zwischen der maximalen Anpassung und der tats chlichen Anpassung Die Summe aus Anpassung und durchschnittlichem Verlust ist gleich der Anzahl der Dimensionen Eine perfekte hnlichkeit liegt nur selten vor und konzentriert sich in der Regel nur auf triviale Aspekte in den Daten Die kanonische Korrelation ist eine weitere beliebte Statistik mit zwei Variablen Sets Die kanonische Korrelation h ngt mit dem Eigenwert zusammen und liefert somit keine zus tzlichen Informationen daher wird diese Korrelation nicht in der Ausgabe der nichtlinearen kanonischen Korrelationsanalyse aufgef hrt Bei zwei Variablen Sets wird die kanonische Korrelation pro Dimension mit der folgenden Formel berechnet Pd 2x Eg 1 Hierbei gilt d ist die Anzahl der Dimensionen und ist der Eigenwert Mit der folgenden Formel k nnen Sie die kanonische Korrelation f r mehr als zwei Sets verallgemeinern pa K x Ea 1 K 1 201 Nichtlineare kanonische Korrelationsanalyse Hierbei gilt d ist die Anzahl der Dimensionen X ist die Anzahl der Sets und E ist der Eigenwert Im obigen Beispiel p 3 x 0 801 1 2 0 702 und p2 3 x 0 735 1 2 0 603 Gewichte und Komponentenladungen Als weiteres Zusammenhangsma steht au erdem die Mehrfachkorrelation zwischen
365. rechen Hite Strategie f r fehlenden Wert Fehlende Werte k nnen ausgeschlossen Passivbehandlung oder vorgeschrieben Aktivbehandlung werden oder Objekte mit fehlenden Werten k nnen ausgeschlossen werden listenweiser Fallausschluss m Fehlende Werte ausschlie en f r Korrelationen nach Quantifizierung vorschreiben Objekte mit fehlenden Werten bei der ausgew hlten Variablen tragen nicht zur Analyse dieser Variablen bei Wenn alle Variablen passiv behandelt werden werden Objekte mit fehlenden Werten f r alle Variablen als Zusatzobjekte behandelt Wenn im Dialogfeld Kategoriale Hauptkomponenten Ausgabe Korrelationen ausgew hlt sind werden fehlende Werte nach der Analyse anhand der h ufigsten Variablenkategorie Modalwert f r die Korrelationen der urspr nglichen Variablengesetzt Sie k nnen die Methode ausw hlen nach der Werte f r die Korrelationen der optimal skalierten Variablen gesetzt werden Wenn Sie Modalwert ausw hlen werden fehlende Werte durch den Modalwert der optimal skalierten Variablen ersetzt Wenn Sie Zusatzkategorie ausw hlen werden fehlende Werte durch die Quantifikation einer zus tzlichen Kategorie ersetzt Dies bedeutet aber auch dass Objekte mit einem fehlenden Wert f r diese Variable als zur gleichen Kategorie der zus tzlichen zugeh rig betrachtet werden 61 Mehrfachkorrespondenzanalyse m Fehlende Werte ersetzen Fehlende Werte werden bei Objekten mit fehlenden Werten f r
366. respondence analysis handbook New York Marcel Dekker Bishop Y M S E Feinberg als auch P W Holland 1975 Discrete multivariate analysis Theory and practice Cambridge Massachusetts MIT Press Blake C L als auch C J Merz 1998 UCI Repository of machine learning databases Available at http www ics uci edu mlearn MLRepository html Breiman L als auch J H Friedman 1985 Estimating optimal transformations for multiple regression and correlation Journal of the American Statistical Association 80 580 598 Buja A 1990 Remarks on functional canonical variates alternating least squares methods and ACE Annals of Statistics 18 1032 1069 Busing F M T A P J F Groenen als auch W J Heiser 2005 Avoiding degeneracy in multidimensional unfolding by penalizing on the coefficient of variation Psychometrika 70 71 98 Carroll J D 1968 Generalization of canonical correlation analysis to three or more sets of variables In Proceedings of the 76th Annual Convention of the American Psychological Association 3 Washington D C American Psychological Association 227 228 Collett D 2003 Modelling survival data in medical research 2 Hg Boca Raton Chapman amp Hall CRC Commandeur J J F als auch W J Heiser 1993 Mathematical derivations in the proximity scaling PROXSCAL of symmetric data matrices Leiden Department of Data Theory Universitat Leiden De Haas M J A Algera H
367. rhergesagte Antwort pro nderung in der Standardabweichung in einer Einflu gr e ndert wenn alle anderen Einflu gr en konstant bleiben Eine nderung um eine Standardabweichung in Brand name f hrt zu einer h heren vorhergesagten Bevorzugung von 0 056 Standardabweichungen Die Standardabweichung f r Preference ist 6 44 Preference steigt somit um 0 056 x 6 44 0 361 nderungen an Package design bewirken die gr ten nderungen bei der vorhergesagten Bevorzugung Residuen Streudiagramme Abbildung 9 6 Residuen im Vergleich zu vorhergesagten Werten Abh ngige Variable Preference Regression Standardisiertes Residuum N 2 1 0 1 Regression Standardisierter gesch tzter Wert Die standardisierten Residuen werden anhand der standardisierten vorhergesagten Werte geplottet Bei einer hohen Anpassungsg te des Modells sollten keine Muster entstehen Hier ist eine U Form sichtbar bei der sowohl hohe als auch niedrige standardisierte vorhergesagte Werte positive Residuen besitzen Die standardisierten vorhergesagten Werte nahe 0 weisen eher negative Werte auf Zum Erstellen eines Streudiagramms der Residuen nach der Einflu gr e Package design w hlen Sie die folgenden Befehle aus den Men s aus Grafiken Diagrammerstellung 103 Kategoriale Regression Abbildung 9 7 Diagrammerstellung E Diagrammerstellung Variablen Ae amp package desi Pobrand name orice price Sb Good Housek
368. riablen werden verwendet um alle m glichen Markierungen zu durchlaufen Diagramme der Quellen F r Individueller Raum Streudiagramm der Anpassung und Residuen Diagramme sowie falls Transformationen nach Quellen angewendet werden f r Transformationsdiagramme und Shepard Diagramme k nnen Sie angeben f r welche Quellen Diagramme erstellt werden sollen Die eingegebenen Quellennummern m ssen Werte der im Hauptdialogfeld angegebenen Quellenvariable sein und im Bereich von 1 bis zur Anzahl der Quellen liegen Zeilendiagramme Wenn Transformationen f r Zeilen erfolgen k nnen Sie f r Transformationsdiagramme und Shepard Diagramme die Zeile angeben f r die die Diagramme erstellt werden sollen Die eingegebenen Zeilenanzahl muss im Bereich von 1 bis zur Anzahl der Zeilen liegen Multidimensionale Entfaltung Ausgabe Im Dialogfeld Ausgabe k nnen Sie die angezeigte Ausgabe steuern und Ausz ge davon in eigenen Dateien speichern 94 Kapitel 8 Abbildung 8 6 Dialogfeld Ausgabe E Multidimensionale Entfaltung Ausgabe Anzeige Eingabedaten _ tterationsprotokoll V Endg ltiger gemeinsamer Raum v Anpassungsmabe Anfangliche Daten _ Stress Zerlegung _ Transformierte hnlichkeiten Angepasste Distanzen In neuer Datei speichern Gemeinsame Raumkoordinaten Distanzen Transformierte hnlichkeiten Weiter
369. riablenprinzipal z Erster Letzter ae Kriterien Einzelner Fall Konvergenz 00001 Maximalzahl der Itterationen 100 Diagramme beschriften mit 3 Variablen oder WVertelabels G Variablennamen oder Werte Diagrammdimensionen Alle Dimensionen in der L sung anzeigen Anzahl der Dimensionen beschr nken Konfiguration Keine z Weiter J Abbrechen Zusatzobjekte Geben Sie die Fallnummer des Objekts bzw die erste und letzte Fallnummer einer Reihe von Objekten an die als Zusatzobjekte deklariert werden sollen und klicken Sie dann auf Hinzuf gen Wiederholen Sie diesen Vorgang bis Sie alle Zusatzobjekte festgelegt haben Wenn ein Objekt als Zusatzobjekt deklariert ist werden Fallgewichtungen f r das Objekt ignoriert Normalisierungsmethode Sie k nnen eine von f nf Optionen f r die Normalisierung der Objektwerte und Variablen ausw hlen In einer Analyse kann nur eine Normalisierungsmethode gleichzeitig verwendet werden m Variablenprinzipal Bei dieser Option wird die Assoziation zwischen Variablen optimiert Die Komponentenladungen Korrelationen mit Hauptkomponenten wie Dimensionen und Objektwerten stellen die Koordinaten der Variablen im Objektraum dar Dies ist n tzlich wenn Sie haupts chlich an der Korrelation zwischen den Variablen interessiert sind m Objektprinzipal Bei dieser Option werden die Distanzen zwischen den Objekten optimiert Dies
370. richtet dass es die Ergebnisse der Tabelle der projizierten Zentroide in die Datei projected_centroids sav schreibt gt Um aus diesem Daten Set Ausgaben f r die kategoriale Hauptkomponentenanalyse zu erstellen w hlen Sie folgende Befehle aus den Men s aus Analysieren Dimensionsreduktion Optimale Skalierung 160 Kapitel 10 Abbildung 10 21 Dialogfeld Optimale Skalierung Messniveau der optimalen Skalierung O Alle Yariablen sind mehrfach nominal Einige variablen sind nicht mehrfach nominal Anzahl der Variablen Sets G Ein Set Mehrere Sets Ausgew hlte Analyse Mehrfachkorrespondenzanalyse Kategoriale Hauptkomponenten Nichtlineare kanonische Korrelation W hlen Sie im Gruppenfeld Messniveau der optimalen Skalierung die Option Einige Variablen sind nicht mehrfach nominal Klicken Sie auf Definieren Abbildung 10 22 Dialogfeld Kategoriale Hauptkomponenten Analysevariablen fi Zeit des Interviews time amp Diagnose diag In diskrete umwandeln amp Zeit Diagnose Wiechsel amp Patienten Nummer num amp Diagnose diag2 time2 gt Dimensionen in der L sung Optionen Ausgabe Speichern 5 Skala und Gewicht definieren Zusatzvariablen bj o Skala definieren Beschriftungsvariablen Kategorie O W hlen Sie Body Weight K rpergewicht bis Body perception
371. rital status als Variablen f r das erste Set W hlen Sie age aus und klicken Sie auf Bereich und Skala definieren Abbildung 11 3 Dialogfeld Bereich und Skala definieren E OVERALS Bereich und Skala definieren E3 Minimum 1 Maximum Ordinal Mehrfach nominal Einzeln nominal Diskret numerisch gt Geben Sie 10 als H chstwert f r diese Variable ein Klicken Sie auf Weiter W hlen Sie im Dialogfeld Nichtlineare kanonische Korrelationsanalyse die Variable marital aus und klicken Sie auf Bereich und Skala definieren 195 Abbildung 11 4 Nichtlineare kanonische Korrelationsanalyse Dialogfeld Bereich und Skala definieren Minimum 1 Maximum EA OVERALS Bereich und Skala definieren X Messniveau Ordinal Mehrfach nominal Diskret numerisch Klicken Sie auf Weiter vy v v y Geben Sie 3 als H chstwert f r diese Variable ein W hlen Sie Einzeln nominal als Messniveau aus Klicken Sie im Dialogfeld Nichtlineare kanonische Korrelationsanalyse auf Weiter um das n chste Variablen Set zu definieren Abbildung 11 5 Dialogfeld Nichtlineare kanonische Korrelationsanalyse amp Musikgeschmack music amp Bevorzugte Wohngegend live cil Ergebnis Mathematiktest math al Ergebnis Sprachtest language E Nichtlineare kanonische Korrelationsanalyse OVERALS X Yariablen news 1 Ordinal
372. rmationstyp bestimmt Variablen die als numerisch behandelt werden f hren zu einer linearen Beziehung zwischen den Quantifikationen und den urspr nglichen Kategorien Im Transformationsdiagramm wird dies als gerade Linie dargestellt Die Reihenfolge der urspr nglichen Kategorien und die Differenzen zwischen diesen Kategorien werden in den Quantifikationen beibehalten Die Reihenfolge der Quantifikationen f r Variablen die als ordinal behandelt werden entspricht der Reihenfolge der urspr nglichen Kategorien Die Differenzen zwischen den Kategorien werden allerdings nicht beibehalten So entsteht ein nicht abnehmendes Transformationsdiagramm das jedoch nicht unbedingt eine gerade Linie zeigen muss Wenn aufeinanderfolgende Kategorien hnlichen Quantifikationen entsprechen ist die Unterscheidung der Kategorien ggf nicht notwendig die Kategorien k nnten in diesem Fall kombiniert werden Diese Kategorien bilden ein Plateau im Transformationsdiagramm Dieses Muster kann jedoch auch entstehen wenn eine ordinale Struktur ber eine Variable die als nominal behandelt werden sollte berlagert wird Zeigt eine nachfolgende nominale Behandlung der Variablen dasselbe Muster ist die Kombination der Kategorien gerechtfertigt Wenn die Quantifikationen f r eine als ordinal behandelte Variable entlang einer geraden Linie liegen d rfte dar ber hinaus eine numerische Transformierung angebrachter sein Bei Variablen die als nominal behandelt werden i
373. ro mutter oma E Gro vater opa L Mutter mutter 4 Nette neffe Nichte nichte A Tor enaa Optionen rA Tochter tochter i A Vater vater Diagramme Ausgabe Onkel onkel Schwester schweste Quellen E Sohn sohn Distanzen erstellen mit Euklidische Distanz L x Ji Einf gen Zur cksetzen J Abbrechen f g Wenn Sie Distanzen zwischen Variablen erzeugen siehe Dialogfeld Distanzen aus Daten erstellen w hlen Sie mindestens drei Variablen aus Diese Variablen dienen zum Erstellen der Distanzmatrix oder Distanzmatrizen wenn mehrere Quellen vorhanden sind Bei der Erzeugung von Distanzen zwischen F llen wird nur eine Variable ben tigt Wenn mehrere Quellen vorhanden sind w hlen Sie eine Quellenvariable aus W hlen Sie bei Bedarf ein Ma f r die Erstellung der hnlichkeiten aus Dar ber hinaus k nnen Sie ein Modell f r die multidimensionale Skalierung angeben Einschr nkungen f r den gemeinsamen Raum festlegen Konvergenzkriterien festlegen die zu verwendende Ausgangskonfiguration angeben sowie Diagramme und die Ausgabe ausw hlen 76 Kapitel 7 Distanzen aus Daten erstellen Abbildung 7 6 Dialogfeld Distanzen aus Daten erstellen ie E Multidimensionale Skalierung Ma x Messniveau Intervall Euklidische Distanz H ufigkeiten Binar Werte transformieren Distanzmatrix erstellen Standardisieren
374. rspr nglichen hnlichkeiten Diese Option ist nur f r hnlichkeiten mit positiven Werten zul ssig m Intervall Die transformierten hnlichkeiten sind proportional zu den urspr nglichen hnlichkeiten plus einem konstanten Term Durch die Konstante wird sichergestellt dass alle hnlichkeiten positive Werte haben m Ordinal Die transformierten hnlichkeiten weisen dieselbe Ordnung wie die urspr nglichen hnlichkeiten auf Sie geben an ob die Bindung von gebundenen hnlichkeiten erhalten bleiben muss oder aufgehoben werden darf m Spline Die transformierten hnlichkeiten sind eine gegl ttete nicht fallende st ckweise polynomiale Transformation der urspr nglichen hnlichkeiten Sie geben den Grad des Polynoms und die Anzahl der inneren Knoten an Transformationen zuweisen Geben Sie an ob nur hnlichkeiten innerhalb jeder Quelle miteinander verglichen werden oder ob die Vergleiche unabh ngig von der Quelle sein sollen Dimensionen Standardm ig wird eine L sung in zwei Dimensionen berechnet Minimum 2 Maximum 2 Geben Sie f r das Minimum und Maximum eine beliebige ganze Zahl zwischen 1 und der Anzahl der Objekte minus 1 an solange das Minimum kleiner oder gleich dem Maximum ist Die Prozedur berechnet eine L sung in der h chsten Dimension und reduziert die Dimensionalit t dann schrittweise bis die niedrigste Dimensionalit t erreicht ist Multidimensionale Skalierung Einschr nkungen Im Dialogfeld
375. rts St rke 0 5 oe Bereich 1 0 Anpassen r ngepasste Konfiguration arlablen Weiter Abbrechen Hite gt Um eine nicht degenerierte L sung zu erstellen klicken Sie auf die Schaltfl che Zuletzt verwendete Dialogfelder und w hlen Sie Multidimensionale Entfaltung aus gt Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf Optionen gt Geben Sie im Gruppenfeld Penalisierungsterm 0 5 f r St rke und 1 0 f r Bereich ein Dadurch wird der Penalisierungsterm deaktiviert Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf OK Im Folgenden finden Sie die durch diese Optionen generierte Befehlssyntax PREFSCAL VARIABLES TP BT EMM JD CT BMM HRB TMd BTJ TMn CB DP GD CC CMB INITIAL CLASSICAL SPEARMAN TRANSFORMATION NONE PROXIMITIES DISSIMILARITIES CRITERIA DIMENSIONS 2 2 DIFFSTRESS 000001 MINSTRESS 0001 MAXITER 5000 PENALTY LAMBDA 0 5 OMEGA 1 0 PRINT MEASURES COMMON PLOT COMMON 296 Kapitel 15 m Die einzige nderung besteht im Unterbefehl PENALTY LAMBDA wurde auf 0 5 und OMEGA auf 1 0 die Standardwerte festgelegt Ma e Abbildung 15 6 Ma e f r nicht degenerierte L sung lterationen 157 Endg ltiger Funktionswert 6948930 Wertteile der Funktion Stressteil 2428268 Penalisierungsteil 9317409 Fehlende Anpassung Normalisierter Stre
376. rung ist f r diese Beziehungen nicht geeignet Um den Schwerpunkt auf den Zusammenhang untereinander zu legen verwenden Sie die symmetrische Normalisierung Die Tr gheit wird nicht zweimal gestreut wie bei der Prinzipal Normalisierung sondern gleichm ig auf die Zeilen und Spalten aufgeteilt Die Distanzen zwischen den Kategorien einer bestimmten Variablen k nnen 243 Korrespondenzanalyse nicht interpretiert werden die Distanzen zwischen den Kategorien verschiedener Variablen sind dagegen sehr wohl aussagekr ftig Abbildung 12 33 Dialogfeld Modell amp Korrespondenzanalyse Modell Dimensionen in der L sung 2 Distanzma Chi Quadrat Euklidisch Standardisierungsmethode Zeilen und Spaltenmittel werden entfernt Normalisierungsmethode Symmetrisch O Zeilenprinzipal Anpassen Prinzipal Spaltenprinzipal Abbrechen Hite Zum Anlegen der nachstehenden L sung mit symmetrischer Normalisierung ffnen Sie erneut das Dialogfeld Korrespondenzanalyse und klicken Sie auf Modell W hlen Sie Symmetrisch als Normalisierungsmethode Klicken Sie auf Weiter Klicken Sie im Dialogfeld Korrespondenzanalyse auf OK Aus dem oberen linken Bereich des Biplot geht die Marke EE als einzige starke Marke f r die Arbeiterklasse hervor die zudem f r M nner ansprechend ist Die Marke AA ist die popul rste Marke und gilt au erdem als Marke
377. rzeichnen In Dimension 2 gibt es offensichtlich einen gewissen Fortschritt in Richtung normal um den Wert 0 zwischen anorektischem und bulimischem Verhalten aber dann tritt eine Verschiebung hin zu bulimischen Symptomen ein Untersuchung der Strukturen im Krankheitsverlauf Um weitere Informationen dazu herauszufinden wie die beiden Dimensionen mit den vier Diagnosekategorien und den vier Zeitpunkten in Bezug standen wurde eine Zusatzvariable Time diagnosis interaction Zeit Diagnose Interaktion erstellt indem eine Kreuzklassifikation der vier Kategorien von Patient diagnosis Patientendiagnose und der vier Kategorien von Time of interview Zeitpunkt der Befragung durchgef hrt wurde Daher weist Time diagnosis interaction Zeit Diagnose Interaktion 16 Kategorien auf wobei die erste Kategorie f r die Anorexia nervosa Patienten bei ihrem ersten Besuch steht Die f nfte Kategorie steht f r die Anorexia nervosa Patienten bei Zeitpunkt 2 usw bis zur 16 Kategorie die f r die Patienten mit atypischer Essst rung bei Zeitpunkt 4 steht Durch die Verwendung der Zusatzvariablen Time diagnosis interaction Zeit Diagnose Interaktion wird die Untersuchung des Krankheitsverlaufs f r die verschiedenen Gruppen im Laufe der Zeit m glich Die Variable erhielt ein mehrfach nominales Skalierungsniveau Die Kategoriepunkte werden in der folgenden Abbildung angezeigt Abbildung 10 39 Kategoriepunkte f r Time diagnosis interaction Zei
378. s F nffache der Anzahl der Variablen betragen Andererseits wird bei der Korrespondenzanalyse von nominalen Variablen ausgegangen sodass die Beziehungen zwischen den Kategorien jeder Variablen sowie die Beziehungen zwischen den Variablen beschrieben werden k nnen Zudem kann die Korrespondenzanalyse zur Untersuchung einer beliebigen Tabelle mit positiven Korrespondenzma en verwendet werden Beispiel Mithilfe der Korrespondenzanalyse kann die Beziehung zwischen einer Mitarbeitergruppe und den Rauchgewohnheiten grafisch dargestellt werden Es k nnte sich herausstellen dass die Rauchgewohnheiten bei Angestellten im mittleren Management und beim Sekratariatspersonal jeweils unterschiedlich bei Sekretariatsmitarbeitern im Vergleich zu Angestellten im gehobenen Management jedoch identisch sind Als Ergebnis k nnte sich ebenfalls die Erkenntnis herausstellen dass starkes Rauchen mit Angestellten des mittleren Managements und gelegentliches Rauchen mit Sekret rinnen in Verbindung gebracht werden kann Statistiken und Diagramme Korrespondenzma e Zeilen und Spaltenprofile Singul rwerte Zeilen und Spaltenwerte Tr gheit Masse Konfidenzstatistik f r Zeilen und Spaltenwerte Konfidenzstatistik f r Singul rwerte Transformationsdiagramme Zeilenpunktdiagramme Spaltenpunktdiagramme und Biplots Daten Die kategorialen Variablen die analysiert werden sollen werden nominal skaliert Verwenden Sie f r aggregierte Daten oder f r ein Korresp
379. s R und korrigiertes R unter Ber cksichtigung der optimalen Skalierung Koeffizienten Diese Option gibt drei Tabellen aus eine Koeffiziententabelle mit Beta Koeffizienten dem Standardfehler der Beta Koeffizienten t Werten und der Signifikanz eine Tabelle der optimalen Skalierung der Koeffizienten mit dem Standardfehler der Beta Koeffizienten unter Ber cksichtigung der optimalen Skalierungsfreiheitsgrade und eine Tabelle mit Korrelationen nullter Ordnung Teilkorrellationen und partiellen Korrelationen Pratts Ma f r die relative Bedeutung der transformierten Einflu variablen und der Toleranz vor und nach der Transformation Iterationsprotokoll F r jede Iteration einschlie lich der Anfangswerte des Algorithmus werden das multiple R und der Regressionsfehler angezeigt Die Erh hung des multiplen R wird beginnend mit der ersten Iteration aufgef hrt Korrelationen der Originalvariablen Eine Matrix mit den Korrelationen zwischen den nicht transformierten Variablen wird angezeigt Korrelationen der transformierten Variablen Eine Matrix mit den Korrelationen zwischen den transformierten Variablen wird angezeigt ANOVA Diese Option enth lt Quadratsummen f r die Regression und die Residuen Mittel der Quadrate und F Zwei ANOVA Tabellen werden angezeigt eine Tabelle mit Freiheitsgraden f r die Regression die der Anzahl der Einflu variablen entspricht und eine Tabelle mit Freiheitsgraden f r die Regression unter Ber cksichti
380. sammenfassung der Analyse ergibt sich 1 0 238 0 762 also 0 873 im Quadrat plus Rundungsfehler Kleine Verlustwerte weisen somit auf umfangreiche Mehrfachkorrelationen zwischen den gewichteten Summen optimal skalierter Variablen und Dimensionen hin Die Gewichtungen sind bei mehrfach nominalen Variablen nicht eindeutig Bei mehrfach nominalen Variablen gilt die Berechnung 1 Verlust pro Set Aufteilen der Anpassung und der Verluste Der Verlust in den einzelnen Sets wird bei der nichtlinearen kanonischen Korrelationsanalyse auf verschiedene Weise aufgeteilt Die Anpassungstabelle enthalt die Tabellen fiir Mehrfachanpassung Einzelanpassung und Einzelverlust die durch die nichtlineare kanonische Korrelationsanalyse f r die Beispieluntersuchung erzeugt wurden Beachten Sie Die Mehrfachanpassung minus die Einzelanpassung ergibt den Einzelverlust Abbildung 11 16 Aufteilen der Anpassung und der Verluste Mehrfachanpassung Einzelne Anpassung Einzelne Verlustfunktion een Dimension Dimension Summe 2 Summe Summe Age in yearsa Marital statusb Pets owned Newspaper read most often Music preferredb Neighborhood preference a Optimales Skalierungsniveau Ordinal b Optimales Skalierungsniveau Einfach nominal Optimales Skalierungsniveau mehrfach nominal Der Einzelverlust zeigt den Verlust der sich aus dem Einschr nken der Variablen auf eine einzige Quantifikationsgruppe ergibt also einzeln nominal ordinal
381. scale construction In The Prediction of Personal Adjustment P Horst Hg New York Social Science Research Council 319 348 Meulman J J 1982 Homogeneity analysis of incomplete data Leiden DSWO Press Meulman J J 1996 Fitting a distance model to homogeneous subsets of variables Points of view analysis of categorical data Journal of Classification 13 249 266 Meulman J J als auch W J Heiser 1997 Graphical display of interaction in multiway contingency tables by use of homogeneity analysis In Visual Display of Categorical Data M Greenacre als auch J Blasius Hgg New York Academic Press 277 296 Nishisato S 1984 Forced classification A simple application of a quantification method Psychometrika 49 25 36 270 Kapitel 13 Tenenhaus M als auch F W Young 1985 An analysis and synthesis of multiple correspondence analysis optimal scaling dual scaling homogeneity analysis and other methods for quantifying categorical multivariate data Psychometrika 50 91 119 Van Rijckevorsel J 1987 The application of fuzzy coding and horseshoes in multiple correspondence analysis Leiden DSWO Press Kapitel Multidimensionale Skalierung Das Ziel der multidimensionalen Skalierung f r eine gegebene Gruppe von Objekten besteht darin eine Darstellung der Objekte in einem flachdimensionierten Raum zu finden Diese L sung wird mithilfe der hnlichkeiten zwischen den Objekten ermittelt Bei der
382. schaftsgrades 271 Festlegen der Anzahl der Dimensionen 0 0 0 cece cee cece eee e eens 272 Eine dreidimensionale Losung 00 cece cent nennen 279 Dreidimensionale L sung mit nicht standardm igen Transformationen 285 DISKUSSION 2 20 ee ee ta hae de ed a ee A i aa aware debt nee tae 288 Empfohlene Literatur 2 0 cece ene eee eens 288 15 Multidimensionale Entfaltung 290 Beispiel Bevorzugte Fr hst cksartikel ee eee eens 290 Erstellen einer degenerierten Losung 000 0 cece eee eee teens 290 Mabe incest ee Boece tirana nee anton a tigers deltas kopen nur Di 293 Gemeinsamer Raum 0 ccc en ee ene n teen e eens 294 Durchf hren einer nicht degenerierten Analyse 00000 cece cece 295 Ma e 0 0 420 tel eyes st en ee nen enter ne ae ee 296 Gemeinsamer Raum ciuci a saii e Ea ai eee ee a Raa ah 297 Beispiel Dreifach Entfaltung von bevorzugten Fr hst cksartikeln 0 000000 ee 297 Durchf hrung der Analyse 00 00 cece eet eee 298 Mabe ee acini ane vou han eet ge were sea SOARS Gea 302 Gemeinsamer Raum 0 ccc en eee nee n teen tenes 303 Individueller Raum 6 ee eee n eee e tent e nee 304 Verwenden einer anderen Ausgangskonfiguration 0000 cece eee eens 307 Mabe oca ee nee Se Augen a hia a E een oh 309 Gemeinsamer Raum 0 ccc eee eee n een eens 310 Individueller Raum
383. se Plots verwenden Dimension 1 als y Achse Die mittlere Plot Zeile erm glicht die Interpretation von Dimension 2 Die zweite Dimension hat sich gegen ber der zweidimensionalen L sung leicht ge ndert Zuvor wies die zweite Dimension drei deutliche Klumpen auf nun jedoch sind die Objekte weiter auf der Achse verteilt Die dritte Dimension unterst tzt die Trennung von MOBS und PRIMARY GROUPS die in der zweidimensionalen L sung nicht m glich war Untersuchen wir die Plots Dimension 2 versus Dimension 3 und Dimension 1 versus Dimension 2 genauer Auf der durch die Dimensionen 2 und 3 definierten Fl che formen die Objekte ungef hr ein Rechteck mit CROWDS MODERN COMMUNITY SECONDARY GROUPS und PUBLIC an den Eckpunkten Auf dieser Fl che erscheinen MOBS und PRIMARY GROUPS als konvexe Kombinationen von PUBLIC CROWDS bzw SECONDARY GROUPS MODERN COMMUNITY Sie werden jedoch wie bereits erw hnt entlang Dimension 1 von den anderen Gruppen getrennt AUDIENCES ist entlang Dimension 1 nicht von den anderen Gruppen getrennt und scheint eine Kombination von CROWDS und MODERN COMMUNITY zu sein Komponentenladungen Abbildung 10 17 Dreidimensionale Komponentenladungen SS Intensitat H ufigkeit Frequenz Zugeh rigkeit Entfernung Formalit t Normalisierung mit Yariablen Prinzipal Zu wissen wie die Objekte getrennt sind bedeutet noch nicht dass klar ist welche Variablen welchen Dimensionen entsprechen Dies wird m
384. sevariablen ausgew hlt werden Da die Konfiguration aber fest ist werden Sie als Zusatzvariablen verarbeitet und m ssen deshalb nicht als Zusatzvariablen ausgew hlt werden Mehrfachkorrespondenzanalyse Ausgabe Im Dialogfeld Ausgabe k nnen Sie festlegen dass Tabellen f r Objektwerte Diskriminationsma e das Iterationsprotokoll Korrelationen der urspr nglichen und transformierten Variablen Kategorienquantifikationen f r ausgew hlte Variablen und deskriptive Statistiken f r ausgew hlte Variablen erstellt werden sollen Abbildung 6 7 Dialogfeld Ausgabe BE MCA Ausgabe Tabellen Objektwerte Korrelationen der Originalvariablen v Diskriminationsma e Korrelationen der transformierten Yariablen kterstionsprotokoll Quantifizierte Variablen Kategorienquantifikationen und Beitr ge gewinde kopf gt kerbe form Deskriptive Statistik lange messing gt Optionen f r Objektwerte Beschriftungsvariablen object gt gt Abbrechen Hite 64 Kapitel 6 Objektwerte Hiermit werden die Objektwerte z B Masse Tr gheit Beitr ge angezeigt Die folgenden Optionen sind verf gbar m Diese Kategorien ber cksichtigen Hiermit werden die Kategorienummern der ausgew hlten Analysevariablen angezeigt m Objektwerte beschriften nach Sie k nnen eine der in der Liste Beschriftungsvar
385. siehe Beispieldateien in Anhang A auf S 326 Bei den 23 Attributen des Eiskaffee Image sollten die Teilnehmer jeweils alle Marken ausw hlen die durch dieses Attribut beschrieben werden Die sechs Marken werden als AA BB CC DD EE und FF bezeichnet um Vertraulichkeit zu gew hrleisten Tabelle 12 1 Eiskaffeeattribute Image Attribut Label Image Attribut Label Gutes Heilmittel gegen Heilmittel Dick machende Marke macht dick Kater Fettarme kalorienarme fettarm Ansprechend f r M nner M nner Marke Marke f r Kinder Kinder S daustralische Marke S d Australien Marke f r die Arbeit Traditionelle alteingesessene traditionell Arbeiterklasse Marke Reichhaltige s e Marke S SS Marke mit Premium Qualit t premium Unpopul re Marke unpopul r Gesunde Marke gesund Marke f r dicke h liche h sslich Marke mit hohem Koffein Menschen Koffeingehalt Sehr erfrischend frisch Neue Marke neu Marke f r Yuppies Yuppies Marke f r attraktive attraktiv Menschen Nahrhafte Marke n hrstoffreich Schwere Marke schwer Marke f r Frauen Frauen Popul re Marke popul r Gering vertretene Marke gering Zu Beginn konzentrieren Sie sich darauf wie die Attribute miteinander zusammenh ngen und in welchem Zusammenhang die Marken stehen Mit der Prinzipal Normalisierung wird die Gesamttr gheit einmal ber die Zeilen und einmal ber die Spalten gestreut So steht zwar die Biplot In
386. sonen in diesen Kategorien Auch die Standardabweichung f r starke Raucher ist aus demselben Grund gr er Wenn Sie die Korrelationen zwischen den Dimensionen f r die Werte betrachten wird ersichtlich dass die Korrelationen f r die Zeilen und Spaltenwerte im allgemeinen klein sind au er bei den Angestellten ohne Erfahrung hier liegt ein Wert von 0 611 f r die Korrelation vor Abbildung 12 14 Konfidenzstatistiken f r Zeilenwerte Standardabweichung Ba in Dimension Korrelation Berufsgruppe Senior Manager 101 Junior Manager 007 Angestellter mit Erfahrung 107 Angestellter ohne Erfahrung 611 Sekretariat 360 Abbildung 12 15 Konfidenzstatistiken f r Spaltenwerte eres Le a in Dimension Korrelation Rauchgewohnheit 1 1 2 Nichtraucher Leicht Mittel Stark Zusatzprofile Bei der Korrespondenzanalyse k nnen zus tzliche Kategorien im Raum repr sentiert werden die die Beziehung zwischen den aktiven Kategorien beschreiben Mit einem Zusatzprofil wird lediglich ein Profil ber die Kategorien der Zeilen oder der Spaltenvariable definiert dieses Profil wirkt sich in keinster Weise auf die Analyse aus Die Datendatei enth lt eine Zusatzzeile und zwei Zusatzspalten Der Landesdurchschnitt in den Kategorien f r die Rauchgewohnheiten bildet ein zus tzliches Zeilenprofil Die beiden Zusatzspalten definieren zwei Spaltenprofile ber die Berufsgruppen Mit den Zusatzprofilen wird ein Punkt definiert der entweder im Zeilenraum od
387. ss Maximalzahl der tterationen Ross Cliff Korrespondenz Zentroide Auswahl Mehrere Zufallsstarts St rke Anzahl Starts Bereik Anpassen rPenalisierungsterm Angepasste Konfiguration Variablen einlesen aus Die Anzahl muss der maximalen Dimensionalitat des Modells entsprechen Aktuell 2 Variablen mit Zeilenkoordinaten m ssen vor Variablen mit Spaltenkoordinaten stehen Verf gbar BEE W hlen Sie Spearman als Annahmemethode f r die Ausgangskonfiguration Klassisch aus Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf Diagramme 301 Multidimensionale Entfaltung Abbildung 15 11 Dialogfeld Diagramme Multidimensionale Entfaltung Diagramme K rDiagramme _ Mehrere Starts V Endg ltiger gemeinsamer Raum _ Transformationsdiagramme _ Anf nglicher gemeinsamer Raum V Raumgewichtungen C Shepard Diagramme Stress pro Dimension V Individueller Raum C Streudiagramm der Anpassung C Residuen Diagramme rStile f r Zeilenobjekte Farben nu scenarios srcid Gender gender Markierungen Toast pop up TP Buttered toast BT Diagramme der Quellen Alle Quellen Quellen Oa v hlen Hinzuf gen To 4 Andern Quellennummer Entfernen Zeilendiagramme Zeilen O Zeilen ausw
388. ss 0583589 Stress Inach Kruskal 2415758 Stress Il nach Kruskal 5875599 Stress nach Young 3446361 5 Stress Il nach Young 6030127 Gite der Anpassung Erklarte Streuung 9416411 Erkl rte Yarianz 7651552 Ermittelte Bevorzungsordnungen Spearman Rho 8179181 Kendall Tau b 6916725 Variationskoeffizienten Variation der hnlichkeiten Variation der transformierten 6006156 hnlichkeiten Yariation der Distanzen 4833617 Indizes f r Quadratsumme von Degeneration DeSarbos Indizes f r 1590979 Vermischung Shepards Index f r Nicht Degeneration 7818594 5590170 7895692 Die bei den Ma en f r die degenerierte L sung beobachteten Probleme wurden hier behoben m Der normalisierte Stress betr gt nicht mehr 0 m Der Variationskoeffizient f r die transformierten hnlichkeiten weist nun einen hnlichen Wert wie der Variationskoeffizient f r die urspr nglichen hnlichkeiten auf m Die Vermischungsindizes nach DeSarbo liegen wesentlich n her bei 0 und deuten somit auf eine erheblich bessere Vermischung hin m Shepards Index f r Nicht Degeneration ein Prozentwert verschiedener Distanzen liegt jetzt bei nahezu 80 Die Distanzen sind ausreichend und die L sung ist wahrscheinlich nicht degeneriert 297 Multidimensionale Entfaltung Gemeinsamer Raum Abbildung 15 7 Verbundenes Diagramm des gemeinsamen Raums f r eine nicht degenerierte L sung Toast pop up fe 39 o 19 Toast
389. st and margarine OToast pop up Dimension 1 Im verbundenen Diagramm des individuellen Raums Snack with beverage only ist zu erkennen dass die Zeilen und Spaltenobjekte dichter an einer vertikalen Linie liegen als beim klassischen Spearman Start Beispiel Untersuchen der Angemessenheit von Verhaltensweisen in bestimmten Situationen In einem klassischen Beispiel Price als auch Bouffard 1974 wurden 52 Sch ler Studenten gebeten die Kombinationen aus 15 Situationen und 15 Verhaltensweisen auf einer 10 Punkte Skala von 0 ausgesprochen angemessen bis 9 ausgesprochen unangemessen zu bewerten Die Werte werden ber die einzelnen Personen gemittelt und als Un hnlichkeiten verwendet Diese Informationen finden Sie in der Datei behavior sav F r weitere Informationen siehe Beispieldateien in Anhang A auf S 326 Suchen Sie mithilfe der multidimensionalen Entfaltung Gruppen von hnlichen Situationen sowie die Verhaltensweisen mit denen sie am ehesten in Verbindung gebracht werden Syntax mit denen Sie diese Analysen nachvollziehen k nnen befindet sich in der Datei prefscal_behavior sps 314 Kapitel 15 Durchf hrung der Analyse gt Um eine Analyse vom Ty Multidimensionale Entfaltung durchzuf hren w hlen Sie die folgenden Befehle aus den Men s aus Analysieren Skalieren Multidimensionale Entfaltung Abbildung 15 24 Hauptdialogfeld Multidimensionale Entfaltung Multidimensionale
390. st die Reihenfolge der Kategorien an der horizontalen Achse mit der Reihenfolge der Codes identisch die die Kategorien repr sentieren Interpretationen der Kategorienreihenfolge oder der Distanz zwischen den Kategorien sind 114 Kapitel 9 gegenstandslos Das Diagramm kann eine beliebige nichtlineare oder lineare Form annehmen Besteht ein steigender Trend sollte die ordinale Behandlung verfolgt werden Falls das nominale Transformationsdiagramm einen linearen Trend zeigt ist ggf eine numerische Transformation angebrachter Die nachstehende Abbildung zeigt das Transformationsdiagramm f r die Variable Price die als numerisch behandelt wurde Beachten Sie dass die Reihenfolge der Kategorien entlang der geraden Linie mit der Reihenfolge der urspr nglichen Kategorien bereinstimmt Dar ber hinaus ist die Differenz zwischen den Quantifikationen f r 7 19 und 81 39 1 173 und 0 mit der Differenz zwischen den Quantifikationen f r 39 und 1 59 0 und 1 173 identisch Die Tatsache dass die Kategorien 1 und 3 dieselbe Distanz zur Kategorie 2 besitzen bleibt in den Quantifikationen erhalten Abbildung 9 21 Transformationsdiagramm f r Preise numerisch 0 01 Quantifizierungen 31 19 1 39 1 59 Kategorien Die nominale Transformation von Package design f hrt zum nachstehenden Transformationsdiagramm Beachten Sie die deutliche nichtlineare Form in der die gr te Quantifikation der zweiten Kategorie liegt Im Hinbli
391. stellung E Diagrammerstellung Variablen Table Numbe da Command_ fac PA Subtype_ Soi PALabel_ Label_ davar ar1 E Centroids Pr E Centroids Pr E Centroids Pr E time time diagnosis di SE Kategorien Keine Kategorien _maseircha Vavishia Diagrammvorschau verwendet Beispieldaten Galerie Ausw hlen aus Favoriten Grundelemente Balken Linie Gruppen Punkt ID Fl che Kreis Polar Titel Fu noten Streu Punktdiagr _ Histogramm Hoch Tief Elementeigenschaft Boxplot Doppelachsen Optionen A gt Rufen Sie die Diagrammerstellung erneut auf Heben Sie die Auswahl von Centroids Projected on Sexual attitude Zentroide auf sexuelle Einstellung projiziert als y Achsen Variable auf und w hlen Sie statt dessen Centroids Projected on Preoccupation with food and weight Zentroide auf Besch ftigung mit Essen und Gewicht projiziert als y Achsen Variable aus Klicken Sie auf OK 189 Kategoriale Hauptkomponentenanalyse Abbildung 10 54 Auf Preoccupation with food and weight Besch ftigung mit Essen und Gewicht projizierte Zentroide des Diagnosezeitpunkts im Verlauf der Zeit m Diagramm Editor Datei Bearbeiten Ansicht Optionen Elemente Hilfe oo EXYM MMS BILEYV CEDE Emus Bell il if az at it t E lini Ae We Diagnose O1 Centroids Projected on Preoccupation with food and weight
392. sungsg te unter Umst nden deutlich zur ck Abbildung 9 35 Transformationsdiagramm von Temperature nominal N Quantifizierungen N 1 34567 8 91011 1213 14 15 16 17 18 19 3 21 22 23 234 25 3 77 28 23 V 3 2 3 8 35 8 Vy 3 Kategorien Das Transformationsdiagramm von Temperature zeigt ein anderes Muster In h heren Kategorien steigen auch die Quantifikationen Das bedeutet Wenn Temperature ansteigt steigen auch die vorhergesagten Ozonwerte Aus diesem Muster geht hervor dass eine Skalierung von Temperature auf ordinalem Messniveau empfehlenswert w re 125 Kategoriale Regression Abbildung 9 36 Transformationsdiagramm von Day of the year nominal Quantifizierungen 123456 7 8 9 1011 12131415 16 17 18 19 2 21 22 23 24 25 23 77 28 29 3 3 V 3 8 35 8V Kategorien Diese Abbildung zeigt das Transformationsdiagramm von Day of the year Die Quantifikationen steigen bis Kategorie 79 an und sinken dann wieder ab So ergibt sich eine U Form Unter Ber cksichtigung des Vorzeichens beim Regressionskoeffizienten f r Day of the year erhalten die urspr nglichen Kategorien bis 5 jeweils eine Quantifikation die sich senkend auf den vorhergesagten Ozonwert auswirkt Ab Kategorie 6 entstehen steigernde Auswirkungen auf die Quantifikationen bis etwa bei Kategorie 79 der H chstwert erreicht wird Ab Kategorie 79 f hren die Quantifikationen zu einer Senkung des vorhergesagten Ozonwerts Die Linie is
393. t 0 126 f r Senior Manager in der ersten Dimension entspricht beispielsweise 0 364 x 0 752 0 182 x 0 190 0 273 x 0 375 0 182 x 0 562 0 273 Bei der Zeilenprinzipal Normalisierung wird der Singul rwert nicht in diese Gleichung aufgenommen Die Zeilenpunkte befinden sich im gewichteten Zentroid der aktiven Spaltenpunkte wobei die Gewichtungen den Eintr gen in der Tabelle mit den Zeilenprofilen entsprechen Wenn die Zeilenpunkte dem gewichteten Durchschnitt der Spaltenpunkte entsprechen und die maximal zul ssige Anzahl an Dimensionen verwendet wird ist die Euklidische Distanz zwischen einem Zeilenpunkt und dem Ursprung gleich der Chi Quadrat Distanz zwischen der Zeile und der Durchschnittszeile die wiederum gleich der Tr gheit einer Zeile ist Die Chi Quadrat Statistik entspricht der Gesamttr gheit multipliziert mit der Summe aller Zellen in der Korrespondenztabelle Die Ausrichtung der Zeilenpunkte kann daher als bildliche Darstellung der Chi Quadrat Statistik angesehen werden F r die Spaltenprinzipal Normalisierung gilt eine hnliche Interpretation nicht jedoch f r die symmetrische Normalisierung Beitr ge Es ist m glich die durch eine bestimmte Dimension gezeigte Tr gheit zu berechnen Die Werte in den einzelnen Dimensionen entsprechen einer orthogonalen Projektion von dem Punkt auf diese Dimension Die Tr gheit einer Dimension ist daher gleich der gewichteten Summe der quadrierten Distanzen von den Werten in
394. t Diagnose Interaktion 15 01 10 4 04 05 054 N 5 809 w oo 12 ail 5 016 10 3 Sr 14 054 0615 o 011 10 4 o2 03 Lo ihr i ee l 45 10 0 5 0 0 0 5 10 Dimension 1 Ein Teil der Struktur ist aus diesem Diagramm ersichtlich Die Diagnosekategorien bei Zeitpunkt 1 trennen in der zweiten Dimension klar Anorexia nervosa und atypische E st rung von Anorexia nervosa mit Bulimia nervosa und Bulimia nervosa nach Anorexia nervosa Danach ist es etwas schwieriger die Muster zu sehen 175 Kategoriale Hauptkomponentenanalyse Sie k nnen die Muster jedoch einfacher sichtbar machen indem Sie ein Streudiagramm auf der Grundlage der Quantifizierungen erstellen W hlen Sie hierzu die folgenden Befehle aus den Men s aus Grafiken Diagrammerstellung Abbildung 10 40 Galerie Streu Punktdiagramm Variablen a Hersteller manufact PS Modell model E Verkaufszahl in Tau E Wiederverkaufswer al Fahrzeugtyp type E Preis in Tausend Do E Hubraum engine_s 8 PS horsepow Radstand wheelbas E Breite width L L nge length Keine Kategonen metrische Variable _ Galerie Grundelemente 3 Diagrammerstellung X Diagrammvorschay verwendet Beispieldaten Ziehen Sie ein Galeriediagramm als Ausgangspunkt hierher ODER Klicken Sie auf die Registerkarte Grundelemente um ein Diagramm Element f r Element zu erstellen Gruppen Punkt ID Titel Fu noten Ausw hl
395. t den beiden Zusatzpunkten f r den Alkoholkonsum Alcohol liegt nahe am Ursprung und zeigt so eine enge Korrespondenz zwischen dem Alkoholprofil und dem durchschnittlichen Spaltenprofil No Alcohol weicht dagegen vom durchschnittlichen Spaltenprofil ab was durch die gro e Distanz zum Ursprung verdeutlicht wird Der n chstgelegene Punkt zu No Alcohol ist Leicht Das Profil der leichten Raucher weist die gr ten hnlichkeiten mit den Abstinenzlern auf Unter den Rauchern liegt der Punkt Mittel am n chsten und der Punkt Schwer am weitesten entfernt Beim leichten bis schweren Rauchen besteht somit eine Progression im Hinblick auf die hnlichkeit mit der Abstinenz Durch den relativ hohen Anteil der Sekretariatsangeh rigen in der Gruppe No Alcohol ist allerdings keine enge Korrespondenz zu den Raucher Kategorien gegeben Abbildung 12 21 Spaltenpunkte Prinzipal Normalisierung Stark 0 1 Nichtraucher Mittel 0 0 e Dimension 2 On Leicht o 0 2 T T T T T T 0 4 0 3 0 2 0 1 0 0 0 1 0 2 0 3 Dimension 1 234 Kapitel 12 Beispiel Wahrnehmung von Kaffeemarken Das vorangegangene Beispiel umfasste eine kleine Tabelle mit hypothetischen Daten Im wirklichen Leben fallen h ufig deutlich gr ere Tabellen an In diesem Beispiel verwenden Sie Daten zum wahrgenommenen Image von sechs Eiskaffeemarken Kennedy Riquier als auch Sharp 1996 Dieses Daten Set finden Sie in coffee sav F r weitere Informationen
396. t zwar recht gezackt l t jedoch die zugrunde liegende Form immer noch erkennen Die Transformationsdiagramme zeigen daher dass Temperature auf ordinaler Ebene skaliert werden sollte f r alle anderen Einflu gr en sollte statt dessen die nominale Skalierung verwendet werden Zum Neuberechnen der Regression mit Skalierung von Temperature auf ordinaler Ebene ffnen Sie erneut das Dialogfeld Kategoriale Regression Abbildung 9 37 Dialogfeld Skala definieren Kategoriale Regression Skala definie Messniveau der optimalen Skalierung Spline ordinal Spline nominal Nominal Numerisch Spline Weiter Abbrechen Hite 126 Kapitel 9 gt Wahlen Sie Temperature aus und klicken Sie auf Skala definieren Wahlen Sie als Messniveau der optimalen Skalierung die Option Ordinal aus Klicken Sie auf Weiter Klicken Sie im Dialogfeld Kategoriale Regression auf Speichern Abbildung 9 38 Dialogfeld Speichern i Kategoriale Regression Speichern Vorhergesagte Werte in Arbeitsdatei speichern Residuen in Arbeitsdatei speichern Diskretisierte Daten Diskretisierte Daten erstellen rTransformierte Variablen v Transformierte Variablen in Arbeitsdatei speichern Transformierte variablen erstellen Abbrechen Wahlen Sie Im Gruppenfeld Transformierte
397. te recidivism_cs_sample sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen einer Strafverfolgungsbeh rde geht einen Einblick in die R ckfallraten in ihrem Zust ndigkeitsbereich zu gewinnen Jeder Fall entspricht einem fr heren Straft ter der im Juni 2003 erstmals aus der Haft entlassen wurde und erfasst Daten zu dessen demografischen Hintergrund einige Details zu seinem ersten Verbrechen sowie die Daten zu seiner zweiten Festnahme sofern diese bis Ende Juni 2006 erfolgte Die Straft ter wurden aus per Stichprobenziehung ermittelten Polizeidirektionen ausgew hlt gem dem in recidivism_cs csplan angegebenen Stichprobenplan Da hierbei eine PPS Methode PPS probability proportional to size Wahrscheinlichkeit proportional zur Gr e verwendet wird gibt es au erdem eine Datei mit den gemeinsamen Auswahlwahrscheinlichkeiten recidivism_cs_jointprob sav salesperformance sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um Bewertung von zwei neuen Verkaufsschulungen geht 60 Mitarbeiter die in drei Gruppen unterteilt sind erhalten jeweils eine Standardschulung Zus tzlich erh lt Gruppe 2 eine technische Schulung und Gruppe 3 eine Praxisschulung Die einzelnen Mitarbeiter wurden am Ende der Schulung einem Test unterzogen und die erzielten Punkte wurden erfasst Jeder Fall in der Datendatei stellt einen Lehrgangsteilnehmer dar und enth lt die Gruppe der der Lehrgangs
398. tei Individuelle Raumgewichtungen Datei C Distanzen Datei _ Transformierte hnlichkeiten Datei Transformierte unabh ngige Variablen Datei veto averesnen ne W hlen Sie Eingabedaten Stress Zerlegung und Variablen und Dimensionskorrelationen 283 Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Multidimensionale Skalierung auf OK Stressma e Multidimensionale Skalierung Die Stress und Anpassungsma e lassen erkennen inwieweit sich die Distanzen in der L sung den urspr nglichen Distanzen n hern Abbildung 14 13 Stress und Anpassungsma e Normalisierter Roh Stress Stress I Stress ll Stress Erklarte Streuung D A F Kongruenzkoeffizient nach Tucker PROXSCAL minimiert den normalisierten Roh Stress a Faktor f r optimale Skalierung 1 066 b Faktor f r optimale Skalierung 984 Jedes der vier Stress Statistikma e misst die mangelnde Anpassung der Daten die ber cksichtigte Streuung und der Kongruenzkoeffizient nach Tucker messen dagegen die Anpassung Niedrigere Stressma e bis zum Minimum 0 und h here Anpassungsma e bis zum Maximum 1 weisen auf bessere L sungen hin Abbildung 14 14 Zerlegung des normalisierten Roh Stresses Panes anes Tre Tore Tores TEE mt EEE ae ae en ae me Mittelwert Aunt Brother Cousin Daughter Father Granddaughter Grandfather Grandmother Grandson Mother Nephew Ni
399. teilnehmer zugeteilt wurde sowie die von ihm in der Pr fung erreichte Punktzahl satisf sav Hierbei handelt es sich um eine hypothetische Datendatei zu einer Zufriedenheitsumfrage die von einem Einzelhandelsunternehmen in 4 Filialen durchgef hrt wurde Insgesamt wurden 582 Kunden befragt Jeder Fall gibt die Antworten eines einzelnen Kunden wieder screws sav Diese Datendatei enth lt Informationen zu den Eigenschaften von Schrauben Bolzen Muttern und Rei n geln Hartigan 1975 shampoo_ph sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Qualit tskontrolle in einer Fabrik f r Haarpflegeprodukte geht In regelm igen Zeitabst nden werden Messwerte von sechs separaten Ausgangschargen erhoben und ihr pH Wert erfasst Der Zielbereich ist 4 5 5 5 ships sav Ein an anderer Stelle McCullagh et al 1989 vorgestelltes und analysiertes Daten Set bezieht sich auf die durch Wellen verursachten Sch den an Frachtschiffen Die Vorfallsh ufigkeiten k nnen unter Angabe von Schiffstyp Konstruktionszeitraum und Betriebszeitraum gem einer Poisson Rate modelliert werden Das Aggregat der Betriebsmonate f r jede Zelle der durch die Kreuzklassifizierung der Faktoren gebildeten Tabelle gibt die Werte f r die Risikoanf lligkeit an site sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Unternehmens geht neue Standorte f r die betriebliche Expansion auszuw hlen
400. tel 11 Zusammenfassung der Analyse Die Anpassungs und Verlustwerte zeigen die Anpassungsg te der nichtlinearen kanonischen Korrelationsanalysel sung f r die optimal quantifizierten Daten im Hinblick auf die Zusammenh nge zwischen den Sets Die Tabelle mit der Zusammenfassung der Analyse enth lt den Anpassungswert die Verlustwerte und die Eigenwerte f r die Beispieluntersuchung Abbildung 11 13 Zusammenfassung der Analyse BL en Summe Yerlustfunktion Set1 Set2 Set 3 Mittelwert Eigenwert Anpassung Der Verlust wird auf die Dimensionen und Sets aufgeteilt Bei jeder Dimension und jedem Set bezeichnet der Verlust den Anteil an der Variation in den Objektwerten der nicht durch die gewichtete Kombination der Variablen im Set abgedeckt ist Der durchschnittliche Verlust wird als Mittelwert gekennzeichnet In diesem Beispiel liegt der durchschnittliche Verlust tiber die S tze bei 0 464 Beachten Sie dass in der zweiten Dimension h here Verluste auftreten als in der ersten Dimension Der Eigenwert f r jede Dimension ist gleich 1 minus dem durchschnittlichen Verlust f r die Dimension Dieser Wert gibt den Teil der Beziehung an der durch die einzelnen Dimensionen dargestellt wird Die Eigenwerte ergeben zusammengerechnet die Gesamtanpassung Bei den Daten nach Verdegaal werden 0 801 1 536 52 der tats chlichen Anpassung durch die erste Dimension erzielt Der maximale Anpassungswert ist gleich der Anzahl der Dimensionen Wi
401. tellenden Dimensionspaare anstelle der Darstellung aller extrahierten Dimensionen unter Verwendung des Schl sselwortes NDIM f r den Unterbefehl PLOT m Festlegen der Zeichenanzahl f r Wertelabels zur Beschriftung der Punkte in den Diagrammen mit dem Unterbefehl PLOT 46 Kapitel 4 m Festlegen von mehr als f nf Variablen f r die Diagramme der Objektwerte mit dem Unterbefehl PLOT m Auswahl von in der Analyse verwendeten Variablen als Beschriftungsvariablen f r die Diagramme der Objektwerte mit dem Unterbefehl PLOT m Auswahl von Variablen als Punktbeschriftungen f r die Diagramme der Quantifikationswerte mit dem Unterbefehl PLOT m Festlegen der Anzahl von F llen die in die Analyse einbezogen werden sollen falls Sie nicht alle F lle in der Arbeitsdatei verwenden m chten mit dem Unterbefehl NOBSERVATIONS m Festlegen der Stammnamen f r Variablen die durch Speichern der Objektwerte erstellt wurden mit dem Unterbefehl sAvE m Festlegen der zu speichernden Anzahl an Dimensionen sodass nicht alle extrahierten Dimensionen gespeichert werden mit dem Unterbefehl SAVE Schreiben von Kategoriequantifikationen in eine Matrixdatei mit dem Unterbefehl MATRIX Erzeugen von Diagrammen mit geringer Aufl sung die lesbarer sind als die blichen hochaufl senden Diagramme mit dem Befehl SET m Erstellen von Zentroid und Transformationsdiagrammen f r bestimmte Variablen mit dem Unterbefehl PLOT Vollst
402. teln m chten wie sich die Kategorien der Zeilenvariable voneinander unterscheiden sollten Sie daher die Zeilenprinzipal Normalisierung verwenden Spaltenprinzipal Unter Umst nden sollen die Chi Quadrat Distanzen zwischen den Spalten der Korrespondenztabelle gen hert werden In diesem Fall sollten die Spaltenwerte dem gewichteten Durchschnitt der Zeilenwerte entsprechen Die Zeilenwerte werden so standardisiert dass eine gewichtete Summe der quadrierten Distanzen zum Zentroid 1 entsteht Bei dieser Methode werden die Distanzen zwischen den Spaltenkategorien maximiert Verwenden Sie diese Methode wenn Sie haupts chlich ermitteln m chten inwieweit sich die Kategorien der Spaltenvariable voneinander unterscheiden Symmetrisch Die Zeilen und Spalten k nnen auch symmetrisch behandelt werden Bei dieser Normalisierung wird die Tr gheit gleichm ig ber die Zeilen und Spaltenwerte gestreut Beachten Sie in diesem Fall dass weder die Distanzen zwischen den Zeilenpunkten noch die Distanzen zwischen den Spaltenpunkten eine N herung der Chi Quadrat Distanzen bilden Verwenden Sie diese Methode wenn Sie haupts chlich die Unterschiede oder hnlichkeiten zwischen den beiden Variablen untersuchen m chten Diese Methode wird in der Regel f r Biplots herangezogen Prinzipal Bei einer vierten Option der Prinzipal Normalisierung wird die Tr gheit zweimal in der L sung gestreut zun chst ber die Zeilenwerte und dann ber die Spaltenwerte
403. ten zeigt ob die vorhergesagte Antwort ansteigt oder abf llt wenn die Einflu gr e w chst und alle anderen Einflu gr en konstant bleiben Bei kategorialen Daten geht die Bedeutung eines Anstiegs bei einer Einflu gr e aus der Kodierung der Kategorien hervor Ein Anstieg bei Money back guarantee Package design oder Good Housekeeping seal f hrt beispielsweise zu einer niedrigeren vorhergesagten Einstufung der Bevorzugung Money back guarantee erh lt die Kodierung 1 f r no money back guarantee bzw die Kodierung 2 f r money back guarantee Ein Anstieg bei Money back guarantee bedeutet dass eine Geld zur ck Garantie hinzugef gt wurde Die Einf hrung einer Geld zur ck Garantie senkt daher die vorhergesagte Einstufung der Bevorzugung bewirkt also eine h here vorhergesagte Bevorzugung Abbildung 9 5 Regressionskoeffizienten Koeffizienten Standardisie Nicht standardisierte rte Koeffizienten Koeffizienten Standardf B ehler Beta Signifikanz Konstante Package design Brand name Price Money back guarantee Good Housekeeping seal a Abh ngige Variable Preference 102 Kapitel 9 Der Wert des Koeffizienten gibt das Ma f r die nderung der vorhergesagten Einstufung der Bevorzugung an Mithilfe standardisierter Koeffizienten werden die Interpretationen auf der Grundlage der Standardabweichungen der Variablen vorgenommen Jeder Koeffizient zeigt die Anzahl der Standardabweichungen um die sich die vo
404. terpretation nicht mehr zur Verf gung aber die Distanzen zwischen den Kategorien der einzelnen Variablen k nnen untersucht werden Durchf hrung der Analyse gt Gem dem Aufbau der Daten m ssen die F lle nach der Variablen H ufigke gewichtet werden W hlen Sie hierzu die folgenden Befehle aus den Men s aus Daten F lle gewichten 235 Korrespondenzanalyse Abbildung 12 22 Dialogfeld F lle gewichten image F lle nicht gewichten E brand F lle gewichten mit H ufigkeitsvariable s Aktueller Status F lle gewichten nachtreq gt F lle gewichten nach freq gt Klicken Sie auf OK Zum Erstellen einer anf nglichen L sung in f nf Dimensionen mit Prinzipal Normalisierung w hlen Sie die folgenden Befehle aus den Men s aus Analysieren Dimensionsreduktion Korrespondenzanalyse Abbildung 12 23 Dialogfeld Korrespondenzanalyse ee B Fur EZ Mosel F trea Bereich definieren Statistiken Spalte O Bereich definieren Einf gen Zur cksetzen Abbrechen Hilfe W hlen Sie mage als Zeilenvariable aus Klicken Sie auf Bereich definieren 236 Kapitel 12 Abbildung 12 24 Dialogfeld Zeilenbereich definieren E Korrespondenzanalyse Zeilenbereich definieren K Kategorienbereich f r Zeilenvariable image Minimalwert i Maximalwert rNebenbedingungen f r Kategorien a E Keine Kategorien m ssen
405. tersucht werden Beispielsweise haben hohe Interaktionsintensit t und nicht f rmliche Beziehung f r diese beiden Gruppen nicht dieselbe Bedeutung Alternativ k nnte die Verwendung einer L sung mit mehr Dimensionen in Erw gung gezogen werden Komponentenladungen Diese Abbildung zeigt das Diagramm der Komponentenladungen Die Vektoren Linien sind relativ lang was wiederum anzeigt dass der Gro teil der Varianz aller quantifizierten Variablen auf die ersten beiden Dimensionen entf llt In der ersten Dimension haben alle Variablen hohe positive Komponentenladungen Die zweite Dimension ist haupts chlich mit den quantifizierten Variablen Zugeh rigkeit und Entfernung in entgegengesetzte Richtungen korreliert Das bedeutet dass Objekte mit einem hohen negativen Wert in Dimension 2 einen hohen Wert f r das Zugeh rigkeitsgef hl und einen niedrigen Wert f r die physische N he aufweisen Die zweite Dimension macht daher einen Kontrast zwischen diesen beiden Variablen deutlich wohingegen sie kaum in Bezug zu den quantifizierten Variablen Interaktion und H ufigkeit Frequenz steht Abbildung 10 13 Komponentenladungen 1 0 Entfernung 0 5 Formalit t N c 7 c w E 00 a ganat Frequenz 0 5 Zugeh rigkeit 00 02 04 06 08 10 Dimension 1 Um die Relation zwischen Objekten und Variablen zu untersuchen betrachten Sie den Biplot der Objekte und Komponentenladungen Der Vektor einer Variablen weist in d
406. tiven Anteil jeder Dimension an der L sung In diesem Fall sind die Dimensionen gleich wichtig 305 Multidimensionale Entfaltung Abbildung 15 15 Dimensionsgewichtungen Snack with beverage only Breakfast with bevera Overall preference Breakfast with juice kes Sausage and beverage Dimension 2 n 0 1 2 3 4 5 Dimension 1 Das Diagramm der Dimensionsgewichtungen bietet eine Visualisierung der Gewichtungstabelle Breakfast with juice bacon and eggs and beverage und Snack with beverage only befinden sich am n chsten an den Dimensionsachsen sind jedoch beide nicht besonders spezifisch in einer bestimmten Dimension 306 Kapitel 15 Abbildung 15 16 Verbundenes Diagramm des individuellen Raums Breakfast with juice bacon and eggs and beverage a 29 17 25 29 Glazed donut 10 a A Cinnamon bun 40 0 ae poets 5 o o Jelly donut 146 een Ben o O 33 0 13201 Coffee cake 519 Enno HR ne 28 o 41 40 429 utes inant HERE AARON 5 Ze 37 en Toast pop up Dimension 2 Hard rolls and butter Dimension 1 Im verbundenen Diagramm des individuellen Raums Breakfast with juice bacon and eggs and beverage sind die Auswirkungen dieses Szenarios auf die Bevorzugungen dargestellt Diese Quelle ist st rker an der ersten Dimension beteiligt sodass die Unterscheidung zwischen den Artikeln meist auf die erste Dimension zur ckzuf hren ist 307 Abbildung 15 17 Multidime
407. tment of categorical information in physical anthropology International Journal of Anthropology 8 43 51 Heiser W J als auch J J Meulman 1994 Homogeneity analysis Exploring the distribution of variables and their nonlinear relationships In Correspondence Analysis in the Social Sciences Recent Developments and Applications M Greenacre als auch J Blasius Hgg New York Academic Press 179 209 Kruskal J B 1978 Factor analysis and principal components analysis Bilinear methods In International Encyclopedia of Statistics W H Kruskal als auch J M Tanur Hgg New York The Free Press 307 330 Kruskal J B als auch R N Shepard 1974 A nonmetric variety of linear factor analysis Psychometrika 39 123 157 Meulman J J 1993 Principal coordinates analysis with optimal transformations of the variables Minimizing the sum of squares of the smallest eigenvalues British Journal of Mathematical and Statistical Psychology 46 287 300 Meulman J J als auch P Verboon 1993 Points of view analysis revisited Fitting multidimensional structures to optimal distance components with cluster restrictions on the variables Psychometrika 58 7 35 Meulman J J A J Van der Kooij als auch A Babinec 2000 New features of categorical principal components analysis for complicated data sets including data mining In Classification Automation and New Media W Gaul als auch G Ritter Hgg Berlin Springer
408. tomatisch umkodieren verf gbar im Men Transformieren aufeinander folgende mit 1 beginnende Kategorien f r Variablen die als nominale oder ordinale Variablen behandelt werden Das Umkodieren in fortlaufende Ganzzahlen empfiehlt sich nicht f r Variablen die auf numerischem Niveau skaliert sind Um bei Variablen die als numerische Variablen behandelt werden eine m glichst kleine Ausgabe zu erzielen subtrahieren Sie f r alle Variablen von jedem Wert den Minimalwert und addieren Sie 1 Sie m ssen au erdem die f r die Quantifikation der einzelnen Variablen verwendete Skalierung ausw hlen m Ordinal Bei der beobachteten Variablen wird die Reihenfolge der Kategorien bei der quantifizierten Variablen beibehalten m Einzeln nominal Bei der quantifizierten Variablen erhalten Objekte der gleichen Kategorie den gleichen Wert m Mehrfach nominal Die Quantifikationen k nnen bei den einzelnen Dimensionen unterschiedlich sein m Diskret numerisch Die Kategorien werden als geordnet mit gleichen Abst nden behandelt Die Unterschiede zwischen den Kategorienummern und die Reihenfolge der Kategorien der beobachteten Variablen bleiben bei der quantifizierten Variablen erhalten 44 Kapitel 4 Bereich definieren Abbildung 4 4 Dialogfeld Bereich definieren w OVERALS Bereich definieren Minimum 1 Maximum Abbrechen Hilfe Sie m ssen f r jede Variable einen Bereich definieren Der a
409. trika 46 357 387 Kapitel Kategoriale Regression CATREG Durch die Kategoriale Regression werden kategoriale Daten quantifiziert indem den Kategorien numerische Werte zugewiesen werden Dadurch ergibt sich f r die transformierten Variablen eine optimale lineare Regressionsgleichung Die kategoriale Regression wird auch mit dem Akronym CATREG Categorical Regression bezeichnet Das Standardverfahren der linearen Regressionsanalyse beinhaltet die Minimierung der Summe von quadrierten Differenzen zwischen einer Antwortvariablen abh ngig und einer gewichteten Kombination von Einflu variablen unabh ngig Variablen sind in der Regel quantitativ wobei nominale kategoriale Daten in Bin r oder Kontrastvariablen umkodiert werden Infolgedessen dienen kategoriale Variablen einer Aufteilung in verschiedene Gruppen von F llen sodass jeweils separate Parameters tze f r jede Gruppe gesch tzt werden Die gesch tzten Koeffizienten geben die Auswirkung einer nderung in den Einflu variablen auf die Antwortvariable wieder Die Antwort kann f r jede beliebige Kombination von Einflu werten vorhergesagt werden Eine andere Methode besteht darin dass die Antwort auf die kategorialen Einflu werte selbst einer Regression unterzogen wird Folglich wird f r jede Variable ein Koeffizient gesch tzt Bei kategorialen Variablen sind die Kategoriewerte jedoch willk rlich Durch verschiedene Kodierungsarten der Kategorien ergeben sich jeweils unt
410. turen im Krankheitsverlauf 020 cece eee 174 Empfohlene Literatur 2 0 0 0 e cette ete eee 190 11 Nichtlineare kanonische Korrelationsanalyse 192 Beispiel Analyse der Umfrageergebnisse 2 22 000 e cece cece cece eee eens 192 Untersuchen der Daten 1 0 0 0 0 00 ccc tenet eee eens 193 Beriicksichtigen der hnlichkeiten zwischen Sets 00 ecceeeeeeeeeeee 199 Komponentenladungen 0 0 cece e eee ete eee 203 Transformationsdiagramme 000 ccc eens 204 Einzelkategoriekoordinaten im Vergleich mit Mehrfachkategoriekoordinaten 206 Zentroide und projizierte Zentroide 0 00 cece eee eee 207 Eine alternative Analyse 0 0 cece teen t eee 209 Allgemeine Vorschl ge 0 0 ccc eee ene n ee n een nee 214 Empfohlene Literatur 00 c ect tetet eee 215 12 Korrespondenzanalyse 216 Normalisierung u 4 21a ade a a a a a dr ti el wei nr 217 Beispiel Rauchgewohnheit nach Berufskategorie 0 00 eee e eee eee 218 Durchf hrung der Analyse 0 0000 cee teeta 218 Korrespondenztabelle 0 0 tenet eee n ene nees 221 Dimensionen 0 0 0 cee nennen nern eens 221 Biplot se via Kod oh eee okt cd wae eee deo baa edge eed lea Een 222 Profile und Distanzen 0 cece tet t tee nennen 223 Zeilen und Spaltenwerte 00 0 cece teens 225 Permutationen der Korrespondenztabelle 0 0 0
411. ty Hyperaktivit t scheinen nicht sehr gut in die L sung zu passen Sie k nnen dies am Diagramm sehen indem Sie die L nge der einzelnen Vektoren beobachten Die Vektorl nge einer Variablen entspricht ihrer Anpassung und die genannten Variablen haben die k rzesten Vektoren Auf der Grundlage einer Zwei Komponenten L sung w rden Sie diese Variablen vermutlich aus einer potentiellen Symptomatologie f r E st rungen herausnehmen In einer h herdimensionierten L sung k nnen sie jedoch besser passen 172 Kapitel 10 Die Variablen Sexual behavior Sexualverhalten Preoccupation with food and weight Besch ftigung mit Essen und Gewicht und Body perception K rperwahrnehmung bilden eine andere theoretische Symptomgruppe die damit zu tun hat wie der Patient seinen K rper erlebt Diese Variablen sind zwar mit den beiden im rechten Winkel zueinander stehenden Variablenb ndeln korreliert weisen jedoch ziemlich lange Vektoren auf und sind eng mit der ersten Dimension verbunden weshalb sie einige n tzliche Informationen ber den gemeinsamen Faktor liefern k nnen Objektwerte Die folgende Abbildung zeigt ein Diagramm der Objektwerte bei denen dei Subjekte mit ihrer jeweiligen Diagnosekategorie beschriftet sind Abbildung 10 37 Objektwertediagramm mit Diagnose beschriftet Dimension 2 Dimension 1 Dieses Diagramm erleichtert nicht die Interpretation der ersten Dimension weil darin die Patienten nicht nach Dia
412. uchen Um zu ermitteln wie die Tr gheit eines Punkts ber die Dimensionen gestreut wird berechnen Sie den Prozentsatz der Punkttr gheit der von den einzelnen Dimensionen beigetragen wird Beachten Sie dass die Beitr ge der Dimensionen zu den Werten f r die Punkttr gheit zusammengerechnet nicht immer 1 ergeben In einem reduzierten Raum wird die Tr gheit aus den h heren Dimensionen nicht dargestellt Wenn Sie die maximal zul ssigen Dimensionen verwenden werden auch die fehlenden Tr gheitswerte sichtbar 227 Korrespondenzanalyse Die ersten beiden Dimensionen tragen die gesamte Tr gheit f r Angestellte mit und ohne Erfahrung bei sowie nahezu die gesamte Tr gheit f r Junior Manager und Sekretariatsangeh rige Bei Senior Managern werden 11 der Tr gheit nicht durch die ersten beiden Dimensionen beigetragen Zwei Dimensionen tragen einen sehr gro en Teil der Tr gheiten f r die Zeilenpunkte bei hnliche Ergebnisse sind bei den Spaltenpunkten zu verzeichnen Bei jedem aktiven Spaltenpunkt tragen zwei Dimensionen mindestens 98 der Tr gheit bei Die dritte Dimension liefert nur einen sehr kleinen Beitrag zu diesen Punkten Permutationen der Korrespondenztabelle Unter Umst nden sollten die Kategorien in den Zeilen und Spalten sortiert werden Sie vermuten beispielsweise dass die Kategorien einer Variablen eine bestimmte Reihenfolge aufweisen kennen diese Reihenfolge jedoch nicht genau Dieses Ordnungsproblem tritt in vi
413. uelle Differenzen angegeben ist m Transformationsdiagramme Es wird ein Streudiagramm der urspr nglichen hnlichkeiten im Vergleich zu den transformierten hnlichkeiten erstellt Abh ngig davon wie Transformationen angewendet werden wird jeder Zeile oder Quelle eine separate Farbe zugewiesen Eine unabh ngige Transformation erzeugt eine Farbe m Shepard Diagramme Die urspr nglichen hnlichkeiten im Vergleich zu sowohl transformierten hnlichkeiten als auch Distanzen Die Distanzen werden durch Punkte angezeigt die transformierten hnlichkeiten durch eine Linie Abh ngig davon wie Transformationen angewendet werden wird f r jede Zeile oder Quelle eine separate Linie gezeichnet Eine unabh ngige Transformation erzeugt eine Linie m Streudiagramm der Anpassung Es wird ein Streudiagramm der transformierten hnlichkeiten im Vergleich zu den Distanzen angezeigt Wenn mehrere Quellen angegeben werden erh lt jede Quelle eine separate Farbe m Residuen Diagramme Es wird ein Streudiagramm der transformierten hnlichkeiten im Vergleich zu den Residuen transformierte hnlichkeiten minus Distanzen angezeigt Wenn mehrere Quellen angegeben werden erh lt jede Quelle eine separate Farbe Stile f r Zeilenobjekte Hiermit k nnen Sie umfassender festlegen wie Zeilenobjekte in den Diagrammen dargestellt werden Die Werte der optionalen Farbvariablen werden verwendet um alle Farben zu durchlaufen Die Werte der optionalen Markierungsva
414. uf Minimalwert i o Maximalwert Aktusiisieren rNebenbedingungen f r Kategorien Keine Kategorien m ssen gleich sein Erg nzende Kategorie Geben Sie 1 als Mindestwert ein Geben Sie 5 als H chstwert ein Klicken Sie auf Aktualisieren Klicken Sie auf Weiter vy v v vy y W hlen Sie Rauchen als Spaltenvariable aus 220 Kapitel 12 gt Klicken Sie im Dialogfeld Korrespondenzanalyse auf Bereich definieren Abbildung 12 4 Dialogfeld Spaltenbereich definieren E Korrespondenzanalyse Spaltenbereich definieren X rKategorienbereich f r Spaltenvariable rauchen Minimalwert 4 Lu Meme p Dand rNebenbedingungen f r Kategorien G Keine Kategorien m ssen gleich sein Erg nzende Kategorie Weiter Abbrechen Hilfe Geben Sie 1 als Mindestwert ein Geben Sie 4 als H chstwert ein Klicken Sie auf Aktualisieren Klicken Sie auf Weiter vy v v v y Klicken Sie im Dialogfeld Korrespondenzanalyse auf Statistiken Abbildung 12 5 Dialogfeld Statistiken Korrespondenzanalyse Statistiken x M Korrespondenztabelle mM bersicht der Zeilenpunkte M bersicht der Spaltenpunkte V Permutationen der Korrespondenztabelle H chste Dimension f r Permutationen h Zeilenprofile V Spattenprofile Ber f r V Zeilenpunkte V Spaltenpunkte Abbrechen Hilfe W
415. ugung von harten oder weichen Artikeln gruppiert und weisen in der vertikalen Dimension starke Variationen innerhalb der Gruppen auf Beispiel Dreifach Entfaltung von bevorzugten Fr hst cksartikeln In einer klassischen Studie Green et al 1972 wurden 21 MBA Studenten der Wharton School mit ihren Lebensgef hrten darum gebeten 15 Fr hst cksartikel in der Vorzugsreihenfolge von 1 am meisten bevorzugt bis 15 am wenigsten bevorzugt zu ordnen Die Bevorzugungen wurden in sechs unterschiedlichen Szenarien erfasst von Overall preference Allgemein bevorzugt bis Snack with beverage only Imbiss nur mit Getr nk Diese Informationen finden Sie in der Datei breakfast sav F r weitere Informationen siehe Beispieldateien in Anhang A auf S 326 298 Kapitel 15 Die sechs Szenarien k nnen als getrennte Quellen behandelt werden F hren Sie mit PREFSCAL eine Drei fach Entfaltung der Zeilen Spalten und Quellen durch Syntax mit denen Sie diese Analysen nachvollziehen k nnen befindet sich in der Datei prefscal_breakfast sps Durchf hrung der Analyse gt Um eine Analyse vom Ty Multidimensionale Entfaltung durchzuf hren w hlen Sie die folgenden Befehle aus den Men s aus Analysieren Skalieren Multidimensionale Entfaltung Abbildung 15 8 Hauptdialogfeld Multidimensionale Entfaltung Multidimensionale Entfaltung hnlichkeiten 2 Gender gender ail Danish pastry DP A G
416. und Preoccupation with food and weight Besch ftigung mit Essen und Gewicht Zentroide projiziert O auf Binge eating auf Preoccupation 10 14 O with food and weight 1 Z 18 4 15 17 11 auf Sexual 5910 il 7 attitude 18 9 913 16 6 afe 018414 92 Ei 7 16 8 2 12 A 6 15 213 4 1 1 2 2 1 3 w Dieses Diagramm zeigt dass beim ersten Zeitpunkt das Symptom Binge eating Fre attacken die Bulimie Patienten 2 und 3 von den anderen 1 und 4 trennt die sexuelle Einstellung trennt die anorektischen und atypischen Patienten 1 und 2 von den anderen 2 und 3 Preoccupation with food and weight Besch ftigung mit Essen und Gewicht bietet keine Trennung der Patienten Bei vielen Anwendungen w rde dieses Diagramm ausreichen um die Beziehung zwischen den Symptomen und der Diagnose zu beschreiben aufgrund der h heren Komplexit t durch die Zeitpunkte wird das Bild jedoch unklar 180 Kapitel 10 Um diese Projektionen im Verlauf der Zeit zu betrachten m ssen Sie in der Lage sein den Inhalt der Tabelle der projizierten Zentroide grafisch darzustellen Dies wird durch die OMS Anforderung erm glicht mit der diese Informationen in der Datei projected_centroids sav gespeichert wurden Abbildung 10 45 Projected_centroids sav projected_centroids sav SPSS Daten Editor m I o leg Datei Bearbeiten Ansicht Daten Transformieren Analysieren Grafiken Extras Add Ons Fenster Hilfe a y Pr
417. und Frauen zeigen dass diese Punkte in einer Dimension sehr stark repr sentiert sind Die h heren Dimensionen tragen folglich nur wenig zur Tr gheit dieser Punkte bei die sehr nahe an der horizontalen Achse liegen Die zweite Dimension liefert die gr ten Beitr ge f r M nner premium und stark Beide Dimensionen haben einen sehr geringen Anteil an der Tr gheit f r S d Australien und h sslich diese Punkte sind daher unterrepr sentiert 241 Korrespondenzanalyse Die bersicht der Spaltenpunkte zeigt die Beitr ge im Zusammenhang mit den Spaltenpunkten Die Marken CC und DD tragen am st rksten zur ersten Dimension bei die Marken FE und FF erkl ren einen Gro teil der Tr gheit f r die zweite Dimension Sowohl AA als auch BB bringen nur sehr geringe Beitr ge zu den Dimensionen Abbildung 12 30 Beitr ge der Marken Wert in Dimension des Punktes an der Tr gheit der der Dimension an der bersich Dimension Tr gheit des Punktes t ber Gesamt marke Masse Tr gheit bersicht AA BB cc DD EE FF Aktiver Gesamtwert In beiden Dimensionen sind alle Marken gut repr sentiert mit Ausnahme von BB CC und DD sind gut in einer Dimension vertreten Die zweite Dimension liefert die gr ten Beitr ge f r EE und FF Beachten Sie dass die Marke AA in der ersten Dimension zwar gut repr sentiert ist jedoch keinen sehr hohen Beitrag zu dieser Dimension liefert Diagramme Die Zeilenpunktdiagramme zeigen dass die
418. und Gewicht definieren Zusatzvariablen gt Skala definieren Beschriftungsvariablen Dimensionen in der L sung Fr er gt W hlen Sie Time of interview Zeitpunkt der Befragung bis Patient Number Patientennummer als Beschriftungsvariablen aus Klicken Sie auf Optionen 163 Kategoriale Hauptkomponentenanalyse Abbildung 10 26 Dialogfeld Optionen Zusatzobjekte Normalisierungsmethode Bereich von F llen SS Erster Benutzerdefinierter Wert Letzter rKriterien Einzelner Fall Konvergenz Hinzuf gen Maximalzahl der tterationen Andern z B P rDiagramme beschriften mit Entfernen Variablen oder Wertelabels Langenbegrenzung f r Beschriftungen rDiagrammdimensionen Alle Dimensionen in der L sung anzeigen anzahl der Dimensionen beschr nken Niedrigste Dimension H chste Dimension rKonfiguration W hlen Sie Variablennamen oder Werte als Option f r die Diagrammbeschriftung Klicken Sie auf Weiter Klicken Sie im Dialogfeld Kategoriale Hauptkomponenten auf Ausgabe 164 Kapitel 10 Abbildung 10 27 Dialogfeld Ausgabe V Objektwerte C Korrelationen der Originalvariablen M Komponentenladungen M Korrelationen der transformierten Variablen C terationsprotokoll C Yarianz ber cksichtigt f r Quantifizierte Variablen Kategorienquantifikationen Deskripti
419. und unterscheidet zwischen unangemessenem Verhalten fighting belching und angemessenerem Verhalten Die vertikale Dimension scheint enger mit den Zeilenobjekten Situationen zusammenzuh ngen und gibt verschiedene Beschr nkungen zwischen Verhalten und Situation vor Am unteren Ende der vertikalen Dimension befinden sich Situationen church class in denen das Verhalten auf die ruhigeren introspektiven Verhaltensweisen read write beschr nkt ist Diese Verhaltensweisen sind daher auf der vertikalen Achse weiter unten zu finden m Am oberen Ende der vertikalen Dimension befinden sich Situationen movies game date in denen das Verhalten auf die sozialen extrovertierten Verhaltensweisen eat kiss laugh beschr nkt ist Diese Verhaltensweisen sind daher auf der vertikalen Achse weiter oben zu finden m Inder Mitte der vertikalen Dimension werden Situationen in der horizontal Dimension entsprechend der allgemeinen Eingeschr nktheit der Situation unterteilt Die von den Verhaltensweise weiter entfernten interview sind am meisten eingeschr nkt w hrend die n her an den Verhaltensweisen liegenden room park allgemein weniger eingeschr nkt sind 321 Multidimensionale Entfaltung hnlichkeitstransformationen Abbildung 15 30 Transformationsdiagramm Transformed Proximity 0 2 4 6 8 10 Raw Proximity Uncondit
420. ungen eines f r einen US Bundesstaat zust ndigen Immobilienbewerters geht trotz eingeschr nkter Ressourcen die Einsch tzungen des Werts von Immobilien auf dem aktuellsten Stand zu halten Die F lle entsprechen den Immobilien in dem betreffenden Bundesstaat Jeder Fall in der Datendatei enth lt das County die Gemeinde und das Wohnviertel in dem sich die Immobilie befindet die seit der letzten Bewertung verstrichene Zeit sowie zu diesem Zeitpunkt ermittelten Wert property_assess_cs_sample sav Diese hypothetische Datendatei enth lt eine Stichprobe der in property_assess_cs sav aufgef hrten Immobilien Die Stichprobe wurde gem dem in der Plandatei property_assess csplan angegebenen Stichprobenplan gezogen und in dieser Datendatei sind die Einschlusswahrscheinlichkeiten und Stichprobengewichtungen erfasst Die zus tzliche Variable Current value Aktueller Wert wurde nach der Ziehung der Stichprobe erfasst und zur Datendatei hinzugef gt 334 Anhang A recidivism sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen einer Strafverfolgungsbeh rde geht einen Einblick in die R ckfallraten in ihrem Zust ndigkeitsbereich zu gewinnen Jeder Fall entspricht einem fr hren Straft ter und erfasst Daten zu dessen demografischen Hintergrund einige Details zu seinem ersten Verbrechen sowie die Zeit bis zu seiner zweiten Festnahme sofern diese innerhalb von zwei Jahren nach der ersten Festnahme erfolg
421. ve Statistik Optionen f r Objektwerte Diese Kategorien ber cksichtigen Objektwerte beschriften nach res rss Je W hlen Sie im Gruppenfeld Tabelle die Option Objektwerte Fordern Sie die Kategoriequantifikationen f r tidi an Wahlen Sie aus dass die Kategorien time diag und number ber cksichtigt werden sollen Klicken Sie auf Weiter vv v vy 7y Klicken Sie im Dialogfeld Kategoriale Hauptkomponenten auf Speichern 165 Kategoriale Hauptkomponentenanalyse Abbildung 10 28 Dialogfeld Speichern Kategoriale Hauptkomponenten Speichern Daten Set Name Daten Set Name Daten Set Name Weiter Hite W hlen Sie im Gruppenfeld Transformierte Variablen die Option In Arbeitsdatei speichern aus Klicken Sie auf Weiter Klicken Sie im Dialogfeld Kategoriale Hauptkomponenten auf Objekt 166 Kapitel 10 Abbildung 10 29 Dialogfeld Objekt und Variablendiagramme rDiagramme V Objektpunkte C Objekte und Variablen Biplot Variablenkoordinaten OLadungen Zentroide Objekte Ladungen und Zentroide Triplot rBiplot und Triplotvariablen Verf gbar Ausgew hlt Einschlie en weight Alle Variablen a Ausgew hlte Variablen rObjekte beschriften Verf gbar Beschriften anhand Fallnummer variable Abbrechen Hilfe W hlen Sie aus dass
422. von hnlichkeitsdaten um eine Darstellung einer einzelnen Gruppe von Objekten in einem schwachdimensionierten Raum mithilfe der Methode der kleinsten Quadrate zu finden m Verwenden Sie die multidimensionale Entfaltung zur Analyse von hnlichkeitsdaten um eine Darstellung zweier Gruppen von Objekten in einem schwachdimensionierten Raum mithilfe der Methode der kleinsten Quadrate zu finden 8 Kapitel 1 Kategoriale Regression Die Verwendung der kategorialen Regression ist am besten geeignet wenn das Ziel der Analyse darin besteht eine abh ngige Response Variable aus einem Set unabh ngiger Einflu Variablen vorherzusagen Wie bei allen Prozeduren f r die optimale Skalierung werden jeder Kategorie jeder Variablen Skalenwerte zugewiesen dergestalt dass diese Werte in Bezug auf die Regression optimal sind Die L sung einer kategorialen Regression maximiert die quadrierte Korrelation zwischen der transformierten Responsevariablen und der gewichteten Kombination transformierter Einflu variablen Beziehung zu anderen Prozeduren von Categories Die kategoriale Regression mit optimaler Skalierung ist vergleichbar mit der kanonischen Korrelationsanalyse mit optimaler Skalierung und zwei Sets von denen ein Set jeweils nur eine Variable enth lt Bei letzterem Verfahren wird die hnlichkeit der Sets abgeleitet indem jedes Set mit einer unbekannten Variablen verglichen wird die irgendwo zwischen allen Sets liegt Bei der kategorialen
423. wendung aufeinander folgender Ganzzahlen als Codes f r als nominal oder ordinal behandelte Variablen f hrt zu einer deutlich kleineren Ausgabe ohne die Ergebnisse zu beeintr chtigen Die Kodierungsschemata f r Variablen die als numerisch behandelt werden unterliegen gr eren Einschr nkungen als dies bei ordinalen Variablen der Fall ist Bei diesen Variablen ist die Differenz zwischen aufeinander folgenden Kategorien von Bedeutung In der folgenden Tabelle werden drei Kodierungsschemata f r Alter angezeigt Tabelle 1 3 Alternative Kodierungsschemata f r das Alter Schema Kategorie A B C 20 20 1 1 22 22 3 2 25 25 6 3 27 27 8 4 Bei allen Aufzeichnungen numerischer Variablen m ssen die Differenzen zwischen den Kategorien erhalten bleiben Die Verwendung der urspr nglichen Werte ist eine Methode um die Beibehaltung der Differenzen zu gew hrleisten Dies kann jedoch dazu f hren dass viele Kategorien Indikatoren f r systemdefiniert fehlende Werte aufweisen Beispiel Schema A verwendet die urspr nglich beobachteten Werte Bei allen Prozeduren von Categories mit Ausnahme der Korrespondenzanalyse ist der maximale Kategoriewert 27 und der minimale Kategoriewert ist auf 1 gesetzt Die ersten 19 Kategorien sind leer und erhalten Indikatoren f r systemdefinierte fehlende Werte Die Ausgabe kann schnell sehr umfangreich und komplex werden wenn der maximale Kategoriewert wesentlich gr er als 1 ist und s
424. ypothetische Datendatei bei der es um die Bem hungen eines Herstellers geht der ermitteln m chte ob ein neue hochwertige Keramiklegierung eine gr ere Hitzebest ndigkeit aufweist als eine Standardlegierung Jeder Fall entspricht einem Test einer der Legierungen die Temperatur bei der das Keramikw lzlager versagte wurde erfasst cereal sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um eine Umfrage geht bei der 880 Personen nach ihren Fr hst ckgewohnheiten befragt wurden Au erdem wurden Alter Geschlecht Familienstand und Vorliegen bzw Nichtvorliegen eines aktiven Lebensstils auf der Grundlage von mindestens zwei Trainingseinheiten pro Woche erfasst Jeder Fall entspricht einem Teilnehmer 329 Beispieldateien clothing_defects sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Qualit tskontrolle in einer Bekleidungsfabrik geht Aus jeder in der Fabrik produzierten Charge entnehmen die Kontrolleure eine Stichprobe an Bekleidungsartikeln und z hlen die Anzahl der Bekleidungsartikel die inakzeptabel sind coffee sav Diese Datendatei enth lt Daten zum wahrgenommenen Image von sechs Eiskaffeemarken Kennedy Riquier als auch Sharp 1996 Bei den 23 Attributen des Eiskaffee Image sollten die Teilnehmer jeweils alle Marken ausw hlen die durch dieses Attribut beschrieben werden Die sechs Marken werden als AA BB CC DD EE und FF b
425. yse jedoch ist nicht gleich der zweiten Dimension der Faktorenanalyse Multidimensionale Skalierung Die multidimensionale Skalierung ist am besten geeignet wenn das Ziel der Analyse darin besteht die Struktur eines Sets von Distanzma en innerhalb einer einzelnen Gruppe von Objekten oder F llen zu ermitteln Dies wird durch das Zuweisen von Beobachtungen zu bestimmten Positionen in einem konzeptuellen Raum mit wenigen Dimensionen erzielt wobei die Abst nde zwischen den Punkten des Raumes mit den vorgegebenen Un hnlichkeiten bzw hnlichkeiten so gut wie m glich bereinstimmen Als Ergebnis werden die Objekte in diesem Raum mit wenigen Dimensionen mithilfe der Methode der kleinsten Quadrate dargestellt was h ufig zu einem besseren Verst ndnis der Daten beitr gt Beziehung zu anderen Prozeduren von Categories Wenn multivariate Daten vorliegen aus denen Sie Distanzen erstellen und anschlie end mit multidimensionaler Skalierung analysieren erhalten Sie ein hnliches Ergebnis wie bei der Analyse der Daten mithilfe der kategorialen Hauptkomponentenanalyse mit Objektprinzipal Normalisierung Diese Art von PCA ist auch als Hauptkoordinatenanalyse bekannt Beziehung zu Standardverfahren Die Prozedur Multidimensionale Skalierung von Categories PROXSCAL bietet zahlreiche Verbesserungen gegen ber der in SPSS Base verf gbaren Skalierungsprozedur ALSCAL PROXSCAL bietet einen schnelleren Algorithmus f r bestimmte Modelle und erm g
426. zeichnungen au erhalb der Kernfamilie 285 Multidimensionale Skalierung Dreidimensionale L sung mit nicht standardm igen Transformationen Bei der vorangegangenen L sung wurde die Verh ltnistransformation nach dem Standardverfahren f r hnlichkeiten verwendet sowie Intervalltransformationen f r die unabh ngigen Variablen gener und degree Die Ergebnisse sind schon recht gut mit anderen Transformationen k nnten Sie jedoch noch bessere Resultate erzielen Die hnlichkeiten sowie die Variablen gener und degree besitzen beispielsweise jeweils eine nat rliche Reihenfolge k nnten jedoch mit einer ordinalen Transformation noch besser modelliert werden als mit einer linearen Transformation Abbildung 14 16 Dialogfeld Modell Multidimensionale Skalierung Modell Skalierungsmodell hnlichkeitstransformationen Identit t Yerh ftnisskala _ Euklidisch gewichtet _ Intervall _ Euklidisch verallgemeinert a _ Reduzierter Rang _ Gebundene Beobachtungen l sen Spline Form G Untere Dreiecksmatrix i x Transformationen zuweisen _ Obere Dreiecksmatrix Getrent in jeder Quelle J Gesamte Matrix _ Alle Quellen gleichzeitig hnlichkeiten Dimensionen Un hnlichkeiten Minimum 3 gt hnlichkeiten Maximum 3 Abbrechen Hite gt Um die Analyse zu wiederholen und dabei die hnlichkeiten sowie die Variablen gener und degree auf einem ordinalen
427. zweidimensionalen L sung weist eine gute Qualit t auf k nnen Sie Plots der Zeilenpunkte und der Spaltenpunkte untersuchen um herauszufinden welche Kategorien der Zeilenvariablen hnlich sind welche Kategorien der Spaltenvariablen hnlich sind und welche Zeilen und Spaltenkategorien einander hnlich sind Beziehung zu anderen Prozeduren von Categories Die einfache Korrespondenzanalyse ist auf zweidimensionale Tabellen beschr nkt Liegen mehr als zwei relevante Variablen vor k nnen Sie die Variablen zu Interaktionsvariablen zusammenfassen Bei den Variablen Region T tigkeit und Alter beispielsweise k nnten Region und T tigkeit zu der neuen Variablen Regt tigkeit zusammengefa t werden die wie in der untenstehenden Tabelle gezeigt 12 Kategorien aufweist Diese neue Variable f hrt zu einer zweidimensionalen Tabelle mit Alter 12 Zeilen 4 Spalten die mithilfe der Korrespondenzanalyse analysiert werden kann Tabelle 1 4 Kombinationen von Region und T tigkeit Kategoriecode Kategoriedefinition Kategoriecode Kategoriedefinition 1 Norden Praktikant 7 Osten Praktikant 2 Norden Vertreter 8 Osten Vertreter 3 Norden Manager 9 Osten Manager 4 Siiden Praktikant 10 Westen Praktikant 5 Siiden Vertreter 11 Westen Vertreter 6 S den Manager 12 Westen Manager Ein Nachteil bei diesem Ansatz besteht darin dass beliebige Variablenpaare zusammengefa t werden k nnen T tigkeit und Alter k n

Download Pdf Manuals

image

Related Search

Related Contents

Télécharger le manuel  null - Gardif    LEDRJ-42478K-LS9    本文を見る  smartLAB®global W nG  Programme GEVER Bund 2008-2012  取扱説明書  MCAM 4 User Manual  

Copyright © All rights reserved.
Failed to retrieve file