Home

SPSS Categories™ 17.0 - Dipartimento di Psicologia dei Processi di

image

Contents

1. Annulla Aiuto gt Selezionare i grafici di trasformazione da Altezza di base inversione a Giorno dell anno gt Fare clic su Continua gt Nella finestra di dialogo Regressione categoriale scegliere OK 118 Capitolo 9 Figura 9 30 Riepilogo modello R quadrato Rmultiplo R quadrato corretto Variabile dipendente ozon Stimatori ibh dpg vis temp doy Il trattamento di tutti i predittori come nominali genera un R pari a 0 886 Questa ampia porzione di varianza spiegata non sorprendente perch il trattamento nominale non impone vincoli sulle quantificazioni Tuttavia l interpretazione dei risultati pu essere alquanto complessa Figura 9 31 Coefficienti di regressione tutti predittori nominali Coefficienti standardizzati Errore std 144 187 123 227 69 528 469 542 203 250 Variabile dipendente ozon La seguente tabella mostra i coefficienti di regressione standardizzati dei predittori Un errore comune nell interpretazione di questi valori consiste nel concentrarsi sui coefficienti trascurando le quantificazioni Non possibile affermare che l elevato valore positivo del coefficiente Temperatura implica che se aumenta la temperatura il valore atteso di Ozono aumenta Analogamente il coefficiente negativo di Altezza di base inversione non suggerisce che l aumento di Altezza di base inversione determini la riduzione del valore atteso di Ozono Tutte le interpretazioni
2. Quantificazione Confezione Esempio Dati sull ozono Nell esempio verr utilizzato un insieme pi ampio di dati per illustrare la selezione e gli effetti delle trasformazioni con scaling ottimale I dati includono 330 osservazioni su sei variabili meteorologiche precedentemente analizzate tra gli altri da Breiman e Friedman Breiman e Friedman 1985 e da Hastie e Tibshirani Hastie e Tibshirani 1990 La seguente tabella descrive le variabili originali La regressione categoriale tenta di prevedere la concentrazione di ozono dalle variabili restanti I precedenti ricercatori hanno rilevato non linearit tra queste variabili che impediscono un approccio di regressione standard Tabella 9 2 Variabili originali Variabile Descrizione ozono livello ozono giornaliero categorizzato in una di 38 categorie abi altezza di base inversione amp P gradiente pressione mm Hg vis visibilita in miglia 114 Capitolo 9 Variabile Descrizione temp temperatura gradi F gda giorno dell anno Questo insiemi di dati reperibile nel file ozone sav Per ulteriori informazioni vedere File di esempio in Appendice A a pag 321 Discretizzazione delle variabili Se una variabile ha pi categorie di quante siano effettivamente interpretabili necessario modificare le categorie utilizzando la finestra di dialogo Discretizzazione per ridurne la gamma a un numero pi gestibile La variabile Giorno dell anno ha un valore minim
3. Dimensione 2 0 1 2 3 4 5 Dimensione 1 Il grafico Pesi di dimensione fornisce un indicazione visiva della tabella dei pesi Le origini Colazione con succo pancetta uova e bibita e Snack con bibita sono quelle pi vicine agli assi delle dimensioni ma nessuna delle due specifica per una dimensione 301 Unfolding multidimensionale Figura 15 16 Grafico congiunto dello spazio individuale Colazione con succo pancetta uova e bibita 30 Pane dolce e cannella 20 25 Dolcetto alla marmellata 10 50 927 na 28 24 13 8 8 Po 6508 40 0 131299 Dolest staaabtanesi 022160 Hib 8 16 __ Torta alcaff 936 19 Dolcetto miti a I Marmi ha 54 O 39 o 4 29 oo Toast aipageREHmostarda Pane integrale imburrato 32 o 11 Toastcon margarina 37 Panino imburrato Dimensione 2 e 1 4 12 z 02745 o Toast 10 5 0 5 10 Dimensione 1 Il grafico congiunto dello spazio individuale Colazione con succo pancetta uova e bibita mostra l effetto dello scenario sulle preferenze Questa sorgente pesa molto di pi sulla prima dimensione quindi la differenziazione tra gli oggetti dipende soprattutto da questa dimensione 302 Capitolo 15 Figura 15 17 Grafico congiunto dello spazio individuale Snack con bibita 27251 OpbRtna asesel ata 5 0 17 030 Pane dolce cannella 5 999009 0860 P56 w gos 15440Pasticcini danesi 25 28 329 OTorta al caff O 29 34 35 15 31 4 19 o 182 3338 9 00 Dolc o mi
4. Statistiche descrittive Selezionare Punteggi degli oggetti nel gruppo Tabelle Richiedere le quantificazioni di categoria per tidi gt gt gt Scegliere di includere le categorie ora diag e numero gt Fare clic su Continua gt Fare clic su Salva nella finestra di dialogo Analisi componenti principali categoriale 161 Analisi Componenti principali categoriale Figura 10 28 Salva Componenti principali categoriale Salva Nome file di dati py f Nome file di dati Nome file di dati gt Nel gruppo Variabili trasformate selezionare Salva nel file di dati attivo gt Fare clic su Continua gt Fare clic su Oggetto nella finestra di dialogo Analisi componenti principali categoriale 162 Capitolo 10 Figura 10 29 Finestra di dialogo Grafici di oggetti e di variabili x Componenti principali categoriale Grafici di oggetti e di variabili x Disponibili Includi pi ni purga iperatt amig emang amci gt Scegliere di etichettare gli oggetti in base a Variabile gt Selezionare ora e diag come variabili in base alle quali etichettare gli oggetti gt Fare clic su Continua gt Fare clic su Categoria nella finestra di dialogo Analisi componenti principali categoriale 163 vvevev y Analisi Componenti principali categoriale Figura 10 30 Finestra di dialogo Grafici di categoria i Componenti principali categoriale Gr
5. Vincoli sulle categorie Nessuna O Le categorie sono uguali O La categoria supplementare Digitare 1 come valore minimo Digitare 4 come valore massimo Fare clic su Aggiorna Fare clic su Continua V v VV vy y Figura 12 5 Finestra di dialogo Statistiche 1 Analisi delle corrispondenze Statistiche Tavola di corrispondenza Riepilogo dei punti di riga Riepilogo dei punti di colonna Permutazioni della tavola di corrispondenza Dimensione massima permutazioni Profili di riga Profili di colonna Statistiche di confidenza per Punti di riga gt Selezionare Profili di riga e Profili di colonna gt Selezionare Permutazioni della tabella di corrispondenza gt Selezionare le statistiche di confidenza per Punti di riga e Punti di colonna Analisi corrispondenze Nella finestra di dialogo Analisi della corrispondenze fare clic su Statistiche 218 Capitolo 12 gt Fare clic su Continua gt Nella finestra di dialogo Analisi della corrispondenze fare clic su OK Tabella di corrispondenza La tabella di corrispondenza mostra la distribuzione del tabagismo per cinque livelli di categorie lavorative Le righe della tabella di corrispondenza rappresentano le categorie lavorative Le colonne rappresentano il livello di tabagismo Figura 12 6 Tavola di corrispondenza Fumatore Categoria No Leggero Medio Accanito Margine attivo Dirigenti anziani Dirigenti giovani Impiegati anzia
6. _ Preferiti Elementi di base Barra rr II Lineare ID gruppi punti Ad area ene corcalpolare Titoli Note a pi di 4 dispersione punti SS ns Istogramma Alto Basso Propriet elemento Grafico a scatola a Assi duali Opzioni ZA A gt Infine per visualizzare i centroidi proiettati del momento temporale della diagnosi su eccessi alimentari nel tempo richiamare Generatore di grafici e fare clic su Ripristina per annullare le selezioni precedenti gt Selezionare il modello Dispersione Punti e scegliere A dispersione raggruppato gt Selezionare Centroidi proiettati su Eccessi alimentari come variabile dell asse y e tempo come variabile dell asse x gt Scegliere di impostare i colori in base a diagnosi gt Fare clic su OK 181 Analisi Componenti principali categoriale Figura 10 50 Centroidi proiettati del momento della diagnosi su Eccessi alimentari nel tempo m Editor dei grafici File Modifica Visualizza opzioni Elementi ise XY eM mMOBS MA LEZ CEEE ti i O is E UIl iE ki th Ae la 9 D ta o D E m z o v Eod D 2 a uw zs 5 gt di o oO a 376 5 L 470 25 punti gt Quindi per collegare i punti fare doppio clic sul grafico e quindi fare clic sullo strumento Aggiungi linea di interpolazione nell Editor dei grafici gt Chiudere l Editor dei grafici Rispetto agli eccessi alimenta
7. r RA Precedente Successivo amp Quotidiani letti pi spes ________ Variabili Musica preferita musica amp Preferenze abitative a et 1 Ordinale all Punteggio al test di mat all Punteggio al test linguis statciv 1 Ordinale Definisci intervallo e scala Etichetta grafici Me Penisoni Ta gardia Eana 2 gt Definisci intervallo Dimensioni nella soluzione 2 gt Selezionare Et in anni e Stato civile come variabili per il primo insieme gt Selezionare et e fare clic su Definisci intervallo e scala Figura 11 3 Finestra di dialogo Definisci intervallo e scala OVERALS Definisci intervallo e Minimo 1 Massimo Scala di misurazione Ordinale Nominale multipla O Nominale singola Numerica discreta gt Digitare 10 come valore massimo per questa variabile gt Fare clic su Continua gt Nella finestra di dialogo Analisi della correlazione canonica non lineare selezionare statociv e fare clic su Definisci intervallo e scala 191 Analisi della correlazione canonica non lineare OVERALS Figura 11 4 Finestra di dialogo Definisci intervallo e scala Minimo 1 Massimo b Scala di misurazione Nominale multipla gole Numerica discreta gt Digitare 3 come valore massimo per questa variabile gt Selezionare Nominale singola come scala di misura
8. 0 82 8 Unfolding multidimensionale PREFSCAL 83 Definizione di un modello di unfolding multidimensionale eee eeeaee 84 Vincoli relativi all unfolding multidimensionale 2 0 0 0 ccc cece cee eee ees 86 Opzioni di unfolding multidimensionale 0 87 Grafici di unfolding multidimensionale 00 89 Output dell unfolding multidimensionale 0 0000 c cee eee eee eee 90 Funzioni aggiuntive del comando PREFSCAL 000 cece eee eee eee 92 vii Parte Il Esempi 9 Regressione categoriale 94 Esempio Dati relativi a un battitappeto 0 0 cece ene eee 94 Analisi della regressione lineare standard 95 Analisi di regressione categoriale een teen eens 101 Esempio Dati SU l OZONO LL 113 Discretizzazione delle variabili 114 Selezione del tipo di trasformazione LL 114 Ottimalit delle quantific azioni 125 Effetti delle trasformazioni LL 127 Letttire consigliate 2 502 064 4404 iaia a ede e a 136 10 Analisi Componenti principali categoriale 138 Esempio Esame delle interrelazioni tra sistemi sociali 138 Esecuzione dell analist s cers serri pai i ae ei 139 Numero di dimensioni LL 143 Quantific azioni 144 Punteggloggetto i iii eli e ea ed 146 Pesi di componente 147 Dimensioni aggiuntive 149 Esempio Sintomatologia dei disturbi dell alimentazione 0 151 Esecuzione dell analisi iaia a 152 Grafici di trasformazione LL 164 Riepilogo del modello Regressione Output
9. 166 Pesi di COMPoOmentes is ii e i eed dea ea de ds 167 Punteggi Oggetto 168 Esame della struttura dell andamento della malattia 0 0 0 0 cc cece eee 170 Letture consigliate 185 11 Analisi della correlazione canonica non lineare OVERALS 188 Esempio un analisi dei risultati dell indagine i 188 Esame delidati moiti sdra lee e e e a 189 Spiegazione della similarit tra gli insiemi LL 195 Pesi di COMPonente i 199 viii Grafici di trasformazione 200 Coordinate della categoria multipla vs categoria singola 202 Centroidi e centroidi proiettati 203 Un analisi alternativa eines bead ovens i ae e a 206 Suggerimenti generali cette tenes 211 Letture consigliate 212 12 Analisi corrispondenze 213 Normalizz azione aee eae a e a a a A e ra 214 Esempio Tabagismo per categoria lavorativa LL 214 Esecuzione dell analisi 215 Tabella di corrispondenza 00 0 c cece cect nee eee 218 Dimensionalit 0 218 Biplot 3 0 04 ib heehee hier i ira e ea 219 Profili distanze i a RR i E a a 220 Punteggi di riga e di colonna LL 221 Permutazioni della tabella di corrispondenza 223 Statistiche di confidenza 224 Profili supplementari LL 225 Esempio Percezione delle marche di caff nananana eens 230 Esecuzione dell analisi 231 Dimensionalit LL 235 Contributi Analisi delle corrispondenze LL 236 Grafici e Bad e a rr 237 Normalizzazione simmetrica
10. Grafici Elastic Net Per il metodo Elastic Net vengono prodotti dei grafici di regolarizzazione in base ai valori della penalit di regressione Ridge Produci tutti i possibili grafici Elastic Net utilizza tutti i valori dell intervallo determinato dai valori di penalit di regressione Ridge minimo e massimo specificati Produci grafici Elastic Net per alcune penalit Ridge consente di specificare un sottoinsieme dei valori dell intervallo determinato dal minimo e dal massimo Digitare il numero di un valore di penalit o indicare un intervallo di valori e fare clic su Aggiungi Regressione categoriale Output Nella finestra di dialogo Output possibile selezionare le statistiche che si desidera visualizzare nell output Figura 2 7 Finestra di dialogo Output z Regressione categoriale output Tabelle Ricampionamento MR multiplo Nessuno M ANOVA O Convalidaincrociata V Coefficienti Bootstrap 632 C Cronologia delle iterazioni C Correlazioni delle variabili originali C Correlazioni delle variabili trasformate C Coefficienti e modelli regolarizzati Variabili di analisi 3 Quantificazioni di categoria pref package brand price seal money Statistiche descrittive Annulla Aiuto Tabelle Consente di creare tabelle per R multiplo Comprende R2 R2 corretto ed R2 corretto basati sulla scala ottimale 24 Capitolo 2 ANOV
11. mn 1 2 3 e i oa es as SS eee N oO Visualizzazione dati Visualizzazione variabili Le variabili Eccessialimentari Atteggiamentosessuale e Preoccupazionecibopeso contengono i valori dei centroidi proiettati su ciascuno dei sintomi di interesse Il numero dei casi da 1 a 16 corrisponde all interazione diagnosi tempo Sar necessario calcolare le nuove variabili che separano i valori Tempo e Diagnosi gt Dai menu scegliere Trasforma Calcola variabile 177 Figura 10 46 Finestra di dialogo Calcola variabile x Calcola variabile me froe GcaseneDW ri non BScnoo orteana no Qua Lio OJ Emna j gt Digitare tempo come variabile di destinazione Analisi Componenti principali categoriale Tutto Aritmetiche CDF e CDF noncentrale Conversione Data Ora corrente Aritmetica data gt Digitare trunc casenum 1 4 1 come espressione numerica gt Fare clic su OK 178 Capitolo 10 Figura 10 47 Finestra di dialogo Calcola variabile a Calcola variabile E o mod casenum 1 4 1 Inserisci amp etichetta Tutto Aritmetiche CDF e CDF noncentrale Conversione Data Ora corrente Aritmetica data condizione di selezione dei casi facoltativa see LK J imola Reimposta __Annula isto gt Richiamare la finestra di dialogo Calcola variabile gt Digitare diagnosi come variabile di destinazione
12. 187 Analisi Componenti principali categoriale Wagenaar W A 1988 Paradoxes of gambling behaviour London Lawrence Erlbaum Associates Inc Young F W Y Takane e J De Leeuw 1978 The principal components of mixed measurement level multivariate data An alternating least squares method with optimal scaling features Psychometrika 43 279 281 Zeijl E Y te Poel M du Bois Reymond J Ravesloot e J Meulman 2000 The role of parents and peers in the leisure activities of young adolescents Journal of Leisure Research 32 281 302 Capitolo Analisi della correlazione canonica non lineare OVERALS Lo scopo dell analisi della correlazione canonica non lineare determinare la similarit reciproca di due o pi insiemi di variabili Come nell analisi della correlazione canonica lineare l obiettivo quello di spiegare la maggior parte dei valori di varianza osservati nelle relazioni tra gli insiemi in uno spazio dimensionale ridotto Diversamente dall analisi della correlazione canonica lineare tuttavia l analisi della correlazione canonica non lineare non presume un livello di intervallo di misurazione o che le relazioni siano lineari Un altra importante differenza costituita dal fatto che l analisi della correlazione canonica non lineare determina la similarit tra gli insiemi confrontando contemporaneamente le combinazioni lineari delle variabili di ogni insieme con un insieme sconosciuto di
13. 5p amp Ordinale Spline nominale Nominale Numerica Spline Grado 2 Nodi interni 3 _ Annulla Aiuto Livello di scaling ottimale inoltre possibile selezionare il livello di scaling per la quantificazione di ciascuna variabile m Spline ordinale Nella variabile con scaling ottimale viene mantenuto l ordine delle categorie della variabile osservata I punti di categoria si troveranno su una linea retta vettore che passa per l origine La trasformazione ottenuta un polinomio livellato monotono del grado specificato Gli elementi vengono determinati dal numero di nodi interni definito dall utente e dalla relativa posizione stabilita dalla procedura m Spline nominale Le uniche informazioni della variabile osservata che verranno mantenute nella variabile con scaling ottimale sono quelle relative al raggruppamento degli oggetti in categorie Non viene mantenuto l ordine delle categorie della variabile osservata I punti di categoria si troveranno su una linea retta vettore che passa per l origine La trasformazione ottenuta un polinomio livellato possibilmente non monotono del grado specificato Gli elementi vengono determinati dal numero di nodi interni definito dall utente e dalla relativa posizione stabilita dalla procedura m Ordinale Nella variabile con scaling ottimale viene mantenuto l ordine delle categorie della variabile osservata I punti di categoria si troveranno su una linea rett
14. Il modello ha come risultato un R pari a 0 875 quindi la varianza spiegata si riduce in modo trascurabile quando le quantificazioni per Temperatura sono vincolate a essere ordinate 124 Capitolo 9 Figura 9 40 Coefficienti di regressione con Temperatura ordinale Coefficienti standardizzati Errore std 132 628 111 757 72 360 517 262 173 158 Variabile dipendente ozon Questa tabella visualizza i coefficienti per il modello in cui Temperatura scalata come ordinale Confrontando i coefficienti per il modello in cui Temperatura scalata come nominale non si evidenziano modifiche di rilievo Figura 9 41 Correlazioni importanza e tolleranza Correlazioni Parziali Ordine zero Parziali indipendenti Importanza Variabile dipendente ozon Tolleranza Dopo la trasforma zione Prima della trasformazi one Inoltre le misure di importanza suggeriscono che Temperatura resti molto pi importante della regressione che delle altre variabili Ora tuttavia come risultato del livello di scaling ordinale di Temperatura e del coefficiente di regressione positivo possibile affermare che se Temperatura aumenta il valore atteso di ozono aumenta anch esso 125 Regressione categoriale Figura 9 42 Grafico di trasformazione per Temperatura ordinale Quantificazioni 1 34567891111 0123 Categorie Il grafico di trasformazione illustra il vincolo ordinale su
15. Metodo di normalizzazione Selezionare una delle alternative seguenti Simmetrico Per ciascuna dimensione i punteggi di riga sono uguali alla media ponderata dei punteggi di colonna divisa per il valore singolare corrispondente e i punteggi di colonna sono uguali alla media ponderata dei punteggi di riga divisa per il valore singolare corrispondente Utilizzare questo metodo se si desidera analizzare le differenze o le similarit tra le categorie delle due variabili m Principale Le distanze tra i punti di riga e i punti di colonna sono approssimazioni delle distanze riportate nella tabella delle corrispondenze in base alla misura della distanza selezionata Usare questo metodo per analizzare le differenze tra le categorie di una o entrambe le variabili anzich le differenze tra le due variabili m Principale per riga Le distanze tra i punti di riga sono approssimazioni delle distanze riportate nella tabella delle corrispondenze in base alla misura della distanza selezionata I punteggi di riga sono la media ponderata dei punteggi di colonna ed adatto per esaminare le differenze fra le categorie della variabile di riga m Principale per colonna Le distanze tra i punti di colonna sono approssimazioni delle distanze riportate nella tabella delle corrispondenze in base alla misura della distanza selezionata I punteggi di colonna sono la media ponderata dei punteggi di riga Utilizzare questo metodo se si desidera analizzare le differe
16. Per le correlazioni delle variabili scalate in modo ottimale possibile scegliere il metodo di assegnazione Selezionare Moda per sostituire i valori mancanti con la moda della variabile scalata in modo ottimale Selezionare Categoria distinta per sostituire i valori mancanti con la quantificazione di una categoria supplementare Ci implica che gli oggetti con un valore mancante nella variabile specificata vengono considerati come appartenenti alla stessa categoria supplementare Assegna i valori mancanti Agli oggetti con valori mancanti della variabile selezionata vengono assegnati i valori ed possibile scegliere il metodo di assegnazione Selezionare Moda per sostituire i valori mancanti con la categoria pi frequente Se sono disponibili pi mode verr utilizzata quella con l indicatore di categoria minore Selezionare Categoria distinta per sostituire i valori mancanti con la stessa quantificazione di una categoria supplementare Ci 61 Analisi corrispondenze multiple implica che gli oggetti con un valore mancante nella variabile specificata vengono considerati come appartenenti alla stessa categoria supplementare m Escludi gli oggetti con valori mancanti per la variabile Gli oggetti con valori mancanti della variabile selezionata sono esclusi dall analisi Questa strategia non disponibile per le variabili supplementari Opzioni dell analisi delle corrispondenze multiple Nella finestra di dialogo Opzioni pos
17. Quantificazione Pressu dpg Nominale Quantificazione Visibilt temp Nominale Quantificazione Tempe Quantificazione Day of Grafici Discretizza Salva gt Deselezionare Visibilit miglia e Giorno dell anno come variabili indipendenti gt Fare clic su OK Figura 9 46 Riepilogo del modello per regressione categoriale sui tre predittori R quadrato R multiplo R quadrato corretto Variabile dipendente ozon Stimatori ibh dpg temp L analisi di regressione categoriale ha un adattamento pari a 0 798 migliore di 0 733 Questo dimostra la propriet degli scaling consistente nel fatto che le quantificazioni ottenute nella regressione originale sono ottimali solo quando tutte le cinque variabili sono incluse nel modello Effetti delle trasformazioni La trasformazione delle variabili crea una relazione non lineare tra la risposta originale e l insieme originale di predittori lineare per le variabili trasformate Tuttavia quando sono presenti pi predittori le altre variabili nel modello creano confusione circa le relazioni pairwise Per concentrare l analisi sulla relazione tra Livello giornaliero di ozono e Giorno dell anno si esamini un grafico a dispersione Dai menu scegliere Grafici Generatore di grafici 128 Capitolo 9 Figura 9 47 Finestra di dialogo Generatore di grafici W Generatore di grafici Variabili amp Cou
18. Some generalizations of principal components analysis In Data Analysis and Informatics E Diday et al ed Amsterdam North Holland 231 242 De Leeuw J F Young e Takane 1976 Additive structure in qualitative data An alternating least squares method with optimal scaling features Psychometrika 41 471 503 Gifi A 1990 Nonlinear multivariate analysis Chichester John Wiley and Sons Heiser W J e J J Meulman 1995 Nonlinear methods for the analysis of homogeneity and heterogeneity In Recent Advances in Descriptive Multivariate Analysis W J Krzanowski ed Oxford Oxford University Press 51 89 Isra ls A 1987 Eigenvalue techniques for qualitative data Leiden DSWO Press Krzanowski W e H C Marriott 1994 Multivariate analysis Part I distributions ordination and inference London Edward Arnold Lebart L A Morineau e K M Warwick 1984 Multivariate descriptive statistical analysis New York John Wiley and Sons Max J 1960 Quantizing for minimum distortion Proceedings IEEE Information Theory 6 7 12 Meulman J J 1986 A distance approach to nonlinear multivariate analysis Leiden DSWO Press 14 Capitolo 1 Meulman J J 1992 The integration of multidimensional scaling and multivariate analysis with optimal transformations of the variables Psychometrika 57 539 565 Nishisato S 1980 Analysis of categorical data Dual scaling and its applications Toronto
19. gt Fare clic su OK gt Quindi per ottenere un analisi delle corrispondenze in due dimensioni utilizzando la normalizzazione principale per riga dai menu scegliere Analizza Riduzione dimensionale Analisi corrispondenze 216 Capitolo 12 Figura 12 2 Finestra di dialogo Analisi della corrispondenze a Analisi corrispondenze al Fumatore fumatore cate j L freq Definisci intervallo ry Colonna Definisci intervallo mole gt Fare clic su Gruppo personale come variabile di riga gt Fare clic su Definisci intervallo Figura 12 3 Finestra di dialogo Definisci intervallo di righe Analisi delle corrispondenze Definisci interv Intervallo di categorie per la variabile di riga categ Valore min 1 a gt Vincoli sulle categorie E Nessuna O Le categorie sono uguali O La categoria supplementare v Digitare 1 come valore minimo v Digitare 5 come valore massimo gt Fare clic su Aggiorna gt Fare clic su Continua gt Selezionare Tabagismo come variabile di colonna gt Fare clic su Definisci intervallo nella finestra di dialogo Analisi delle corrispondenze 217 Figura 12 4 Finestra di dialogo Definisci intervallo di colonne Analisi delle corrispondenze Definisci interv Intervallo di categorie per la variabile di colonna fumatore Valore min 1 Valore max 4
20. gt Nella finestra di dialogo Regressione categoriale fare clic su Output 104 Capitolo 9 Figura 9 13 Finestra di dialogo Output za Regressione categoriale output Ricampionamento N I n 3 Numero di sottocampioni ONDE O Numero di campioni EE continue _Annule Aiuto gt Selezionare Correlazioni delle variabili originalie Correlazioni delle variabili trasformate gt Deselezionare ANOVA gt Fare clic su Continua gt Nella finestra di dialogo Regressione categoriale fare clic su Salva 105 Regressione categoriale Figura 9 14 Salva 3 Regressione categoriale salva Nome insieme di dati Nome insieme di dati Nome insieme di dati Nome insieme di dati gt Selezionare Salva residui nel file di dati attivo gt Nel gruppo Variabili trasformate selezionare Salva variabili trasformate nel file di dati attivo gt Fare clic su Continua gt Nella finestra di dialogo Regressione categoriale fare clic su Grafici 106 Capitolo 9 Figura 9 15 Finestra di dialogo Grafici z Regressione categoriale grafici Grafici di trasformazione pref confez marca prezzo garanzia soddrimb Grafici dei residui Annulla Aiuto gt Scegliere di creare grafici di trasformazione per Design confezione e Prezzo gt Fare clic su Continua gt Nella finestra di dialogo Regressione categoriale scegliere OK Intercorr
21. output 55 Analisi corrispondenze m Visualizza tutte le dimensioni nella soluzione Tutte le dimensioni nella soluzione sono visualizzate in una matrice di grafici a dispersione Limita il numero di dimensioni Le dimensioni visualizzate sono limitate alle coppie inserite nel grafico Se le dimensioni vengono limitate necessario selezionare la dimensione maggiore e minore da inserire nel grafico La dimensione minore pu variare da 1 al numero delle dimensioni nella soluzione meno 1 e viene inserita nel grafico a confronto con le dimensioni maggiori La dimensione maggiore pu variare da 2 al numero delle dimensioni nella soluzione e indica la dimensione massima da utilizzare nell inserimento nel grafico delle coppie di dimensioni Questa specifica si applica a tutti i grafici multidimensionali richiesti Opzioni aggiuntive delcomando CORRESPONDENCE Per personalizzare l analisi delle corrispondenze possibile incollare le impostazioni selezionate in una finestra di sintassi e quindi modificare la sintassi del comando CORRESPONDENCE cos ottenuta Il linguaggio della sintassi dei comandi consente inoltre di Specificare i dati della tabella come input anzich utilizzare i dati per casi con il sottocomando TABLE ALL Specificare il numero di caratteri delle etichette dei valori utilizzate per etichettare i punti di ciascun tipo di matrice dei grafici a dispersione o dei biplot con il sottocomando PLOT Specificare
22. 1 2 0 Ogni categoria per la quale non sono stati registrati casi riceve una quantificazione pari a 0 Per Et in anni le categorie prive di casi includono 31 35 46 50 e 51 55 Queste categorie non sono limitate all ordinamento con altre categorie e non influenzano alcun calcolo Per le variabili nominali multiple ogni categoria riceve una quantificazione diversa per ciascuna dimensione Per tutti gli altri tipi di trasformazioni una categoria ha una sola quantificazione indipendentemente dalla dimensionalit della soluzione Ciascun insieme di coordinate della categoria singola rappresenta la posizione delle categorie su una linea nello spazio dell oggetto Le coordinata di una data categoria equivalgono alla quantificazione moltiplicata per 1 pesi di dimensione della variabile Ad esempio nella tabella Et in anni le coordinate della categoria 203 Analisi della correlazione canonica non lineare OVERALS singola per la categoria 56 60 0 142 0 165 sono pari alla quantificazione 0 209 moltiplicata per 1 pesi di dimensione 0 680 0 789 Le coordinate della categoria multipla per le variabili trattate come nominali singole ordinali o numeriche rappresentano le coordinate delle categorie nello spazio dell oggetto prima dell applicazione di vincoli ordinali o lineari Questi valori sono riduttori non vincolati della perdita Per le variabili nominali multiple queste coordinate rappresentano le quantificazioni
23. 29 pesi di componente 147 151 167 punteggi degli oggetti 146 149 168 punti di categoria 170 quantificazioni 144 164 riepilogo del modello 143 149 166 salvataggio di variabili 37 Analisi corrispondenze 47 50 52 53 213 214 230 biplot 219 contributi 221 236 dimensioni 235 funzioni aggiuntive del comando 55 grafici 47 grafici dei punteggi di colonna 237 grafici dei punteggi di riga 237 248 inerzia per dimensione 218 normalizzazione 214 permutazioni 223 profili 220 punteggi di riga e di colonna 221 statistiche 47 statistiche di confidenza 224 tabelle di corrispondenza 218 247 Analisi corrispondenze multiple 56 61 249 funzioni aggiuntive del comando 66 livello di scaling ottimale 58 misure di discriminazione 255 outliers 261 punteggi degli oggetti 254 258 quantificazioni di categoria 256 riepilogo del modello 253 salvataggio di variabili 64 Analisi della correlazione canonica non lineare OVERALS 41 44 188 centroidi 203 coordinate di categoria 202 funzioni aggiuntive del comando 46 grafici 41 pesi 197 pesi di componente 197 199 quantificazioni 200 riepilogo dell analisi 196 Indice statistiche 41 ANOVA in regressione categoriale 23 autovalori in analisi Componenti principali categoriale 143 149 166 in analisi della correlazione canonica non lineare 196 biplot in analisi Componenti principali categoriale 37 in analisi delle corrispondenze 53 219 in anali
24. Capitolo 10 De Leeuw J 1982 Nonlinear principal components analysis In COMPSTAT Proceedings in Computational Statistics Vienna Physica Verlag 77 89 Eckart C e G Young 1936 The approximation of one matrix by another one of lower rank Psychometrika 1 211 218 Gabriel K R 1971 The biplot graphic display of matrices with application to principal components analysis Biometrika 58 453 467 Gifi A 1985 PRINCALS Research Report UG 85 02 Leiden Department of Data Theory University of Leiden Gower J e J Meulman 1993 The treatment of categorical information in physical anthropology International Journal of Anthropology 8 43 51 Heiser W J e J J Meulman 1994 Homogeneity analysis Exploring the distribution of variables and their nonlinear relationships In Correspondence Analysis in the Social Sciences Recent Developments and Applications M Greenacre e J Blasius ed New York Academic Press 179 209 Kruskal J B 1978 Factor analysis and principal components analysis Bilinear methods In International Encyclopedia of Statistics W H Kruskal e J M Tanur ed New York The Free Press 307 330 Kruskal J e N Shepard 1974 A nonmetric variety of linear factor analysis Psychometrika 39 123 157 Meulman J J 1993 Principal coordinates analysis with optimal transformations of the variables Minimizing the sum of squares of the smallest eigenvalues British Journal of Math
25. Ciclo regolare Pasti normali regolari Buone Adeguato Due o pi amici intimi Risultati da discreti a buoni Adeguato In grado di apprezzare il sesso Normale Nessuna Normale L analisi componenti principali ideale per questa situazione perch lo scopo dello studio accertare le relazioni tra i sintomi e le diverse classi di disturbi dell alimentazione Inoltre l analisi componenti principali categoriale probabilmente pi utile di quella classica in quanto ai sintomi viene assegnato un punteggio su una scala ordinale Esecuzione dell analisi Per esaminare correttamente la struttura dello sviluppo della malattia per ogni diagnosi sar opportuno fare in modo che 1 risultati della tabella dei centroidi proiettati siano disponibili come dati per grafici a dispersione possibile farlo utilizzando il Sistema di gestione dell output gt Per avviare una richiesta SGO dai menu scegliere Strumenti Pannello di controllo SGO 153 v v v y Analisi Componenti principali categoriale Figura 10 18 Pannello di controllo sistema di gestione dell output 3 Pannello di controllo sistema di gestione dell output Case Plot A Descriptive Statistics Cases to Variables Iteration History Selezionare Tabelle come tipo di output Selezionare CATPCA come comando Selezionare Centroidi proiettati come tipo di tabella Selezionare File nel gruppo Destinazioni output e digitare projected_centro
26. Il numero massimo minore di m numero delle categorie di riga attive meno il numero delle categorie di riga vincolate all uguaglianza pi il numero degli insiemi di categorie di riga vincolati m Ii numero delle categorie di colonna attive meno il numero delle categorie di colonna vincolate all uguaglianza pi il numero degli insiemi di categorie di colonna vincolati Misura di distanza possibile selezionare la misura della distanza tra le righe e le colonne della tabella delle corrispondenze Sono disponibili i seguenti metodi m Chi quadrato Utilizza una distanza di profilo ponderata dove il peso corrisponde alla massa delle righe e delle colonne richiesta per l analisi delle corrispondenze standard m Euclidea Utilizza la radice quadrata della somma delle differenze quadratiche tra le coppie di righe e le coppie di colonne Metodo di standardizzazione Selezionare una delle alternative seguenti m Medie di riga e colonna rimosse Vengono centrate sia le righe che le colonne Questo metodo richiesto per l analisi delle corrispondenze standard m Medie di riga rimosse Vengono centrate solo le righe Medie di colonna rimosse Vengono centrate solo le colonne 52 Capitolo 5 m Totali di riga uguali e medie rimosse Prima di centrare le righe vengono equalizzati i relativi margini Totali di colonna uguali e medie rimosse Prima di centrare le colonne vengono equalizzati i relativi margini
27. Kaplan ed Thousand Oaks Calif Sage Publications Inc 25 48 284 Capitolo 14 Kruskal J B 1964 Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis Psychometrika 29 1 28 Kruskal J B 1964 Nonmetric multidimensional scaling A numerical method Psychometrika 29 115 129 Shepard R N 1962 The analysis of proximities Multidimensional scaling with an unknown distance function I Psychometrika 27 125 140 Shepard R N 1962 The analysis of proximities Multidimensional scaling with an unknown distance function II Psychometrika 27 219 246 Capitolo Unfolding multidimensionale La procedura Unfolding multidimensionale tenta di individuare una scala quantitativa comune che consenta di analizzare visivamente le relazioni tra due insiemi di oggetti Esempio preferenze relative ai cibi da colazione In uno studio classico Green e Rao 1972 stato chiesto a 21 studenti MBA della Wharton School e ai loro consorti di classificare 15 cibi da colazione in ordine di preferenza dove 1 era l alimento preferito in assoluto e 15 quello meno preferito Tali informazioni vengono raccolte nel file breakfast_overall sav Per ulteriori informazioni vedere File di esempio in Appendice A a pag 321 I risultati dello studio forniscono un tipico esempio del problema della degenerazione tipico di molti algoritmi impiegati per l unfolding multidimensionale che viene generalmente risolto
28. Ni Punteggio al test linguis statciv 1 Ordinale Definisci intervallo e scala Etichetta grafici dei punteggi degli oggetti tramite efinisci intervalle Dimensioni nella soluzione 2 Incolla Reimposta Annulla Aiuto Specificare almeno due insiemi di variabili Selezionare le variabili che si desidera includere nel primo insieme Per passare all insieme successivo fare clic su Successivo e quindi selezionare le variabili da inserire nel secondo insieme possibile aggiungere il numero di insiemi desiderato Fare clic su Precedente per tornare all insieme di variabili definito in precedenza Specificare l intervallo di valori e la scala di misurazione livello di scaling ottimale per ciascuna variabile selezionata Fare clic su OK Oppure Selezionare una o pi variabili per definire le etichette dei punti per i grafici dei punteggi degli oggetti Per ciascuna variabile viene creato un grafico distinto nel quale i punti sono etichettati in base ai valori della specifica variabile necessario definire un intervallo per ciascuna di tali variabili etichetta dei grafici Nella finestra di dialogo non possibile definire contemporaneamente la stessa variabile come variabile dell analisi e come variabile etichetta Per etichettare il grafico dei punteggi degli oggetti mediante una variabile utilizzata nell analisi creare una copia della variabile scegliendo Calcola dal menu Tras
29. O 56 60 66 56 51 55 N o 26 30 41 45 5 DIEM a 56 60 v E a O 41 45 1 0 0 5 0 0 0 5 10 15 20 Dimensione 1 L interpretazione dei gruppi di et pi giovani ora possibile dal grafico dei centroidi Le categorie La Repubblica e La Stampa sono inoltre pi distanti rispetto all analisi precedente il che consente l interpretazione separata di ciascuna categoria I gruppi di et tra 26 e 45 anni leggono la Repubblica e preferiscono vivere in campagna I gruppi di et 20 25 e 56 60 leggono La Stampa il primo gruppo preferisce vivere in citt il secondo in campagna I gruppi pi anziani leggono il Corriere della Sera e preferiscono vivere in un paese 211 Analisi della correlazione canonica non lineare OVERALS L interpretazione dell altra direzione Stato civile Musica preferita e Animali domestici resta fondamentalmente invariata rispetto all analisi precedente L unica differenza evidente consiste nel fatto che le persone con stato civile Diverso hanno gatti oppure non hanno animali domestici Figura 11 32 Centroidi etichettati in base a variabili et nominale O Et in anni O Stato civile _ Animali domestici Piccola citt O Quotidiani letti pi e spesso 1 o 66 70 O _ Musica preferita ve 309 Preferenze Mac of Sazzetti 6165 O abtative cani single o N Fatr31 35 Altro 0 4 2 G O 3 aafitetiit deete non gi tmsimamasica oe Classica posato a oS 1 Ca
30. Variabili di analisi filetto escludi valori Modalit testafescludi valori Modalit tagliofescludi valori Modalit puntafescludi valori Modalit lungh2fescludi valori Modalit ottone escludi valori Modalit filetton escludi valori Modalit testanfescludi valori Modalit tagliontescludi valori Modalit puntan escludi valori Modalit Variabili supplementari Strategia Escludi i valori mancanti per le correlazioni assegna dopo la quantificazione Modalit Categoria supplementare O Assegna i valori mancanti Modalit O Escludi gli oggetti con valori mancanti per la variabile Annulla Aiuto Strategia per la gestione dei valori mancanti Specificare se si desidera escludere i valori mancanti trattamento passivo assegnare i valori mancanti trattamento attivo o escludere gli oggetti con valori mancanti eliminazione listwise m Escludi i valori mancanti per le correlazioni assegna dopo la quantificazione Gli oggetti con valori mancanti della variabile selezionata non vengono utilizzati nell analisi di questa variabile Se a tutte le variabili applicato il trattamento passivo gli oggetti con valori mancanti di tutte le variabili vengono considerati come supplementari Se nella finestra di dialogo Output sono specificate correlazioni dopo l analisi ai valori mancanti viene assegnata la categoria o moda pi frequente della variabile per le correlazioni delle variabili originali
31. Vincoli sulle categorie Nessuna O Le categorie sono uguali gt Per aggiungere le categorie supplementari e ottenere una soluzione con normalizzazione principale richiamare la finestra di dialogo Analisi delle corrispondenze gt Selezionare personale e fare clic su Definisci intervallo gt Digitare 6 come valore massimo e fare clic su Aggiorna 226 Capitolo 12 gt Selezionare 6 nell elenco Vincoli sulle categorie e selezionare La categoria supplementare gt Fare clic su Continua gt Selezionare tabagismo e fare clic su Definisci intervallo nella finestra di dialogo Analisi delle corrispondenze Figura 12 17 Finestra di dialogo Definisci intervallo di colonne Analisi delle corrispondenze Definisci interv Intervallo di categorie per la variabile di colonna fumatore Valore min 1 Ge _agaomna_ Vincoli sulle categorie 1 2 3 Nessuna 4 5 Le categorie sono uguali Aggiuntive Ole categ a Digitare 6 come valore massimo e fare clic su Aggiorna Selezionare 5 nell elenco Vincoli sulle categorie e selezionare La categoria supplementare gt gt gt Selezionare 6 nell elenco Vincoli sulle categorie e selezionare La categoria supplementare gt Fare clic su Continua gt Nella finestra di dialogo Analisi della corrispondenze fare clic su Modello 227 Analisi corrispondenze Figura 12 18 Finestra di dialogo Modello ca Analisi dell
32. classificazione incrociata della categoria relativa et e del sesso adl sav File di dati ipotetici che prende in esame l impegno richiesto per determinare i vantaggi di un tipo di terapia proposto per i pazienti con problemi di cuore I medici hanno assegnato in modo casuale i pazienti con problemi di cuore di sesso femminile a uno di due gruppi Al primo gruppo stata assegnata la terapia fisica standard al secondo gruppo un ulteriore terapia di supporto psicologico Dopo tre mesi di trattamenti a ciascuna capacit dei pazienti che consente di riprendere le normali attivit giornaliere stato assegnato un punteggio come variabile ordinale advert sav File di dati ipotetici che prende in esame l impegno di un rivenditore al dettaglio che desidera esaminare la relazione tra il denaro speso per la pubblicit e le vendite risultanti Finora sono stati raccolti i dati delle vendite precedenti e i relativi costi pubblicitari aflatoxin sav File di dati ipotetici che prende in esame il test di raccolti di mais con presenza di Aflatossina un veleno la cui concentrazione varia notevolmente nei raccolti Una macchina per la lavorazione dei cereali ha ricevuto 16 campioni da ciascuno degli otto raccolti di mais e ha misurato i livelli di Aflatossina in parti per miliardo PPB aflatoxin20 sav Questo file di dati contiene le misurazioni di Aflatossina di ciascuno dei 16 campioni di quattro raccolti e otto campioni dal file di dati aflato
33. in analisi delle corrispondenze multiple 58 in regressione categoriale 18 distanze in scaling multidimensionale 80 nell unfolding multidimensionale 90 distanze trasformate in scaling multidimensionale 80 nell unfolding multidimensionale 90 elastic net in regressione categoriale 22 file di esempio posizione 321 grafici in analisi della correlazione canonica non lineare 45 in analisi delle corrispondenze 53 in regressione categoriale 26 in scaling multidimensionale 78 80 grafici a punti degli oggetti in analisi Componenti principali categoriale 37 in analisi delle corrispondenze multiple 64 grafici degli inizi multipli nell unfolding multidimensionale 89 grafici degli spazi individuali in scaling multidimensionale 78 nell unfolding multidimensionale 89 grafici dei pesi dello spazio nell unfolding multidimensionale 89 grafici dei pesi dello spazio individuale in scaling multidimensionale 78 nell unfolding multidimensionale 89 grafici dei pesi di componente in analisi Componenti principali categoriale 39 grafici dei punteggi di colonna in analisi delle corrispondenze 237 grafici dei punteggi di riga in analisi delle corrispondenze 237 248 grafici dei residui nell unfolding multidimensionale 89 grafici delle misure di discriminazione in analisi delle corrispondenze multiple 65 grafici dello spazio comune in scaling multidimensionale 78 nell unfolding multidimensionale
34. 197 pesi dello spazio individuale in scaling multidimensionale 80 nell unfolding multidimensionale 90 pesi di componente in analisi Componenti principali categoriale 35 147 151 167 in analisi della correlazione canonica non lineare 45 199 pesi di dimensione nell unfolding multidimensionale 299 306 peso della variabile in analisi Componenti principali categoriale 29 in analisi delle corrispondenze multiple 58 PREFSCAL 83 profili in analisi delle corrispondenze 220 punteggi degli oggetti in analisi Componenti principali categoriale 35 146 149 168 in analisi della correlazione canonica non lineare 45 in analisi delle corrispondenze multiple 63 254 258 punteggi di colonna in analisi delle corrispondenze 221 punteggi di riga in analisi delle corrispondenze 221 punti di categoria in analisi Componenti principali categoriale 170 punti supplementari in analisi delle corrispondenze 225 quantificazioni in analisi Componenti principali categoriale 144 164 in analisi della correlazione canonica non lineare 200 quantificazioni di categoria in analisi Componenti principali categoriale 35 in analisi della correlazione canonica non lineare 45 in analisi delle corrispondenze multiple 63 256 in regressione categoriale 23 R multiplo in regressione categoriale 23 R2 in regressione categoriale 107 Regressione categoriale 15 94 adattamento del modello 107 correlazioni 107 108 funzioni aggiuntive del c
35. 23 Generatore di grafici E Generatore di grafici Variabili amp County c Years sin L value atl L Probabilit E Peso dic E Peso dic L Probabilit L Peso dic Indice di Presodic w XY Peso di campionamento cumul Categorie Nessuna categoria variabile di scala L anteprima dei grafici usa i dati di esempio Modelli Seleziona da e NI Preferiti Elementi di base Barra o c SP a ennas MII Lincare cP ID gruppi punti Ad area gt ren A torta polare e Titoli Note a pi di A dispersione punti pagina Istogramma Alto Basso Propriet elemento Grafico a scatola Assi duali A itt gt Selezionare il modello Dispersione Punti e scegliere Dispersione semplice gt Selezionare Residuo come variabile dell asse y M Selezionare Quantificazione design confezione come variabile dell asse x gt Fare clic su OK Il grafico a dispersione mostra i residui standardizzati tracciati rispetto ai punteggi ottimali per Design confezione Tutti i residui sono compresi entro le due deviazioni standard di 0 Una dispersione casuale di punti sostituisce la forma a U nel grafico a dispersione derivato dalla 113 Regressione categoriale regressione lineare standard Le capacita predittive vengono migliorate dalla quantificazione ottimale delle categorie Figura 9 24 Residui per regressione categoriale Residuo
36. 57 Grafico a dispersione delle variabili trasformate Quantificazione ozon 2 00 1 00 0 00 1 00 2 00 Quantificazione doy La figura mostra la relazione tra le variabili trasformate Un trend crescente sostituisce la U invertita La linea di regressione ha una pendenza positiva a indicare che l aumento di Giorno dell anno trasformato corrisponde all aumento di Livello giornaliero di ozono atteso Utilizzando lo scaling ottimale si linearizza la relazione rendendo possibili interpretazioni che diversamente passerebbero inosservate Letture consigliate Consultare i testi seguenti per ulteriori informazioni sulla regressione categoriale Buja A 1990 Remarks on functional canonical variates alternating least squares methods and ACE Annals of Statistics 18 1032 1069 Hastie T R Tibshirani e A Buja 1994 Flexible discriminant analysis Journal of the American Statistical Association 89 1255 1270 Hayashi C 1952 On the prediction of phenomena from qualitative data and the quantification of qualitative data from the mathematico statistical point of view Annals of the Institute of Statitical Mathematics 2 93 96 Kruskal J B 1965 Analysis of factorial experiments by estimating monotone transformations of the data Journal of the Royal Statistical Society Series B 27 251 263 137 Regressione categoriale Meulman J J 2003 Prediction and classification in nonlinear data analysis Something old som
37. 89 grafici dello spazio comune finale nell unfolding multidimensionale 89 Indice grafici dello spazio comune iniziale nell unfolding multidimensionale 89 grafici di categoria in analisi Componenti principali categoriale 38 in analisi delle corrispondenze multiple 65 grafici di categoria congiunti in analisi Componenti principali categoriale 38 in analisi delle corrispondenze multiple 65 grafici di centroidi proiettati in analisi Componenti principali categoriale 38 grafici di correlazione in scaling multidimensionale 78 Grafici di Shepard nell unfolding multidimensionale 89 grafici di trasformazione in analisi Componenti principali categoriale 38 in analisi delle corrispondenze multiple 65 in regressione categoriale 110 in scaling multidimensionale 78 281 nell unfolding multidimensionale 89 316 320 grafici stress in scaling multidimensionale 78 nell unfolding multidimensionale 89 grafico a dispersione dell adattamento nell unfolding multidimensionale 89 grafico congiunto degli spazi individuali nell unfolding multidimensionale 299 306 grafico congiunto dello spazio comune nell unfolding multidimensionale 289 292 298 305 315 319 importanza in regressione categoriale 108 Indice di non degenerazione approssimativo di Shepard nell unfolding multidimensionale 288 291 297 304 314 indici di intervariabilita di DeSarbo nell unfolding multidimensionale 288 291 297 304 314 ine
38. Alimentazione O esagerata su Preoccupazione per cibo e peso su Inclinazioni sessuali Il grafico mostra che in corrispondenza del primo punto temporale il sintomo Eccessi alimentari separa i pazienti bulimici 2 e 3 dagli altri 1 e 4 Atteggiamento sessuale separa gli anoressici e i pazienti atipici 1 e 4 dagli altri 2 e 3 Preoccupazione legata a cibo e peso non separa i pazienti in modo significativo In molte applicazioni questo grafico sarebbe sufficiente per descrive la relazione tra i sintomi e la diagnosi ma a causa della complicazione rappresentata dai punti di tempo multipli il quadro diventa pi confuso 176 Capitolo 10 Per visualizzare queste proiezioni nel tempo necessario poter tracciare i contenuti della tabella dei centroidi proiettati in un grafico Questo reso possibile dalla richiesta SGO che ha salvato tali informazioni nel file projected_centroids sav Figura 10 45 Projected_centroids sav za projected_centroids sav InsiemeDati10 Data Editor Modifica Yisualizza Dati Trasforma Analizza Grafici Strumenti Dispositivi aggiuntivi Finestra Aiuto Visibili 8 variabile i di 8 Bingeeating Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids lt i oon One WN ala
39. Ciascuna variabile pu essere analizzata a diversi livelli Tuttavia poich l obiettivo la previsione della risposta si consiglia di scalare la risposta cos com utilizzando il livello di scaling ottimale numerico Di conseguenza l ordine e le differenze tra le categorie saranno mantenuti nella variabile trasformata Per eseguire un analisi di regressione categoriale dai menu scegliere Analizza Regressione Scaling ottimale CATREG 115 Regressione categoriale Figura 9 25 Finestra di dialogo Regressione categoriale 1 Regressione categoriale Variabile dipendente z z ozon Spline ordinale 2 2 piscata Variabili indipendenti i Opzioni Regolarizzazione Output Salva Definisci scala can Selezionare Livello ozono giornaliero come variabile dipendente Selezionare da Altezza di base inversione a Giorno dell anno come variabili indipendenti Selezionare Livello ozono giornaliero e fare clic su Definisci scala Figura 9 26 Finestra di dialogo Definisci scala a Regressione categoriale definis Livello di scala ottimale O Spline ordinale O Ordinale Spline nominale Nominale Spline Grado E__ Nodi interni a Selezionare Numerico come livello di scaling ottimale Fare clic su Continua Selezionare da Altezza di base inversione a Giorno dell anno e fare clic su Definisci scala nella finestra di dial
40. Figura 10 25 Finestra di dialogo Componenti principali categoriale 2 Componenti principali categoriale g diag2 Ri tempo2 Definisci scala e _Befinisci scala e peso tempo 7 MEC gt Selezionare da Numero colloquio a Numero paziente come variabili di etichetta gt Fare clic su Opzioni 159 Analisi Componenti principali categoriale Figura 10 26 Finestra di dialogo Opzioni 3 Componenti principali categoriale Opzioni Principale per variabile Valore personalizzato Lunghezza massima etichetta Dimensione minima Dimensione massima onfigurazioni continua Annua __Aiuto inline gt Scegliere di etichettare i grafici in base a Nomi o valori di variabili gt Fare clic su Continua gt Fare clic su Output nella finestra di dialogo Analisi componenti principali categoriale 160 Capitolo 10 Figura 10 27 Finestra di dialogo Output x Componenti principali categoriale Output Tabelle E Punteggi degli oggetti C Correlazioni delle variabili originali Pesi di componente Correlazioni delle variabili trasformate C Cronologia delle iterazioni _ Varianza spiegata Yariabili quantificate Quantificazioni di categoria Famig emanc sE amici scuola attsess compsess umore preocc corpo Opzioni per punteggi di oggetti tempdiag Includi categorie Variabili etichetta A tempo tempo diagn diagn numero numero Etichetta in base a
41. LL 239 Esempio Chilometraggio aereo tra Citt 240 Tabella di corrispondenza 24 Punteggi di riga e di colonna 248 Letture consigliate 248 13 Analisi corrispondenze multiple 249 Esempio Caratteristiche degli articoli da ferramenta 249 Esecuzione dell amaliSl sesasi eia wi iti aata aati ai woces We 250 Riepilogo del modello Regressione output LL 253 Punteggi oggetto 254 Misure di discriminazione LL 255 Quantificazioni di categoria Categories opzioni Visualizza 256 Un esame pi dettagliato dei punteggi degli oggetti 258 Omissione di valori anomali 261 Letture consigliate pig aa e a ei medals 264 14 Scaling multidimensionale 266 Esempio un esame dei termini indicanti parentela 0 0 0 0 ccc cece eee eee 266 Scelta del numero di dimensioni LL 267 Una soluzione a tre dimensioni LL 273 Una soluzione a tre dimensioni con trasformazioni non predefinite 279 DISCUSSIONE iii e ea 283 L etture consigliate 62432454 pi ea Cis a a da 283 15 Unfolding multidimensionale 285 Esempio preferenze relative ai cibi da colazione 285 Creazione di una soluzione degenerata 0000 c eee eee 285 Misure cain ee e a 288 SPAZIO COMUNE cir ate abe deem i Reti ra 289 Esecuzione di un analisi Non degenerata 0 nnana ccc eee eee ene 290 MI SUTE dai tenat aaa ia elia 291 Spazio COMUNE c c e i TE ded EE we hoeed ae 292 Esempio unfolding a tre vie delle preferenze relative ai cibi da col
42. La procedura Unfolding multidimensionale in grado di generare cronologia delle iterazioni misure di stress scomposizione di stress coordinate dello spazio comune distanze degli oggetti entro la configurazione finale pesi dello spazio individuale spazi individuali distanze trasformate grafici di stress grafici a dispersione dello spazio comune grafici a dispersione dei pesi dello spazio individuale grafici a dispersione degli spazi individuali grafici di trasformazione e grafici dei residui di Shepard Dati I dati vengono forniti sotto forma di matrici di distanza rettangolari Ogni colonna viene considerata come un oggetto colonna separato Ogni riga di una matrice di distanza viene considerata come un oggetto riga separato Quando sono presenti pi sorgenti delle distanze le matrici vengono sovrapposte Assunzioni necessario specificare almeno due variabili Il numero di dimensioni presenti nella soluzione non pu essere maggiore del numero degli oggetti meno uno Se viene specificata una sola origine tutti i modelli sono equivalenti al modello di identit e pertanto l analisi predefinita il modello di identit Per ottenere un analisi Unfolding multidimensionale gt Dai menu scegliere Analizza Scala Unfolding multidimensionale PREFSCAL 83 84 Capitolo 8 Figura 8 1 Finestra di dialogo principale Unfolding multidimensionale Unfolding multidimensionale Distanze Sesso sesso ail Toa
43. Psychology 36 54 80 Van der Burg E J De Leeuw e R Verdegaal 1988 Homogeneity analysis with k sets of variables An alternating least squares method with optimal scaling features Psychometrika 53 177 197 Van der Ham T J Meulman C Van Strien e H Van Engeland 1997 Empirically based subgrouping of eating disorders in adolescents A longitudinal perspective British Journal of Psychiatry 170 363 368 Van der Kooij A J e J J Meulman 1997 MURALS Multiple regression and optimal scaling using alternating least squares In Softstat 97 F Faulbaum e W Bandilla ed Stuttgart Gustav Fisher 99 106 Van Rijckevorsel J 1987 The application of fuzzy coding and horseshoes in multiple correspondence analysis Leiden DSWO Press Verboon P e I A Van der Lans 1994 Robust canonical discriminant analysis Psychometrika 59 485 507 Verdegaal R 1985 Meer sets analyse voor kwalitatieve gegevens in Dutch Leiden Department of Data Theory University of Leiden Vlek C e P J Stallen 1981 Judging risks and benefits in the small and in the large Organizational Behavior and Human Performance 28 235 271 Wagenaar W A 1988 Paradoxes of gambling behaviour London Lawrence Erlbaum Associates Inc Ware J H D W Dockery A Spiro III F E Speizer e B G Ferris Jr 1984 Passive smoking gas cooking and respiratory health of children living in six cities American Review of
44. Punti di riga normalizzazione principale 034 Dirigenti giovani Dirigenti anziani N 02 e w c A v A 0 1 v E Impiegati anziani A 00H Impiegati giovani Segreteria e Dimensione 1 Il grafico dei punti di colonna mostra lo spazio di colonna con i due punti supplementari relativi al consumo di alcolici Bevitore si trova vicino all origine a indicare una stretta corrispondenza tra profilo del consumo di alcol e il profilo medio della colonna Tuttavia Astemio differisce dal profilo medio della colonna illustrato dall ampia distanza dall origine Il punto pi vicino a Astemio Lieve Il profilo dei fumatori lievi molto simile a quello degli astemi Tra i fumatori Medio il punto successivo pi vicino e Forte il pi lontano Di conseguenza presente una progressione nella similarit alla condizione di astemio da fumatore lieve e forte Tuttavia la 230 Capitolo 12 proporzione relativamente elevata di personale di segreteria nel gruppo degli astemi impedisce eventuali corrispondenze strette con qualsiasi categoria di fumatori Figura 12 21 Punti di colonna normalizzazione principale 0 2 e Accanito pa 0 1 c No o 7 Medio n e 0 0 o w E A 01 Leggero e 0 4 0 3 0 2 01 00 0 1 0 2 0 3 Dimensione 1 Esempio Percezione delle marche di caff Il precedente esempio riguardava una tabella di piccole dimensioni di dati ipotetici Le applicazioni reali s
45. Questa opzione disponibile solo se si specifica uno dei modelli delle differenze individuali m Distanze inserite Visualizza le distanze tra gli oggetti nella configurazione specificata Salva in un nuovo file Le coordinate dello spazio comune i pesi dello spazio individuale le distanze e le distanze trasformate possono essere salvate in file di dati di SPSS Statistics distinti 92 Capitolo amp Funzioni aggiuntive del comando PREFSCAL Per personalizzare l unfolding multidimensionale dell analisi delle distanze possibile incollare le impostazioni selezionate in una finestra di sintassi e modificare la sintassi del comando PREFSCAL risultante Il linguaggio della sintassi dei comandi consente inoltre di m Specificare diversi elenchi sorgente per i grafici Spazi individuali Dispersione dell adattamento e Residui e in caso di trasformazioni condizionali della matrice per i grafici Trasformazione e Shepard quando sono disponibili pi sorgenti ricorrendo al sottocomando PLOT m Specificare diversi elenchi riga per i grafici Trasformazione e Shepard in caso di trasformazioni condizionali della riga ricorrendo al sottocomando PLOT m Specificare un numero di righe anzich una variabile dell ID di riga ricorrendo al sottocomando INPUT m Specificare un numero di sorgenti anzich una variabile dell ID di sorgente ricorrendo al sottocomando INPUT Per informazioni dettagliate sulla sintassi vedere C
46. University of Toronto Press Nishisato S 1994 Elements of dual scaling An introduction to practical data analysis Hillsdale N J Lawrence Erlbaum Associates Inc Rao C R 1973 Linear statistical inference and its applications 2nd ed New York John Wiley and Sons Rao C R 1980 Matrix approximations and reduction of dimensionality in multivariate statistical analysis In Multivariate Analysis Vol 5 P R Krishnaiah ed Amsterdam North Holland 3 22 Roskam E E 1968 Metric analysis of ordinal data in psychology Voorschoten VAM Shepard R N 1966 Metric structures in ordinal data Journal of Mathematical Psychology 3 287 315 Wolter K M 1985 Introduction to variance estimation Berlin Springer Verlag Young F W 1981 Quantitative analysis of qualitative data Psychometrika 46 357 387 Capitolo Regressione categoriale CATREG La procedura Regressione categoriale consente di quantificare i dati categoriali mediante l assegnazione di valori numerici alle categorie e di ottenere quindi un equazione della regressione lineare ottimale per le variabili trasformate La regressione categoriale nota anche con l acronimo CATREG regressione categoriale L analisi della regressione lineare standard comporta la riduzione al minimo della somma dei quadrati delle differenze tra una variabile dipendente di risposta e una combinazione ponderata di variabili indipendenti predittore Le var
47. a esaminare 1 coefficienti di regressione Inoltre necessario esaminare le correlazioni le correlazioni di parte e le correlazioni parziali La seguente tabella include le misure delle correlazioni citate per ogni variabile La correlazione di ordine zero quella tra il predittore trasformato e la risposta trasformata Per questi dati la correlazione maggiore si verifica per Design confezione Tuttavia se possibile spiegare parte della variazione nel predittore o nella risposta si otterr una migliore rappresentazione delle prestazioni del predittore Figura 9 20 Correlazioni parziali di parte e di ordine zero variabili trasformate Correlazioni Tolleranza Dopo la Prima della Parziali trasforma trasformazi Ordine zero Parziali indipendenti Importanza zione one Confezione Marca Prezzo Sigillo di garanzia Soddisfatti o rimborsati Variabile dipendente Preferenza 109 Regressione categoriale Altre variabili nel modello possono creare confusione circa le prestazioni di un dato predittore per quanto concerne le previsioni della risposta Il coefficiente di correlazione parziale rimuove gli effetti lineari di altri predittori dal predittore e dalla risposta Questa misura pari alla correlazione tra i residui derivanti dalla regressione del predittore sugli altri e i residui derivanti dalla regressione della risposta sugli altri predittori La correlazione parziale quadrata corrisponde alla proporzi
48. anno ricevono entrambi quantificazioni negative mentre i valori centrali hanno quantificazioni positive Applicando questa trasformazione i valori inferiore e superiore di Giorno dell anno hanno effetti simili sul Livello giornaliero di ozono previsto 135 Regressione categoriale Figura 9 56 Generatore di grafici W Generatore di grafici Variabili County c Years sin P value atl L Probabilt E Peso dic E Peso dic L Probabilt E Peso dic E Indice di L Ampiezza Peso dic s Categorie Nessuna categoria variabile di scala L anteprima dei grafici usa i dati di esempio Modelli Seleziona da EI Preferiti Elementi di base Barra 09 meee DI Lincare ID gruppi punti Ad area y 4 torta polare ven a pi di A dispersione punti eda ooo Istogramma Alto Basso Propriet elemento Grafico a scatola Ri Assi duali s Opzioni A A Per vedere un grafico a dispersione delle variabili trasformate richiamare Generatore di grafici e fare clic su Ripristina per annullare le selezioni precedenti gt Selezionare il modello Dispersione Punti e scegliere Dispersione semplice gt Selezionare Quantificazione Livello giornaliero di ozono TRA1_3 come variabile dell asse y e Quantificazione Giorno dell anno TRA2_3 come variabile dell asse x gt Fare clic su OK 136 Capitolo 9 Figura 9
49. che i primi due autovalori in presenza di tre dimensioni non sono uguali agli autovalori nella soluzione a tre in altre parole le soluzioni non sono nidificate Poich gli autovalori nelle dimensioni 2 e 3 sono ora inferiori rispetto alla dimensione 1 con Alfa 150 Capitolo 10 di Cronbach negativa consigliabile optare per la soluzione a due dimensioni La soluzione a tre dimensioni viene inclusa a scopo illustrativo Figura 10 16 Matrice di grafici a dispersione dei punteggi degli oggetti a tre dimensioni MC MC Dimensione 1 SG o SG 0o PUO AU c R Ocg AU Pd MB m 5 AUO MC o o o MC 2 00 o e PU Else PG o o SG MC MC g PG PG o 3 S SE AU o Oau o 5 cR m CR o SG o aro o MB PU PU Dimensione 1 Dimensione 2 Dimensione 3 La riga superiore dei grafici rivela che la prima dimensione separa GRUPPI PRIMARI e PUBBLICO dagli altri gruppi Si noti che l ordine degli oggetti lungo l asse verticale non cambia in alcuno dei grafici della riga superiore ciascuno di tali grafici utilizza la dimensione 1 come asse y La riga centrale dei grafici consente di interpretare la dimensione 2 La seconda dimensione si leggermente modificata rispetto alla soluzione a due dimensioni In precedenza la seconda dimensione includeva tre gruppi distinti ora gli oggetti sono maggiormente distribuiti lungo l asse La terza dimensione consente di separate PUBBLICO da GRUPPI PRIMARI il che non avviene
50. delle distanze originali Ci suggerisce che le distanze trasformate di ciascuna riga sono quasi costanti e che conseguentemente la soluzione non consente di discriminare gli oggetti La somma dei quadrati degli indici di intervariabilit di DeSarbo indica il livello di variabilit dei punti dei diversi insiemi Se non ci sono oggetti distribuiti in modo variabile possibile che la soluzione sia degenerata Pi vicino il risultato a 0 e maggiore la probabilit che la soluzione contenga oggetti con una distribuzione variabile Poich in questo caso il valore risultante molto alto la soluzione non contiene oggetti con una distribuzione variabile L indice di non degenerazione approssimativo di Shepard espresso come percentuale delle diverse distanze uguale a 0 Ci indica che le distanze non sono abbastanza diverse e che la soluzione probabilmente degenerata Spazio comune Figura 15 4 Grafico congiunto dello spazio comune per la soluzione degenerata Dimensione 2 10 5 0 5 10 Dimensione 1 La conferma visiva della degenerazione della soluzione viene fornita dal grafico congiunto dello spazio comune degli oggetti riga e colonna Gli oggetti riga singoli sono situati lungo la circonferenza di un cerchio centrato sugli oggetti colonna cibi per colazione le cui coordinate sono state compresse in un unico punto 290 Capitolo 15 Esecuzione di un analisi Non degenerata Figura 15 5 Fin
51. deve contenere le coordinate della prima dimensione la seconda variabile le coordinate della seconda dimensione e cos via m Iniziale La configurazione del file specificato verr utilizzata come punto di partenza dell analisi m Fissa La configurazione del file specificato verr utilizzata per inserire le variabili Le variabili inserite devono essere selezionate come variabili dell analisi ma poich la configurazione fissa vengono considerate come variabili supplementari e pertanto non necessario selezionarle come variabili supplementari Componenti principali categoriale Output La finestra di dialogo Output consente di creare tabelle per i punteggi degli oggetti i pesi di componente la cronologia delle iterazioni le correlazioni delle variabili originali e trasformate le varianze spiegate per variabile e per dimensione le quantificazioni di categoria delle variabili selezionate e le statistiche descrittive delle variabili selezionate 36 Capitolo 3 Figura 3 7 Finestra di dialogo Output x Componenti principali categoriale Output Tabelle Punteggi degli oggetti C Correlazioni delle variabili originali Pesi di componente Correlazioni delle variabili trasformate C Cronologia delle iterazioni Varianza spiegata Variabili quantificate Quantificazioni di categoria Fang emanc amici scuola attsess compsess umore preocc corpo lt Opzioni per punteggi di oggetti tempdiag Includi categor
52. devono essere relative alle variabili trasformate Con l aumento delle quantificazioni per Temperatura o con la riduzione delle quantificazioni per A tezza di base inversione il valore atteso per Ozono aumenta Per esaminare gli effetti delle variabili originali necessario mettere in correlazione categorie e quantificazioni 119 Regressione categoriale Figura 9 32 Grafico di trasformazione per Altezza di base inversione nominale Quantificazioni 123456789 222222233333333334 44 4 222 12345678901234567890 23 9 o Categorie Il grafico di trasformazione per Altezza di base inversione non mostra modelli evidenti Come evidenziato dalla natura irregolare del grafico lo spostamento dalle categorie inferiori alle superiori genera fluttuazioni nelle quantificazioni in entrambe le direzioni Di conseguenza per descrivere gli effetti di questa variabile necessario concentrarsi sulle singole categorie L imposizione di vincoli lineare o ordinali alle quantificazioni per questa variabile pu ridurne significativamente l adattamento 120 Capitolo 9 Figura 9 33 Grafico di trasformazione per Gradiente pressione nominale 2 Quantificazioni i N 12 3456 7 8 9 10 11 12 13 14 15 16 18 Categorie La figura mostra il grafico di trasformazione per Gradiente pressione Le categorie discretizzate iniziali da a 6 ricevono quantificazioni limitate e quindi contribuiscono in modo ridotto alla
53. di riga e colonna rimosse Medie di riga rimosse Medie di colonna rimosse Totali di riga uguali e medie rimosse Totali di colonna uguali e medie rimosse Metodo di normalizzazione GO Principale per riga Personalizzato O Principale O Principale per colonna Annulla Aiuto gt Per generare la seguente soluzione con la normalizzazione simmetrica richiamare la finestra di dialogo Analisi delle corrispondenze e fare clic su Modello gt Selezionare Simmetrico come metodo di normalizzazione gt Fare clic su Continua gt Nella finestra di dialogo Analisi della corrispondenze fare clic su OK 240 Capitolo 12 Nella parte superiore sinistra del biplot risultante la marca FE l unica forte per la classe lavoratrice e che attrae gli uomini La marca AA la pi diffusa e quella percepita come contenente la maggiore percentuale di caffeina Le marche dolci e che fanno ingrassare includono BB e FF Le marche CC e DD sebbene percepite come nuove e salutari sono anche le meno diffuse Figura 12 34 Biplot delle marche e degli attributi normalizzazione simmetrica 5 Di O impress 0 5 O marca uomini i EE O funziona N affumicato ol 2 are 9 onov 0 Oge A e iciment ce 04 S fresco S DD 00 3 une rtaveneti a una i nte o rampante prep k syd australia 44 tradizione FF dolce T T T 1 0 1 N Dimensione 1 Per un interpretazione ulteriore p
54. diagnosticata un anoressia nervosa e 1 cui punteggi sono indicati nella tabella seguente Tabella 10 4 Punteggi degli oggetti per il paziente n 43 Ora Dimensione 1 Dimensione 2 1 2 031 1 250 2 2 067 0 131 3 1 575 1 467 4 2 405 1 807 170 Capitolo 10 I punteggi del paziente in corrispondenza del colloquio numero 1 sono tipici dei soggetti anoressici con un elevato punteggio negativo nella dimensione 1 corrispondente a una percezione negativa del proprio corpo e un punteggio positivo per la dimensione 2 indicativo di sintomi di anoressia o di comportamento psicosociale inadeguato Tuttavia diversamente dalla maggioranza dei pazienti nella dimensione 1 i progressi sono scarsi o assenti Nella dimensione 2 apparentemente sono presenti dei progressi verso normale attorno allo 0 tra comportamento anoressico e bulimico ma successivamente il paziente inizia a mostrare sintomi bulimici Esame della struttura dell andamento della malattia Per reperire maggiori informazioni sulla connessione tra le due dimensioni e le quattro categorie diagnostiche e i quattro punti temporali stata creata la variabile supplementare Interazione diagnosi tempo tramite una classificazione incrociata delle quattro categorie di Diagnosi paziente e le quattro categorie di Numero colloquio Di conseguenza Interazione diagnosi tempo ha 16 categorie la prima delle quali indica i pazienti diagnosticati con anoressia nervosa alla pri
55. e colonna mostrano una variazione minore lungo l asse verticale e una variazione pi marcata lungo l asse orizzontale 308 Capitolo 15 Figura 15 23 Grafico congiunto dello spazio individuale Snack con bibita per la configurazione iniziale della corrispondenza Toast alla cannella 10 o o 5 Pane integrale imburrato Panino dolce con margarina o Pane dolce e Datestttamirtilli e margarina 5 Dolcetto glassato o 30 2 ho Dolcetto alla marmell ee 28 0015 69 22 34 38 OdZ tata alc SSO og 41 143 4 81713027 12 Pasticcini danesi O 031 590 44 29 0 3 019 024 5 36 40 Dimensione 2 00 37 Toast burro e marmellata 32 o Toast imburrato Toast con mostarda Toas con margarina oloast Panino imburrato Dimensione 1 Il grafico congiunto dello spazio individuale Snack con bibita mostra che gli oggetti riga e colonna sono pi vicini alla riga verticale rispetto a quelli del grafico ottenuto con il punto iniziale tradizionale di Spearman Esempio analisi della correttezza dei comportamenti In un classico esempio Price e Bouffard 1974 stato chiesto a 52 studenti di classificare una combinazione di 15 situazioni e 15 comportamenti utilizzando una scala da 0 molto appropriato a 9 molto inadeguato I valori medi riferiti ai partecipanti sono stati considerati dissimilarit Tali informazioni vengono raccolte nel file behavior sav Per ulteriori informazioni vedere File di esempio in Appen
56. ed Boca Raton Chapman amp Hall CRC Commandeur J F e W J Heiser 1993 Mathematical derivations in the proximity scaling PROXSCAL of symmetric data matrices Leiden Department of Data Theory University of Leiden De Haas M J Algera F J M Van Tuijl e J J Meulman 2000 Macro and micro goal setting In search of coherence Applied Psychology 49 579 595 De Leeuw J 1982 Nonlinear principal components analysis In COMPSTAT Proceedings in Computational Statistics Vienna Physica Verlag 77 89 De Leeuw J 1984 Canonical analysis of categorical data 2nd ed Leiden DSWO Press De Leeuw J 1984 The Gifi system of nonlinear multivariate analysis In Data Analysis and Informatics II E Diday et al ed 415 424 De Leeuw J e J Van Rijckevorsel 1980 HOMALS and PRINCALS Some generalizations of principal components analysis In Data Analysis and Informatics E Diday et al ed Amsterdam North Holland 231 242 De Leeuw J F Young e Takane 1976 Additive structure in qualitative data An alternating least squares method with optimal scaling features Psychometrika 41 471 503 332 333 Bibliografia De Leeuw J 1990 Multivariate analysis with optimal scaling In Progress in Multivariate Analysis S Das Gupta e J Sethuraman ed Calcutta Indian Statistical Institute De Leeuw J e W J Heiser 1980 Multidimensional scaling with restrictions on the configuration I
57. et Sebbene l et possa essere scalata come variabile numerica potenzialmente vero che per le persone con meno di 25 anni la relazione tra sicurezza ed et positiva mentre negativa per le persone con pi di 60 anni In questo caso pu essere preferibile considerare l et come una variabile nominale Sempre a titolo di esempio una variabile che ordina le persone in base alle preferenze politiche essenzialmente nominale Tuttavia se si ordinano 1 partiti politici da sinistra a destra possibile che si voglia che la quantificazione dei partiti rispetti quest ordine utilizzando un livello di analisi ordinale Anche se non esistono propriet predefinite di una variabile che le attribuiscano esclusivamente un livello specifico l utente inesperto pu fare riferimento ad alcune linee guida generali Quando si utilizza la quantificazione nominale singola normalmente non si conosce l ordine delle categorie ma si desidera applicarne uno tramite l analisi Se l ordine delle categorie noto utilizzare la quantificazione ordinale Se le categorie non sono ordinabili utilizzare la quantificazione nominale multipla Grafici di trasformazione I diversi livelli di scaling di ciascuna variabile applicano vincoli diversi alle quantificazioni I grafici di trasformazione illustrano la relazione tra le quantificazioni e le categorie originali risultanti dal livello di scaling ottimale selezionato Ad esempio un grafico
58. gt SPSS Categories 17 0 Per ulteriori informazioni sui prodotti software SPSS Inc visitare il sito Web all indirizzo http www spss it o contattare SPSS Inc 233 South Wacker Drive 11th Floor Chicago IL 60606 6412 Tel 312 651 3000 Fax 312 651 3668 SPSS un marchio registrato e gli altri nomi di prodotti sono marchi di software di propriet di SPSS Inc Non consentito produrre o distribuire materiale che descriva il software senza previa autorizzazione scritta dei proprietari dei diritti di marchio e dei diritti di licenza per il software nonch dei diritti di copyright per la documentazione Il SOFTWARE e la documentazione vengono forniti con DIRITTI LIMITATI L utilizzo la duplicazione e la divulgazione da parte del Governo sono soggetti alle restrizioni indicate nella sottoclausola c 1 ii della clausola The Rights in Technical Data and Computer Software al punto 52 227 7013 Il contraente produttore SPSS Inc 233 South Wacker Drive 11th Floor Chicago IL 60606 6412 Brevetto n 7 023 453 Nota altri nomi di prodotti menzionati nel presente documento vengono utilizzati esclusivamente a fini identificativi e sono marchi dei rispettivi proprietari Windows un marchio registrato di Microsoft Corporation Apple Mac e il logo Mac sono marchi registrati di Apple Computer Inc registrato negli Stati Uniti e in altri paesi Questo prodotto utilizza WinWrap Basic Copyright 1993 2007 Polar Eng
59. il numero di caratteri delle etichette dei valori utilizzate per etichettare i punti di ciascun tipo di grafico lineare con il sottocomando PLOT Scrivere una matrice di punteggi di riga e di colonna in un file dati della matrice con il sottocomando OUTFILE Scrivere una matrice delle statistiche di confidenza varianze e covarianze per i valori singolari e i punteggi in un file dati della matrice con il sottocomando OUTFILE Specificare pi insiemi di categorie che devono essere uguali con il sottocomando EQUAL Per informazioni dettagliate sulla sintassi vedere Command Syntax Reference Capitolo Analisi corrispondenze multiple L analisi delle corrispondenze multiple quantifica i dati categoriali nominali assegnando valori numerici ai casi oggetti e alle categorie in modo che gli oggetti all interno della stessa categoria siano vicini tra loro e gli oggetti in diverse categorie siano distanti Ciascun oggetto si trova il pi vicino possibile ai punti delle categorie a esso applicabili In questo modo le categorie dividono gli oggetti in sottogruppi omogenei Le variabili sono considerate omogenee quando classificano gli oggetti nelle stesse categorie negli stessi sottogruppi Esempio possibile utilizzare questa analisi per visualizzare graficamente la relazione tra la categoria lavorativa la classificazione per minoranza e il genere Pu risultare che la classificazione per minoranza e il genere creino discri
60. importanza della dimensione L analisi delle corrispondenze genera una variet di grafici che illustrano graficamente le relazioni sottostanti tra categorie e tra variabili Questo il grafico a dispersione dei punteggi di riga e colonna per la soluzione a due dimensioni Figura 12 8 Grafico dei punteggi di riga e colonna normalizzazione simmetrica 08 3 Dirigenti gitani O Categoria oe anziani o O Fumatore 06 gt Accanito 0 4 N 02 No e O Impiegati anziani oo e Medio E o a 0 2 Segreteria e o Impiegati giovani 0 4 Leggero o 0 6 T T T T T T 0 8 0 6 0 4 0 2 0 0 0 2 0 4 0 6 Dimensione 1 220 Capitolo 12 L interpretazione del grafico piuttosto semplice i punti di riga colonna vicini tra loro sono pi simili dei punti distanti La seconda dimensione separa i dirigenti dagli altri dipendenti mentre la prima separata i livelli senior dai junior con il personale di segreteria in mezzo La normalizzazione simmetrica facilita l esame della relazione tra la categoria lavorativa e il tabagismo Ad esempio i dirigenti sono vicini alla categoria Forte mentre i quadri senior sono pi vicini alla categoria Nessuno I quadri junior sembrano essere associati a un tabagismo Medio o Lieve e il personale di segreteria non associato in modo definito a nessun livello di tabagismo particolare ma comunque lontano da Forte Profili e distanze Per determinare la distanza tra le cate
61. in file di dati attivo Crea variabili Crea nuovo file di dati Nome file di dati variabili_transformate O Scrivi nuovo file di dati Approssimazioni Salva in file di dati attivo Crea approssimazioni Crea nuovo file di dati Nome file di dati approssimazioni O Scrivi nuovo file di dati Dimensioni nominali multiple Tutte Prime Componenti principali categoriale Grafici di oggetti e di variabili Nella finestra di dialogo Grafici di oggetti e di variabili possibile specificare i tipi di grafici desiderati e le variabili per cui essi verranno creati 38 Capitolo 3 Figura 3 9 Finestra di dialogo Grafici di oggetti e di variabili x Componenti principali categoriale Grafici di oggetti e di variabili x Grafici Punti degli oggetti C Oggetti e variabili biplot Coordinate di variabile Etichetta gli oggetti Disponibili Selezionate Etichetta per umore tempo Numero caso preoce corpo Variabile tempdiag numero Annulla Aiuto Punti degli oggetti Viene visualizzato un grafico dei punti degli oggetti Oggetti e variabili biplot I punti degli oggetti vengono tracciati nel grafico in base alle coordinate di variabile specificate ovvero i pesi di componente e i centroidi di variabili Oggetti pesi e centroidi triplot I punti degli oggetti vengono tracciati nel grafico in base ai centroidi di variabili con livelli di
62. in una tabella di corrispondenza Si utilizzer una tabella ipotetica introdotta da Greenacre Greenacre 1984 per illustrare i concetti di base Tali informazioni vengono raccolte nel file smoking sav Per ulteriori informazioni vedere File di esempio in Appendice A a pag 321 La tabella di interesse formata dalla tavola di contingenza del tabagismo per categoria lavorativa La variabile Gruppo personale contiene le categorie lavorative Dirigenti sr Dirigenti jr Quadri sr Quadri jr e Personale di segreteria che verranno utilizzate per creare la soluzione 215 Analisi corrispondenze piu la categoria Media nazionale utilizzabile come categoria supplementare nell analisi La variabile Tabagismo contiene i livelli Nessuno Lieve Medio Forte che verranno utilizzate per creare la soluzione pi le categorie Astemio e Bevitore utilizzabili come categorie supplementari nell analisi Esecuzione dell analisi gt Prima di poter eseguire la procedura Analisi delle corrispondenze l impostazione dei dati richiede che i casi siano pesati tramite il conteggio delle variabili Per farlo dai menu scegliere Dati Pesa casi Figura 12 1 Finestra di dialogo Pesa casi za Pesa casi amp Categoria categ Non pesare i casi amp Fumatore fumatore Pesa i casi per Variabile di frequenza Stato attuale pesa i casi perfreq Incolla Reimposta Annulla Aiuto gt Pesa i casi per conteggio
63. indica l influenza di un oggetto in base alla sua frequenza marginale La massa influenza il centroide ovvero il profilo di colonna o di riga della media ponderata Il centroide di riga il profilo di riga medio I punti con massa elevata come i quadri junior attraggono notevolmente il centroide verso la propria posizione I punti con massa ridotta come i dirigenti senior attraggono lievemente il centroide di riga verso la propria posizione Se si preferisce pensare alla differenza in termini di distanza maggiore la differenza tra i profili di riga maggiore la distanza tra i punti in un grafico Ad esempio quando si utilizza la normalizzazione principale per riga nella configurazione iniziale le distanze euclidee fra i punti di riga nello spazio con tutte le dimensioni sono pari alle distanze chi quadrato tra le righe della tabella di corrispondenza In uno spazio ridotto le distanze euclidee sono approssimazioni delle distanze chi quadrato A loro volta le distanze chi quadrato sono distanze di profilo ponderate Queste distanze pesate si basano sulla massa Analogamente nella normalizzazione principale per colonna le distanze euclidee fra i punti di colonna nella spazio con tutte le dimensioni sono pari alle distanze chi quadrato tra le colonne della tabella di corrispondenza Si noti tuttavia che nella normalizzazione simmetrica queste quantit non sono uguali L inerzia totale definita come la somma ponderata di tutte le dist
64. informazioni finanziarie e demografiche su 850 vecchi e potenziali clienti I primi 700 casi riguardano i clienti a cui sono stati concessi dei prestiti precedentemente Gli ultimi 150 casi riguardano i potenziali clienti che la banca deve classificare come rischi di credito positivi o negativi bankloan_binning sav File di dati ipotetici che contiene informazioni finanziarie e demografiche su 5000 vecchi clienti behavior sav In un classico esempio Price e Bouffard 1974 stato chiesto a 52 studenti di classificare una combinazione di 15 situazioni e 15 comportamenti utilizzando una scala da 0 molto appropriato a 9 molto inadeguato I valori medi riferiti ai partecipanti sono stati considerati dissimilarit behavior_ini sav Questo file di dati contiene la configurazione iniziale di una soluzione a due dimensioni per behavior sav brakes sav File di dati ipotetici che prende in esame il controllo di qualit di un industria che produce freni a disco per automobili con elevate prestazioni Il file di dati contiene le misurazioni del diametro di 16 dischi da ciascuna delle otto macchine di produzione L obiettivo finale ottenere un diametro dei dischi pari a 322 millimetri breakfast sav In uno studio classico Green e Rao 1972 stato chiesto a 21 studenti MBA della Wharton School e ai loro consorti di classificare 15 cibi da colazione in ordine di preferenza dove il valore 1 corrispondeva all alimento preferito
65. misure di similarit o di dissimilarit Dimensioni Per impostazione predefinita una soluzione viene calcolata in due dimensioni Minimo 2 Massimo 2 possibile scegliere un minimo e un massimo compresi tra 1 e il numero degli oggetto meno 1 a patto che il minimo sia minore o uguale al massimo La procedura consente di calcolare una soluzione nelle dimensioni massime e di ridurre quindi la dimensionalit in passaggi fino al raggiungimento di quello inferiore Trasformazioni delle distanze Scegliere una delle seguenti opzioni m Nessuna Le distanze non vengono trasformate Se lo si desidera possibile selezionare Includi intercetta In questo caso le distanze possono essere spostate in base a un termine costante m Lineare Le distanze trasformate sono proporzionali alle distanze originali ovvero la funzione di trasformazione esegue la stima di un inclinazione e l intercetta viene fissata a 0 Questa operazione viene anche definita trasformazione del rapporto Se lo si desidera possibile selezionare Includi intercetta In questo caso le distanze possono inoltre essere spostate in base a un termine costante Questa operazione viene anche definita trasformazione di intervallo 86 Capitolo 8 m Spline Le distanze trasformate sono una trasformazione polinomiale non decrescente livellata delle distanze originali possibile specificare il grado del polinomio e il numero dei nodi interni Se lo si desidera possibi
66. nella soluzione a due dimensioni Si osservino pi in dettaglio i grafici della dimensione 2 rispetto alla 3 e della dimensione 1 rispetto alla 2 Nel piano definito dalle dimensioni 2 e 3 gli oggetti formano un rettangolo con FOLLA COMUNIT MODERNA GRUPPI SECONDARI e UDITORIO ai vertici Su questo piano PUBBLICO e GRUPPI PRIMARI risultano rispettivamente combinazioni convesse di UDITORIO FOLLA e GRUPPI SECONDARI COMUNIT MODERNA Tuttavia come gi indicato sono separati dagli altri gruppi nella dimensione 1 SPETTATORI non separato dagli altri gruppi nella dimensione 1 e sembra rappresentare una combinazione di FOLLA e di COMUNIT MODERNA 151 Analisi Componenti principali categoriale Pesi di componente Figura 10 17 Pesi di componenti a tre dimensioni Dimensione INTENSIT FREQUENZA Appartenenza Vicinanza Formalit Normalizzazione principale per variabile La modalit di separazione degli oggetti non indica per quali variabili corrispondono a quali dimensioni Questo risultato si raggiunge utilizzando i pesi componente La prima dimensione corrispondente essenzialmente a Sentimento di appartenenza Intensit dell interazione e Formalita della relazione la seconda dimensione separa Frequenza dell interazione e Vicinanza fisica la terza separa queste ultime dalle altre Esempio Sintomatologia dei disturbi dell alimentazione I disturbi dell alimentazione sono malattie debilitanti associate a
67. nominale multipli le categorie si trovano nei centroidi degli oggetti delle specifiche categorie Per tutti gli altri livelli di scaling le categorie sono su un vettore che passa per l origine Grafici di categoria congiunti Si tratta di un singolo grafico delle coordinate del centroide e del vettore relativo a ciascuna variabile selezionata Grafici di trasformazione Visualizza un grafico delle quantificazioni di categoria ottimali rispetto agli indicatori di categoria possibile specificare il numero di dimensioni desiderato per le variabili con livelli di scaling nominale multipli Verr generato un grafico per ciascuna dimensione inoltre possibile visualizzare i grafici dei residui per ciascuna variabile selezionata Proietta centroidi di possibile scegliere una variabile e proiettarne i relativi centroidi nelle variabili selezionate che non possono tuttavia essere variabili con livelli di scaling nominale multipli Insieme a questo grafico viene visualizzata anche una tabella con le coordinate dei centroidi proiettati Componenti principali categoriale Grafici dei pesi Nella finestra di dialogo Grafici dei pesi possibile specificare le variabili che verranno incluse nel grafico e se inserirvi o meno 1 centroidi 40 Capitolo 3 Figura 3 11 Finestra di dialogo Grafici dei pesi fattoriali x Componenti principali categorici grafici dei pesi Visualizza pesi dei componenti Variabili dei pesi Disponib
68. ordine delle categorie originali Tuttavia le differenze tra le categorie non vengono mantenute Di conseguenza il grafico di trasformazione non decrescente ma non deve essere necessariamente una linea retta Se categorie consecutive corrispondono a quantificazioni simili la distinzione tra categorie potrebbe essere superflua e le categorie combinate Tali categorie danno come risultato un plateau nel grafico di trasformazione Tuttavia questo modello pu anche derivare dall imposizione di una struttura ordinale a una variabile che dovrebbe essere trattata come nominale Se un successivo trattamento nominale della variabile presenta lo stesso modello la combinazione delle categorie opportuna Inoltre se le quantificazioni per una variabile trattata come ordinale corrispondono a una linea retta una trasformazione numerica pu essere pi adatta Per le variabili trattate come nominali l ordine delle categorie lungo l asse orizzontale corrisponde all ordine dei codici utilizzati per rappresentare le categorie Le interpretazioni dell ordine delle categorie o della distanza tra le categorie sono infondate Il grafico pu assumere qualsiasi forma lineare o non lineare Se presente un trend crescente tentare di eseguire un trattamento ordinale Se il grafico di trasformazione nominale visualizza un trend lineare una trasformazione numerica potrebbe essere pi adatta La figura seguente visualizza il grafico di trasformazione per
69. per colazione I bomboloni i biscotti alla cannella e i pasticcini formano un cluster di cibi morbidi e non tradizionali I muffin e il pane tostato alla cannella formano un cluster di cibi pi duri ma pi tradizionali Gli altri tipi di pane e panini tostati formano un cluster di cibi duri e meno tradizionali Il pane da tostare rientra nel cluster dei cibi duri e decisamente meno tradizionali Gli individui rappresentati dagli oggetti riga sono chiaramente suddivisi in cluster in base alle loro preferenze in termini di cibi duri o morbidi con variazioni significative all interno del cluster lungo la dimensione verticale Esempio unfolding a tre vie delle preferenze relative ai cibi da colazione In uno studio classico Green et al 1972 stato chiesto a 21 studenti MBA della Wharton School e ai loro consorti di classificare 15 cibi da colazione in ordine di preferenza dove 1 era l alimento preferito in assoluto e 15 quello meno preferito Le loro preferenze sono state registrate per sei diversi scenari che comprendevano tutti gli scenari compresi tra Preferenza generale e 293 Unfolding multidimensionale Solo snack con bibita Tali informazioni vengono raccolte nel file breakfast sav Per ulteriori informazioni vedere File di esempio in Appendice A a pag 321 I sei scenari possono essere considerati sorgenti diverse Usare PREFSCAL per eseguire l unfolding a tre vie delle righe colonne e sorgenti La sintassi
70. politico prima e dopo il dibattito Ogni caso rappresenta un rispondente separato debate_aggregate sav File di dati ipotetici che aggrega le risposte contenute nel file debate sav Ciascun caso corrisponde a una classificazione incrociata della preferenza prima e dopo il dibattito demo sav File di dati ipotetici che prende in esame un database di clienti che hanno fatto acquisti al fine di inviare offerte mensili tramite il metodo del direct mailing Viene registrata la risposta dei clienti sia che abbiano aderito all offerta o meno insieme a diverse informazioni demografiche demo_cs_1 sav File di dati ipotetici che prende in esame il primo passo che una societ intraprende per compilare un database con informazioni ricavate dai sondaggi Ogni caso rappresenta una diversa citt Sono registrate anche le informazioni sulla regione provincia distretto e citt 325 File di esempio demo_cs_2 sav File di dati ipotetici che prende in esame il secondo passo che una societa intraprende per compilare un database con informazioni ricavate dai sondaggi Ogni caso rappresenta una diversa unita di abitazione ricavata dalle citta selezionate nel primo passo Sono registrate anche le informazioni sulla regione provincia distretto citta suddivisione e unit Il file include inoltre informazioni sul campionamento ottenute dai primi due stadi del disegno demo_cs sav File di dati ipotetici che contiene informazioni sulle indagini ra
71. positivi La seconda dimensione correlata principalmente alle variabili quantificate Sentimento di appartenenza e Vicinanza fisica in direzioni opposte Questo significa che gli oggetti con punteggio negativo elevato nella dimensione 2 avranno un punteggio elevato per sentimento di appartenenza e ridotto per vicinanza fisica La seconda dimensione quindi rivela un contrasto tra queste due variabili con al contempo una limitata relazione con le variabili quantificate Intensit dell interazione e Frequenza dell interazione 148 Capitolo 10 Figura 10 13 Pesi di componente 10 Vicinanza 0 5 Formalit 0 0 Dimensione 2 FAR Appartenenza 00 02 04 06 08 10 Dimensione 1 Per esaminare la relazione tra gli oggetti e le variabili si consideri il biplot di oggetti e di pesi di componente Il vettore di una variabile orientato nella direzione della categoria massima della variabile Ad esempio per Vicinanza fisica e Sentimento di appartenenza le categorie massime sono rispettivamente elevata e alta Di conseguenza il gruppo FOLLA caratterizzato da un elevata vicinanza fisica e dall assenza di sentimento di appartenenza GRUPPI SECONDARI da una ridotta vicinanza fisica e da un elevato sentimento di appartenenza Figura 10 14 Biplot Oggetti etichettati da O Gruppo oggetti cr corretti in base 10 o alla scala dei 5 Vicinanza pesi Pesi di componente N 05 w c 2 n 0 0 E a 0 5 P
72. prodotto rispetto ai prodotti concorrenti Tramite queste distanze e le relative variabili indipendenti ad esempio il prezzo si pu stabilire quali variabili sono importanti in relazione al modo in cui le persone percepiscono tali prodotti ed quindi possibile adattarne l immagine di conseguenza Statistiche e grafici Cronologia delle iterazioni misure di stress scomposizione di stress coordinate dello spazio comune distanze degli oggetti entro la configurazione finale pesi dello spazio individuale spazi individuali distanze trasformate variabili indipendenti trasformate grafici di stress grafici a dispersione dello spazio comune grafici a dispersione dei pesi dello spazio individuale grafici a dispersione dello spazio individuale grafici di trasformazione grafici dei residui di Shepard e grafici di trasformazione delle variabili indipendenti Dati I dati possono essere forniti come matrici delle distanze o come variabili convertite in matrici delle distanze Le matrici possono essere formattate in colonne o per colonne e per le distanze possono essere presi in considerazione i livelli di scaling di rapporto intervallo ordinale o spline Assunzioni necessario specificare almeno tre variabili e il numero di dimensioni non pu essere maggiore del numero degli oggetti meno uno La riduzione dimensionale non viene presa in considerazione se combinata con inizi casuali multipli Se viene specificata una sola origine tutti
73. quadratica Differenza di dimensione Differenza di modello Varianza o Lance e Williams Crea matrice delle distanze Consente di scegliere l unit di analisi Le alternative sono Fra variabili o Fra casi Trasforma valori In alcuni casi ad esempio quando le variabili sono misurate su scale molto diverse possibile standardizzarne i valori prima di calcolare le dissimilarit non applicabile ai dati binari Selezionare un metodo di standardizzazione dall elenco a discesa Standardizzazione se non richiesta la standardizzazione selezionare Nessuno 75 Scaling multidimensionale PROXSCAL Definire un modello di scaling multidimensionale Nella finestra di dialogo Modello possibile specificare un modello di scaling il numero minimo e massimo delle dimensioni di tale modello la struttura della matrice delle distanze la trasformazione da utilizzare sulle distanze e se le distanze vengono trasformate in ciascuna sorgente separatamente o in modo non condizionale sulla sorgente Figura 7 7 Finestra di dialogo Modello 4 Scaling multidimensionale Modello Modello di scaling Trasformazioni delle distanze Identit Rapporto Euclideo pesato O Intervallo Euclideo generalizzato O Ordinale Rango ridotto O Spline Forma Triangolo inferiore 4 Sas Iriang Applica trasformazioni Triangolo superiore Entro ciascuna sorgente separatamente Matrice completa O Fra tutte le sorgenti sim
74. risposta prevista Le tre categorie successive ricevono valori pi elevati e positivi con conseguente aumento moderato del valore di ozono previsto Le quantificazioni si riducono fino alla categoria 6 per la quale Gradiente pressione ha l effetto decrescente massimo sul valore di ozono previsto Sebbene la linea aumenti dopo questa categoria un livello di scaling ordinale per Gradiente pressione potrebbe non ridurre in modo significativo l adattamento semplificando al contempo le interpretazioni degli effetti Tuttavia la misura di importanza pari a 0 04 e il coefficiente di regressione per Gradiente pressione indica che questa variabile non molto utile nella regressione 121 Regressione categoriale Figura 9 34 Grafico di trasformazione per Visibilita nominale Quantificazioni 12345674911 1 11 a1 3 56 1 6 1 6 Categorie Il grafico di trasformazione per Visibilita come quello per Altezza di base inversione non mostra modelli evidenti L imposizione di vincoli lineare o ordinali alle quantificazioni per questa variabile pu ridurne significativamente l adattamento Figura 9 35 Grafico di trasformazione per Temperatura nominale N Quantificazioni Categorie Il grafico di trasformazione per Temperatura mostra un modello alternativo Le quantificazioni tendono ad aumentare con l aumento delle categorie Come risultato quando Temperatura aumenta l ozono previsto tende ad aumentare anch esso Q
75. scaling nominale multipli e ai pesi di componente di altre variabili Variabili biplot e triplot Per i biplot e i triplot possibile utilizzare tutte le variabili o selezionarne un sottoinsieme Etichetta gli oggetti possibile etichettare gli oggetti con le categorie delle variabili selezionate scegliendo i valori degli indicatori di categoria o le etichette dei valori nella finestra di dialogo Opzioni oppure con i relativi numeri di caso Se selezionata l opzione Variabile viene creato un grafico per ogni variabile Componenti principali categoriale Grafici di categoria Nella finestra di dialogo Grafici di categoria possibile specificare i tipi di grafici desiderati e le variabili per cui tali grafici verranno creati 39 Analisi delle componenti principali categoriale CATPCA Figura 3 10 Finestra di dialogo Grafici di categoria x Componenti principali categoriale Grafici di categoria Grafici di categoria peso mestru calocibo Grafici di categoria congiunti vomito purga iperatt famig emanc Grafici di trasformazione amici scuola attsess compsess o A 7 7 Dimensioni per nominale multipla 2 umore indugi grafici residui corpo tempdiag Proietta centroidi di tempdiag In esag attsess preocc Grafici di categoria Per ciascuna variabile selezionata viene creato un grafico delle coordinate del centroide e del vettore Per le variabili con livelli di scaling
76. sono uguali e l inerzia totale presente in entrambi perci non ha importanza esaminare i punteggi di riga o di colonna Figura 12 46 Punti per 10 citt Atl o Dimensione 2 Dimensione 1 Le posizioni delle citt sono molto simili a quelle geografiche reali ruotate intorno all origine Le citt pi a Sud hanno valori pi elevati lungo la seconda dimensione mentre quelle pi a Ovest hanno valori pi elevati lungo la prima Letture consigliate Consultare i testi seguenti per ulteriori informazioni sull analisi delle corrispondenze Fisher R A 1938 Statistical methods for research workers Edinburgh Oliver and Boyd Fisher R A 1940 The precision of discriminant functions Annals of Eugenics 10 422 429 Gilula Z e S J Haberman 1988 The analysis of multivariate contingency tables by restricted canonical and restricted association models Journal of the American Statistical Association 83 760 771 Analisi corrispondenze multiple Capitolo 13 Lo scopo dell analisi delle corrispondenze multiple nota anche come analisi di omogeneit individuare le quantificazioni ottimali nel senso che le categorie vengono separate le une dalle altre nella misura pi ampia possibile Questo implica che gli oggetti all interno della stessa categoria vengono inseriti nel grafico gli uni accanto agli altri mentre gli oggetti di categorie diverse sono inseriti in posizioni distanti Il termine
77. trattamento di Et in anni come ordinale non sia adeguato Sebbene Et in anni sia misurata a livello ordinale le sue relazioni con altre variabili non sono monotone Per esaminare gli effetti della modifica del livello di scaling ottimale in nominale singolo ripetere l analisi 207 Analisi della correlazione canonica non lineare OVERALS Per eseguire l analisi gt Richiamare la finestra di dialogo Analisi della correlazione canonica non lineare e accedere al primo insieme gt Selezionare et e fare clic su Definisci intervallo e scala gt Nella finestra di dialogo Definisci intervallo e scala selezionare Nominale singola come intervallo di scala gt Fare clic su Continua gt Nella finestra di dialogo Analisi della correlazione canonica non lineare fare clic su OK Gli autovalori per una soluzione a due dimensioni sono pari rispettivamente a 0 806 e 0 757 con adattamento totale pari a 1 564 Figura 11 26 Autovalori per una soluzione a due dimensioni Dimensione 1 2 Somma Perdita Insieme 1 Insieme 2 Insieme 3 Media Autovalore Adattamento Le tabelle di adattamento singolo e multiplo mostrano che Et in anni continua a essere una variabile a elevata discriminazione come evidenziato dalla somma dei valori di adattamento multiplo In contrasto con i risultati precedenti tuttavia l esame dei valori di adattamento singolo rivela che la discriminazione appartiene quasi totalmente alla seconda di
78. uguale al numero totale delle categorie di riga meno 2 Definire l intervallo di colonne nell analisi delle corrispondenze E necessario specificare un intervallo per la variabile di colonna I valori massimo e minimo specificati devono essere interi I valori frazionari vengono troncati nell analisi e i valori di categoria al di fuori dell intervallo specificato vengono ignorati 50 Capitolo 5 Figura 5 3 Finestra di dialogo Definisci intervallo di colonne Analisi delle corrispondenze Definisci interv Intervallo di categorie per la variabile di colonna fumatore Valore min 1 Valore max 4 Vincoli sulle categorie Nessuna O Le categorie sono uguali O La categoria supplementare Tutte le categorie sono inizialmente libere da vincoli e attive possibile applicare alle categorie di colonna il vincolo di essere uguali ad altre categorie di colonna oppure definire una categoria di colonna come supplementare m Le categorie sono uguali I punteggi delle categorie devono essere uguali Se l ordine delle categorie non corrisponde alle aspettative o di difficile comprensione utilizzare il vincolo di uguaglianza Il numero massimo di categorie di colonna alle quali pu essere applicato il vincolo di uguaglianza pari al numero totale delle categorie di colonna attive meno 1 Per applicare vincoli di uguaglianza diversi agli insiemi di categorie utilizzare la sintassi Ad esempio mediante la sin
79. ulteriori informazioni vedere Regressione categoriale Salva a pag 25 m Regressione Ridge La regressione Ridge riduce i coefficienti introducendo un termine di penalit uguale alla somma dei coefficienti al quadrato moltiplicata per un coefficiente di penalit Questo coefficiente pu andare da 0 nessuna penalit a 1 la procedura cercher il valore migliore della penalit se si indica un intervallo e un incremento m Lasso Il termine di penalit Lasso si basa sulla somma dei coefficienti assoluti e la specifica di un coefficiente di penalit simile a quella della regressione Ridge tuttavia Lasso prevede un numero maggiore di operazioni di calcolo m Elastic net Elastic net semplicemente una combinazione delle penalit Lasso e regressione Ridge ed esegue una ricerca nella griglia dei valori specificati al fine di trovare i coefficienti di penalit Lasso e regressione Ridge migliori Per una data coppia di penalit Lasso e regressione Ridge Elastic Net non prevede un numero di calcoli particolarmente pi alto rispetto a Lasso 23 Regressione categoriale CATREG Visualizza grafici di regolarizzazione Si tratta di grafici dei coefficienti di regressione rispetto alla penalita di regolarizzazione Quando si cerca un intervallo di valori per trovare il coefficiente di penalita migliore offre una visualizzazione del modo in cui i coefficienti di regressione cambiano nell arco dell intervallo
80. un quadro chiaro della natura della relazione tra le due variabili Questo particolarmente vero se le variabili di interesse sono nominali senza ordine inerente o rango e contengono numerose categorie La tavola di contingenza pu indicare che le frequenze di celle osservate differiscono notevolmente dai valori attesi in un tavola di contingenza 10x9 di occupazione e cereali da colazione ma pu essere difficile discernere quali gruppi occupazionali hanno gusti analoghi o quali siano questi gusti L analisi delle corrispondenze consente di esaminare graficamente la relazione esistente fra due variabili nominali in uno spazio multidimensionale Essa calcola i punteggi di righe e colonne generando grafici in base a tali punteggi Le categorie simili tra loro sono visualizzate nel grafico vicine le une alle altre In questo modo facile vedere quali categorie di una variabile sono simili tra loro o quali categorie delle due variabili sono correlate L analisi delle corrispondenze consente inoltre di adattare punti supplementari allo spazio definito dai punti attivi Se l ordinamento delle categorie in base ai relativi punteggi non corrisponde alle aspettative o di difficile comprensione possibile imporre vincoli all ordine imponendo che i punteggi siano uguali per alcune categorie Ad esempio si supponga che si preveda che la variabile Tabagismo con le categorie nessuno lieve medio e forte abbia punteggi corrispondenti a questo ordin
81. una distribuzione vicina a quella normale e converte automaticamente i valori delle variabili stringa in valori interi positivi possibile specificare altri schemi di discretizzazione Procedure correlate Lo scaling di tutte le variabili a livello numerico corrisponde all analisi delle componenti principali standard Mediante l utilizzo delle variabili trasformate in un analisi delle componenti principali lineare standard possibile disporre di funzioni alternative per la creazione dei grafici Se per tutte le variabili sono disponibili livelli di scaling nominale multipli l analisi delle componenti principali categoriale equivale all analisi delle corrispondenze multiple Se si desidera considerare insiemi di variabili consigliabile utilizzare l analisi della correlazione canonica non lineare categoriale Per ottenere un analisi delle componenti principali categoriale Dai menu scegliere Analizza Riduzioni dimensione Scaling ottimale Figura 3 1 Finestra di dialogo Scaling ottimale za Scaling ottimale Livello di scala ottimale O Tutte le variabili sono di tipo nominale multiplo Numero di insiemi di variabili Un insieme O Pi insiemi Analisi selezionata Componenti principali categoriale gt Selezionare Una o pi variabili non nominali multiple gt Selezionare Un insieme gt Fare clic su Definisci 29 Analisi delle componenti principali categoriale CATPCA Figura 3 2 Fi
82. v Raggruppamento Numero di categorie 7 Distribuzione Normale O Uniforme O Intervalli uguali Annulla Aiuto Metodo Scegliere un metodo di raggruppamento di classificazione o di moltiplicazione m Raggruppamento Ricodifica in un numero specificato di categorie o ricodifica per intervallo m Classificazione La variabile viene discretizzata tramite la classificazione dei casi Moltiplicazione I valori correnti della variabile vengono standardizzati moltiplicati per 10 arrotondati e viene aggiunta una costante in modo tale che il valore discretizzato minore sia uguale a 1 Raggruppamento Per la discretizzazione delle variabili tramite raggruppamento sono disponibili le seguenti opzioni m Numero di categorie Specificare un numero di categorie e se la distribuzione dei valori della variabile nelle categorie deve essere normale o uniforme m Intervalliuguali Le variabili vengono ricodificate in categorie definite in base agli intervalli di dimensioni uguali specificati E necessario specificare la lunghezza degli intervalli Valori mancanti nell analisi delle corrispondenze multiple Nella finestra di dialogo Valori mancanti possibile scegliere la strategia di gestione dei valori mancanti delle variabili dell analisi e delle variabili supplementari 60 Capitolo 6 Figura 6 5 Finestra di dialogo Valori mancanti lt a MCA Valori mancanti Strategia per i valori mancanti
83. variabile Idealmente oggetti simili dovrebbero formare gruppi esclusivi e questi gruppi dovrebbero essere lontani tra loro Figura 13 9 Punteggi degli oggetti etichettati in base a Filettatura 47 o S _Filett 34 N o 24 E No_Filett 2 o w E w 1 No Filett a S _Filett Oi o o No_Filett S _Filett 07 Si_Fil t_ amp ilatit No_Filett S _Filett Do Fiat Su No_fd tilett No_Filett a T_T_T_T_1TTT 15 10 05 00 05 10 15 Dimensione 1 Il grafico etichettato con Filettatura mostra che la prima dimensione separa perfettamente S _Filettatura e No_Filettatura Tutti gli oggetti con filettature hanno punteggi degli oggetti negativi mentre tutti gli oggetti privi di filettatura hanno punteggi degli oggetti positivi Sebbene le due categorie non formino gruppi compatti la perfetta differenziazione tra le categorie generalmente considerata un buon risultato 259 Analisi corrispondenze multiple Figura 13 10 Punteggi degli oggetti etichettati in base a Forma della testa Ooo CONICA 34 N 24 COPPA 2 o v c o E T COPPA o pie COPPA CONICA 04 GIRA A o Oo PIATTA PIATTA A Do SERDAR PIARLAT AO PIATTA itr erra a 15 10 05 00 05 10 15 Dimensione 1 Il grafico etichettato con Forma della testa mostra che questa variabile comporta una discriminazione in entrambe le dimensioni Gli oggetti PIATTI sono raggruppati nell angolo inferiore destro del grafico mentre gli oggetti A C
84. 0 489 502 336 Bibliografia Roskam E E 1968 Metric analysis of ordinal data in psychology Voorschoten VAM Shepard R N 1962 The analysis of proximities Multidimensional scaling with an unknown distance function I Psychometrika 27 125 140 Shepard R N 1962 The analysis of proximities Multidimensional scaling with an unknown distance function II Psychometrika 27 219 246 Shepard R N 1966 Metric structures in ordinal data Journal of Mathematical Psychology 3 287 315 Tenenhaus M e F Young 1985 An analysis and synthesis of multiple correspondence analysis optimal scaling dual scaling homogeneity analysis and other methods for quantifying categorical multivariate data Psychometrika 50 91 119 Theunissen N M J J Meulman A L Den Ouden H M Koopman G H Verrips S Verloove Vanhorick e J M Wit 2003 Changes can be studied when the measurement instrument is different at different time points Health Services and Outcomes Research Methodology 4 109 126 Tucker L R 1960 Intra individual and inter individual multidimensionality In Psychological Scaling Theory amp Applications H Gulliksen e S Messick ed New York John Wiley and Sons 155 167 Van der Burg E 1988 Nonlinear canonical correlation and some related techniques Leiden DSWO Press Van der Burg E e J De Leeuw 1983 Nonlinear canonical correlation British Journal of Mathematical and Statistical
85. 0 364 x 0 752 0 182 x 0 190 0 273 x 0 375 0 182 x 0 562 0 273 Per la normalizzazione principale per riga il valore singolare non figura nell equazione I punti di riga sono nel centroide ponderato dei punti di colonna attivi per i quali i pesi corrispondono alle voci della tabella dei profili di riga Quando i punti di riga sono la media ponderata dei punti di colonna e viene utilizzata la dimensionalit massima la distanza euclidea tra un punto di riga e l origine pari alla distanza chi quadrato tra la riga e la riga media che a sua volta pari all inerzia di una riga Poich la statistica chi quadrato equivale all inerzia totale per la somma di tutte le celle della tabella di corrispondenza possibile pensare all orientamento dei punti di riga come a una rappresentazione grafica della statistica chi quadrato Un interpretazione corrispondente esiste per la normalizzazione principale per colonna ma non per quella simmetrica Contributi Analisi delle corrispondenze possibile calcolare l inerzia visualizzata in una particolare dimensione I punteggi di ogni dimensione corrispondono a una proiezione ortogonale del punto su tale dimensione Di conseguenza l inerzia per una dimensione pari alla somma ponderata delle distanze quadrate dai punteggi sulla dimensione all origine Tuttavia se questo si applichi o meno ai punteggi di riga o di colonna o a entrambi dipende dal metodo di normalizzazio
86. 19 Spazio comune Figura 15 33 Grafico congiunto dello spazio comune per la soluzione con trasformazione ordinale 150 100 50 Dimensione 2 9 o 4 Eat o e o 072 Shout ALA Org to e e NR am oo Kiss Laugh Tak Run gt Jump o o Belch Cry 13 q4 312 Sleepo o o Read Argue Mumble amp 1 Write o 150 100 50 0 50 100 Dimensione 1 150 Unfolding multidimensionale L interpretazione dello spazio comune lo stesso in entrambe le soluzioni Questa soluzione con la trasformazione ordinale mostra probabilmente un grado di variazione minore sulla dimensione verticale rispetto a quella orizzontale che invece evidente nella soluzione con trasformazione lineare 320 Capitolo 15 Trasformazioni delle distanze Figura 15 34 Grafico di trasformazione per la soluzione con trasformazione ordinale Distanza trasformata 0 2 4 6 8 10 Distanza semplice Fatta eccezione per i valori con le distanze maggiori che tendono a curvarsi verso l altro rispetto al resto dei valori la trasformazione ordinale delle distanze abbastanza lineare Queste distanze spiegano probabilmente il motivo della maggior parte delle differenze tra le soluzioni con trasformazione ordinale e lineare Tuttavia in questo caso le informazioni non sono sufficienti per stabilire se il trend non lineare presente nei valori maggiori un trend reale o un anomalia Letture consigliate Per ulteriori informazion
87. 2 O 4 oo o Toast alla cannella i imidatatoconYMargarina oa IRSA i O a ngarga con mostarda o 11 40 Toastimburrato 120 Toastcon margarina 39 Dimensione 2 Toast o 2 8 o 37 32 Panino imburrato 2 1 0 1 N Dimensione 1 Il grafico congiunto dello spazio comune mostra una configurazione finale che molto simile all analisi a due vie relativa alle preferenze generali in cui la soluzione risulta capovolta rispetto alla riga dei 45 gradi Quindi la dimensione orizzontale mette in evidenza una differenza tra pane morbido e duro o tostato poich i cibi morbidi tendono ad aumentare man mano che ci si sposta verso la parte superiore dell asse La dimensione orizzontale non offre un interpretazione chiara anche se fornisce informazioni sulle differenze in termini di convenienza poich i cibi pi tradizionali tendono ad aumentare man mano che ci sposta verso il lato sinistro dell asse Gli individui rappresentati dagli oggetti riga sono chiaramente suddivisi in cluster in base alle loro preferenze in termini di cibi duri o morbidi con variazioni significative all interno del cluster lungo la dimensione orizzontale 299 Unfolding multidimensionale Spazi individuali Figura 15 14 Pesi di dimensione Dimensione 1 2 Specificit Sorgente 1 3 235 4 297 186 2 4 883 2 193 457 3 4 131 3 438 109 4 4 291 3 267 164 5 3 124 4 413 223 6 2 750 4 541 31
88. 3 Importanza 504 496 a La specificita indica la tipicita di una sorgente Il range della specificita 6 compreso tra zero e uno dove zero indica una sorgente media con pesi di dimensioni identici e uno indica una sorgente molto specifica con un peso di dimensione eccezionale e altri pesi vicini a zero b Importanza relativa di ciascuna dimensione indicata come rapporto tra la somma dei quadrati di una dimensione e il totale della somma dei quadrati Gli spazi individuali vengono calcolati per ciascuna sorgente I pesi di dimensione mostrano il peso dei singoli spazi sulle dimensioni dello spazio comune Un peso alto indica una maggiore distanza dallo spazio individuale e quindi una maggiore differenza in termini di spazio individuale tra gli oggetti della dimensione m La specificita indica il grado di diversit dello spazio individuale rispetto a quello comune Uno spazio individuale identico a quello comune ha generalmente pesi di dimensione identici e una specificit pari a 0 mentre uno spazio individuale riferito a una dimensione specifica ha generalmente pesi di dimensione maggiori e una specificit pari a 1 In questo caso le origini pi divergenti sono Colazione con succo pancetta uova e bibita e Snack con bibita L importanza la misura del contributo relativo di ciascuna dimensione alla soluzione In questo caso le dimensioni hanno la stessa importanza 300 Capitolo 15 Figura 15 15 Pesi di dimensione
89. 5 bullonel bullone2 bullone3 bullone4 bulloneS bullone6 puntinal puntina2 chiodob viteb 249 250 Capitolo 13 Esecuzione dell analisi gt Per eseguire un analisi delle corrispondenze multiple dai menu scegliere Analizza Riduzione dimensionale Scaling ottimale Figura 13 1 Finestra di dialogo Scaling ottimale 2 Scaling ottimale Livello di scala ottimale O Alcune variabili non sono di tipo nominale multiplo Numero di insiemi di variabili Un insieme O Pi insiemi Analisi selezionata Analisi corrispondenze multiple Componenti principali categoriale Correlazione canonica r Annulla Aiuto gt Assicurarsi che le opzioni Tutte le variabili nominali multiple e Un insieme siano selezionate e fare clic su Definisci 251 Analisi corrispondenze multiple Figura 13 2 Finestra di dialogo Analisi delle corrispondenze multiple za Analisi corrispondenze multiple e gt Selezionare da Filettatura a Lunghezza in mezzi pollici come variabili di analisi gt Scegliere oggetto come variabile di etichettatura gt Nel gruppo Grafici fare clic su Oggetto 252 Capitolo 13 Figura 13 3 Finestra di dialogo Grafici Oggetto 3 MCA Grafici degli oggetti Includi punta lungh ottone puntan Q aiia E llunghz Continua _Amnula Aito gt Scegliere di etichettare gli oggetti in base a Variabile gt Scegliere da filettatura a oggett
90. 603 Pesi e pesi di componente Categories Un altra misura dell associazione la correlazione multipla tra combinazioni lineari da ogni insieme e da punteggi degli oggetti Qualora nessuna variabile di un insieme sia nominale multipla possibile calcolare la misura moltiplicando il peso e il peso di componente di ciascuna variabile all interno dell insieme sommando questi prodotti e calcolando la radice quadrata della somma Figura 11 14 Pesi Insieme Et in anni Stato civile Quotidiani letti pi spesso Musica preferita Preferenze abitative Figura 11 15 Pesi di componente Dimensione Insieme Et in annia b Stato civiles b Animali domesticide Dimensione 1 2 Quotidiani letti pi spesso b Musica preferita c d Preferenze abitatives b a Livello di scaling ottimale Ordinale b Proiezioni delle variabili quantificate singole nell area dell oggetto Livello di scaling ottimale Nominale singola d Livello di scaling ottimale Nominale multipla e Proiezioni delle variabili quantificate multiple nell area dell oggetto Questi dati forniscono i pesi e i pesi di componente delle variabili dell esempio La correlazione multipla R per la prima somma ponderata di variabili con scaling ottimale Et in anni e Stato civile con la prima dimensione dei punteggi di oggetti la seguente R 0 701 x 0 841 0 273 x 0 631 V 0 5895 0 1723 0 873 198 Capitolo 11
91. 7 8 Finestra di dialogo Vincoli Scaling multidimensionale Vincoli Vincoli sullo spazio comune O Nessun vincolo O Alcune coordinate fisse Combinazione lineare di variabili indipendenti Variabili vincolo Leggi variabili da File kinship_var say Disponibili Selezionate gender gender interval gener gener interval degree idegree interval v Annulla Aiuto Trasformazioni di variabili indipendenti Intervallo 77 Scaling multidimensionale PROXSCAL Vincoli sullo spazio comune Specificare il tipo di vincolo desiderato m Nessun vincolo Non vengono assegnati vincoli sullo spazio comune m Alcune coordinate fisse La prima variabile selezionata contiene le coordinate degli oggetti della prima dimensione mentre la seconda corrisponde alle coordiante della seconda dimensione e cos via Un valore mancante indica che una coordinata su una dimensione libera Il numero di variabili selezionate deve essere uguale al numero massimo di dimensioni richiesto m Combinazione lineare delle variabili indipendenti Allo spazio comune applicato il vincolo di essere una combinazione lineare delle variabili selezionate Variabili vincolo Selezionare le variabili che definiscono i vincoli sullo spazio comune Se stata specificata una combinazione lineare possibile indicare una trasformazione di tipo intervallo nominale ordinale o spline per le variabili vincolo Il numero dei
92. A Questa opzione include le somme dei quadrati dei residui e della regressione le medie dei quadrati e un test F Vengono visualizzate due tabelle ANOVA una con i gradi di libert per la regressione equivalenti al numero delle variabili predittore e l altra con i gradi di libert per la regressione che tengono conto dello scaling ottimale Coefficienti Questa opzione rende disponibili tre tabelle una tabella Coefficienti che include i coefficienti beta ed il relativo errore standard i valori e la significativit una tabella dei coefficienti dello scaling ottimale con l errore standard dei coefficienti beta che tiene conto dei gradi di libert dello scaling ottimale e una tabella che include la correlazione di ordine zero e parziale la misura di importanza relativa di Pratt per i predittori trasformati e la tolleranza precedente e successiva alla trasformazione Cronologia iterazioni Per ogni iterazione inclusi i valori iniziali dell algoritmo vengono visualizzati gli errori relativi a R multiplo e alla regressione Gli incrementi di R multiplo vengono visualizzati a partire dalla prima iterazione Correlazioni delle variabili originali Viene visualizzata una matrice con le correlazioni tra le variabili non trasformate Correlazioni delle variabili trasformate Viene visualizzata una matrice con le correlazioni tra le variabili trasformate Coefficienti e modelli regolarizzati Visualizza valori di penalit R quadrato e coe
93. DD contribuiscono per la maggioranza alla prima dimensione mentre EE e FF spiegano un ampia porzione dell inerzia per la seconda dimensione AA e BB contribuiscono in modo molto limitato a ciascuna dimensione Figura 12 30 Contributi delle marche Punteggio nella dimensione Contributo del punto all inerzia della dimensione all inerzia del della dimensione punto marca Massa Inerzia 2 Totale BA BB ce DD EE FF Totale attivi In due dimensioni tutte le marche eccetto BB sono ben rappresentate CC e DD sono ben rappresentate in una dimensione La seconda dimensione contribuisce per le porzioni maggiori per EE e FF Si noti che AA rappresentata nella prima dimensione ma non contribuisce in modo significativo a essa Il grafico dei punti di riga mostra che fresca e aspetto sgradevole sono entrambe molto vicine all origine a indicare che differiscono poco dal profilo di riga medio A emergere sono tre classificazioni generali Situati nella parte superiore sinistra del grafico forte uomini e classe lavoratrice sono tutti simili tra loro La parte inferiore sinistra include dolce ingrassante bambini e alta qualit Di contro salutare pochi grassi nutriente e nuova sono raggruppati nella parte destra del grafico 238 Capitolo 12 Figura 12 31 Grafico degli attributi dell immagine normalizzazione principale pesante 1 0 uomini N A funziona 2 05 o affumicato w ro caffe
94. Esistono due direzioni che non coincidono con gli assi verticale e orizzontale Una direzione determinata da Et in anni Giornale letto pi spesso e Preferenze vicinato L altra direzione definita dalle variabili Stato civile Musica preferita e Animali domestici La variabile Animali domestici una variabile nominale multipla quindi per essa sono inseriti nel grafico due punti Ogni quantificazione viene interpretata come una variabile singola 200 Capitolo 11 Grafici di trasformazione I diversi livelli di scaling di ciascuna variabile determinano l applicazione di vincoli alle quantificazioni I grafici di trasformazione illustrano la relazione tra le quantificazioni e le categorie originali risultanti dal livello di scaling ottimale selezionato Il grafico di trasformazione per Preferenze vicinato trattata come nominale visualizza un modello con forma a U nel quale la categoria centrale riceve la quantificazione minore e le categorie alle estremit valori simili tra loro Questo modello indica una relazione quadratica tra la variabile originale e la variabile trasformata L utilizzo di un livello di scaling ottimale alternativo non consigliabile per Preferenze vicinato Figura 11 18 Grafico di trasformazione per Preferenze vicinato nominale 1 0 0 5 0 0 Quantificazioni di categoria per Preferenze abitative O in Grande citt Piccola citt Campagna Preferenze abitative 201 Analisi del
95. Figura 15 18 Finestra di dialogo Opzioni ia Unfolding multidimensionale opzioni Configurazione iniziale Criteri di iterazione O Classica Stress minimo O Ross Cliff Max iterazioni O Centroidi Termine penalit O Inizi casuali multipli Intensit Intervallo Personalizzato Configurazione personalizzata Convergenza stress 0001 000 000001 gt Fare clic su Continua Selezionare Corrispondenza nel gruppo Configurazione iniziale Nella finestra di dialogo Unfolding multidimensionale fare clic su OK Segue la sintassi di comandi generata da queste selezioni PREFSCAL VARIABLES TP BT EMM JD CT BMM HRB TMd BTJ TMn CI INPUT SOURCES srcid INITIAL CORRESPONDENCE TRANSFORMATION NONE PROXIMITIES DISSIMILARITIES CRITERIA DIMENSIONS 2 2 DIFFSTRESS 000001 MAXITER 5000 PENALTY LAMBDA 0 5 OMEGA 1 0 PRINT MEASURES COMMON PLOT COMMON WEIGHTS INDIVIDUAL ALL B DP GD CC CMB MINSTRESS 0001 m L unica variazione contenuta nel sottocomando INITIAL La configurazione iniziale stata impostata su CORRESPONDENCE che usa i risultati dell analisi della corrispondenza sui dati invertiti similarit anzich dissimilarit insieme a una normalizzazione simmetrica dei punteggi delle righe e delle colonne 304 Capitolo 15 Misure Figura 15 19 Misure per la configurazione iniziale della corr
96. OPPA sono raggruppati nella parte superiore destra Gli oggetti CONICA sono tutti posizionati nella parte superiore sinistra Tuttavia tali oggetti sono pi distribuiti rispetto agli altri gruppi e di conseguenza non altrettanto omogenei Infine gli oggetti CILINDRICA non possono essere separati dagli oggetti ROTONDI entrambi sono posizionati nell angolo inferiore destro del grafico 260 Capitolo 13 Figura 13 11 Punteggi degli oggetti etichettati in base a Lunghezza in mezzi pollici 4 o cm 6 25 34 N v 24 c cm 6 25 o o v c w E 14 cm 3 75 o SE a cm 375 cm 1 25 07 amS cm ems pres cm 2 5 o AS za cm 2 59cm 2 5 15 10 05 00 05 10 15 Dimensione 1 Il grafico etichettato con Lunghezza in mezzi pollici mostra che questa variabile non comporta una discriminazione nella prima dimensione Le sue categorie non visualizzano alcun raggruppamento se proiettate su una linea orizzontale Tuttavia Lunghezza in mezzi pollici non comporta una discriminazione nella seconda dimensione Gli oggetti pi corti corrispondono a punteggi positivi gli oggetti pi lunghi a elevati punteggi negativi Figura 13 12 Punteggi degli oggetti etichettati in base a Ottone 4 e Dimensione 2 1 5 10 05 00 05 10 15 Dimensione 1 Il grafico etichettato con Ottone mostra che questa variabile include categorie che non possibile separare nettamente nella prima o nella seconda dimensione I punteggi degli ogg
97. OT COMMON TRANSFORMATIONS m L unica variazione contenuta nel sottocomando TRANSFORMATION La trasformazione stata impostata su ORDINAL che mantiene l ordine delle distanze ma non richiede che 1 valori trasformati siano proporzionali ai valori originali 318 Capitolo 15 Misure Figura 15 32 Misure per la soluzione con trasformazione ordinale Iterazioni 268 Valore finale della funzione 6044671 Parti dei valori della Parte dello stress 1747239 funzione Parte penalit 2 0911875 Cattivo adattamento Stress normalizzato 0305285 Stress di Kruskal 1747239 Stress Il di Kruskal 4444641 S stress di Young 12707147 S stress Il di Young 3978003 Bont dell adattamento Dispersione spiegata in 9694715 base a Varianza spiegata in base 8454488 a Ordini delle preferenze 8574206 recuperate Rho di Spearman 9032676 Tau b di Kendall 7532788 Coefficienti di variazione Vicinanze delle variazioni 5138436 Vicinanze trasformate delle Ar 4930018 variazioni Distanze delle variazioni 4284849 Indici di degenerazione Somma dei quadrati degli indici di amalgamazione di 3610680 DeSarbo Indice di non degenerazione approssimativo di Shepard 404048 L algoritmo converge dopo 268 interazioni con uno stress penalizzato finale pari a 0 6044671 Questa statistica e le altre misure sono leggermente migliori per questa soluzione rispetto a quella che prevede la trasformazione lineare delle distanze 3
98. Ora per visualizzare i chilometraggi in una tavola di contingenza dai menu scegliere Analizza Statistiche descrittive Tavole di contingenza Figura 12 36 Finestra di dialogo Tavole di contingenza s Tavole di contingenza e colonna Strato1di Si gt Selezionare riga come variabile di riga 242 Capitolo 12 gt Selezionare col come variabile di colonna gt Fare clic su OK La tabella seguente include i chilometraggi aerei tra le citt Si noti che presente una sola variabile per righe e colonne e che la tabella simmetrica la distanza tra Los Angeles e Miami e tra Miami e Los Angeles la stessa Inoltre la distanza tra la stessa citt ovviamente uguale a 0 Il margine attivo riflette il chilometraggio totale da ogni citt a tutte le altre Figura 12 37 Chilometraggi aereo tra 10 citt americane Conteggio colonna San Washington Atlanta Chicago Denver Houston Los Angeles Miami New York Francisco Seattle DC 10652 10285 10663 11038 14282 14168 13239 15223 15939 12053 Totale 127542 In generale le distanze indicano dissimilarit valori elevati indicano un ampia differenza tra le categorie Tuttavia l analisi delle corrispondenze richiede una misura di associazione di conseguenza necessario convertire le dissimilarit in similarit In altre parole una voce di grandi dimensioni deve corrispondere a una differenza limitata tra le
99. Per ogni dimensione 1 perdita R2 Ad esempio dalla tabella Riepilogo dell analisi 1 0 238 0 762 pari a 0 873 elevato al quadrato tenendo conto di un certo grado di errore di arrotondamento Di conseguenza valori di perdita limitati indicano elevate correlazioni multiple tra le somme ponderate delle variabili e delle dimensioni con scaling ottimale I pesi non sono univoci per le variabili nominali multiple Per le variabili nominali multiple utilizzare 1 perdita per insieme Ripartizione dell adattamento e perdita La perdita di ogni insieme viene ripartita dall analisi della correlazione canonica non lineare in vari modi La tabella di adattamento presenta le tabelle di adattamento multiplo di adattamento singolo e di perdita singola generate dall analisi della correlazione canonica non lineare per l indagine di esempio Si noti che l adattamento multiplo meno l adattamento singolo pari alla perdita singola Figura 11 16 Ripartizione dell adattamento e perdita Adattamento multiplo Adattamento singolo Perdita singola ERRE a omens Dimensione Somma Somma 1 2 Eta in annia Stato civileb Animali domestici Quotidigni letti pi spesso Musica preferitab Preferenze abitativeb a Livello di scaling ottimale Ordinale b Livello di scaling ottimale Nominale singola Livello di scaling ottimale Nominale multipla La perdita singola indica la perdita risultante dalla limitazione d
100. Prezzo trattato come numerico Si noti che l ordine delle categorie lungo la linea retta corrisponde all ordine delle categorie originali Inoltre la differenza tra le quantificazioni per 1 19 e 1 39 1 173 e 0 pari alla differenza tra le quantificazioni per 1 39 e 1 59 0 e 1 173 Il fatto che la distanza delle categorie 1 e 3 dalla categoria 2 sia la stessa mantenuto nelle quantificazioni 111 Regressione categoriale Figura 9 21 Grafico di trasformazione del prezzo numerico 0 5 00 Quantificazioni 119 41 39 1 59 Categorie La trasformazione nominale di Design confezione genera il seguente grafico di trasformazione Si noti la forma non lineare distinta in cui la seconda categoria ha la quantificazione maggiore In termini di regressione la seconda categoria riduce la classificazione della preferenza prevista mentre la prima e la terza categoria hanno l effetto opposto Figura 9 22 Grafico di trasformazione per Design confezione nominale 0 5 00 Quantificazioni At Bt ct Categorie 112 Capitolo 9 Analisi dei residui Utilizzando i dati trasformati e i residui salvati nel file di dati attivo possibile creare un grafico a dispersione dei valori attesi a partire dai valori trasformati di Design confezione Per ottenere tale grafico richiamare Generatore di grafici e fare clic su Ripristina per annullare le selezioni precedenti e ripristinare le opzioni predefinite Figura 9
101. Respiratory Diseases 129 366 374 337 Bibliografia Winsberg S e J Ramsay 1980 Monotonic transformations to additivity using splines Biometrika 67 669 674 Winsberg S e J Ramsay 1983 Monotone spline transformations for dimension reduction Psychometrika 48 575 595 Wolter K M 1985 Introduction to variance estimation Berlin Springer Verlag Young F W 1981 Quantitative analysis of qualitative data Psychometrika 46 357 387 Young F W J De Leeuw e Y Takane 1976 Regression with qualitative and quantitative variables An alternating least squares method with optimal scaling features Psychometrika 41 505 528 Young F W Y Takane e J De Leeuw 1978 The principal components of mixed measurement level multivariate data An alternating least squares method with optimal scaling features Psychometrika 43 279 281 Zeijl E Y te Poel M du Bois Reymond J Ravesloot e J Meulman 2000 The role of parents and peers in the leisure activities of young adolescents Journal of Leisure Research 32 281 302 adattamento in analisi della correlazione canonica non lineare 45 aggiornamenti rilassati in scaling multidimensionale 77 alfa di Cronbach in analisi Componenti principali categoriale 143 Analisi Componenti principali categoriale 138 analisi Componenti principali categoriale 27 33 151 cronologia iterazioni 143 funzioni aggiuntive del comando 40 livello di scaling ottimale
102. U o Ag artenenza o 1 5 10 0 5 0 0 05 10 Dimensione 1 149 Analisi Componenti principali categoriale Dimensioni aggiuntive L aumento del numero delle dimensioni aumenta la quantita di variazioni considerate e pu rivelare differenze non evidenti nelle soluzioni con un numero di dimensioni minore Come notato in precedenza in presenza di due dimensioni PUBBLICO e GRUPPI PRIMARI non possono essere separati Tuttavia l aumento della dimensionalit pu consentire una differenziazione tra i due gruppi Esecuzione dell analisi gt Per ottenere una soluzione a tre dimensioni richiamare la finestra di dialogo Componenti principali categoriale gt Digitare 3 come numero di dimensioni per la soluzione gt Fare clic su OK nella finestra di dialogo Analisi componenti principali categoriale Riepilogo del modello Regressione output Figura 10 15 Riepilogo modello Varianza spiegata Alfa di Totale Dimensione Cronbach autovalore di varianza Totale a Il totale di Alfa di Cronbach basato sul totale dell autovalore Una soluzione a tre dimensioni ha autovalori pari a 3 424 0 844 e 0 732 che spiegano la quasi totalit della varianza Punteggi oggetto I punteggi degli oggetti per la soluzione a tre dimensioni sono tracciati in una matrice di grafici a dispersione nella quale ogni dimensione viene tracciata rispetto alle altre in una serie di grafici a dispersione a due dimensioni Si noti
103. Uno dei principali vantaggi di queste procedure consiste nel fatto che dispongono i dati con diversi livelli di scaling ottimale La regressione categoriale descrive la relazione tra una variabile di risposta categoriale e una combinazione di variabili predittore categoriali L influenza di ciascuna variabile predittore sulla variabile di risposta descritta dal peso della regressione corrispondente Come nelle altre procedure possibile analizzare i dati con diversi livelli di scaling ottimale Lo scaling e l unfolding multidimensionale descrivono le relazioni tra gli oggetti in uno spazio dimensionale ridotto utilizzando le distanze tra gli oggetti Seguono alcune linee guida per ciascuna delle procedure m Utilizzare la regressione categoriale per la previsione dei valori di una variabile dipendente categoriale da una combinazione di variabili dello stesso tipo m Utilizzare l analisi delle componenti principali categoriale per tenere conto dei modelli di variazione in un singolo insieme di variabili con livelli di scaling ottimale misti m Utilizzare l analisi della correlazione canonica non lineare per valutare il grado di correlazione tra due o pi insiemi di variabili con livelli di scaling ottimale misti m Utilizzare l analisi delle corrispondenze per analizzare le tavole di contingenza a due vie o 1 dati che possibile esprimere in una tavola a due vie ad esempio dati relativi alla marca preferita o di scelta sociometri
104. a vettore che passa per l origine La trasformazione ottenuta ha un grado di adeguatezza maggiore di quello ottenuto con la trasformazione dello spline ordinale ma meno regolare m Nominale Le uniche informazioni della variabile osservata che verranno mantenute nella variabile con scaling ottimale sono quelle relative al raggruppamento degli oggetti in categorie Non viene mantenuto l ordine delle categorie della variabile osservata I punti di categoria si troveranno su una linea retta vettore che passa per l origine La trasformazione ottenuta ha un grado di adeguatezza maggiore di quello ottenuto con la trasformazione dello spline nominale ma meno regolare m Numerica Le categorie vengono considerate come ordinate ed equamente distanziate a livello di intervallo L ordine delle categorie e le distanze uguali tra i numeri delle categorie della variabile osservata vengono mantenuti nella variabile con scaling ottimale I punti di categoria si troveranno su una linea retta vettore che passa per l origine Se tutte le variabili sono a livello numerico l analisi corrisponde all analisi delle componenti principali standard 18 Capitolo 2 Regressione categoriale Discretizzazione Nella finestra di dialogo Discretizzazione possibile selezionare un metodo di ricodifica delle variabili Le variabili con valori frazionari sono raggruppate in sette categorie o nel numero di valori distinti della variabile se tal
105. a cinque categorie e per tre di esse valido il vincolo di uguaglianza per stabilire il numero massimo di dimensioni sar necessario considerare che la variabile abbia tre categorie Due delle categorie non sono vincolate mentre la terza categoria corrisponde alle tre categorie vincolate Se si specifica un numero di dimensioni maggiore del massimo verr utilizzato il valore massimo Procedure correlate Se sono implicate pi di due variabili utilizzare l analisi delle corrispondenze multiple Se le variabili devono essere scalate in modo ordinale utilizzare l analisi delle componenti principali categoriale Per ottenere un analisi delle corrispondenze Dai menu scegliere Analizza Riduzioni dimensione Analisi corrispondenze Figura 5 1 Finestra di dialogo Analisi della corrispondenze 5 Analisi corrispondenze zr NON Modello Jil Fumatore fumatore categ P freq Definisci intervallo Statistiche Colonna Selezionare una variabile di riga Selezionare una variabile di colonna Definire gli intervalli per le variabili Fare clic su OK Definire l intervallo di righe nell analisi delle corrispondenze E necessario specificare un intervallo per la variabile di riga I valori massimo e minimo specificati devono essere interi I valori frazionari vengono troncati nell analisi e i valori di categoria al di fuori dell intervallo specificato vengono ignorati 49 An
106. a nella finestra di dialogo Componenti principali categoriale gt Fare clic su Output 141 Figura 10 4 Finestra di dialogo Output x Componenti principali categoriale Output Tabelle Punteggi degli oggetti Pesi di componente C Correlazioni delle variabili originali Correlazioni delle variabili trasformate C Cronologia delle iterazioni Varianza spiegata Variabili quantificate freq appart vicinan formal Variabili etichetta Quantificazioni di categoria Statistiche descrittive Opzioni per punteggi di oggetti Includi categorie Etichetta in base a Analisi Componenti principali categoriale Selezionare Punteggi degli oggetti e deselezionare Correlazioni delle variabili trasformate nel gruppo Tabelle Scegliere di generare quantificazioni di categoria per le variabili da intensit Intensit dell interazione a formalit Formalit della relazione Scegliere di etichettare i punteggi degli oggetti in base a cluster Fare clic su Continua Fare clic su Oggetto nel gruppo Grafici della finestra di dialogo Analisi componenti principali categoriale 142 Capitolo 10 Figura 10 5 Finestra di dialogo Grafici di oggetti e di variabili x Componenti principali categoriale Grafici di oggetti e di variabili appart 1cinan Formal gruppo gt Selezionare Oggetti e variabili biplot nel gruppo Grafici gt Sc
107. a un insieme di oggetti o casi Questa operazione viene compiuta assegnando le osservazioni a posizioni specifiche in uno spazio concettuale ridotto in modo tale che le distanze tra i punti nello spazio corrispondano il pi possibile alle dissimilarit specificate In questo modo si ottiene una rappresentazione dei minimi quadrati degli oggetti all interno dello spazio dimensionale ridotto che nella maggior parte dei casi aiuta a comprendere meglio i dati Relazione con altre procedure di Categories Quando sono presenti dati multivariati dai quali si creano distanze e che quindi si analizzano tramite scaling multidimensionale i risultati sono simili a quelli dell analisi dei dati tramite analisi delle componenti categoriali principali con normalizzazione principale degli oggetti Questo tipo di PCA nota anche come analisi delle coordinate principali Relazione con le tecniche standard La procedura di scaling multidimensionale del modulo Categories PROXSCAL offre numerosi miglioramenti rispetto alla procedura di scaling disponibile nel modulo Base PROXSCAL offre un algoritmo pi rapido per alcuni modelli e consente di assegnare vincoli sullo spazio comune Inoltre PROXSCAL tenta di ridurre al minimo il raw stress normalizzato anzich l s stress anche denominato deformazione Il raw stress normalizzato generalmente preferibile in quanto rappresenta una misura basata sugli scostamenti mentre l s stress si basa sui quadrati deg
108. abella seguente I punteggi relativi ai sintomi sono assenti per il paziente 71 alla visita 2 il 152 Capitolo 10 paziente 76 alla visita 2 e il paziente 47 alla visita 3 con 217 osservazioni valide Questi dati sono reperibili in anorectic sav Per ulteriori informazioni vedere File di esempio in Appendice A a pag 321 Tabella 10 3 Sottoscale di Morgan Russell modificate per la misura del benessere Nome di variabile peso ciclo digiuno eccessi vomito lassativi iper fami eman amici scuola attses comses umore preo corpo Etichetta di valore Peso corporeo Ciclo mestruale Limitata ingestione di cibo digiuno Eccessi alimentari Episodi di vomito Uso di lassativi Iperattivit Rapporti famigliari Emancipazione dalla famiglia Relazioni amicali Risultati lavorativi scolastici Atteggiamento sessuale Comportamento sessuale Stato mentale umore Preoccupazione legata a cibo e peso Percezione del proprio corpo Estremit inferiore punteggiol Esterno all intervallo normale Amenorrea Minore di 1200 calorie Piu spesso di una volta a settimana Pi spesso di una volta a settimana Pi spesso di una volta a settimana Impossibilit di stare fermo a Scarse Elevato grado di dipendenza Assenza di amici intimi Lavoro scuola interrotto Non adeguato Non adeguato Molto depresso Completo Distorta Estremit superiore punteggio 3 o 4 Normale
109. afici di categoria Grafici di categoria peso mestru calocibo Grafici di categoria congiunti vomito purga iperatt famig emanc Grafici di trasformazione amici scuola compsess z aks 7 z Dimensioni per nominale multipla umore nc grafici residui corpo tempdiag Proietta centroidi di Richiedere i grafici di categoria per tidi Richiedere i grafici di trasformazione per le variabili da peso a corpo Scegliere di proiettare i centroidi di tidi su eccesso attses e preo Fare clic su Continua Fare clic su OK nella finestra di dialogo Analisi componenti principali categoriale La procedura d come risultato punteggi per i soggetti con media 0 e varianza di unit e quantificazioni delle categorie che massimizzano la correlazione quadratica media tra i punteggi dei soggetti e le variabili trasformate Nell analisi corrente le quantificazioni di categoria sono state limitate per riflettere le informazioni ordinali 164 Capitolo 10 Infine per scrivere le informazioni della tabella dei centroidi proiettati nel file projected_centroids sav necessario terminare la richiesta SGO Richiamare il Pannello di controllo SGO Figura 10 31 Pannello di controllo sistema di gestione dell output x Pannello di controllo sistema di gestione dell output Richieste Stato ID Tipi Comandi Sottotipi Etichette Destinazione Forni Ter p jactive Idi Tables CATPCA PROJECTED C ttempproject
110. afico Visualizza tutte le dimensioni nella soluzione O Limita il numero di dimensioni Annulla Aiuto Grafici a dispersione Crea una matrice di tutti i grafici pairwise delle dimensioni Sono disponibili i seguenti grafici a dispersione Biplot Crea una matrice dei grafici congiunti dei punti di riga e di colonna Se selezionata la normalizzazione principale l opzione non disponibile m Punti di riga Crea una matrice di grafici dei punti di riga m Punti di colonna Crea una matrice di grafici dei punti di colonna inoltre possibile specificare il numero di caratteri delle etichette dei valori da utilizzare per etichettare i punti che deve essere un intero non negativo inferiore o uguale a 20 Grafici lineari Crea un grafico per ciascuna dimensione della variabile selezionata Sono disponibili i seguenti grafici lineari m Categorie di riga trasformate Crea un grafico dei valori delle categorie di riga originali confrontati con i punteggi di riga corrispondenti m Categorie di colonna trasformate Crea un grafico dei valori delle categorie di colonna originali confrontati con i punteggi di colonna corrispondenti inoltre possibile specificare il numero di caratteri delle etichette dei valori da utilizzare per etichettare l asse delle categorie che deve essere un intero non negativo inferiore o uguale a 20 Dimensioni del grafico Consente di controllare le dimensioni visualizzate nell
111. al disegno specificato nel file di piano poll csplan e questo file di dati contiene le probabilit di inclusione e i pesi del campione Tuttavia notare che poich fa uso del metodo PPS probability proportional to size 328 Appendice A probabilita proporzionale alla dimensione esiste anche un file contenente le probabilita di selezione congiunte poll_jointprob sav Le ulteriori variabili corrispondenti ai dati demografici dei votanti e alla loro opinione sul disegno di legge sono state raccolte e aggiunte al file di dati dopo aver acquisito il campione property_assess sav File di dati ipotetici che prende in esame l impegno di un perito di una contea nel tentativo di mantenere gli accertamenti sui valori delle propriet aggiornati in base alle risorse limitate I casi rappresentano le propriet vendute nella contea nello scorso anno Ogni caso nel file di dati contiene informazioni sul comune in cui si trova la propriet il perito che per ultimo ha visitato la propriet il tempo trascorso dall accertamento la valutazione fatta in tale momento e il valore di vendita della propriet property_assess_cs sav File di dati ipotetici che prende in esame l impegno di un perito di uno stato nel tentativo di mantenere aggiornati gli accertamenti sui valori delle propriet in base alle risorse limitate I casi corrispondono alle propriet nello stato Ogni caso nel file di dati include informazioni sulla contea il comune e il q
112. al foundations of human behavior Introduction to the study of sociology New York Harper amp Row Benz cri J P 1969 Statistical analysis as a tool to make patterns emerge from data In Methodologies of Pattern Recognition S Watanabe ed New York Academic Press 35 74 Benz cri J 1992 Correspondence analysis handbook New York Marcel Dekker Bishop Y M S E Feinberg e P W Holland 1975 Discrete multivariate analysis Theory and practice Cambridge Mass MIT Press Blake C L e C J Merz 1998 UCI Repository of machine learning databases Available at http www ics uci edu mlearn MLRepository html Breiman L e J Friedman 1985 Estimating optimal transformations for multiple regression and correlation Journal of the American Statistical Association 80 580 598 Buja A 1990 Remarks on functional canonical variates alternating least squares methods and ACE Annals of Statistics 18 1032 1069 Busing F T A P F Groenen e W J Heiser 2005 Avoiding degeneracy in multidimensional unfolding by penalizing on the coefficient of variation Psychometrika 70 71 98 Carroll J D 1968 Generalization of canonical correlation analysis to three or more sets of variables In Proceedings of the 76th Annual Convention of the American Psychological Association 3 Washington D C American Psychological Association 227 228 Collett D 2003 Modelling survival data in medical research 2
113. ale singolo La scelta della configurazione casuale Inizi casuali multipli Vengono scelte numerose configurazioni casuali e come configurazione iniziale viene utilizzata quella con il livello di Raw Stress normalizzato pi basso m Personalizzata possibile selezionare le variabili che contengono le coordinate della configurazione iniziale specificata Il numero delle variabili selezionate deve essere uguale al numero massimo di dimensioni specificato La prima variabile corrisponde alle coordinate sulla dimensione 1 la seconda variabile alle coordinate sulla dimensione 2 e cos via Il numero dei casi di ciascuna variabile deve essere uguale al numero degli oggetti Criteri di iterazione Specificare i valori dei criteri di iterazione m Convergenza stress L algoritmo di iterazione si interrompe quando la differenza tra i valori di Raw Stress normalizzato consecutivi inferiore al numero specificato che deve essere compreso tra 0 0 e 1 0 Stress minimo L algoritmo si interrompe quando il valore di Raw Stress normalizzato inferiore al numero specificato che deve essere compreso tra 0 0 e 1 0 m Max iterazioni L algoritmo esegue il numero di iterazioni specificato a meno che non sia stato soddisfatto in precedenza uno dei criteri sopra riportati Aggiornamenti rilassati Gli aggiornamenti rilassati consentono di velocizzare l algoritmo Questi aggiornamenti non possono essere utilizzati con modelli diversi dal modell
114. alisi corrispondenze Figura 5 2 Finestra di dialogo Definisci intervallo di righe Analisi delle corrispondenze Definisci interv Intervallo di categorie per la variabile di riga categ Valore min 1 Coc 55 sagoma Vincoli sulle categorie Nessuna O Le categorie sono uguali O La categoria supplementare Tutte le categorie sono inizialmente libere da vincoli e attive possibile applicare alle categorie di riga il vincolo di essere uguali ad altre categorie di riga oppure definire una categoria di riga come supplementare m Le categorie sono uguali I punteggi delle categorie devono essere uguali Se l ordine delle categorie non corrisponde alle aspettative o di difficile comprensione utilizzare il vincolo di uguaglianza Il numero massimo di categorie di riga alle quali pu essere applicato il vincolo di uguaglianza pari al numero totale delle categorie di riga attive meno 1 Per applicare vincoli di uguaglianza diversi agli insiemi di categorie utilizzare la sintassi Ad esempio mediante la sintassi possibile vincolare l uguaglianza delle categorie 1 e 2 e vincolare l uguaglianza delle categorie 3 e 4 m La categoria supplementare Le categorie supplementari non influiscono sull analisi ma devono essere rappresentate nello spazio definito dalle categorie attive Non influiscono in alcun modo sulla definizione delle dimensioni Il numero massimo di categorie di riga supplementari
115. amento Tuttavia se l analisi ordina le categorie nessuno lieve intenso e medio imponendo che i punteggi per intenso e medio siano uguali si mantiene l ordinamento delle categorie nei rispettivi punteggi L interpretazione dell analisi delle corrispondenze in termini di distanze dipende dal metodo di normalizzazione utilizzato L analisi delle corrispondenze pu essere utilizzata per analizzare le differenze tra le categorie di una variabile o tra le variabili Con la normalizzazione predefinita essa analizza le differenze tra le variabili di riga e di colonna L algoritmo dell analisi delle corrispondenze in grado di eseguire vari tipi di analisi La centratura delle righe e delle colonne e l utilizzo delle distanze chi quadrato corrisponde all analisi delle corrispondenze standard Tuttavia l utilizzo delle opzioni di centratura alternative combinate con le distanze euclidee consente una rappresentazione alternativa di una matrice in uno spazio a ridotto numero di dimensioni Verranno illustrati tre esempi il primo impiega una tabella di corrispondenza relativamente limitata e illustra i concetti legati all analisi delle corrispondenze Il secondo esempio illustra un applicazione di marketing pratica L esempio finale utilizza una tabella delle distanze in un approccio di scaling multidimensionale 213 214 Capitolo 12 Normalizzazione La normalizzazione utilizzata per distribuire l inerzia nei punt
116. ando la percentuale dell inerzia del punto cui contribuisce ogni dimensione Si noti che la somma dei contributi delle dimensioni ai valori di inerzia dei punti non pari a uno In uno spazio ridotto l inerzia cui contribuiscono le dimensioni maggiori non rappresentata Utilizzando la massima dimensionalit verrebbe rilevata l inerzia non spiegata Le prime due dimensioni contribuiscono tutte all inerzia per i quadri senior e junior e alla quasi totalit dell inerzia per dirigenti junior e personale di segreteria Per i dirigenti senior P11 dell inerzia non dipende dal contributo delle prime due dimensioni Due dimensioni contribuiscono a una proporzione molto ampia dell inerzia dei punti di riga Risultati analoghi si verificano per i punti di colonna Per ogni punto di colonna attivo due dimensioni contribuiscono almeno al 98 dell inerzia La terza dimensione fornisce un contributo molto ridotto a tali punti Permutazioni della tabella di corrispondenza A volte utile ordinare le categorie delle righe e delle colonne Ad esempio potrebbe essere che le categorie di una variabile corrispondano a un certo ordine che per non noto Questo problema di ordinamento si presenta in varie discipline il problema della disposizione in serie in archeologia dell ordinazione in fitosociologia e il problema dello scalogramma di Guttman nelle scienze sociali L ordinamento pu essere ottenuto considerando i punteggi di riga e d
117. ank Busing Willem Heiser Patrick Groenen e Peter Neufeglise hanno partecipato allo sviluppo della procedura PREFSCAL Contenuto Parte I Manuale dell utente 1 Introduzione alle procedure di scaling ottimale per i dati categoriali Informazioni sullo scaling ottimale 0 0 0 ccc ee eee nee teen nee Motivi di utilizzo dello scaling ottimale 0 1 cee eee eens Livello di scaling ottimale e livello di misurazione LL Selezione del livello di scaling ottimale 0000 cee ee eee Grafici di trasformazione LL Codici di categoria s ssai tomadach batoe apia gie ap kaus aa Fan draa p i aia aeda aui Procedura ottimale per l applicazione Regressione categoriale ce tenet eee en eens Analisi Componenti principali categoriale 00 0000 cece eee eee Analisi della correlazione canonica non lineare OVERALS Analisi corrispondenze LL Analisi corrispondenze multiple Scaling multidimensionale 0 000 cece teas Unfolding multidimensionale 000 cece cette eee ae Proporzioni nei grafici di scaling ottimale LL Letture consigliate mia 2s gn Rel ari E U E at EE E EAA BRE A AEL aa o 2 Regressione categoriale CATREG Definisci scala in regressione categoriale 0 0 ccc eee eee nee Regressione categoriale Discretizzazione 0 0 eee eens Regressione categoriale Valori mancanti Regressione categoriale Opzioni Regolarizzazione della
118. anze quadrate all origine divisa per il totale su tutte le celle dove i pesi sono le masse Le righe con massa ridotta influenzano l inerzia solo quando sono lontane dal centroide Le righe con massa elevata influenzano l inerzia totale anche quando sono vicine al centroide Lo stesso vale per le colonne Punteggi di riga e di colonna I punteggi di riga e di colonna sono le coordinate dei punti di riga e di colonna nel biplot Figura 12 11 Punteggi di riga normalizzazione simmetrica Punteggio nella dimensione Contributo del punto all inerzia della dimensione all inerzia del della dimensione punto Categoria Inerzia 2 Totale Dirigenti anziani Dirigenti giovani Impiegati anziani Impiegati giovani Segreteria Totale attivi 222 Capitolo 12 Figura 12 12 Punteggi di colonna normalizzazione simmetrica Punteggio nella dimensione Contributo del punto all inerzia della dimensione all inerzia del della dimensione punto Fumatore Massa Inerzia Totale No Leggero Medio Accanito Totale attivi I punteggi di colonna sono correlati ai punteggi di riga tramite 1 profili e il valore singolare dalla tabella Inerzia per dimensione In particolare i punteggi di riga sono il prodotto di matrice dei profili di riga e dei punteggi di colonna scalati in base al valore singolare per ogni dimensione Ad esempio il punteggio 0 126 per i dirigenti senior nella prima dimensione pari a
119. are Spearman come metodo di assegnazione per il punto iniziale tradizionale gt Nel gruppo Termine penalit digitare 1 0 come valore del parametro Intensit e 0 0 come valore del parametro Intervallo In tal modo il termine di penalit viene disattivato gt Fare clic su Continua gt Nella finestra di dialogo Unfolding multidimensionale fare clic su OK Segue la sintassi di comandi generata da queste selezioni PREF VA SCAL RIABLES TP BT EMM JD CT BMM HRB TMd BTJ TMn CB DP GD CC CMB INITIAL CLASSICAL SPEARMAN T P C RANSFORMATION NONE ROXIMITIES DISSIMILARITIES RITERIA DIMENSIONS 2 2 DIFFSTRESS 000001 MINSTRESS 0001 MAXITER 5000 PENALTY LAMBDA 1 0 OMEGA 0 0 P RINT MEASURES COMMON PLOT COMMON m Questa sintassi specifica un analisi sulle variabili da tp pane da tostare a cmb muffin con burro 288 Capitolo 15 m sottocomando INITIAL specifica che i valori iniziali possono essere immessi usando le distanze di Spearman m lvalori specificati nel sottocomando PENALTY disabilitano la penalit quindi la procedura minimizza lo stress I di Kruskal provocando la creazione di una soluzione degenerata m Il sottocomando PLOT richiede i grafici per lo spazio comune Tutti gli altri parametri vengono impostati sui valori predefiniti Misure Figura 15 3 Misure per la soluzione degenerata Iterazioni 154 Valore finale della funzione 00990 Parti dei valori del
120. ariabili categoriali in quanto alcuni schemi di codifica possono generare output indesiderati o analisi incomplete Gli schemi di codifica applicabili per la variabile avoro sono visualizzati nella tabella seguente Tabella 1 2 Schemi di codifica alternativi per lavoro Schema Categoria Viene B C D visualizzata la stagista 1 1 5 1 commerciale 2 2 6 5 manager 333 Alcune procedure di Categories richiedono la definizione dell intervallo di ogni variabile utilizzata Qualsiasi valore esterno all interno viene considerato come mancante Il valore di categoria minimo sempre 1 Il valore di categoria massimo specificato dall utente Questo valore non il numero delle categorie per una variabile ma il valore di categoria massimo Ad esempio nella tabella il valore di categoria massimo per lo schema A 3 e per lo schema B 7 ma entrambi gli schemi codificano le stesse tre categorie L intervallo delle variabili determina quali categorie saranno omesse dall analisi Qualsiasi categoria con codici esterni all intervallo definito sar omessa dall analisi Tuttavia questo semplice metodo per escludere le categorie pu determinare analisi indesiderate Un errore nel determinare la categoria massima pu determinare l esclusione di categorie valide dall analisi Ad esempio definire per lo schema B il valore della categoria massima uguale a 3 significa che a lavoro sono associate categor
121. asuale Fare clic su Continua V v v vy y Nella finestra di dialogo Analisi della correlazione canonica non lineare fare clic su OK 195 Analisi della correlazione canonica non lineare OVERALS Dopo un elenco delle variabili con i relativi livelli di scaling ottimale l analisi della correlazione canonica categoriale con scaling ottimale genera una tabella che mostra le frequenze degli oggetti nelle categorie Questa tabella particolarmente importante in presenza di dati mancanti in quanto ci sono maggiori probabilit che le categorie quasi vuote dominino la soluzione In questo esempio non ci sono dati mancanti Una seconda verifica preliminare consiste nell esaminare il grafico dei punteggi degli oggetti alla ricerca di valori anomali I valori anomali hanno quantificazioni diverse dagli altri oggetti tali che si trovano ai limiti del grafico dominando di conseguenza una o pi dimensioni Se vengono reperiti valori anomali possibile gestirli in due modi possibile eliminarli semplicemente dai dati ed eseguire di nuovo l analisi della correlazione canonica non lineare In alternativa possibile provare a ricodificare le risposte estreme degli oggetti anomali comprimendo unendo alcune categorie Come indicato nel grafico dei punteggi degli oggetti non ci sono valori anomali per i dati dell indagine Figura 11 12 Punteggi degli oggetti 1 O N a a v c v E a 41s 2 1 0 1 2 Dimensio
122. at Analisi delle corrispondenze Definisci interv x v Digitare 1 come valore minimo gt Digitare 23 come valore massimo gt Fare clic su Aggiorna gt Fare clic su Continua gt Selezionare marca come variabile di colonna gt Fare clic su Definisci intervallo nella finestra di dialogo Analisi delle corrispondenze 233 Figura 12 25 Finestra di dialogo Definisci intervallo di colonne Analisi delle corrispondenze Definisci interv Intervallo di categorie per la variabile di colonna marca Valore min 1 a 5 _Aggiorna__ Vincoli sulle categorie Nessuna O Le categorie sono uguali O La categoria supplementare Digitare 1 come valore minimo Digitare 6 come valore massimo Fare clic su Aggiorna Fare clic su Continua Nella finestra di dialogo Analisi della corrispondenze fare clic su Modello Analisi corrispondenze 234 Capitolo 12 Figura 12 26 Finestra di dialogo Modello ca Analisi delle corrispondenze Modello p gt Selezionare Principale come metodo di normalizzazione gt Fare clic su Continua gt Nella finestra di dialogo Analisi della corrispondenze fare clic su Grafici 235 Analisi corrispondenze Figura 12 27 Finestra di dialogo Grafici Analisi delle corrispondenze Grafici Grafici a dispersione Biplot Punti di riga Lunghezza etichette grafici a dispersione 20 Grafici lineari C Categorie di riga tra
123. azio comune impostare criteri di convergenza specificare la configurazione iniziale che dovr essere utilizzata e scegliere i grafici e l output 73 Scaling multidimensionale PROXSCAL Crea le distanze dai dati Se nella finestra di dialogo Formato dati si sceglie di creare le distanze dai dati verra visualizzata la seguente finestra principale Figura 7 5 Finestra di dialogo Crea le distanze dai dati z Scaling multidimensionale Crea le distanze dai dati Variabili I amp Nonno nonno zia zia amp Nonna nonna amp Fratello fratello E Pronipote maschio pronmas Cugino cugino Madre madre Figlia Figlia L Nipote maschio nipmas Padre padre L Nipote femmina nipfem E Sorella sorella 8 Figlio figlio Sorgenti 8L zio zio ID sorgente Crea distanze tramite Distanza euclidea gt Sesi creano distanze tra variabili vedere la finestra di dialogo Crea misure dai dati selezionare almeno tre variabili che verranno utilizzate per creare la matrice delle distanze o le matrici delle distanze se sono disponibili pi sorgenti Se si creano distanze tra casi sufficiente una sola variabile gt Se sono disponibili pi sorgenti selezionare una variabile di sorgenti gt Se necessario scegliere una misura per la creazione delle distanze E inoltre possibile definire un modello di scaling multidimensionale assegnare vincoli sullo spazio comune impostare crit
124. azione 292 Esecuzione dell analisi 293 Misure a a 4 dn ance aus averse Gn aes he ase nace eee 297 SPAZIO COMUNE picia i i e E ia 298 Spazi individualis risa na pe a i i deere 299 Uso di una configurazione iniziale diversa 302 Misure iaia ae i 304 SPAZIO COMUNE iii e a FR ni 305 Spazi Individual ic tas oe a e E doen ke 306 Esempio analisi della correttezza dei comportamenti 308 Esecuzione dell analisi 308 MISURA ata 314 Spazio COMUNE LL 315 Trasformazioni delle distanze 316 Modifica delle trasformazioni delle distanze ordinali 0 0000 316 Misure a n 318 Spazio comune Trasformazioni delle distanze Letture consigliate Appendice A File di esempio Bibliografia Indice xi 321 332 338 Parte I Manuale dell utente Capitolo Introduzione alle procedure di scaling ottimale per i dati categoriali Le procedure di Categorie utilizzano lo scaling ottimale per analizzare i dati che risulta difficile o impossibile analizzare tramite le procedure statistiche standard Il capitolo illustra le operazioni eseguite da ciascuna procedura le situazioni in cui ogni procedura pi adatta le relazioni tra le procedure e le relazioni tra queste procedure e le corrispondenti procedure statistiche standard Nota Queste procedure e la relativa implementazione in SPSS Statistics sono state sviluppate dal Data Theory Scaling System Group DTSS composto dai membri dei d
125. azioni per i gruppi pi giovani indica che la limitazione dell ordine delle quantificazioni all ordine delle categorie originali potrebbe non essere consigliabile Poich le quantificazioni per i gruppi di 26 30 36 40 e 41 45 non possono essere minori della quantificazione per il gruppo 20 25 questi valori vengono impostati come uguali al valore limite Se si consente che questi valori siano minori della quantificazione per il gruppo pi giovane ovvero se si tratta la variabile et come nominale possibile ottenere un miglioramento dell adattamento Di conseguenza sebbene l et sia considerata una variabile ordinale trattarla come tale non sembra appropriato in questo caso Inoltre trattando l et come variabile numerica e quindi mantenendo le distanze tra le categorie si determinerebbe una significativa riduzione dell adattamento Coordinate della categoria multipla vs categoria singola Per ogni variabile trattata come nominale singola ordinale o numerica sono determinate le quantificazioni le coordinate della categoria singola e le coordinate della categoria multipla Queste statistiche sono illustrate per Et in anni Figura 11 21 Coordinate per Et in anni Coordinate della Coordinate della categoria singola categoria multipla Frequenza Quantifica Dimensione Dimensione marginale zione 1 2 1 2 20 25 26 30 31 35 36 40 41 45 46 50 51 55 56 60 61 65 66 70 Mancante 3 5 0 1 1 0 0 2
126. babilit E Peso dic E Peso dic Probabili E Peso dic E Indice di E Ampiezza Peso dic y Ny Peso di campionamento cumulat Categorie EE Eastern ES Central E Western E Nort L anteprima dei grafici usa i dati di esempio Modelli Seleziona da R Preferiti Elementi di base Barra rn Lineae ID gruppi punti Ad area eT a RET a ea Titoli Mote a pi di A torta polare ica A dispersione punti agma ooo Istogramma Alto Basso Propriet elemento Grafico a scatola Assi duali CE E i t ae pt ee a A A gt Selezionare il modello Dispersione Punti e scegliere Dispersione semplice gt Selezionare Residuo standardizzato come variabile dell asse y e Design confezione come variabile dell asse x gt Fare clic su OK 101 Regressione categoriale Figura 9 8 Residui vs design confezione 1 00000 0 00000 1 00000 Standardized Residual 2 00000 1 00 1 50 2 00 2 50 3 00 Confezione La forma a U pi pronunciata nel grafico dei residui standardizzati rispetto alla confezione Ogni residuo per Design B negativo mentre tutti i residui eccetto uno sono positivi per gli altri due design Poich il modello di regressione lineare si adatta a un parametro per ogni variabile il rapporto non pu essere rilevato dall approccio standard Analisi di regressione categoriale La natura categoriale delle variabil
127. bile dipendente gt Selezionare da Design confezione a Garanzia Soddisfatti o rimborsati come variabili indipendenti gt Selezionare Preferenza e fare clic su Definisci scala Figura 9 10 Finestra di dialogo Definisci scala a Regressione categoriale definis Livello di scala ottimale Spline ordinale O Ordinale Spline nominale Nominale Spline Grado Baa Nodi interni kg gt Selezionare Numerico come livello di scaling ottimale 103 Regressione categoriale gt Fare clic su Continua gt Nella finestra di dialogo Regressione categoriale selezionare Design confezione e fare clic su Definisci scala Figura 9 11 Finestra di dialogo Definisci scala a Regressione categoriale definis Livello di scala ottimale Spline ordinale Ordinale O Spline nominae Numerica Spline Wodi interni Annulla Aiuto gt Selezionare Nominale come livello di scaling ottimale gt Fare clic su Continua gt Nella finestra di dialogo Regressione categoriale selezionare da Nome marca a Garanzia Soddisfatti o rimborsati e fare clic su Definisci scala Figura 9 12 Finestra di dialogo Definisci scala 1 Regressione categoriale definis Livello di scala ottimale Spline ordinale O Ordinale Nodi interni p gt Selezionare Numerico come livello di scaling ottimale gt Fare clic su Continua
128. bile quantificata di un insieme dove i punteggi di oggetto sono regressi sulle variabili quantificate e sulla proiezione delle variabili quantificate nello spazio Fornisce un indicazione del contributo di ciascuna variabile alla dimensione all interno di ogni insieme Adattamento singolo e multiplo Misure della bont di adattamento delle coordinate di una o pi categorie o delle quantificazioni di categoria rispetto agli oggetti Quantificazioni di categoria Punteggio ottimale assegnato alle categoria di ciascuna variabile Punteggi degli oggetti Quantificazione ottimale assegnata ad un oggetto caso in una delle dimensioni 46 Capitolo 4 Grafico E possibile creare grafici delle coordinate di categoria dei punteggi degli oggetti dei pesi di componente dei centroidi delle categorie e delle trasformazioni Salva i punteggi degli oggetti I punteggi degli oggetti possono essere salvati come nuove variabili nel file di dati attivo Verranno salvati i punteggi relativi al numero di dimensioni specificato nella finestra di dialogo principale Usa configurazione iniziale casuale Se alcune o tutte le variabili sono nominali singole consigliabile selezionare questa opzione Se l opzione non selezionata verr utilizzata una configurazione iniziale nidificata Criteri possibile specificare il numero massimo di iterazioni che l analisi della correlazione canonica non lineare pu eseguire durante i calcoli e inoltre s
129. bili tramite raggruppamento sono disponibili le seguenti opzioni m Numero di categorie Specificare un numero di categorie e se la distribuzione dei valori della variabile nelle categorie deve essere normale o uniforme m Intervalli uguali Le variabili vengono ricodificate in categorie definite in base agli intervalli di dimensioni uguali specificati E necessario specificare la lunghezza degli intervalli Regressione categoriale Valori mancanti Nella finestra di dialogo Valori mancanti possibile scegliere la strategia di gestione dei valori mancanti delle variabili dell analisi e delle variabili supplementari Figura 2 4 Finestra di dialogo Valori mancanti 1 Regressione categoriale valori mancanti Strategia per i valori mancanti Variabili di analisi pref Modalita di assegnazione confez Escludi marca Escludi prezzo Escludi garanzia Escludi soddrimb Escludi Strategia Escludi gli oggetti con valori mancanti per la variabile Assegna i valori mancanti Modalit Categoria supplementare Annulla Aiuto Strategia Specificare se si desidera escludere i valori mancanti eliminazione listwise o aggiungere gli oggetti con valori mancanti trattamento attivo m Escludi gli oggetti con valori mancanti per la variabile Gli oggetti con valori mancanti della variabile selezionata sono esclusi dall analisi Questa strategia non disponibile per le variabili supplementari Ass
130. ca 7 Introduzione alle procedure di scaling ottimale per i dati categoriali m Utilizzare l analisi delle corrispondenze multiple per analizzare una matrice di dati multivariati categoriali quando non si desiderano avanzare ipotesi pi forti sul fatto che tutte le variabili siano analizzate a livello nominale m Utilizzare lo scaling multidimensionale per analizzare i dati di distanza per individuare una rappresentazione dei minimi quadrati di un insieme di oggetti in uno spazio dimensionale ridotto m Utilizzare l unfolding multidimensionale per analizzare i dati di distanza per individuare una rappresentazione dei minimi quadrati di due insiemi di oggetti in uno spazio dimensionale ridotto Regressione categoriale La regressione categoriale la pi adatta quando l obiettivo dell analisi prevedere una variabile di risposta dipendente da un insieme di variabili predittore indipendenti Come in tutte le procedure di scaling ottimale i valori di scala vengono assegnati a ciascuna categoria di ogni variabile in modo che i valori siano ottimali rispetto alla regressione La soluzione di una regressione categoriale massimizza la correlazione quadratica tra la risposta trasformata e la combinazione ponderata dei predittori trasformati Relazione con altre procedure di Categories La regressione categoriale con scaling ottimale paragonabile all analisi della correlazione canonica con scaling ottimale con due insiemi d
131. ca Limitata elevata formalit Formalit della relazione Nessuna relazione formale informale cluster Folla spettatori uditorio pubblico calca gruppi primari gruppi secondari comunit moderna Esecuzione dell analisi gt Per generare il risultato dei componenti principali categoriale per questo insieme di dati dai menu scegliere Analizza Riduzioni dimensione Scaling ottimale Figura 10 1 Finestra di dialogo Scaling ottimale Livello di scala ottimale O Tutte le variabili sono di tipo nominale multiplo Numero di insiemi di variabili Un insieme O Pi insiemi Analisi selezionata Componenti principali categoriale gt Selezionare Una o pi variabili non nominali multiple nel gruppo Livello di scaling ottimale gt Fare clic su Definisci 140 Capitolo 10 Figura 10 2 Finestra di dialogo Componenti principali categoriale Componenti principali categoriale amp Gruppo gruppo L_ok__ _sncole Remposta _ _Annule J Auto MIE 2 ae ae gt Selezionare da Intensit dell interazione a Formalita della relazione come variabili di analisi gt Fare clic su Definisci scala e peso Figura 10 3 Finestra di dialogo Definisci scala e peso za Componenti principali categorial x Grado Nodi interni po gt Selezionare Ordinale nel gruppo Livello di scaling ottimale gt Fare clic su Continua gt Selezionare cluster come variabile di etichett
132. casi di ciascuna variabile deve essere in ogni caso uguale al numero degli oggetti Scaling multidimensionale Opzioni Nella finestra di dialogo Opzioni possibile selezionare lo stile di configurazione iniziale specificare i criteri di iterazione e di convergenza e selezionare gli aggiornamenti standard o rilassati Figura 7 9 Finestra di dialogo Opzioni Scaling multidimensionale Opzioni Configurazione iniziale Criteri di iterazione Semplice Convergenza stress O Torgerson Stress minimo Inizio casuale singolo Max iterazioni O Inizi casuali multipli Aggiornamenti rilassati Personalizzato Configurazione personalizzata Leggi variabili da kinship_ini sav Il numero deve corrispondere alla dimensionalit di modello massima attualmente 3 Disponibili Selezionate dimO1 dim02 dim03 Annulla Aiuto 78 Capitolo 7 Configurazione iniziale Selezionare una delle alternative seguenti m Semplice Glioggetti sono posizionati alla stessa distanza l uno dall altro nella dimensione massima Per ottenere una configurazione iniziale con il numero massimo di dimensioni specificato nella finestra di dialogo Modello viene eseguita un iterazione per migliorare questa configurazione di livello dimensionale elevato seguita da una riduzione dimensionale m Torgerson Come configurazione iniziale viene utilizzata una soluzione di scaling standard Inizio casu
133. caso rappresenta la quota di mercato raggiunta in un determinato mese stroke_clean sav File di dati ipotetici che riporta lo stato di un database medico dopo averne eseguito la pulizia utilizzando le procedure del modulo Data Preparation stroke_invalid sav File di dati ipotetici che riporta lo stato iniziale di un database medico e contiene numerosi errori di immissione dati stroke_survival Questo file di dati ipotetici riguarda i tempi di sopravvivenza per i pazienti che dopo avere completato un programma riabilitativo in seguito a un ictus postischemico affrontano alcune sfide Dopo l attacco viene annotata l occorrenza dell infarto miocardiaco 330 Appendice A dell ictus ischemico o emorragico e viene registrata l ora dell evento Questo campione viene troncato a sinistra perch include solo i pazienti che sono sopravvissuti fino alla fine del programma riabilitativo post ictus stroke_valid sav File di dati ipotetici che riporta lo stato di un database medico dopo il controllo dei valori eseguito con la procedura Convalida i dati Il database contiene comunque casi potenzialmente anomali survey_sample sav File di dati ipotetico che contiene i dati dell indagine compresi i dati demografici e varie misure dell atteggiamento tastetest sav File di dati ipotetici che prende in esame l effetto del Mulch Color sul sapore delle coltivazioni Le fragole a cui stato applicato il Mulch Color rosso blu e ne
134. categorie Sottraendo ogni voce di tabella dalla voce di tabella maggiore le dissimilarit vengono convertite in similarit gt Per creare le similarit e memorizzarle in una nuova variabile sim dai menu scegliere Trasforma Calcola variabile 243 Analisi corrispondenze Figura 12 38 Finestra di dialogo Calcola variabile as Calcola variabile Tutto Aritmetiche CDF e CDF noncentrale Conversione gt Digitare sim come variabile di destinazione gt Digitare 2734 dist come espressione numerica gt Fare clic su OK 244 Capitolo 12 Figura 12 39 Finestra di dialogo Pesa casi eat Pesa casi P riga O Non pesare i casi colonna Pesa i casi per E distanza Variabile di frequenza Stato attuale pesa i casi perdistanza E e Caos Cone an Ora ripetere la ponderazione dei casi in base alla misura di similarit richiamando la finestra di dialogo Pesa casi gt Pesa i casi per sim gt Fare clic su OK gt Infine per ottenere un analisi delle corrispondenze per le similarit dai menu scegliere Analizza Riduzione dimensionale Analisi corrispondenze Figura 12 40 Finestra di dialogo Analisi della corrispondenze ta Analisi corrispondenze ere Modello colonna riga Virna sim Da C3 Definisci intervallo cole gt Selezionare riga come variabile di riga gt Fare clic su Def
135. catori hanno a che fare quasi esclusivamente con dati categoriali Sebbene gli adattamenti della maggior parte dei modelli standard siano finalizzati specificatamente all analisi dei dati categoriali spesso non funzionano altrettanto bene per insiemi di dati che includono Un numero troppo limitato di osservazioni Un numero troppo limitato di variabili Un numero troppo limitato di valori per variabile 2 Capitolo 1 Tramite la quantificazione delle categorie le tecniche di scaling ottimale evitano i problemi relativi a queste situazioni Inoltre sono particolarmente utili quando necessario utilizzare tecniche speciali Anzich sulle stime dei parametri l interpretazione dell output dello scaling ottimale si basa spesso su rappresentazioni grafiche Le tecniche di scaling ottimale offrono eccellenti funzioni di analisi esplorativa che integrano bene altri modelli SPSS Statistics Limitando l obiettivo principale dell analisi la visualizzazione dei dati tramite scaling ottimale pu costituire la base di un analisi basata sull interpretazione dei parametri del modello Livello di scaling ottimale e livello di misurazione Questo concetto pu generare molta confusione al primo utilizzo delle procedure del modulo Categories Il livello specificato non il livello di misurazione delle variabili ma quello di scala Il concetto che le variabili da quantificare possono includere relazioni non lineari indipendent
136. ccolte utilizzando un disegno di campionamento complesso Ogni caso rappresenta una diversa unit di abitazione Sono registrate diverse informazioni demografiche e sul campionamento dietstudy sav File di dati ipotetici che contiene il risultato di uno studio ipotetico sulla dieta chiamato Stillman diet Rickman Mitchell Dingman e Dalen 1974 Ogni caso rappresenta un diverso soggetto e ne riporta il peso prima e dopo la dieta in libbre e 1 livelli dei trigliceridi in mg 100 ml dischargedata sav Questo file prende in esame l uso dei modelli stagionali dell ospedale Winnipeg Menec Roos Nowicki MacWilliam Finlayson e Black 1999 dal Manitoba Centre for Health Policy dvdplayer sav File di dati ipotetici che prende in esame lo sviluppo di un nuovo lettore DVD Utilizzando un prototipo il personale addetto al marketing ha raccolto dati sui gruppi di interesse Ogni caso rappresenta un diverso utente che stato sottoposto all indagine e include informazioni demografiche personali dell utente e sulle risposte che ha fornito riguardo al prototipo flying sav Questo file contiene informazioni sulla distanza in aereo espressa in chilometri tra 10 citt americane german_credit sav Questo file di dati contiene informazioni ricavate dall insieme di dati German Credit del Repository of Machine Learning Databases Blake e Merz 1998 presso la University of California Irvine grocery_1month sav Questo file d
137. ci sorgente Tutte le sorgenti O Seleziona sorgenti Grafici righe Tutte le righe Continua Annulla Grafici Sono disponibili i seguenti grafici Inizi multipli Consente di visualizzare un istogramma sovrapposto di stress penalizzato riportando sia lo stress che la penalit m Spazio comune iniziale Consente di visualizzare una matrice di grafici a dispersione delle coordinate dello spazio comune iniziale m Stress per dimensione Produce un grafico lineare di stress penalizzato rispetto alle dimensioni Il grafico viene creato solo se il numero massimo delle dimensioni maggiore del numero minimo delle dimensioni 90 Capitolo 8 m Spazio comune finale Viene visualizzata una matrice di grafici a dispersione delle coordinate dello spazio comune m Pesi dello spazio Viene creato un grafico a dispersione dei pesi dello spazio individuale Ci avviene solo se nella finestra di dialogo Modello specificato uno dei modelli delle differenze individuali Per il modello Euclideo pesato nei grafici vengono rappresentati i pesi relativi a tutte le sorgenti con una dimensione su ciascun asse Per il modello Euclideo generalizzato viene creato un grafico per dimensione in cui sono indicate sia la rotazione che il peso di tale dimensione per ogni sorgente m Spazi individuali Viene visualizzata una matrice di grafici a dispersione delle coordinate dello spazio individuale di o
138. citta N v 054 E o 5 n Grande citt c o o 00 a o Grande citt 057 o Campagna Campag 1 0 1 0 0 5 0 0 0 5 1 0 1 5 Dimensione 1 Per comprendere le relazioni tra le variabili individuare le categorie specifiche valori per i cluster di categorie nei grafici dei centroidi Le relazioni tra Et in anni Giornale letto pi spesso e Preferenze vicinato possono essere descritte esaminando la parte superiore destra e inferiore sinistra dei grafici Nella parte superiore destra si trovano i rispondenti pi anziani che leggono il Corriere della Sera e preferiscono vivere in un paese Nell angolo inferiore sinistro di ciascun grafico possibile vedere che i rispondenti di mezza et e pi giovani leggono La Repubblica o La Stampa e preferiscono vivere in campagna o in una citt Tuttavia la separazione tra i gruppi pi giovani alquanto complessa Gli stessi tipi di interpretazione possono essere effettuati in relazione all altra direzione Stato civile Musica preferita e Animali domestici concentrandosi sulla parte superiore sinistra e inferiore destra dei grafici dei centroidi Nell angolo superiore sinistro possibile notare che i single tendono ad avere un cane e a preferire la musica new wave Le persone sposate e con stato civile diverso hanno un gatto il primo gruppo preferisce la musica classica e il secondo non ama la musica Un analisi alternativa I risultati dell analisi suggeriscono che il
139. condari volontari e la comunit moderna 326 Appendice A unione non stretta derivante da una vicinanza fisica elevata e dall esigenza di servizi specializzati healthplans sav File di dati ipotetici che prende in esame l impegno di un gruppo di assicurazioni nel tentativo di valutare quattro diversi piani di assistenza sanitaria per piccoli datori di lavoro Sono stati convocati dodici datori di lavoro per classificare i piani in base a quanto sono disposti ad offrirli ai loro dipendenti Ogni caso corrisponde a un diverso datore di lavoro e contiene informazioni sulla reazione a ciascun piano health_funding sav File di dati ipotetici che contiene i dati sui fondi di assistenza sanitaria importo per 100 persone sui tassi di malattie tasso per 10 000 persone e sulle visite ai fornitori di assistenza sanitaria tasso per 10 000 persone Ogni caso rappresenta una diversa citt hivassay sav File di dati ipotetici che prende in esame l impegno di un industria farmaceutica nel tentativo di sviluppare un analisi che riesca a rilevare in tempi brevi l infezione da virus HIV I risultati dell analisi sono otto sfumature di colore rosso sempre pi intenso le sfumature pi intense indicano la maggiore probabilit di infezione Un esperimento di laboratorio stato condotto su 2000 campioni di sangue La met di questi risultata infetta al virus HIV l altra met non risultata infetta hourlywagedata sav F
140. correlazioni tra gli insiemi di variabili possibile confrontare gli insiemi con un insieme intermedio non conosciuto definito dai punteggi degli oggetti Esempio L analisi della correlazione canonica categoriale con scaling ottimale consente di visualizzare graficamente la relazione esistente tra un insieme di variabili che include la categoria lavorativa e il livello di istruzione e un altro insieme di variabili che include l area di residenza e il genere Ci si pu rendere conto che il livello di istruzione e l area di residenza comportano una discriminazione maggiore rispetto alle altre variabili oppure che il livello di istruzione comporta una maggiore discriminazione nella prima dimensione Statistiche e grafici Frequenze centroidi cronologia delle iterazioni punteggi degli oggetti quantificazioni di categoria pesi pesi di componente adattamento singolo e multiplo grafici dei punteggi degli oggetti grafici delle coordinate di categoria grafici dei pesi di componente grafici dei centroidi di categoria grafici di trasformazione Dati Utilizzare valori interi per la codifica delle variabili categoriali livello di scaling nominale o ordinale Per ridurre al minimo l output utilizzare interi consecutivi che iniziano con 1 per la codifica di ciascuna variabile Le variabili scalate a livello numerico non devono essere ricodificate in interi consecutivi Per ridurre al minimo l output per ogni variabile scalata a livello
141. d anomalie nelle abitudini alimentari a una percezione gravemente distorta del proprio corpo e a un ossessione per il peso che influenza contemporaneamente mente e corpo Milioni di persone ne vengono colpite ogni anno particolarmente a rischio sono gli adolescenti Esistono delle cure la maggioranza delle quali particolarmente utili quando il problema viene identificato nelle prime fasi Un sanitario pu tentare di diagnosticare un disturbo dell alimentazione tramite valutazione medica e psicologica Tuttavia pu essere difficile assegnare un paziente a una delle diverse classi di disturbi dell alimentazione in quanto non esiste una sintomatologia standardizzata del comportamento anoressico bulimico Esistono sintomi che differenziano chiaramente i pazienti dei quattro gruppi Quali sintomi hanno in comune Per tentare di rispondere a queste domande i ricercatori Van der Ham Meulman Van Strien e Van Engeland 1997 hanno condotto uno studio su 55 adolescenti con disturbi alimentari noti come illustrato nella tabella seguente Tabella 10 2 Diagnosi dei pazienti Diagnosi Numero di pazienti Anoressia nervosa 25 Anoressia con bulimia nervosa 9 Bulimia nervosa post anoressia 14 Disturbo dell alimentazione atipico 7 Totale 55 Ogni paziente stato visitato quattro volte in quattro anni per un totale di 220 visite Durante ciascuna visita ai pazienti stato assegnato un punteggio per ognuno dei 16 sintomi indicati nella t
142. d canonical correlations and their applications to experimental data Journal of Clinical Psychology 17 331 347 Horst P 1961 Relations among m sets of measures Psychometrika 26 129 149 Kettenring J 1971 Canonical analysis of several sets of variables Biometrika 58 433 460 Van der Burg E 1988 Nonlinear canonical correlation and some related techniques Leiden DSWO Press Van der Burg E e J De Leeuw 1983 Nonlinear canonical correlation British Journal of Mathematical and Statistical Psychology 36 54 80 Van der Burg E J De Leeuw e R Verdegaal 1988 Homogeneity analysis with k sets of variables An alternating least squares method with optimal scaling features Psychometrika 53 177 197 Verboon P e I A Van der Lans 1994 Robust canonical discriminant analysis Psychometrika 59 485 507 Capitolo Analisi corrispondenze Una tabella di corrispondenza una tabella a due vie le cui celle contengono alcune misure della corrispondenza tra righe e colonne La misura della corrispondenza pu essere un qualsiasi indicatore di similarit affinit confusione associazione o interazione tra le variabili di riga e di colonna Un tipo molto comune di tabella di corrispondenza la tavola di contingenza in cui le celle contengono conteggi di frequenza Queste tavole possono essere ottenute facilmente grazie alla procedura Tavole di contingenza Tuttavia una tavola di contingenza non genera sempre
143. d delle variabili Ogni coefficiente indica il numero delle deviazioni standard di modifica della risposta prevista per una modifica della deviazione a uno standard in un predittore restando costanti tutti gli altri Ad esempio una modifica della deviazione standard in Nome marca genera un aumento nella preferenza prevista pari a 0 056 deviazioni standard La deviazione standard di 99 Regressione categoriale Preferenza 6 44 quindi Preferenza aumentata di 0 056 x 6 44 0 361 Le modifiche di Design confezionegenerano le maggiori variazioni nella preferenza prevista Grafici a dispersione dei residui Figura 9 6 Residui e valori attesi Variabile dipendente Preferenza i N Regressione Residuo standardizzato 2 1 0 1 N Regressione Valore previsto standardizzato I residui standardizzati sono tracciati rispetto ai valori attesi standardizzati Se l adattamento del modello buono non dovrebbero essere presenti modelli visibile una forma a U in cui i valori attesi standardizzati inferiore e superiore hanno entrambi residui positivi I valori attesi standardizzati vicini allo 0 tendono ad avere residui negativi gt Per generare un grafico a dispersione dei residui dal predittore Design confezione dai menu scegliere Grafici Generatore di grafici 100 Capitolo 9 Figura 9 7 Generatore di grafici E Generatore di grafici Variabili County c E Years sin P value atl E Pro
144. delle categorie Gli effetti dell imposizione di vincoli alla relazione tra le categorie e le relative quantificazioni si evidenziano confrontando le coordinate della categoria singola con quelle della categoria multipla Nella prima dimensione le coordinate della categoria multipla per Et in anni si riducono fino alla categoria 2 e rimangono relativamente allo stesso livello fino alla categoria 9 in corrispondenza della quale si verifica un significativo aumento Un modello simile viene evidenziato per la seconda dimensione Queste relazioni vengono rimosse nelle coordinate della categoria singola cui applicato il vincolo ordinale In entrambe le dimensioni le coordinate sono ora non decrescenti La diversa struttura dei due insiemi di coordinate suggerisce che un trattamento nominale potrebbe essere pi appropriato Centroidi e centroidi proiettati Il grafico dei centroidi etichettati in base alle variabili dovrebbe essere interpretato in modo analogo al grafico delle quantificazioni di categoria nell analisi dell omogeneit o alle coordinate della categoria multipla nell analisi componenti principali non lineare Di per se stesso tale grafico mostra il grado di separazione tra i gruppi di oggetti a opera delle variabili i centroidi si trovano nel centro di gravit degli oggetti Si noti che le categorie per Et in anni non sono separate molto nettamente Le categorie relative a fasce di et pi giovane sono raggruppate a sin
145. der genderinominale gener gener ordinale degree degree ordinale Trasformazioni di variabili indipendenti Ordinale pari merito mante Continua Annulla Aiuto gt Selezionare gener e degree gt Selezionare Ordinale mantieni pari merito dall elenco a discesa Trasformazioni di variabili indipendenti gt Fare clic su Cambia gt Fare clic su Continua gt Nella finestra di dialogo Scaling multidimensionale fare clic su OK Grafici di trasformazione I grafici di trasformazione sono utili per una prima verifica circa l adeguatezza delle trasformazioni originali Se i grafici sono approssimativamente lineari l ipotesi lineare adeguata In caso contrario necessario verificare le misure di stress per vedere se presente un miglioramento nell adattamento e controllare il grafico dello spazio comune per verificare se l interpretazione risulta pi utile Le variabili indipendenti ottengono ciascuna trasformazioni approssimativamente lineari perci potrebbe essere indicato interpretarle come numeriche Tuttavia le distanze non ottengono una trasformazione lineare quindi possibile che per esse la trasformazione ordinale sia pi adatta 282 Capitolo 14 Figura 14 18 Distanze trasformate Sorgente SRC_1 SRC_2 SRC_3 SRC_4 SRC_S SRC_6 Dissimilarita trasformate 20 40 60 80 Dissimilarita Misure di stres
146. di attesa dei clienti per un servizio in tre diverse filiali di una banca locale Ogni caso corrisponde a un cliente separato e riporta il tempo di attesa e la filiale in cui era presente webusability sav File di dati ipotetici che prende in esame il test di usabilit di un nuovo e store Ogni caso corrisponde a una delle cinque persone che hanno eseguito il test di usabilit e indica se la persona ha superato ciascuna delle sei diverse attivit previste dal test wheeze_steubenville sav Questo file un sottoinsieme di uno studio longitudinale degli effetti che l inquinamento provoca sulla salute dei bambini Ware Dockery Spiro III Speizer e Ferris Jr 1984 I dati contengono misure binarie ripetute del livello di asma dei bambini della citt di Steubenville Ohio di 7 8 9 e 10 anni I dati indicano anche se la mamma dei bambini era fumatrice durante il primo anno dello studio workprog sav File di dati ipotetici che prende in esame un programma di lavoro governativo il cui obiettivo fornire attivit pi adatte alle persone diversamente abili stato seguito un campione di potenziali partecipanti al programma alcuni dei quali sono stati selezionai in modo casuale e altri no Ogni caso rappresenta un diverso partecipante al programma Bibliografia Barlow R E D J Bartholomew D J Bremner e H D Brunk 1972 Statistical inference under order restrictions New York John Wiley and Sons Bell E H 1961 Soci
147. di proiettati e reali I centroidi proiettati sono compresi in uno dei quattro quadranti formati prolungando le due linee di riferimento perpendicolari fino all origine L interpretazione della direzione delle variabili nominali singole ordinali o numeriche viene ottenuta dalla posizione dei centroidi proiettati Ad esempio la variabile Giornale letto pi spesso specificata come nominale singola I centroidi proiettati mostrano che La Repubblica e La Stampa sono in contrasto con Corriere della Sera Figura 11 24 Centroidi e centroidi proiettati per Et in anni 10 Centroidi v O Effettivo 66 70 Proiettato la O 20 420 25 61 65 N q 46 36 61 65 c 1 55 2 56 60 c w E a 56 60 41 45 1 0 0 5 0 0 0 5 1 0 1 5 2 0 Dimensione 1 Il problema con Et in anni evidente dai centroidi proiettati Il trattamento di Et in anni come ordinale implica che l ordine dei gruppi di et debba essere preservato Per soddisfare questo vincolo tutti i gruppi di et inferiori a 45 anni sono proiettati sullo stesso punto Lungo la direzione definita da Et in anni Giornale letto pi spesso e Preferenze vicinato non esiste separazione dei gruppi di et pi giovane Questo risultato suggerisce che la variabile debba essere trattata come nominale 206 Capitolo 11 Figura 11 25 Centroidi e centroidi proiettati per Preferenze vicinato 15 Centroidi O Effettivo O Proiettato Piccola citt 10 4 Piccola
148. di scaling per ciascuna variabile Le combinazioni di questi livelli possono tenere conto di un ampia gamma di relazioni non lineari per le quali un singolo metodo standard sia inadatto Di conseguenza lo scaling ottimale offre maggiore flessibilit rispetto agli approcci standard e una complessit aggiuntiva minima Inoltre le trasformazioni non lineari dei predittori in genere riducono le dipendenze tra i predittori Se si confrontano gli autovalori della matrice di correlazione per i predittori con gli autovalori della matrice di correlazione per i predittori con scaling ottimale quest ultimo insieme sar generalmente meno variabile del primo In altre parole nella regressione categoria lo scaling 8 Capitolo 1 ottimale riduce gli autovalori maggiori della matrice di correlazione dei predittori e aumenta gli autovalori minori Analisi Componenti principali categoriale L analisi delle componenti principali categoriale la pi adatta per tenere conto dei modelli di variazione in un singolo insieme di variabili con livelli di scaling ottimale misti Questa tecnica tenta di ridurre la dimensione di un insieme di variabili tenendo conto al contempo della maggiore variazione possibile I valori di scala vengono assegnati a ciascuna categoria di ogni variabile in modo che i valori siano ottimali rispetto alla soluzione delle componenti principali Gli oggetti nell analisi ricevono i punteggi delle componenti in base ai dat
149. di trasformazione Grafici di categoria congiunti puntan ottonen oggetton lunghzn puntal ottonel Includi grafici residu testal tagliol Misure di discriminazione lunghal filettol homi_1 Usa tutte le variabili hom2_1 puncqi puncq2 ottcgi gt ottcq2 tescql Annulla Aiuto Visualizza grafico O Usa le variabili selezionate Grafici di categoria Per ciascuna variabile selezionata viene creato un grafico delle coordinate del centroide Le categorie saranno nei centroidi degli oggetti delle categorie specifiche Grafici di categoria congiunti Si tratta di un singolo grafico delle coordinate del centroide di ciascuna variabile selezionata Grafici di trasformazione Visualizza un grafico delle quantificazioni di categoria ottimali rispetto agli indicatori di categoria possibile specificare il numero di dimensioni desiderato Verr generato un grafico per ciascuna dimensione inoltre possibile visualizzare i grafici dei residui per ciascuna variabile selezionata Misure di discriminazione Crea un singolo grafico delle misure di discriminazione per le variabili selezionate Opzioni aggiuntive del comando MULTIPLE CORRESPONDENCE Per personalizzare l analisi delle corrispondenze multiple possibile incollare le impostazioni selezionate in una finestra di sintassi e quindi modificare la sintassi del comando MULTIPLE CORRESPONDENCE cos ottenuta Il linguaggio della sintas
150. di trasformazione lineare viene generato quando una variabile viene considerata come numerica Le variabili considerate come ordinali determinano la generazione di un grafico di trasformazione non decrescente I grafici di trasformazione per le variabili considerate come nominali con forma a U o l inverso visualizzano una relazione quadratica Le variabili nominali possono inoltre generare grafici di trasformazione senza trend apparenti modificando completamente l ordine delle categorie La figura seguente mostra un grafico di trasformazione di esempio I grafici di trasformazione sono particolarmente adatti per determinare l adeguatezza del livello di scaling ottimale selezionato Se pi categorie ricevono quantificazioni analoghe la loro compressione in una categoria unica potrebbe essere giustificata In alternativa se una variabile considerata come nominale riceve quantificazioni che visualizzano un trend crescente una trasformazione ordinale pu generare un adattamento analogo Se il trend lineare pu essere appropriato considerare la variabile come numerica Tuttavia se la compressione delle categorie o la modifica dei livelli di scaling giustificata l analisi non si modificher in modo significativo 4 Capitolo 1 Figura 1 1 Grafico di trasformazione del prezzo numerico 0 5 00 Quantificazioni 0 5 119 1 39 1 59 Categorie Codici di categoria Prestare attenzione nella codifica delle v
151. dice A a pag 321 Usare l Unfolding multidimensionale per trovare i raggruppamenti di situazioni simili e i comportamenti pi direttamente associati agli stessi La sintassi utilizzabile per riprodurre queste analisi contenuta in prefscal_behavior sps Esecuzione dell analisi gt Per eseguire un analisi di unfolding multidimensionale dai menu scegliere Analizza Scala Unfolding multidimensionale PREFSCAL 309 Figura 15 24 Finestra di dialogo principale Unfolding multidimensionale z Unfolding multidimensionale OD gt Selezionare le variabili di distanza da Run a Shout gt Selezionare ROWID come variabile di riga gt Fare clic su Modello Unfolding multidimensionale 310 Capitolo 15 Figura 15 25 Finestra di dialogo Modello Unfolding multidimensionale modello Grado Hodi interni O Liy Q gt Selezionare Lineare come trasformazione della distanza e scegliere Includi intercetta gt Scegliere di applicare le trasformazioni Fra tutte le sorgenti simultaneamente gt Fare clic su Continua gt Nella finestra di dialogo Unfolding multidimensionale fare clic su Opzioni 311 Unfolding multidimensionale Figura 15 26 Finestra di dialogo Opzioni 3 Unfolding multidimensionale opzioni Selezionare Personalizzata nel gruppo Configurazione iniziale Scegliere behavior_ini sav come file contenente la configurazione personalizzata iniziale Per ulteriori info
152. e Annulla Aiuto I coefficienti e i modelli regolarizzati vengono salvati ogni volta che viene selezionato un metodo di regolarizzazione nella finestra di dialogo Regolarizzazione Per impostazione predefinita questa procedura crea un nuovo insieme di dati con un nome univoco comunque possibile specificare un nome di propria scelta o salvare in un file esterno I segni dei coefficienti di regressione vengono salvati ogni volta che vengono utilizzati gli inizi sistematici multipli come configurazione iniziale nella finestra di dialogoOpzioni Per impostazione predefinita questa procedura crea un nuovo insieme di dati con un nome univoco comunque possibile specificare un nome di propria scelta o salvare in un file esterno 26 Capitolo 2 Regressione categoriale Grafici Nella finestra di dialogo Grafici possibile specificare le variabili in base alle quali verranno creati i grafici di trasformazione e dei residui Figura 2 9 Finestra di dialogo Grafici x Regressione categoriale grafici Grafici di trasformazione pref pref confez confez marca prezzo garanzia soddrimb Grafici dei residui Annulla Aiuto Grafici di trasformazione Per ciascuna variabile le quantificazioni di categoria vengono inserite nel grafico mediante il confronto con i valori di categoria originali Le categorie vuote vengono visualizzate sull asse orizzontale ma non influiscono sui calcoli Queste ca
153. e categorie della variabile e di conseguenza indicano un grado elevato di discriminazione tra le categorie di una variabile in quella dimensione 256 Capitolo 13 La media delle misure di discriminazione per qualsiasi dimensione pari alla percentuale della varianza spiegata per quella dimensione Di conseguenza le dimensioni vengono ordinate in base alla discriminazione media La prima dimensione ha la discriminazione media pi ampia la seconda dimensione il valore di discriminazione successivo e cos via per tutte le dimensioni della soluzione Figura 13 7 Grafico delle misure di discriminazione 10 Lunghezza 08 N Fessufa w 06 a c o v c rT E 04 a 0 2 one Punta Filettatura 0 0 00 0 2 04 0 6 08 1 0 Dimensione 1 Come evidenziato nel grafico dei punteggi degli oggetti il grafico delle misure di discriminazione mostra che la prima dimensione relativa alle variabili Filettatura e Forma parte inferiore Queste variabili hanno elevate misure di discriminazione nella prima dimensione e misure di discriminazione ridotte nella seconda Di conseguenza per entrambe queste variabili le categorie vengono distribuite in posizioni distanti solo lungo la prima dimensione Lunghezza in mezzi pollici ha un valore elevato nella seconda dimensione ma un valore ridotto nella prima Di conseguenza lunghezza pi vicina alla seconda dimensione il che corrisponde all osservazione fatta sul grafico dei punteggi degli o
154. e in quanto i relativi vettori sono vicini al cluster principale e queste variabili sono considerate sintomi di anoressia digiuno peso ciclo mestruale o sono di natura psicosociale emancipazione risultati lavorativi scolastici atteggiamento sessuale rapporti famigliari I vettori di questo insieme sono ortogonali perpendicolari ai vettori di eccessi vomito e lassativi il che significa che questo gruppo di variabili privo di correlazione con l insieme delle variabili indicative di bulimia Le variabili Amici Stato mentale umore e Iperattivit non sembrano adattarsi particolarmente bene alla soluzione possibile vederlo nel grafico osservando la lunghezza di ciascun vettore La lunghezza del vettore di una data variabile corrisponde al suo adattamento e i vettori di queste variabili sono i pi corti In una soluzione a due componenti queste variabili verrebbero probabilmente eliminate da una proposta di sintomatologia relativa ai disturbi alimentari Esse potrebbero tuttavia adattarsi meglio a una soluzione con un maggiore numero di dimensioni Le variabili Comportamento sessuale Preoccupazione legata a cibo e peso e Percezione del proprio corpo formano un altro gruppo teorico di simboli relativo alla percezione del proprio corpo da parte del paziente Sebbene correlate con i due insiemi ortogonali di variabili queste variabili hanno vettori piuttosto lunghi e sono strettamente associate alla prima dimensione di conseguenza po
155. e rimanente Le analisi delle corrispondenze di queste tre tabelle non genereranno risultati identici tuttavia ciascuna costituisce un approccio valido Inoltre in presenza di quattro o pi variabili possibile creare tabelle a due vie per mettere a confronto due variabili di interazione Il numero delle tabelle che possibile analizzare pu diventare ampio anche in presenza di un numero limitato di variabili possibile selezionare una di queste tabelle da analizzare oppure analizzare tutte In alternativa la procedura Analisi delle corrispondenze multiple pu essere utilizzata per esaminare tutte le variabili contemporaneamente senza necessit di creare variabili di interazione Relazione con le tecniche standard La procedura Tavole di contingenza pu essere utilizzata anche per analizzare tavole di contingenza con l indipendenza come elemento chiave comune delle analisi Tuttavia anche in tavole di piccole dimensioni pu essere difficile rilevare la causa degli scostamenti dall indipendenza L utilit dell analisi delle corrispondenze risiede nella visualizzazione di questi modelli per tabelle a due vie di qualsiasi dimensione Se esiste un associazione tra le variabili di riga e di colonna ovvero se il valore chi quadrato significativo l analisi delle corrispondenze pu essere utile per rivelare la natura della relazione 11 Introduzione alle procedure di scaling ottimale per i dati categoriali Analisi c
156. e anomalo rimosso 2 No_Ott No_Ott No_Ott No_Ott 140 0 No ott No_Ott N o No_Ott No_Ott 2 r No_ott No_Ott Ons ec E No_Ott Noe Neos E A No_Ott a oN PS No_Ott 1 Si_Ott Si_Ott Si_Ott e 15 10 05 00 0 5 1 0 15 Dimensione 1 Il grafico dei punteggi degli oggetti etichettato in base alla variabile Ottone mostra che i quattro oggetti in ottone sono tutti visualizzati in prossimit della parte inferiore del grafico tre oggetti occupano posizioni identiche a indicare un elevata discriminazione nella seconda dimensione Come nel caso di Fi ettatura nell analisi precedente gli oggetti non formano gruppi compatti ma la differenziazione degli oggetti per categorie perfetta 264 Capitolo 13 Figura 13 18 Punteggi degli oggetti etichettati in base a Rientro della testa con valore anomalo rimosso el 7 NESSUNO o NESSUNO NESSUNO TAGLIO 140 0 TAGLIO TAGLIO o N 2 TAGLIO NESSUNO 2 0 TAGLIO TAGLIO o c E LU NESSUNO NESSUNO E TAGLIO a A A NESSUNO 1 TAGLIO NESSUNO NESSUNO o o 15 10 05 00 0 5 1 0 1 5 Dimensione 1 Il grafico dei punteggi degli oggetti etichettato in base alla variabile Rientro della testa mostra che la prima dimensione comporta la discriminazione perfetta tra gli oggetti senza rientro e gli oggetti con rientro come nell analisi precedente In contrasto con l analisi precedente tuttavia nella seconda dimensione non ora possibile distinguere tra le due categ
157. e attraenti attraente marca a elevato valore nutriente gusto forte forte nutritivo marca per donne donne marca diffusa diffusa marca minore minore Inizialmente l attenzione sar dedicata alla relazione tra gli attributi e le marche L utilizzo della normalizzazione principale distribuisce l inerzia totale una volta tra le righe e una volta tra le colonne Sebbene questo impedisca l interpretazione biplot possibile esaminare le distanze tra le categorie per ogni variabile Esecuzione dell analisi gt L impostazione dei dati richiede che i casi siano pesati tramite la variabile freq Per farlo dai menu scegliere Dati Pesa casi Figura 12 22 Finestra di dialogo Pesa casi eat Pesa casi amp impress g marca O Non pesare i casi Pesa i casi per Variabile di frequenza Stato attuale pesa i casi perfreq gt Pesa i casi per freq gt Fare clic su OK gt Per ottenere una soluzione iniziale in cinque dimensioni con normalizzazione principale dai menu scegliere Analizza Riduzione dimensionale Analisi corrispondenze 232 Capitolo 12 Figura 12 23 Finestra di dialogo Analisi della corrispondenze 3 Analisi corrispondenze marca L freq O x mole Remota amua J ato l l l gt Selezionare immagine come variabile di riga gt Fare clic su Definisci intervallo Figura 12 24 Finestra di dialogo Definisci intervallo di righe s
158. e clic su Definisci Figura 10 22 Finestra di dialogo Componenti principali categoriale s Componenti principali categoriale fill Periodo dell intervista tem amp Diagnosi sul paziente diagn amp Interazione tempo diagno b Numero paziente numero gt Selezionare da Peso corporeo a Percezione del proprio corpo come variabili di analisi gt Fare clic su Definisci scala e peso 157 Analisi Componenti principali categoriale Figura 10 23 Finestra di dialogo Definisci scala e peso za Componenti principali categorial Peso della variabile Livello di scala ottimale O Spline ordinale Ordinale Spline nominale Nominale O Nominale multipla Numerica Spline Grado 3 Nodi interni 3 gt Selezionare Ordinale come livello di scaling ottimale gt Fare clic su Continua gt Selezionare Interazione diagnosi tempo come variabile supplementare e fare clic su Definisci scala nella finestra di dialogo Analisi componenti principali categoriale Figura 10 24 Finestra di dialogo Definisci scala Componenti principali categoriale Definisci s Peso della variabile Livello di scala ottimale O Spline ordinale Ordinale Spline nominale Nominale Nomi Numerica Spline Grado bp Nodi interni gt Selezionare Nominale multiplo come livello di scaling ottimale gt Fare clic su Continua 158 Capitolo 10
159. e con una trasformazione ordinale delle distanze fare clic sullo strumento Richiama finestra e selezionare Unfolding multidimensionale 317 Unfolding multidimensionale gt Nella finestra di dialogo Unfolding multidimensionale fare clic su Modello Figura 15 31 Finestra di dialogo Modello Unfolding multidimensionale modello Modello di scaling Trasformazioni delle distanze Identit O Nessuna Euclideo pesato O Lineare O Euclideo generalizzato O Spline Distanze Dissimilarit O Livellato i O Similarit Dimensioni Minimo 2 Massimo 2 Includi intercetta C Distingui osservazioni pari merito Applica trasformazioni O In ciascuna riga separatamente O Entro ciascuna sorgente separatamente Era tutte le sorgenti simultaneamente gt Selezionare Ordinale come trasformazione della distanza gt Fare clic su Continua gt Nella finestra di dialogo Unfolding multidimensionale fare clic su OK Segue la sintassi di comandi generata da queste selezioni PREFSCAL VARIABLES Run Talk Kiss Write Eat Sleep Mumble Read Fight Belch Argue Jump Cry Laugh Shout INPUT ROWS ROWID INITIAL samplesDirectory behavior_ini sav diml dim2 CONDITION UNCONDITIONAL TRANSFORMATION ORDINAL KEEPTIES PROXIMITIES DISSIMILARITIES MODEL IDENTITY CRITERIA DIMENSIONS 2 2 DIFFSTRESS 000001 MINSTRESS 0001 MAXITER 5000 PENALTY LAMBDA 0 5 OMEGA 1 0 PRINT MEASURES COMMON PL
160. e coordinate della seconda dimensione e cos via m Iniziale La configurazione del file specificato verr utilizzata come punto di partenza dell analisi m Fissa La configurazione del file specificato verr utilizzata per inserire le variabili Le variabili inserite devono essere selezionate come variabili dell analisi ma poich la configurazione fissa vengono considerate come variabili supplementari e pertanto non necessario selezionarle come variabili supplementari 63 Analisi corrispondenze multiple Output dell analisi delle corrispondenze multiple La finestra di dialogo Output consente di creare tabelle per i punteggi degli oggetti le misure di discriminazione la cronologia delle iterazioni le correlazioni delle variabili originali e trasformate le quantificazioni di categoria delle variabili selezionate e le statistiche descrittive delle variabili selezionate Figura 6 7 Finestra di dialogo Output za MCA Output Tabelle C Correlazioni delle variabili originali Misure di discriminazione Correlazioni delle variabili trasformate C Cronologia delle iterazioni Quantificazioni e contributi delle Variabili quantificate A categorie filetto testa taglio punta lunghz ottone filetton testan taglion Opzioni per punteggi di oggetti puntan Variabili etichetta oggetto Statistiche descrittive gt Annulla Aiuto Punteggi degli ogge
161. e corrispondenze Modello p gt Selezionare Principale come metodo di normalizzazione gt Fare clic su Continua gt Nella finestra di dialogo Analisi della corrispondenze fare clic su Grafici 228 Capitolo 12 Figura 12 19 Finestra di dialogo Grafici Analisi delle corrispondenze Grafici Grafici a dispersione Biplot Punti di riga Lunghezza etichette grafici a dispersione 20 Grafici lineari C Categorie di riga trasformate C Categorie di colonna trasformate L z ichette grafici linear Po Dimensioni grafico Visualizza tutte le dimensioni nella soluzione O Limita il numero di dimensioni Annulla Aiuto gt Selezionare Profili di riga e Profili di colonna nel gruppo Grafici a dispersione gt Fare clic su Continua gt Nella finestra di dialogo Analisi della corrispondenze fare clic su OK Il grafico dei punti di riga mostra le prime due dimensioni per i punti di riga con il punto supplementare per Media nazionale Media nazionale si trova lontano dall origine a indicare che il campione non rappresentativo della nazione in termini di livelli di tabagismo Personale di segreteria e Quadri sr sono vicini alla media nazionale diversamente dai dirigenti junior Di 229 Analisi corrispondenze conseguenza Personale di segreteria e Quadri senior hanno livelli di tabagismo vicini alla media nazionale diversamente dai dirigenti junior Figura 12 20
162. e nel caso di acquisti effettuati entro i tre mesi successivi All altra met stato inviato un annuncio stagionale standard customer_dbase sav File di dati ipotetico che prende in esame l impegno di una societ nel tentativo di utilizzare le informazioni contenute nel proprio database dei dati per creare offerte speciali per i clienti che pi probabilmente risponderanno all offerta stato selezionato in modo casuale un sottoinsieme della base dei clienti a cui stata inviata l offerta speciale e sono state registrate le risposte ricevute customer_information sav File di dati ipotetici contenente le informazioni postali del cliente ad esempio il nome e l indirizzo customers_model sav File di dati ipotetici che contiene il nominativo delle persone a cui stata inviata una campagna di marketing I dati includono informazioni demografiche un riepilogo della cronologia degli acquisti e se ciascuna persona ha risposto alla campagna Ogni caso rappresenta una persona separata customers_new sav File di dati ipotetici che contiene i nominativi delle persone che sono state evidenziate come potenziali candidati per una campagna di marketing I dati includono informazioni demografiche e un riepilogo sulla cronologia degli acquisti di ciascuna persona Ogni caso rappresenta una persona separata debate sav File di dati ipotetici che prende in esame le risposte appaiate a un indagine da parte dei partecipanti a un dibattito
163. e numero inferiore a sette con distribuzione approssimativamente normale se non viene specificato diversamente Le variabili stringa vengono sempre convertite in interi positivi tramite l assegnazione di indicatori di categoria in base a un ordinamento alfanumerico crescente La discretizzazione delle variabili stringa valida per questi valori interi Le altre variabili rimangono distinte per impostazione predefinita Le variabili discretizzate vengono quindi utilizzate per l analisi Figura 2 3 Finestra di dialogo Discretizza lt 8 Regressione categoriale discretizza Variabili pref Classificazione confez Non specificato marca Non specificato prezzo Non specificato garanzia Non specificato soddrimb Non specificato L Raggruppamento Numero di categorie f n NN Jormale Intervalli uguali Continua Annulla Aiuto Metodo Scegliere un metodo di raggruppamento di classificazione o di moltiplicazione m Raggruppamento Ricodifica in un numero specificato di categorie o ricodifica per intervallo m Classificazione La variabile viene discretizzata tramite la classificazione dei casi Moltiplicazione I valori correnti della variabile vengono standardizzati moltiplicati per 10 arrotondati e viene aggiunta una costante in modo tale che il valore discretizzato minore sia uguale a 1 19 Regressione categoriale CATREG Raggruppamento Per la discretizzazione delle varia
164. e specificare la configurazione iniziale i criteri di iterazione e di convergenza un metodo di normalizzazione il metodo per etichettare i grafici e gli oggetti supplementari 34 Capitolo 3 Figura 3 6 Finestra di dialogo Opzioni x Componenti principali categoriale Opzioni Oggetti supplementari Metodo di normalizzazione Intervallo di casi Primo Principale per variabile Ultimo Criteri Caso singolo Convergenza 00001 Aggiungi Max iterazioni 100 Etichetta i grafici in base a O Etichette di variabili o di valori bo Dimensioni grafico Visualizza tutte le dimensioni nella soluzione O Limita il numero di dimensioni Configurazione Nessuna v Annulla Aiuto Oggetti supplementari Specificare il numero di caso dell oggetto 0 il primo e l ultimo numero di caso per un intervallo di oggetti che si desidera contrassegnare come supplementare e quindi fare clic su Aggiungi Ripetere l operazione fino ad aver specificato tutti gli oggetti supplementari I pesi di caso di un oggetto definito come supplementare verranno ignorati Metodo di normalizzazione Per normalizzare i punteggi degli oggetti e le variabili possibile specificare una delle cinque opzioni seguenti In un analisi pu essere utilizzato un solo metodo di normalizzazione m Principale per variabile Consente di ottimizzare l associazione
165. e variabili l analisi delle corrispondenze multiple equivale all analisi delle corrispondenze Se si ritiene che le variabili abbiano propriet ordinali o numeriche consigliabile utilizzare l analisi delle componenti principali categoriale Se si desidera considerare insiemi di variabili consigliabile utilizzare l analisi della correlazione canonica non lineare categoriale Per ottenere un analisi delle corrispondenze multiple gt Dai menu scegliere Analizza Riduzioni dimensione Scaling ottimale 56 57 Analisi corrispondenze multiple Figura 6 1 Finestra di dialogo Scaling ottimale 2s Scaling ottimale Componenti principali categoriale Correlazione canonica non lineare _Pefinisci _Annula aiuto gt Selezionare Tutte le variabili nominali multiple gt Selezionare Un insieme gt Fare clic su Definisci Figura 6 2 Finestra di dialogo Analisi delle corrispondenze multiple 2 Analisi corrispondenze multiple gt Selezionare almeno due variabili dell analisi e specificare il numero di dimensioni nella soluzione gt Fare clic su OK 58 Capitolo 6 Se necessario possibile specificare variabili supplementari che verranno inserite nella soluzione oppure variabili di etichetta per i grafici Definire il peso della variabile nell analisi delle corrispondenze multiple possibile impostare il peso delle variabili dell analisi Figura 6 3 Finestra di dia
166. e viene fornito con il modulo Base Servizio clienti Per informazioni sulla spedizione o sul proprio account contattare la filiale SPSS nel proprio paese indicata nell elenco disponibile nel sito Web all indirizzo http www spss com worldwide Tenere presente che sar necessario fornire il numero di serie Corsi di formazione SPSS Inc organizza corsi di formazione pubblici e onsite che includono esercitazioni pratiche Tali corsi si terranno periodicamente nelle principali citt Per ulteriori informazioni sui corsi contattare la filiale SPSS nel proprio paese indicata nell elenco disponibile nel sito Web all indirizzo http www spss com worldwide Supporto tecnico Ai clienti che richiedono la manutenzione viene messo a disposizione un servizio di supporto tecnico I clienti possono contattare il supporto tecnico per richiedere assistenza sull utilizzo dei prodotti SPSS Statistics o sull installazione di uno degli ambienti hardware supportati Per il supporto tecnico visitare il sito Web di SPSS all indirizzo http Avww spss it o contattare la filiale SPSS nel proprio paese indicata nel sito Web all indirizzo Attp www spss com worldwide Tenere presente che sar necessario fornire dati di identificazione personali e relativi alla propria societ e il numero di serie del sistema Pubblicazioni aggiuntive Presso Prentice Hall disponibile il volume SPSS Statistical Procedures Companion di Marija Norusis che sa
167. ed New York The Free Press 307 330 Kruskal J e N Shepard 1974 A nonmetric variety of linear factor analysis Psychometrika 39 123 157 Krzanowski W e H C Marriott 1994 Multivariate analysis Part I distributions ordination and inference London Edward Arnold Lebart L A Morineau e K M Warwick 1984 Multivariate descriptive statistical analysis New York John Wiley and Sons Lingoes J C 1968 The multivariate analysis of qualitative data Multivariate Behavioral Research 3 61 94 Max J 1960 Quantizing for minimum distortion Proceedings IEEE Information Theory 6 7 12 McCullagh P e J A Nelder 1989 Generalized Linear Models 2nd ed London Chapman amp Hall Menec V N Roos D Nowicki L MacWilliam G Finlayson e C Black 1999 Seasonal Patterns of Winnipeg Hospital Use Manitoba Centre for Health Policy Meulman J J 1982 Homogeneity analysis of incomplete data Leiden DSWO Press Meulman J J 1986 A distance approach to nonlinear multivariate analysis Leiden DSWO Press 335 Bibliografia Meulman J J 1992 The integration of multidimensional scaling and multivariate analysis with optimal transformations of the variables Psychometrika 57 539 565 Meulman J J 1993 Principal coordinates analysis with optimal transformations of the variables Minimizing the sum of squares of the smallest eigenvalues British Journal of Mathematical and S
168. ed_c SAY Elimina al Nuova richiesta Per aggiungere una richiesta selezionare uno o pi elementi dagli elenchi sottostanti e le propriet desiderate quindi fare clic su Aggiungi I sottotipi di tabella includeranno solo i sottotipi disponibili per almeno una delle procedure selezionate Aggi Opzioni Tipi di output Identificatori di comando Sottotipi tabella per comandi selezionati Destinazioni output Grafici ACF 4 hedule Registri AIM sing gt u y A _ File Sfoglia Tabelle Alscal i ol ois Testi ANACOR fai aly hai O In base ai nomi degli oggetti Intestazioni ANOWA ia se er Cartella Avvisi Apply Dictionary Strutture ARIMA Autoregression 3 C Escludi da Viewer ID A Nessuna Sfoglia Nuovo insieme di dati Etichette gt Fare clic su Termina gt Fare clic su OK e quindi di nuovo su OK per confermare Grafici di trasformazione I grafici di trasformazione visualizzano il numero della categoria originale sugli assi orizzontali gli assi verticali indicano le quantificazioni ottimali 165 Analisi Componenti principali categoriale Figura 10 32 Grafico di trasformazione per ciclo mestruale Trasformazione Mestruazioni 0 5 00 Quantificazioni 1 2 3 Categorie Alcune variabili come Ciclo mestruale hanno ottenuto trasformazioni quasi lineari perci i
169. eferibili perch i codici influiscono sulla quantit di output generata da una procedura Tutte le categorie codificate con valori compresi tra 1 e il valore massimo definito dall utente sono valide Se una di tali categorie vuota le quantificazioni corrispondenti saranno mancanti di sistema o uguali a 0 in base alla procedura Sebbene nessuna di queste assegnazioni influenzi le analisi l output viene generato per queste categorie Di conseguenza per lo schema B avoro ha quattro categorie che ricevono valori mancanti di sistema Per lo schema C sono inoltre presenti quattro categorie che ricevono indicatori di mancanti di sistema Al contrario per lo schema A non sono presenti quantificazioni mancanti di sistema L utilizzo di interi consecutivi come codici per le variabili considerate come nominali o ordinali determina una quantit molto minore di output senza influenzare 1 risultati Gli schemi di codifica per le variabili considerate come numeriche sono pi limitati rispetto al caso di variabili considerate come nominali Per tali variabili le differenze tra categorie consecutive sono importanti La tabella seguente mostra tre schemi di codifica per et Tabella 1 3 Schemi di codifica alternativi per et Schema Categoria Viene visualizzata la B C 20 20 1 1 22 22 3 2 25 25 6 3 27 27 8 4 Qualsiasi ricodifica di variabili numeriche deve conservare le differenze tra le categorie L utilizzo dei va
170. eggi sia di riga che di colonna Alcuni aspetti della soluzione con analisi delle corrispondenze come i singoli valori l inerzia per dimensione e i contributi non cambiano nelle varie normalizzazioni I punteggi di riga e di colonna e le loro varianze ne vengono influenzate L analisi delle corrispondenze include vari modi per distribuire l inerzia I tre pi comuni includono la distribuzione dell inerzia solo sui punteggi di riga la distribuzione dell inerzia solo su punteggi di colonna o la distribuzione dell inerzia in modo simmetrico sui punteggi di riga e di colonna Principale per riga Nella normalizzazione principale per riga le distanze euclidee fra i punti di riga sono approssimazioni delle distanze chi quadrato tra le righe della tabella di corrispondenza I punteggi di riga sono la media ponderata dei punteggi di colonna I punteggi di colonna sono standardizzati in modo da avere una somma ponderata delle distanze quadrate al centroide 1 Poich questo metodo massimizza le distanze tra le categorie di riga si consiglia di utilizzare la normalizzazione principale per riga se si interessati principalmente a evidenziare le differenze tra le categorie della variabile di riga Principale per colonna D altro lato se si desidera che approssimare le distanze chi quadrato tra le colonne della tabella di corrispondenza i punteggi di colonna dovranno essere la media ponderata dei punteggi di riga I punteggi di riga sono standardi
171. egliere di etichettare gli oggetti in base a Variabile nel gruppo Etichetta gli oggetti quindi selezionare cluster come variabile in base alla quale etichettare gli oggetti gt Fare clic su Continua gt Fare clic su Categoria nel gruppo Grafici della finestra di dialogo Analisi componenti principali categoriale 143 Analisi Componenti principali categoriale Figura 10 6 Finestra di dialogo Grafici di categoria i Componenti principali categoriale Grafici di categoria Grafici di categoria Grafici di categoria congiunti Grafici di trasformazione Includi grafici residui Proietta centroidi di gt Scegliere di generare grafici di categoria congiunti per le variabili da intensit Intensit dell interazione a formalit Formalit della relazione gt Fare clic su Continua gt Fare clic su OK nella finestra di dialogo Analisi componenti principali categoriale Numero di dimensioni Questi dati mostrano parte dell output iniziale dell analisi componenti principali categoriale Dopo la cronologia iterazioni dell algoritmo viene visualizzato il riepilogo del modello compresi gli autovalori di ciascuna dimensione Tali autovalori sono equivalenti a quelli dell analisi componenti principali classica Rappresentano una misura della quantit di varianza spiegata per ogni dimensione 144 Capitolo 10 Figura 10 7 Cronologia delle iteraz
172. egna i valori mancanti Agli oggetti con valori mancanti della variabile selezionata vengono assegnati i valori ed possibile scegliere il metodo di assegnazione Selezionare Moda per sostituire i valori mancanti con la categoria pi frequente Se sono disponibili pi mode verr utilizzata quella con l indicatore di categoria minore Selezionare Categoria distinta per sostituire 1 valori mancanti con la stessa quantificazione di una categoria supplementare Ci implica che gli oggetti con un valore mancante nella variabile specificata vengono considerati come appartenenti alla stessa categoria supplementare 20 Capitolo 2 Regressione categoriale Opzioni Nella finestra di dialogo Opzioni possibile selezionare lo stile di configurazione iniziale specificare i criteri di iterazione e di convergenza selezionare gli oggetti supplementari e impostare le etichette dei grafici Figura 2 5 Finestra di dialogo Opzioni z2 Regressione categoriale opzioni Oggetti supplementari Configurazione iniziale Numerica O Casuale O Inizi sistematici multipli O Caso singolo si Modelli da testare Tutti i possibili modelli di segno Casi da considerare come supplementari Numero ridotto di modelli di segno solo consentiti solo per variabili con una perdita di varianza Q L insieme ridotto costituito da modelli in cui i segni negativi percentuale superiore alla soglia Usa segni fissi per i coe
173. elativo al battitappeto Nome di variabile Etichetta di valore Etichetta del valore confezione Design confezione A B C marca Nome marca K2R Glory Bissell prezzo Prezzo 1 19 1 39 1 59 marchio di qualit Presenza di un No s marchio di qualit garanzia Garanzia Soddisfatti No s o rimborsati Dieci consumatori sono classificati in 22 profili definiti da questi fattori La variabile Preferenza include il rango delle classificazioni medie per ogni profilo Classificazioni basse corrispondono a una preferenza elevata La variabile riflette una misura globale della preferenza per ogni profilo Utilizzando la regressione categoriale si esaminer la correlazione tra i cinque fattori e la preferenza Questo insieme di dati reperibile in carpet sav Per ulteriori informazioni vedere File di esempio in Appendice A a pag 321 94 95 Regressione categoriale Analisi della regressione lineare standard gt Per generare l output della regressione lineare standard dai menu scegliere Analizza Regressione Lineare Figura 9 1 Finestra di dialogo Regressione lineare 1 Regressione lineare Dipendente Gity Blocki dil Indipendenti a Coi e le w Metodo Per blocchi v variabile di selezione Regola Etichette casi Minimi quadrati ponderati oog gt Selezionare Preferenza come variabile dipendente gt Selezionare da Design con
174. elazioni Le intercorrelazioni tra i predittori sono utili per identificare la multicollinearit nella regressione Le variabili strettamente correlate condurranno a stime di regressione instabili Tuttavia a causa dell elevata correlazione l omissione di una di esse dal modello influenza la previsione in misura minima La varianza nella risposta che pu essere spiegata dalla variabile omessa rimane spiegata dalla variabile correlata rimanente Tuttavia le correlazioni di ordine zero sono sensibili ai valori anomali e inoltre non sono in grado di identificare la multicollinearit a causa dell elevata correlazione tra un predittore e una combinazione degli altri predittori Figura 9 16 Correlazioni tra i predittori originali Sigillo di Soddisfatti o Confezione Marca Prezzo rimborsati Confezione Marca Prezzo Sigillo di garanzia Soddisfatti o rimborsati Dimensione Autovalore 107 Regressione categoriale Figura 9 17 Correlazioni tra i predittori trasformati Sigillo di Soddisfatti o Confezione Marca Prezzo garanzia rimborsati Confezione 156 089 032 Marca Prezzo Sigillo di garanzia Soddisfatti o rimborsati Dimensione Autovalore Vengono visualizzate le intercorrelazioni dei predittori per i predittori trasformati e non trasformati Tutti i valori sono vicini allo 0 a indicare che la multicollinearita tra le singole variabili non rappresenta un problema Si noti che le sole correlazioni che si m
175. elezionare Centroidi proiettati su Preoccupazione legata a cibo e peso come variabile dell asse x gt Fare clic su OK 185 Analisi Componenti principali categoriale Figura 10 54 Centroidi proiettati del momento della diagnosi su Preoccupazione legata al corpo nel tempo iS Editor dei grafici Dex File Modifica Visualizza opzioni Elementi oo BXYke MBS MILEY mu is E U B_I Ab it t lk ie Zee la Diagnosi sul paziente O1 O 2 I I I IO amp WN a U lt gt v gt v c n ct o 2 3 c S B Qa 3 o o o w i n c o god w 4 o DI o o v k o Fan c w oO 4 376 5 L 470 25 punti gt Quindi per collegare i punti fare doppio clic sul grafico e quindi fare clic sullo strumento Aggiungi linea di interpolazione nell Editor dei grafici gt Chiudere l Editor dei grafici La preoccupazione relativa al corpo una variabile che rappresenta i sintomi chiave condivisi dai quattro diversi gruppi Oltre ai pazienti con disturbi alimentari atipici il gruppo anoressico e i due gruppi bulimici hanno livelli molto simili sia all inizio sia alla fine Letture consigliate Consultare i testi seguenti per maggiori informazioni sull analisi componenti principali categoriale De Haas M J Algera F J M Van Tuijl e J J Meulman 2000 Macro and micro goal setting In search of coherence Applied Psychology 49 579 595 186
176. elezionare il livello di scaling da utilizzare per quantificare ciascuna variabile m Ordinale Nella variabile quantificata viene mantenuto l ordine delle categorie della variabile osservata m Nominale singola Nella variabile quantificata agli oggetti della stessa categoria assegnato un punteggio uguale Nominale multipla Le quantificazioni possono variare a seconda della dimensione Numerica discreta Le categorie vengono considerate come ordinate ed equamente distanziate Le differenze tra i numeri delle categorie e l ordine delle categorie della variabile osservata vengono mantenute nella variabile quantificata Definisci intervallo Figura 4 4 Finestra di dialogo Definisci intervallo at OVERALS Definisci intervallo Minimo 1 Massimo necessario definire un intervallo per ciascuna variabile Il valore massimo specificato deve essere un intero I valori frazionari vengono troncati nell analisi e i valori di categoria al di fuori dell intervallo specificato vengono ignorati Per ridurre al minimo l output utilizzare il comando Ricodifica automatica del menu Trasforma per creare categorie consecutive che iniziano con 1 45 Analisi della correlazione canonica non lineare OVERALS E inoltre necessario definire un intervallo per ciascuna variabile utilizzata per etichettare i grafici dei punteggi degli oggetti Le etichette per le categorie con valori al di fuori dell intervallo definito per la va
177. elezionare un valore per il criterio di convergenza L analisi si interrompe se la differenza dell adattamento totale delle due ultime iterazioni inferiore al valore di convergenza o se viene raggiunto il numero massimo di iterazioni Opzioni aggiuntive del comando OVERALS Per personalizzare l analisi della correlazione canonica non lineare possibile incollare le impostazioni selezionate in una finestra di sintassi e quindi modificare la sintassi del comando OVERALS cos ottenuta Il linguaggio della sintassi dei comandi consente inoltre di Mm Specificare le coppie di dimensioni da inserire nel grafico evitando cos di inserire tutte le dimensioni estratte mediante la parola chiave NDIM del sottocomando PLOT m Specificare il numero dei caratteri delle etichette dei valori utilizzate per etichettare i punti dei grafici mediante il sottocomando PLOT m Designare pi di cinque variabili come variabili etichetta per i grafici dei punteggi degli oggetti mediante il sottocomando PLOT m Selezionare le variabili utilizzate nell analisi come variabili etichetta per i grafici dei punteggi degli oggetti mediante il sottocomando PLOT m Selezionare le variabili che definiscono le etichette dei punti per il grafico del punteggio della quantificazione mediante il sottocomando PLOT m Specificare il numero dei casi da includere nell analisi se non si desidera utilizzare tutti i casi disponibili nel file di dati attivo med
178. ell adattamento totale delle due ultime iterazioni inferiore al valore di convergenza o se viene raggiunto il numero massimo di iterazioni Etichetta i grafici in base a Consente di specificare se nei grafici verranno utilizzati le variabili e le etichette dei valori o i nomi delle variabili e i valori E inoltre possibile specificare una lunghezza massima per le etichette Dimensioni del grafico Consente di controllare le dimensioni visualizzate nell output m Visualizza tutte le dimensioni nella soluzione Tutte le dimensioni nella soluzione sono visualizzate in una matrice di grafici a dispersione Limita il numero di dimensioni Le dimensioni visualizzate sono limitate alle coppie inserite nel grafico Se le dimensioni vengono limitate necessario selezionare la dimensione maggiore e minore da inserire nel grafico La dimensione minore pu variare da 1 al numero delle dimensioni nella soluzione meno 1 e viene inserita nel grafico a confronto con le dimensioni maggiori La dimensione maggiore pu variare da 2 al numero delle dimensioni nella soluzione e indica la dimensione massima da utilizzare nell inserimento nel grafico delle coppie di dimensioni Questa specifica si applica a tutti i grafici multidimensionali richiesti Configurazione possibile leggere i dati da un file che contiene le coordinate di una configurazione La prima variabile del file deve contenere le coordinate della prima dimensione la seconda variabile l
179. elle variabili a un insieme di quantificazioni ovvero nominale singola ordinale o nominale Se la perdita singola elevata preferibile trattare le variabili come nominali multiple Nell esempio tuttavia l adattamento singolo e multiplo sono pressoch uguali il che significa che le coordinate multiple si trovano quasi su una linea retta nella direzione indicata dai pesi L adattamento multiplo pari alla varianza delle coordinate della categoria multipla per ciascuna variabile Queste misure sono analoghe alle misure di discriminazione rilevate nell analisi dell omogeneit possibile esaminare la tabella dell adattamento multiplo per verificare quali variabili comportano la migliore discriminazione Ad esempio si veda la tabella dell adattamento multiplo per Stato civile e Giornale letto pi spesso I valori di adattamento sommati nelle due dimensioni sono pari a 1 122 per Stato civile e a 0 911 per Giornale letto pi spesso Questa informazione indica che lo stato civile di una persona fornisce un potere di discriminazione maggiore rispetto alle sue preferenze di lettura L adattamento singolo corrisponde al peso quadrato per ogni variabile ed pari alla varianza delle coordinate della categoria singola Di conseguenza i pesi sono pari alle deviazioni standard delle coordinate della categoria singola Esaminando la ripartizione dell adattamento singolo tra le dimensioni possibile vedere che la variabile Giornale le
180. elle variabili selezionate Statistiche descrittive Vengono visualizzate le tabelle con le frequenze i valori mancanti e le mode delle variabili selezionate 25 Regressione categoriale CATREG Regressione categoriale Salva Dalla finestra di dialogo Salva possibile salvare i valori previsti i residui e i valori trasformati nel file di dati attivo e o salvare i dati discretizzati i valori trasformati i coefficienti e i modelli regolarizzati nonch i segni dei coefficienti di regressione in un file di dati esterno di SPSS Statistics o in un insieme di dati della sessione corrente m file di dati sono disponibili durante la sessione corrente ma non lo sono in quelle successive a meno che non li si salvi esplicitamente come file di dati I nomi degli insiemi di dati devono rispettare le regole dei nomi delle variabili m Inomi dei file o i nomi dei file di dati devono essere diversi per ogni tipo di dati salvati Figura 2 8 Finestra di dialogo Salva 15 Regressione categoriale salva U Salva i valori attesi nell insieme di dati attivo 0 Salva residui nell insieme di dati attivo Dati discretizzati Coefficienti e modelli regolarizzati C crea dati discretizzati Crea nuovo insieme di dat Variabili trasformate Segni di coefficienti di regressione Salva variabili trasformate nell insieme di dati attivo rea nuovo insieme di dat C Salva variabili trasformate in nuovo insieme di dati o fil
181. ello che meglio si adatta alle specifiche esigenze Esempio La regressione categoriale consente di illustrare in quale modo il grado di soddisfazione dipende dalla categoria lavorativa dall area geografica e dalla quantit di spostamenti richiesti Si potrebbe scoprire che un grado elevato di soddisfazione correlato ai manager e a un numero ridotto di spostamenti L equazione di regressione risultante pu essere utilizzata per prevedere il grado di soddisfazione relativo a qualsiasi combinazione delle tre variabili indipendenti Statistiche e grafici Frequenze coefficienti di regressione tabella ANOVA cronologia delle iterazioni quantificazioni di categoria correlazioni tra predittori non trasformati correlazioni tra predittori trasformati grafici dei residui e grafici di trasformazione Dati La procedura CATREG opera sulle variabili indicatore di categoria che dovrebbero essere rappresentate da interi positivi Nella finestra di dialogo Discretizzazione possibile convertire le variabili rappresentate da frazioni o da stringhe in interi positivi 15 16 Capitolo 2 gt gt gt Assunzioni E consentita una sola variabile di risposta ma il numero massimo di variabili predittore uguale a 200 I dati devono includere almeno tre casi validi e il numero di casi validi deve essere uguale al numero delle variabili predittore pi uno Procedure correlate La procedura CATREG equivale all analisi della correlaz
182. ello di scaling il numero minimo e massimo delle dimensioni di tale modello la struttura della matrice delle distanze la trasformazione da utilizzare sulle distanze e se le distanze vengono trasformate in modo condizionale sulla riga e in modo condizionale o non condizionale sulla sorgente 85 Unfolding multidimensionale PREFSCAL Figura 8 2 Finestra di dialogo Modello x Unfolding multidimensionale modello Modello di scaling Trasformazioni delle distanze O Identit O Nessuna O Lineare Euclideo generalizzato O Spline Distanze Dissimilarit O Livellato O Similarit Ordinale Dimensioni In di intercetta Minimo p RE e C Distingui osservazioni pari merito Massimo 2 Applica trasformazioni In ciascuna riga separatamente Entro ciascuna sorgente separatamente O Fra tutte le sorgenti simultaneamente Annulla Aiuto Modello di scaling Scegliere una delle seguenti opzioni m Identit Tutte le sorgenti hanno la stessa configurazione m Euclideo pesato E un modello per differenze individuali Ciascuna sorgente ha uno spazio individuale in cui ogni dimensione dello spazio comune viene pesata in modo differenziale m Euclideo generalizzato un modello per differenze individuali Ciascuna sorgente ha uno spazio individuale uguale alla rotazione dello spazio comune seguito da una pesatura differenziale delle dimensioni Distanze Specificare se la matrice di distanza contiene
183. ematical and Statistical Psychology 46 287 300 Meulman J e Verboon 1993 Points of view analysis revisited Fitting multidimensional structures to optimal distance components with cluster restrictions on the variables Psychometrika 58 7 35 Meulman J J A J Van der Kooij e A Babinec 2000 New features of categorical principal components analysis for complicated data sets including data mining In Classification Automation and New Media W Gaul e G Ritter ed Berlin Springer Verlag 207 217 Meulman J J A J Van der Kooij e W J Heiser 2004 Principal components analysis with nonlinear optimal scaling transformations for ordinal and nominal data In Handbook of Quantitative Methodology for the Social Sciences D Kaplan ed Thousand Oaks Calif Sage Publications Inc 49 70 Theunissen N M J J Meulman A L Den Ouden H M Koopman G H Verrips S Verloove Vanhorick e J M Wit 2003 Changes can be studied when the measurement instrument is different at different time points Health Services and Outcomes Research Methodology 4 109 126 Tucker L R 1960 Intra individual and inter individual multidimensionality In Psychological Scaling Theory amp Applications H Gulliksen e S Messick ed New York John Wiley and Sons 155 167 Vlek C e P J Stallen 1981 Judging risks and benefits in the small and in the large Organizational Behavior and Human Performance 28 235 271
184. emente dalla modalit di misurazione Per quanto concerne Categories esistono tre livelli fondamentali di misurazione m 1 livello nominale implica che i valori di una variabile rappresentano categorie non ordinate Esempi di variabili che possono essere nominali sono la regione il codice postale la religione e le categorie a scelta multipla m 1 livello ordinale implica che i valori di una variabile rappresentano categorie ordinate Tra gli esempi le scale di atteggiamento corrispondenti a gradi di soddisfazione o fiducia e 1 punteggi di preferenza m 1 livello numerico implica che i valori di una variabile rappresentino categorie ordinate con una metrica significativa tale che i confronti fra le categorie siano appropriati Esempi di variabili sono l et espressa in anni o il reddito espresso in migliaia di Euro Ad esempio si supponga che le variabili regione lavoro ed et siano codificate come illustrato nella tabella seguente Tabella 1 1 Schema di codifica per regione lavoro ed et Regione Lavoro Et 1 Nord 1 stagista 20 venti anni 2 Sud 2 commerciale 22 ventidue anni 3 Est 3 manager 25 venticinque anni 4 Ovest 27 ventisette anni I valori illustrati rappresentano le categorie di ciascuna variabile Regione sara una variabile nominale Esistono quattro categorie di regioni senza ordinamento intrinseco I valori da 1 a 4 rappresentano semplicemente le quattro categorie lo schema di c
185. endall 7202452 Coefficienti di variazione Vicinanze delle variazioni 5138436 8608333 Vicinanze trasformate delle variazioni 4761934 Distanze delle variazioni 3912592 Indici di degenerazione Somma dei quadrati degli indici di amalgamazione di 4957969 DeSarho Indice di non degenerazione approssimativo di Shepard ARI L algoritmo converge dopo 169 interazioni con uno stress penalizzato finale pari a 0 6427725 I coefficienti di variazione e l indice di Shepard sono sufficientemente grandi e gli indici di DeSarbo sono sufficientemente piccoli ad indicare che non ci sono problemi di degenerazione 315 Unfolding multidimensionale Spazio comune Figura 15 29 Grafico congiunto dello spazio comune 4 o 2 Eat 4 2 odg 9 2 Laugh 10 Kiss taug A Shout 2 o o o zi 5 Runo cry 13 o 2 o Talk v Fight Jump 5 o Sleep o i 3 o E Belch CO O 14 O Mumble Argue Read 12 2 o o e a 2 Write Dimensione 1 La dimensione orizzontale appare significativamente associata agli oggetti colonna comportamenti e consente di distinguere tra comportamenti inadeguati litigare fare rutti e quelli pi appropriati La dimensione verticale appare significativamente correlata agli oggetti riga situazioni e definisce pi limitazioni per i comportamenti relativi a situazioni specifiche m La parte finale della dimensione verticale riporta le situazioni chiesa classe che limitano i comportamenti ovvero che impongo
186. ensione e il contributo della dimensione all inerzia del punto Profili di riga Per ciascuna categoria di riga la distribuzione della variabile di colonna nelle categorie Profili di colonna Per ciascuna categoria di colonna la distribuzione della variabile di riga nelle categorie Permutazioni della tavola di corrispondenza Tavola di corrispondenza riorganizzata in modo tale che le righe e le colonne sono disposte in ordine crescente in base ai punteggi nella prima dimensione inoltre possibile specificare il numero massimo di dimensioni per cui verranno create tabelle permutate Viene creata una tabella permutata per ciascuna dimensione a partire da 1 fino al numero specificato Statistiche di confidenza per Punti di riga Include la deviazione standard e le correlazioni per tutti i punti di riga non supplementari Statistiche di confidenza per Punti di colonna Include la deviazione standard e le correlazioni per tutti i punti di colonna non supplementari Analisi delle corrispondenze Grafici Nella finestra di dialogo Grafici possibile specificare i grafici che si desidera creare 54 Capitolo 5 Figura 5 6 Finestra di dialogo Grafici ta Analisi delle corrispondenze Grafici RK Grafici a dispersione Biplot Punti di riga C Punti di colonna Lunghezza etichette grafici a dispersione 20 Grafici lineari C Categorie di riga trasformate C Categorie di colonna trasformate FI Dimensioni gr
187. ente Un numero inferiore di dimensioni pi facile da interpretare e dopo un certo numero di dimensioni la quantit di associazione aggiuntiva spiegata diventa trascurabile In un analisi di omogeneit una soluzione a una due o tre dimensioni molto comune 254 Capitolo 13 Figura 13 5 Riepilogo modello Varianza spiegata Alfa di Totale Dimensione Cronbach autovalore Inerzia di varianza 1 878 3 727 621 62 123 2 657 2 209 368 36 809 Media 7964 2 968 495 49 466 a La media di Alfa di Cronbach basata sulla media dell autovalore La quasi totalit della varianza nei dati spiegata dalla soluzione il 62 1 dalla prima dimensione e il 36 8 dalla seconda Le due dimensioni insieme forniscono un interpretazione in termini di distanze Se la discriminazione di una variabile elevata gli oggetti saranno vicini alle categorie cui appartengono Idealmente gli oggetti nella stessa categoria saranno vicini gli uni agli altri ovvero avranno punteggi simili e le categorie di variabili diverse saranno vicine se appartengono agli stessi oggetti ovvero due oggetti con punteggi simili per una variabile avranno anche punteggi analoghi per le altre nella soluzione Punteggi oggetto Dopo avere esaminato il riepilogo del modello verificare i punteggi degli oggetti possibile specificare una o pi variabili per etichettare il grafico dei punteggi degli oggetti Per ciascuna variabile di etichettatura viene gen
188. entificano riga colonna e sorgente per ciascuna cella L operazione porta alla finestra di dialogo Distanze in una sola colonna gt Fare clic su Definisci Distanze in matrici per colonne Se nella finestra di dialogo Formato dati si seleziona il modello di dati delle distanze nelle matrici per una sorgente o per pi sorgenti verr visualizzata la seguente finestra principale Figura 7 2 Finestra di dialogo Distanze in matrici per colonne z Scaling multidimensionale Distanze in matrici per colonne Distanze Zia zia Fratello fratello Vincoli Cugino cugino amp Figlia figlia Modello Opzioni Grafici Pesi Sorgenti identificazione id gt Selezionare tre o pi variabili di distanza accertandosi che l ordine delle variabili nell elenco corrisponda all ordine delle colonne delle distanze gt Se necessario selezionare un numero di variabili di ponderazione uguale al numero delle variabili delle distanze Accertarsi che l ordine dei pesi corrisponda all ordine delle distanze da essi rappresentate gt In alternativa se sono disponibili pi sorgenti selezionare una variabile di sorgenti Il numero dei casi in ciascuna variabile di distanza deve essere uguale al numero delle variabili di distanza per il numero delle sorgenti 71 Scaling multidimensionale PROXSCAL E inoltre possibile definire un modello di scaling multidime
189. eraction Quantification dimension 1 Collegando i punti di categoria per ogni categoria diagnostica nel tempo i modelli suggeriscono immediatamente che la prima dimensione correlata al tempo e la seconda alla diagnosi come determinato in precedenza per i grafici dei punteggi degli oggetti Tuttavia questo grafico mostra che nel tempo i disturbi tendono a diventare pi simili tra loro Inoltre per tutti i gruppi 1 progressi sono maggiori tra i punti temporali 1 e 2 1 pazienti anoressici mostrano pi progressi da 2 a 3 ma per gli altri gruppi i progressi sono scarsi Sviluppo differenziale per variabili selezionate Una variabile da ogni insieme di sintomi identificata dai pesi di componente stata selezionata come rappresentativa dell insieme La variabile Eccessi alimentari stata selezionata per l insieme bulimico Atteggiamento sessuale per l insieme anoressico psicosociale e preoccupazione legata al corpo per il terzo insieme 175 Analisi Componenti principali categoriale Per esaminare i possibili andamenti differenziali della malattia le proiezioni di Interazione diagnosi tempo per Eccessi alimentari Atteggiamento sessuale e Preoccupazione legata a cibo e peso sono state calcolate e tracciate in un grafico nella seguente figura Figura 10 44 Centroidi proiettati di Interazione diagnosi tempo su Eccessi alimentari Atteggiamento sessuale e Preoccupazione legata a cibo e peso Centroidi proiettati su
190. erato un grafico distinto etichettato in base ai valori della specifica variabile Verr inoltre esaminato il grafico dei punteggi degli oggetti etichettati in base all oggetto della variabile Si tratta di una variabile di identificazione dei casi non utilizzata in nessun calcolo La distanza di un oggetto dall origine riflette la variazione rispetto al modello di risposta media Questo modello di risposta media corrisponde alla categoria pi frequente per ogni variabile Gli oggetti con un numero elevato di caratteristiche corrispondenti alle categorie pi frequenti si trovano in prossimit dell origine Per contro gli oggetti con caratteristiche uniche sono posizionati lontani dall origine 255 Analisi corrispondenze multiple Figura 13 6 Grafico dei punteggi degli oggetti etichettati per oggetto 4 VITE1 N CHIODO6 o Dimensione 2 1 CHIODO7 BULLONE2 o 5 CHIODO8 VITEB i o F ounTINA o V9 vp H0002 o BULLONEB cHIEARbox conos 15 10 05 00 05 10 15 Dimensione 1 Esaminando il grafico si pu vedere che la prima dimensione l asse orizzontale separa viti e bulloni dotati di filettatura da chiodi e puntine privi di filettatura Questo evidente nel grafico in quanto viti e bulloni si trovano su un estremit dell asse orizzontale puntine e chiodi sull altra In misura minore la prima dimensione separa inoltre i bulloni con parte inferiore piatta da tutti gli altri ogge
191. eri di convergenza specificare la configurazione iniziale che dovr essere utilizzata e scegliere 1 grafici e l output 74 Capitolo 7 Crea misure dai dati Figura 7 6 Finestra di dialogo Crea misure dai dati 4 Scaling multidimensionale Crea misure dai dati Misura Distanza euclidea e Frequenze O Binaria a Trasforma valori Crea matrice delle distanze Standardizzazione Nessuno Ira variabili O Tra casi Per variabile Per caso Annulla Aiuto La procedura Scaling multidimensionale utilizza dati di dissimilarit per creare una soluzione di scaling Se i dati disponibili sono dati multivariati valori di variabili misurate necessario creare dati di dissimilarit in modo da calcolare una soluzione di scaling multidimensionale possibile specificare i dettagli della creazione delle misure di dissimilarit a partire dai dati disponibili Misura Consente di specificare la misura di dissimilarit per l analisi Selezionare un alternativa dal gruppo Misura corrispondente al tipo di dati desiderato e quindi selezionare una delle misure dall elenco a discesa corrispondente a tale tipo di misura Le alternative disponibili sono m Intervallo Distanza euclidea Distanza euclidea quadratica Chebychev City Block Minkowski o Personalizzato Conteggi Misura chi quadrato e Misura phi quadrato Binaria Distanza euclidea Distanza euclidea
192. esso Questi valori non dovrebbero essere utilizzati per l omissione contemporanea di molte variabili per un modello successivo Inoltre il metodo dei minimi 108 Capitolo 9 quadrati alternati ottimizza le quantificazioni il che implica che questi test devono essere interpretati in modo conservativo Figura 9 19 Coefficienti standardizzati per predittori trasformati Coefficienti standardizzati Errore std Confezione 155 289 Marca 578 Prezzo 39 312 Sigillo di garanzia 35 299 Soddisfatti o rimborsati 7 175 Variabile dipendente Preferenza Il coefficiente maggiore relativo a Design confezione Un aumento di deviazione standard di Design confezione genera una deviazione standard pari a 0 748 nella classificazione della preferenza prevista Tuttavia Design confezione viene trattato normalmente quando un aumento delle quantificazioni non deve corrispondere a un aumento dei codici di categoria originali I coefficienti standardizzati sono spesso interpretati come indicativi dell importanza di ogni predittore Tuttavia i coefficienti di regressione non possono descrivere completamente l impatto di un predittore o le relazioni tra i predittori necessario utilizzare statistiche alternative in combinazione con i coefficienti standardizzati per esaminare in modo completo gli effetti dei predittori Correlazioni e importanza Per interpretare i contributi dei predittori alla regressione non sufficiente limitarsi
193. estra di dialogo Opzioni cat U nfolding multidimensionale opzioni Configurazione iniziale Criteri di iterazione Classica O Ross Cliff Corrispondenza Convergenza stress 000001 Assegnazione per v Stress minimo Jooo tt t Max iterazioni 000 O Centroidi O Inizi casuali multipli Intensit Termine penalit Intervallo Personalizzato Configurazione personalizzata gt Per produrre una soluzione non degenerata fare clic sullo strumento Richiama finestra e selez ionare Unfolding multidimensionale gt Nella finestra di dialogo Unfolding multidimensionale fare clic su Opzioni gt Nel gruppo Termine penalit digitare 0 5 come valore del parametro Intensit e 1 0 come valore del parametro Intervallo In tal modo il termine di penalit viene disattivato gt Fare clic su Continua gt Nella finestra di dialogo Unfolding multidimensionale fare clic su OK Segue la sintassi di comandi generata da queste selezioni PREF VA SCAL RIABLES TP BT EMM JD CT BMM HRB TMd BTJ TMn CB DP GD CC CMB INITIAL CLASSICAL SPEARMAN E P C RANSFORMATION NONE ROXIMITIES DISSIMILARITIES RITERIA DIMENSIONS 2 2 DIFFSTRESS 000001 MINSTRESS 0001 MAXITER 5000 PENALTY LAMBDA 0 5 OMEGA 1 0 P RINT MEASURES COMMON PLOT COMMON 291 Misure Unfolding multidimensionale L unica
194. ething new something borrowed something blue Psychometrika 4 493 517 Ramsay J O 1989 Monotone regression splines in action Statistical Science 4 425 441 Van der Kooij A J e J J Meulman 1997 MURALS Multiple regression and optimal scaling using alternating least squares In Softstat 97 F Faulbaum e W Bandilla ed Stuttgart Gustav Fisher 99 106 Winsberg S e J Ramsay 1980 Monotonic transformations to additivity using splines Biometrika 67 669 674 Winsberg S e J Ramsay 1983 Monotone spline transformations for dimension reduction Psychometrika 48 575 595 Young F W J De Leeuw e Y Takane 1976 Regression with qualitative and quantitative variables An alternating least squares method with optimal scaling features Psychometrika 41 505 528 Capitolo Analisi Componenti principali categoriale L analisi componenti principali categoriale pu essere vista come un metodo di riduzione del numero delle dimensioni Un gruppo di variabili viene analizzato per rivelare le dimensioni principali della variazione L insieme di dati originale pu essere quindi sostituito da un insieme nuovo e di dimensioni inferiori con una minima perdita di informazioni Il metodo rivela le relazioni tra le variabili tra i casi e tra le variabili e i casi Il criterio utilizzato dall analisi componenti principali categoriale per la quantificazione dei dati osservati consiste nel fatto che i punteggi degl
195. ettagliate sulla sintassi vedere Command Syntax Reference Capitolo Analisi della correlazione canonica non lineare OVERALS L analisi della correlazione canonica non lineare corrisponde all analisi della correlazione canonica categoriale con scaling ottimale Questa procedura consente di determinare la correlazione tra insiemi simili di variabili categoriali conosciuta anche con l acronimo OVERALS L analisi della correlazione canonica standard un estensione della regressione multipla in cui il secondo insieme non contiene una sola variabile di risposta ma pi variabili di risposta L obiettivo quello di spiegare la maggior parte dei valori di varianza osservati nelle relazioni tra due insiemi di variabili numeriche in uno spazio dimensionale ridotto Le variabili di ciascun insieme vengono inizialmente combinate linearmente in modo che la correlazione tra le combinazioni lineari sia massima In base a tali combinazioni vengono determinate le combinazioni lineari successive non correlate con le precedenti e con la maggiore correlazione possibile L approccio di scaling ottimale consente di estendere l analisi standard in tre modi fondamentali Innanzitutto OVERALS consente di utilizzare pi di due insiemi di variabili In secondo luogo le variabili possono essere scalate come nominali ordinali o numeriche ed quindi possibile analizzare le relazioni non lineari tra le variabili Infine anzich massimizzare le
196. etti sono ampiamente distribuiti nello spazio Gli oggetti in ottone non possono essere differenziati rispetto agli oggetti non in ottone 261 Analisi corrispondenze multiple Omissione di valori anomali Nell analisi di omogeneit i valori anomali sono oggetti con un numero eccessivo di caratteristiche uniche Come notato in precedenza VITE pu essere considerato un valore anomalo Per eliminare questo oggetto ed eseguire di nuovo l analisi dai menu scegliere Dati Seleziona casi Figura 13 13 Finestra di dialogo Seleziona casi vat Seleziona casi Seleziona O Tutti i casi b Filettatura filetto amp Testa testa amp Fessura taglio Se la condizione soddisfatta di Purto puree amp Lunghezza lunghz O Campi La Mi Ottone ottone ampione casuale di casi amp Oggetto oggetto Campione Basato su intervallo di tempo o di casi Intervallo O Usa variabile filtro gt Output Eiltra casi non selezionati Copia casi selezionati in un nuovo insieme di dati Nome insieme di dati Elimina casi non selezionati Stato attuale non filtrare i casi gt Selezionare Se la condizione soddisfatta gt Fare clic su Se 262 Capitolo 13 Figura 13 14 Se la finestra di dialogo z Seleziona casi Se Filettatura Filet ggetto lt 16 Testa testa amp Fessura taglio amp Punta punta amp Lunghezza lung
197. ettimanali organizzate in modo che ogni caso corrisponda a un luogo separato Alcune delle variabili che cambiano settimanalmente non vengono riportate nei risultati le vendite registrate corrispondono ora alla somma delle vendite conseguite durante le quattro settimane dello studio tree_car sav File di dati ipotetici che contiene dati demografici e sul prezzo di acquisto dei veicoli tree_credit sav File di dati ipotetici che contiene dati demografici e sulla cronologia dei mutui di una banca tree_missing_data sav File di dati ipotetici che contiene dati demografici e sulla cronologia dei mutui di una banca con un numero elevato di valori mancanti tree_score_car sav File di dati ipotetici che contiene dati demografici e sul prezzo di acquisto dei veicoli tree_textdata sav File di dati semplice con due variabili destinato principalmente per mostrare lo stato predefinito delle variabili prima dell assegnazione dei livelli di misurazione e delle etichette dei valori 331 File di esempio tv survey sav File di dati ipotetici che prende in esame un sondaggio condotto da una emittente televisiva che deve stabilire se estendere la durata di un programma di successo A un campione di 906 intervistati stato chiesto se preferisce guardare il programma con diverse condizioni Ciascuna riga rappresenta un diverso intervistato e ciascuna colonna una diversa condizione ulcer_recurrence sav Questo file contiene informazioni parziali s
198. fescludi valori Modalit mestrutescludi valori Modalit calocibofescludi valori Modalit esag escludi valori Modalit vomito escludi valori Modalit purga escludi valori Modalit iperatt escludi valori Modalit Famigfescludi valori Modalit emanciescludi valori Modalit amicifescludi valori Modalit Variabili supplementari tempdiag escludi valori Modalit Strategia Escludi i valori mancanti per le correlazioni assegna dopo la quantificazione Modalit Categoria supplementare Assegna i valori mancanti Modalit Categoria supplementare O Escludi gli oggetti con valori mancanti per la variabile Strategia Specificare se si desidera escludere i valori mancanti trattamento passivo assegnare i valori mancanti trattamento attivo o escludere gli oggetti con valori mancanti eliminazione listwise m Escludi i valori mancanti per le correlazioni assegna dopo la quantificazione Gli oggetti con valori mancanti della variabile selezionata non vengono utilizzati nell analisi di questa variabile Se a tutte le variabili applicato il trattamento passivo gli oggetti con valori mancanti di tutte le variabili vengono considerati come supplementari Se nella finestra di dialogo Output sono specificate correlazioni dopo l analisi ai valori mancanti viene assegnata 33 Analisi delle componenti principali categoriale CATPCA la categoria o moda pi frequente della variab
199. fezione a Garanzia Soddisfatti o rimborsati come variabili indipendenti gt Fare clic su Grafici 96 Capitolo 9 Figura 9 2 Finestra di dialogo Grafici 1 Regressione lineare grafici gt Selezionare ZRESID come variabile dell asse y gt Selezionare ZPRED come variabile dell asse x gt Fare clic su Continua gt Nella finestra di dialogo Regressione lineare fare clic su Salva 97 Regressione categoriale Figura 9 3 Salva 2s Regressione lineare Salva Nome insieme di dati gt Selezionare Standardizzati nel gruppo Residui gt Fare clic su Continua gt Nella finestra di dialogo Regressione lineare scegliere OK 98 Capitolo 9 Riepilogo del modello Regressione output Figura 9 4 Riepilogo del modello per regressione lineare standard R quadrato Errore std Modello R quadrato corretto della stima a Stimatori Costante Residuo Standardizzato Soddisfatti o rimborsati Sigillo di garanzia Marca Prezzo Confezione L approccio standard per descrivere le relazioni nel problema corrente la regressione lineare La misura pi comune del grado di adattamento del modello di regressione ai dati R2 La statistica rappresenta la quantit di varianza nella risposta spiegata dalla combinazione ponderata dei predittori Maggiore sar l approssimazione di R2 a 1 maggiore sar l adattamento del modello Eseguendo la regressione di Preferenza sui cinque predittor
200. fficienti di regressione per ogni modello regolarizzato Se viene specificato un metodo di ricampionamento oppure vengono indicati degli oggetti supplementari casi di test viene visualizzato anche l errore di previsione o l errore MSE del test Ricampionamento I metodi di ricampionamento forniscono una stima dell errore di previsione del modello Convalida incrociata La convalida incrociata divide il campione in vari sottocampioni o campioni A questo punto vengono generati i modelli di regressione categoriale escludendo di volta in volta i dati da ciascun sottocampione Il primo modello si basa su tutti i casi eccetto quelli contenuti nel primo sottocampione il secondo modello si basa su tutti i casi eccetto quelli contenuti nel secondo sottocampione e cos via Il rischio di errore di previsione per ciascun modello viene stimato applicando il modello al sottocampione escluso al momento della generazione del modello stesso Bootstrap 632 Mediante bootstrap le osservazioni vengono derivate in modo casuale dai dati con sostituzione ripetendo questo processo pi volte in modo da ottenere una serie di campioni bootstrap Per ogni campione bootstrap viene adattato un modello che esegue la stima dell errore di previsione per ogni modello l errore di previsione viene quindi applicato ai casi che non fanno parte del campione bootstrap Quantificazioni di categoria Vengono visualizzate le tabelle che includono i valori trasformati d
201. fficienti di regressione Segni di coefficienti di regressione Criteri Le a insieme di dati Convergenza oo001 Max iterazioni 100 Etichetta i grafici in base a Etichette di variabili o di valori Lunghezza massima etichetta 20 O Nomi o valori di variabili Annulla Aiuto Oggetti supplementari Consente di specificare gli oggetti che si desidera considerare come supplementari Digitare il numero di un oggetto supplementare o indicare un intervallo di casi e fare clic su Aggiungi Non possibile ponderare oggetti supplementari i pesi specificati vengono ignorati Configurazione iniziale Se nessuna variabile viene considerata come nominale selezionare la configurazione Numerica Se almeno una variabile viene considerata come nominale selezionare la configurazione Casuale In alternativa se almeno una delle variabili ha un livello di scaling ordinale o spline ordinale l algoritmo adatto al modello utilizzato solitamente pu rivelarsi una soluzione non proprio ottimale La selezione di Inizi sistematici multipli con tutti i possibili modelli di segni da testare trover sempre la soluzione ottimale ma il tempo necessario per l elaborazione aumenta 21 Regressione categoriale CATREG rapidamente con l aumento delle variabili ordinali e spline ordinali nell insieme di dati Per ridurre il numero di modelli di test possibile specificare una soglia percentuale d
202. finestra di dialogo Grafici possibile specificare i grafici che si desidera creare Se il formato dei dati specificato diverso da Distanze in colonne la finestra di dialogo Grafici includer le opzioni riportate di seguito Per i grafici Peso dello spazio individuale Distanze originali con distanze trasformate e Distanze trasformate con distanze possibile specificare le sorgenti per cui devono essere creati i grafici I numeri delle sorgenti specificati devono essere valori della variabile sorgenti specificata nella finestra principale e devono essere compresi nell intervallo da 1 al numero delle sorgenti Figura 7 11 Finestra di dialogo Grafici versione 2 Scaling multidimensionale Grafici Grafici C Distanze originali con distanze trasformate C Distanze trasformate con distanze dual O Variabili indipendenti trasformate llo spazio individuale Correlazioni di variabili e dimensioni pes Scaling multidimensionale Output Nella finestra di dialogo Output possibile controllare la quantit di output visualizzata e salvarne una parte in file distinti 81 Scaling multidimensionale PROXSCAL Figura 7 12 Finestra di dialogo Output Scaling multidimensionale Output Visualizza Coordinate spazio comune Stress per inizi casuali Coordinate dello spazio individuale Cronologia delle iterazioni Pesi dello spazio individuale Misure diverse di stress C Distanze Scomposizione di
203. forma e quindi utilizzare la nuova variabile per etichettare il grafico In alternativa utilizzare la sintassi di comando Specificare il numero di dimensioni desiderato per la soluzione In genere si sceglie un numero di dimensioni sufficiente a spiegare la maggior parte della variazione Se l analisi implica pi di due dimensioni verranno creati grafici tridimensionali delle prime tre dimensioni Le altre dimensioni possono essere visualizzate modificando il grafico 44 Capitolo 4 Definisci intervallo e scala Figura 4 3 Finestra di dialogo Definisci intervallo e scala OVERALS Definisci intervallo e Minimo 1 Massimo 10 Scala di misurazione Ordinale Nominale multipla O Nominale singola Numerica discreta necessario definire un intervallo per ciascuna variabile Il valore massimo specificato deve essere un intero I valori frazionari vengono troncati nell analisi e i valori di categoria al di fuori dell intervallo specificato vengono ignorati Per ridurre al minimo l output utilizzare il comando Ricodifica automatica del menu Trasforma per creare categorie consecutive che iniziano con per le variabili considerate come nominali o ordinali La ricodifica in interi consecutivi sconsigliabile per le variabili scalate a livello numerico Per ridurre al minimo l output per le variabili considerate come numeriche sottrarre il valore minimo da ogni valore e aggiungere 1 E inoltre necessario s
204. g ottimale Le proporzioni nei grafici di scaling ottimale sono isotropiche In un grafico a due dimensioni la distanza che rappresenta un unit nella dimensione 1 uguale alla distanza che rappresenta un unit nella dimensione 2 Se si modifica l intervallo di una dimensione in un grafico a due dimensioni il sistema cambia le dimensioni dell altra dimensione per mantenere uguali le distanze fisiche Le proporzioni isotropiche non possono essere ignorate per le procedure di scaling ottimale Letture consigliate Per informazioni generali sulle tecniche di scaling ottimale vedere i seguenti testi Barlow R E D J Bartholomew D J Bremner e H D Brunk 1972 Statistical inference under order restrictions New York John Wiley and Sons Benz cri J P 1969 Statistical analysis as a tool to make patterns emerge from data In Methodologies of Pattern Recognition S Watanabe ed New York Academic Press 35 74 Bishop Y M S E Feinberg e P W Holland 1975 Discrete multivariate analysis Theory and practice Cambridge Mass MIT Press De Leeuw J 1984 The Gifi system of nonlinear multivariate analysis In Data Analysis and Informatics II E Diday et al ed 415 424 De Leeuw J 1990 Multivariate analysis with optimal scaling In Progress in Multivariate Analysis S Das Gupta e J Sethuraman ed Calcutta Indian Statistical Institute De Leeuw J e J Van Rijckevorsel 1980 HOMALS and PRINCALS
205. ggetti relativa al fatto che la seconda dimensione sembra dividere gli oggetti pi lunghi agli altri Rientro della testa e Forma della testa hanno valori relativamente ampi in entrambe le dimensioni a indicare una discriminazione della prima della seconda dimensione La variabile Ottone situata in una posizione molto vicino all origine non determina nessuna discriminazione nelle prime due dimensioni Questo ha senso in quanto tutti gli oggetti possono essere fatti di ottone o meno Quantificazioni di categoria Categories opzioni Visualizza Si ricordi che una discriminazione rappresenta la varianza della variabile quantificata in una particolare dimensione Il grafico delle misure di discriminazione include queste varianze a indicare quali variabili comportano una discriminazione e in quale dimensione Tuttavia la stessa varianza pu corrispondere a tutte le categorie distribuite in una posizione relativamente lontana o alla maggioranza delle categorie vicine tra loro con un numero limitato di categorie 257 Analisi corrispondenze multiple che differiscono da questo gruppo Il grafico di discriminazione non pu differenziare queste due condizioni I grafici delle quantificazioni di categoria offrono un metodo alternativo di visualizzazione della discriminazione tra le variabili in grado di identificare le relazioni tra categorie In questo grafico sono visualizzate le coordinate di ciascuna categoria in ciascuna dimensione Di con
206. gni sorgente Ci avviene solo se nella finestra di dialogo Modello specificato uno dei modelli delle differenze individuali m Grafici di trasformazione Vengono creati grafici a dispersione delle distanze originali rispetto alle distanze trasformate A seconda della modalit di applicazione delle trasformazioni a ogni riga o sorgente viene assegnato un diverso colore Una trasformazione non condizionale produce un singolo colore m Grafici Shepard Consente di confrontare le distanze originali con le distanze e le distanze trasformate Le distanze sono indicate da punti mentre le distanze trasformate sono indicate da una linea A seconda della modalit di applicazione delle trasformazioni per ogni riga o sorgente viene generata una linea distinta Una trasformazione non condizionale produce una linea m Grafico a dispersione dell adattamento Viene visualizzato un grafico a dispersione che confronta le distanze e le distanze trasformate Se si specificano pi sorgenti a ognuna di esse viene assegnato un diverso colore m Grafici dei residui Viene visualizzato un grafico a dispersione che confronta le distanze trasformate e i residui distanze trasformate meno le distanze Se si specificano pi sorgenti a ognuna di esse viene assegnato un diverso colore Stili degli oggetti riga Consente un maggiore controllo della visualizzazione degli oggetti riga nei grafici I valori delle variabili di colore facoltative consentono di utilizza
207. gnosi tempo dimensione 2 come variabile dell asse y e Quantificazione diagnosi tempo dimensione I come variabile dell asse x gt Scegliere di impostare il colore in base a Diagnosi paziente gt Fare clic su OK 173 Analisi Componenti principali categoriale Figura 10 42 Strutture dell andamento della malattia im Editor dei grafici OO ise XY AMP ALEZ CERE t i U i Ell Diagnosi sul paziente O anoressia nervosa QAnoressia con bulimia nervosa Bulimia nervosa dopo anoressia Disordine alimentare tipico gt Anoressia nervosa Anoressia con bulimia nervosa _ Bulimia nervosa dopo anoressia Disordine alimentare atipico o in 1 50 1 00 0 50 0 00 0 50 1 00 Time diagnosis interaction Quantification dimension 1 a 376 5 L 470 25 punti gt Quindi per collegare i punti fare doppio clic sul grafico e quindi fare clic sullo strumento Aggiungi linea di interpolazione nell Editor dei grafici gt Chiudere l Editor dei grafici 174 Capitolo 10 Figura 10 43 Strutture dell andamento della malattia Diagnosi sul paziente Oanoressia nervosa Anoressia con bulimia nervosa Bulimia nervosa dopo anoressia Disordine alimentare tipico Anoressia nervosa __ Anoressia con bulimia nervosa Bulimia nervosa dopo anoressia Disordine alimentare atipico Time diagnosis interaction Quantification dimension 2 1 50 1 00 0 50 0 00 0 50 1 00 Time diagnosis int
208. gorie l analisi delle corrispondenze considera le distribuzioni marginali nonch le singole frequenze di cella Essa calcola i profili di riga e di colonna che forniscono le proporzioni di riga e di colonna di ogni cella in base ai totali marginali Figura 12 9 Profili di riga normalizzazione simmetrica Categoria __No__ Leggero Medio Accanito_ Margine attivo 364 Dirigenti anziani 1273 Dirigenti giovani 389 Impiegati anziani i 235 Impiegati giovani 375 Segreteria o 280 Massa i 321 I profili di riga indicano la proporzione della categoria di riga in ogni categoria di colonna Ad esempio tra i quadri senior la maggioranza sono non fumatori e pochissimi forti fumatori Per contro tra i dirigenti junior la maggioranza sono fumatori medi e pochissimi fumatori leggeri I profili di colonna indicano la proporzione della colonna in ogni categoria di riga Ad esempio la maggioranza dei fumatori lievi sono quadri junior Analogamente la maggioranza dei fumatori medi e forti sono quadri junior Tenendo presente che il campione include un numero predominante di quadri junior non sorprendente che questa categoria di personale domini le categorie di tabagismo Figura 12 10 Profili di colonna Fumatore Categoria No Leggero Medio Accanito Massa Dirigenti anziani Dirigenti giovani Impiegati anziani Impiegati giovani Segreteria Margine attivo 221 Analisi corrispondenze La massa una misura che
209. gt Digitare mod casenum 1 4 1 come espressione numerica gt Fare clic su OK 179 Analisi Componenti principali categoriale Figura 10 48 Projected_centroids sav 15 demo sav InsiemeDati1 Editor dei dati ME File Modifica Visualizza Dati Trasforma Analizza Grafici Strumenti Finestra SHA HE oe wk A EE BRR gt DO e Tesi mana Coree Ainea Mere Property ID Nessuno Nessuno Destra Nominale Neighborhood Nessuno Nessuno Destra Nominale Township Nessuno Nessuno Destra Nominale County 1 Eastern Nessuno Destra Nominale Years since la Nessuno Nessuno Destra Scala Value at last a Nessuno Nessuno Destra Scala Probabilit di i Nessuno Nessuno Destra Peso di campi Nessuno Nessuno Destra Nominale Peso di campi Nessuno Nessuno Destra g Scala Probabilit di i Nessuno Nessuno Destra Peso di campi Nessuno Nessuno Destra ni Nominale 8 8 8 8 4 8 8 8 8 8 8 Nella Visualizzazione variabili modificare la misura di diagnosi da Scala to Nominale 180 Capitolo 10 Figura 10 49 Generatore di grafici W Generatore di grafici Variabili County c A Years sin L value atl Probabilit Peso dic L Peso dic Probabilit E Indice di E Ampiezza Peso dic v Ny Peso di campionamento cumul Categorie Nessuna categoria variabile di scala L anteprima dei grafici usa i dati di esempio Modelli Seleziona da
210. he le coordinate delle colonne seguano quelle delle righe Il sottocomando CONDITION specifica che tutte le distanze possono essere confrontate le une con le altre Tutto ci si applica alla nostra analisi poich possibile confrontare le distanze per comportamenti quali correre nel parco e correre in chiesa e stabilire quale comportamento pi appropriato Il sottocomando TRANSFORMATION specifica una trasformazione lineare delle distanze con intercetta Ci appropriato se la differenza pari a 1 punto nelle distanze equivalente su tutta la scala dei 10 punti In altre parole la trasformazione lineare appropriata se gli studenti hanno assegnato i punteggi in modo che la differenza tra 0 e 1 sia uguale alla differenza tra 5 e 6 Il sottocomando PLOT richiede 1 grafici per lo spazio comune e i grafici di trasformazione Tutti gli altri parametri vengono impostati sui valori predefiniti 314 Capitolo 15 Misure Figura 15 28 Misure Iterazioni 169 Valore finale della funzione 6427725 Parti dei valori della Parte dello stress 1900001 funzione Parte penalit 2 1745069 Cattivo adattamento Stress normalizzato 0361000 Stress di Kruskal 1900001 Stress Il di Kruskal 5224668 S stress di Young 2760971 S stress Il di Young 4525933 Bont dell adattamento Dispersione spiegata in based 9639000 Varianza spiegata in base 8082862 a Ordini delle preferenze recuperate Rho di Spearman 8981120 Tau b di K
211. hezza dell intervallo Fare clic su Cambia Fare clic su Continua vy vyv vy Vy vy y Nella finestra di dialogo Regressione categoriale fare clic su Grafici 133 Regressione categoriale Figura 9 53 Finestra di dialogo Grafici 1 Regressione categoriale grafici Grafici di trasformazione Grafici dei residui Annulla Aiuto gt Selezionare gda per i grafici di trasformazione gt Fare clic su Continua gt Nella finestra di dialogo Regressione categoriale scegliere OK Figura 9 54 Riepilogo del modello per regressione categoriale di Livello giornaliero di ozono su Giorno dell anno R quadrato R multiplo R quadrato corretto Patt a a Variabile dipendente ozon Stimatori doy La regressione con scaling ottimale tratta Livello giornaliero di ozono come numerico e Giorno dell anno come nominale Questo determina un R2 pari a 0 549 Sebbene solo il 55 della variazione di Livello giornaliero di ozono sia spiegata dalla regressione categoriale si tratta di un miglioramento significativo rispetto alla regressione originale La trasformazione di Giorno dell anno consente la previsione di Livello giornaliero di ozono 134 Capitolo 9 Figura 9 55 Grafico di trasformazione per Giorno dell anno nominale Quantificazioni o 1 2 123456749 Categorie La figura mostra il grafico di trasformazione per Giorno dell anno Gli estremi di Giorno dell
212. hz amp Ottone ottone amp Oggetto oggetto Gruppo di funzioni Tutto Aritmetiche CDF e CDF noncentrale Conversione Data Ora corrente Aritmetica data L x du Funzioni e variabili speciali a OHU WEIL Digitare oggetto 16 come condizione Fare clic su Continua Fare clic su OK nella finestra di dialogo Seleziona casi V v v y Infine richiamare la finestra di dialogo Analisi delle corrispondenze multiple e fare clic su OK Figura 13 15 Riepilogo del modello con valore anomalo rimosso Varianza spiegata Alfa di Totale Dimensione Cronbach autovalore di varianza 636 1347 491 a La media di Alfa di Cronbach basata sulla media dell autovalore Gli autovalori si modificano leggermente La prima dimensione spiega ora una porzione leggermente superiore della varianza 263 Analisi corrispondenze multiple Figura 13 16 Misure di discriminazione 10 08 Lunghezza 0 6 04 Dimensione 2 0 2 00 0 0 0 2 0 4 0 6 08 10 Dimensione 1 Come indicato nel grafico di discriminazione Rientro della testa non comporta pi una discriminazione nella seconda dimensione mentre Ottone passa da nessuna discriminazione in tutte le dimensioni a una discriminazione nella seconda La discriminazione per le altre variabili resta fondamentalmente invariata Figura 13 17 Punteggi degli oggetti etichettati in base a Ottone con valor
213. i colonna come variabili di ordinamento Se i punteggi di riga e di colonna sono presenti in p dimensioni possibile creare p tabelle permutate Quando il primo valore singolare ampio la prima tabella mostrer una struttura particolare con frequenze relative maggiori del previsto vicine alla diagonale La seguente tabella mostra la permutazione della tabella di corrispondenza lungo la prima dimensione Esaminando i punteggi di riga per la dimensione 1 possibile vedere che la classificazione da minimo a massimo la seguente quadri senior 0 728 personale di segreteria 0 385 dirigenti senior 0 126 quadri junior 0 446 e dirigenti junior 0 495 Esaminando i punteggi di colonna per la dimensione 1 possibile vedere che la classificazione nessuno lieve medio e forte Queste classificazioni si riflettono nell ordinamento delle righe e delle colonne nella tabella 224 Capitolo 12 Figura 12 13 Permutazione della tabella di corrispondenza Fumatore Categoria No Leggero Medio Accanito Margine attivo Impiegati anziani 10 12 Segreteria Dirigenti anziani Impiegati giovani Dirigenti giovani Margine attivo Statistiche di confidenza Supponendo che la tabella da analizzare sia una tabella di frequenza e che i dati siano un campione casuale da una popolazione sconosciuta le frequenze di cella seguiranno una distribuzione multinomiale A partire da questo possibile calcolare la deviazione
214. i consultare i seguenti testi Busing F T A P F Groenen e W J Heiser 2005 Avoiding degeneracy in multidimensional unfolding by penalizing on the coefficient of variation Psychometrika 70 71 98 Green P E e V Rao 1972 Applied multidimensional scaling Hinsdale Ill Dryden Press Price R e L Bouffard 1974 Behavioral appropriateness and situational constraints as dimensions of social behavior Journal of Personality and Social Psychology 30 579 586 Appendice A File di esempio Il file di esempio installato con il prodotto si trova nella sottodirectory Samples della directory di installazione La sottodirectory Samples contiene cartelle separate per ciascuna delle seguenti lingue Inglese Francese Tedesco Italiano Giapponese Coreano Polacco Russo Cinese semplificato Spagnolo e Cinese tradizionale Non tutti i file di esempio sono disponibili in tutte le lingue Se un file di esempio non disponibile in una lingua la cartella di tale lingua contiene una versione inglese del file Descrizioni Questa sezione contiene brevi descrizioni dei file di esempio utilizzati negli esempi riportati in tutta la documentazione accidents sav File di dati ipotetici che prende in esame una compagnia di assicurazioni impegnata nello studio dei fattori di rischio correlati all et e al sesso per gli incidenti automobilistici che si verificano in una determinata regione Ciascun caso corrisponde a una
215. i 481 Valore finale della funzione 8199642 Parti dei valori della Parte dello stress 3680994 funzione Parte penalit 1 8265211 Cattivo adattamento Stress normalizzato 1335343 Stress di Kruskal 13654234 Stress Il di Kruskal 9780824 S stress di Young 4938016 S stress Il di Young 6912352 Bont dell adattamento Dispersione spiegata in pasas 8664657 ERIS spiegata in base 5024953 Ordini delle preferenze recuperate 7025921 Rho di Spearman 6271702 Tau b di Kendall 4991188 Coefficienti di variazione Vicinanze delle variazioni 5590170 Vicinanze trasformate delle variazioni 6378878 Distanze delle variazioni 4484515 Indici di degenerazione Somma dei quadrati degli indici di amalgamazione di 2199287 DeSarbo Indice di non degenerazione approssimativo di Shepard STBAABAA L algoritmo converge dopo 481 interazioni con uno stress penalizzato finale pari a 0 8199642 I coefficienti di variazione e l indice di Shepard sono sufficientemente grandi e gli indici di DeSarbo sono sufficientemente piccoli ad indicare che non ci sono problemi di degenerazione 298 Capitolo 15 Spazio comune Figura 15 13 Grafico congiunto dello spazio comune N gt Dolcetto alla marmellata 20 Di 26 2 7 i pane dolce e REA 10 5 909800 0850 o 8 1739 3 15 O Pasticcini danesi 35 290 Dolcetto glassato 280 135 31 022 16923 Totaal caff 4 o Dolcetto mirtilli e margarina 036 da 24 27 941 Toastburro e marmellata 21
216. i categorie 4 Distribuzione Normale O Uniforme O Intervalli uguali Annulla Aiuto Metodo Scegliere un metodo di raggruppamento di classificazione o di moltiplicazione m Raggruppamento Ricodifica in un numero specificato di categorie o ricodifica per intervallo m Classificazione La variabile viene discretizzata tramite la classificazione dei casi Moltiplicazione I valori correnti della variabile vengono standardizzati moltiplicati per 10 arrotondati e viene aggiunta una costante in modo tale che il valore discretizzato minore sia uguale a 1 32 Capitolo 3 Raggruppamento Per la discretizzazione delle variabili tramite raggruppamento sono disponibili le seguenti opzioni m Numero di categorie Specificare un numero di categorie e se la distribuzione dei valori della variabile nelle categorie deve essere normale o uniforme m Intervalliuguali Le variabili vengono ricodificate in categorie definite in base agli intervalli di dimensioni uguali specificati E necessario specificare la lunghezza degli intervalli Componenti principali categoriale Valori mancanti Nella finestra di dialogo Valori mancanti possibile scegliere la strategia di gestione dei valori mancanti delle variabili dell analisi e delle variabili supplementari Figura 3 5 Finestra di dialogo Valori mancanti x Componenti principali categoriale Valori mancanti Strategia per i valori mancanti Variabili di analisi peso
217. i cui uno contiene solo la variabile dipendente In quest ultimo caso la similarit degli insiemi deriva dal confronto di ciascun insieme con una variabile sconosciuta compresa in un qualsiasi punto all interno di tutti gli insiemi Nella regressione categoriale la similarit della risposta trasformata e la combinazione lineare dei predittori trasformati vengono valutate direttamente Relazione con le tecniche standard Nella regressione lineare standard le variabili categoriali possono essere ricodificate come variabili indicatore oppure considerate come variabili a livello di intervallo Nel primo caso il modello include un intercetta e una inclinazione separate per ciascuna combinazione di livelli delle variabili categoriali Questo determina un numero elevato di parametri da interpretare Nel secondo caso per ciascuna variabile viene stimato solo un parametro Tuttavia la natura arbitraria delle codifiche di categoria rende impossibile generalizzare Se alcune delle variabili non sono continue possibile utilizzare analisi alternative Se la risposta continua e i predittori sono categoriali viene spesso utilizzata l analisi della varianza Se la risposta categoriale e i predittori sono continui pu essere adatta la regressione logistica o l analisi discriminante Se la risposta e i predittori sono entrambi categoriali vengono spesso utilizzati il modelli loglineari La regressione con scaling ottimale offre tre livelli
218. i dati ipotetici corrisponde al file di dati grocery_coupons sav con gli acquisti settimanali organizzati in modo che ogni caso corrisponda a un cliente separato Alcune delle variabili che cambiano settimanalmente non vengono riportate nei risultati l importo speso registrato corrisponde ora alla somma degli importi spesi durante le quattro settimane dello studio grocery_coupons sav File di dati ipotetici che contiene i dati sui sondaggi raccolti da una catena di drogherie interessata alle abitudini di acquisto dei suoi clienti Ciascun cliente viene seguito per quattro settimane e ciascun caso corrisponde a una settimana per cliente con informazioni sul luogo degli acquisti e i tipi di acquisti incluso l importo speso nelle drogherie durante la settimana guttman sav Bell Bell 1961 ha presentato una tabella per illustrare i possibili gruppi sociali Guttman Guttman 1968 ha utilizzato una parte di tale tabella in cui cinque variabili che descrivono elementi come l interazione sociale i sentimenti di appartenenza a un gruppo la vicinanza fisica dei membri e il grado di formalit della relazione sono state incrociate con cinque gruppi sociali teorici compresi folla ad esempio le persone presenti a una partita di calcio uditorio ad esempio di uno spettacolo teatrale o di una lezione universitaria pubblico ad esempio televisivo calca come una folla ma con un interazione molto maggiore gruppi primari intimi gruppi se
219. i e il rapporto non lineare tra Preferenza e Design confezione suggerisce che la regressione su punteggi ottimali possa offrire prestazioni migliori di quella standard La forma a U dei grafici dei residui indica che consigliato l utilizzo di un trattamento nominale di Design confezione Tutti gli altri predittori saranno trattati a livello di scaling numerico La variabile di risposta merita una considerazione speciale Poich si desidera prevedere i valori di Preferenze consigliabile recuperare il maggior numero possibile di propriet delle relative categorie nelle quantificazioni Utilizzando un livello di scaling nominale o ordinale le differenze tra le categorie di risposta vengono ignorate Tuttavia la trasformazione lineare delle categorie di risposta conserva le differenze tra le categorie Di conseguenza lo scaling numerico delle risposte generalmente preferibile e sar utilizzato in questo caso 102 Capitolo 9 Esecuzione dell analisi gt Per eseguire un analisi di regressione categoriale dai menu scegliere Analizza Regressione Scaling ottimale CATREG Figura 9 9 Finestra di dialogo Regressione categoriale z Regressione categoriale Variabile dipendente i 7 mara m Discretizza Standardized Residual pref Spline ordinale 2 2 a Variabili indipendenti Opzioni Regolarizzazione Output Salva Definisci scala gt Selezionare Preferenza come varia
220. i modelli sono equivalenti al modello di identit e pertanto l analisi predefinita il modello di identit Procedure correlate Lo scaling di tutte le variabili a livello numerico corrisponde all analisi dello scaling multidimensionale standard 68 69 Scaling multidimensionale PROXSCAL Per ottenere un analisi Scaling multidimensionale gt Dai menu scegliere Analizza Scala Scaling multidimensionale PROXSCAL Verra visualizzata la finestra di dialogo Formato dati Figura 7 1 Finestra di dialogo Formato dati a Scaling multidimensionale Formato dati Formato dei dati Numero di sorgenti I dati sono distanze O Una matrice O Crea distanze dai dati Pi matrici Una sorgente Pi sorgenti Le distanze sono in matrici impilate per colonne Annulla Aiuto gt Specificare il formato dei dati Formato dati Specificare se i dati sono misure di distanza o se si desidera creare distanze dai dati Numero di sorgenti Se i dati sono distanze specificare se si dispone di una sorgente singola o di sorgenti multiple per le misure di similarit Una sorgente Se esiste una sorgente delle distanze specificare se il formato dell insieme dei dati include le distanze in una matrice per colonne o in una singola colonna con due variabili distinte per l identificazione della riga e della colonna di ciascuna distanza m Le distanze sono in una matrice per colonne La matrice delle distanze dist
221. i oggetti punteggi dei componenti abbiano correlazioni elevate con ciascuna delle variabili quantificate Una soluzione valida nella misura in cui tale criterio viene soddisfatto Verranno illustrati due esempi di analisi componenti principali categoriale Il primo utilizza un insieme di dati piuttosto piccolo utile per illustrare i concetti e le interpretazioni di base associati alla procedura Il secondo esempio esamina un applicazione pratica Esempio Esame delle interrelazioni tra sistemi sociali L esempio esamina l adattamento di Guttman Guttman 1968 di una tabella di Bell Bell 1961 I dati vengono anche discussi da Lingoes Lingoes 1968 Bell ha presentato una tabella per illustrare i possibili gruppi sociali Guttman ha utilizzato un parte di tale tabella in cui cinque variabili che descrivono elementi come l interazione sociale i sentimenti di appartenenza a un gruppo la vicinanza fisica dei membri e il grado di formalit della relazione sono state incrociate con cinque gruppi sociali teorici compresi folla ad esempio le persone presenti a una partita di calcio uditorio ad esempio di uno spettacolo teatrale o di una lezione universitaria pubblico ad esempio televisivo calca come una folla ma con un interazione molto maggiore gruppi primari intimi gruppi secondari volontari e la comunit moderna unione non stretta derivante da una vicinanza fisica elevata e dall esigenza di servizi specializza
222. i perdita di varianza dove l incremento della soglia comporta l aumento dei modelli di segni che verranno esclusi Questa opzione non garantisce la soluzione ottimale ma diminuisce la possibilit di ottenere una soluzione non ottimale Inoltre se non viene trovata la soluzione ottimale diminuiscono le possibilit che la soluzione non ottimale sia significativamente diversa dalla soluzione ottimale Quando sono richiesti gli inizi sistematici multipli i segni dei coefficienti di regressione per ogni avvio vengono scritti in un file di dati SPSS Statistics esterno o in un insieme di dati della sessione corrente Per ulteriori informazioni vedere Regressione categoriale Salva a pag 25 I risultati di un esecuzione precedente con inizi sistematici multipli consentono di Usare segni fissi per i coefficienti di regressione I segni indicati da 1 e 1 devono essere in una riga dell insieme di dati o file specificato Il numero iniziale intero il numero del caso della riga di questo file che contiene i segni da utilizzare Criteri possibile specificare il numero massimo di iterazioni che possono essere eseguite dalla regressione durante i calcoli e inoltre selezionare un valore per il criterio di convergenza La procedura si interrompe se la differenza dell adattamento totale delle due ultime iterazioni inferiore al valore di convergenza o se viene raggiunto il numero massimo di iterazioni Etichetta i grafici in base a Consen
223. i quantificati I grafici dei punteggi delle componenti rivelano modelli tra gli oggetti nell analisi e possono segnalare oggetti anomali nei dati La soluzione di un analisi delle componenti principali categoriale massimizza le correlazioni dei punteggi degli oggetti con ciascuna delle variabili quantificate per il numero delle componenti dimensioni specificate Un applicazione importante di questa analisi l esame dei dati relativi alle preferenze in cui i rispondenti classificano o valutano un numero di item in ordine di preferenza Nella normale configurazione dei dati SPSS Statistics le righe sono valori individuali le colonne misure per gli item e i punteggi tra le righe i punteggi di preferenza ad esempio su una scala da 0 a 10 di conseguenza i dati sono condizionali per le righe Per i dati di preferenza possibile considerare i valori individuali come variabili Utilizzando la procedura Trasponi possibile trasporre i dati I predittori diventano le variabili e tutte le variabili sono dichiarate ordinali Non esistono controindicazioni all utilizzo di pi variabili che oggetti in CATPCA Relazione con altre procedure di Categories Se tutte le variabili vengono dichiarate nominali multiple l analisi dei componenti principali categoriale genera un analisi equivalente a un analisi delle corrispondenze multiple eseguita sulle stesse variabili Di conseguenza l analisi delle componenti principali categoriale pu e
224. i si ottiene un R2 pari a 0 707 a indicare che circa il 71 della varianza delle classificazioni di preferenza spiegata dalle variabili predittore nella regressione lineare Coefficienti I coefficienti standardizzati sono indicati nella tabella Il segno del coefficiente indica se la risposta prevista aumenta o diminuisce quando il predittore aumenta restando costanti tutti gli altri Per i dati categoriali la codificazione della categoria determina il significato dell aumento di un predittore Ad esempio un aumento di Garanzia Soddisfatti o rimborsati Design confezione o Marchio di qualit determiner una riduzione della classificazione della preferenza prevista La codifica di Garanzia Soddisfatti o rimborsati 1 per nessuna garanzia e 2 per garanzia presente Un aumento di Garanzia Soddisfatti o rimborsati corrisponde all aggiunta di una garanzia Di conseguenza l aggiunta di una garanzia Soddisfatti o rimborsati riduce la classificazione della preferenza prevista che corrisponde a una preferenza prevista maggiore Figura 9 5 Coefficienti di regressione Coefficienti non Coefficienti ET izzati standardizzati Modell Costante Confezione Marca Prezzo Sigillo di garanzia Soddisfatti o rimborsati Il valore del coefficiente riflette la variazione nella classificazione della preferenza prevista Utilizzando i coefficienti standardizzati le interpretazioni si basano sulle deviazioni standar
225. i sullo spazio comune impostare criteri di convergenza specificare la configurazione iniziale che dovr essere utilizzata e scegliere i grafici e l output 72 Capitolo 7 Distanze in una sola colonna Se nella finestra di dialogo Formato dati si seleziona il modello a una colonna per una sorgente o per pi sorgenti verr visualizzata la seguente finestra principale Figura 7 4 Finestra di dialogo Distanze in una sola colonna 2 Scaling multidimensionale Distanze in una sola colonna Distanze eRe Modello Vincoli Righe L rid Opzioni Colonne Grafici E cid Sorgenti Pesi Incolla Reimposta Annulla Aiuto Selezionare una variabile delle distanze che si assume sia costituita da una o pi matrici delle distanze Selezionare una variabile di riga per definire le posizioni delle righe per le distanze contenute nella variabile di distanza Selezionare una variabile di colonna per definire le posizioni delle colonne per le distanze contenute nella variabile di distanza Se sono disponibili pi sorgenti selezionare una variabile di sorgenti Le celle della matrice delle distanze di ciascuna sorgente che non vengono designate come righe o colonne verranno considerate come mancanti Se necessario selezionare una variabile di ponderazione E inoltre possibile definire un modello di scaling multidimensionale assegnare vincoli sullo sp
226. iabile di riga sono simili quali categorie della variabile di colonna sono simili e quali categorie di riga e di colonna sono simili tra loro Relazione con altre procedure di Categories L analisi delle corrispondenze semplice limitata a tabelle a due vie Se le variabili di interesse sono pi di due possibile combinarle per creare variabili di interazione Ad esempio per le variabili regione lavoro ed et possibile combinare regione e lavoro per creare una nuova variabile relav inclusiva delle 12 categorie illustrate nella tabella seguente La nuova variabile forma una tabella a due vie con et 12 righe 4 colonne che pu essere analizzata tramite analisi delle corrispondenze Tabella 1 4 Combinazioni di regione e lavoro Codice categoria Definizione categoria Codice categoria Definizione categoria 1 Nord stagista f Est stagista 2 Nord commerciale 8 Est commerciale 3 Nord manager 9 Est manager 4 Sud stagista 10 Ovest stagista 5 Sud commerciale 11 Ovest commerciale 6 Sud manager 12 Ovest manager Uno svantaggio di questo approccio rappresentato dal fatto che ciascuna coppia di variabili pu essere combinata possibile combinare avoro ed et generando un altra variabile a 12 categorie Oppure possibile combinare regione ed et generando una nuova variabile a 16 categorie Ciascuna di queste variabili di interazione forma una tabella a due vie con la variabil
227. iabili sono in genere quantitative e i dati categoriali nominali vengono ricodificati in variabili binarie o di contrasto Di conseguenza le variabili categoriali consentono di distinguere i gruppi di casi e le stime della tecnica consentono di distinguere gli insiemi di parametri per ciascun gruppo I coefficienti stimati riflettono il modo in cui le modifiche dei predittori influiscono sulla risposta possibile stimare la risposta per qualsiasi combinazione di valori dei predittori Un approccio alternativo consiste nell analisi della regressione della risposta rispetto ai valori stessi dei predittori categoriali Per ciascuna variabile viene pertanto stimato un singolo coefficiente I valori di categoria delle variabili categoriali sono tuttavia arbitrari Se le categorie vengono codificate in modi diversi anche i coefficienti saranno diversi e i confronti tra analisi delle stesse variabili risulteranno difficoltosi La procedura CATREG consente di ampliare l approccio standard poich applica lo scaling simultaneamente alle variabili nominali ordinali e numeriche Questa procedura quantifica le variabili categoriali in modo tale che le quantificazioni riflettano le caratteristiche delle categorie originali e considera le variabili categoriali quantificate allo stesso modo delle variabili numeriche L utilizzo delle trasformazioni non lineari consente di analizzare le variabili in una gamma di livelli diversi e di individuare pertanto il mod
228. iabili vincolo colonne Leggi variabili da Il numero deve corrispondere alla dimensionalit di modello massima attualmente 2 Disponibili Selezionate Annulla Aiuto 87 Unfolding multidimensionale PREFSCAL Vincoli sullo spazio comune E possibile scegliere di definire le coordinate degli oggetti riga e o colonna nello spazio comune Variabili vincolo di riga colonna Scegliere il file che contiene i vincoli e selezionare le variabili che definiscono i vincoli nello spazio comune La prima variabile selezionata contiene le coordinate degli oggetti della prima dimensione mentre la seconda corrisponde alle coordinate della seconda dimensione e cos via Un valore mancante indica che una coordinata su una dimensione libera Il numero di variabili selezionate deve essere uguale al numero massimo di dimensioni richiesto Il numero dei casi di ciascuna variabile deve essere uguale al numero degli oggetti Opzioni di unfolding multidimensionale Nella finestra di dialogo Opzioni possibile selezionare lo stile di configurazione iniziale specificare i criteri di iterazione e di convergenza e impostare il termine di penalit per stress Figura 8 4 Finestra di dialogo Opzioni Unfolding multidimensionale opzioni Configurazione iniziale Criteri di iterazione Classica Convergenza stress oooodt Assegnazione per v O Ross Cliff Stress minimo Max iterazioni Corrisponde
229. iante il sottocomando NOBSERVATIONS m Specificare i nomi di radice per le variabili create salvando i punteggi degli oggetti mediante il sottocomando SAVE m Specificare il numero di dimensioni da salvare evitando quindi di salvare tutte le dimensioni estratte mediante il sottocomando SAVE m Scrivere le quantificazioni di categoria in un file matrice mediante il sottocomando MATRIX m Creare graficia bassa risoluzione e pi facili da leggere rispetto ai grafici ad alta risoluzione mediante il comando SET m Creare grafici dei centroidi e delle trasformazioni unicamente per le variabili selezionate con il sottocomando PLOT Per informazioni dettagliate sulla sintassi vedere Command Syntax Reference Capitolo Analisi corrispondenze Uno degli obiettivi dell analisi delle corrispondenze descrivere le relazioni esistenti tra due variabili nominali di una tabella di corrispondenza in uno spazio dimensionale ridotto e al tempo stesso descrivere le relazioni tra le categorie di ciascuna variabile Per ciascuna variabile le distanze tra i punti delle categorie riportati in un grafico riflettono le relazioni tra le categorie e le categorie simili vengono inserite nel grafico una accanto all altra La relazione tra le variabili viene descritta dalla proiezione dei punti di una variabile sul vettore dall origine a un punto di categoria dell altra variabile L analisi delle tavole di contingenza spesso include lo st
230. icata da ogni dimensione Gli autovalori si aggiungono all adattamento totale Peri dati di Verdegaal 0 801 1 536 52 dell adattamento effettivo viene spiegato dalla prima dimensione Il valore di adattamento massimo pari al numero delle dimensioni e se ottenuto indica che la relazione perfetta Il valore di perdita media negli insiemi e nelle dimensioni indica la differenza tra l adattamento massimo e quello reale L adattamento pi la perdita media pari al numero delle dimensioni Una similarit perfetta si verifica raramente e in genere riguarda aspetti trascurabili dei dati Un altra statistica diffusa relativa a due insiemi di variabili la correlazione canonica Poich la correlazione canonica correlata all autovalore e di conseguenza non fornisce informazioni aggiuntive non viene inclusa nell output dell analisi della correlazione canonica non lineare Per due insiemi di variabili la correlazione canonica per dimensione si ottiene dalla seguente formula pda 2X Ea 1 dove d il numero delle dimensioni e l autovalore E possibile generalizzare la correlazione canonica per pi di due insiemi attraverso la seguente formula pa K x Ea 1 K 1 dove d il numero delle dimensioni K il numero degli insiemi ed l autovalore Nell esempio 197 Analisi della correlazione canonica non lineare OVERALS p 3 x 0 801 1 2 0 702 p2 3 x 0 735 1 2 0
231. icazione minima quelle alle estremit elevati valori positivi Figura 11 29 Grafico di trasformazione per Preferenze vicinato et nominale 1 0 Quantificazioni di categoria per Preferenze abitative n Grande citt Piccola citt Campagna Preferenze abitative 209 Analisi della correlazione canonica non lineare OVERALS Nel grafico di trasformazione per Giornale letto pitt spesso viene rilevata una variazione In precedenza era presente un trend crescente nelle quantificazioni che poteva suggerire un trattamento ordinale per questa variabile Tuttavia il trattamento di Et in anni come nominale rimuove tale trend dalle quantificazioni relative a giornale Figura 11 30 Grafico di trasformazione per Giornale letto pi spesso nominale 0 5 00 Quantificazioni di categoria per Quotidiani letti pi spesso Nessuno Gazzetta Voce FT Altro Quotidiani letti pi spesso 210 Capitolo 11 Quello visualizzato il grafico dei centroidi per Et in anni Si noti che le categorie non hanno ordine cronologico lungo la linea che congiunge i centroidi proiettati Il gruppo 20 25 si trova nella parte centrale invece che alla fine La distribuzione delle categorie molto migliorata rispetto alla controparte ordinale illustrata in precedenza Figura 11 31 Centroidi e centroidi proiettati per Et in anni nominale 10 66 70 66 70 Centroids 861 65 O Actual o 20 25 O Projected 0 5 o 61 65
232. ids sav come nome del file Fare clic su Opzioni 154 Capitolo 10 Figura 10 19 Finestra di dialogo Opzioni lt 8 SGO Opzioni Fes MM ormato Dimensione gt Selezionare File di dati SPSS Statistics come formato dell output gt Digitare NumeroTabella_1 come variabile di numero di tabella gt Fare clic su Continua 155 Analisi Componenti principali categoriale Figura 10 20 Pannello di controllo sistema di gestione dell output annello di controllo sistema di gestione dell output Comandi So Etichette e CATPCA cted Centroids projected_centroi E e Grafici Case Plot Registri Cases to Variables Descriptive Statistics Iteration History Model Summary Notes Object Scores Projected Centroids Quantifications Variance Accounted For gt Fare clic su Aggiungi gt Fare clic su OK e quindi di nuovo su OK per confermare la sessione SGO Il Sistema di gestione dell output ora impostato per scrivere i risultati della tabella dei centroidi proiettati nel file projected_centroids sav gt Per generare il risultato dei componenti principali categoriale per questo insieme di dati dai menu scegliere Analizza Riduzione dimensionale Scaling ottimale 156 Capitolo 10 Figura 10 21 Finestra di dialogo Scaling ottimale 8 Scaling ottimale gt Selezionare Una o pi variabili non nominali multiple nel gruppo Livello di scaling ottimale gt Far
233. ie Variabili etichetta tempo Statistiche descrittive tempo diagn diagn numero numero Etichetta in base a Annulla Aiuto Punteggi degli oggetti Visualizza i punteggi degli oggetti e include le seguenti opzioni m Includi categorie Visualizza gli indicatori di categoria per le variabili dell analisi selezionate m Etichetta in base a Per etichettare gli oggetti possibile selezionare una variabile dall elenco di variabili etichetta Pesi di componente Visualizza pesi di componente per tutte le variabili a cui non sono stati assegnati livelli di scaling nominale multipli Cronologia iterazioni Visualizza la varianza spiegata la perdita e l aumento della varianza spiegata per ciascuna iterazione Correlazioni delle variabili originali Visualizza la matrice di correlazione delle variabili originali e gli autovalori di tale matrice Correlazioni delle variabili trasformate Visualizza la matrice di correlazione delle variabili trasformate con scaling ottimale e gli autovalori di tale matrice Varianza spiegata Visualizza l entit della varianza spiegata in base alle coordinate del centroide alle coordinate del vettore e al totale combinazione delle coordinate del centroide e del vettore per variabile e per dimensione Quantificazioni di categoria Fornisce le quantificazioni di categoria e le coordinate per ciascuna dimensione delle variabili selezionate Stat
234. ie codificate da 1 a 3 la categoria manager verr considerata mancante Poich nessuna categoria stata effettivamente codificata con il numero 3 la terza 5 Introduzione alle procedure di scaling ottimale per i dati categoriali categoria nell analisi non contiene nessun caso Questa analisi sarebbe appropriata per omettere tutte le categorie manager Tuttavia per includere i manager necessario definire la categoria massima uguale a 7 e codificare i valori mancanti con valori superiori a 7 o inferiori a 1 Per le variabili considerate come nominali o ordinali l intervallo delle categorie non influisce sui risultati Per le variabili nominali a essere significativa solo l etichetta non il valore a essa associato Per le variabili ordinali l ordine delle categorie viene mantenuto nelle quantificazioni i valori di categoria non sono significativi Tutti gli schemi di codifica risultanti nello stesso ordine di categoria avranno risultati identici Ad esempio i primi tre schemi nella tabella sono equivalenti da un punto di vista funzionale se lavoro viene analizzato a livello ordinale L ordine delle categorie identico in questi schemi Nello schema D invece la seconda e la terza categoria vengono invertite e i risultati generati sono diversi rispetto agli altri schemi Sebbene molti schemi di codifica per una variabile siano equivalenti da un punto di vista funzionale schemi con piccole differenze tra i codici sono pr
235. il grafico congiunto dello spazio comune 305 Unfolding multidimensionale Spazio comune Figura 15 20 Grafico congiunto dello spazio comune per la configurazione iniziale della corrispondenza Toast alla cannella e Pane integrale imburrato Panino dolce con margarinao Dolcetto mirtilli e margarina C gona al caff 300 x asticciy SIE O do 0980 LS cia 143 17 13 4 279 031 24 29 190 Oo A 40 3 37 320 O o Toast imburrato Toast burro e marmellata o ert 2 O Toast con masayyynourrato lo o Toast con margarina o Toast Dimensione 2 Dimensione 1 Il grafico congiunto dello spazio comune mostra una configurazione finale che simile a quella risultante dall analisi eseguita con la configurazione iniziale tradizionale di Spearman Tuttavia gli oggetti colonna alimenti consumati a colazione appaiono posizionati intorno agli oggetti riga individui anzich essere distribuiti 306 Capitolo 15 Spazi individuali Figura 15 21 Pesi di dimensioni per la configurazione iniziale della corrispondenza Dimensione 1 2 Specificit Sorgente 279 636 263 389 381 552 Importanza La specificit indica la tipicit di una sorgente Il range della specificit compreso tra zero e uno dove zero indica una sorgente media con pesi di dimensioni identici e uno indica una sorgente molto specifica con un peso di dimensione eccezionale e altri pesi vicini a zer
236. ile di dati ipotetici che prende in esame la paga oraria degli infermieri occupati presso uffici e ospedali e in base ai diversi livelli di esperienza insure sav File di dati ipotetici che prende in esame una compagnia di assicurazioni impegnata nello studio dei fattori di rischio che indicano l eventualit che un cliente presenti una domanda di indennizzo in un contratto assicurativo sulla vita della durata di dieci anni Ogni caso nel file di dati rappresenta una coppia di contratti In un contratto sono contenute informazioni su una richiesta di risarcimento l altro sull et e sul sesso judges sav File di dati ipotetici che prende in esame il punteggio assegnato da giurie qualificate pi un appassionato a 300 prestazioni sportive Ciascuna riga rappresenta una diversa prestazione i giudici hanno esaminato le stesse prestazioni kinship_dat sav Rosenberg e Kim Rosenberg e Kim 1975 si prefiggono di analizzare 15 termini indicanti parentela zia fratello cugino padre nipote femmina di nonni nonno nonna nipote maschio di nonni madre nipote maschio di zii nipote femmina di zii sorella figlio zio Hanno richiesto a quattro gruppi di studenti universitari due composti da femmine e due da maschi di ordinare questi termini in base alla similiarit A due gruppi uno femminile e uno maschile stato richiesto di effettuare l ordinamento due volte con il secondo ordinamento basato su un criterio diverso rispetto al
237. ile per le correlazioni delle variabili originali Per le correlazioni delle variabili scalate in modo ottimale possibile scegliere il metodo di assegnazione Selezionare Moda per sostituire i valori mancanti con la moda della variabile scalata in modo ottimale Selezionare Categoria distinta per sostituire 1 valori mancanti con la quantificazione di una categoria supplementare Ci implica che gli oggetti con un valore mancante nella variabile specificata vengono considerati come appartenenti alla stessa categoria supplementare m Assegnaivalori mancanti Agli oggetti con valori mancanti della variabile selezionata vengono assegnati 1 valori ed possibile scegliere il metodo di assegnazione Selezionare Moda per sostituire i valori mancanti con la categoria pi frequente Se sono disponibili pi mode verr utilizzata quella con l indicatore di categoria minore Selezionare Categoria distinta per sostituire i valori mancanti con la stessa quantificazione di una categoria supplementare Ci implica che gli oggetti con un valore mancante nella variabile specificata vengono considerati come appartenenti alla stessa categoria supplementare m Escludi gli oggetti con valori mancanti per la variabile Gli oggetti con valori mancanti della variabile selezionata sono esclusi dall analisi Questa strategia non disponibile per le variabili supplementari Componenti principali categoriale Opzioni Nella finestra di dialogo Opzioni possibil
238. ili Selezionate Includi purga O Tutte le variabili iperatt famig emanc amici scuola attsess compsess umore preocc Variabili selezionate Includi centroidi Annulla Aiuto Visualizza pesi di componente Se selezionata viene visualizzato un grafico dei pesi di componente Variabili dei pesi Per il grafico dei pesi di componente possibile utilizzare tutte le variabili o selezionarne un sottoinsieme Includi i centroidi Le variabili con livelli di scaling nominale multipli non hanno pesi di componente ma possibile scegliere di includere nel grafico i centroidi di tali variabili possibile scegliere di utilizzare tutte le variabili nominali multiple o selezionarne un sottoinsieme Opzioni aggiuntive del comando CATPCA Per personalizzare l analisi delle componenti principali categoriale possibile incollare le impostazioni selezionate in una finestra di sintassi e modificare la sintassi di comando CATPCA risultante Il linguaggio della sintassi dei comandi consente inoltre di m Specificare i nomi di radice per le variabili trasformate i punteggi degli oggetti e le approssimazioni quando vengono salvati nel file dati attivo con il sottocomando SAVE m Specificare una lunghezza massima per le singole etichette di ciascun grafico con il sottocomando PLOT m Specificare un elenco di variabili distinto per i grafici dei residui con il sottocomando PLOT Per informazioni d
239. in assoluto e il valore 15 a quello meno preferito Le loro preferenze sono state registrate per sei diversi scenari che comprendevano tutti gli scenari compresi tra Preferenza generale e Solo snack con bibita breakfast overall sav Questo file contiene le preferenze degli alimenti della colazione solo per il primo scenario Preferenza generale broadband_1 sav File di dati ipotetici che contiene il numero di sottoscrittori per area di un provider di servizi a banda larga nazionale Il file di dati contiene il numero dei sottoscrittori mensili di 85 aree in un periodo di quattro anni broadband_2 sav Questo file identico al file broadband _1 sav ma contiene i dati per ulteriori tre mesi car_insurance_claims sav Un insieme di dati presentato e analizzato altrove McCullagh e Nelder 1989 riguarda le richieste di risarcimento auto La quantit media di richieste di risarcimento pu essere adattata come avente una distribuzione gamma utilizzando una funzione di collegamento inverso per correlare la media della variabile dipendente a una 323 File di esempio combinazione lineare di et del contraente della polizza e tipo e anni del veicolo Il numero delle richieste di risarcimento specificato pu essere utilizzato come peso scalato car_sales sav Questo file di dati ipotetici contiene le stime sulle vendite i prezzi di listino e le specifiche fisiche di numerose marche e modelli di veicoli I prezzi di li
240. ina nuo ggliiPO o o0 ofresco NomcomMAfne O Onutriente a oo i und brutto i teressantdonne o FEO i os ate o prawhLaystralia rampante dizianale 1 0 0 5 0 0 05 10 15 Dimensione 1 Si noti nei punti di colonna che tutte le marche sono lontane dall origine perci nessuna marca simile al centroide globale Le marche CC e DD sono raggruppate a destra mentre BB e FF sono raggruppate nella met inferiore del grafico Le marche AA e EE non sono simili ad alcuna altra marca Figura 12 32 Grafico delle marche normalizzazione principale Dimensione 2 Dimensione 1 239 Analisi corrispondenze Normalizzazione simmetrica Qual la correlazione tra marche e attributi dell immagine La normalizzazione principale non in grado di evidenziare queste relazioni Per concentrarsi sulle correlazioni tra le variabili necessario utilizzare la normalizzazione simmetrica Anzich distribuire l inerzia due volte come nella normalizzazione principale la normalizzazione simmetrica divide l inerzia in parti uguali tra righe e colonne Le distanze tra le categorie per una singola variabile non possono essere interpretate ma la distanze tra le categorie per le diverse variabili sono significative Figura 12 33 Finestra di dialogo Modello Analisi delle corrispondenze Modello Dimensioni nella soluzione 2 Misura di distanza Chi Quadrato Euclidea Metodo di standardizzazione Medie
241. ineering and Consulting ttp Avww winwrap com Nessuna parte di questa pubblicazione potr comunque essere riprodotta o inserita in un sistema di riproduzione o trasmessa in qualsiasi forma e con qualsiasi mezzo in formato elettronico meccanico su fotocopia come registrazione o altro per qualsiasi scopo senza il permesso scritto dell editore Prefazione SPSS Statistics 17 0 un sistema completo per l analisi dei dati Il modulo aggiuntivo opzionale Categories include le tecniche di analisi aggiuntive descritte nel presente manuale Il modulo aggiuntivo Categories deve essere usato con il modulo base SPSS Statistics 17 0 in cui completamente integrato Installazione Per installare Categories Modulo aggiuntivo eseguire Attivazione guidata licenza utilizzando il codice di autorizzazione fornito da SPSS Inc Per ulteriori informazioni consultare le istruzioni di installazione fornite con Categories Modulo aggiuntivo Compatibilit SPSS Statistics progettato per l esecuzione in una vasta gamma di sistemi operativi Per informazioni specifiche sui requisiti minimi e consigliati vedere le istruzioni di installazione fornite con il sistema Numeri di serie Il numero di serie il numero di identificazione del cliente per SPSS Inc Sar necessario fornire questo numero nel caso l utente contatti SPSS Inc per ricevere informazioni relative al supporto al pagamento e ai sistemi aggiornati Il numero di seri
242. inisci intervallo 245 Analisi corrispondenze Figura 12 41 Finestra di dialogo Definisci intervallo di righe 3 Analisi delle corrispondenze Definisci interv rie per la variabile di riga riga Digitare 1 come valore minimo Digitare 10 come valore massimo Fare clic su Aggiorna Fare clic su Continua Selezionare col come variabile di colonna Fare clic su Definisci intervallo nella finestra di dialogo Analisi delle corrispondenze Figura 12 42 Finestra di dialogo Definisci intervallo di colonne 3 Analisi delle corrispondenze Definisci interv x ibile di colonna colonn gt Digitare 1 come valore minimo gt Digitare 10 come valore massimo 246 Capitolo 12 gt Fare clic su Aggiorna gt Fare clic su Continua gt Nella finestra di dialogo Analisi della corrispondenze fare clic su Modello Figura 12 43 Finestra di dialogo Modello a Analisi delle corrispondenze Modello 2 gt Selezionare Principale come metodo di normalizzazione gt Fare clic su Continua gt Nella finestra di dialogo Analisi della corrispondenze fare clic su Grafici 247 Figura 12 44 Finestra di dialogo Grafici za Analisi delle corrispondenze Grafici Grafici a dispersione C Biplot Punti di colonna Lunghezza etichette grafici a dispersione 20 Grafici lineari C Categorie di riga trasformate C Categorie di colonna trasformate Lunghezza etichette grafici
243. ione canonica categoriale con scaling ottimale OVERALS con due insiemi di cui uno contiene solo una variabile Lo scaling di tutte le variabili a livello numerico corrisponde all analisi della regressione multipla standard Per ottenere una regressione categoriale Dai menu scegliere Analizza Regressione Scaling ottimale CATREG Figura 2 1 Finestra di dialogo Regressione categoriale 1 Regressione categoriale Variabile dipendente DETTA Standardized Residual pref Spline ordinale 2 2 Mancanti Definisci scala Opzioni Variabili indipendenti package Spline ordinale 2 2 Regolarizzazione brand Spline ordinale 2 2 price Spline ordinale 2 2 seal Spline ordinale 2 2 Salva money Spline ordinale 2 2 Grafici Selezionare la variabile dipendente e le variabili indipendenti Fare clic su OK inoltre possibile modificare il livello di scaling per ciascuna variabile Definisci scala in regressione categoriale possibile impostare il livello di scaling ottimale per le variabili dipendenti e indipendenti che vengono scalate per impostazione predefinita come spline ordinali monotoni di secondo grado con due nodi interni inoltre possibile impostare il peso delle variabili dell analisi 17 Regressione categoriale CATREG Figura 2 2 Finestra di dialogo Definisci scala Regressione categoriale definis Livello di scala ottimale
244. ione doy TRA6_1 S Variabile di selezione Statistiche Grafici Salva Opzioni Regola Etichette casi Minimi quadrati ponderati gt Selezionare Quantificazione Valore ozono giornaliero come variabile dipendente gt Selezionare da Quantificazione Altezza di base inversione Quantificazione Gradiente pressione mm Hg e Temperatura gradi F come variabili indipendenti gt Fare clic su OK Figura 9 44 Riepilogo del modello per regressione con sottoinsieme di predittori con scaling ottimale R quadrato Errore std Modello R quadrato corretto della stima a Stimatori Costante doy ibh dpa vis Utilizzando le quantificazioni per la risposta Temperatura Gradiente pressione e Altezza di base inversione in una regressione lineare standard determinano un adattamento pari a 0 733 Per confrontarlo con l adattamento di una regressione categoriale utilizzando solo questi tre predittori richiamare la finestra di dialogo Regressione categoriale 127 Regressione categoriale Figura 9 45 Finestra di dialogo Regressione categoriale t Regressione categoriale Variabile dipendente vh ozon Numerica Nisibility miles vis Mancanti Defrinisci scala Day of the year doy Opzioni Quantificazione Daily o variabili indipendenti Quantificazione Inversi ibh Nominale Regolarizzazione
245. ione lineare non pu rendere questa relazione gt Per visualizzare una curva di adattamento ottimale tracciata su punti del grafico a dispersione attivare il grafico facendo doppio clic su di esso gt Selezionare un punto nell Editor dei dati gt Fare clic sullo strumento Aggiungi curva di adattamento a totale e chiudere l Editor dei grafici 130 Capitolo 9 Figura 9 49 Grafico a dispersione con curva di adattamento ottimale 40 00 30 00 20 00 ozon 10 00 0 00 100 00 200 00 300 00 400 00 doy Una regressione lineare di Livello giornaliero di ozono su Giorno dell anno genera un R2 pari a 0 004 Questo adattamento suggerisce che Giorno dell anno non abbia valore predittivo per Livello giornaliero di ozono Questo non sorprende dato il modello in figura Utilizzando lo scaling ottimale tuttavia possibile linearizzare la relazione quadratica e utilizzare Giorno dell anno trasformato per prevedere la risposta 131 Regressione categoriale Figura 9 50 Finestra di dialogo Regressione categoriale ia Regressione categoriale Variabile dipendente vh ozon Numerica E Inversion base height Discretizza Mancanti Definisci scala E Pressure gradient mm _Definisci scala _ Opzioni P Visibility miles vis variabili indipendenti E Temperature degrees Quantificazione Daily 0 Output E Quantificazione Inversi E Quantifica
246. ioni Varianza spiegata Restrizione coordinate centroide rispetto a Coordinate coordinate Numero di iterazione Totale Aumento del centroide vettore 0 4 515315 000000 5 484685 4 075583 1 409101 317 4 726009 000008 5 273991 4 273795 1 000196 a Processo di iterazione interrotto perch stato raggiunto il valore di controllo per la convergenza Figura 10 8 Riepilogo modello Alfa di Totale Dimensione Cronbach autovalore divarianza 67 774 26 746 94 520 a Il totale di Alfa di Cronbach basato sul totale dell autovalore Gli autovalori possono essere utilizzati come indicazione del numero di dimensioni necessarie Nell esempio stato utilizzato il numero predefinito di dimensioni 2 Si tratta del numero corretto Come regola generale quando tutte le variabili sono nominali singole ordinali o numeriche l autovalore per una dimensione deve essere maggiore di 1 Poich la soluzione a due dimensioni spiega il 94 52 della varianza una terza dimensione probabilmente non aggiungerebbe molte informazioni Per variabili nominali multiple non esiste una regola semplice per determinare il numero adeguato di dimensioni Se il numero delle variabili sostituito dal numero totale di categorie meno il numero di variabili la regola sopra illustrata resta applicabile Tale regola da sola tuttavia consentirebbe probabilmente pi dimensioni del necessario Quando si sceglie il numero di dimensioni la regola pratica pi u
247. ioni nominali In altre parole l unica considerazione il fatto che alcuni oggetti appartengono alla stessa categoria e altri no Non viene fatta alcuna ipotesi circa la distanza o l ordine tra le categorie della stessa variabile Un utilizzo specifico dell analisi delle corrispondenze l analisi delle tavole di contingenza a due vie Se una tabella include r righe attive e c colonne attive il numero delle dimensioni nella soluzione dell analisi delle corrispondenze il valore minimo tra r meno 1 e c meno 1 In altre parole possibile rappresentare perfettamente le categorie delle righe o delle colonne di una tavola di contingenza in uno spazio dimensionale Da un punto di vista pratico tuttavia utile rappresentare le categorie di righe e colonne in una tabella a due vie in uno spazio dimensionale ridotto ad esempio con due dimensioni in quanto i grafici bidimensionali sono pi facilmente comprensibili delle rappresentazioni spaziali multidimensionali 10 Capitolo 1 Quando viene utilizzato un numero di dimensioni possibili inferiore al massimo le statistiche generate nell analisi descrivono il grado di attendibilit della rappresentazione delle categorie di righe e colonne nella rappresentazione dimensionale ridotta A condizione che la qualita della rappresentazione della soluzione a due dimensioni sia buona possibile esaminare 1 grafici dei punti di riga e di colonna per comprendere quali categorie della var
248. ipartimenti di Didattica e Psicologia dalla Facolt di Scienze sociali e del comportamento della Leiden University Informazioni sullo scaling ottimale Il concetto alla base dello scaling ottimale l assegnazione di quantificazioni numeriche alle categorie di ciascuna variabile che rende possibile l utilizzo delle procedure standard per ottenere una soluzione sulle variabili quantificate I valori di scala ottimali vengono assegnati alle categorie di ciascuna variabile in base al criterio di ottimizzazione della procedura in uso Diversamente dalle etichette originali delle variabili nominali o ordinali nell analisi questi valori di scala hanno propriet metriche Nella maggioranza delle procedure del modulo Categories la quantificazione ottimale per ciascuna variabile scalata viene ottenuta tramite un metodo iterativo detto dei minimi quadrati alternati nel quale dopo essere state utilizzate per trovare una soluzione le quantificazioni correnti vengono aggiornate utilizzando la soluzione stessa Le quantificazione aggiornate vengono quindi utilizzate per trovare una nuova soluzione impiegata a sua volta per aggiornare le quantificazioni e cos via fino a raggiungere un criterio che indichi al processo di arrestarsi Motivi di utilizzo dello scaling ottimale I dati categoriali sono spesso presenti nelle ricerche di marketing nelle indagini di mercato e nella ricerca nelle scienze sociali e del comportamento In effetti molti ricer
249. ispondenza Iterazioni 385 Valore finale della funzione 8140741 Parti dei valori della Parte dello stress 13493640 funzione Parte penalit 8969229 Cattivo adattamento Stress normalizzato 1212146 Stress di Kruskal 13481587 Stress II di Kruskal 0770522 S stress di Young 4812632 S stress Il di Young ini Bont dell adattamento Dispersione spiegata in 8787855 hase a Varianza spiegata in base a 5183498 Ordini delle preferenze recuperate Rho di Spearman 6446272 Tau b di Kendall 5165230 Coefficienti di variazione Vicinanze delle variazioni 5590170 7174981 Vicinanze trasformate delle PEA 6122308 variazioni Distanze delle variazioni 4043695 Indici di degenerazione Somma dei quadrati degli indici di amalgamazione di 1 7571887 DeSarbo Indice di non degenerazione approssimativo di Shepard 17932124 L algoritmo converge dopo 385 interazioni con uno stress penalizzato finale pari a 0 8140741 Questa statistica l inadeguatezza dell adattamento la bont dell adattamento i coefficienti di variazione e l indice di Shepard sono tutti molti simili a quelli riferiti alla soluzione ottenuta con il punto di inizio tradizionale di Spearman Gli indici di DeSarbo sono diversi poich hanno un valore pari a 1 7571887 anzich 0 2199287 ad indicare che la soluzione che utilizza l inizio di corrispondenza non ben distribuita Per vedere in che misura ci influisce sulla soluzione sufficiente osservare
250. istenti patient_los sav File di dati ipotetici che contiene informazioni sul trattamento dei pazienti ricoverati per sospetto di infarto del miocardio Ogni caso corrisponde a un diverso paziente e contiene diverse variabili correlate alla degenza nell ospedale patlos_sample sav File di dati ipotetici che contiene informazioni sul trattamento di un campione di pazienti curato con trombolitici durante la degenza per infarto del miocardio Ogni caso corrisponde a un diverso paziente e contiene diverse variabili correlate alla degenza nell ospedale polishing sav File di dati Nambeware Polishing Times di Data and Story Library Prende in esame l impegno di un industria di stoviglie in metallo Nambe Mills Santa Fe N M nel tentativo di pianificare il proprio piano di produzione Ogni caso rappresenta un diverso articolo nella linea dei prodotti Per ciascun articolo sono indicati il diametro il tempo di lucidatura il prezzo e il tipo di prodotto poll_cs sav File di dati ipotetici che prende in esame i sondaggi per stabilire il livello di sostegno pubblico nei confronti di un disegno di legge prima che diventi una legge vera e propria I casi corrispondono ai votanti registrati Ciascun caso riporta informazioni sulla contea sul comune e sul quartiere in cui vive il votante poll_cs_sample sav File di dati ipotetici che contiene un campione dei votanti elencati nel file poll_cs sav Il campione stato selezionato in base
251. istiche descrittive Visualizza le frequenze il numero di valori mancanti e la moda delle variabili selezionate 37 Analisi delle componenti principali categoriale CATPCA Componenti principali categoriale Salva Dalla finestra di dialogo Salva possibile salvare i dati discretizzati i punteggi degli oggetti i valori trasformati e le approssimazioni in un file di dati esterno di SPSS Statistics o un insieme di dati nella sessione corrente Nel file di dati attivo inoltre possibile salvare i valori trasformati i punteggi degli oggetti e le approssimazioni m file di dati sono disponibili durante la sessione corrente ma non lo sono in quelle successive a meno che non li si salvi esplicitamente come file di dati I nomi degli insiemi di dati devono rispettare le regole dei nomi delle variabili I nomi dei file o i nomi dei file di dati devono essere diversi per ogni tipo di dati salvati Se si salvano i punteggi degli oggetti o i valori trasformati nel file di dati attivo possibile specificare il numero delle dimensioni nominali multiple Figura 3 8 Finestra di dialogo Salva Componenti principali categoriale Salva Dati discretizzati Crea dati discretizzati Crea nuovo file di dati O Scrivi nuovo file di dati Punteggi oggetto Salva in file di dati attivo Crea punteggi oggetto Crea nuovo file di dati Nome file di dati punteggioggetto O Scrivi nuovo file di dati Variabili trasformate Salva
252. istra del grafico Come suggerito in precedenza quello ordinale potrebbe essere un livello di scaling ordinale troppo rigido da applicare a Et in anni 204 Capitolo 11 Figura 11 22 Centroidi etichettati in base a variabili O Et in anni O Stato civile CO Animali domestici Quotidiani letti pi O spesso 00 cani _ Musica preferita du i g rererenze ew wav O0 Piccola citt serave C 00 Singe o B670 00 vap agi i 00 no o 00 66 70 Peer iAP Pop 00 Gazes ooga arna oreste Waria j o0 ation it mesa OO BNS oo 00 acert 00 Sposato 00 Altro 00 56 60 08 gatti e Dimensione 2 o era 00 Campagna Jo Classica DO 41 45 2 1 0 1 2 Dimensione 1 Quando si richiede il grafico dei centroidi vengono generati anche i grafici dei singoli centroidi e dei centroidi proiettati per ogni variabile etichettata in base alle etichette dei valori I centroidi proiettati si trovano su una linea nello spazio dell oggetto Figura 11 23 Centroidi e centroidi proiettati per Giornale letto pi spesso Centroidi O Effettivo O Proiettato Gazzetta Gazzetta Nessuno Dimensione 2 i QO ofr 0 5 0 0 0 5 10 Dimensione 1 205 Analisi della correlazione canonica non lineare OVERALS I centroidi reali sono proiettati sui vettori definiti dai pesi di componente Questi vettori sono stati aggiunti ai grafici dei centroidi per semplificare la distinzione tra centroi
253. l Vehicle type type Trascinare un modello di grafico in questo punto per Price in thousands usarlo come base amp Engine size engine OPPURE E Horsepower horse lezi la scheda El idb il Wheelers fabeelb a Selezionare la scheda Elementi di base per creare i eth width grafico elemento per elemento Width wide E Length length Nessuna categoria variabile di scala Modelli Elementi di base ID gruppi punti TitolifAnnotazioni Seleziona da ag clan 1 Grafico a scatole Assi duali gt Selezionare il modello Dispersione Punti e scegliere A dispersione raggruppato 172 Capitolo 10 Figura 10 41 Generatore di grafici W Generatore di grafici Variabili amp Property i Neighbor Township y eed c Years sin L value atl Probabilit L Peso dic F Probabilit Peso dic Categorie Nessuna categoria variabile di scala ampionamento cumulato per lo stadio 2 L anteprima dei grafici usa i dati di esempio Modelli Seleziona da een Preferiti Al Elementi di base Barra Bal ial ee UES ID gruppi punti Ad area i Titoli Mote a pi di A torta polare ka A dispersione punti ele 1 Istogramma Alto Basso Propriet elemento Grafico a scatola Assi duali as BB lf it A A gt SelezionareQuantificazione interazione dia
254. l interazione ad esempio hanno quantificazioni pari o quasi pari per le due relative categorie centrali Questo tipo di risultati pu suggerire di tentare analisi componenti principali categoriali alternative eventualmente con alcune categorie compresse o con un diverso livello di analisi ad esempio nominale multiplo Figura 10 10 Punti delle categorie dei grafici congiunti O Appartenenza O Formalit FREQUENZA O INTENSIT Vicinanza nessuna 05 Informale Dimensione 2 2 o una relazione 2 1 0 1 Dimensione 1 Il grafico congiunto dei punti delle categorie analogo al grafico per i pesi di componente ma mostra in aggiunta la posizione dei punti finali corrispondenti alle quantificazioni pi basse ad esempio leggera per Intensit dell interazione e nessuna per Sentimento di appartenenza Le due variabili che misurano l interazione Intensit dell interazione e Frequenza dell interazione vengono visualizzate una accanto all altra e spiegano gran parte della varianza nella dimensione 1 Formalit della relazione appare anch essa accanto a Vicinanza fisica 146 Capitolo 10 Concentrando l attenzione sui punti delle categorie possibile vedere i rapporti in modo ancora pi chiaro Non solo Intensit dell interazione e Frequenza dell interazione sono vicine ma le direzioni delle relative scale sono simili ovvero intensit leggera e frequenza scarsa sono analoghe ovvero in
255. la Aiuto Peso della variabile Per ciascuna variabile pu essere definito un peso il cui valore deve essere un intero positivo Il valore predefinito 1 Livello di scaling ottimale inoltre possibile selezionare il livello di scaling da utilizzare per quantificare ciascuna variabile m Spline ordinale Nella variabile con scaling ottimale viene mantenuto l ordine delle categorie della variabile osservata I punti di categoria si troveranno su una linea retta vettore che passa per l origine La trasformazione ottenuta un polinomio livellato monotono del grado specificato Gli elementi vengono determinati dal numero di nodi interni definito dall utente e dalla relativa posizione stabilita dalla procedura m Spline nominale Le uniche informazioni della variabile osservata che verranno mantenute nella variabile con scaling ottimale sono quelle relative al raggruppamento degli oggetti in categorie Non viene mantenuto l ordine delle categorie della variabile osservata I punti di categoria si troveranno su una linea retta vettore che passa per l origine La trasformazione ottenuta un polinomio livellato possibilmente non monotono del grado specificato Gli elementi vengono determinati dal numero di nodi interni definito dall utente e dalla relativa posizione stabilita dalla procedura Nominale multipla Le uniche informazioni della variabile osservata che verranno mantenute nella variabile con scaling ottima
256. la Parte dello stress 00990 funzione Parte penalit 00000 Cattivo adattamento Stress normalizzato 0000000 Stress di Kruskal 0000990 Stress Il di Kruskal 6129749 S stress di Young 0001980 S stress Il di Young mangio Bont dell adattamento Dispersione spiegata in base a 1 0000000 Varianza spiegata in base 6230788 a Ordini delle preferenze recuperate Rho di Spearman 450748 Tau b di Kendall 6218729 Coefficienti di variazione Vicinanze delle variazioni 5590170 7074830 Vicinanze trasformate delle Vino 0000924 variazioni Distanze delle variazioni 1808765 Indici di degenerazione Somma dei quadrati degli indici di amalgamazione di 117 3115413 DeSarbo Indice di non degenerazione approssimativo di Shepard 0000000 L algoritmo arriva a una soluzione dopo 154 iterazioni con una misura dello stress penalizzata contrassegnata come valore funzionale finale pari allo 0 0000990 Poich la penalit stata disabilitata lo stress penalizzato uguale allo stress I di Kruskal la parte dello stress del valore della funzione equivalente all inadeguatezza dell adattamento di Kruskal Valori bassi di stress 289 Unfolding multidimensionale indicano che la soluzione si adatta bene ai dati ma che ci sono numerosi segnali che indicano la presenza di una soluzione degenerata Il coefficiente di variazione delle distanze trasformate molto piccolo rispetto al coefficiente di variazione
257. la correlazione canonica dello scaling ottimale 9 Introduzione alle procedure di scaling ottimale per i dati categoriali determina la similarita tra gli insiemi confrontando contemporaneamente le variabili canoniche di ogni insieme con un insieme intermedio di punteggi assegnati agli oggetti Relazione con altre procedure di Categories Se sono presenti due o pi insiemi di variabili con una sola variabile per insieme l analisi della correlazione canonica dello scaling ottimale equivale all analisi delle componenti principali dello scaling ottimale Se tutte le variabili in un analisi in cui ogni insieme include un unica variabile sono nominali multiple l analisi della correlazione canonica dello scaling ottimale equivale all analisi delle corrispondenze multiple Se sono presenti due o pi insiemi di variabili uno dei quali include una sola variabile l analisi della correlazione canonica dello scaling ottimale equivale alla regressione categoriale con scaling ottimale Relazione con le tecniche standard L analisi della correlazione canonica standard una tecnica statistica che individua una combinazione lineare di un insieme di variabili e una combinazione lineare di un secondo insieme di variabili con la massima correlazione Dato questo insieme di correlazioni lineari l analisi della correlazione canonica in grado di individuare insiemi indipendenti successivi di combinazioni lineari detti variabili canoniche fi
258. la correlazione canonica non lineare OVERALS Le quantificazioni per Giornale letto piu spesso per contro corrispondono a un trend crescente nelle tre categorie con casi osservati La prima categoria riceve la quantificazione minore la seconda un valore maggiore e la terza il valore massimo Sebbene la variabile venga scalata come nominale l ordine delle categorie viene recuperato nelle quantificazioni Figura 11 19 Grafico di trasformazione per Giornale letto pi spesso nominale 1 0 0 5 0 0 Quantificazioni di categoria per Quotidiani letti pi spesso Nessuno Gazzetta Voce FT Altro Quotidiani letti pi spesso Figura 11 20 Grafico di trasformazione per Et in anni ordinale 0 91 064 034 034 Quantificazioni di categoria per Et in anni 064 e e e e 20 25 26 30 31 35 36 40 41 45 46 50 51 55 56 60 61 65 66 70 Et in anni 202 Capitolo 11 Il grafico di trasformazione per Et in anni mostra una curva a forma di S Le quattro categorie relative alle fasce di et pi giovani osservate ricevono tutte la stessa quantificazione negativa mentre le due categorie relative alle fasce di et pi anziane ricevono valori positivi analoghi Di conseguenza possibile tentare la compressione di tutte le et pi giovani in una categoria comune ovvero di et inferiore a 50 anni e la compressione delle due categorie pi anziane in una sola Tuttavia l esatta uguaglianza delle quantific
259. la sessione corrente Nel file di dati attivo inoltre possibile salvare i valori trasformati e i punteggi degli oggetti m file di dati sono disponibili durante la sessione corrente ma non lo sono in quelle successive a meno che non li si salvi esplicitamente come file di dati I nomi degli insiemi di dati devono rispettare le regole dei nomi delle variabili I nomi dei file o i nomi dei file di dati devono essere diversi per ogni tipo di dati salvati Se si salvano i punteggi degli oggetti o i valori trasformati nel file di dati attivo possibile specificare il numero delle dimensioni nominali multiple Figura 6 8 Finestra di dialogo Salva a MCA Salvataggio Dati discretizzati Variabili trasformate Crea dati discretizzati Salva variabili trasformate nell insieme di dati attivo Crea nuovo insieme di dati Crea variabili trasformate Nome insieme didat disedata Crea nuovo insieme di dati Scrivi nuovo file di dati Nome insieme di dati O Scrivi nuovo file di dati Punteggi oggetto Salva punteggi oggetto nell insieme di dati attivo Crea punteggi oggetto Crea nuovo insieme di dati Nome insieme di dati object_scores O Scrivi nuovo file di dati Dimensioni nominali multiple Tutto Prime Annulla Aiuto Grafici di oggetti dell analisi delle corrispondenze multiple Nella finestra di dialogo Grafici di oggetti possibile specificare i tipi di grafici desiderati e le variabili da rap
260. le selezionare Includi intercetta In questo caso le distanze possono inoltre essere spostate in base a un termine costante m Livellamento Le distanze trasformate presentano lo stesso ordine delle distanze originali incluso un vincolo che tiene in considerazione le differenze tra i valori successivi Il risultato una trasformazione di livellamento ordinale possibile specificare se la distinzione delle distanze pari merito consentita o meno m Ordinale L ordine delle distanze trasformate uguale all ordine delle distanze originali possibile specificare se la distinzione delle distanze pari merito consentita o meno Applica trasformazioni Specificare se confrontare l una con l altra solo le distanze presenti nelle singole righe o solo le distanze presenti in ogni sorgente o se i confronti sono non condizionali sulla riga o sulla sorgente ovvero se le trasformazioni devono essere eseguite per riga per sorgente o su tutte le distanze contemporaneamente Vincoli relativi all unfolding multidimensionale Nella finestra di dialogo Vincoli possibile assegnare vincoli sullo spazio comune Figura 8 3 Finestra di dialogo Vincoli 2 Unfolding multidimensionale vincoli Vincoli sullo spazio comune Vincoli su coordinate riga Variabili vincolo righe Leggi variabili da Il numero deve corrispondere alla dimensionalit di modello massima attualmente 2 Disponibili Selezionate Var
261. le sono quelle relative al raggruppamento degli oggetti in categorie Non viene mantenuto l ordine delle categorie della variabile osservata I punti di categoria saranno nel centroide degli oggetti delle categorie specifiche Il termine multipla indica che per ciascuna dimensione si ottengono insiemi di quantificazioni diversi m Ordinale Nella variabile con scaling ottimale viene mantenuto l ordine delle categorie della variabile osservata I punti di categoria si troveranno su una linea retta vettore che passa per l origine La trasformazione ottenuta ha un grado di adeguatezza maggiore di quello ottenuto con la trasformazione dello spline ordinale ma meno regolare m Nominale Le uniche informazioni della variabile osservata che verranno mantenute nella variabile con scaling ottimale sono quelle relative al raggruppamento degli oggetti in categorie Non viene mantenuto l ordine delle categorie della variabile osservata I punti di categoria si troveranno su una linea retta vettore che passa per l origine La trasformazione 31 Analisi delle componenti principali categoriale CATPCA ottenuta ha un grado di adeguatezza maggiore di quello ottenuto con la trasformazione dello spline nominale ma meno regolare m Numerica Le categorie vengono considerate come ordinate ed equamente distanziate a livello di intervallo L ordine delle categorie e le distanze uguali tra i numeri delle categorie della variabile osservata ve
262. li scostamenti Unfolding multidimensionale L unfolding multidimensionale particolarmente indicato se lo scopo dell analisi quello di individuare la struttura di un insieme di misure di distanza tra due insiemi di oggetti ovvero gli oggetti riga e colonna Questa operazione viene compiuta assegnando le osservazioni a posizioni specifiche in uno spazio concettuale ridotto in modo tale che le distanze tra i punti nello spazio corrispondano il pi possibile alle dissimilarit specificate In questo modo si ottiene una rappresentazione dei minimi quadrati degli oggetti riga e colonna all interno dello spazio dimensionale ridotto che nella maggior parte dei casi aiuta a comprendere meglio i dati Relazione con altre procedure di Categories Se i dati si riferiscono a distanze di un unico insieme di oggetti quadrato matrice simmetrica usare lo scaling multidimensionale Relazione con le tecniche standard La procedura di unfolding multidimensionale del modulo Categories PREFSCAL offre numerosi miglioramenti rispetto alla procedura di unfolding disponibile nel modulo Base tramite il comando ALSCAL PREFSCAL permette di limitare lo spazio comune Inoltre tenta di minimizzare la misura dello stress penalizzata evitando che venga generate soluzioni inadeguate problema che si verifica con gli algoritmi pi vecchi 13 Introduzione alle procedure di scaling ottimale per i dati categoriali Proporzioni nei grafici di scalin
263. liere Analizza Scala Scaling multidimensionale PROXSCAL Figura 14 1 Finestra di dialogo Formato dati z Scaling multidimensionale Formato dati Formato dei dati Numero di sorgenti 1 dati sono distanze O Una matrice O Grea distanze dai dati Pi matrici Una sorgente Pi sorgenti 1 Le distanze sono in matrici impilate per colonne 2 Le distanze sono nelle colonne una sorgente per colonna Le distanze sono sovrapposte in una singola colonna gt Selezionare Pi matrici nel gruppo Numero di sorgenti gt Fare clic su Definisci 268 Capitolo 14 Figura 14 2 Finestra di dialogo Scaling multidimensionale x Scaling multidimensionale Distanze in matrici per colonne gt Selezionare da Zia a Zio come variabili di distanza Selezionare identificazione come variabile di identificazione della sorgente gt Fare clic su Modello Figura 14 3 Finestra di dialogo Modello Scaling multidimensionale Modello Rango Grado gt Digitare 10 come numero massimo delle dimensioni gt Fare clic su Continua gt Nella finestra di dialogo Scaling multidimensionale fare clic su Vincoli 269 Scaling multidimensionale Figura 14 4 Finestra di dialogo Vincoli 3 Scaling multidimensionale Vincoli gt Selezionare Combinazione lineare di variabili indipendenti gt Fare clic su File per selezionare la sorgente delle variabili indipendenti gt Selezionare kinshi
264. line Annulla Aiuto 123 Regressione categoriale Selezionare Temperatura e fare clic su Definisci scala Selezionare Ordinale come livello di scaling ottimale Fare clic su Continua Nella finestra di dialogo Regressione categoriale fare clic su Salva Figura 9 38 Salva a Regressione categoriale salva C Salva i valori attesi nell insieme di dati attivo 0 Salva residui nell insieme di dati attivo Dati discretizzati Coefficienti e modelli regolarizzati C Crea dati discretizzati Crea nuovo insieme di dati Crea nuovo insieme di dati Nome insieme di dati nsiemeDatiS nsieme di dati Scrivi nuovo File di dati Scrivi nuovo File di dati Sfoglia proglia Variabili trasformate Segni di coefficienti di regressione Salva variabili trasformate nell insieme di dati attivo Crea nuovo insieme di dati nsiemeDati _ Salva variabili trasformate in nuovo insieme di dati o file Scrivi nuovo file di dati Crea nuovo insieme di dati Scrivi nuovo File di dati Sfoglia Annulla Aiuto Nel gruppo Variabili trasformate selezionare Salva variabili trasformate nel file di dati attivo Fare clic su Continua Nella finestra di dialogo Regressione categoriale scegliere OK Figura 9 39 Riepilogo del modello per regressione con Temperatura ordinale R quadrato R multiplo R quadrato corretto Variabile dipendente ozon Stimatori ibh dpg vis temp doy
265. lineari Dimensioni grafico Visualizza tutte le dimensioni nella soluzione O Limita il numero di dimensioni gt Selezionare Punti di riga nel gruppo Grafici a dispersione gt Fare clic su Continua gt Nella finestra di dialogo Analisi della corrispondenze fare clic su OK Tabella di corrispondenza Analisi corrispondenze La nuova distanza pari a 0 tra Seattle e Miami indica che sono le pi distanti le meno simili mentre la distanza pari a 2529 tra New York e Washington D C indica che sono la coppia di citt meno distanti le pi simili Figura 12 45 Tabella di corrispondenza per similarit colonna Atlanta Atl Chi Den Hou LA Mia NY SF Sea DC Margine attivo Chicago Denver Houston Los Angeles Miami New York San Francisco Seattle Washington DC Margine attivo 16688 17055 16677 16302 13058 13172 14101 12117 11401 15287 145858 248 Capitolo 12 Punteggi di riga e di colonna Utilizzando i chilometraggi aerei anzich quelli stradali le caratteristiche del territorio americano non influenzano le distanze Di conseguenza tutte le similarit dovrebbero essere rappresentabili in due dimensioni Centrare sia le righe che le colonne e utilizzare la normalizzazione principale A motivo della simmetria della tabella di corrispondenza e della normalizzazione principale i punteggi di riga e di colonna
266. lit migliore L indice di non degenerazione generale di Shepard espresso come percentuale delle diverse distanze ora pari a circa 1 80 Poich le distanze sono sufficientemente diverse la soluzione probabilmente non degenerata 292 Capitolo 15 Spazio comune Figura 15 7 Grafico congiunto dello spazio comune per la soluzione degenerata Toast o 10 39 o 19 Toast con margarina o 37 Toast con mostaf alcetto alla marmellata e Icetto glassato 9 o Toast burro e necie a9 32 17 ane dolce e cannella e so Pasticcini danesb 1 reo O pParf o imburrato 5 s afte 30 Toast imburrato o 94914 020 22 Dimensione 2 25 2 ar zoro 9012 ooo 42 O9 0 10 PTE o 33 O5O Torta al caff 5 41 o 5 o 34 38 28 199 Dolcetto mirtilli e rPaniaartnice con margarina le Pane integrale imburrato Toast alla cannella Dimensione 1 Il grafico congiunto dello spazio comune consente di interpretare le dimensioni La dimensione orizzontale sembra mettere in evidenza una differenza tra pane morbido e duro o tostato poich i cibi morbidi tendono ad aumentare man mano che ci si sposta a destra dell asse La dimensione verticale non offre un interpretazione chiara sebbene fornisce probabilmente informazioni sulle differenze in termini di convenienza considerato che i cibi pi tradizionali tendono ad aumentare man mano che ci sposta lungo l asse Ci contribuisce a creare vari cluster di cibi
267. lla o w v 3 fi 3 x v v c o v w o 2 o i a n kj o gt w 4 376 5 L 470 25 punti gt Quindi per collegare i punti fare doppio clic sul grafico e quindi fare clic sullo strumento Aggiungi linea di interpolazione nell Editor dei grafici gt Chiudere l Editor dei grafici Rispetto all atteggiamento sessuale le quattro traiettorie sono pi o meno parallele nel tempo e tutti i gruppi mostrano dei progressi I gruppi bulimici tuttavia hanno punteggi pi elevati migliori del gruppo anoressico 184 Capitolo 10 Figura 10 53 Generatore di grafici MA Generatore di grafici Variabili County c amp Years sin L value atl Probabili Peso dic L Peso dic Probabilit E Indice di 8 Ampiezza Peso dic y Ny Peso di campionamento cumulat Categorie Nessuna categoria variabile di scala L anteprima dei grafici usa i dati di esempio Modelli Seleziona da rrr _ tilii Preferiti Elementi di base Barra Pes I LiNcare ID gruppi punti Ad area Fear ay torta polare Titoli Note a pi di A dispersione punti pagina Istogramma Alto Basso Propriet elemento Grafico a scatola a Assi duali i m ri AA ZA gt Richiamare Generatore grafici gt Deselezionare Centroidi proiettati su Atteggiamento sessuale come variabile dell asse y e s
268. lle quantificazioni per Temperatura La linea irregolare dalla trasformazione nominale viene qui sostituita da una linea crescente regolare Inoltre non sono presenti ampi plateau a indicare che la compressione delle categorie non necessaria Ottimalit delle quantificazioni Le variabili trasformate da una regressione categoriale possono essere utilizzate in una regressione lineare standard generando risultati identici Tuttavia le quantificazioni sono ottimali solo per il modello che le ha prodotte L utilizzo di un sottoinsieme dei predittori nella regressione lineare non corrisponde a eseguire una regressione con scaling ottimale sullo stesso sottoinsieme Ad esempio la regressione categoriale calcolata ha un R2 pari a 0 875 Le variabili trasformate sono state salvate perci per adattare una regressione lineare utilizzando solo Temperatura Gradiente pressione e Altezza di base inversione come predittori dai menu scegliere Analizza Regressione Lineare 126 Capitolo 9 Figura 9 43 Finestra di dialogo Regressione lineare z2 Regressione lineare Dipendente Ph gt quantificazione ozon TRA1_1 L ozon City Blocki dit ibh P vis Indipendenti P temp Quantificazione ibh TRA2_1 E doy Quantificazione dpg TRA3_1 amp Quantificazione ibh TRA2_1 Quantificazione temp TRAS_1 amp Quantificazione dpg TRA3_1 VA Quantificazione vis TRA4_1 Metodo Per blocchi amp Quantificazione temp TRAS_1 Quantificaz
269. logo Definisci peso della variabile sat MCA Definisci peso della variabile Peso della variabile 1 Peso della variabile Per ciascuna variabile pu essere definito un peso il cui valore deve essere un intero positivo Il valore predefinito 1 Discretizzazione dell analisi delle corrispondenze multiple Nella finestra di dialogo Discretizzazione possibile selezionare un metodo di ricodifica delle variabili Le variabili con valori frazionari sono raggruppate in sette categorie o nel numero di valori distinti della variabile se tale numero inferiore a sette con distribuzione approssimativamente normale se non viene specificato diversamente Le variabili stringa vengono sempre convertite in interi positivi tramite l assegnazione di indicatori di categoria in base a un ordinamento alfanumerico crescente La discretizzazione delle variabili stringa valida per questi valori interi Le altre variabili rimangono distinte per impostazione predefinita Le variabili discretizzate vengono quindi utilizzate per l analisi 59 Analisi corrispondenze multiple Figura 6 4 Finestra di dialogo Discretizza lt a MCA Discretizzazione Variabili filetto Non specificato testa Non specificato taglio Mon specificato punta Non specificato lunghz Mon specificato attone Non specificato filetton Non specificato testan Mon specificato taglion Non specificato puntan Non specificato Mi Metodo Raggruppamento
270. lori originali un metodo per assicurare la conservazione delle differenze Tuttavia pu determinare la presenza di indicatori mancanti di sistema in molte categorie Ad esempio si supponga che lo schema A utilizzi 1 valori osservati originali Per tutte le procedure di Categories fatta eccezione per l analisi delle corrispondenze il valore di categoria massimo 27 e il minimo 1 Le prime 19 categorie sono vuote e ricevono indicatori mancanti di sistema L output pu diventare rapidamente piuttosto complesso se la categoria massima molto superiore a 1 e ci sono molte categorie vuote tra 1 e il valore massimo Per ridurre la quantit di output possibile eseguire la ricodifica Tuttavia nel caso di una variabile numerica non utilizzare lo strumento Ricodifica automatica La codifica in interi consecutivi determina differenze di 1 tra tutte le categorie consecutive di conseguenza tutte 6 Capitolo 1 le quantificazioni saranno distanziate in modo uniforme Le caratteristiche metriche ritenute importanti nella considerazione di una variabile come numerica vengono eliminate quando si esegue la ricodifica in interi consecutivi Ad esempio lo schema C nella tabella corrisponde alla ricodifica automatica di et La differenza tra le categorie 22 e 25 passata da tre a uno e le quantificazioni rifletteranno quest ultimo valore Uno schema di ricodifica alternativo che conservi le differenze tra le categorie consiste nel sottrar
271. ltidimensionale fare clic su Grafici 296 Capitolo 15 Figura 15 11 Finestra di dialogo Grafici Sorgenti Numero riga gt Nel gruppo Grafici selezionare Spazi individuali gt Fare clic su Continua gt Nella finestra di dialogo Unfolding multidimensionale fare clic su OK Segue la sintassi di comandi generata da queste selezioni PREFSCAL VARIABLES TP BT EMM JD CT BMM HRB TMd BTJ TMn CB DP GD CC CMB INPUT SOURCES srcid INITIAL CLASSICAL SPEARMAN CONDITION ROW TRANSFORMATION NONE PROXIMITIES DISSIMILARITIES MODEL WEIGHTED CRITERIA DIMENSIONS 2 2 DIFFSTRESS 000001 MINSTRESS 0001 MAXITER 5000 297 Misure Unfolding multidimensionale PENALTY LAMBDA 0 5 OMEGA 1 0 PRINT MEASURES COMMON PLOT COMMON WEIGHTS INDIVIDUAL ALL m Questa sintassi specifica un analisi sulle variabili da tp pane da tostare a cmb muffin con burro La variabile srcid viene usata per identificare le sorgenti m 1 sottocomando INITIAL specifica che i valori iniziali possono essere immessi usando le distanze di Spearman m Il sottocomando MODEL specifica un modello euclideo ponderato che permette a ciascuno spazio individuale di ponderare in modo diverso le dimensioni dello spazio comune PLOT richiede i grafici per lo spazio comune gli spazi individuali e i pesi dello spazio individuale Tutti gli altri parametri vengono impostati sui valori predefiniti Figura 15 12 Misure Iterazion
272. m02 e dim03 come variabili Fare clic su Continua Nella finestra di dialogo Scaling multidimensionale fare clic su Grafici Scaling multidimensionale 276 Capitolo 14 Figura 14 11 Finestra di dialogo Grafici Scaling multidimensionale Grafici sorgenti CEB Numero sorgente eee Soo Eo gt Selezionare Distanze originali con distanze trasformate e Variabili indipendenti trasformate gt Fare clic su Continua gt Nella finestra di dialogo Scaling multidimensionale fare clic su Output 277 Figura 14 12 Finestra di dialogo Output Visualizza Coordinate spazio comune Coordinate dello spazio individuale Pesi dello spazio individuale C Distanze C Distanze trasformate Dati iniziali Salva in un nuovo file C Coordinate spazio comune Pesi dello spazio individuale C Distanze O Distanze trasformate Variabili indipendenti trasformate Scaling multidimensionale Output Stress per inizi casuali C Cronologia delle iterazioni Misure diverse di stress Scomposizione di stress ariabili indipendenti trasformate V Correlazioni di variabili e dimensioni Annulla Aiuto Scaling multidimensionale gt Selezionare Dati iniziali Scomposizione di stress e Correlazioni di variabili e dimensioni gt Fare clic su Continua gt Nella finestra di dialogo Scaling multidimensionale fare clic su OK Misure di stress Le misure di stress e di adattamento forni
273. mM ni figili gaS pronfepronmas Dimensione 1 Dimensione 2 Dimensione 3 Si esaminino le coordinate finali per gli oggetti nelle dimensioni 1 e 3 si tratta del grafico nell angolo inferiore sinistro della matrice di grafici a dispersione Questo grafico mostra che la dimensione sull asse x correlata con la variabile sesso e che la dimensione 3 sull asse y correlata con gener Da sinistra a destra possibile vedere che la dimensione 1 separa i termini femminili e maschili con il termine neutro Cugino nel mezzo Dal basso del grafico verso l alto valori crescenti lungo l asse corrispondono ai termini pi vecchi Si esaminino ora le coordinate finali per gli oggetti nelle dimensioni 2 e 3 si tratta del grafico nella parte centrale destra della matrice di grafici a dispersione Questo grafico mostra che la seconda dimensione sull asse y corrisponde alla variabile grado con valori pi elevati lungo l asse corrispondente ai termini pi lontani dalla famiglia nucleare Una soluzione a tre dimensioni con trasformazioni non predefinite La soluzione precedente stata calcolata utilizzando la trasformazione del rapporto predefinita per le distanze e le trasformazioni di intervallo per le variabili indipendenti gener e grado I risultati sono buoni ma potrebbe essere possibile migliorarli ulteriormente utilizzando altre trasformazioni Ad esempio le distanze gener e grado hanno tutte ordinamenti naturali ma pot
274. ma visita La quinta categoria indica i pazienti diagnosticati con anoressia nervosa al punto temporale 2 e cos via la sedicesima categoria indica i pazienti con disturbi alimentari atipici al punto temporale 4 L utilizzo della variabile supplementare Interazione diagnosi tempo consente di studiare l andamento della malattia per i vari gruppi nel tempo Alla variabile assegnato un livello di scaling nominale multiplo e i punti di categoria sono visualizzati nella figura seguente Figura 10 39 Punti di categoria per interazione diagnosi tempo 15 00 Dimensione 2 0 5 1 5 1 0 0 5 0 0 0 5 1 0 Dimensione 1 Parte della struttura evidente dal grafico corrente le categorie diagnostiche in corrispondenza del punto temporale 1 separano chiaramente l anoressia nervosa e il disturbo alimentare atipico dall anoressia nervosa con bulimia nervosa e dalla bulimia nervosa post anoressia nervosa nella seconda dimensione A parte questo evidenziare i modelli risulta leggermente pi difficile 171 Analisi Componenti principali categoriale Tuttavia possibile rendere tali modelli pi visibili creando un grafico a dispersione basato sulle quantificazioni Per farlo dai menu scegliere Grafici Generatore di grafici Figura 10 40 Modello Dispersione Punti 4 Generatore di grafici L anteprima del grafico utilizza dati di esempio d Model model E Sales in thousands E 4 year resale value F a
275. mal scaling dual scaling homogeneity analysis and other methods for quantifying categorical multivariate data Psychometrika 50 91 119 Van Rijckevorsel J 1987 The application of fuzzy coding and horseshoes in multiple correspondence analysis Leiden DSWO Press Capitolo 14 Scaling multidimenstonale Dato un insieme di oggetti l obiettivo dello scaling multidimensionale individuare una rappresentazione degli oggetti in uno spazio dimensionale ridotto Questa soluzione viene ottenuta utilizzando le distanze tra gli oggetti La procedura riduce al minimo le deviazioni quadrate tra le distanze degli oggetti originali o trasformati e le relative distanze euclidee nello spazio dimensionale ridotto Lo scopo dello spazio dimensionale ridotto evidenziare le relazioni tra gli oggetti Limitando la soluzione in modo che sia una combinazione lineare di variabili indipendenti possibile interpretare le dimensioni della soluzione alla luce di tali variabili Nel seguente esempio si vedr come possibile rappresentare 15 diversi termini indicanti parentela in tre dimensioni e come tale spazio pu essere interpretato in relazione a sesso generazione e grado di separazione di ciascuno di tali termini Esempio un esame dei termini indicanti parentela Rosenberg e Kim Rosenberg e Kim 1975 si prefiggono di analizzare 15 termini indicanti parentela zia fratello cugino padre nipote femmina di nonni nonno nonna nipote ma
276. mc Dimensione 2 i N N o Dimensione 1 Nel grafico possibile vedere UDITORIO e GRUPPI SECONDARI nella parte inferiore FOLLA nella parte superiore e gli altri gruppi sociali nel mezzo L esame dei modelli tra i singoli oggetti dipende dalle informazioni aggiuntive disponibili per le unit di analisi In questo caso nota la classificazione degli oggetti In altri casi possibile utilizzare variabili supplementari per etichettare gli oggetti inoltre possibile vedere che l analisi componenti principali categoriale non divide PUBBLICO da GRUPPI PRIMARI Sebbene la maggioranza delle persone normalmente non pensi alla propria famiglia come a una calca di persone nelle variabili utilizzate i due gruppi hanno ricevuti lo stesso punteggio per quattro variabili su cinque Normalmente si desidera esaminare possibili difetti delle variabili e delle categorie utilizzate Ad esempio un elevata intensit dell interazione e relazioni informali probabilmente indicano cose diverse per questi due gruppi In alternativa possibile prendere in considerazione una soluzione con un maggiore numero di dimensioni Pesi di componente La figura mostra il grafico dei pesi di componente I vettori linee sono relativamente lunghi a indicare di nuovo che le prime due dimensioni spiegano la maggior parte della varianza di tutte le variabili quantificate Nella prima dimensione tutte le variabili hanno pesi di componenti elevati
277. mensione Figura 11 27 Ripartizione dell adattamento e perdita Adattamento multiplo Adattamento singolo Perdita singola Dimensione Dimensione Dimensione Insieme Et in annia Stato civilea Animali domesticib Quotidiani letti pi spesso Musica preferita Preferenze abitative a Livello di scaling ottimale Nominale singola b Livello di scaling ottimale Nominale multipla Tornare al grafico di trasformazione per Et in anni Le quantificazioni per una variabile nominale sono non vincolate quindi il trend non decrescente visualizzato quando Et in anni stata trattata originariamente non pi presente Esiste quindi un trend non decrescente fino all et di 40 anni e un trend crescente a partire da quell et corrispondente a una relazione a forma di U 208 Capitolo 11 quadratica Le due categorie pi anziane ricevono ancora punteggi simili ed eventuali analisi possono includere la combinazione di queste categorie Figura 11 28 Grafico di trasformazione per Et in anni nominale 2 0 0 5 0 0 Quantificazioni di categoria per Et in anni 20 25 26 30 31 35 36 40 41 45 46 50 51 55 56 60 61 65 66 70 Et in anni Il grafico di trasformazione per Preferenze vicinato viene illustrato di seguito Il trattamento di Et in anni come nominale non influenza le quantificazioni per Preferenze vicinato da nessun punto di vista significativo La categoria centrale riceve la quantif
278. minazioni tra le persone mentre ci non accade per la categoria lavorativa inoltre possibile che le categorie Latino e Afro americano siano simili tra loro Statistiche e grafici Punteggi degli oggetti misure di discriminazione cronologia delle iterazioni correlazioni delle variabili originali e trasformate quantificazioni di categoria statistiche descrittive grafici a punti degli oggetti biplot grafici di categoria grafici di categoria congiunti grafici di trasformazione e grafici delle misure di discriminazione Dati I valori delle variabili stringa vengono sempre convertiti in interi positivi disposti in ordine alfabetico crescente I valori mancanti definiti dall utente i valori mancanti di sistema e i valori inferiori a 1 sono considerati valori mancanti possibile ricodificare o aggiungere una costante alle variabili con valori inferiori a 1 per fare in modo che siano considerate come non mancanti Assunzioni Tutte le variabili hanno un livello di scaling nominale multiplo I dati devono contenere almeno tre casi validi e l analisi basata su dati interi positivi La funzione di discretizzazione classifica automaticamente una variabile con valore frazionario raggruppandone i valori in categorie con una distribuzione vicina a quella normale e converte automaticamente i valori delle variabili stringa in valori interi positivi possibile specificare altri schemi di discretizzazione Procedure correlate Nel caso di du
279. mo principale Misure diverse di stress Visualizza valori di stress diversi La tabella include i valori di Raw Stress normalizzato Stress I Stress II S Stress della dispersione spiegata DAF e del coefficiente di congruenza di Tucker Scomposizione di stress Visualizza una scomposizione degli oggetti e delle sorgenti del valore finale Raw Stress normalizzato inclusa la media per oggetto e per sorgente 82 Capitolo 7 Variabili indipendenti trasformate Se stato selezionato un vincolo di combinazione lineare vengono visualizzati le variabili indipendenti trasformate e i pesi della regressione corrispondenti Correlazioni di variabili e dimensioni Se stato selezionato un vincolo di combinazione lineare vengono visualizzate le correlazioni tra le variabili indipendenti e le dimensioni dello spazio comune Salva in un nuovo file Le coordinate dello spazio comune i pesi dello spazio individuale le distanze le distanze trasformate e le variabili indipendenti trasformate possono essere salvate in file di dati di SPSS Statistics distinti Opzioni aggiuntive del comando PROXSCAL Per personalizzare lo scaling multidimensionale dell analisi delle distanze possibile incollare le impostazioni selezionate in una finestra di sintassi e modificare la sintassi del comando PROXSCAL risultante Il linguaggio della sintassi dei comandi consente inoltre di Specificare un elenco di variabili distinto per le trasformazioni e
280. mpagna gatti 41 45 e 2 2 1 0 1 2 Dimensione 1 Suggerimenti generali Una volta esaminati i risultati iniziali si desiderera probabilmente perfezionare l analisi modificando alcune delle specifiche dell analisi della correlazione canonica non lineare Di seguito vengono illustrati alcuni suggerimenti relativi a come definire la struttura dell analisi m Creare quanti pi insiemi possibile Inserire una variabile importante della quale si desidera prevedere il valore da sola in un insieme separato m Raggruppare le variabili considerate predittori in un unico insieme Se sono presenti molti predittori tentare di ripartirli in pi insiemi n Inserire ciascuna variabile nominale multipla da sola in un insieme separato Se tra le variabili presente un elevato grado di correlazione e non si desidera evitare che questa relazione domini la soluzione raggruppare tali variabili nello stesso insieme 212 Capitolo 11 Letture consigliate Consultare i testi seguenti per ulteriori informazioni sull analisi della correlazione canonica non lineare Carroll J D 1968 Generalization of canonical correlation analysis to three or more sets of variables In Proceedings of the 76th Annual Convention of the American Psychological Association 3 Washington D C American Psychological Association 227 228 De Leeuw J 1984 Canonical analysis of categorical data 2nd ed Leiden DSWO Press Horst P 1961 Generalize
281. mportanza chiave per la regressione Inoltre la presenza di variabili di soppressore indicata da un importanza ridotta per una variabile con coefficiente di dimensioni analoghe ai predittori importanti In contrasto con i coefficienti di regressione questa misura definisce l importanza dei predittori additivamente ovvero l importanza di un insieme di predittori la somma delle importanze dei singoli predittori La misura di importanza relativa di Pratt pari al prodotto del coefficiente di regressione e alla correlazione di ordine zero per un predittore Questi prodotti si aggiungono a R2 quindi vengono divisi per R2 generando una somma pari a 1 L insieme di predittori Design confezione e Nome marca ad esempio hanno importanza pari a 0 654 L importanza maggiore corrisponde a Design confezione con Design confezione Prezzo e Marchio di qualit che spiegano il 95 dell importanza per questa combinazione di predittori Multicollinearit Correlazioni ampie tra i predittori ridurranno notevolmente la stabilit di un modello di regressione Predittori correlati determineranno stime dei parametri instabili La tolleranza riflette il grado di reciproca relazione lineare tra le variabili indipendenti Questa misura la proporzione della varianza di una variabile non spiegata dalle altre variabili indipendenti dell equazione Se gli altri predittori possono spiegare una quantit elevata della varianza di un predittore quest ul
282. n Multivariate Analysis Vol V P R Krishnaiah ed Amsterdam North Holland 501 522 Eckart C e G Young 1936 The approximation of one matrix by another one of lower rank Psychometrika 1 211 218 Fisher R A 1938 Statistical methods for research workers Edinburgh Oliver and Boyd Fisher R A 1940 The precision of discriminant functions Annals of Eugenics 10 422 429 Gabriel K R 1971 The biplot graphic display of matrices with application to principal components analysis Biometrika 58 453 467 Gifi A 1985 PRINCALS Research Report UG 85 02 Leiden Department of Data Theory University of Leiden Gifi A 1990 Nonlinear multivariate analysis Chichester John Wiley and Sons Gilula Z e S J Haberman 1988 The analysis of multivariate contingency tables by restricted canonical and restricted association models Journal of the American Statistical Association 83 760 771 Gower J e J Meulman 1993 The treatment of categorical information in physical anthropology International Journal of Anthropology 8 43 51 Green P E e V Rao 1972 Applied multidimensional scaling Hinsdale Ill Dryden Press Green P E e Y Wind 1973 Multiattribute decisions in marketing A measurement approach Hinsdale Ill Dryden Press Greenacre M J 1984 Theory and applications of correspondence analysis London Academic Press Guttman L 1941 The quantification of a class of attributes A
283. n questa analisi possibile interpretarle come numeriche Figura 10 33 Grafico di trasformazione per Risultati lavorativi scolastici Trasformazione Livello scolastico di impiego 0 5 0 0 Quantificazioni 1 2 3 Categorie Le quantificazioni per le altre variabili come Risultati lavorativi scolastici non hanno ottenuto trasformazioni lineari e dovrebbero essere interpretate a livello di scaling ordinale La differenza tra la seconda e la terza categoria molto pi significativa di quella tra la prima e la seconda 166 Capitolo 10 Figura 10 34 Grafico di trasformazione per Eccessi alimentari Trasformazione Alimentazione esagerata 0 04 05 Quantificazioni 6 I Categorie Un caso interessante si verifica per le quantificazioni di Eccessi alimentari La trasformazione ottenuta lineare per le categorie da 1 a 3 ma i valori quantificati per le categorie 3 e 4 sono uguali Questo risultato mostra che i punteggi 3 e 4 non fanno differenza tra i pazienti e suggerisce che sia possibile utilizzare il livello di scaling numerico in una soluzione a due componenti ricodificando 4 come 3 Riepilogo del modello Regressione output Figura 10 35 Riepilogo modello Varianza spiegata Alfa di Totale Dimensione Cronbach autovalore di varianza 1 5 550 34 690 2 1 957 12 234 Totale 7 508 46 924 a Il totale di Alfa di Cronbach basato sul totale dell autovalore Per verificare l at
284. nacre e J Blasius ed New York Academic Press 179 209 Heiser W J e J J Meulman 1995 Nonlinear methods for the analysis of homogeneity and heterogeneity In Recent Advances in Descriptive Multivariate Analysis W J Krzanowski ed Oxford Oxford University Press 51 89 Horst P 1961 Generalized canonical correlations and their applications to experimental data Journal of Clinical Psychology 17 331 347 Horst P 1961 Relations among m sets of measures Psychometrika 26 129 149 Isra ls A 1987 Eigenvalue techniques for qualitative data Leiden DSWO Press Kennedy R C Riquier e B Sharp 1996 Practical applications of correspondence analysis to categorical data in market research Journal of Targeting Measurement and Analysis for Marketing 5 56 70 Kettenring J 1971 Canonical analysis of several sets of variables Biometrika 58 433 460 Kruskal J B 1964 Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis Psychometrika 29 1 28 Kruskal J B 1964 Nonmetric multidimensional scaling A numerical method Psychometrika 29 115 129 Kruskal J B 1965 Analysis of factorial experiments by estimating monotone transformations of the data Journal of the Royal Statistical Society Series B 27 251 263 Kruskal J B 1978 Factor analysis and principal components analysis Bilinear methods In International Encyclopedia of Statistics W H Kruskal e J M Tanur
285. nclude musica e vicinato Andom viene scalata come nominale multipla ed et come ordinale tutte le altre variabili vengono scalate come nominali singole L analisi richiede una configurazione iniziale casuale Per impostazione predefinita la configurazione iniziale numerica Tuttavia quando alcune variabili vengono elaborate come nominale singola senza possibilit di ordinamento consigliabile scegliere una configurazione iniziale casuale il caso della maggioranza delle variabili di questo studio Esame dei dati gt Per ottenere un analisi della correlazione canonica non lineare per questo insieme di dati dai menu scegliere Analizza Riduzione dimensionale Scaling ottimale Figura 11 1 Finestra di dialogo Scaling ottimale a Scaling ottimale Livello di scala ottimale Tutte le variabili sono di tipo nominale multiplo Alcune variabili non sono di tipo nominale multiplo Numero di insiemi di variabili O Un insieme Obi Analisi selezionata Correlazione canonica non lineare gt Selezionare Una o pi variabili non nominali multiple nel gruppo Livello di scaling ottimale gt Selezionare Pi insiemi nel gruppo Numero di insiemi di variabili gt Fare clic su Definisci 190 Capitolo 11 Figura 11 2 Finestra di dialogo Analisi della correlazione canonica non lineare Analisi della correlazione canonica non lineare OVERALS Set 1 di 1 amp Animali domestici animali
286. ne 1 Casi pesati per il numero di oggetti Spiegazione della similarit tra gli insiemi Esistono molti modi di misurare l associazione tra insiemi in un analisi della correlazione canonica non lineare ciascuno dei quali viene illustrato in dettaglio in una tabella separata o in un insieme di tabelle 196 Capitolo 11 Riepilogo dell analisi I valori di perdita e di adattamento indicano la bont dell adattamento della soluzione con analisi della correlazione canonica non lineare rispetto ai dati con quantificazione ottimale in relazione all associazione tra gli insiemi Il riepilogo della tabella di analisi mostra i valori di adattamento i valori di perdita e gli autovalori per l indagine di esempio Figura 11 13 Riepilogo dell analisi pensione a Somma Perdita Insieme 1 Insieme 2 Insieme 3 Media Autovalore Adattamento La perdita suddivisa tra le dimensioni e gli insiemi Per ogni dimensione e insieme la perdita rappresenta la proporzione di variabilit nei punteggi degli oggetti che non pu essere spiegata dalla combinazione ponderata delle variabili nell insieme La perdita media viene etichettata come Media Nell esempio la perdita media negli insiemi pari a 0 464 Si noti che per la seconda dimensione presente una perdita maggiore rispetto alla prima L autovalore per ogni dimensione pari a 1 meno la perdita media per la dimensione e indica quanta parte della relazione viene ind
287. ne utilizzato Ogni punto di riga e di colonna contribuisce all inerzia I punti di riga e di colonna che contribuiscono in modo significativo all inerzia di una dimensione sono importanti per essa Il contributo di un punto all inerzia di una dimensione la distanza quadrata ponderata dal punto proiettato sull origine divisa per l inerzia della dimensione La diagnostica che misura i contributi dei punti un ausilio importante nell interpretazione di una soluzione di analisi delle corrispondenze I punti dominanti nella soluzione possono essere rilevati con facilit Ad esempio quadri senior e junior sono dominanti nella prima dimensione con un contributo pari all 84 dell inerzia Tra i punti di colonna nessuno contribuisce per il 65 dell inerzia solo per la prima dimensione 223 Analisi corrispondenze Il contributo di un punto all inerzia delle dimensioni dipende dalla massa e della distanza dall origine I punti che sono lontani dall origine e hanno massa elevata forniscono il maggiore contributo all inerzia della dimensione Poich i punti supplementari non hanno alcun ruolo nella definizione della soluzione non contribuiscono all inerzia delle dimensioni Oltre a esaminare il contributo dei punti all inerzia per dimensione possibile esaminare il contributo delle dimensioni all inerzia per punto possibile esaminare in che modo l inerzia di un punto viene distribuita tra le dimensione calcol
288. nestra di dialogo Componenti principali categoriale Componenti principali categoriale Variabili di analisi Discretizea amp diaz pesof1 Spline ordinale 2 2 all tempo2 mestru 1 Spline ordinale 2 2 _ Mancanti _ calocibo 1 Spline ordinale 2 2 _opzioni _ esag 1 Spline ordinale 2 2 vomito 1 Spline ordinale 2 2 _output _ Definisci scala e peso Sava Variabili supplementari Grafici tempdiag Spline ordinale 2 2 Oggetto Dimensioni nella soluzione 2 gt Selezionare almeno due variabili dell analisi e specificare il numero di dimensioni nella soluzione gt Fare clic su OK Se necessario possibile specificare variabili supplementari che verranno inserite nella soluzione oppure variabili di etichetta per i grafici Definisci scala e peso in CATPCA possibile impostare il livello di scaling ottimale per le variabili dell analisi e le variabili supplementari che vengono scalate per impostazione predefinita come spline ordinali monotoni di secondo grado con due nodi interni inoltre possibile impostare il peso delle variabili dell analisi 30 Capitolo 3 Figura 3 3 Finestra di dialogo Definisci scala e peso a Componenti principali categorial Peso della variabile 1 Livello di scala ottimale O Spline ordinale Ordinale Spline nominale Nominale O Nominale multipla Numerica Spline Continua Annul
289. ngono mantenuti nella variabile con scaling ottimale I punti di categoria si troveranno su una linea retta vettore che passa per l origine Se tutte le variabili sono a livello numerico l analisi corrisponde all analisi delle componenti principali standard Componenti principali categoriale Discretizzazione Nella finestra di dialogo Discretizzazione possibile selezionare un metodo di ricodifica delle variabili Le variabili con valori frazionari sono raggruppate in sette categorie o nel numero di valori distinti della variabile se tale numero inferiore a sette con distribuzione approssimativamente normale se non viene specificato diversamente Le variabili stringa vengono sempre convertite in interi positivi tramite l assegnazione di indicatori di categoria in base a un ordinamento alfanumerico crescente La discretizzazione delle variabili stringa valida per questi valori interi Le altre variabili rimangono distinte per impostazione predefinita Le variabili discretizzate vengono quindi utilizzate per l analisi Figura 3 4 Finestra di dialogo Discretizza x Componenti principali categoriale Discretiz Variabili mestru Non specificato a calocibo Non specificato esag Non specificato vomito Non specificato purga Non specificato iperatt Non specificato Famig Non specificato emanc Non specificato amici Non specificato v Metodo Raggruppamento Raggruppamento Numero d
290. ni Impiegati giovani Segreteria Margine attivo I totali delle righe marginali mostrano che la societ ha molti pi quadri di livello sia junior sia senior rispetto a dirigenti e personale di segreteria Tuttavia la distribuzione delle posizioni senior e junior per i dirigenti approssimativamente la stessa rispetto a quella per i quadri Esaminando i totali di colonna possibile vedere che il numero dei non fumatori e dei fumatori medi simile Inoltre i forti fumatori sono molti meno rispetto agli appartenenti alle altre categorie Tuttavia queste categorie lavorative hanno qualcosa in comune con il tabagismo e cosa Esiste una correlazione tra la categoria lavorativa e il tabagismo Dimensionalit Idealmente l analisi delle corrispondenze dovrebbe rappresentare la relazione tra le variabili di riga e di colonna nel minor numero di dimensioni possibile Spesso per utile esaminare il massimo numero di dimensioni per vedere il contributo relativo di ogni dimensione Il numero massimo di dimensioni per una soluzione con analisi delle corrispondenze pari al numero di righe attive meno 1 o al numero dei colonne attive meno 1 a seconda di quale sia il valore minore Una riga o colonna attiva quella per la quale viene rilevato un insieme distinto di punteggi Le righe o colonne supplementari non sono attive Nell esempio il numero massimo di dimensioni min 5 4 1 3 Nella prima dimensione visualizzata la maggio
291. ni Nonno Nonna Nipote maschio di nonni e Sorella Le due sorgenti all origine della maggioranza dello stress sono i due gruppi che hanno ordinato i termini solo una volta Tale informazione suggerisce che tutti gli studenti hanno considerato fattori multipli nell ordinamento dei termini e che coloro che hanno potuto eseguire l ordinamento due volte si sono concentrati su una parte di tali fattori per il primo ordinamento considerando poi 1 fattori restanti durante il secondo Gli oggetti che spiegano la maggioranza dello stress sono quelli con grado pari a 2 Tali persone rappresentano le relazioni che non sono parte della famiglia nucleare Madre Padre Figlia Figlio ma che sono comunque pi strette di altre Questa posizione centrale potrebbe facilmente determinare qualche tipo di ordinamento differenziale dei termini Coordinate finali dello spazio comune Il grafico dello spazio comune fornisce una rappresentazione visuale delle relazioni tra gli oggetti 279 Scaling multidimensionale Figura 14 15 Coordinate spazio comune patie zio nipmas nipMesatamas _Z 0 owa 0000090 Moitas E figlio o Pre cugino meme BIRAWEm nipferela zia w 0090000 figliellazia pfiotiiem nanne cugino cugino nipfem nipmas Mb nio zi zio zia zia 8 Dimensione 1 Dimensione 2 serale uu fgieto Sila paer fratello Gear eee figlia adie ie PRE nonna nonno nonno nonna i madre ze zio cugino Dimensione 3
292. no a un numero massimo pari al numero delle variabili nell insieme pi piccolo Se sono presenti due o pi insiemi di variabili nell analisi e tutte le variabili sono definite come numeriche l analisi della correlazione canonica dello scaling ottimale equivale all analisi della correlazione canonica standard Sebbene SPSS Statistics non includa una procedura di analisi della correlazione canonica molte delle statistiche rilevanti possono essere ottenute tramite un analisi della varianza multivariata L analisi della correlazione canonica dello scaling ottimale ha svariate altre applicazioni Se sono presenti due insiemi di variabili uno dei quali include una variabile nominale dichiarata come nominale singola i risultati dell analisi possono essere interpretati in modo analogo a quelli di un analisi di regressione Se si considera la variabile come nominale multipla l analisi rappresenta un alternativa all analisi discriminante Raggruppando le variabili in pi di due insiemi possibile analizzare i dati in numerosi modi Analisi corrispondenze L obiettivo dell analisi delle corrispondenze generare biplot per le tabelle di corrispondenza In una tabella di corrispondenza si suppone che le variabili di riga e colonna rappresentino categorie non ordinate di conseguenza viene sempre utilizzato il livello nominale di scaling ottimale Entrambe le variabili vengono esaminate solo per quanto riguarda le relative informaz
293. no comportamenti pi posati leggere scrivere Questi comportamenti compaiono verso l estremit inferiore dell asse verticale m La parte superiore della dimensione verticale mostra le situazioni film giochi appuntamenti che limitano i comportamenti ovvero che impongono comportamenti pi socievoli estroversi mangiare baciare ridere Questi comportamenti compaiono verso l estremit superiore dell asse verticale m Al centro della dimensione verticale le situazioni sono separate nella dimensione orizzontale in base alle caratteristiche limite della situazione Quindi le situazioni pi lontane dai comportamenti intervista sono quelli associate a situazioni pi limitative mentre quelle pi vicine ai comportamenti stanza parco sono meno limitative 316 Capitolo 15 Trasformazioni delle distanze Figura 15 30 Grafico di trasformazione Grafico di trasformazione Distanza trasformata 0 2 4 6 8 10 Distanza semplice Non condizionale lineare trasformazione con intercetta Le distanze sono state considerate lineari in quest analisi quindi il grafico che mostra il confronto tra i valori trasformati e le distanze originali sotto forma di riga lineare L adattamento di questa soluzione buono ma non esclude che si possa ottenere un adattamento migliore con una trasformazione diversa delle distanze Modifica delle trasformazioni delle distanze ordinali gt Per produrre una soluzion
294. nsionale assegnare vincoli sullo spazio comune impostare criteri di convergenza specificare la configurazione iniziale che dovra essere utilizzata e scegliere i grafici e l output Distanze in colonne Se nella finestra di dialogo Formato dati si seleziona il modello in pi colonne per pi sorgenti verr visualizzata la seguente finestra principale Figura 7 3 Finestra di dialogo Distanze in colonne Scaling multidimensionale Distanze in colonne Distanze Modello proxi prox2 Vincoli Loova Yl Opzioni Righe gt rid Grafici Colonne c_id Pesi Incolla f Reimposta Annulla Aiuto gt Selezionare due o pi variabili delle distanze Si assume che ciascuna variabile sia una matrice delle distanze derivate da una sorgente distinta gt Selezionare una variabile di riga per definire le posizioni delle righe per le distanze contenute in ciascuna variabile di distanza gt Selezionare una variabile di colonna per definire le posizioni delle colonne per le distanze contenute in ciascuna variabile di distanza Le celle della matrice delle distanze che non vengono designate come righe o colonne vengono considerate come mancanti gt Se necessario selezionare un numero di variabili di ponderazione uguale al numero delle variabili delle distanze E inoltre possibile definire un modello di scaling multidimensionale assegnare vincol
295. ntervallo e scala Figura 11 7 Finestra di dialogo Definisci intervallo e scala OVERALS Definisci intervallo e Minimo 1 Massimo 5 Scala di misurazione Ordinale O Nominale multipla O Numerica discreta Digitare 5 come valore massimo per questa variabile Selezionare Nominale singola come scala di misurazione Fare clic su Continua V v v y Nella finestra di dialogo Analisi della correlazione canonica non lineare fare clic su Avanti per definire l ultimo insieme di variabili 193 Analisi della correlazione canonica non lineare OVERALS Figura 11 8 Finestra di dialogo Analisi della correlazione canonica non lineare za Analisi della correlazione canonica non lineare OVERALS Set 3di3 all Punteggio al test di matemati A Ni Punteggio al test linguistico I Variabili imusica 1 Ordinale abitaz 1 Ordinale Definisci intervallo e scala Etichetta grafici dei punteggi degli oggetti tramite Definisci intervallo Dimensioni nella soluzione p gt Selezionare Musica preferita e Preferenze vicinato come variabili per il terzo insieme gt Selezionare musica e fare clic su Definisci intervallo e scala Figura 11 9 Finestra di dialogo Definisci intervallo e scala i OVERALS Definisci intervallo e Minimo 1 Massimo 5 Scala di misurazione O Nominale multipla Digitare 5 come valore massimo
296. nty c amp Years sin P value atl E Probabilit E Peso dic E Peso dic L Probabilit E Peso dic E Indice di L ampiezza Peso dic Peso di campionamento cumulat Categorie Nessuna categoria variabile di scala L anteprima dei grafici usa i dati di esempio Modelli Seleziona da N Preferiti Elementi di base Barra Lineare ID gruppifpunti Ad area a hina MI A torta polare ven a pi di A dispersione punti Istogramma nine rca Alto Basso Propriet elemento Grafico a scatola Ri Assi duali ay ni A 14 gt Selezionare il modello Dispersione Punti e scegliere Dispersione semplice gt Selezionare Livello giornaliero di ozono come variabile dell asse y e Giorno dell anno come variabile dell asse x gt Fare clic su OK 129 Regressione categoriale Figura 9 48 Grafico a dispersione per Livello giornaliero di ozono e Giorno dell anno 40 00 30 00 20 00 ozon 10 00 0 00 100 00 200 00 300 00 400 00 doy La figura mostra la relazione tra Livello giornaliero di ozono e Giorno dell anno Se Giorno dell anno aumenta all incirca fino a 200 Livello giornaliero di ozono aumenta anch esso Tuttavia per valori maggiori di 200 di Giorno dell anno Livello giornaliero di ozono si riduce Questo modello a U invertito suggerisce una relazione quadratica tra le due variabili Una regress
297. numerico sottrarre il valore osservato pi piccolo da ogni valore e aggiungere 1 I valori frazionari vengono troncati dopo i decimali 41 42 Capitolo 4 gt Assunzioni Le variabili possono essere classificate in due o pi insiemi Le variabili dell analisi vengono scalate come nominali multiple nominali singole ordinali o numeriche Il numero massimo di dimensioni utilizzate nella procedura dipende dal livello di scaling ottimale delle variabili Se tutte le variabili sono specificate come ordinali nominali singole o numeriche il numero massimo di dimensioni inferiore ai due valori seguenti Il numero di osservazioni meno 1 o il numero totale delle variabili Se invece vengono definiti solo due insiemi di variabili il numero massimo di dimensioni uguale al numero delle variabili dell insieme pi piccolo Se alcune variabili sono nominali multiple il numero massimo di dimensioni uguale al numero totale delle categorie nominali multiple pi il numero di variabili nominali non multiple meno il numero di variabili nominali multiple Ad esempio se l analisi implica cinque variabili una delle quali nominale multipla e ha quattro categorie il numero massimo di categorie uguale a 7 4 4 1 Se si specifica un numero maggiore del massimo verr utilizzato il valore massimo Procedure correlate Se ciascun insieme contiene una variabile l analisi della correlazione canonica non lineare equivale all anali
298. nza O Centroidi Termine penalit O Inizi casuali multipli Intensit Intervallo Personalizzato Configurazione personalizzata Annulla Aiuto Configurazione iniziale Selezionare una delle alternative seguenti m Classica La matrice di distanza rettangolare viene utilizzata come supplemento per i valori tra i blocchi ovvero i valori che si trovano tra le righe e tra le colonne della matrice di scaling multidimensionale simmetrica completa Dopo aver formato la matrice completa come configurazione iniziale viene utilizzata una soluzione di scaling classica I valori tra i blocchi 88 Capitolo 8 possono essere riempiti mediante assegnazione utilizzando l ineguaglianza del triangolo o le distanze di Spearman Ross Cliff Come valori iniziali per gli oggetti riga e colonna l inizio Ross Cliff utilizza i risultati di una scomposizione di valori singoli sulla matrice di distanza quadrata e con doppia centratura Corrispondenza L inizio corrispondenza utilizza i risultati di un analisi di corrispondenza sui dati invertiti similarit anzich dissimilarit con normalizzazione simmetrica dei punteggi di riga e di colonna Centroidi La procedura inizia con il posizionamento degli oggetti riga nella configurazione utilizzando la scomposizione di un autovalore A questo punto gli oggetti colonna vengono posizionati in corrispondenza del centroide delle scelte specificate Per il numer
299. nze o le similarit tra le categorie della variabile di colonna m Personalizzata necessario specificare un valore compreso tra 1 e 1 Il valore 1 corrisponde al valore principale per colonna il valore 1 al valore principale per riga e il valore 0 al valore simmetrico Tutti gli altri valori distribuiscono vari livelli di inerzia nei punteggi sia di riga che di colonna Questo metodo utile per creare biplot personalizzati Analisi delle corrispondenze Statistiche Nella finestra di dialogo Statistiche possibile specificare l output numerico 53 Analisi corrispondenze Figura 5 5 Finestra di dialogo Statistiche a Analisi delle corrispondenze Statistiche V Tavola di corrispondenza V Riepilogo dei punti di riga V Riepilogo dei punti di colonna M Permutazioni della tavola di corrispondenza Dimensione massima permutazioni 1 V Profili di riga M Profili di colonna Statistiche di confidenza per Punti di riga Annulla Aiuto Tabella di corrispondenza Tavola di contingenza delle variabili di input con i totali marginali di riga e di colonna Riassunto dei punti di riga Per ciascuna categoria di riga i punteggi la massa l inerzia il contributo all inerzia della dimensione e il contributo della dimensione all inerzia del punto Riassunto dei punti di colonna Per ciascuna categoria di colonna i punteggi la massa l inerzia il contributo all inerzia della dim
300. o Do Importanza relativa di ciascuna dimensione indicata come rapporto tra la somma dei quadrati di una dimensione e il totale della somma dei quadrati Nella configurazione di corrispondenza iniziale ciascuno degli spazi individuali ha una specificit pi alta Ci vuol dire che ciascun caso in cui i partecipanti hanno fornito delle preferenze relativamente ai cibi consumati a colazione sono pi marcatamente associati a una dimensione specifica Le sorgenti pi divergenti rimangono Colazione con succo pancetta uova e bibita e Snack con bibita 307 Unfolding multidimensionale Figura 15 22 Grafico congiunto dello spazio individuale Colazione con succo pancetta uova e bibita per la configurazione iniziale della corrispondenza 10 Toastalla cannelfgane integrale imburrato 5 Dolcetto glassato Panino dolce con margarina x Banedelarernanneliata 24 207 aaeeio mirtilli e margarina Z Torta al caff 9392592 4 o 00 156 3 8 i e ta v her ar 08 E Pasticcini danesi a 29 3614 19 33 i an eS cio 5 Toast burro e marmellata Toast imburrato Joss Toastcon mostarda Toastcon margarina 10 5 0 5 10 Dimensione 1 La maggiore specificit evidente nel grafico congiunto dello spazio individuale Colazione con succo pancetta uova e bibita La sorgente pesa ancora pi significativamente sulla prima dimensione rispetto al punto iniziale tradizionale di Spearman Di conseguenza gli oggetti riga
301. o come variabili di etichettatura gt Nel gruppo Grafici della finestra di dialogo Analisi della corrispondenze multiple fare clic su Continua e quindi su Variabile 253 Figura 13 4 Finestra di dialogo Grafici delle variabili lt a MCA Grafici delle variabili filetto testa taglio punta lunghz ottone filetton testan taglion puntan ottonen oggetton lunghzn puntal ottonel testal tagliol lunghal filettol hom1_1 hom2_1 puncqi puncq2 ottegi ottcg2 tescql gt z Grafici di categoria Grafici di categoria congiunti Grafici di trasformazione Includi grafici residui Misure di discriminazione Visualizza grafico Usa tutte le variabili O Usa le variabili selezionate Annulla Aiuto Analisi corrispondenze multiple gt Scegliere di generare un grafico di categoria congiunto per le variabili da filettatura a lunghezza gt Fare clic su Continua gt Nella finestra di dialogo Analisi della corrispondenze multiple fare clic su OK Riepilogo del modello Regressione output L analisi di omogeneit pu calcolare una soluzione per numerose dimensioni Il numero massimo di dimensioni pari al numero di categorie meno il numero delle variabili senza dati mancanti oppure al numero di osservazioni meno 1 a seconda di quale dei due sia il valore minore Tuttavia consigliabile utilizzare il numero massimo di dimensioni solo raram
302. o di identit n insieme a vincoli Scaling multidimensionale Grafici Versione 1 Nella finestra di dialogo Grafici possibile specificare i grafici che si desidera creare Se stato impostato il formato dei dati Distanze in colonne la finestra di dialogo Grafici includer le opzioni riportate di seguito Per i grafici Peso dello spazio individuale Distanze originali con distanze trasformate e Distanze trasformate con distanze possibile specificare le sorgenti per cui devono essere creati i grafici L elenco delle sorgenti disponibili corrisponde all elenco delle variabili delle distanze della finestra principale 79 Scaling multidimensionale PROXSCAL Figura 7 10 Finestra di dialogo Grafici versione 1 Scaling multidimensionale Grafici Grafici Stress Distanze originali con distanze trasformate Spazio comune C Distanze trasformate con distanze Spazi individuali variabili indipendenti trasformate correlazioni di variabili e dimensioni Grafici sorgente O Iutte le sorgenti Seleziona sorgenti Disponibili Selezionate prox1 proxi prox2 prox3 prox2 Annulla Aiuto Stress Viene creato un grafico in cui sono rappresentati il valore di Raw Stress e le dimensioni Il grafico viene creato solo se il numero massimo delle dimensioni maggiore del numero minimo delle dimensioni Spazio comune Viene visualizzata una matrice di grafici a dispersione delle coordinate dello spazio com
303. o di 3 e un valore massimo di 365 Il suo utilizzo in una regressione categoriale corrisponde all utilizzo di una variabile con 365 categorie Analogamente Visibilit in miglia varia da 0 a 350 Per semplificare l interpretazione delle analisi discretizzare le variabili in intervalli uguali di lunghezza 10 La variabile Altezza di base inversione varia da 111 a 5000 Una variabile con questo numero di categorie determiner relazioni molto complesse Tuttavia la discretizzazione di questa variabile in intervalli uguali di lunghezza 100 genera circa 50 categorie Utilizzando una variabile con 50 categorie anzich una variabile con 500 semplifica notevolmente le interpretazioni Gradiente pressione mm Hg varia da 69 a 107 La procedura esclude dall analisi eventuali categorie codificate con numeri negativi ma la discretizzazione della variabile in intervalli uguali di lunghezza 10 genera circa 19 categorie Temperatura gradi F varia da 25 a 93 sulla scala Fahrenheit Per analizzare i dati come se fossero espressi sulla scala Celsius discretizzare la variabile in intervalli uguali di lunghezza 1 8 possibile che siano necessarie discretizzazioni diverse per le variabili Le scelte utilizzate nell esempio sono puramente soggettive Per ottenere un numero inferiore di categorie scegliere intervalli pi ampi Ad esempio Giorno dell anno potrebbe essere diviso in mesi dell anno o stagioni Selezione del tipo di trasformazione
304. o di diverse azioni quotate alla borsa S amp P 500 Ogni caso rappresenta una diversa societ nhis2000_subset sav Il National Health Interview Survey NHIS un sondaggio di grandi dimensioni condotto sulla popolazione civile americana Le interviste vengono realizzate di persona e si basano su un campione rappresentativo di famiglie a livello nazionale Per ogni membro di una famiglia vengono raccolte osservazioni e informazioni di carattere demografico relative allo stato di salute Questo file di dati contiene un sottoinsieme delle informazioni ottenute dall indagine del 2000 National Center for Health Statistics National Health Interview Survey 2000 File di dati e documentazione di dominio pubblico Stp ftp cdc gov pub Health_Statistics NCHS Datasets NHIS 2000 Accesso 2003 ozone sav I dati includono 330 osservazioni basate su sei variabili meteorologiche per quantificare la concentrazione dell ozono dalle variabili rimanenti I precedenti ricercatori Breiman e Friedman 1985 e Hastie e Tibshirani 1990 hanno rilevato non linearit tra queste variabili che impediscono un approccio di regressione standard pain_medication sav File di dati ipotetici che contiene i risultati di un test clinico per stabilire la cura antinfiammatoria per il trattamento del dolore generato dall artrite cronica Di particolare interesse il test ha evidenziato il tempo che impiega il farmaco ad avere effetto e il confronto con altri farmaci es
305. o di scelte specificare un numero intero positivo compreso tra e il numero delle variabili di distanza Inizi casuali multipli Vengono calcolate soluzioni per numerose configurazioni iniziali scelte in modo casuale e quella che presenta lo stress penalizzato minore viene indicata come soluzione ottimale Personalizzata possibile selezionare le variabili che contengono le coordinate della configurazione iniziale specificata Il numero delle variabili selezionate deve essere uguale al numero massimo di dimensioni specificato La prima variabile corrisponde alle coordinate sulla dimensione 1 la seconda variabile alle coordinate sulla dimensione 2 e cos via Il numero dei casi di ciascuna variabile deve essere uguale al numero combinato degli oggetti riga e colonna Le coordinate di riga e colonna devono essere sovrapposte con le coordinate della colonna che seguono le coordinate della riga Criteri di iterazione Specificare i valori dei criteri di iterazione Convergenza stress L algoritmo di iterazione si interrompe quando la differenza relativa tra valori di stress penalizzato consecutivi inferiore al numero specificato che deve essere non negativo Stress minimo L algoritmo si interrompe quando lo stress penalizzato scende al di sotto del numero specificato che deve essere non negativo Max iterazioni L algoritmo esegue il numero di iterazioni specificato a meno che non sia stato soddisfatto in precedenza uno dei criteri
306. o individuale C Distanze C Distanze trasformate Annulla Aiuto Visualizzazione Selezionare una o pi delle seguenti opzioni per la visualizzazione Dati iniziali Include le distanze originali e se presenti i pesi dei dati la configurazione iniziale e le coordinate fisse m Inizi multipli Visualizza il seme del numero casuale e il valore di stress penalizzato per ciascun inizio casuale Dati iniziali Visualizza le coordinate dello spazio comune iniziale Cronologia iterazioni Visualizza la cronologia delle iterazioni dell algoritmo principale m Misure di adattamento Visualizza diverse misure La tabella contiene varie misure di bont dell adattamento inadeguatezza dell adattamento correlazione variazione e non degenerazione Scomposizione di stress Visualizza una scomposizione di oggetti righe e sorgenti di stress penalizzato tra cui riga colonna e medie e deviazioni standard della sorgente m Distanze trasformate Visualizza le distanze trasformate Spazio comune finale Visualizza le coordinate dello spazio comune Pesi dello spazio Visualizza i pesi dello spazio individuale Questa opzione disponibile solo se si specifica uno dei modelli delle differenze individuali A seconda del modello i pesi dello spazio vengono scomposti in pesi di rotazione e pesi di dimensione anch essi visualizzati nel grafico m Spazi individuali Vengono visualizzate le coordinate degli spazi individuali
307. o stati selezionati dai dipartimenti sottoposti a campione in base al piano di campionamento specificato nel file recidivism_cs csplan Poich viene utilizzato un metodo PPS Probability Proportional to Size probabilit proporzionale alla dimensione esiste anche un file contenente le probabilit di selezione congiunte recidivism_cs_jointprob sav rfm_transactions sav File di dati ipotetici contenente i dati delle transazioni di acquisto inclusa la data di acquisto gli articoli acquistati e il valore monetario di ciascuna transazione salesperformance sav File di dati ipotetici che prende in esame la valutazione di due nuovi corsi di formazione alle vendite Sessanta dipendenti divisi in tre gruppi ricevono tutti la formazione standard In pi al gruppo 2 viene assegnato un corso di formazione tecnica e al gruppo 3 un esercitazione pratica Alla fine del corso di formazione ciascun dipendente viene sottoposto a un esame e il punteggio conseguito viene registrato Ciascun caso nel file di dati rappresenta un diverso partecipante Il file di dati include il gruppo a cui assegnato il partecipante e il punteggio conseguito all esame finale 329 File di esempio satisf sav File di dati ipotetico che prende in esame un indagine sulla soddisfazione dei clienti condotta da una societa di vendita al dettaglio presso 4 negozi Sono stati intervistati 582 clienti e ciascun caso rappresenta le risposte ottenute da un singolo clien
308. odifica totalmente arbitrario D altro canto si presume che Lavoro sia una variabile ordinale Le categorie originali formano una progressione da stagista a manager Maggiore il codice numerico maggiore il livello della posizione lavorativa all interno della scala aziendale Tuttavia sono note solo informazioni sull ordinamento mentre non ci sono dati sulla distanza tra categorie adiacenti Al contrario si pu presumere che et sia un valore numerico Nel caso di et le distanze tra i valori sono 3 Introduzione alle procedure di scaling ottimale per i dati categoriali intrinsicamente significative La distanza tra 20 e 22 la stessa esistente tra 25 e 27 mentre la distanza tra 22 e 25 maggiore di entrambe le precedenti Selezione del livello di scaling ottimale importante comprendere che nessuna propriet intrinseca di una variabile predefinisce automaticamente il livello di scaling ottimale da specificare per la variabile possibile esplorare i dati in qualsiasi modo purch sia appropriato e faciliti l interpretazione Analizzando ad esempio una variabile di livello numerico a livello ordinale l utilizzo di una trasformazione non lineare pu consentire una soluzione in un numero minore di dimensioni I due esempi che seguono illustrano come il livello ovvio di misurazione possa non corrispondere al livello di scaling ottimale migliore Si supponga che una variabile ordini gli oggetti in gruppi di
309. odificano riguardano Design confezione Poich tutti gli altri predittori sono trattati numericamente le differenze tra le categorie e l ordine di queste sono conservati per queste variabili Di conseguenza le correlazioni non possono modificarsi Adattamento del modello e coefficienti La procedura di regressione categoriale genera un R2 pari a 0 948 a indicare che circa il 95 della varianza delle classificazioni di preferenza trasformata spiegata dalla regressione nei predittori trasformati in modo ottimale La trasformazione dei predittori migliora l adattamento rispetto all approccio standard Figura 9 18 Riepilogo del modello per regressione categoriale R quadrato R multiplo R quadrato corretto Variabile dipendente Preferenza Stimatori Confezione Marca Prezzo Sigillo di garanzia Soddisfatti o rimborsati La seguente tabella mostra i coefficienti di regressione standardizzati La regressione categoriale determina la standardizzazione delle variabili di conseguenza solo i coefficienti standardizzati vengono riportati Questi valori sono divisi per gli errori standard corrispondenti generando un test F per ogni variabile Tuttavia il test per ogni variabile contingente rispetto agli altri predittori nel modello In altre parole il test determina se l omissione di una variabile di predittore dal modello in presenza di tutti gli altri predittori peggiora in modo significativo le capacit di previsione del modello st
310. oggetti inclusi in tale categoria Relazione con altre procedure di Categories L analisi delle corrispondenze multiple conosciuta anche come analisi di omogeneit o scaling duale In presenza di due sole variabili essa fornisce risultati confrontabili ma non identici all analisi delle corrispondenze L analisi delle corrispondenze genera un output univoco che riassume l adattamento e la qualit della rappresentazione della soluzione incluse informazioni sulla stabilit Di conseguenza l analisi delle corrispondenze generalmente preferibile all analisi delle corrispondenze multiple in presenza di due variabili Un altra differenza tra le due procedure rappresentata dal fatto che l input per l analisi delle corrispondenze multiple una matrice di dati in cui le righe sono oggetti e le colonne sono variabili mentre l input per l analisi delle corrispondenze pu essere la stessa matrice di dati una matrice di distanza generale o una tavola di contingenza congiunta vale a dire una matrice aggregata in cui sia le righe che le colonne rappresentano categorie di variabili L analisi delle corrispondenze multiple pu essere considerata anche come un analisi delle componenti principali dei dati scalati a livello nominale multiplo Relazione con le tecniche standard L analisi delle corrispondenze multiple pu essere considerata come l analisi di una tavola di contingenza a pi vie Le tavole di contingenza a pi
311. ogo Regressione categoriale 116 Capitolo 9 Figura 9 27 Finestra di dialogo Definisci scala za Regressione categoriale definis Livello di scala ottimale O Spline ordinale O Ordinale Numerica Spline Grado 3 Nodi interni E gt Selezionare Nominale come livello di scaling ottimale gt Fare clic su Continua gt Nella finestra di dialogo Regressione categoriale scegliere Discretizza Figura 9 28 Finestra di dialogo Discretizza z Regressione categoriale discretizza Variabili ozon Non specificato ibh Raggruppamento 100 dpg Raggruppamento 10 vis Raggruppamento 10 temp Non specificato Metodo Raggruppamento w Raggruppamento si E Numero di categorie F Distribuzione Normale Uniforme Intervalli uguali 1 8 gt Selezionare abi gt Selezionare Intervalli uguali e digitare 100 come lunghezza dell intervallo gt Fare clic su Cambia 117 Regressione categoriale Selezionare gp vis e gda Digitare 10 come lunghezza dell intervallo Fare clic su Cambia Selezionare temp Digitare 1 8 come lunghezza dell intervallo Fare clic su Cambia Fare clic su Continua VV VV V V Vy V VV y Nella finestra di dialogo Regressione categoriale fare clic su Grafici Figura 9 29 Finestra di dialogo Grafici z Regressione categoriale grafici Grafici dei residui
312. omando 26 grafici 15 grafici di trasformazione 110 importanza 108 intercorrelazioni 106 livello di scaling ottimale 16 regolarizzazione 22 residuo 112 Salva 25 statistiche 15 regressione Ridge in regressione categoriale 22 residuo in regressione categoriale 112 riepilogo del modello in analisi delle corrispondenze multiple 253 Scaling multidimensionale 68 70 74 266 funzioni aggiuntive del comando 82 grafici 68 78 80 grafici di trasformazione 281 misure di stress 277 282 modello 75 opzioni 77 output 80 spazio comune 278 282 statistiche 68 vincoli 76 spazi individuali nell unfolding multidimensionale 299 306 341 spazio comune vincoli sullo spazio comune in scaling multidimensionale 278 282 nell unfolding multidimensionale 86 nell unfolding multidimensionale 289 292 298 305 315 319 standardizzazione in analisi delle corrispondenze 50 statistiche descrittive in regressione categoriale 23 statistiche di confidenza in analisi delle corrispondenze 52 224 stress penalizzato nell unfolding multidimensionale 288 297 304 314 318 tabelle di corrispondenza in analisi delle corrispondenze 218 247 termine di penalita nell unfolding multidimensionale 87 trasformazioni delle distanze nell unfolding multidimensionale 84 triplot in analisi Componenti principali categoriale 37 unfolding a tre vie nell unfolding multidimensionale 292 Unfolding multidimensi
313. ommand Syntax Reference Parte Il Esempi Capitolo Regressione categoriale L obiettivo della regressione categoriale con scaling ottimale descrivere la relazione tra una variabile di risposta e un insieme di predittori Quantificando tale relazione possibile stimare i valori della risposta per qualsiasi combinazione di predittori Nel presente capitolo verranno utilizzati due esempi per illustrare le analisi relative alla regressione con scaling ottimale Il primo esempio utilizza un limitato insieme di dati per illustrare i concetti di base Il secondo esempio utilizza un insieme di variabili e di osservazioni pi ampio in un esempio pratico Esempio Dati relativi a un battitappeto Come esempio tipico Green e Wind 1973 un azienda interessata alla commercializzazione di un nuovo battitappeto desidera esaminare l influenza di cinque fattori sulle preferenze del consumatore ovvero design della confezione marca prezzo la presenza di un marchio di qualit e una garanzia Soddisfatti o rimborsati Esistono tre livelli di fattore per il design della confezione che differiscono per la posizione della spazzola dell applicatore tre marchi K2R Glory e Bissell tre livelli di prezzo e due livelli no o s per ciascuno degli ultimi due fattori La tabella seguente mostra le variabili utilizzate nello studio relativo al battitappeto con relative etichette e valori Tabella 9 1 Variabili esplicative nello studio r
314. omogeneit fa inoltre riferimento al fatto che la correttezza dell analisi maggiore quando le variabili sono omogenee ovvero quando suddividono gli oggetti in cluster con categorie uguali o simili Esempio Caratteristiche degli articoli da ferramenta Per esaminare il funzionamento dell analisi della corrispondenza multipla si utilizzano i dati ricavati da Hartigan Hartigan 1975 riportati in screws sav Per ulteriori informazioni vedere File di esempio in Appendice A a pag 321 Questo insieme di dati contiene informazioni sulle caratteristiche di viti bulloni dadi e puntine La seguente tabella mostra le variabili insieme alle relative etichette e le etichette di valore assegnate alle categorie di ciascuna variabile nel file di dati relativi agli articoli da ferramenta di Hartigan Tabella 13 1 File di dati relativi agli articoli da ferramenta di Hartigan Nome di variabile Etichetta di valore Etichetta del valore filettatura Filettatura S Filettatura No_Filettatura testa Forma della testa Piatta A coppa Conica Arrotondata Cilindrica rientes Rientro della testa Nessuno A stella A feritoia inferiore Forma parte inferiore A punta Piatta lunghezza Lunghezza in mezzi 1 2 in 1 in 1_1 2 in 2 in 2 1 2 in pollici ottone Ottone Si_Ot No_Ot oggetto Oggetto puntina chiodo1 chiodo2 chiodo3 chiodo4 chiodo5 chiodo6 chiodo7 chiodo8 vitel vite2 vite3 vite4 vite
315. onale 83 285 308 funzioni aggiuntive del comando 92 grafici 83 89 misure 288 291 297 304 314 318 modello 84 opzioni 87 output 90 soluzioni degenerate 285 spazi individuali 299 306 spazio comune 289 292 298 305 315 319 statistiche 83 trasformazioni delle distanze 316 320 unfolding a tre vie 292 vincoli sullo spazio comune 86 valori di adattamento in analisi della correlazione canonica non lineare 196 valori di perdita in analisi della correlazione canonica non lineare 196 valori mancanti in analisi Componenti principali categoriale 32 in analisi delle corrispondenze multiple 59 in regressione categoriale 19 variabili indipendenti trasformate in scaling multidimensionale 80 varianza spiegata in analisi Componenti principali categoriale 35 143 166 vincoli in scaling multidimensionale 76 Indice
316. ondenze Statistiche 52 Analisi delle corrispondenze Grafici 53 Opzioni aggiuntive del comando CORRESPONDENCE 0 55 6 Analisi corrispondenze multiple 56 Definire il peso della variabile nell analisi delle corrispondenze multiple 58 Discretizzazione dell analisi delle corrispondenze multiple 58 Valori mancanti nell analisi delle corrispondenze multiple 0 0 0 cece eee ees 59 Opzioni dell analisi delle corrispondenze multiple 61 vi Output dell analisi delle corrispondenze multiple 63 Analisi delle corrispondenze multiple Salva 64 Grafici di oggetti dell analisi delle corrispondenze multiple 64 Grafici di variabili dell analisi delle corrispondenze multiple 65 Opzioni aggiuntive del comando MULTIPLE CORRESPONDENCE aaa 66 7 Scaling multidimensionale PROXSCAL 68 Distanze in matrici per colonne LL 70 Distanze IMCOIONNE cresket bdenia ep e dae I n TA Distanze in una sola colonna LL 72 Crea le distanze dai dati 73 Crea misure dalidatii iii i A e a 74 Definire un modello di scaling multidimensionale 0 00000 cece e eee eeaee 75 Scaling multidimensionale Vincoli 0 2 0 cece cece eee eee 76 Scaling multidimensionale Opzioni 77 Scaling multidimensionale Grafici Versione 1 1 1 eee teens 78 Scaling multidimensionale Grafici Versione 2 80 Scaling multidimensionale Output 80 Opzioni aggiuntive del comando PROXSCAL
317. one della varianza spiegata relativa alla varianza residua della risposta rimanente dopo la rimozione degli effetti delle altre variabili Ad esempio Design confezione ha una correlazione parziale di 0 955 Rimuovendo gli effetti delle altre variabili Design confezione spiega 0 955 2 0 91 91 della variazione delle classificazioni della preferenza Sia Prezzo che Marchio di qualit spiegano anch essi una parte significativa della varianza se gli effetti delle altre variabili vengono rimossi In alternativa alla rimozione degli effetti delle variabili dalla risposta e da un predittore possibile rimuovere gli effetti solo dal predittore La correlazione tra la risposta e i residui derivanti dalla regressione di un predittore sugli altri la correlazione di parte Elevando al quadrato tale valore si ottiene una misura della proporzione della varianza spiegata rispetto alla varianza totale della risposta Se si rimuovono gli effetti di Nome marca Marchio di qualit Garanzia Soddisfatti o rimborsati e Prezzo da Design confezione la parte restante di Design confezione spiega 0 733 2 0 54 54 della variazione nelle classificazioni della preferenza Importanza Oltre ai coefficienti di regressione e alle correlazioni la misura di importanza relativa di Pratt Pratt 1987 consente di interpretare i contributi dei predittori alla regressione Singoli valori di importanza elevati rispetto ad altri corrispondono a predittori di i
318. onenti non correlate che rappresentano la maggior parte delle informazioni disponibili nelle variabili originali Questa tecnica risulta particolarmente utile nel caso in cui non sia possibile interpretare in modo efficiente le relazioni tra gli oggetti soggetti e unit a causa della presenza di un numero troppo elevato di variabili Se la dimensione viene ridotta sar possibile interpretare un numero ridotto di componenti anzich un numero elevato di variabili L analisi delle componenti principali standard presume l esistenza di relazioni lineari tra le variabili numeriche L approccio di scaling ottimale consente d altra parte di scalare le variabili a livelli diversi Le variabili categoriali vengono quantificate in modo ottimale nella dimensione specificata ed quindi possibile definire le relazioni non lineari tra variabili Esempio L analisi delle componenti principali categoriale consente di visualizzare graficamente la relazione esistente tra una categoria lavorativa una divisione una regione la quantit di spostamenti richiesti alta media e bassa e il grado di soddisfazione A volte ci si pu rendere conto che due dimensioni sono sufficienti per considerare un entit notevole della varianza La prima dimensione pu distinguere la categoria lavorativa rispetto alla regione mentre la seconda pu distinguere la divisione dalla quantit di spostamenti Pu anche risultare che un grado di soddisfazione alto sia correla
319. orie Di conseguenza l omissione di VITE l unico oggetto con una testa a stella influenza in modo significativo l interpretazione della seconda dimensione Questa dimensione differenzia ora gli oggetti in base alle variabili Ottone Forma della testa e Lunghezza in mezzi pollicii Letture consigliate Consultare i testi seguenti per ulteriori informazioni sull analisi delle corrispondenze multiple Benz cri J 1992 Correspondence analysis handbook New York Marcel Dekker Guttman L 1941 The quantification of a class of attributes A theory and method of scale construction In The Prediction of Personal Adjustment P Horst ed New York Social Science Research Council 319 348 Meulman J J 1982 Homogeneity analysis of incomplete data Leiden DSWO Press Meulman J J 1996 Fitting a distance model to homogeneous subsets of variables Points of view analysis of categorical data Journal of Classification 13 249 266 Meulman J J e W J Heiser 1997 Graphical display of interaction in multiway contingency tables by use of homogeneity analysis In Visual Display of Categorical Data M Greenacre e J Blasius ed New York Academic Press 277 296 Nishisato S 1984 Forced classification A simple application of a quantification method Psychometrika 49 25 36 265 Analisi corrispondenze multiple Tenenhaus M e F Young 1985 An analysis and synthesis of multiple correspondence analysis opti
320. orrispondenze multiple L analisi delle corrispondenze multiple tenta di generare una soluzione in cui gli oggetti della stessa categoria sono rappresentati in un grafico vicini tra loro mentre quelli di categorie diverse sono inseriti in posizioni distanti Ciascun oggetto si trova il pi vicino possibile ai punti delle categorie a esso applicabili In questo modo le categorie dividono gli oggetti in sottogruppi omogenei Le variabili sono considerate omogenee quando classificano gli oggetti nelle stesse categorie negli stessi sottogruppi Per una soluzione monodimensionale l analisi delle corrispondenze multiple assegna valori di scala ottimali quantificazioni di categoria a ciascuna categoria di ciascuna variabile in modo che globalmente in media le categorie abbiano la massima variabilit Per una soluzione bidimensionale l analisi delle corrispondenze multiple individua un secondo insieme di quantificazioni delle categorie per ciascuna categoria di ciascuna variabile non collegata al primo insieme tentando nuovamente di massimizzare la variabilit e cos via Poich le categorie di una variabile ricevono tanti punteggi quante sono le dimensioni si suppone che le variabili nell analisi siano nominali multiple a livello di scaling ottimale L analisi delle corrispondenze multiple assegna anch essa punteggi agli oggetti nell analisi in modo che le quantificazioni di categoria siano le medie o centroidi dei punteggi degli
321. ossibile estrarre una linea attraverso l origine e i due attributi dell immagine uomini e yuppie proiettare le marche su tale linea I due attributi sono uno il contrario dell altro a indicare che il modello di associazione delle marche per uomini invertito rispetto al modello per yuppie Ovvero la categoria uomini viene associata con la maggiore frequenza alla marca FE e con la frequenza minore alla marca CC laddove la categoria yuppie associata alla marca CC con la frequenza maggiore e alla marca EE con quella minore Esempio Chilometraggio aereo tra citt L analisi delle corrispondenze non limitata alle tabelle di frequenza Le voci possono essere costituite da qualsiasi misura positiva di corrispondenza Nell esempio vengono utilizzati i chilometraggi aerei tra 10 citt americane Questi insiemi di dati sono reperibili nel file flving sav Per ulteriori informazioni vedere File di esempio in Appendice A a pag 321 Tabella 12 2 Etichette citt Citt Etichetta Citt Etichetta Atlanta Atl Miami Mia Chicago Chi New York NY Denver Den San Francisco SF Houston Hou Seattle Sea Los Angeles LA Washington DC DC 241 Analisi corrispondenze gt Per visualizzare i chilometraggi prima pesare i casi tramite la variabile dist Dai menu scegliere Dati Pesa casi Figura 12 35 Finestra di dialogo Pesa casi 3 Pesa casi P riga colonna gt Pesa i casi per dist gt Fare clic su OK gt
322. p _var sav 270 Capitolo 14 Figura 14 5 Finestra di dialogo Vincoli Scaling multidimensionale Vincoli gt Selezionare gender gener e degree come variabili vincolo Si noti che la variabile gender ha un valore mancante definito dall utente 9 mancante per cugino La procedura considera tale valore come una categoria valida Di conseguenza improbabile che la trasformazione lineare predefinita risulti appropriata Utilizzare invece una trasformazione nominale 271 Scaling multidimensionale Figura 14 6 Finestra di dialogo Vincoli z Scaling multidimensionale Vincoli Selezionare gender Selezionare Nominale dall elenco a discesa Trasformazioni di variabili indipendenti Fare clic su Cambia Fare clic su Continua Nella finestra di dialogo Scaling multidimensionale fare clic su Grafici 272 Capitolo 14 Figura 14 7 Finestra di dialogo Grafici Scaling multidimensionale Grafici Numero sorgente m gt Nel gruppo Grafici fare clic su Stress gt Fare clic su Continua gt Nella finestra di dialogo Scaling multidimensionale fare clic su OK 273 Figura 14 8 Scaling multidimensionale Grafico decrescente autovalori 0 14 0 12 Raw Stress normalizzato 0 02 La procedura inizia con una soluzione a dieci dimensioni che si riducono a 2 Il grafico 0 10 0 08 0 06 N w 5 6 7 8 9 10 Dimensionalit decrescente degli autovalori mos
323. penalizzando il coefficiente di variazione delle distanze trasformate Busing Groenen e Heiser 2005 L esempio mostra come individuare la soluzione degenerata e come risolvere il problema utilizzando l unfolding multidimensionale che permette di stabilire in che modo i singoli classificano i cibi da colazione La sintassi per l esecuzione di queste analisi contenuta nel file prefscal_breakfast overall sps Creazione di una soluzione degenerata gt Per eseguire un analisi di unfolding multidimensionale dai menu scegliere Analizza Scala Unfolding multidimensionale PREFSCAL 285 286 Capitolo 15 Figura 15 1 Finestra di dialogo principale Unfolding multidimensionale z Unfolding multidimensionale ae ee ee ae gt Selezionare le variabili di distanza da Pane da tostare a Muffin e burro gt Fare clic su Opzioni 287 Unfolding multidimensionale Figura 15 2 Finestra di dialogo Opzioni x Unfolding multidimensionale opzioni Configurazione iniziale Criteri di iterazione Classica Convergenza stress 000001 O Ross Cliff Corrispondenza beaa de Assegnazione per Spearman Stress minimo 0001 Max iterazioni 000 O Centroidi O Inizi casuali multipli Intensit Termine penalit Intervallo Personalizzato Col nfigurazione personalizzata Annulla Aiuto gt Selezion
324. per i grafici dei residui con il sottocomando PLOT Specificare elenchi sorgente distinti per i pesi dello spazio individuale le trasformazioni e i grafici dei residui con il sottocomando PLOT Specificare un sottoinsieme dei grafici di trasformazione delle variabili indipendenti che si desidera visualizzare con il sottocomando PLOT Per informazioni dettagliate sulla sintassi vedere Command Syntax Reference Capitolo Unfolding multidimensionale PREFSCAL La procedura Unfolding multidimensionale tenta di individuare una scala quantitativa comune che consenta di analizzare visivamente le relazioni tra due insiemi di oggetti Esempi E stato chiesto a 21 persone di disporre 15 alimenti da colazione in ordine di preferenza da 1 a 15 Grazie all unfolding multidimensionale possibile stabilire che tali persone distinguono tra gli alimenti da colazione seguendo due criteri principali pane fresco e pane tostato e alimenti ingrassanti e dietetici In alternativa stato chiesto a un gruppo di guidatori di valutare 10 caratteristiche di 26 modelli di auto adottando una scala da 6 punti da 1 assolutamente in disaccordo a 6 assolutamente d accordo Calcolando la media delle persone tali valori vengono considerati come similarit Utilizzando Unfolding multidimensionale possibile individuare raggruppamenti di modelli analoghi e gli attributi a cui vengono pi strettamente associati Statistiche e grafici
325. per le porzioni maggiori all inerzia della seconda dimensione Sia aspetto sgradevole che fresca contribuiscono in modo molto limitato a ciascuna dimensione Figura 12 29 Contributi degli attributi impress grasso uomini sud australiano tradizionale premium salutare caffeina nuovo interessante pesante comune affumicato magro bambini funziona dolce non comune brutto fresco rampante nutriente donne minimo Totale attivi Punteggio nella dimensione Inerzia del punto all inerzia della dimensione Contributo della dimensione all inerzia del punto 1 2 2 237 Grafici Analisi corrispondenze Due dimensioni contribuiscono a una proporzione molto ampia dell inerzia per la maggioranza dei punti di riga I maggiori contributi della prima dimensione a salutare nuova attraente pochi grassi nutriente e donne indica che questi punti sono ben rappresentati in una dimensione Di conseguenza le dimensioni pi elevate contribuiscono poco all inerzia di questi punti che si troveranno molto vicino all asse orizzontale La seconda dimensione contribuisce per la maggior parte a uomini alta qualit e forte Entrambe le dimensioni contribuiscono in modo molto limitato all inerzia per Australia del Sud e aspetto sgradevole perci tali punti sono rappresentati in modo scarso La panoramica dei punti di colonna mostra i contributi relativi ai punti di colonna Le marche CC e
326. per questa variabile Selezionare Nominale singola come scala di misurazione Fare clic su Continua V v v y Nella finestra di dialogo Analisi della correlazione canonica non lineare selezionare vicinato e fare clic su Definisci intervallo e scala 194 Capitolo 11 Figura 11 10 Finestra di dialogo Definisci intervallo e scala za OVERALS Definisci intervallo e Minimo 1 Massimo b Scala di misurazione Ordinale Nominale multipla O Numerica discreta Digitare 3 come valore massimo per questa variabile Selezionare Nominale singola come scala di misurazione Fare clic su Continua V v v y Nella finestra di dialogo Analisi della correlazione canonica non lineare fare clic su Opzioni Figura 11 11 Finestra di dialogo Opzioni z2 OVERALS Opzioni Visualizza Frequenze Adattamento singolo e multiplo C Centroidi Quantificazioni di categoria C cronologia delle iterazioni Punteggi degli oggetti C Pesi e pesi di componente Grafico C Coordinate di categoria Centroidi di categoria Punteggi degli oggetti Trasformazioni Pesi di componente C Salva i punteggi degli oggetti Criteri Massimo numero di iterazioni 00 Convergenza 300001 Continua Annulla Deselezionare Centroidi e selezionare Pesi e pesi di componente nel gruppo Visualizza Selezionare Centroidi di categoria e Trasformazioni nel gruppo Grafici Selezionare Usa configurazione iniziale c
327. pesso riguardano tabelle molto pi ampie Nell esempio verranno utilizzati dati relativi alle immagini percepite di sei marche di caff freddo Kennedy Riquier e Sharp 1996 Questi insiemi di dati sono reperibili nel file coffee sav Per ulteriori informazioni vedere File di esempio in Appendice A a pag 321 Per ciascuno dei 23 attributi dell immagine del caff freddo sono state selezionate tutte le marche descritte da tale attributo Le sei marche sono indicate dalle sigle 4A BB CC DD EE e FF per tutelare la confidenzialit dei dati Tabella 12 1 Attributi del caff freddo Attributo immagine Etichetta Attributo immagine Etichetta prodotto valido cura marca che fa ingrassare ingrassante post ubriacatura marca a quantit ridotta di pochi grassi attrae gli uomini uomini grassi calorie marca per bambini bambini Marca dell Australia del sud Australia del Sud marca da classe lavoratrice classe lavoratrice marca tradizionale vecchio tradizionale stampo gusto ricco dolce dolce marca di alta qualit alta qualit marca non diffusa non diffusa marca salutare salutare marca per persone grasse di aspetto sgradevole marca ad alto contenuto di caffeina aspetto sgradevole caffeina 231 Analisi corrispondenze Attributo immagine Etichetta Attributo immagine Etichetta molto fresca fresca marca nuova nuovo marca per yuppie yuppie marca per person
328. plications Toronto University of Toronto Press Nishisato S 1984 Forced classification A simple application of a quantification method Psychometrika 49 25 36 Nishisato S 1994 Elements of dual scaling An introduction to practical data analysis Hillsdale N J Lawrence Erlbaum Associates Inc Pratt J W 1987 Dividing the indivisible Using simple symmetry to partition variance explained In Proceedings of the Second International Conference in Statistics T Pukkila e S Puntanen ed Tampere Finland University of Tampere 245 260 Price R e L Bouffard 1974 Behavioral appropriateness and situational constraints as dimensions of social behavior Journal of Personality and Social Psychology 30 579 586 Ramsay J O 1989 Monotone regression splines in action Statistical Science 4 425 441 Rao C R 1980 Matrix approximations and reduction of dimensionality in multivariate statistical analysis In Multivariate Analysis Vol 5 P R Krishnaiah ed Amsterdam North Holland 3 22 Rao C R 1973 Linear statistical inference and its applications 2nd ed New York John Wiley and Sons Rickman R N Mitchell J Dingman e J Dalen 1974 Changes in serum cholesterol during the Stillman Diet Journal of the American Medical Association 228 54 58 Rosenberg S e M P Kim 1975 The method of sorting as a data gathering procedure in multivariate research Multivariate Behavioral Research 1
329. poco Statistiche e grafici Misure di corrispondenza profili di riga e di colonna valori singolari punteggi di riga e di colonna inerzia massa statistiche del punteggio di riga e di colonna statistiche di confidenza di valori singolari grafici di trasformazione grafici a punti di colonna e di riga e biplot Dati Le variabili categoriali da analizzare vengono scalate in modo nominale Per i dati aggregati o per una misura di corrispondenza diversa dalle frequenze utilizzare una variabile peso con valori di similarit positivi In alternativa utilizzare la sintassi per leggere i dati della tabella Assunzioni Il numero massimo di dimensioni utilizzate nella procedura dipende dal numero di righe attive e di categorie di colonna e dal numero dei vincoli di uguaglianza Se non esistono vincoli e tutte le categorie sono attive il numero massimo inferiore di uno rispetto al numero delle categorie della variabile con il numero minimo di categorie Se ad esempio una variabile ha cinque categorie e l altra variabile ne ha quattro il numero massimo di dimensioni pari a tre Le 47 48 Capitolo 5 categorie supplementari non sono attive Se ad esempio una variabile ha cinque categorie di cui due sono supplementari e l altra variabile ha quattro categorie il numero massimo di dimensioni pari a due Tutti gli insiemi di categorie vincolati devono essere considerati come un unica categoria Se ad esempio una variabile h
330. presentare graficamente 65 Analisi corrispondenze multiple Figura 6 9 Finestra di dialogo Grafici Oggetto z MCA Grafici degli oggetti Grafici Punti degli oggetti C Oggetti e centroidi biplot Variabili biplot Etichetta gli oggetti Disponibili Selezionate Etichetta per Numero caso v variabile Annulla Aiuto Punti degli oggetti Viene visualizzato un grafico dei punti degli oggetti Oggetti e centroidi biplot I punti degli oggetti vengono inseriti nel grafico insieme ai centroidi di variabili Variabili biplot Per i biplot possibile utilizzare tutte le variabili o selezionarne un sottoinsieme Etichetta gli oggetti possibile etichettare gli oggetti con le categorie delle variabili selezionate scegliendo i valori degli indicatori di categoria o le etichette dei valori nella finestra di dialogo Opzioni oppure con i relativi numeri di caso Se selezionata l opzione Variabile viene creato un grafico per ogni variabile Grafici di variabili dell analisi delle corrispondenze multiple Nella finestra di dialogo Grafici delle variabili possibile specificare i tipi di grafici desiderati e le variabili da rappresentare graficamente 66 Capitolo 6 Figura 6 10 Finestra di dialogo Grafici delle variabili ea MCA Grafici delle variabili Grafici di categoria filetto testa taglio punta lunghz ottone filetton testan taglion Grafici
331. primo Di conseguenza sono state ottenute sei sorgenti in totale Ogni sorgente corrisponde a una matrice di prossimit 15 x 15 le cui celle sono uguali al numero delle persone in una sorgente meno il numero di volte in cui gli oggetti sono stati ripartiti insieme nella sorgente kinship_ini sav Questo file di dati contiene la configurazione iniziale di una soluzione a tre dimensioni per kinship_dat sav kinship_var sav Questo file di dati contiene variabili indipendenti relative a sesso generazione e grado di separazione che possono essere utilizzate per interpretare le dimensioni di una soluzione per kinship_dat sav In modo specifico tali variabili possono essere utilizzate per limitare lo spazio della soluzione a una combinazione lineare di tali variabili 327 File di esempio mailresponse sav File di dati ipotetici che prende in esame l impegno di un industria di abbigliamento nel tentativo di stabilire se con il servizio di postacelere per il direct mailing si ottengono risposte pi rapide rispetto alla posta tradizionale I responsabili degli ordini registrano dopo quante settimane dall invio della posta vengono ricevuti gli ordini marketvalues sav File di dati che prende in esame le vendite di abitazioni in un nuovo centro abitato in Algonquin Ill durate gli anni 1999 2000 Tali vendite sono una questione di dominio pubblico mutualfund sav File di dati che prende in esame informazioni sul mercato azionari
332. punteggi degli oggetti Esempio un analisi dei risultati dell indagine Gli esempi di questo capitolo derivano da un indagine Verdegaal 1985 Sono state registrate le risposte di quindici soggetti a otto variabili Le variabili le etichette delle variabili e le etichette di valore categorie dell insieme di dati sono visualizzate nella seguente tabella Tabella 11 1 Dati dell indagine Nome di variabile Etichetta della Etichetta del valore variabile et Et in anni 20 25 26 30 31 35 36 40 41 45 46 50 51 55 56 60 61 65 66 70 statociv Stato civile Single coniugato a altro andom Animali domestici Nessuno Gatto i Cane i Altro diverso da gatto o cane Animali domestici vari giornale Giornale letto pi spesso Nessuno il Corriere della Sera la Repubblica La Stampa Altro musica Musica preferita Classica New wave Popolare Variet Non ama la musica vicinato Preferenze vicinato Citt Paese Campagna mate Punteggio test 0 5 6 10 11 15 matematico lingua Punteggio test 0 5 6 10 11 15 16 20 linguistico 188 189 Analisi della correlazione canonica non lineare OVERALS Questi insiemi di dati sono reperibili nel file verd 985 sav Per ulteriori informazioni vedere File di esempio in Appendice A a pag 321 Le variabili di interesse sono le prime sei variabili e sono divise in tre insiemi L insieme 1 include et e statociv l insieme 2 include andom e giornale e l insieme 3 i
333. punteggio assegnato relativo all usabilit del sito in base a una scala da 0 a 20 smokers sav Questo file di dati un estratto del 1998 National Household Survey of Drug Abuse e rappresenta un campione probabile di famiglie americane Il primo passaggio dell analisi di questi dati consiste nel pesare 1 dati per riflettere le tendenze della popolazione smoking sav Tabella di dati ipotetici introdotta da Greenacre Greenacre 1984 La tabella di interesse formata dalla tavola di contingenza del tabagismo per categoria lavorativa La variabile Gruppo personale contiene le categorie lavorative Dirigenti sr Dirigenti jr Quadri sr Quadri jr e Personale di segreteria pi la categoria Media nazionale da utilizzare come categoria supplementare nell analisi La variabile Tabagismo contiene i livelli Nessuno Lieve Medio e Forte pi le categorie Astemio e Bevitore che possono essere utilizzate come categorie supplementari nell analisi storebrand sav File di dati ipotetici che prende in esame l impegno del responsabile di un magazzino nel tentativo di aumentare le vendite del detergente con il marchio del proprio magazzino rispetto ai detergenti di altre marche Il tentativo consiste nel creare una promozione all interno del magazzino e nel parlare con i clienti alla cassa Ogni caso rappresenta un cliente separato stores sav File di dati ipotetici sulle quote di mercato mensili di due catene di drogherie concorrenti Ciascun
334. r presto disponibile in una versione aggiornata per SPSS Statistics 17 0 Verr preseto pubblicato anche il volume SPSS Advanced Statistical Procedures Companion basato su SPSS Statistics 17 0 A breve verr sviluppata anche la pubblicazione SPSS Guide to Data Analysis for SPSS Statistics 17 0 I titoli dei volumi disponibili esclusivamente tramite Prentice Hall verranno pubblicati sul sito Web all indirizzo Attp Awww spss com estore selezionare il proprio paese di residenza quindi fare clic su Books Ringraziamenti Le ottime procedure di scaling e la loro implementazione in SPSS Statistics sono state sviluppate da DTSS Data Theory Scaling System Group un gruppo costituito da membri dei dipartimenti di scienze dell educazione e psicologia della Facolt di Scienze Sociali e Comportamentali dell Universit di Leiden Willem Heiser Jacqueline Meulman Gerda van den Berg e Patrick Groenen hanno partecipato allo sviluppo delle procedure iniziali del 1990 Jacqueline Meulman e Peter Neufeglise hanno contribuito allo sviluppo delle procedure per la regressione categorica l analisi delle rispondenze l analisi delle componenti principali categoriale e lo scaling multimediale Inoltre Anita van der Kooij ha contribuito in particolare allo sviluppo delle analisi CATREG CORRESPONDENCE e ATPCA Willem Heiser Jacques Commandeur Frank Busing Gerda van den Berg e Patrick Groenen hanno partecipato allo sviluppo della procedura PROXSCAL Fr
335. r il criterio di convergenza L algoritmo si interrompe se la differenza dell adattamento totale delle due ultime iterazioni inferiore al valore di convergenza o se viene raggiunto il numero massimo di iterazioni Etichetta i grafici in base a Consente di specificare se nei grafici verranno utilizzati le variabili e le etichette dei valori o i nomi delle variabili e i valori E inoltre possibile specificare una lunghezza massima per le etichette Dimensioni del grafico Consente di controllare le dimensioni visualizzate nell output Visualizza tutte le dimensioni nella soluzione Tutte le dimensioni nella soluzione sono visualizzate in una matrice di grafici a dispersione m Limita il numero di dimensioni Le dimensioni visualizzate sono limitate alle coppie inserite nel grafico Se le dimensioni vengono limitate necessario selezionare la dimensione maggiore e minore da inserire nel grafico La dimensione minore pu variare da 1 al numero delle dimensioni nella soluzione meno 1 e viene inserita nel grafico a confronto con le dimensioni maggiori La dimensione maggiore pu variare da 2 al numero delle dimensioni nella soluzione e indica la dimensione massima da utilizzare nell inserimento nel grafico delle coppie di dimensioni Questa specifica si applica a tutti i grafici multidimensionali richiesti Configurazione possibile leggere i dati da un file che contiene le coordinate di una configurazione La prima variabile del file
336. re il valore di categoria minore da ciascuna categoria e nell aggiungere uno a ciascuna differenza Lo schema B generato da questa trasformazione Il valore di categoria minore 20 stato sottratto da ciascuna categoria e a ogni risultato stato aggiunto 1 I codici trasformati hanno un valore minimo di e tutte le differenze sono identiche ai dati originali Il valore di categoria massimo ora uguale a otto e tutte le quantificazioni uguali a zero precedenti alla prima quantificazione diversa da zero vengono eliminate Tuttavia le quantificazioni diverse da zero corrispondenti a ciascuna categoria risultante dallo schema B sono identiche alle quantificazioni risultanti dallo schema A Procedura ottimale per l applicazione Le tecniche integrate in quattro di queste procedure Analisi delle corrispondenze Analisi delle corrispondenze multiple Analisi delle componenti principali categoriale e Analisi della correlazione canonica non lineare appartengono all area generale dell analisi dei dati multivariati nota come riduzione dimensionale Le relazioni tra variabili vengono cio rappresentate nel minor numero di dimensioni possibile due o tre Questo consente di descrivere le strutture o i modelli delle relazioni che sarebbe troppo complesso comprendere appieno nella loro complessit e ricchezza originali Nelle applicazioni per le ricerche di mercato queste tecniche possono rappresentare una forma di segmentazione percettiva
337. re quantit di inerzia una misura della variazione dei dati possibile la seconda ortogonale alla prima e mostra la maggiore quantit dell inerzia restante possibile e cos via possibile dividere l inerzia totale in componenti attribuibili a ciascuna dimensione quindi possibile valutare l inerzia visualizzata in una particolare dimensione confrontandola con quella totale Ad esempio la prima dimensione mostra 1 87 8 0 075 0 085 dell inerzia totale mentre la seconda solo 1 11 8 0 010 0 085 219 Biplot Analisi corrispondenze Figura 12 7 Inerzia per dimensione Proporzione di inerzia Confidenza del valore singolare Valore Deviazione Correlazione Correlazione Dimensione singolare Inerzia Chi Quadrato ig Cumulata standard Totale a 12 gradi di libert Se si stabilisce che le prime p dimensioni di una soluzione con g dimensioni mostrano una porzione sufficiente dell inerzia totale non necessario esaminare le dimensioni superiori Nell esempio la soluzione a due dimensioni sufficiente perch la terza rappresenta meno dell 1 dell inerzia totale I singoli valori possono essere interpretati come la correlazione tra i punteggi di riga e di colonna Sono analoghi al coefficiente di correlazione di Pearson r nell analisi della correlazione Per ogni dimensione il quadrato del singolo valore autovalore pari all inerzia e quindi rappresenta un altra misura dell
338. re tutti i colori I valori delle variabili di simbolo facoltative consentono di utilizzare tutti i simboli possibili Grafici sorgente Per i grafici Spazi individuali Dispersione dell adattamento e Residui e se le trasformazioni vengono applicate in base alla sorgente per i grafici Trasformazione e Shepard possibile specificare le sorgenti a cui tali grafici devono fare riferimento I numeri delle sorgenti specificati devono essere valori della variabile sorgente specificata nella finestra di dialogo principale e devono essere compresi nell intervallo da 1 al numero delle sorgenti Grafici righe Se le trasformazioni vengono applicate per riga per i grafici Trasformazione e Shepard possibile specificare la riga a cui tali grafici devono fare riferimento I numeri di riga immessi devono essere compresi tra 1 e il numero di righe Output dell unfolding multidimensionale Nella finestra di dialogo Output possibile controllare la quantit di output visualizzata e salvarne una parte in file distinti 91 Unfolding multidimensionale PREFSCAL Figura 8 6 Finestra di dialogo Output a Unfolding multidimensionale output Visualizza O C Cronologia delle iterazioni Spazio comune finale Ayvi multipli V Misure di adattamento Pesi dello spazio U Dati iniziali C Scomposizione di stress pazi individual C Distanze trasformate C Distanze inserite Salva in un nuovo file C Coordinate spazio comune Pesi dello spazi
339. re una delle seguenti opzioni m Rapporto Le distanze trasformate sono proporzionali alle distanze originali consentita solo per le distanze con valore positivo m Intervallo Le distanze trasformate sono proporzionali alle distanze originali pi il termine di un intercetta L intercetta garantisce che tutte le distanze trasformate sono positive m Ordinale L ordine delle distanze trasformate uguale all ordine delle distanze originali possibile specificare se la distinzione delle distanze pari merito consentita o meno m Spline Le distanze trasformate sono una trasformazione polinomiale non decrescente livellata delle distanze originali E possibile specificare il grado del polinomio e il numero dei nodi interni Applica trasformazioni Specificare se il confronto avviene solo tra le distanze di ciascuna sorgente o se i confronti nella sorgente sono non condizionali Dimensioni Per impostazione predefinita una soluzione viene calcolata in due dimensioni Minimo 2 Massimo 2 possibile scegliere un minimo e un massimo compresi tra 1 e il numero degli oggetto meno 1 a patto che il minimo sia minore o uguale al massimo La procedura consente di calcolare una soluzione nelle dimensioni massime e riduce quindi la dimensionalit in passaggi fino al raggiungimento di quello inferiore Scaling multidimensionale Vincoli Nella finestra di dialogo Vincoli possibile assegnare vincoli sullo spazio comune Figura
340. rebbe essere possibile creare un modello migliore tramite una trasformazione ordinale anzich lineare 280 Capitolo 14 Figura 14 16 Finestra di dialogo Modello Scaling multidimensionale Modello Modello di scaling Trasformazioni delle distanze Identit O Rapporto Euclideo pesato O Intervallo Euclideo generalizzato OJ Rango ridotto Distingui osservazioni pari merito Rango O Spline Strada Forma Nodi interni Triangolo inferiore Applica trasformazioni O Triangolo superiore Entro ciascuna sorgente separatamente Matrice completa O Era tutte le sorgenti simultaneamente Distanze Dimensioni Dissimilarit Minimo b Similarit Massimo b Annulla Aiuto gt Per ripetere l analisi scalando le distanze gener e grado a livello ordinale mantenendo i pari merito richiamare la finestra di dialogo Scaling multidimensionale e fare clic su Modello gt Selezionare Ordinale come trasformazione della distanza gt Fare clic su Continua gt Nella finestra di dialogo Scaling multidimensionale fare clic su Vincoli 281 Scaling multidimensionale Figura 14 17 Finestra di dialogo Vincoli z Scaling multidimensionale Vincoli Vincoli sullo spazio comune O Nessun vincolo O Alcune coordinate fisse Combinazione lineare di variabili indipendenti Variabili vincolo Leggi variabili da kinship_var say Disponibili Selezionate gen
341. regressione categoriale Regressione categoriale Output i Regressione categoriale Salva LL Regressione categoriale Grafici Opzioni aggiuntive del comando CATREG 000 c eee eee 3 Analisi delle componenti principali categoriale CATPCA 27 Definisci scala e peso in CATPCA 0 0 cette tees 29 Componenti principali categoriale Discretizzazione LL 31 Componenti principali categoriale Valori mancanti 0c cece eeaee 32 Componenti principali categoriale Opzioni i 33 Componenti principali categoriale Output 35 Componenti principali categoriale Salva 37 Componenti principali categoriale Grafici di oggetti e divariabili 37 Componenti principali categoriale Grafici di categoria n n aaua 38 Componenti principali categoriale Grafici dei pesi 39 Opzioni aggiuntive del comando CATPCA 0 40 4 Analisi della correlazione canonica non lineare OVERALS 41 Definisci intervallo e scala 44 Definisci intervallo cli eli ARRE Kad ob e le a lin 44 Analisi della correlazione canonica non lineare OVERALS Opzioni 45 Opzioni aggiuntive del comando OVERALS 0 46 5 Analisi corrispondenze 47 Definire l intervallo di righe nell analisi delle corrispondenze 0 00 ccc ee eee 48 Definire l intervallo di colonne nell analisi delle corrispondenze 49 Analisi delle corrispondenze Modello 50 Analisi delle corrisp
342. ri chiaro che i gruppi anoressici hanno valori iniziali diversi dai gruppi bulimici La differenza si riduce nel tempo in quanto i gruppi anoressici si modificano solo leggermente mentre i gruppi bulimici mostrano progressi 182 Capitolo 10 Figura 10 51 Generatore di grafici MA Generatore di grafici Variabili County c amp Years sin L value atl Probabili Peso dic L Peso dic Probabilit E Indice di 8 Ampiezza Peso dic y Ny Peso di campionamento cumulat Categorie Nessuna categoria variabile di scala L anteprima dei grafici usa i dati di esempio Modelli Seleziona da rrr _ tilii Preferiti Elementi di base Barra Pes I LiNcare ID gruppi punti Ad area Fear ay torta polare Titoli Note a pi di A dispersione punti pagina Istogramma Alto Basso Propriet elemento Grafico a scatola a Assi duali i m ri AA A gt Richiamare Generatore grafici gt Deselezionare Centroidi proiettati su Eccessi alimentari come variabile dell asse y e selezionare Centroidi proiettati su Atteggiamento sessuale come variabile dell asse x gt Fare clic su OK 183 Analisi Componenti principali categoriale Figura 10 52 Centroidi proiettati del momento della diagnosi su Atteggiamento sessuale nel tempo iM Editor dei grafici OO ioo SEXY MES M Le Z CETE E Liss amp il J 88 l i e e
343. riabile non verranno tuttavia visualizzate nei grafici Analisi della correlazione canonica non lineare OVERALS Opzioni Nella finestra di dialogo Opzioni possibile selezionare le statistiche e i grafici opzionali salvare i punteggi degli oggetti come nuove variabili nel file di dati attivo specificare 1 criteri di iterazione e di convergenza nonch la configurazione iniziale dell analisi Figura 4 5 Finestra di dialogo Opzioni zas OVERALS Opzioni Visualizza V Frequenze Adattamento singolo e multiplo C Centroidi Quantificazioni di categoria C Cronologia delle iterazioni Punteggi degli oggetti C Pesi e pesi di componente Grafico C Coordinate di categoria Centroidi di categoria V Punteggi degli oggetti Trasformazioni V Pesi di componente C Salva i punteggi degli oggetti s Criteri Massimo numero di iterazioni 100 Convergenza 00001 v Annulla Aiuto Visualizzazione Le statistiche disponibili sono frequenze marginali conteggi centroidi cronologia delle iterazioni pesi e pesi di componente quantificazioni di categoria punteggi degli oggetti e statistiche dell adattamento singolo e multiplo Centroidi Quantificazioni di categoria e medie proiettate ed effettive dei punteggi per oggetti casi inclusi in ogni insieme e appartenenti alle medesime categorie di una variabile Pesi e pesi di componente I coefficienti di regressione in ciascuna dimensione per ogni varia
344. riabile sono molto vicine Di conseguenza Filettattura comporta una discriminazione migliore nella dimensione 1 rispetto alla dimensione 2 Per contro le categorie per Forma della testa sono distribuite in posizioni lontane in entrambe le dimensioni a suggerire che questa variabile comporti una discriminazione corretta in entrambe le dimensioni Oltre a determinare le dimensioni lungo le quali una variabile comporta una discriminazione e le modalit di quest ultima il grafico delle quantificazioni di categoria confronta anche la discriminazione della variabile Una variabile con categorie lontane comporta una discriminazione migliore rispetto a una variabile con categorie vicine tra loro Ad esempio nella dimensione 1 le due categorie di Ottone sono pi vicine tra loro delle due categorie di Filettatura a 258 Capitolo 13 indicare che Filettatura comporta una discriminazione migliore rispetto a Ottone in questa dimensione Tuttavia nella dimensione 2 le distanze sono molto simili a suggerire che il grado di discriminazione di queste variabili lo stesso nella dimensione corrente Il grafico delle misure di discriminazione illustrato sopra identifica queste stesse relazioni utilizzando le varianze per riflettere la distribuzione delle categorie Un esame pi dettagliato dei punteggi degli oggetti possibile ottenere una migliore comprensione dei dati esaminando i grafici dei punteggi degli oggetti etichettati in base a ciascuna
345. riabili Le coordinate delle variabili nello spazio dell oggetto sono i pesi di componente ovvero le correlazioni con le componenti principali quali le dimensioni e i punteggi degli oggetti Questo metodo risulta utile se la correlazione tra variabili riveste un importanza fondamentale E Principale per oggetto Questo metodo consente di ottimizzare le distanze tra gli oggetti e risulta utile se le dissimilarit o le similarit tra gli oggetti sono di importanza fondamentale Simmetrico Utilizzare questo metodo di normalizzazione se la relazione tra oggetti e variabili di importanza fondamentale m Indipendente Utilizzare questo metodo se si desidera esaminare separatamente le distanze tra gli oggetti e le correlazioni tra le variabili m Personalizzata possibile specificare qualsiasi valore reale compreso nell intervallo 1 1 Il valore 1 equivale al metodo Principale per oggetto il valore 0 equivale al metodo Simmetrico e il valore 1 equivale al metodo Principale per variabile Se si specifica un valore maggiore di 1 e minore di 1 possibile disperdere l autovalore negli oggetti e nelle variabili Questo metodo utile per creare biplot o triplot adatti alle specifiche esigenze Criteri possibile specificare il numero massimo di iterazioni che possono essere eseguite dalla procedura durante i calcoli e inoltre selezionare un valore per il criterio di convergenza L algoritmo si interrompe se la differenza d
346. ribuita su un numero di colonne uguale al numero di oggetti L operazione porta alla finestra di dialogo Distanze in matrici per colonne m Le distanze sono in una singola colonna La matrice delle distanze riassunta in una sola colonna o variabile Sono necessarie due variabili aggiuntive che identificano riga e colonna per ciascuna cella L operazione porta alla finestra di dialogo Distanze in una sola colonna Pi sorgenti Se esistono pi sorgenti delle distanze specificare se il formato dell insieme di dati include le distanze in matrici impilate per colonne in pi colonne con una sorgente per colonna o in una singola colonna 70 Capitolo 7 m Le distanze sono in matrici impilate per colonne Le matrici di distanza sono distribuite tra un numero di colonne pari al numero di oggetti e impilate una sopra l altra per un numero di righe pari al numero di oggetti per il numero di sorgenti L operazione porta alla finestra di dialogo Distanze in matrici per colonne m Le distanze sono nelle colonne una sorgente per colonna Le matrici delle distanze sono riassunte in pi colonne o variabili Sono necessarie due variabili aggiuntive che identificano riga e colonna per ciascuna cella L operazione porta alla finestra di dialogo Distanze in colonne m Le distanze sono sovrapposte in una singola colonna Le matrici delle distanze sono riassunte in una sola colonna o variabile Sono necessarie tre variabili aggiuntive che id
347. rmazioni vedere File di esempio in Appendice A a pag 321 Selezionare dim e dim2 come variabili che specificano la configurazione iniziale Fare clic su Continua Nella finestra di dialogo Unfolding multidimensionale fare clic su Grafici 312 Capitolo 15 Figura 15 27 Finestra di dialogo Grafici Unfolding multidimensionale grafici Sorgenti Numero sorgente Righe Numero riga gt Selezionare Grafici di trasformazione nel gruppo Grafici gt Fare clic su Continua gt Nella finestra di dialogo Unfolding multidimensionale fare clic su OK Segue la sintassi di comandi generata da queste selezioni PREFSCAL VARIABLES Run Talk Kiss Write Eat Sleep Mumble Read Fight Belch Argue Jump Cry Laugh Shout INPUT ROWS ROWID INITIAL samplesDirectory behavior_ini sav diml dim2 CONDITION UNCONDITIONAL TRANSFORMATION LINEAR INTERCEPT PROXIMITIES DISSIMILARITIES MODEL IDENTITY 313 Unfolding multidimensionale CRITERIA DIMENSIONS 2 2 DIFFSTRESS 000001 MINSTRESS 0001 MAXITER 5000 PENALTY LAMBDA 0 5 OMEGA 1 0 PRINT MEASURES COMMON PLOT COMMON TRANSFORMATIONS La sintassi specifica un analisi sulle variabili da correre a saltare La variabile idriga viene usata per identificare le righe Il sottocomando INITIAL specifica che i valori iniziali devono essere acquisiti dal file behavior_ini sav Le coordinate delle righe e delle colonne sono impilate in modo c
348. ro del colloquio 2 Dimensione 2 Dimensione 1 Le etichette dei punteggi degli oggetti in base alla progressione temporale indicano che la prima dimensione ha una correlazione con quest ultima sembra infatti che vi sia una progressione dei tempi diagnostici dall 1 in maggioranza a sinistra e gli altri a destra Si noti che possibile collegare i punti temporali nel grafico salvando i punteggi degli oggetti e creando un grafico a dispersione utilizzando i punteggi della dimensione 1 sull asse x i punteggi della dimensione 2 sull asse y e impostando i simboli utilizzando i numeri dei pazienti Confrontando il grafico dei punteggi degli oggetti in base al tempo con quello etichettato per diagnosi possibile ottenere alcune indicazioni su oggetti insoliti Ad esempio nel grafico etichettato in base al tempo presente un paziente la cui diagnosi in corrispondenza del quarto incontro si trova a sinistra di tutti gli altri punti del grafico Questo insolito in quanto il trend generale dei punti relativi ai colloqui successivi nel tempo di trovarsi pi a destra interessante notare come questo punto apparentemente fuori posto dal punto di vista temporale corrisponda anche a una diagnosi insolita nel senso che il paziente un soggetto anoressico i cui punteggi lo inseriscono nel cluster relativo alla bulimia Esaminando la tabella dei punteggi degli oggetti si vedr che si tratta del paziente numero 43 cui stata
349. ro sono state classificate dagli assaggiatori in base a una scala ordinale da 1 a 5 da molto meno a molto pi della media Ogni caso rappresenta un assaggiatore separato telco sav File di dati ipotetici che prende in esame l impegno di un azienda di telecomunicazioni nel tentativo di ridurre il churn ovvero l abbandono dei propri clienti Ciascun caso rappresenta un cliente separato e riporta diverse informazioni demografiche e sull uso del servizio telco_extra sav Questo file di dati simile al file telco sav ma le variabili tenure e spesa del cliente trasformata tramite logaritmo sono state sostituite dalle variabili di spesa del cliente trasformata tramite logaritmo standardizzate telco_missing sav Questo file di dati un sottoinsieme del file di dati telco sav ma alcuni dei valori di dati demografici sono stati sostituiti con valori mancanti testmarket sav File di dati ipotetici che prende in esame 1 piani di una catena di fast food per aggiungere un nuovo prodotto al proprio menu Sono previste tre campagne promozionali del nuovo prodotto Il prodotto viene introdotto in diversi mercati selezionati in modo casuale Per ogni sede viene utilizzata una promozione differente registrando le vendite settimanali della nuova voce per le prime quattro settimane Ogni caso rappresenta un luogo e una settimana diversi testmarket_1month sav Questo file di dati ipotetici corrisponde al file testmarket sav con le vendite s
350. rtilli e margarina 36 E 230 21 o 42 4 4102427 S o 785 E Toast burro e marmellata O all a o o 504 panhRhall Calla garinao 14st con mostarda oPane near Imburrato 40 Toast imburrato e a 120 OToast con margarina moast 1 8 32 10 0 Panino imburrato 37 Dimensione 1 Il grafico congiunto dello spazio individuale Snack con bibita mostra l effetto di questo scenario sulle preferenze Questa sorgente pesa molto di pi sulla seconda dimensione quindi la differenziazione tra gli oggetti dipende soprattutto da questa dimensione Tuttavia presente una differenziazione piuttosto marcata rispetto alla prima dimensione soprattutto a causa della bassa specificit dell origine Uso di una configurazione iniziale diversa La configurazione finale dipende dai punti iniziali assegnati all algoritmo La struttura generale di una soluzione dovrebbe idealmente rimanere invariata per consentire l identificazione della soluzione corretta Tuttavia possibile mettere in evidenza dettagli specifici provando a usare configurazioni iniziali diverse ad esempio usando un inizio di corrispondenza per l analisi a tre vie dei dati relativi alla colazione gt Per produrre una soluzione con un inizio di corrispondenza fare clic sullo strumento Richiama finestra e selezionare Unfolding multidimensionale 303 Unfolding multidimensionale gt Nella finestra di dialogo Unfolding multidimensionale fare clic su Opzioni
351. rzia in analisi delle corrispondenze 52 218 221 intercorrelazioni in regressione categoriale 106 lasso in regressione categoriale 22 livello di scaling ottimale in analisi Componenti principali categoriale 29 in analisi delle corrispondenze multiple 58 matrice di correlazione in analisi Componenti principali categoriale 35 in analisi delle corrispondenze multiple 63 misure di discriminazione in analisi delle corrispondenze multiple 63 255 340 Indice misure di distanza in analisi delle corrispondenze 50 misure di stress in scaling multidimensionale 80 277 282 nell unfolding multidimensionale 90 modello di identita nell unfolding multidimensionale 84 modello di scaling nell unfolding multidimensionale 84 modello Euclideo generalizzato nell unfolding multidimensionale 84 modello Euclideo pesato nell unfolding multidimensionale 84 normalizzazione in analisi delle corrispondenze 50 214 normalizzazione principale in analisi delle corrispondenze 214 normalizzazione principale per colonna in analisi delle corrispondenze 214 normalizzazione principale per riga in analisi delle corrispondenze 214 normalizzazione simmetrica in analisi delle corrispondenze 214 oggetti supplementari in regressione categoriale 20 outliers in analisi delle corrispondenze multiple 261 permutazioni in analisi delle corrispondenze 223 pesi in analisi della correlazione canonica non lineare 45
352. s Lo stress per la soluzione corrente supporta l argomento relativo allo scaling delle distanze a livello ordinale Figura 14 19 Misure di stress e di adattamento Stress non trasformato normalizzato Stress Stress ll S stress Dispersione spiegata Coefficiente di convergenza di Tucker PROXSCAL minimizza lo stress non trasformato normalizzato a Livello di scala ottimale 1 032 b Livello di scala ottimale 980 Il raw stress normalizzato per la soluzione precedente 0 06234 Lo scaling delle variabili utilizzando trasformazioni non predefinite determina uno stress pari a 0 03137 Coordinate finali dello spazio comune I grafici dello spazio comune offrono essenzialmente la stessa interpretazione delle dimensioni della soluzione precedente 283 Scaling multidimensionale Figura 14 20 Coordinate spazio comune fratelito e 2 panee Fi onignmas 2 o O cugino cugino v 2 magemna phair r marina a Oday pronfigitem Dnip Or sofiglia zia Da Pia M ocugine fi nipmas ae e gza cugino DUE Perle pi to ea zia Ga frateyg Nonno A figa nanna padil padre NOnga nonno zig nonno NERA zig m 2 Ree aar e dre cugino FA H frat S sgiela 5 5 ata w E nipmas 6 AEs a O pronma figi gt pronfem Taio ine pronfem Dimensione 1 Dimensione 2 Dimensione 3 Discussione Il metodo ottimale trattare le distanze come variabili ordinali perch si ottiene cos
353. schio di nonni madre nipote maschio di zii nipote femmina di zii sorella figlio zio Hanno richiesto a quattro gruppi di studenti universitari due composti da femmine e due da maschi di ordinare questi termini in base alla similiarit A due gruppi uno femminile e uno maschile stato richiesto di effettuare l ordinamento due volte con il secondo ordinamento basato su un criterio diverso rispetto al primo Di conseguenza sono state ottenute sei sorgenti totali come indicato nella tabella seguente Tabella 14 1 Struttura sorgente dei dati di parentela Sorgente Sesso Condizione Dimensione campione 1 Femmina Ordinamento 85 singolo 2 Maschio Ordinamento 85 singolo 3 Femmina Primo 80 ordinamento 4 Femmina Secondo 80 ordinamento 5 Maschio Primo 80 ordinamento 6 Maschio Secondo 80 ordinamento 266 267 Scaling multidimensionale Ogni sorgente corrisponde a una matrice di prossimita 15 x 15 le cui celle sono uguali al numero delle persone in una sorgente meno il numero di volte in cui gli oggetti sono stati ripartiti insieme nella sorgente Questo insiemi di dati reperibile nel file Kinship_dat sav Per ulteriori informazioni vedere File di esempio in Appendice A a pag 321 Scelta del numero di dimensioni Sta all utente decidere quante dimensioni deve avere la soluzione Il grafico decrescente aiuta a prendere tale decisione gt Per creare un grafico decrescente degli autovalori dai menu sceg
354. scono un indicazione dell approssimazione delle distanze nella soluzione rispetto alle distanze originali Figura 14 13 Misure di stress e di adattamento Stress non trasformato normalizzato 06234 Stress l 249684 Stress ll 878494 S stress 147165 Dispersione spiegata 93766 Coefficiente di convergenza di Tucker PROXSCAL minimizza lo stress non trasformato normalizzato a Livello di scala ottimale 1 066 b Livello di scala ottimale 984 96833 278 Capitolo 14 Ciascuna delle quattro statistiche di Stress misura il non adattamento dei dati mentre la dispersione spiegata e il coefficiente di congruenza di Tucker misurano l adattamento Misure di stress inferiori fino a un minimo di 0 e misure di adattamento superiori fino a un massimo di 1 indicano soluzioni migliori Figura 14 14 Scomposizione del raw stress normalizzato Sorgente SRC_1 SRC_2 SRC_3 SRC_4 SRC_5 SRC_6 Zia Fratello Cugino Figlia Padre Pronipote femmina Nonno Nonna Pronipote maschio Madre Nipote maschio Nipote femmina Sorella Figlio Zio La decomposizione dello stress consente di identificare le sorgenti e gli oggetti che forniscono il maggiore contributo allo stress complessivo della soluzione In questo caso la maggioranza dello stress tra le sorgenti attribuibile alle sorgenti 1 e 2 mentre tra gli oggetti la maggioranza dello stress attribuibile a Fratello Nipote femmina di non
355. seguenza possibile determinare quali categorie sono simili per ciascuna variabile Figura 13 8 Quantificazioni di categoria Longa mn I TE a O Fessura O Filettatura _ Lunghezza 3 cm 6 25 O Ottone Punta O Testa N v 2 c 9 oo v c COPPA a 1 cm 3 75 S _Filett acuta fe o o T No_Filett 0 TARP cmNgo28tt e A O NESSUNO c NSRBA s o M25 patta 15 10 05 00 05 10 15 Dimensione 1 Lunghezza in mezzi pollici ha cinque categorie tre delle quali sono raggruppate in prossimit della parte superiore del grafico Le due categorie rimanenti in si trovano nella met inferiore del grafico con la categoria 2_ 2_in posizionata molto lontana dal gruppo L elevata discriminazione relativa alla lunghezza nella dimensione 2 il risultato della forte differenziazione di questa categoria rispetto alle altre categorie di lunghezza Analogamente per Forma della testa la categoria A STELLA molto lontana delle altre categorie e genera una misura discriminazione elevata nella seconda dimensione Questi modelli non possono essere illustrati in un grafico delle misure discriminazione La distribuzione delle quantificazioni di categoria per una variabile riflette la varianza e quindi indica la correttezza della discriminazione di tale variabile in ciascuna dimensione Concentrando l attenzione sulla dimensione 1 le categorie per Filettatura sono molto lontane Tuttavia nella dimensione 2 le categorie per questa va
356. sformate C Categorie di colonna trasformate l z tichette grafici linear Po Dimensioni grafico Visualizza tutte le dimensioni nella soluzione O Limita il numero di dimensioni Annulla Aiuto gt Selezionare Profili di riga e Profili di colonna nel gruppo Grafici a dispersione gt Fare clic su Continua gt Nella finestra di dialogo Analisi della corrispondenze fare clic su OK Dimensionalita L inerzia per dimensione mostra la scomposizione dell inerzia totale per ogni dimensione Due dimensioni spiegano 1 83 dell inerzia totale Aggiungendo una terza dimensione si aggiunge solo 1 8 6 di inerzia spiegata Di conseguenza si opta per utilizzare una rappresentazione a due dimensioni 236 Capitolo 12 Figura 12 28 Inerzia per dimensione Dimensione singolare a 110 gradi di libert Contributi Analisi delle corrispondenze Chi Quadrato a Confidenza del valore Proporzione di inerzia singolare Spiegata 629 Deviazione Correlazione Cumulata standard 2 132 La panoramica dei punti di riga mostra i contributi dei punti di riga all inerzia delle dimensioni e i contributi delle dimensioni all inerzia dei punti di riga Se tutti i punti contribuissero in pari misura all inerzia i contributi sarebbero pari a 0 043 Salutare e pochi grassi contribuiscono entrambe in modo significativo all inerzia della prima dimensione Uomini e forte contribuiscono
357. si dei comandi consente inoltre di m Specificare i nomi di radice per le variabili trasformate i punteggi degli oggetti e le approssimazioni quando vengono salvati nel file dati attivo con il sottocomando SAVE 67 Analisi corrispondenze multiple m Specificare una lunghezza massima per le singole etichette di ciascun grafico con il sottocomando PLOT m Specificare un elenco di variabili distinto per i grafici dei residui con il sottocomando PLOT Per informazioni dettagliate sulla sintassi vedere Command Syntax Reference Capitolo 7 Scaling multidimensionale PROXSCAL La procedura Scaling multidimensionale consente di effettuare un tentativo per trovare la struttura in un insieme di misure di distanza tra oggetti Questo processo viene effettuato assegnando le osservazioni a posizioni specifiche in uno spazio concettuale ridotto in modo tale che le distanze tra i punti nello spazio corrispondano il pit possibile alle dissimilarita specificate In questo modo si ottiene una rappresentazione dei minimi quadrati degli oggetti all interno dello spazio che nella maggior parte dei casi aiuta a comprendere meglio i dati Esempio La procedura Scaling multidimensionale pu essere molto utile per definire le relazioni percettive Se ad esempio si prende in considerazione l immagine di un prodotto si pu svolgere un analisi per definire un insieme di dati che descriva le similarit o la distanza percepibili del
358. si delle componenti principali con scaling ottimale Se ciascuna di tali variabili nominale multipla l analisi corrisponde all analisi delle corrispondenze multiple Se sono implicati due insiemi di variabili e uno di essi contiene solo una variabile l analisi identica alla regressione categoriale con scaling ottimale Per ottenere un analisi della correlazione canonica non lineare Dai menu scegliere Analizza Riduzioni dimensione Scaling ottimale Figura 4 1 Finestra di dialogo Scaling ottimale Scaling ottimale Livello di scala ottimale Tutte le variabili sono di tipo nominale multiplo O Alcune variabili non sono di tipo nominale multiplo Numero di insiemi di variabili O Un insieme fi Analisi selezionata Correlazione canonica non lineare Annulla Aiuto gt Selezionare Tutte le variabili non nominali multiple o Una o pi variabili nominali multiple gt Selezionare Pi insiemi gt Fare clic su Definisci 43 Analisi della correlazione canonica non lineare OVERALS Figura 4 2 Finestra di dialogo Analisi della correlazione canonica non lineare OVERALS Analisi della correlazione canonica non lineare OVERALS Set 1 di1 Animali domestici animali E Pei Re Precedente Successivo amp Quotidiani letti pi spes no amp Musica preferita musica Variabili amp Preferenze abitative a et 1 Ordinale Ni Punteggio al test di mat
359. si delle corrispondenze multiple 64 centroidi in analisi della correlazione canonica non lineare 45 203 centroidi proiettati in analisi della correlazione canonica non lineare 203 coefficiente di variazione nell unfolding multidimensionale 288 291 297 304 314 coefficienti in regressione categoriale 107 coefficienti di regressione in regressione categoriale 23 configurazione iniziale in analisi della correlazione canonica non lineare 45 in regressione categoriale 20 in scaling multidimensionale 77 nell unfolding multidimensionale 87 contributi in analisi delle corrispondenze 221 236 coordinate dello spazio comune in scaling multidimensionale 80 nell unfolding multidimensionale 90 coordinate dello spazio individuale nell unfolding multidimensionale 90 coordinate di categoria in analisi della correlazione canonica non lineare 202 correlazioni in scaling multidimensionale 80 correlazioni di ordine zero in regressione categoriale 108 correlazioni parziali in regressione categoriale 108 criteri di iterazione in scaling multidimensionale 77 nell unfolding multidimensionale 87 cronologia iterazioni in analisi Componenti principali categoriale 35 143 338 339 in analisi delle corrispondenze multiple 63 in scaling multidimensionale 80 nell unfolding multidimensionale 90 dimensioni in analisi delle corrispondenze 50 235 discretizzazione in analisi Componenti principali categoriale 31
360. sibile specificare la configurazione iniziale i criteri di iterazione e di convergenza un metodo di normalizzazione il metodo per etichettare i grafici e gli oggetti supplementari Figura 6 6 Finestra di dialogo Opzioni za MCA Opzioni Metodo di normalizzazione Oggetti supplementari ei Principale per variabile Ultimo Criteri Caso singolo H Convergenza L00001 Max iterazioni 100 Etichetta i grafici in base a Etichette di variabili o di valori Lunghezza massima etichetta 20 O Nomi o valori di variabili Dimensioni grafico Visualizza tutte le dimensioni nella soluzione O Limita il numero di dimensioni Configurazione Nessuna v Annulla Aiuto Oggetti supplementari Specificare il numero di caso dell oggetto 0 il primo e l ultimo numero di caso per un intervallo di oggetti che si desidera contrassegnare come supplementare e quindi fare clic su Aggiungi Ripetere l operazione fino ad aver specificato tutti gli oggetti supplementari I pesi di caso di un oggetto definito come supplementare verranno ignorati Metodo di normalizzazione Per normalizzare i punteggi degli oggetti e le variabili possibile specificare una delle cinque opzioni seguenti In un analisi pu essere utilizzato un solo metodo di normalizzazione 62 Capitolo 6 m Principale per variabile Consente di ottimizzare l associazione tra va
361. sopra riportati Termine di penalit L algoritmo tenta di ridurre al minimo lo stress penalizzato una misura della bont di adattamento equivalente al prodotto di Stress I di Kruskal per un termine di penalit basato sul coefficiente di variazione delle distanze trasformate Questi controlli consentono di impostare l intensit e l intervallo del termine di penalit Intensit Il valore del parametro dell intensit inversamente proporzionale alla penalit Specificare un valore compreso tra 0 0 e 1 0 Intervallo Questo parametro definisce il momento in cui la penalit diventa attiva Se l impostazione 0 0 la penalit non attiva Se si aumenta il valore l algoritmo cerca una soluzione con una variazione maggiore tra le distanze trasformate Specificare un valore non negativo 89 Unfolding multidimensionale PREFSCAL Grafici di unfolding multidimensionale Nella finestra di dialogo Grafici possibile specificare i grafici che si desidera creare Figura 8 5 Finestra di dialogo Grafici 2 Unfolding multidimensionale grafici Grafici Avvii multipl Spazio comune finale _ Grafici di trasformazione C Spazio comune iniziale Pesi dello spazio C Grafici di Shepard Stress per dimensione 5p ji C Grafico a dispersione dell adattamento C Grafici dei residui Stili oggetti di riga Colori Tipi di menu srcid Sesso sesso Toast TP Toast imburrato BT ro Grafi
362. ssere considerata un tipo di analisi delle corrispondenze multiple in cui alcune variabili vengono dichiarate ordinali o numeriche Relazione con le tecniche standard Se tutte le variabili sono scalate a livello numerico l analisi delle componenti principali categoriale equivale all analisi delle componenti principali standard Pi in generale l analisi delle componenti principali categoriale un alternativa al calcolo delle correlazioni tra scale non numeriche e all analisi di queste ultime attraverso un approccio di analisi fattoriale o delle componenti principali standard Un utilizzo non attento della normale correlazione di Pearson come misura dell associazione per i dati ordinali pu portare a distorsioni significative nella stima delle correlazioni Analisi della correlazione canonica non lineare OVERALS L analisi della correlazione canonica non lineare una procedura estremamente generale con numerose applicazioni diverse L obiettivo l analisi delle relazioni tra due o pi insiemi di variabili anzich tra le variabili come avviene nell analisi delle componenti principali Ad esempio si supponga di avere due insiemi di variabili uno dei quali include item di background demografico in un insieme di rispondenti e il secondo le risposte a un insieme di item di atteggiamento I livelli di scaling nell analisi possono essere una qualsiasi combinazione dei livelli ordinale numerico e nominale L analisi del
363. ssono fornire informazioni utili circa il fattore comune 168 Capitolo 10 Punteggi oggetto La figura seguente mostra un grafico dei punteggi degli oggetti nel quale i soggetti sono etichettati in base alla categoria diagnostica Figura 10 37 Grafico dei punteggi degli oggetti etichettati per diagnosi 5 g r N ui x o o 3 o e17 28s 0 208 09 3 E Bi 0 20 303 g3 a pP oi 2 agen 8 ou 3 0301 00 3 o 403 Dimensione 1 Questo grafico non consente di interpretare la prima dimensione perch in esso i pazienti non sono separati per diagnosi Tuttavia sono presenti alcune informazioni sulla seconda dimensione I soggetti anoressici 1 e i pazienti con disturbi dell alimentazione atipici 4 formano un gruppo collocato sopra i soggetti con una forma di bulimia 2 e 3 Di conseguenza la seconda dimensione divide i pazienti bulimici dagli altri come visto anche nella sezione precedente le variabili dell insieme relativo alla bulimia hanno elevati pesi di componente positivi nella seconda dimensione Questo ha senso in quanto i pesi di componente dei sintomi generalmente associati alla bulimia hanno valori elevati nella seconda dimensione 169 Analisi Componenti principali categoriale La figura mostra un grafico dei punteggi degli oggetti nel quale i soggetti sono etichettati in base al momento della diagnosi Figura 10 38 Punteggi degli oggetti etichettati in base al nume
364. st TP al Toast imburrato BT Vincoli all Panino dolce con margari Opzioni fll Dolcetto alla marmellata cil Toast alla cannella CT v Grafici Pesi Modello Righe gt Sorgenti Tipi di menu srcid Incolla Reimposta Annulla Aiuto gt Selezionare due o pi variabili che identifichino le colonne nella matrice di distanza rettangolare Ogni variabile rappresenta un oggetto colonna separato gt Se necessario selezionare un numero di variabili di ponderazione uguale al numero delle variabili dell oggetto colonna L ordine delle variabili di ponderazione deve corrispondere all ordine degli oggetti colonna da esse rappresentati gt Se necessario selezionare una variabile di riga I valori o le etichette dei valori di questa variabile vengono utilizzati per etichettare gli oggetti riga nell output gt Se esistono pi sorgenti possibile selezionare una variabile sorgente Il numero dei casi nel file di dati deve essere uguale al numero degli oggetti riga per il numero delle sorgenti E inoltre possibile definire un modello di unfolding multidimensionale assegnare vincoli sullo spazio comune impostare criteri di convergenza specificare la configurazione iniziale che dovr essere utilizzata e scegliere i grafici e l output Definizione di un modello di unfolding multidimensionale Nella finestra di dialogo Modello possibile specificare un mod
365. standard e le correlazioni tra i singoli valori punteggi di riga e punteggi di colonna In una soluzione con analisi di corrispondenza a una dimensione possibile calcolare un intervallo di confidenza per ogni punteggio nella popolazione Se la deviazione standard ampia l analisi di corrispondenza molto incerta circa la posizione del punto nella popolazione D altro canto se la deviazione standard ridotta l analisi di corrispondenza discretamente certa circa la collocazione del punto in prossimit del punto fornito dalla soluzione In una soluzione multidimensionale se la correlazione tra le dimensioni ampia potrebbe non essere possibile individuare un punto nella dimensione corretta con certezza elevata In tali casi gli intervalli di confidenza multivariati devono essere calcolati utilizzando la matrice di varianza covarianza che possibile scrivere in un file Sono visualizzate le statistiche di confidenza per i punteggi di riga e di colonna Le deviazioni standard per le due categorie di dirigenti sono maggiori delle altre probabilmente a causa del numero relativamente limitato di tali figure La deviazione standard per i forti fumatori anch essa maggiore per la stessa ragione Se si esaminano le correlazioni tra le dimensioni per i punteggi si vedr che le correlazioni sono generalmente ridotte per i punteggi di riga e colonna a eccezione dei quadri junior con una correlazione pari a 0 611 Figura 12 14 S
366. stino e le specifiche fisiche sono state ottenute dal sito edmunds com e dai siti dei produttori carpet sav Come esempio tipico Green e Wind 1973 un azienda interessata alla commercializzazione di un nuovo battitappeto desidera esaminare l influenza di cinque fattori sulle preferenze del consumatore ovvero design della confezione marca prezzo la presenza di un marchio di qualit e una garanzia Soddisfatti o rimborsati Esistono tre livelli di fattore per il design della confezione che differiscono per la posizione della spazzola dell applicatore tre marchi K2R Glory e Bissell tre livelli di prezzo e due livelli no o si per ciascuno degli ultimi due fattori Dieci consumatori sono classificati in 22 profili definiti da questi fattori La variabile Preferenza include il rango delle classificazioni medie per ogni profilo Classificazioni basse corrispondono a una preferenza elevata La variabile riflette una misura globale della preferenza per ogni profilo carpet_prefs sav Questo file di dati si basa sullo stesso esempio del file carpet sav ma contiene le classificazioni effettive raccolte da ciascuno dei 10 clienti Ai clienti stato chiesto di classificare 22 profili di prodotti in ordine di preferenza Le variabili da PREFI a PREF22 contengono gli ID dei profili associati come definito nel file carpet_plan sav catalog sav File di dati ipotetico che contiene le cifre sulle vendite mensili di tre prodotti venduti da
367. stress C Distanze trasformate V Variabili indipendenti trasformate V Dati iniziali V Correlazioni di variabili e dimensioni Salva in un nuovo file C Coordinate spazio comune o individuale C Distanze C Distanze trasformate Variabili indipendenti trasformate Annulla Aiuto Visualizzazione Selezionare una o pi delle seguenti opzioni per la visualizzazione Coordinate dello spazio comune Visualizza le coordinate dello spazio comune Coordinate dello spazio individuale Visualizza le coordinate degli spazi individuali solo nel caso in cui il modello sia diverso da Identit Pesi dello spazio individuale Visualizza i pesi dello spazio individuale solo nel caso in cui venga specificato uno dei modelli delle differenze individuali A seconda del modello i pesi dello spazio vengono scomposti in pesi di rotazione e pesi di dimensione anch essi visualizzati nel grafico Distanze Visualizza le distanze tra gli oggetti nella configurazione specificata Distanze trasformate Visualizza le distanze trasformate tra gli oggetti della configurazione Dati iniziali Include le distanze originali e se presenti i pesi dei dati la configurazione iniziale e le coordinate fisse o le variabili indipendenti Stress per inizi casuali Visualizza il seme del numero casuale e il valore di Raw Stress normalizzato per ciascun inizio casuale Cronologia iterazioni Visualizza la cronologia delle iterazioni dell algorit
368. tassi possibile vincolare uguaglianza delle categorie 1 e 2 e vincolare uguaglianza delle categorie 3 e 4 m La categoria supplementare Le categorie supplementari non influiscono sull analisi ma devono essere rappresentate nello spazio definito dalle categorie attive Non influiscono in alcun modo sulla definizione delle dimensioni Il numero massimo di categorie di colonna supplementari uguale al numero totale delle categorie di colonna meno 2 Analisi delle corrispondenze Modello Nella finestra di dialogo Modello possibile specificare il numero di dimensioni la misura della distanza il metodo di standardizzazione e il metodo di normalizzazione 51 Analisi corrispondenze Figura 5 4 Finestra di dialogo Modello Analisi delle corrispondenze Modello Dimensioni nella soluzione p Misura di distanza Chi Quadrato Euclidea Metodo di standardizzazione Medie di riga e colonna rimosse Totali di riga uguali e medie rimosse Totali di colonna uguali e medie rimosse Metodo di normalizzazione cd Principale per riga Personalizzato O Principale Principale per colonna Annulla Aiuto Dimensioni nella soluzione Specificare il numero di dimensioni In genere si sceglie un numero di dimensioni sufficiente a spiegare la maggior parte della variazione Il numero massimo di dimensioni dipende dal numero delle categorie attive utilizzate nell analisi e dai vincoli di uguaglianza
369. tatistical Psychology 46 287 300 Meulman J J 1996 Fitting a distance model to homogeneous subsets of variables Points of view analysis of categorical data Journal of Classification 13 249 266 Meulman J J 2003 Prediction and classification in nonlinear data analysis Something old something new something borrowed something blue Psychometrika 4 493 517 Meulman J e Verboon 1993 Points of view analysis revisited Fitting multidimensional structures to optimal distance components with cluster restrictions on the variables Psychometrika 58 7 35 Meulman J J A J Van der Kooij e A Babinec 2000 New features of categorical principal components analysis for complicated data sets including data mining In Classification Automation and New Media W Gaul e G Ritter ed Berlin Springer Verlag 207 217 Meulman J J A J Van der Kooij e W J Heiser 2004 Principal components analysis with nonlinear optimal scaling transformations for ordinal and nominal data In Handbook of Quantitative Methodology for the Social Sciences D Kaplan ed Thousand Oaks Calif Sage Publications Inc 49 70 Meulman J J e W J Heiser 1997 Graphical display of interaction in multiway contingency tables by use of homogeneity analysis In Visual Display of Categorical Data M Greenacre e J Blasius ed New York Academic Press 277 296 Nishisato S 1980 Analysis of categorical data Dual scaling and its ap
370. tatistiche di confidenza per punteggi di riga a Te nella dimensione Correlazione Categoria Dirigenti anziani Dirigenti giovani Impiegati anziani Impiegati giovani Segreteria 225 Analisi corrispondenze Figura 12 15 Statistiche di confidenza per punteggi di colonna Deviazione standard nella dimensione Correlazione Fumatore 1 2 No Leggero Medio Accanito Profili supplementari Nell analisi delle corrispondenze le categorie aggiuntive possono essere rappresentate nello spazio che descrive le relazioni tra le categorie attive Un profilo supplementare definisce un profilo tra le categorie della variabile di riga o di colonna e non influenza l analisi in alcun modo Il file di dati include una riga supplementare e due colonne supplementari La media nazionale delle persone in ciascuna categoria di livello di tabagismo definisce un profilo di riga supplementare Le due colonne supplementari definiscono due profili di colonna tra le categorie di personale I profili supplementari definiscono un punto nello spazio di riga o di colonna Poich l attenzione si concentrer sia sulle righe sia sulle colonne separatamente verr utilizzata la normalizzazione principale Esecuzione dell analisi Figura 12 16 Finestra di dialogo Definisci intervallo di righe Analisi delle corrispondenze Definisci interv Intervallo di categorie per la variabile di riga categ Valore min 1 Valore max
371. te screws sav Questo file di dati contiene informazioni sulle caratteristiche di viti bulloni dadi e puntine Hartigan 1975 shampoo_ph sav File di dati ipotetici che prende in esame il processo di controllo di qualita di un industria di prodotti per capelli A intervalli di tempo regolari vengono misurati sei diversi lotti prodotti e ne viene registrato il relativo pH I valori accettati sono compresi tra 4 5 e 5 5 ships sav Ad esempio un insieme di dati presentato e analizzato altrove McCullagh et al 1989 riguarda i danni subiti dalle navi da carico a causa delle onde I conteggi degli incidenti possono essere presentati con un tasso di Poisson in base al tipo di nave al periodo di costruzione e al periodo di servizio I mesi di servizio aggregati di ciascuna cella della tabella generata dalla classificazione incrociata dei fattori fornisce i valori di esposizione al rischio site sav File di dati ipotetici che prende in esame l impegno di una societ nella scelta di nuovi siti in cui espandere la propria presenza La societ ha incaricato due consulenti separati che oltre a valutare i siti e presentare un report completo devono classificarli come potenzialmente molto adatti adatti o poco adatti siteratings sav File di dati ipotetici che prende in esame il test beta di un nuovo sito Web di una societ di e commerce Ciascun caso rappresenta una diversa persona che ha eseguito il test beta e indica il
372. te di specificare se nei grafici verranno utilizzati le variabili e le etichette dei valori o i nomi delle variabili e i valori E inoltre possibile specificare una lunghezza massima per le etichette 22 Capitolo 2 Regolarizzazione della regressione categoriale Figura 2 6 Finestra di dialogo Regolarizzazione z Regressione categoriale Regolarizzazione Metodo Grafici Elastic Net Nessuno O Produci tutti i possibili grafici Elastic Net O Regressione Ridge Produci grafici Elastic Net per alcune penalit Ridge Intervallo di valori Primo 0 2 Ultimo 06 O Valore unico Elastic Net Minimo Massimo Incremento valori penalit Ridge Regressione Ridge 0 0 1 0 DI Elenco di valori penalit Lasso oo fo poz Aggiungi Visualizza grafici di regolarizzazione Annulla Aiuto Metodo I metodi di regolarizzazione consentono di migliorare l errore predittivo del modello diminuendo la variabilit delle stime del coefficiente di regressione riducendo le stime verso lo 0 Lasso ed Elastic Net ridurranno alcune stime dei coefficienti esattamente a 0 fornendo in questo modo una forma di selezione variabile Quando richiesto un metodo di regolarizzazione il modello regolarizzato e i coefficienti per ogni valore di coefficiente di penalit vengono scritti in un file di dati SPSS Statistics esterno o in un insieme di dati della sessione corrente Per
373. tegorie sono identificate da interruzioni sulla linea che collega le quantificazioni Grafici dei residui Per ciascuna variabile i residui calcolati per la variabile dipendente attesa in base a tutte le variabili stimatore eccetto quella in questione vengono inseriti nel grafico mediante il confronto con gli indicatori di categoria e le quantificazioni di categoria ottimali moltiplicate per i coefficienti beta e confrontate con gli indicatori di categoria Opzioni aggiuntive del comando CATREG Per personalizzare la procedura Regressione categoriale possibile incollare le selezioni in una finestra di sintassi e quindi modificare la sintassi dei comandi CATREG cos ottenuta Il linguaggio della sintassi dei comandi consente inoltre di m Specificare i nomi di radice per le variabili trasformate durante il salvataggio nel file di dati attivo con il sottocomando SAVE Per informazioni dettagliate sulla sintassi vedere Command Syntax Reference Capitolo Analisi delle componenti principali categoriale CATPCA Questa procedura consente di quantificare le variabili categoriali e contemporaneamente di ridurre la dimensione dei dati L analisi delle componenti principali categoriale conosciuta anche con l acronimo CATPCA Categorical Principal Component Analysis Lo scopo principale dell analisi delle componenti principali categoriale quello di ridurre un insieme originale di variabili in un insieme pi limitato di comp
374. tendibilit del modello rispetto ai dati si veda il riepilogo del modello Circa il 47 della varianza totale spiegata dal modello a due componenti il 35 dalla prima dimensione e il 12 dalla seconda Di conseguenza quasi la met della variabilit a livello di singoli oggetti spiegata dal modello a due componenti 167 Analisi Componenti principali categoriale Pesi di componente Per iniziare l interpretazione delle due dimensioni della soluzione si esaminino i pesi di componente Tutte le variabili hanno un peso di componente positivo nella prima dimensione questo significa che esiste un fattore comune di correlazione positiva con tutte le variabili Figura 10 36 Grafico dei pesi di componente 0 75 gygntazione esager Vomito 0 50 Stato mentale umore ESRARFURAZIARE Per a 0 00 Comportamento sessua Dimensione 2 Relazioni familiari 0 0 0 2 0 4 0 6 08 Dimensione 1 La seconda dimensione separa le variabili Le variabili Eccessi alimentari Episodi di vomito e Uso di lassativi formano un insieme con elevati pesi positivi nella seconda dimensione Questi sintomi sono tipicamente considerati rappresentativi di un comportamento bulimico Le variabili Emancipazione dalla famiglia Risultati lavorativi scolastici Atteggiamento sessuale Peso corporeo e Ciclo mestruale formano un altro insieme ed possibile includere Limitata ingestione di cibo digiuno e Rapporti famigliari nel medesimo insiem
375. tensit leggera e frequenza scarsa sono vicine e interazione frequente e intensit di interazione elevata sono vicine possibile inoltre vedere che la vicinanza fisica elevata sembra andare di pari passo con un tipo di relazione informale e che la distanza fisica correlata all assenza di relazione Punteggi oggetto Si pu inoltre richiedere un elenco e il grafico dei punteggi degli oggetti Il grafico dei punteggi degli oggetti pu essere utile per rilevare valori anomali gruppi tipici di oggetti o per evidenziare alcuni modelli speciali La tabella dei punteggi degli oggetti mostra l elenco dei punteggi etichettati per gruppo sociale per i dati di Guttman Bell Esaminando i valori per i punti degli oggetti possibile identificare oggetti specifici all interno del grafico Figura 10 11 Punteggi degli oggetti Gruppo tl Normalizzazione principale per variabile La prima dimensione sembra dividere FOLLA e UDITORIO che hanno punteggi negativi relativamente elevati da PUBBLICO e GRUPPI PRIMARI che hanno punteggi positivi relativamente elevati La seconda dimensione include tre gruppi UDITORIO e GRUPPI SECONDARI con valori negativi elevati FOLLA con valori positivi elevati e gli altri gruppi sociali compresi tra di essi Esaminando il grafico dei punteggi degli oggetti questo risulta pi evidente 147 Analisi Componenti principali categoriale Figura 10 12 Grafico dei punteggi degli oggetti AU PG
376. theory and method of scale construction In The Prediction of Personal Adjustment P Horst ed New York Social Science Research Council 319 348 Guttman L 1968 A general nonmetric technique for finding the smallest coordinate space for configurations of points Psychometrika 33 469 506 Hartigan J A 1975 Clustering algorithms New York John Wiley and Sons Hastie T e R Tibshirani 1990 Generalized additive models London Chapman and Hall Hastie T R Tibshirani e A Buja 1994 Flexible discriminant analysis Journal of the American Statistical Association 89 1255 1270 Hayashi C 1952 On the prediction of phenomena from qualitative data and the quantification of qualitative data from the mathematico statistical point of view Annals of the Institute of Statitical Mathematics 2 93 96 Heiser W J 1981 Unfolding analysis of proximity data Leiden Department of Data Theory University of Leiden Heiser W J e F M T A Busing 2004 Multidimensional scaling and unfolding of symmetric and asymmetric proximity relations In Handbook of Quantitative Methodology for the Social Sciences D Kaplan ed Thousand Oaks Calif Sage Publications Inc 25 48 334 Bibliografia Heiser W J e J J Meulman 1994 Homogeneity analysis Exploring the distribution of variables and their nonlinear relationships In Correspondence Analysis in the Social Sciences Recent Developments and Applications M Gree
377. ti La seguente tabella mostra le variabili nell insieme di dati derivante dalla classificazione in sette gruppi sociali utilizzata nei dati di Guttman Bell con le etichette delle variabili e dei valori categorie associate ai livelli di ciascuna variabile Questo insiemi di dati reperibile nel file guttman sav Per ulteriori informazioni vedere File di esempio in Appendice A a pag 321 Oltre a selezionare le variabili da includere nel calcolo dell analisi componenti principali categoriale possibile selezionare variabili utilizzate per assegnare etichette agli oggetti nei grafici Nell esempio le prime cinque variabili nei dati sono incluse nell analisi mentre il cluster utilizzato esclusivamente come variabile di etichetta Quando si specifica un analisi componenti 138 139 Analisi Componenti principali categoriale principali categoriale necessario specificare il livello di scaling ottimale per ogni variabile dell analisi Nell esempio specificato un livello ordinale per tutte le variabili dell analisi Tabella 10 1 Variabili nell insieme di dati di Guttman Bell Nome di variabile Etichetta di valore Etichetta del valore intensit intensit dell interazione Leggera bassa moderata alta frequenza Frequenza dell interazione Leggera non ricorrente non frequente frequente appartenenza Sentimento di appartenenza Nessuna leggera variabile alta vicinanza Vicinanza fisi
378. tile mantenerlo sufficientemente basso da consentire interpretazioni significative La tabella di riepilogo del modello mostra inoltre 1 Alfa di Cronbach una misura di affidabilit massimizzata dalla procedura Quantificazioni Per ciascuna variabile vengono presentate le quantificazioni le coordinate del vettore e del centroide per ogni dimensione Le quantificazioni sono i valori assegnati a ciascuna categoria Le coordinate del centroide sono la media dei punteggi degli oggetti per gli oggetti della stessa categoria Le coordinate del vettore sono le coordinate delle categorie quando necessario che siano presenti su una linea a rappresentazione della variabile nello spazio Questo necessario per le variabili con livello di scaling numerico e ordinale 145 Analisi Componenti principali categoriale Figura 10 9 Quantificazioni dell intensit dell interazione Coordinate del centroide Coordinate del vettore Quantifica Dimensione Dimensione Categoria Frequenza zione 1 2 1 MINIMA BASSA MODERATA ALTA Normalizzazione principale per variabile Considerando le quantificazioni nel grafico congiunto dei punti delle categorie possibile vedere che alcune delle categorie di alcune variabili non sono state distinte dall analisi componenti principali categoriale tanto nettamente quanto previsto se il livello fosse stato completamente ordinale Le variabili Intensit dell interazione e Frequenza del
379. timo non necessario nel modello Un valore di tolleranza vicino a 1 indica che la variabile non pu essere prevista con grande affidabilit a partire dagli altri predittori Per contro una variabile con una tolleranza molto bassa apporta poche informazioni a un modello e pu causare problemi di calcolo Inoltre elevati valori negativi della misura di importanza di Pratt sono indicativi di multicollinearit 110 Capitolo 9 Tutte le misure di tolleranza sono molto elevate Nessuno dei predittori previsto con grande affidabilit dagli altri ed presente multicollinearit Grafici di trasformazione Tracciando i valori della categoria originale rispetto alle quantificazioni corrispondenti possibile evidenziare trend che potrebbero non venire notati in un elenco delle quantificazioni Tali grafici sono normalmente definiti grafici di trasformazione Prestare attenzione alle categorie che ricevono quantificazioni simili Queste categorie influenzano la risposta prevista nello stesso modo Tuttavia il tipo di trasformazione definisce l aspetto di base del grafico Le variabili trattate come numeriche determinano una relazione lineare tra le quantificazioni e le categorie originali corrispondente a una linea retta nel grafico di trasformazione L ordine e la differenza tra le categorie originali vengono mantenuti nelle quantificazioni L ordine delle quantificazioni per le variabili trattate come ordinali corrisponde all
380. to a una quantit media di spostamenti Statistiche e grafici Frequenze valori mancanti livello di scaling ottimale moda varianza spiegata in base alle coordinate del centroide coordinate del vettore totale per variabile e per dimensione pesi di componente per le variabili quantificate in base al vettore quantificazioni e coordinate di categoria cronologia delle iterazioni correlazioni delle variabili trasformate e autovalori della matrice di correlazione correlazioni delle variabili originali e autovalori della matrice di correlazione punteggi degli oggetti grafici di categoria grafici di categoria congiunti grafici di trasformazione grafici dei residui grafici dei centroidi proiettati grafici degli oggetti biplot triplot e grafici dei pesi di componente Dati I valori delle variabili stringa vengono sempre convertiti in interi positivi disposti in ordine alfabetico crescente I valori mancanti definiti dall utente i valori mancanti di sistema e i valori inferiori a 1 sono considerati valori mancanti possibile ricodificare o aggiungere una costante alle variabili con valori inferiori a 1 per fare in modo che siano considerate come non mancanti 27 28 Capitolo 3 gt Assunzioni I dati devono contenere almeno tre casi validi e l analisi basata su dati interi positivi La funzione di discretizzazione classifica automaticamente una variabile con valore frazionario raggruppandone i valori in categorie con
381. tra il raw stress normalizzato della soluzione per ogni dimensione possibile vedere dal grafico che aumentando la dimensionalit da 2 a 3 e da 3 a 4 lo stress viene notevolmente migliorato Per valori successivi a 4 i miglioramenti sono limitati Si sceglier di analizzare i dati utilizzando una soluzione a tre dimensioni in quanto l interpretazione dei dati risulta facilitata Una soluzione a tre dimensioni Le variabili indipendenti sesso gener generazione e grado di separazione sono state strutturare con l intenzione di utilizzarle per interpretare le dimensioni della soluzione Le variabili indipendenti sono state strutturate come segue Sesso 1 maschile 2 femminile 9 mancante per cugino gener Il numero di generazioni tra il rispondente se il termine si riferisce alla sua parentela dove numeri pi bassi corrispondono a generazioni pi vecchie Di conseguenza i valori per nonni nipoti e fratelli sono rispettivamente 2 2 e 0 grado Il numero di gradi di separazione lungo l albero genealogico Di conseguenza i genitori del rispondente si trovano sul nodo superiore i suoi figli sul nodo inferiore I fratelli del rispondente si trovano su un nodo pi in alto rispetto ai suoi genitori e quindi di un altro nodo pi in basso per un totale di 2 gradi di separazione Il cugino del rispondente a 4 gradi di separazione 2 fino ai nonni quindi altri due verso il basso attra
382. tra variabili Le coordinate delle variabili nello spazio dell oggetto sono i pesi di componente ovvero le correlazioni con le componenti principali quali le dimensioni e i punteggi degli oggetti Questo metodo risulta utile se la correlazione tra variabili riveste un importanza fondamentale m Principale per oggetto Questo metodo consente di ottimizzare le distanze tra gli oggetti e risulta utile se le dissimilarit o le similarit tra gli oggetti sono di importanza fondamentale Simmetrico Utilizzare questo metodo di normalizzazione se la relazione tra oggetti e variabili di importanza fondamentale 35 Analisi delle componenti principali categoriale CATPCA m Indipendente Utilizzare questo metodo se si desidera esaminare separatamente le distanze tra gli oggetti e le correlazioni tra le variabili m Personalizzata possibile specificare qualsiasi valore reale compreso nell intervallo 1 1 Il valore 1 equivale al metodo Principale per oggetto il valore 0 equivale al metodo Simmetrico e il valore 1 equivale al metodo Principale per variabile Se si specifica un valore maggiore di 1 e minore di 1 possibile disperdere l autovalore negli oggetti e nelle variabili Questo metodo utile per creare biplot o triplot adatti alle specifiche esigenze Criteri possibile specificare il numero massimo di iterazioni che possono essere eseguite dalla procedura durante i calcoli e inoltre selezionare un valore pe
383. tti Visualizza i punteggi degli oggetti compresi la massa l inerzie ed i contributi ed offre le seguenti opzioni m Includicategorie Visualizza gli indicatori di categoria per le variabili dell analisi selezionate m Etichetta in base a Per etichettare gli oggetti possibile selezionare una variabile dall elenco di variabili etichetta Misure di discriminazione Visualizza le misure di discriminazione per variabile e per dimensione Cronologia iterazioni Visualizza la varianza spiegata la perdita e l aumento della varianza spiegata per ciascuna iterazione Correlazioni delle variabili originali Visualizza la matrice di correlazione delle variabili originali e gli autovalori di tale matrice Correlazioni delle variabili trasformate Visualizza la matrice di correlazione delle variabili trasformate con scaling ottimale e gli autovalori di tale matrice 64 Capitolo 6 Quantificazioni e contributi delle categorie Fornisce le quantificazioni di categoria e le coordinate compresi la massa l inerzia ed i contributi per ciascuna dimensione delle variabili selezionate Statistiche descrittive Visualizza le frequenze il numero di valori mancanti e la moda delle variabili selezionate Analisi delle corrispondenze multiple Salva Dalla finestra di dialogo Salva possibile salvare i dati discretizzati i punteggi degli oggetti e 1 valori trasformati in un file di dati esterno di SPSS Statistics o un insieme di dati nel
384. tti con parte inferiore a punta La seconda dimensione l asse verticale separa VITE e CHIODO6 da tutti altri oggetti L elemento in comune tra VITE e CHIODO6 sono i valori sulla lunghezza della variabile sono gli oggetti pi lunghi presenti nei dati Inoltre VITE si trova molto pi lontano dall origine rispetto agli altri oggetti il che suggerisce che considerate nel complesso molte caratteristiche di questo oggetto non sono condivise dagli altri Il grafico dei punteggi degli oggetti particolarmente utile per individuare visivamente 1 valori anomali VITEI potrebbe essere considerato un valore anomalo Pi oltre considereremo cosa avviene escludendo questo oggetto Misure di discriminazione Prima di esaminare il resto dei grafici dei punteggi delle oggetti verificheremo se le misure di discriminazione concordano con quanto detto finora Per ogni variabile una misura di discriminazione che pu essere considerata come un peso di componente quadrato viene calcolata per ogni dimensione Questa misura rappresenta anche la varianza della variabile quantificata in quella dimensione Il suo valore massimo 1 ottenuto se i punteggi degli oggetti sono compresi in gruppi mutuamente esclusivi e se tutti i punteggi di oggetti all interno di una categoria sono identici Nota Questa misura pu avere un valore maggiore di 1 in presenza di dati mancanti Misure di discriminazione elevate corrispondono a una distribuzione ampia tra l
385. tto pi spesso comporta una discriminazione principalmente nella prima dimensione e che la variabile Stato civile comporta una discriminazione pressoch totale nella seconda In altre parole le categorie di Giornale letto 199 Analisi della correlazione canonica non lineare OVERALS piu spesso sono maggiormente separate nella prima dimensione rispetto alla seconda mentre il modello invertito per Stato civile Per contro Et in anni comporta una discriminazione nella prima e nella seconda dimensione di conseguenza la distribuzione delle categorie uguale in entrambe le dimensioni Pesi di componente La figura seguente mostra il grafico dei pesi di componente per i dati dell indagine In assenza di dati mancanti i pesi di componente sono equivalenti alle correlazioni di Pearson tra le variabili quantificate e i punteggi degli oggetti La a distanza dall origine a ogni punto di variabile approssimativamente pari all importanza di tale variabile Le variabili canoniche non sono inserite nel grafico ma possono essere rappresentate tramite linee verticali e orizzontali tracciate a partire dall origine Figura 11 17 Pesi di componente Animali domestici o e Et in anni Dimensione 2 o o 0 25 Peele letti pi spesso ren e Musica preferita 0 50 ene abitative Afimali domestici o le Stato civile 0 75 0 5 00 05 10 Dimensione 1 Le relazioni tra le variabili sono evidenti
386. u uno studio svolto per mettere a confronto l efficacia di due terapie preventive per la recidiva delle ulcere Fornisce un ottimo esempio di dati acquisiti a intervalli ed stato presentato e analizzato in altri luoghi Collett 2003 ulcer_recurrence_recoded sav In questo file sono contenute le informazioni del file ulcer_recurrence sav riorganizzate per consentire di presentare la probabilit degli eventi per ciascun intervallo dello studio anzich solo alla fine stato presentato e analizzato in altri luoghi Collett et al 2003 verd1985 sav Questo file di dati prende in esame un indagine Verdegaal 1985 Sono state registrate le risposte di quindici soggetti a otto variabili Le variabili di interesse sono suddivise in tre insiemi L insieme 1 include et e statociv l insieme 2 include andom e giornale e l insieme 3 include musica e vicinato Andom viene scalata come nominale multipla ed et come ordinale tutte le altre variabili vengono scalate come nominali singole virus sav File di dati ipotetici che prende in esame l impegno di un ISP Internet Service Provider nel tentativo di determinare gli effetti che un virus pu generare nelle sue reti Si tenuta traccia della percentuale approssimativa di traffico e mail infettato da virus sulla rete in un lasso di tempo dal momento dell individuazione fino alla soppressione della minaccia waittimes sav File di dati ipotetici che prende in esame i tempi
387. uartiere in cui risiede la propriet la data dell ultimo accertamento e la valutazione fatta in tale data property_assess_cs_sample sav File di dati ipotetici che contiene un campione delle propriet elencate nel file property_assess_cs sav Il campione stato selezionato in base al disegno specificato nel file di piano property_assess csplan e questo file di dati contiene le probabilit di inclusione e i pesi del campione L ulteriore variabile Valore corrente stata raccolta e aggiunta al file di dati dopo aver acquisito il campione recidivism sav File di dati ipotetici che prende in esame l impegno delle Forze dell Ordine nel tentativo di valutare il tasso di recidivit nella propria area di giurisdizione Ogni caso corrisponde a un precedente trasgressore e include le informazioni demografiche alcuni dettagli sul primo crimine il tempo trascorso fino al secondo arresto e se tale arresto avvenuto entro due anni dal primo recidivism_cs_sample sav File di dati ipotetici che prende in esame l impegno delle Forze dell Ordine nel tentativo di valutare il tasso di recidivit nella propria area di giurisdizione Ogni caso corrisponde a un trasgressore precedente rilasciato dopo il primo arresto durante il mese di giugno del 2003 e registra le relative informazioni demografiche alcuni dettagli sul primo crimine commesso e i dati del secondo arresto se si verificato prima della fine di giugno del 2006 I trasgressori son
388. udio dei profili di riga e di colonna e i test di indipendenza mediante la statistica Chi quadrato Il numero dei profili pu tuttavia essere piuttosto elevato e il test Chi quadrato non in grado rilevare la struttura della dipendenza La procedura Tavole di contingenza rende disponibili numerosi test e misure di associazione ma non pu rappresentare graficamente le relazioni tra le variabili L analisi fattoriale una tecnica standard per la descrizione delle relazioni tra le variabili all interno di uno spazio dimensionale ridotto ma richiede tuttavia dati per intervallo e il numero di osservazioni deve essere pari a cinque volte il numero delle variabili L analisi delle corrispondenze invece assume variabili nominali ed in grado di descrivere le relazioni tra le categorie di ciascuna variabile nonch la relazione tra le variabili Pu inoltre essere utilizzata per l analisi di qualsiasi tabella di misure di corrispondenza positive Esempio possibile utilizzare l analisi delle corrispondenze per visualizzare graficamente le relazioni tra la categoria lavorativa e le abitudini correlate al fumo Si pu scoprire che per quanto riguarda il fumo il comportamento dei manager di livello inferiore si differenzia da quello delle segretarie e che invece quello delle segretarie non si differenzia dal comportamento dei manager di livello superiore oppure che i manager di livello inferiore fumano molto mentre le segretarie fumano
389. uesto modello suggerisce lo scaling di Temperatura a livello ordinale 122 Capitolo 9 Figura 9 36 Grafico di trasformazione per Giorno dell anno nominale Quantificazioni 1234567489 Categorie La figura mostra il grafico di trasformazione per Giorno dell anno Le quantificazioni tendono a ridursi fino alla categoria 9 in corrispondenza della quale tendono ad aumentare generando una forma a U Considerando il segno del coefficiente di regressione per Giorno dell anno le categorie iniziali da a 5 ricevono quantificazioni con effetto decrescente sull ozono previsto Dalla categoria 6 in avanti l effetto delle quantificazioni sull ozono previsto diventa sempre pi crescente raggiungendo il massimo in corrispondenza della categoria 9 Oltre la categoria 79 le quantificazioni tendono a ridurre l ozono previsto Sebbene la linea sia piuttosto irregolare la forma generale rimane identificabile Di conseguenza i grafici di trasformazione suggeriscono lo scaling di Temperatura a livello ordinale mantenendo al contempo lo scaling nominale di tutti gli altri predittori Per ricalcolare la regressione eseguendo lo scaling di Temperatura a livello ordinale richiamare la finestra di dialogo Regressione categoriale Figura 9 37 Finestra di dialogo Definisci scala Regressione categoriale definisci scala Livello di scala ottimale O Spline ordinale i Spline nominale Nominale Numerica Sp
390. ultaneamente Distanze Dimensioni Dissimilarit Minimo 7 O Similarit Massimo 10 Annulla Aiuto Modello di scaling Scegliere una delle seguenti opzioni m Identit Tutte le sorgenti hanno la stessa configurazione m Euclideo pesato un modello per differenze individuali Ciascuna sorgente ha uno spazio individuale in cui ogni dimensione dello spazio comune viene pesata in modo differenziale m Euclideo generalizzato un modello per differenze individuali Ciascuna sorgente ha uno spazio individuale uguale alla rotazione dello spazio comune seguito da una pesatura differenziale delle dimensioni m Rango ridotto Questo un modello Euclideo generalizzato in cui possibile specificare il rango dello spazio individuale Il rango specificato deve essere maggiore o uguale a 1 e inferiore al numero massimo di dimensioni Forma Specificare se le distanze devono essere prese dal triangolo inferiore o dal triangolo superiore della matrice delle distanze possibile specificare che deve essere utilizzata l intera matrice e in questo caso verr analizzata la somma ponderata del triangolo superiore e del triangolo inferiore tuttavia opportuno specificare la matrice completa inclusa la diagonale anche se verranno utilizzate solo le parti indicate Distanze Specificare se la matrice di distanza contiene misure di similarit o di dissimilarit 76 Capitolo 7 Trasformazioni delle distanze Sceglie
391. un notevole miglioramento nelle misure di stress Come passaggio successivo possibile che si desideri distinguere le variabili ordinali ovvero consentire che valori equivalenti delle variabili originali ottengano diversi valori trasformati Ad esempio nella prima sorgente le distanze tra Zia e Figlio e tra Zia e Nipote maschio di nonnisono pari a 85 L approccio a pari merito alle variabili ordinali forza l equivalenza tra i valori trasformati di queste distanze ma non c alcuna ragione particolare per presumere che questo sia corretto In questo caso consentendo la distinzione delle distanze si elimina un vincolo superfluo Letture consigliate Consultare i testi seguenti per ulteriori informazioni sullo scaling multidimensionale Commandeur J F e W J Heiser 1993 Mathematical derivations in the proximity scaling PROXSCAL of symmetric data matrices Leiden Department of Data Theory University of Leiden De Leeuw J e W J Heiser 1980 Multidimensional scaling with restrictions on the configuration In Multivariate Analysis Vol V P R Krishnaiah ed Amsterdam North Holland 501 522 Heiser W J 1981 Unfolding analysis of proximity data Leiden Department of Data Theory University of Leiden Heiser W J e F M T A Busing 2004 Multidimensional scaling and unfolding of symmetric and asymmetric proximity relations In Handbook of Quantitative Methodology for the Social Sciences D
392. una societ di vendita per corrispondenza Il file include anche 1 dati di cinque possibili variabili predittore catalog_seasfac sav Questo file di dati uguale al file catalog sav con l eccezione che contiene un insieme di fattori stagionali calcolati dalla procedura Decomposizionale stagionale insieme a variabili di dati cellular sav File di dati ipotetici che prende in esame l impegno di un azienda di telefonia cellulare nel tentativo di ridurre il churn ovvero l abbandono dei clienti Agli account vengono applicati i punteggi relativi alla propensione al churn con valori compresi tra 0 e 100 Gli account con punteggio pari a 50 o superiore probabile che stiano cercando nuovi provider ceramics sav File di dati ipotetici che prende in esame l impegno di un produttore che desidera stabilire se una nuova lega premium ha una maggiore resistenza al calore rispetto alla lega standard Ciascun caso rappresenta il test separato di una delle leghe indicata la temperatura massima alla quale pu essere sottoposto il cuscinetto cereal sav File di dati ipotetici che prende in esame le preferenze relative agli alimenti della colazione di un campione di 880 persone Il file riporta anche l et il sesso e lo stato civile del campione e se le persone conducono uno stile di vita attivo in base a un attivit sportiva con frequenza di due volte alla settimana Ogni caso rappresenta un rispondente separato clothing_defects sa
393. une Spazi individuali Per ciascuna sorgente nelle matrici di grafici a dispersione vengono visualizzate le coordinate degli spazi individuali Ci avviene solo se nella finestra di dialogo Modello specificato uno dei modelli delle differenze individuali Pesi dello spazio individuale Viene creato un grafico a dispersione dei pesi dello spazio individuale Ci avviene solo se nella finestra di dialogo Modello specificato uno dei modelli delle differenze individuali Per il modello Euclideo pesato nei grafici vengono rappresentati i pesi con una dimensione su ciascun asse Per il modello Euclideo generalizzato viene creato un grafico per dimensione in cui sono indicate sia la rotazione che il peso della dimensione Il modello Rango ridotto crea lo stesso grafico del modello Euclideo generalizzato ma il numero delle dimensioni per gli spazi individuali viene ridotto Distanze originali con distanze trasformate Vengono creati grafici delle distanze originali e delle distanze trasformate Distanze trasformate con distanze Nel grafico vengono rappresentate le distanze trasformate e le distanze Variabili indipendenti trasformate Vengono creati grafici di trasformazione per le variabili indipendenti Correlazioni di variabili e dimensioni Viene visualizzato un grafico della correlazione tra le variabili indipendenti e le dimensioni dello spazio comune 80 Capitolo 7 Scaling multidimensionale Grafici Versione 2 Nella
394. utilizzabile per riprodurre queste analisi contenuta in prefscal_breakfast sps Esecuzione dell analisi gt Per eseguire un analisi di unfolding multidimensionale dai menu scegliere Analizza Scala Unfolding multidimensionale PREFSCAL Figura 15 8 Finestra di dialogo principale Unfolding multidimensionale Unfolding multidimensionale Distanze L Sesso sesso ail Toast TP a all Toast imburrato BT Vincoli all Panino dolce con margari Opzioni di Dolcetto alla marmellata Modello Grafici Pesi Righe Sorgenti Tipi di menu srcid gt Selezionare le variabili di distanza da Pane da tostare a Muffin e burro gt Selezionare Menu scenarios come variabile sorgente gt Fare clic su Modello 294 Capitolo 15 Figura 15 9 Finestra di dialogo Modello 3 Unfolding multidimensionale modello Grado Modi interni O gt Selezionare Euclideo pesato come modello di scaling gt Fare clic su Continua gt Nella finestra di dialogo Unfolding multidimensionale fare clic su Opzioni 295 Unfolding multidimensionale Figura 15 10 Finestra di dialogo Opzioni 3 Unfolding multidimensionale opzioni scelte Numero di inizi Disponibili ate gt Selezionare Spearman come metodo di assegnazione per il punto iniziale tradizionale gt Fare clic su Continua gt Nella finestra di dialogo Unfolding mu
395. v File di dati ipotetici che prende in esame il processo di controllo di qualit di un industria di abbigliamento Per ciascun lotto prodotto nella fabbrica gli ispettori prelevano un campione di abiti per contare il numero dei capi che non sono accettabili per la vendita 324 Appendice A coffee sav Questo file di dati contiene informazioni sulle immagini percepite di sei marche di caff freddo Kennedy Riquier e Sharp 1996 Per ciascuno dei 23 attributi dell immagine del caff freddo sono state selezionate tutte le marche descritte da tale attributo Le sei marche sono indicate dalle sigle AA BB CC DD EE e FF per tutelare la confidenzialita dei dati contacts sav File di dati ipotetici che prende in esame l elenco dei contatti di un gruppo di rappresentanti di vendita di computer aziendali Ciascun contatto classificato in base al reparto della societ in cui lavora e dalle relative categorie aziendali Il file riporta anche l importo dell ultima vendita effettuata il tempo trascorso dall ultima vendita e le dimensioni della societ del contatto creditpromo sav File di dati ipotetici che prende in esame l impegno di un grande magazzino nel tentativo di valutare l efficacia di una recente promozione con carta di credito A tale scopo sono stati selezionati 500 titolari di carta in modo casuale Alla met di questi stato inviato un annuncio promozionale che comunica la riduzione del tasso d interess
396. variazione contenuta nel sottocomando PENALTY LAMBDA stato impostato su 0 5 e OMEGA su 1 0 valori predefiniti Figura 15 6 Misure per la soluzione non degenerata Iterazioni Valore finale della funzione Parti dei valori della funzione Cattivo adattamento Bont dell adattamento Coefficienti di variazione Indici di degenerazione Parte dello stress Parte penalit Stress normalizzato Stress di Kruskal Stress Il di Kruskal S stress di Young S stress Il di Young Dispersione spiegata in base a Varianza spiegata in base a Ordini delle preferenze recuperate Rho di Spearman Tau b di Kendall Vicinanze delle variazioni Vicinanze trasformate delle variazioni Distanze delle variazioni Somma dei quadrati degli indici di amalgamazione di DeSarbo Indice di non degenerazione approssimativo di Shepard 157 6848930 2428268 9317409 0583589 12415758 5875599 3446361 5030127 9416411 7661552 7818594 8179181 6916725 5590170 6006156 4833617 1590979 7895692 Nell esempio i problemi notati nelle misure relative alla soluzione degenerata sono stati corretti Lo stress normalizzato non pi 0 Il coefficiente di variazione delle distanze trasformate ha adesso un valore molto simile al coefficiente di variazione delle distanze originali Gli indici di intervariabilit di DeSarbo sono molto pi vicini a 0 ad indicare che la soluzione ha un grado di intervariabi
397. verso la zia o lo zio 274 Capitolo 14 Le variabili esterne sono reperibili in Ainship_var sav Inoltre una configurazione iniziale da un analisi precedente fornita in kinship_ini sav Per ulteriori informazioni vedere File di esempio in Appendice A a pag 321 Esecuzione dell analisi Figura 14 9 Finestra di dialogo Modello Scaling multidimensionale Modello Modello di scaling Trasformazioni delle distanze Identit Rapporto Euclideo pesato O Intervallo Euclideo generalizzato O Ordinale Rango ridotto Distingui osservazioni pari merito Rango fi O Spline Forma Nodi interni Triangolo inferiore Applica trasformazioni O Triangolo superiore Entro ciascuna sorgente separatamente Matrice completa O Era tutte le sorgenti simultaneamente Distanze Dimensioni Dissimilarit Minimo b Similarita Massimo B gt Per ottenere una soluzione a tre dimensioni richiamare la finestra di dialogo Scaling multidimensionale e fare clic su Modello gt Digitare 3 come numero massimo e minimo di dimensioni gt Fare clic su Continua gt Nella finestra di dialogo Scaling multidimensionale fare clic su Opzioni 275 Figura 14 10 Finestra di dialogo Opzioni 22 Scaling multidimensionale Opzioni Selezionare Personalizzato come configurazione iniziale Selezionare kinship_ini sav come file da cui leggere le variabili Selezionare dim01 di
398. vie possono essere analizzate anche tramite la procedura Tavole di contingenza che per fornisce statistiche riassuntive distinte per ciascuna categoria di ciascuna variabile di controllo Con l analisi delle corrispondenze multiple spesso possibile riassumere la relazione tra tutte le variabili in un unico grafico a due dimensioni Un utilizzo avanzato dell analisi delle corrispondenze multiple consiste nel sostituire i valori di categoria originali con i valori di scala ottimali della prima dimensione eseguendo quindi un analisi multivariata secondaria Poich l analisi delle corrispondenze multiple sostituisce le etichette di categoria con valori di scala numerici dopo l analisi possibile applicare molte procedure diverse che richiedono dati numerici Ad esempio la procedura Analisi fattoriale genera una prima componente principale equivalente alla prima dimensione dell analisi delle corrispondenze multiple I punteggi delle componenti nella prima dimensione sono uguali ai punteggi degli oggetti e i pesi quadrati delle componenti sono uguali 12 Capitolo 1 alle misure di discriminazione La seconda dimensione dell analisi delle corrispondenze multiple tuttavia non uguale alla seconda dimensione dell analisi fattoriale Scaling multidimensionale L utilizzo dello scaling multidimensionale il pi adatto quando l obiettivo dell analisi individuare la struttura in un insieme di misure di distanza tr
399. xin sav anorectic sav Per trovare una sintomatologia standardizzata del comportamento anoressico bulimico i ricercatori Van der Ham Meulman Van Strien e Van Engeland 1997 hanno condotto uno studio basato su 55 adolescenti affetti da disordini alimentari conosciuti Ogni paziente stato visitato quattro volte in quattro anni per un totale di 220 visite Durante ogni visita ai pazienti sono stati assegnati punteggi per ciascuno dei 16 sintomi I punteggi 321 322 Appendice A relativi ai sintomi sono assenti per il paziente 71 alla visita 2 il paziente 76 alla visita 2 e il paziente 47 alla visita 3 con 217 osservazioni valide autoaccidents sav File di dati ipotetici che prende in esame l impegno di un analista che opera nel campo delle assicurazioni per creare un modello del numero di incidenti automobilistici per conducente Il modello prende in esame anche l et e il sesso del conducente Ciascun caso rappresenta un diverso conducente e riporta il sesso e l et in anni del conducente e il numero di incidenti automobilistici negli ultimi cinque anni band sav Questo file di dati ipotetici contiene le cifre sulle vendite settimanali di CD conseguite da un gruppo musicale Il file include anche i dati di tre possibili variabili predittore bankloan sav File di dati ipotetici che prende in esame l impegno di una banca nel tentativo di ridurre il tasso di inadempienza nel rimborso di un prestito Il file contiene
400. zione gt Fare clic su Continua gt Nella finestra di dialogo Analisi della correlazione canonica non lineare fare clic su Avanti per definire l insieme di variabili successivo Figura 11 5 Finestra di dialogo Analisi della correlazione canonica non lineare Analisi della correlazione canonica non lineare OVERALS Set 2 di 2 amp Musica preferita musica rai E Precedente Successivo amp Preferenze abitative abitaz Variabili Ni Punteggio al test di matemati N Punteggio al test linguistico I animali 1 Ordinale quotid 1 Ordinale Definisci intervallo e scala Etichetta grafici dei punteggi degli oggetti tramite Definisci intervallo Dimensioni nella soluzione 2 gt Selezionare Animali domestici e Giornale letto piu spesso come variabili per il secondo insieme gt Selezionare andom e fare clic su Definisci intervallo e scala 192 Capitolo 11 Figura 11 6 Finestra di dialogo Definisci intervallo e scala za OVERALS Definisci intervallo e Minimo 1 Massimo 5 Scala di misurazione O Ordinale O O Nominale singola Numerica discreta Digitare 5 come valore massimo per questa variabile Selezionare Nominale multipla come scala di misurazione Fare clic su Continua V v v y Nella finestra di dialogo Analisi della correlazione canonica non lineare selezionare giornale e fare clic su Definisci i
401. zione Pressu Regolarizzazione Salva Quantificazione Visibilit E Quantificazione Tempe P Quantificazione Day of E Quantificazione Daily 0 E Quantificazione Inversi 4 Quantificazione Pressu E Quantificazione Tempe Per ottener una regressione categoriale di Livello giornaliero di ozono su Giorno dell anno richiamare la finestra di dialogo Regressione categoriale gt Deselezionare da Altezza di base inversione a Temperatura gradi F come variabili indipendenti gt Selezionare Giorno dell anno come variabile indipendente gt Fare clic su Definisci scala Figura 9 51 Finestra di dialogo Definisci scala a Regressione categoriale definis Livello di scala ottimale O Spline ordinale O Ordinale Spline nominale Nominal O Numerica Spline Grado E Nodi interni P gt Selezionare Nominale come livello di scaling ottimale gt Fare clic su Continua gt Nella finestra di dialogo Regressione categoriale scegliere Discretizza 132 Capitolo 9 Figura 9 52 Finestra di dialogo Discretizza z Regressione categoriale discretizza Variabili ozon Non specificato doy Non specificato Metodo Raggruppamento v Raggruppamento e Numero di categorie F Distribuzione Normale Uniforme Intervalli uguali 10 Selezionare gda Selezionare Intervalli uguali Digitare 10 come lung
402. zzati in modo da avere una somma ponderata delle distanze quadrate al centroide 1 Poich questo metodo massimizza le distanze tra le categorie di colonna si consiglia di utilizzarlo se si interessati principalmente a evidenziare le differenze tra le categorie della variabile di colonna Simmetrico anche possibile trattare righe e colonne in modo simmetrico La normalizzazione distribuisce l inerzia in modo uniforme sui punteggi di riga e di colonna Si noti che n le distanze tra i punti di riga n le distanze tra i punti di colonna sono approssimazioni delle distanze chi quadrato in questo caso Utilizzare questo metodo se si interessati principalmente alle differenze o alle somiglianze tra le due variabili Questo in genere il metodo di elezione per generare biplot Principale Una quarta opzione denominata normalizzazione principale e prevede la distribuzione dell inerzia due volte nella soluzione una sui punteggi di riga e una sui punteggi di colonna Utilizzare questo metodo se si interessati principalmente alle distanze tra i punti di riga e di colonna separatamente ma non alle correlazioni tra punti di riga e di colonna I biplot non sono adatti per questa opzione di normalizzazione e di conseguenza non sono disponibili se stato specificato il metodo di normalizzazione principale Esempio Tabagismo per categoria lavorativa Lo scopo dell analisi delle corrispondenze mostrare le relazioni tra righe e colonne

Download Pdf Manuals

image

Related Search

Related Contents

Honor 3C - Manual pdf  City of Bossier , Bossier City, LA  A b a ste c im e n to d e Á g u a  Operators Manual Operators Manual Manuel De L'Opérateur  Central station air handling units Centrali di trattamento aria  Moyno® 500 Pump (Service Manual - 200 Series  取扱説明書 - 電農スクエア  resume de la these de doctorat - Universitatea "1 Decembrie 1918"  Tableau de recommandations PPG  Lien vers manuel.  

Copyright © All rights reserved.
Failed to retrieve file