Home

Sun Fire V440 Server Diagnostics and Troubleshooting Guide

image

Contents

1. IO Devices Bus Freq Type MHz Slot Name Model pci 66 MB pcil08e abba network SUNW pci ce pci 33 MB isa su serial pei 33 MB isa su serial Memory Module Groups 0 C0 P0 B0 DO C0 P0 B0 DI 1 C0 P0 B1 DO C0 P0 B1 DI1 Capitolo 7 Risoluzione dei problemi hardware 139 CODICE DI ESEMPIO 7 5 Output del comando prtdiag v Continua Memory Module Groups 1 0 C1 P0 B0 D0 C1 P0 B0 D1 1 1 C1 P0 B1 D0 C1 P0 B1 D1 System PROM revisions OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 OBDIAG 4 10 3 2003 05 02 20 26 4 Controllare i LED di sistema 5 Controllare il file var adm messages Di seguito sono riportate indicazioni chiare su una parte danneggiata m Messaggi di avvertenza sui componenti hardware o software restituiti dal software Solaris m Messaggi ambientali ALOM su una parte danneggiata compresa una ventola o un alimentatore Se non esistono indicazioni chiare su una parte danneggiata esaminare le applicazioni installate la rete o la configurazione dei dischi Operazioni successive Se esistono indicazioni specifiche sul fatto che una parte danneggiata o sta per danneggiarsi sostituirla il prima possibile Se il problema riguarda un guasto ambientale confermato sostituire la ventola o l alimentatore il prima possibile Un sistema con una configurazione ridondante potrebbe ancora funzionare in una condizione
2. ok Porta SERIAL MGT o NET MGT ZN IL console LN LL sc gt Controller di sistema ALOM FIGURA A 3 Canali separati per la console di sistema e il controller di sistema Appendice A Configurazione della console di sistema 185 Se la console di sistema configurata in modo da essere accessibile dalle porte di gestione seriale e di rete quando si esegue il collegamento attraverso una di queste porte possibile accedere all interfaccia della riga di comando ALOM o alla console di sistema E possibile passare dal controller di sistema ALOM alla console di sistema e viceversa in qualsiasi momento ma non possibile accedere a entrambi allo stesso momento da un terminale o da uno Shell Tool Il prompt visualizzato sul terminale o sullo Shell Tool indica il canale di accesso Il prompt o indica che si sta utilizzando la console di sistema e che in esecuzione l ambiente operativo Solaris m Il comando ok indica che si sta utilizzando la console di sistema e che il server in esecuzione sotto il controllo del firmware OpenBoot m Il prompt sc gt indica che si sta utilizzando il controller di sistema ALOM Nota Se non viene visualizzato alcun testo o prompt possibile che recentemente il sistema non abbia generato alcun messaggio della console In tal caso premendo il tasto Invio del terminale dovrebbe apparire un prompt Per acc
3. Logico Logico Banco 2 Banco 0 DIMM Logico Logico Banco 3 Banco 1 uh Galia sli Banco fisico 1 Banco fisico 0 FIGURA 2 4 Associazione tra banchi di memoria logici e moduli DIMM 50 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Identificazione dei moduli CPU memoria Poich ciascun modulo CPU memoria associato a un gruppo di DIMM specifico necessario determinare il modulo CPU memoria contenente il modulo DIMM danneggiato Le informazioni necessarie sono contenute nel messaggio di errore POST 1 gt H W under test CPU3 B0 D1 30602 side 1 Bank 1 CPU Module C3 In questo esempio viene indicato il modulo CPU Module C3 I processori sono numerati in base allo slot in cui sono installati Gli slot sono associati a un numero da 0 a 3 a partire da sinistra osservando il telaio del server Sun Fire V440 dalla parte anteriore e dall alto come nella FIGURA 2 5 FIGURA 2 5 Numerazione di moduli CPU memoria Ad esempio se su un server Sun Fire V440 sono installati solo due moduli CPU memoria posizionati negli slot all estrema sinistra e all estrema destra i due processori del sistema verranno indicati nel firmware come CPU 0 e CPU 3 Il modulo DIMM danneggiato indicato nel precedente messaggio di errore POST pertanto presente nel modulo CPU memoria all estrema destra C3 ed associato all etichetta BO D1 sulla scheda a circuiti del modulo
4. Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 3 Esaminare l output del comando prtdiag v Digitare quanto segue sc gt console Enter to return to ALOM usr platform uname i sbin prtdiag v Il comando prtdiag v fornisce l accesso alle informazioni memorizzate dai test diagnostici POST e OpenBoot Tutte le informazioni restituite da questo comando sullo stato corrente del sistema vanno perse nel momento in cui viene ripristinato il sistema Quando si esamina l output per identificare i problemi verificare che siano elencati tutti i moduli CPU installati le schede PCI e i moduli di memoria controllare che tutti i LED di richiesta di assistenza siano accesi e verificare che sia installata la versione pi aggiornata del firmware PROM del sistema Il CODICE DI ESEMPIO 7 5 mostra un estratto di output restituito dal comando prtdiag v Vedere dal CODICE DI ESEMPIO 2 8 al CODICE DI ESEMPIO 2 13 per l output prtdiag v completo restituito da un server Sun Fire V440 correttamente funzionante CODICE DI ESEMPIO 7 5 Output del comando prtdiag v System Configuration Sun Microsystems sun4u Sun Fire V440 System clock frequency 177 MHZ Memory size 4GB sen sutlacLoaolcatetlotSttas scatat CPUS ee ttantst tustenetsn atene ES CPU CPU Temperature Fan CPU Freq Size Impl Mask Die Ambient Speed Unit 0 1062 MHz 1MB US IITi 2 3 1 1062 MHz 1MB US IITi Dis di
5. FIGURA A 1 Indirizzamento della console di sistema a porte e dispositivi diversi Nelle sezioni seguenti vengono fornite informazioni di base sui dispositivi che possibile utilizzare per accedere alla console di sistema e vengono forniti i riferimenti alla documentazione disponibile su ciascun dispositivo Istruzioni sulle modalit di collegamento e configurazione dell hardware per accedere alla console di sistema vengono fornite pi avanti in questa appendice Connessione predefinita della console di sistema attraverso le porte di gestione seriale e di rete Nei server Sun Fire V440 la console di sistema preconfigurata in modo da utilizzare per l input e l output solo i dispositivi hardware collegati alla porta di gestione seriale o di rete Tuttavia poich la porta di gestione di rete non disponibile fino a quando non le viene assegnato un indirizzo IP la prima connessione deve essere eseguita alla porta di gestione seriale 176 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Solitamente alla porta di gestione seriale viene collegato uno dei seguenti dispositivi hardware m Server terminal m Terminale alfanumerico o dispositivo simile m Una linea tip collegata a un altro computer Sun In questo modo viene fornito un accesso sicuro al luogo di installazione Porta di gestione seriale Porta di gestione di rete TN Porta seriale ttyb FIGURA A 2 Porte per il c
6. I file core dump forniscono informazioni utili all assistenza tecnica per la diagnosi dei problemi del sistema Per ulteriori informazioni sui file core dump vedere Informazioni sul processo core dump a pagina 123 e la sezione relativa alle informazioni sulla gestione dei crash di sistema nella documentazione Solaris System Administration Guide 6 Controllare i LED di sistema possibile utilizzare il controller di sistema ALOM per verificare lo stato dei LED di sistema Per informazioni sui LED di sistema vedere la documentazione Server Sun Fire V440 Guida di amministrazione Capitolo 7 Risoluzione dei problemi hardware 147 7 Esaminare l output del comando prtdiag v Digitare quanto segue sc gt console Enter to return to ALOM usr platform uname i sbin prtdiag v Il comando prtdiag v consente l accesso alle informazioni memorizzate dai test diagnostici POST e OpenBoot Tutte le informazioni restituite da questo comando sullo stato corrente del sistema vanno perse nel momento in cui viene ripristinato il sistema Quando si esamina l output per identificare i problemi verificare che siano elencati tutti i moduli CPU installati le schede PCI e i moduli di memoria controllare che tutti i LED di richiesta di assistenza siano accesi e verificare che sia installata la versione pi aggiornata del firmware PROM del sistema Il CODICE DI ESEMPIO 7 14 mostra un estratto di output restituito dal comando prtdi
7. m Dalla console di sistema digitare quanto segue usr sbin locator f m Dal controller di sistema digitare quanto segue sc gt setlocator off 62 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Impostazione del sistema in modalita diagnostica E possibile ignorare i test diagnostici basati su firmware per accelerare il processo di avvio del server La procedura descritta di seguito garantisce che i test diagnostici POST e OpenBoot vengano eseguiti in fase di avvio Per informazioni di base vedere m Diagnostica affidabilit e disponibilit a pagina 16 Operazioni preliminari Eseguire il login alla console di sistema e accedere al prompt ok Per istruzioni vedere m Accesso al prompt ok a pagina 186 Operazioni da eseguire Tra le seguenti operazioni effettuare quella che risulta pi pratica Impostare l interruttore di controllo di sistema del server sulla posizione di diagnostica possibile eseguire tale operazione dal pannello principale della macchina oppure mediante l interfaccia ALOM qualora la sessione di diagnostica venga eseguita in remoto dal display della console m Impostare la variabile diag switch Digitare quanto segue ok setenv diag switch true Impostare la variabile di configurazione OpenBoot diag script su normal Digitare quanto segue ok setenv diag script normal In questo modo i test
8. 1 Stabilire una sessione del controller di sistema ALOM Per istruzioni vedere Sun Advanced Lights Out Manager ALOM Online Help 2 Al prompt del controller di sistema ALOM digitare quanto segue sc gt console Il comando console consente di passare alla console di sistema 188 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 3 Per tornare al prompt sc gt digitare la sequenza di escape ok icaratteri non vengono visualizzati sullo schermo Operazioni successive Per istruzioni sull uso del controller di sistema ALOM vedere m Sun Advanced Lights Out Manager ALOM Online Help Attivazione della porta di gestione di rete Operazioni preliminari Per utilizzare una porta di gestione di rete necessario assegnarle prima un indirizzo IP Internet Protocol Se si sta configurando la porta di gestione di rete per la prima volta necessario collegare il controller di sistema ALOM mediante la porta di gestione seriale e assegnare un indirizzo IP alla porta di gestione di rete E possibile quindi assegnare manualmente un indirizzo IP o configurare la porta in modo che ottenga un indirizzo IP da un altro server utilizzando il protocollo DHCP Dynamic Host Configuration Protocol Nota L indirizzo IP assegnato alla porta di gestione di rete un indirizzo IP univoco distinto dall indirizzo IP principale del server Sun Fire V440 I centri dati sp
9. Area di selezione delle modalit Area dei messaggi dei test 5 Espandere gli elenchi dei test in modo da visualizzare i singoli test disponibili Nell area di selezione dei test dell interfaccia i test vengono visualizzati per categoria ad esempio Network come illustrato di seguito Per espandere una categoria fare clic con il pulsante destro del mouse sull icona H a sinistra del nome della categoria Processor s Memory N Network ce0 nettest ceO netlbtest _ cel netlbtest Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 6 Facoltativo Selezionare i test che si desidera eseguire possibile scegliere di accettare che vengano eseguiti i test attivati per impostazione predefinita Altrimenti possibile attivare e disattivare i singoli test o blocchi di test facendo clic sulla casella di controllo accanto al nome del test o al nome della categoria di test I test sono attivati se la rispettiva casella di controllo selezionata altrimenti sono disattivati Nella TABELLA 5 1 viene fornito un elenco dei test la cui esecuzione risulta particolarmente utile su un server Sun Fire V440 Nota Nella TABELLA 5 1 viene fornito un elenco delle unit FRU ordinate a partire da quella che rappresenta con maggiore probabilit la causa della mancata riuscita del test 7 Facoltativo Personalizzare i singoli test possibile personalizzare i s
10. opportuno non eseguire ulteriori applicazioni Per utilizzare SunVTS necessario che il server Sun Fire V440 da verificare sia attivo e in esecuzione in quanto il software si basa sull ambiente operativo Solaris Poich i pacchetti software SunVTS sono opzionali possibile che non siano installati sul sistema Per istruzioni dettagliate vedere Come verificare se il software SunVTS installato a pagina 109 necessario utilizzare la versione pi aggiornata del software SunVTS disponibile in modo da disporre della suite di test pi recente Per scaricare l ultima versione del software SunVTS accedere all indirizzo Web http www sun com oem products vts Per istruzioni su come eseguire il software SunVTS per analizzare il server Sun Fire V440 vedere Analisi del sistema mediante il software SunVTS a pagina 104 Per ulteriori informazioni sul prodotto vedere la documentazione riportata di seguito m SunVTS User s Guide vengono descritte le funzioni di SunVTS e vengono fornite informazioni su come avviare e controllare le varie interfacce utente m SunVTS Test Reference Manual viene fornita una descrizione di ciascun test di ciascuna opzione e di ciascun argomento della riga di comando di SunVTS m SunVTS Quick Reference Card viene fornita una panoramica sulle funzioni principali dell interfaccia grafica utente GUI Graphical User Interface m SunVTS Documentation Supplement vengono descritti gli ultimi miglioram
11. possibile utilizzare questa porta per qualsiasi altro dispositivo seriale m Nella configurazione predefinita le porte di gestione seriale e di rete consentono di aprire fino a quattro finestre aggiuntive nelle quali possibile solo visualizzare l attivit della console di sistema Non possibile aprire tali finestre se la console di sistema reindirizzata a ttyb o alla porta di una scheda grafica m Nella configurazione predefinita le porte di gestione seriale e di rete consentono di passare dalla visualizzazione della console di sistema all output del controller di sistema e viceversa sullo stesso dispositivo digitando una semplice sequenza di escape o comandi specifici La sequenza di escape e i comandi non funzionano se la console di sistema reindirizzata a ttyb o alla porta di una scheda grafica m Il controller di sistema mantiene un log dei messaggi della console tuttavia se la console di sistema viene reindirizzata a ttyb o alla porta di una scheda grafica alcuni messaggi non vengono registrati Le informazioni omesse potrebbero essere importanti qualora fosse necessario contattare il servizio clienti Sun per un problema 178 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Per tutti i motivi descritti precedentemente consigliabile lasciare invariata la configurazione predefinita della console di sistema E possibile modificare la configurazione della console di sistema i
12. 1 gt MSG ERROR PCI Master Abort Detected for TOMATILLO 0 PCI BUS A DEVICE NUMBER 2 DEVICE NAME SCSI 1 gt END ERROR 1 gt 1 gt ERROR TEST IO Bridge unit 0 PCI id test 1 gt H W under test Motherboard I0 Bridge 0 CPU 1 gt MSG Test Failed 1 gt END_ERROR Identificazione delle unita FRU Un importante funzione dei messaggi di errore POST rappresentata dalla riga H W under test ovvero la seconda riga nel precedente CODICE DI ESEMPIO 2 1 La riga H W under test indica le unit sostituibili in loco FRU Field Replaceable Unit da cui pu dipendere l errore Si noti che nel precedente CODICE DI ESEMPIO 2 1 vengono indicate due diverse unit FRU Se si utilizza la TABELLA 2 15 per decodificare alcuni termini possibile rendersi conto che l errore POST in questione stato probabilmente causato da circuiti integrati IO Bridge o percorsi elettrici danneggiati presenti sulla scheda madre Tuttavia tale messaggio di errore indica anche che la CPU master in questo caso la CPU 1 potrebbe essere danneggiata Per informazioni sulla numerazione delle CPU del server Sun Fire V440 vedere Identificazione dei moduli CPU memoria a pagina 51 Sebbene non rientri nell ambito del presente manuale opportuno notare che i messaggi di errore POST consentono anche di isolare i guasti in base al livello di FRU Nell esempio attuale la riga MSG presente immediatamente sotto la riga H W under test indic
13. 16 16 16 16 16 16 16 16 16 54 54 56 56 58 58 58 58 58 27 Sun SFV440 27 Sun SFV44 35 Sun SFV44 54 Sun SFV44 11 Sun SFV44 11 Sun SFV44 13 Sun SFV44 a 00060003 SC System booted a 00040029 Host system has shut down a 00060000 SC Login User admin Logged on a 00060000 SC Login User admin Logged on a a a 00040001 SC Request to Power On Host 00040002 Host System has Reset 0004000b Host System has read and cleared bootmode 13 Sun SFV440 a 0004004f Indicator PS0 POK is now ON 13 Sun SFV440 a 0004004f Indicator PS1 POK is now ON Capitolo 7 Risoluzione dei problemi hardware 137 CODICE DI ESEMPIO 7 3 Output del comando showlogs Continua 138 09 09 09 09 09 09 09 09 09 09 16 17 I7 17 Ue a 172 I7 T73 I7 59 00 Ol O32 03 03 04 05 06 07 19 Sun SFV440 a 00040002 Host System has Reset 46 Sun SFV440 a 00040002 Host System has Reset 51 Sun SFV440 a 0004004f Indicator SYS FRONT SERVICE is now ON 22 Sun SFV440 a 00040002 Host System has Reset 22 Sun SFV440 0004004f Indicator SYS_FRONT SERVICE is now OFF 24 Sun SFV440 a 0004000b Host System has read and cleared bootmode 00040002 Host System has Reset 00040002 Host System has Reset 0004004f Indicator SYS _FRONT SERVICE is now ON 0004004f Indicator SYS FRONT ACT is now ON 30 Su
14. 7 Esaminare l output del comando prtdiag v Digitare quanto segue sc gt console Enter to return to ALOM usr platform uname i sbin prtdiag v Il comando prtdiag v consente l accesso alle informazioni memorizzate da i test diagnostici POST e OpenBoot Tutte le informazioni restituite da questo comando sullo stato corrente del sistema vanno perse nel momento in cui viene ripristinato il sistema Quando si esamina l output per identificare i problemi verificare che siano elencati tutti i moduli CPU installati le schede PCI e i moduli di memoria controllare che tutti i LED di richiesta di assistenza siano accesi e verificare che sia installata la versione pi aggiornata del firmware PROM del sistema Il CODICE DI ESEMPIO 7 27 mostra un estratto di output restituito dal comando prtdiag v Vedere dal CODICE DI ESEMPIO 2 8 al CODICE DI ESEMPIO 2 13 per l output prtdiag v completo restituito da un server Sun Fire V440 correttamente funzionante CODICE DI ESEMPIO 7 27 Output del comando prtdiag v System Configuration Sun Microsystems sun4u Sun Fire V440 System clock frequency 177 MHZ Memory size 4GB E thl t t t t s aese t at a a CUS E E CPU CPU Temperature Fan CPU Freq Size Impl Mask Die Ambient Speed Unit 0 1062 MHz 1MB US IITi 2 3 1 1062 MHz 1MB US IITi 2 3 IO Devices Bus Freq Type MHz Slot Name
15. Impostazione del sistema in modalit diagnostica a pagina 63 Il processo di boot richiede diverse fasi descritte in modo dettagliato nelle seguenti sezioni m Prologo boot del controller di sistema a pagina 9 m Fase 1 firmware OpenBoot e POST a pagina 9 m Fase 2 test OpenBoot Diagnostics a pagina 17 m Fase 3 ambiente operativo a pagina 25 8 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Prologo boot del controller di sistema Ogni volta che si collega il server Sun Fire V440 a una presa elettrica ma prima dell accensione vengono eseguiti la diagnostica automatica e il ciclo di boot del controller di sistema interno al server Il controller di sistema incorporato nella scheda Sun Advanced Lights Out Manager ALOM installata nel telaio del server Sun Fire V440 In modalita di standby la scheda inizia a funzionare ancora prima dell accensione del server Il controller di sistema consente di accedere a diverse funzioni di controllo e monitoraggio mediante l interfaccia della riga di comando CLI Command Line Interface ALOM Per ulteriori informazioni su ALOM vedere Monitoraggio del sistema mediante Sun Advanced Lights Out Manager a pagina 38 Fase 1 firmware OpenBoot e POST In ciascun server Sun Fire V440 presente un chip contenente circa 2 Mbyte di codice basato sul firmware Tale chip denominato PROM di boot Una volta acceso il sistema esegue in pri
16. Volume Status Disk Status cltodo RESYNCING cltodo OK clt1d0 OK 12 Eseguire uno strumento di analisi come il software Sun VTS o Hardware Diagnostic Suite Per informazioni sugli strumenti di analisi vedere il Capitolo 5 13 Se si tratta della prima volta che viene eseguito un reboot non previsto e il sistema non esegue i test POST come parte del processo di reboot eseguire i test diagnostici POST Se la funzione ASR non abilitata questo il momento adatto per abilitarla ASR esegue automaticamente i test diagnostici POST e OpenBoot durante il reboot Con la funzione ASR abilitata possibile risparmiare tempo durante la diagnosi dei problemi in quanto i risultati dei test diagnostici POST e OpenBoot sono gi disponibili dopo un reboot non previsto Per ulteriori istruzioni e informazioni sull attivazione e il funzionamento di ASR vedere la documentazione Server Sun Fire V440 Guida di amministrazione Operazioni successive Pianificare la manutenzione per tutte le azioni di assistenza in base alle necessit 152 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Risoluzione degli errori irreversibili di ripristino e delle eccezioni dello stato RED Operazioni preliminari Eseguire il login al controller di sistema e accedere al prompt sc gt Per informazioni vedere m Informazioni sul prompt sc gt a pagina 179 Per eseguire questa procedura necessario av
17. di seguito m Se la console di sistema diretta alle porte di gestione seriale e di rete possibile digitare la sequenza di escape del controller di sistema ALOM m possibile eseguire il login al controller di sistema ALOM direttamente da un dispositivo collegato alla porta di gestione seriale Vedere Uso della porta di gestione seriale a pagina 188 m possibile eseguire il login al controller di sistema ALOM direttamente da un dispositivo collegato alla porta di gestione seriale Vedere Attivazione della porta di gestione di rete a pagina 189 Informazioni sul prompt ok Un server Sun Fire V440 con l ambiente operativo Solaris installato in grado di funzionare a diversi livelli di esecuzione Di seguito viene fornito un riepilogo di tali livelli di esecuzione Per una descrizione completa consultare la documentazione di amministrazione del sistema Solaris Nella maggior parte dei casi viene utilizzato un livello di esecuzione 2 o 3 di un server Sun Fire V440 Tali livelli rappresentano stati multiutente con accesso all intero sistema e a tutte le risorse di rete In alcuni casi possibile utilizzare il livello di esecuzione 1 ovvero uno stato di amministrazione monoutente Lo stato operativo inferiore tuttavia rappresentato dal livello di esecuzione 0 ovvero lo stato in cui possibile spegnere il sistema Quando un sistema Sun Fire V440 viene eseguito al livello 0 viene visualizzato il prompt ok per i
18. nonch una descrizione del dispositivo in cui viene indicato il tipo e il produttore Di seguito viene riportato un esempio di output restituito dal comando probe scsi CODICE DI ESEMPIO 2 3 Output del comando probe scsi Target Unit Target Unit ok probe scsi 0 0 1 0 Disk FUJITSU MAN3367M SUN36G 1502 71132959 Blocks 34732 MB Disk FUJITSU MAN3367M SUN36G 1502 71132959 Blocks 34732 MB Di seguito viene riportato un esempio di output restituito dal comando probe scsi all CODICE DI ESEMPIO 2 4 Output del comando probe scsi all Target Unit Target Unit 0 0 1 0 ok probe scsi all pci 1 700000 scsi 2 1 pci 1f 700000 scsi 2 Disk FUJITSU MAN3367M SUN36G 1502 71132959 Blocks 34732 MB Disk FUJITSU MAN3367M SUN36G 1502 71132959 Blocks 34732 MB Capitolo 2 Diagnostica e processo di boot 23 24 Comando probe ide Il comando probe ide comunica con tutti i dispositivi Integrated Drive Electronics IDE collegati al bus IDE ovvero al bus interno del sistema per i dispositivi di supporto ad esempio l unit DVD ROM Attenzione Se stato utilizzato il comando halt o la sequenza di tasti L1 A Stop A per accedere al prompt ok l uso del comando probe ide pu provocare un blocco del sistema Di seguito viene riportato un esempio di output restituito dal comando probe ide CODICE DI ESEMPIO 2 5 Output del comando probe ide ok probe ide Device 0 Primary Ma
19. root 282 1 0 14 51 47 0 00 usr dt bin dtlogin daemon root 292 1 0 14 51 47 console 0 00 sh root 324 314 0 14 54 51 pts 1 0 00 sh 9 Verificare che tutti i dispositivi di I O e le attivita siano ancora presenti e funzionanti Digitare quanto segue iostat xtc Questo comando mostra tutti i dispositivi di I O e indica un attivit per ciascun dispositivo Per identificare un problema esaminare l output relativo ai dispositivi installati che non sono elencati Il CODICE DI ESEMPIO 7 29 mostra l output del comando iostat xtc restituito da un server Sun Fire V440 correttamente funzionante CODICE DI ESEMPIO 7 29 Output del comando iostat xtc device sdo sdil sd2 sd3 sd4 nfsl nfs2 nfs3 nfs4 extended device statistics tty cpu r s w s kr s kw s wait actv svc t w b tin tout us sy wt id 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 O 183 O 2 2 96 6 5 Iy2 49 5 Tad Da 042 24 6 0 3 0 2 0 0 0 0 0 0 01 10 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 9 6 0 0 0 1 0 0 0 6 0 0 0 0 0 0 1 4 0 0 0 0 0 0 0 1 0 0 0 0 0 0 Biol 0 0 10 Esaminare gli errori relativi ai dispositivi di I O Digitare quanto segue iostat E Questo comando segnala gli errori relativi a ciascun dispositivo di I O Per identificare un problema esaminare l output relativo a qualsiasi tipo di errore maggiore di 0 Ad esempio nel C
20. usr lib nfs statd usr sbin syslogd usr sbin cron Capitolo 7 Risoluzione dei problemi hardware 149 CODICE DI ESEMPIO 7 15 Output del comando ps ef Continua root 235 233 0 14 51 44 0 00 usr sadm lib smc bin smcboot root 233 1 0 14 51 44 0 00 usr sadm lib smc bin smcboot root 245 1 0 14 51 45 0 00 usr sbin vold root 247 1 0 14 51 45 0 00 usr lib sendmail bd q15m root 256 1 0 14 51 45 0 00 usr lib efcode sparcv9 efdaemon root 294 291 0 14 51 47 0 00 usr lib saf ttymon root 304 274 0 14 51 51 0 00 mibiisa r p 32826 root 274 1 0 14 51 46 0 00 usr lib snmp snmpdx y c etc snmp conf root 334 292 0 15 00 59 console 0 00 ps ef 9 Verificare che tutti i dispositivi di I O e le attivit siano ancora presenti e funzionanti Digitare quanto segue iostat xtc Questo comando mostra tutti i dispositivi di I O e indica un attivit per ciascun dispositivo Per identificare un problema esaminare l output relativo ai dispositivi installati che non sono elencati Il CODICE DI ESEMPIO 7 16 mostra l output del comando iostat xtc restituito da un server Sun Fire V440 correttamente funzionante CODICE DI ESEMPIO 7 16 Output del comando iostat xtc extended device statistics tty cpu device r s w s kr s kw s wait actv svc t w b tin tout us sy wt id sdo 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 O 183 0O 2 2 96 sdil 6 5 Lx 49 5 Todi 0400 1042 24 6 0 3 sd2 0 2 0 0 0 0 0 0
21. vedere Comando show devs a pagina 24 m Se prima del prompt ok stata visualizzata l intestazione m Eventuali errori di test diagnostici o altri messaggi di errore hardware visualizzati prima del prompt ok Capitolo 7 Risoluzione dei problemi hardware 169 170 Risoluzione dei problemi di un sistema bloccato Operazioni preliminari Per eseguire questa procedura necessario aver impostato la configurazione predefinita della console di sistema affinch sia possibile passare dal controller di sistema alla console di sistema Per informazioni vedere m Informazioni sulla comunicazione con il sistema a pagina 174 m Accesso mediante la porta di gestione di rete a pagina 178 Operazioni da eseguire 1 Verificare lo stato di blocco del sistema a Digitare il comando ping per stabilire se esistono attivit di rete b Digitare il comando ps ef per stabilire se vi sono altre sezioni utenti attive o che rispondono Se esiste un altra sessione utente attiva utilizzarla per esaminare il contenuto del file var adm messages per indicazioni sui problemi del sistema c Provare ad accedere alla console di sistema tramite il controller di sistema ALOM Qualora fosse possibile stabilire una connessione con la console di sistema attiva potrebbe non trattarsi di un vero e proprio blocco bens di un problema correlato alla rete In caso di sospetti problemi di rete utilizzare il comando ping rlogin o telnet per raggiu
22. verde LED che pu essere attivato da un amministratore di sistema per segnalare la presenza di un problema su un sistema Se acceso l hardware o il software ha rilevato un problema relativo al sistema Se lampeggiante il sistema operativo in fase di boot Se spento il sistema operativo stato interrotto Identifica un determinato sistema tra pi sistemi disponibili Controllare gli altri LED oppure eseguire i test diagnostici per individuare l origine del problema Nessuna I LED di localizzazione e di richiesta assistenza utilizzano l alimentazione di standby a 5 volt del sistema e restano accesi a segnalare un guasto anche in caso di chiusura del sistema Nota Per visualizzare lo stato dei LED di sistema da ALOM digitare showenvironment dal prompt sc gt Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 2 Controllare i LED degli alimentatori Per ciascun alimentatore sono disponibili quattro LED situati sul pannello principale gli stessi LED sono presenti anche sul pannello posteriore Nella tabella seguente vengono riportate le informazioni fornite da ciascuno di questi LED Nome LED posizione colore Informazione Azione Rimozione consentita alto blu Richiesta assistenza secondo dall alto ambra Alimentazione OK terzo dall alto verde Standby disponibile basso verde Se acceso possibile rim
23. 0 0 0 0 0 0 0 0 sd3 O82 0 0 0 0 0 0 0 0 0 0 0 0 0 0 sd4 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 nfsl 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 nfs2 0 0 0 0 0 1 0n L00100 9 6 0 0 nfs3 0 1 0 0 0 6 0 0 0 0 0 0 1 4 0 0 nfs4 0 0 0 0 0 1 Qw POS 1203 20 Gil 0 0 150 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 10 Esaminare gli errori relativi ai dispositivi di I O Digitare quanto segue iostat E Questo comando segnala gli errori relativi a ciascun dispositivo di I O Per identificare un problema esaminare l output relativo a qualsiasi tipo di errore maggiore di 0 Ad esempio nel CODICE DI ESEMPIO 7 17 iostat E riporta Hard Errors 2 per il dispositivo di I O sdo CODICE DI ESEMPIO 7 17 Output del comando iostat E sdo Soft Errors 0 Hard Errors 2 Transport Errors 0 Vendor TOSHIBA Product DVD ROM SD C2612 Revision 1011 Serial No 04 17 02 Size 18446744073 71GB lt 1 bytes gt Media Error 0 Device Not Ready 2 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 sdl Soft Errors 0 Hard Errors 0 Transport Errors 0 Vendor SEAGATE Product ST336607LSUN36G Revision 0207 Serial No 3JA0BW6Y00002317 Size 36 42GB lt 36418595328 bytes gt Media Error 0 Device Not Ready 0 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 sd2 Soft Errors 0 Hard Errors 0 Transport Errors 0 Vendor SEAGATE Product ST336607LSUN36G Revisi
24. 0 00 in telnetd 169 1 0 14 51 42 0 00 usr lib autofs automountd 314 312 O 14 54 33 pts 1 0 00 csh 53 1 0 14 51 36 0 00 usr lib sysevent syseventd 59 1 0 14 51 37 0 02 usr lib picl picld 100 1 0 14 51 40 0 00 usr sbin in rdisc s 131 1 0 14 51 40 0 00 usr lib netsvc yp ypbind broadcast 118 1 0 14 51 40 0 00 usr sbin rpcbind 121 1 0 14 51 40 0 00 usr sbin keyserv 148 1 0 14 51 42 0 00 usr sbin inetd s 226 1 0 14 51 44 0 00 usr lib utmpd 218 1 0 14 51 44 0 00 usr lib power powerd 199 1 0 14 51 43 0 00 usr sbin nscd 162 1 0 14 51 42 0 00 usr lib nfs lockd 166 1 0 14 51 42 0 00 usr lib nfs statd 181 1 0 14 51 43 0 00 usr sbin syslogd 283 1 014 51 47 0 00 usr lib dmi snmpXdmid s Sun SFV440 a 184 1 0 14 51 43 0 00 usr sbin cron 235 233 0 14 51 44 0 00 usr sadm lib smc bin smcboot 233 1 0 14 51 44 0 00 usr sadm lib smc bin smcboot 245 1 0 14 51 45 0 00 usr sbin vold Capitolo 7 Risoluzione dei problemi hardware 161 CODICE DI ESEMPIO 7 28 Output del comando ps ef Continua root 247 1 0 14 51 45 0 00 usr lib sendmail bd q15m root 256 1 0 14 51 45 0 00 usr lib efcode sparcv9 efdaemon root 294 291 0 14 51 47 0 00 usr lib saf ttymon root 304 274 O 14 51 51 0 00 mibiisa r p 32826 root 274 1 0 14 51 46 0 00 usr lib snmp snmpdx y c etc snmp conf root 334 292 0 15 00 59 console 0 00 ps ef root 281 1 0 14 51 47 0 00 usr lib dmi dmispd
25. 2003 Operazioni da eseguire Arrestare regolarmente il sistema utilizzando il comando shutdown Al prompt ok eseguire il comando sync Sulla console di sistema dovrebbero apparire messaggi di dump Viene eseguito il reboot del sistema Durante questo processo possibile visualizzare i messaggi relativi al comando savecore Attendere che l operazione di reboot del sistema sia terminata Ricercare i file core dump del sistema nella directory savecore I file sono denominati unix y e vmcore y dove y indica il numero intero del dump Dovrebbe essere presente anche un file bounds contenente il successivo numero di crash utilizzato da savecore Se non viene creato un core dump eseguire la procedura descritta nella sezione Abilitazione del processo core dump a pagina 124 Capitolo 6 Opzioni per la risoluzione dei problemi 127 128 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 CAPITOLO T Risoluzione dei problemi hardware Il termine risoluzione dei problemi si riferisce all azione di applicare strumenti diagnostici spesso euristicamente o accompagnati dal senso comune per determinare le cause dei problemi del sistema Ciascun problema del sistema deve essere trattato separatamente Non possibile fornire una raccolta di azioni per la soluzione di ciascun problema Tuttavia in questo capitolo sono riportati alcuni approcci e procedure che utilizzate insieme al
26. 4096 MB memory installed Serial 53005571 Ethernet address 0 3 ba 28 cd 3 Host ID 8328cd03 Initializing 1MB of memory at addr 123fecc000 Initializing 1MB of memory at addr 123fe02000 Initializing 14MB of memory at addr 123 002000 Initializing 16MB of memory at addr 123e002000 Initializing 992MB of memory at addr 1200000000 Initializing 1024MB of memory at addr 1000000000 Initializing 1024MB of memory at addr 200000000 Initializing 1024MB of memory at addr 0 Rebooting with command boot disk Boot device pci 1f 700000 scsi 2 disk 0 0 File and args SunOS Release 5 8 Version Generic 114696 04 64 bit Copyright 1983 2003 Sun Microsystems Inc All rights reserved Hardware watchdog enabled Indicator SYS_FRONT ACT is now ON configuring IPv4 interfaces ce0 Hostname Sun SFV440 a The system is coming up Please wait NIS domainname is Ecd East Sun COM Starting IPv4 router discovery starting rpc services rpcbind keyserv ypbind done Setting netmask of 100 to 255 0 0 0 Setting netmask of ce0 to 255 255 255 0 Capitolo 7 Risoluzione dei problemi hardware 155 CODICE DI ESEMPIO 7 20 Output del comando consolehistory run v Continua Setting default IPv4 interface for multicast add net 224 0 4 gateway Sun SFV440 a syslog service starting Print services started volume management starting The system is ready Sun SFV440 a console login May 9 14 52 57 Sun SFV440 a rmclomv NOTI
27. 51 2 00 2v2 2 87 3 00 MB V_NETO 1V2D OK dur25 0 96 1 02 1 38 1 44 MB V_NETl 1V2D OK 1 26 0 96 1 02 1 38 1 44 MB V_NETO 1V2A OK Li 216 0 96 1 02 1 38 1 44 MB V_NET1_ 1V2A OK 1 26 0 96 T02 1 38 1 44 MB V_ 3V3 OK 3 34 2 64 2 80 3 79 3 96 MB V_ 3V3STBY OK 333 2 64 2 80 3 79 3 96 MB BAT V_BAT OK 3 26 ne 2425 a MB V_SCSI_ CORE OK 1 79 1 53 1 62 1 98 2 07 MB V_ 5V OK 5 04 4 25 4 50 5x50 5 75 MB V_ 12V OK 12 00 10 20 10 80 13 20 13 80 MB V_ 12V OK 12 04 13 80 13 20 10 80 10 20 Nota Le soglie di avvertenza e di chiusura regolare del software visualizzate nel CODICE DI ESEMPIO 4 4 sono impostazioni di fabbrica e non possono essere modificate Il comando showenvironment indica lo stato di ogni alimentatore e dei quattro LED situati su ciascuno di essi CODICE DI ESEMPIO 4 5 ALOM Rapporti sullo stato degli alimentatori Power Supply Indicators Supply POK STBY Service OK to Remove PSO ON ON OFF OFF PS1 ON ON OFF OFF Supply Status PSO OK PS1 OK Capitolo 4 Monitoraggio del sistema 91 92 Infine questo comando segnala lo stato degli interruttori automatici della scheda madre associati all etichetta MB FF_SCSIx e dei convertitori CC CC dei moduli CPU associati all etichetta Cn PO FF_POK CODICE DI ESEMPIO 4 6 Rapporti ALOM sugli interruttori automatici e sui convertitori CC CC MB FF_SCSIA OK MB FF_SCSIB OK MB FF_POK OK CO PO FF POK OK C1 P0 FF POK OK C2 PO FF_ _POK OK C3 PO FF_
28. 600000 isa 7 serial 0 3 8 Testing pci le 600000 isa 7 rtc 0 70 Testing pci le 600000 isa 7 12c 0 320 tests gpio 0 42 gpio 0 44 gpio 0 46 gpio 0 48 Testing pci le 600000 isa 7 i2c 0 320 tests hardware monitor 0 5c Testing pci le 600000 isa 7 i2c 0 320 tests temperature sensor 0 9c Testing pci 1c 600000 network 2 Testing pci 1 700000 scsi 2 1 Testing pci 1f 700000 scsi 2 Nel seguente output di esempio viene illustrata l inizializzazione della memoria mediante OpenBoot PROM CODICE DI ESEMPIO 7 25 Output del comando consolehistory boot v inizializzazione della memoria Initializing 1MB of memory at addr 123fe02000 Initializing 12MB of memory at addr 123 000000 Initializing 1008MB of memory at addr 1200000000 Initializing 1024MB of memory at addr 1000000000 Initializing 1024MB of memory at addr 200000000 Initializing 1024MB of memory at addr 0 1 ok boot disk 158 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 Nel seguente output di esempio viene illustrato il boot del sistema e il caricamento del software Solaris CODICE DI ESEMPIO 7 26 Output del comando consolehistory boot v boot del sistema e caricamento del software Solaris Rebooting with command boot disk Boot device pci 1f 700000 scsi 2 disk 0 0 File and args Loading ufs file system package 1 4 04 Aug 1995 13 02 54 FCode UFS Reader 1 11 97 07 10 16 19 15 Loadin
29. FIGURA 2 3 Facoltativo Impostare il livello di diagnostica desiderato Per eseguire test pi approfonditi impostare la variabile di configurazione OpenBoot diag level su max obdiag gt setenv diag level max Capitolo 3 Isolamento delle parti danneggiate 75 76 Nota Se la variabile diag level impostata su off il firmware OpenBoot restituisce lo stato passed che indica l esito positivo di tutti i test principali ma non esegue alcuna diagnostica Allo stesso modo possibile utilizzare il prompt obdiag gt per impostare qualsiasi variabile di configurazione OpenBoot vedere la TABELLA 2 1 Digitare il comando appropriato e il numero del test che si desidera eseguire Ad esempio per eseguire tutti i test OpenBoot disponibili digitare quanto segue obdiag gt test all Per eseguire un test specifico digitare quanto segue obdiag gt test In questa stringa rappresenta il numero del test da eseguire Per un elenco dei comandi dei test diagnostici OpenBoot vedere Comandi interattivi OpenBoot Diagnostics a pagina 20 Il menu dei test con il numero associato a ciascuno di essi illustrato nella FIGURA 2 3 Una volta completata l esecuzione dei test diagnostici OpenBoot chiudere l apposito menu Digitare quanto segue obdiag gt exit Viene di nuovo visualizzato il prompt ok Impostare la variabile di configurazione OpenBoot auto boot su
30. Non sempre possibile attribuire con certezza la causa di un problema che si verifica su un server a un determinato componente hardware o software In questi casi potrebbe essere utile eseguire uno strumento di diagnostica che solleciti il sistema mediante la continua esecuzione di una serie completa di test Sono disponibili due strumenti Sun che possibile utilizzare con il server Sun Fire V440 m Software SunVTS m Hardware Diagnostic Suite Hardware Diagnostic Suite un prodotto che possibile acquistare come aggiornamento del software Sun Management Center Per istruzioni sull uso di Hardware Diagnostic Suite consultare la documentazione Sun Management Center Software User s Guide In questo capitolo vengono descritte le operazioni necessarie per utilizzare il software SunVTS al fine di analizzare il server Sun Fire V440 In questo capitolo sono incluse le seguenti sezioni m Analisi del sistema mediante il software SunVTS a pagina 104 m Come verificare se il software SunVTS installato a pagina 109 Per informazioni di base sugli strumenti disponibili e per indicazioni sulle situazioni in cui possibile utilizzarli vedere Capitolo 1 e Capitolo 2 Nota Molte delle procedure descritte in questo capitolo presuppongono una conoscenza di base del firmware OpenBoot e della modalit di accesso al prompt ok Per informazioni di base vedere Informazioni sul prompt ok a pagina 181 Per istruzioni vedere Accesso al prompt o
31. OFF MAY 09 17 03 24 Sun SFV440 a 0004000b Host System has read and cleared bootmode 00040002 Host System has Reset 00040002 Host System has Reset 0004004f Indicator SYS _FRONT SERVICE is now ON 0004004f Indicator SYS FRONT ACT is now ON MAY 09 17 04 30 Sun SFV440 MAY 09 17 05 59 Sun SFV440 0 0 MAY 09 17 06 40 Sun SFV440 MAY 09 17 07 44 Sun SFV440 a a a a Nota Le stampigliature delle date per i log ALOM riflettono l orario UTC Universal Time Coordinated mentre le stampigliature delle date per l ambiente operativo Solaris riflettono l orario locale server Pertanto un singolo evento pu generare messaggi che sembrano registrati in momenti differenti su log differenti 2 Esaminare il log di esecuzione ALOM Digitare quanto segue sc gt consolehistory run v Questo comando mostra il log contenente l output della console di sistema pi recente relativo ai messaggi di boot provenienti dall ambiente operativo Solaris Durante la risoluzione dei problemi esaminare l output per individuare gli errori hardware o software registrati dall ambiente operativo sulla console di sistema Il CODICE DI ESEMPIO 7 7 mostra un esempio di output restituito dal comando consolehistory run v CODICE DI ESEMPIO 7 7 Output del comando consolehistory run v May 9 14 48 22 Sun SFV440 a rmclomv SC Login User admin Logged on init 0 INIT New run level 0 The
32. Power On SelfTest 0 gt Sun Fire TM V440 POST 4 10 3 2003 05 04 22 08 export work staff firmware re post post build 4 10 3 Fiesta chalupa integrated firmware re 0 gt Hard Powerup RST thru SW 0 gt CPUs present in system 0 1 0 gt OBP gt POST Call with 00 00000000 01012000 O gt Diag level set to MIN 0 gt MFG scrpt mode set NORM 0 gt I O port set to TTYA 0 gt O gt Start selftest 1 gt Print Mem Config 1 gt Caches Icache is ON Dcache is ON Wcache is ON Pcache is ON 1 gt Memory interleave set to 0 La Bank 0 1024MB 00000010 00000000 gt 00000010 40000000 1 gt Bank 2 1024MB 00000012 00000000 gt 00000012 40000000 O gt Print Mem Config 0 gt Caches Icache is ON Dcache is ON Wcache is ON Pcache is ON O gt Memory interleave set to 0 0 gt Bank 0 1024MB 00000000 00000000 gt 00000000 40000000 0 gt Bank 2 1024MB 00000002 00000000 gt 00000002 40000000 O gt INFO 0 gt POST Passed all devices 0 gt 0 gt POST Return to OBP 168 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 4 Ruotare l interruttore di controllo del sistema sulla posizione di diagnostica 5 Accendere il sistema Se non viene eseguito il boot possibile che il sistema presenti un problema hardware di base Se non sono state apportate modifiche hardware recenti al sistema contattare l assistenza tecnica autorizzata 6 Se il sistema accede al promp
33. SC Login User admin Logged on Capitolo 7 Risoluzione dei problemi hardware 153 CODICE DI ESEMPIO 7 19 Output del comando showlogs Continua MAY 09 16 58 11 Sun SFV440 a 00040001 SC Request to Power On Host MAY 09 16 58 11 Sun SFV440 a 00040002 Host System has Reset MAY 09 16 58 13 Sun SFV440 a 0004000b Host System has read and cleared bootmode a 0004004f Indicator PS0 POK is now ON a 0004004f Indicator PS1 POK is now ON MAY 09 16 58 13 Sun SFV440 0 0 a 00040002 Host System has Reset 0 0 0 MAY 09 16 58 13 Sun SFV44 MAY 09 16 59 19 Sun SFV44 MAY 09 17 00 46 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 01 51 Sun SFV440 a 0004004f Indicator SYS_FRONT SERVICE is now ON MAY 09 17 03 22 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 03 22 Sun SFV440 a 0004004f Indicator SYS_FRONT SERVICE is now OFF MAY 09 17 03 24 Sun SFV440 a 0004000b Host System has read and cleared bootmode a 00040002 Host System has Reset a 00040002 Host System has Reset a 0004004f Indicator SYS FRONT SERVICE is now ON a 0004004f Indicator SYS FRONT ACT is now ON MAY 09 17 04 30 Sun SFV44 MAY 09 17 05 59 Sun SFV44 MAY 09 17 06 40 Sun SFV44 MAY 09 17 07 44 Sun SFV44 Nota Le stampigliature delle date per i log ALOM riflettono l orario UTC Universal Time Coordinated mentre le stampigliature delle date per l ambiente operativo Solar
34. Vendor SEAGATE Product ST336607LSUN36G Revision 0207 Serial No 3JA0AGQS00002317 Size 36 42GB lt 36418595328 bytes gt Media Error 0 Device Not Ready 0 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 11 Controllare le note sul prodotto del sistema e il sito Web SunSolve per le ultime informazioni gli aggiornamenti dei driver e le documentazioni gratuite per il sistema 12 Controllare la cronologia dei servizi di manutenzione recenti Un sistema che recentemente ha subito diversi errori irreversibili di ripristino e conseguenti sostituzioni delle unita FRU deve essere monitorato attentamente per determinare se le parti recentemente sostituite non erano in realta danneggiate e se Vhardware effettivamente danneggiato non stato rilevato Capitolo 7 Risoluzione dei problemi hardware 163 Risoluzione dei problemi di un sistema che non esegue il boot E possibile che un sistema non sia in grado di eseguire il boot a causa di problemi hardware o software Se si sospetta un problema software vedere la sezione relativa alla risoluzione di problemi software nella documentazione Solaris System Administration Guide Advanced Administration Se si sospetta un problema hardware utilizzare la procedura riportata di seguito per determinare le possibili cause Operazioni preliminari Eseguire il login al controller di sistema e accedere al prompt sc gt Per informazioni vedere m Inform
35. amp Sun microsystems Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Sun Microsystems Inc 4150 Network Circle Santa Clara CA 95054 U S A 650 960 1300 N di parte 817 2866 10 Luglio 2003 revisione A Inviare gli eventuali commenti su questo documento a http www sun com hwdocs feedback Copyright 2003 Sun Microsystems Inc 4150 Network Circle Santa Clara California 95054 U S A Tutti i diritti riservati Sun Microsystems Inc detiene diritti di propriet intellettuale sulla tecnologia descritta in questo documento In particolare e senza limitazione tali diritti di propriet intellettuali possono includere uno o pi brevetti statunitensi elencati all indirizzo http www sun com patents e uno o pi brevetti aggiuntivi o in attesa di registrazione negli Stati Uniti e in altri paesi Questo documento e il prodotto a cui si riferisce sono distribuiti sotto licenze che ne limitano l uso la copia la distribuzione e la decompilazione Nessuna parte di questo prodotto o documento pu essere riprodotta in qualunque forma o con qualunque mezzo senza la previa autorizzazione di Sun e dei suoi concessori di licenza Il software di terze parti inclusa la tecnologia dei font protetto da copyright e distribuito su licenza dai fornitori Sun Alcune parti di questo prodotto possono derivare dai sistemi Berkeley BSD concessi in licenza dalla University of California UNIX un marchio
36. attached SUNW builtin drivers driver not attached deblocker driver not attached disk label driver not attached pci instance 1 pci instance 2 isa instance 0 flashprom driver not attached rtc driver not attached i2c instance 0 12c bridge driver not attached 12c bridge driver not attached temperature instance 3 driver not attached L opzione p del comando prtconf consente di ottenere un output simile a quello restituito mediante il comando OpenBoot show devs Vedere Comando show devs a pagina 24 In questo output vengono elencati solo i dispositivi compilati dal firmware del sistema Comando prtdiag Il comando prtdiag consente di visualizzare una tabella contenente le informazioni di diagnostica che indicano lo stato dei componenti del sistema Il formato di visualizzazione dell output del comando prtdiag varia in base alla versione dell ambiente operativo Solaris in esecuzione sul sistema Di seguito vengono riportati alcuni estratti dell output restituito dal comando prtdiag su un server Sun Fire V440 integro su cui viene eseguito il software Solaris 8 Capitolo 2 Diagnostica e processo di boot 27 CODICE DI ESEMPIO 2 8 Output del comando prtdiag sull interfaccia di I O e sulla CPU System Configuration Sun Microsystems sun4u Sun Fire V440 System clock frequency 183 MHZ Memory size 16GB Steves sees Seek he See See ee CPUS Stes Se oe eee ee eee oe ES CPU CPU CPU Freq
37. attraverso la porta di gestione di rete utilizzare il comando telnet con l indirizzo IP specificato nel Punto 3 della procedura precedente 190 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Accesso alla console di sistema mediante un server terminal Operazioni preliminari La procedura descritta di seguito presuppone che si stia eseguendo l accesso alla console di sistema del server Sun Fire V440 mediante il collegamento di un server terminal alla porta di gestione seriale SERIAL MGT del server Sun Fire V440 Operazioni da eseguire Completare la connessione fisica dalla porta di gestione seriale al server terminal La porta di gestione seriale sul server Sun Fire V440 di tipo DTE Data Terminal Equipment I pin per la porta di gestione seriale corrispondono ai pin per le porte RJ 45 presenti sul cavo di collegamento esterno breakout cable dell interfaccia seriale fornito da Cisco per l uso con il server terminal Cisco AS2511 RJ Se si utilizza un server terminal distribuito da un altro produttore verificare che i pin della porta seriale del server Sun Fire V440 corrispondano a quelli del server terminale che si desidera utilizzare Se i pin per le porte seriali del server corrispondono a quelli per le porte RJ 45 sul server terminal possibile eseguire il collegamento mediante uno dei due seguenti metodi m Collegare un cavo di collegamento esterno breakout cable d
38. com Big Admin Questo sito Web rappresenta una risorsa unica per gli amministratori di sistema Sun E possibile accedere al sito Web Big Admin al seguente indirizzo http www sun com bigadmin Informazioni sulla gestione delle patch del firmware e del software Sun tenta in ogni modo di garantire che ciascun sistema venga fornito con il firmware e il software pit aggiornati Tuttavia nei sistemi complessi i difetti e i problemi vengono rilevati sul posto dopo che il sistema uscito dalla fabbrica Spesso questi problemi vengono corretti con le patch al firmware del sistema Un aggiornamento continuo del firmware del sistema e dell ambiente operativo Solaris con le versioni pi recenti delle patch necessarie e consigliate consente di evitare problemi che potrebbero gi essere stati rilevati e risolti da altri utenti Gli aggiornamenti del firmware e dell ambiente operativo sono spesso necessari per diagnosticare o risolvere un problema Programmare aggiornamenti regolari del firmware e del software del sistema affinch non si debba aggiornare il firmware o il software in momenti non opportuni Le patch e gli aggiornamenti pi avanzati per il server Sun Fire V440 sono disponibili sui siti Web elencati nella sezione Siti Web a pagina 116 Informazioni su Sun Install Check Tool Quando si installa SunSM Install Check Tool viene installato anche Sun Explorer Data Collector Sun Install Check Tool utilizza Sun Explorer Data Colle
39. comando go per riprendere l esecuzione in generale ogni volta che si utilizza il prompt ok necessario prevedere l esecuzione del reboot del sistema al fine di ripristinare l ambiente operativo Di norma prima di sospendere l ambiente operativo necessario eseguire il backup dei file avvisare gli utenti circa l imminente chiusura dell ambiente operativo e chiudere il sistema in base alla procedura ordinaria Non sempre tuttavia possibile adottare tali precauzioni specialmente se il sistema non funziona correttamente 184 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Ulteriori informazioni Per ulteriori informazioni sul firmware OpenBoot vedere la documentazione OpenBoot 4 x Command Reference Manual Una versione in linea del manuale inclusa nella documentazione OpenBoot Collection AnswerBook fornita con il software Solaris Passaggio dal controller di sistema ALOM alla console di sistema Il server Sun Fire V440 dotato di due porte di gestione denominate SERIAL MGT e NET MGT che si trovano sul pannello posteriore del server Se la console di sistema diretta alle porte di gestione seriale e di rete in base alla configurazione predefinita queste porte forniscono l accesso sia alla console di sistema che al controller di sistema ALOM ciascuna su canali separati vedere la FIGURA A 3 Console di sistema
40. connessione tip a pagina 194 Se la console di sistema stata reindirizzata a ttyb e si desidera ripristinare le impostazioni della console in modo che utilizzi le porte di gestione seriale e di rete vedere m Riferimento per le impostazioni delle variabili di configurazione OpenBoot della console di sistema a pagina 207 Accesso alla console di sistema mediante un terminale alfanumerico Operazioni preliminari In questa procedura si assume che l accesso alla console di sistema del server Sun Fire V440 venga eseguito mediante la connessione della porta seriale di un terminale alfanumerico alla porta di gestione seriale SERIAL MGT del server Sun Fire V440 Operazioni da eseguire Collegare un estremit del cavo seriale alla porta seriale del terminale alfanumerico Utilizzare cavo seriale null modem RJ 45 o un cavo seriale RJ 45 e un adattatore null modem Inserire il cavo nel connettore della porta seriale del terminale Collegare l altra estremit del cavo seriale alla porta di gestione seriale del server Sun Fire V440 Collegare il cavo di alimentazione del terminale alfanumerico una presa di alimentazione CA Impostare il terminale alfanumerico per la ricezione m 9600 baud a 8bit Appendice A Configurazione della console di sistema 199 m Nessuna parit m lbit di stop m Nessun protocollo di sincronizzazione Fare riferimento alla documentazione fornita con il terminale in uso per ulteriori inform
41. cui i test POST o OpenBoot Diagnostics stessi si bloccano rendendo il server inutilizzabile essendo impossibile eseguirne il boot Tali blocchi sono in genere dovuti a eventuali danni del firmware specialmente nel caso in cui sia stata inserita un immagine del firmware incompatibile nelle PROM Flash del server Se si ritiene necessario ignorare i test diagnostici per un singolo ciclo di boot possibile servirsi del metodo fornito dal controller di sistema ALOM Per le istruzioni vedere Come ignorare temporaneamente i test diagnostici a pagina 66 Aumento dell affidabilita Per impostazione predefinita i test diagnostici non vengono eseguiti dopo un ripristino inizializzato dall utente o dal sistema operativo Tali test non vengono pertanto eseguiti nel caso di una procedura di emergenza del sistema operativo Per ottenere la massima affidabilit specialmente nel caso dell uso della funzione di ripristino automatico del sistema ASR Automatic System Recovery possibile configurare il sistema per l esecuzione dei test diagnostici basati sul firmware dopo tutte le operazioni di ripristino Per istruzioni vedere Ottimizzazione dei test diagnostici a pagina 67 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Fase 2 test OpenBoot Diagnostics Una volta completata l esecuzione di test diagnostici POST gli eventuali dispositivi danneggiati vengono contrassegnati dalla dicitura FAILED
42. della password e conservarla per un uso futuro Viene visualizzato il prompt sc gt sc gt Questo prompt indica che stato ottenuto l accesso all interfaccia della riga di comando del controller di sistema ALOM Al prompt sc gt digitare il comando showenvironment sc gt showenvironment Questo comando visualizza una quantit notevole di dati utili a partire dalle indicazioni sulla temperatura tramite una serie di sensori termici Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 CODICE DI ESEMPIO 4 1 Rapporti ALOM sulle temperature del sistema Environmental Status System Temperatures Temperatures in Celsius 120 120 120 75 5 75 85 Sensor Status Temp LowHard LowSoft LowWarn HighWarn HighSoft CO PO T_ CORE OK 43 20 10 0 97 102 C1 P0 T CORE OK 50 20 10 0 97 102 C2 P0 T CORE OK 56 20 10 0 97 102 CO T_AMB OK 26 20 10 0 60 65 C1 T_AMB OK 27 20 10 0 60 65 C2 T_AMB OK 26 20 10 0 60 65 SCSIBP T_ AMB OK 23 18 10 0 65 75 10 0 65 75 85 MB T_AMB OK 28 18 Nota Le soglie di avvertenza e di chiusura regolare del software indicate nel CODICE DI ESEMPIO 4 1 sono impostazioni di fabbrica e non possono essere modificate I sensori associati all etichetta T_AMB nel CODICE DI ESEMPIO 4 1 calcolano le temperature ambientali dei moduli CPU memoria della scheda madre e del piano posteriore SCSI I sensori
43. di boot Vedere la FIGURA 2 1 Capitolo 2 Diagnostica e processo di boot 9 10 POST SCC PROM di boot Firmware OpenBoot 2 Mbyte FIGURA 2 1 PROM di boot e SCC Il tipo di esecuzione dei test diagnostici all accensione controllato dalle variabili di configurazione memorizzate nella scheda di configurazione del sistema SCC System Configuration Card rimovibile le quali determinano anche la necessit o meno di eseguire tali test Le variabili di configurazione OpenBoot vengono descritte nella sezione Controllo della diagnostica POST a pagina 13 I test diagnostici POST vengono caricati nella memoria del sistema non appena sono in grado di verificare la funzionalit di un sottoinsieme di memoria del sistema Funzione dei test diagnostici POST I test diagnostici POST verificano la funzionalit di base del sistema Un esecuzione corretta della diagnostica POST non garantisce il corretto funzionamento del server ma indica che possibile eseguire la fase successiva del processo di boot Nel caso di un server Sun Fire V440 ci indica quanto segue Almeno una CPU funziona correttamente Almeno un sottoinsieme 512 Mbyte della memoria del sistema funzionale I bridge di input output presenti sulla scheda madre sono funzionanti Il bus PCI intatto ovvero non presente alcun corto circuito Sebbene un sistema passi tutti i test diagnostici POST potrebbe non essere possibile eseguire
44. di elaborazione vedere CPU unita sostituibile in loco vedere FRU Universal Serial Bus USB esecuzione dei test automatici OpenBoot Diagnostics su dispositivi 21 V variabile auto boot impostazione 181 uso nella risoluzione di problemi di boot 169 variabile boot device uso nella risoluzione dei problemi di boot 169 variabile diag device uso nella risoluzione dei problemi di boot 169 variabileerror reset recovery impostazione per la risoluzione dei problemi 120 variabili di configurazione OpenBoot attivazione ASR 121 auto boot 14 diag level 14 diag script 14 diag switch 14 funzione 10 13 impostazioni della console di sistema 207 input device 15 obdiag trigger 15 output device 15 post trigger 15 tabella 14 visualizzazione con printenv 22 velocit del processore visualizzazione 32 velocit di trasmissione in baud impostazione del terminale alfanumerico 199 verifica 202 verifica velocit di trasmissione in baud 201 vista configurazione fisica Sun Management Center 41 vista configurazione logica Sun Management Center 41 visualizzazione dell intestazione del sistema 145 X XIR vedere ripristino avviato esternamente 217 218 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003
45. diagnostici OpenBoot vengono eseguiti automaticamente su tutti i componenti della scheda madre Capitolo 3 Isolamento delle parti danneggiate 63 Nota Se si preferisce che i test diagnostici OpenBoot esaminino tutti i dispositivi IEEE 1275 compatibili non solo quelli presenti sulla scheda madre impostare la variabile diag script su all 3 Impostare le variabili di configurazione OpenBoot per l avvio dei test diagnostici Digitare quanto segue ok setenv post trigger power on reset error reset ok setenv obdiag trigger power on reset error reset 4 Impostare il massimo livello di test diagnostico POST Digitare quanto segue ok setenv diag level max Ci assicura che i test diagnostici all accensione vengano eseguiti in modo pi approfondito possibile Il completamento del livello di test massimo richiede molto pi tempo rispetto a quello minimo A seconda della configurazione del sistema potrebbe essere necessario attendere ancora da 10 a 20 minuti affinch venga completato il boot del sistema Come ignorare i test diagnostici basati su firmware possibile ignorare i test diagnostici POST e OpenBoot per accelerare il processo di avvio del server Per informazioni di base vedere a Diagnostica affidabilit e disponibilit a pagina 16 Attenzione Se vengono ignorati i test diagnostici l affidabilit del sistema pu risultarne compromessa poich quest ultimo tenta di eseguire il boot an
46. diretto alla porta di gestione seriale in quanto i test diagnostici POST non dispongono di un meccanismo che consenta l invio dell output a un monitor grafico La porta di gestione seriale e la porta di gestione di rete vengono rappresentate nelle variabili di configurazione OpenBoot come tt ya Tuttavia la porta di gestione seriale non funziona come una connessione seriale standard Se si desidera collegare al sistema un dispositivo seriale convenzionale come una stampante sar necessario collegarlo a ttyb e non alla porta di gestione seriale Per ulteriori informazioni vedere la documentazione Server Sun Fire V440 Guida di amministrazione importante tenere presente che il prompt sc gt e i messaggi POST sono disponibili solo attraverso le porte di gestione seriale e di rete Inoltre il comando console del controller di sistema ALOM non valido se la console di sistema reindirizzata attyb o a un monitor grafico locale Oltre alle variabili di configurazione OpenBoot descritte nella TABELLA A 4 altre variabili incidono sul funzionamento del sistema Tali variabili sono descritte pi dettagliatamente nella sezione Controllo della diagnostica POST a pagina 13 208 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Indice SIMBOLI etc remote file modifica 197 etc syslogd conf file 25 var adm messages file registrazione degli errori 25 uso nella risoluzione dei prob
47. e il controllo viene restituito al firmware OpenBoot Il firmware OpenBoot compila un elenco di tutti i dispositivi presenti nel sistema disponendoli in ordine gerarchico Tale elenco viene denominato struttura ad albero dei dispositivi Sebbene tale struttura ad albero dipenda dalla configurazione del sistema in genere include sia i componenti incorporati del sistema sia i dispositivi dei bus PCI opzionali I componenti contrassegnati come FAILED dai test diagnostici POST non vengono inclusi nella struttura ad albero dei dispositivi Dopo la corretta esecuzione dei test diagnostici POST il firmware OpenBoot esegue i test OpenBoot Diagnostics Analogamente ai test POST il codice OpenBoot Diagnostics basato sul firmware e si trova nella memoria PROM di boot Funzione dei test OpenBoot Diagnostics I test OpenBoot Diagnostics si concentrano sui dispositivi di I O del sistema e sulle periferiche Indipendentemente dal produttore tutti i dispositivi presenti nella struttura ad albero che dispongono di una funzione di diagnostica automatica IEEE 1275 compatibile sono inclusi nella suite dei test OpenBoot Diagnostics Su un server Sun Fire V440 i seguenti componenti del sistema vengono analizzati mediante i test OpenBoot Diagnostics m Interfacce I O incluse porte USB e seriali controller SCSI e IDE e interfacce Ethernet m Scheda ALOM m Tastiera mouse e video se presente Componenti bus Inter Integrated Circuit IC inclusi senso
48. il boot del sistema operativo tuttavia possibile eseguire i test diagnostici POST anche se il boot di un sistema non riesce Tali test consentono infatti di determinare la causa della maggior parte dei problemi hardware In genere i test diagnostici POST rilevano gli errori di natura persistente Per individuare problemi che si verificano a intermittenza eseguire uno strumento di analisi del sistema Vedere Informazioni sull analisi del sistema a pagina 43 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Scopo dei test di diagnostica POST Ciascuna diagnostica POST un test di basso livello in grado di rilevare i guasti presenti in uno specifico componente hardware Ad esempio i singoli test della memoria denominati address bitwalk e data bitwalk garantiscono che gli 0 e gli 1 binari possano essere scritti su ciascuna riga relativa agli indirizzi e ai dati Durante l esecuzione di tale test possibile che venga visualizzato un output simile al seguente esempio 1 gt Data Bitwalk on Slave 3 a Test Bank 0 In questo esempio la CPU 1 rappresenta la CPU master come indicato dal prompt 1 gt e sta per eseguire il test della memoria associata alla CPU 3 come indicato dal messaggio Slave 3 Nel risultato relativo all esito negativo del test vengono indicate informazioni precise su circuiti integrati specifici sui registri di memoria interni a tali circuiti o sui percorsi d
49. il sistema non risponde a una sequenza di arresto Lo stato di blocco hardware risulta evidente dopo aver tentato senza successo tutti i rimedi per il blocco software Vedere Risoluzione dei problemi di un sistema bloccato a pagina 170 Risposta agli errori irreversibili di ripristino e alle eccezioni dello stato RED Gli errori irreversibili di ripristino e le eccezioni dello stato RED sono provocati nella maggior parte dei casi da problemi hardware Gli errori hardware irreversibili di ripristino sono il risultato di uno stato hardware non valido rilevato dal sistema Un errore hardware irreversibile di ripristino pu essere un errore temporaneo o hardware Un errore temporaneo provoca guasti intermittenti Un errore hardware provoca guasti persistenti che si verificano nello stesso modo Il CODICE DI ESEMPIO 7 1 mostra un esempio di avviso per errore irreversibile di ripristino proveniente dalla console di sistema CODICE DI ESEMPIO 7 1 Avviso per errore irreversibile di ripristino Sun SFV440 a console login Fatal Error Reset CPU 0000 0000 0000 0002 AFSR 0210 9000 0200 0000 JETO PRIV OM TO AFAR 0000 0280 0ec0 c180 SC Alert Host System has Reset SC Alert Host System has read and cleared bootmode Una condizione di eccezione dello stato RED rappresenta pi comunemente un guasto hardware rilevato dal sistema Non esistono informazioni di recupero da poter utilizzare per risolvere un problema di eccezione dello stato R
50. indirizzi JTAG Joint Test Access Group standard IEEE 1149 1 Nessuna per la scansione dei componenti di sistema MAC Media Access Controller indirizzo hardware di Scheda madre un dispositivo collegato a una rete MII Media Independent Interface parte del Scheda madre controller Ethernet NVRAM Fa riferimento alla scheda di configurazione del Scheda configurazione sistema SCC System Configuration Card del sistema OBP Fa riferimento al firmware OpenBoot Nessuna PHY Interfaccia fisica parte del circuito di Scheda madre controllo Ethernet POST Power On Self Test test diagnostico Nessuna all accensione RIC Real Time Clock clock in tempo reale Scheda madre RX Ricezione protocollo di comunicazione Scheda madre Scan Mezzo per monitorare e modificare il contenuto Nessuna dei circuiti ASIC e dei componenti di sistema in base allo standard IEEE 1149 1 Southbridge Circuito integrato che controlla la porta UART Scheda madre ALOM e altro Tomatillo Bus di sistema al circuito integrato del bridge PCI Scheda madre TX Trasmissione protocollo di comunicazione Scheda madre UART Universal Asynchronous Receiver Transmitter Scheda madre scheda hardware porta seriale ALOM UIE Update ended Interrupt Enable funzione fornita Scheda madre mediante il clock in tempo reale XBus Bus per dispositivi a bassa velocita Scheda madre Capitolo 2 Diagnostica e processo di boot 57 58 Server Sun Fire V440 Guida alla diagnostic
51. interpretazione 21 POST interpretazione 11 modalit diagnostica funzione 8 impostazione del server 63 monitor collegamento 203 monitoraggio del sistema comandi OpenBoot 22 102 comandi Solaris 26 101 controller di sistema 87 controller di sistema ALOM 38 notifica tramite posta elettronica 37 38 Sun Management Center 82 mouse collegamento 206 N non standard strumenti diagnostici 2 25 numero dell unit probe scsi 23 numero della destinazione probe scsi 23 O OBDIAG vedere test OpenBoot Diagnostics obdiag trigger variabile impostazione 15 uso nella risoluzione dei problemi di blocco del sistema 171 output device variabile 15 213 P parit impostazione del terminale alfanumerico 200 verifica 202 patch determinazione con showrev 33 installate 33 percorsi hardware dei dispositivi 20 24 ping comando Solaris uso nella risoluzione dei problemi di sospensione del sistema 170 pkgadd utility 110 pkginfo comando Solaris 110 porta di gestione di rete NET MGT accesso al controller di sistema ALOM e alla console di sistema 185 connessione predefinita alla console di sistema 177 porta di gestione seriale SERIAL MGT accesso al controller di sistema ALOM e alla console di sistema 185 connessione predefinita alla console di sistema 177 connessione tip 194 definizione 174 dispositivi per l accesso alla console di sistema 174 uso 188 porta seriale connessione 199 posizio
52. man appropriate Operazioni preliminari Purch sia possibile accedere al prompt ok possibile utilizzare i comandi OpenBoot per le informazioni Tali comandi sono pertanto accessibili anche quando il sistema non pu eseguire il boot del software dell ambiente operativo Operazioni da eseguire 1 Se necessario arrestare il sistema per accedere al prompt ok La modalit di esecuzione di tale operazione varia in base alle condizioni del sistema Se possibile opportuno avvisare gli utenti e arrestare il sistema in modo regolare Per informazioni vedere Informazioni sul prompt ok a pagina 181 2 Stabilire il tipo di informazioni di sistema che si desidera visualizzare Per ulteriori informazioni vedere Alti comandi OpenBoot a pagina 22 3 Digitare il comando appropriato a un prompt della console di sistema Vedere la TABELLA 4 2 TABELLA 4 2 Uso dei comandi OpenBoot per la visualizzazione delle informazioni Comando da digitare Informazione printenv Valori predefiniti e impostazioni delle variabili di configurazione OpenBoot probe scsi Indirizzo di destinazione numero di unit tipo di dispositivo probe scsi all e nome del produttore dei dispositivi SCSI e IDE attivi probe ide show devs Percorso hardware di tutti i dispositivi nella configurazione di sistema 102 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 CAPITOLO 5 Analisi del sistema
53. modalit di diagnostica per il sistema impostando tale variabile su true oppure spostando l interruttore di controllo del sistema sulla posizione di diagnostica Per informazioni dettagliate vedere Impostazione del sistema in modalit diagnostica a pagina 63 14 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 TABELLA 2 1 Variabili di configurazione OpenBoot Continua Variabile di configurazione OpenBoot Descrizione e parole chiave post trigger Indica la classe dell evento di ripristino che causa l esecuzione dei test diagnostici obdiag trigger POST o dei test OpenBoot Diagnostics Queste variabili accettano sia parole chiave singole sia la combinazione delle prime tre parole chiave separate da spazi Per informazioni dettagliate vedere Visualizzazione e impostazione delle variabili di configurazione OpenBoot a pagina 60 e error reset ripristino causato da determinate condizioni di errore hardware irreversibili In genere un ripristino dall errore error reset si verifica quando i dati sullo stato del sistema vengono danneggiati a causa di un problema hardware e la macchina perde precisione I ripristini del meccanismo di sorveglianza delle CPU e del sistema gli errori irreversibili e alcuni eventi di ripristino delle CPU predefinito sono esempi di error reset e power on reset ripristino causato dalla pressione del pulsante di alimentazione predefinito e user reset r
54. non stata fornita alcuna risposta nel presente documento accedere al seguente indirizzo http www sun com service contacting Commenti dell utente Per eventuali commenti e suggerimenti su come migliorare la documentazione di Sun possibile accedere all indirizzo http www sun com hwdocs feedback Assicurarsi di specificare il titolo e il numero di parte del documento insieme ai propri commenti Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi numero di parte 817 2866 10 Prefazione xv xvi Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 PARTE I Diagnostica I cinque capitoli di questa parte della documentazione Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi descrivono gli strumenti diagnostici basati su hardware firmware e software del server le modalita di interazione e di utilizzo di tali strumenti per monitorare analizzare e isolare i guasti del sistema Per informazioni e istruzioni dettagliate sulla risoluzione di determinati problemi con il server vedere i capitoli della Parte II Risoluzione dei problemi Nella Parte I sono inclusi i seguenti capitoli Capitolo 1 Panoramica sugli strumenti diagnostici Capitolo 2 Diagnostica e processo di boot Capitolo 3 Isolamento delle parti danneggiate Capitolo 4 Monitoraggio del sistema Capitolo 5 Analisi del sistema CAPITOLO 1 Panoramica s
55. operativo 137 eccezioni dello stato RED 153 errori di ripristino irreversibili 153 informazioni sugli errori 130 problema di boot 164 reboot non previsto 141 registrazione errori 122 uso delle variabili di configurazione per 119 S SCC vedere scheda di configurazione del sistema scheda PCI Peripheral Component Interconnect scheda frame buffer 203 SEAM Sun Enterprise Authentication Mechanism 46 sequenza di tasti L1 A 187 SERIAL MGT vedere porta di gestione seriale server terminal 191 show devs comando OpenBoot 24 showenvironment comando controller di sistema monitoraggio del server 38 uso nella risoluzione dei problemi con risposta da parte del sistema operativo 138 showenvironment comando controller di sistema visualizzazione dei dati ambientali 88 showfru comando controller di sistema 92 showlogs comando controller di sistema uso nel monitoraggio del sistema 93 uso nella risoluzione dei problemi 153 uso nella risoluzione dei problemi con risposta da parte del sistema operativo 137 uso nella risoluzione dei problemi dopo un reboot non previsto 141 uso nella risoluzione di problemi di boot 164 show obdiag results comando uso nella risoluzione dei problemi 131 showplatform comando controller di sistema 38 99 show post results comando OpenBoot uso nella risoluzione dei problemi 131 showrev comando Solaris 33 showusers comando controller di sistema 39 98 shutdown coma
56. pagina 191 Accesso alla console di sistema mediante la connessione tip a pagina 194 Modifica del file etc remote a pagina 197 Verifica delle impostazioni della porta seriale su ttyb a pagina 201 Accesso alla console di sistema mediante un terminale alfanumerico a pagina 199 Accesso alla console di sistema mediante un monitor grafico a pagina 203 questa appendice sono incluse anche le seguenti sezioni Informazioni sulla comunicazione con il sistema a pagina 174 Informazioni sul prompt sc gt a pagina 179 Informazioni sul prompt ok a pagina 181 Passaggio dal controller di sistema ALOM alla console di sistema a pagina 185 Riferimento per le impostazioni delle variabili di configurazione OpenBoot della console di sistema a pagina 207 173 Informazioni sulla comunicazione con il sistema Per installare il software del sistema o diagnosticare eventuali problemi necessario interagire con il sistema a livelli inferiori La console di sistema rappresenta la risorsa Sun per l esecuzione di tale operazione in quanto consente di visualizzare i messaggi ed eseguire i comandi prevista una sola console di sistema per ogni computer La porta di gestione seriale SERIAL MGT la porta predefinita per l accesso alla console di sistema al momento dell installazione iniziale del sistema Una volta eseguita l installazione possibile configurare la console di sistema per l uso di diversi dispositivi di input e di out
57. pagina 44 Questa procedura presuppone inoltre che il server Sun Fire V440 non disponga di un monitor in grado di visualizzare la grafica bitmap In questo caso possibile accedere all interfaccia GUI di SunVTS eseguendo il login in modo remoto da una macchina con un display grafico In questa procedura viene infine fornita una descrizione generica delle modalit di esecuzione dei test SunVTS possibile che per eseguire i singoli test sia necessaria la presenza di determinati componenti hardware o di driver cavi o connettori di loopback specifici Per informazioni sulle opzioni dei test e sui prerequisiti vedere m SunVTS Test Reference Manual m SunVTS Documentation Supplement Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 Operazioni da eseguire 1 Eseguire il login come superutente a un sistema con un display grafico E opportuno che il sistema di visualizzazione disponga di una scheda buffer frame e di un monitor in grado di visualizzare la grafica bitmap generata dall interfaccia GUI di SunVTS 2 Attivare la visualizzazione in modo remoto Sul sistema di visualizzazione digitare quanto segue usr openwin bin xhost test sistema In questa stringa test sistema indica il nome del server Sun Fire V440 su cui vengono eseguiti i test 3 Eseguire il login in modo remoto al server Sun Fire V440 come superutente Utilizzare un comando come rlogin o telnet 4 Avvi
58. per le impostazioni delle variabili di configurazione OpenBoot della console di sistema a pagina 207 174 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 TABELLA A 1 Metodi di comunicazione con il sistema Continua Durante Dopo Vinstallazio l installazio Dispositivi di accesso alla console di sistema disponibili ne ne Una linea Ethernet collegata alla porta di gestione della rete v NET MGT Vedere e Attivazione della porta di gestione di rete a pagina 189 Un monitor grafico locale scheda frame buffer schermo grafico v mouse e cosi via Vedere e Accesso alla console di sistema mediante un monitor grafico a pagina 203 e Riferimento per le impostazioni delle variabili di configurazione OpenBoot della console di sistema a pagina 207 Al termine dell installazione iniziale del sistema possibile reindirizzare la console di sistema in modo che utilizzi la porta seriale ttyb per la ricezione dell input e l invio dell output Funzioni della console di sistema La console di sistema visualizza i messaggi di errore e di stato generati dai test basati sul firmware eseguiti all avvio del sistema Al termine dell esecuzione di tali test possibile inserire comandi particolari che hanno effetto sul firmware e sul funzionamento del sistema Per ulteriori informazioni sui test eseguiti durante il processo di boot vedere Informazioni sulla d
59. presenza e lo stato delle ventole Ambientale Viene indicata la velocit delle ventole Interfacce di rete Logico Vengono indicati la presenza e lo stato dei dispositivi e vengono fornite informazioni sugli errori Capitolo 2 Diagnostica e processo di boot 39 TABELLA 2 7 Elementi monitorati mediante Sun Management Center Continua Dispositivo Categoria del monitorato dispositivo Informazioni fornite da Sun Management Center Schede PCI Fisico Viene indicata la presenza delle schede Alimentatori Fisico Vengono indicati la presenza e lo stato degli alimentatori Ambientale Vengono indicate le tensioni e le correnti rilevate nel sistema Rapporti sullo stato in Sun Management Center Per ciascun dispositivo installato su un server Sun Fire V440 monitorato Sun Management Center in grado di rilevare e indicare gli stati riportati nella TABELLA 2 8 TABELLA 2 8 Stati dei dispositivi rilevati da Sun Management Center Stato Significato Degraded Il dispositivo funziona a un livello di prestazioni inferiore a quello ottimale Error stato rilevato un problema Failure Predicted Le statistiche disponibili indicano l imminenza di un guasto al dispositivo Lost Comms Le comunicazioni tra Sun Management Center e il dispositivo in questione sono andate perse OK Il dispositivo funziona correttamente e non stato rilevato alcun problema Stopped Il dispositivo non in esecuzione Unknown Sun Management
60. procedure 4 e 5 se lo spazio non sufficiente Capitolo 6 Opzioni per la risoluzione dei problemi 125 4 Digitare il comando df k1 per identificare le ubicazioni con pi spazio df k1 Filesystem kbytes used avail capacity Mounted on dev dsk c1t0d0s0 832109 552314 221548 72 proc 0 0 0 0 proc fd 0 0 0 0 dev fd mnttab 0 0 0 0 etc mntab swap 3626264 16 362624 81 var run swap 3626656 408 362624 81 tmp dev dsk clt0d0s7 33912732 9 33573596 1 export home 5 Digitare il comando dumpadm s per specificare un ubicazione per il file dump dumpadm s export home Dump content kernel pages Dump device dev dsk c3t5d0s1 swap Savecore directory export home Savecore enabled yes Il comando dumpadm s consente di specificare l ubicazione per il file di swap Per ulteriori informazioni vedere la pagina man dumpadm 1M Verifica della configurazione del core dump Prima di inserire il sistema in un ambiente di produzione potrebbe essere utile verificare se la configurazione del core dump corretta Questa procedura pu richiedere alcuni minuti a seconda della quantit di memoria installata Operazioni preliminari Eseguire una copia di backup di tutti i dati e accedere alla console di sistema Per informazioni vedere m Informazioni sulla comunicazione con il sistema a pagina 174 126 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio
61. si installa questo strumento durante la configurazione iniziale del sistema si evita di dover installare lo strumento in un secondo momento e spesso in un momento non opportuno Sia Sun Install Check Tool con Sun Explorer Data Collector in dotazione che Sun Explorer Data Collector standalone sono disponibili all indirizzo http sunsolve sun com Su questo sito fare clic sul collegamento appropriato Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 Informazioni su Sun Remote Services Net Connect collegamento in rete ai servizi remoti Sun Sun Remote Services SRS Net Connect una raccolta di servizi per la gestione del sistema progettati per favorire un controllo migliore dell ambiente di elaborazione Questi servizi forniti sul Web consentono di monitorare i sistemi creare rapporti sulle prestazioni e sulle tendenze e ricevere notifiche automatiche relative agli eventi del sistema Questi servizi consentono di agire pi rapidamente quando si verifica un evento del sistema e di gestire possibili difficolt prima che diventino veri e propri problemi Ulteriori informazioni su SRS Net Connect sono disponibili all indirizzo http www sun com service support srs netconnect Informazioni sulla configurazione del sistema per la risoluzione dei problemi I guasti del sistema sono caratterizzati da determinati sintomi Ogni sintomo pu essere collegato a uno o pi problemi o c
62. solo sulla gestione da parte del sistema di determinati tipi di guasti ma anche sulla risoluzione da parte dell utente di alcuni problemi 120 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 Per le attivita quotidiane abilitare la funzione ASR impostando le variabili di configurazione OpenBoot come indicato nella TABELLA 6 1 TABELLA 6 1 Impostazioni delle variabili di configurazione OpenBoot per l attivazione del ripristino automatico del sistema ASR Variabile Impostazione auto boot true auto boot on error true diag level max diag switch true diag trigger all resets post trigger all resets diag device Impostare il valore boot device Questo tipo di configurazione del sistema garantisce l esecuzione automatica dei test diagnostici quando si verificano errori hardware e software gravi Con questa configurazione della funzione ASR possibile risparmiare tempo durante la diagnosi dei problemi in quanto i risultati dei test diagnostici POST e OpenBoot sono gi disponibili dopo che il sistema ha riscontrato un errore Per ulteriori istruzioni e informazioni sull attivazione e il funzionamento di ASR vedere la documentazione Server Sun Fire V440 Guida di amministrazione Funzioni remote per la risoluzione dei problemi possibile utilizzare il controller di sistema Sun Advanced Lights Out Manager ALOM per la risoluzione dei problemi e la diagnosi del sistema r
63. system is coming down Please wait System services are now being stopped Print services stopped May 9 14 49 18 Sun SFV440 a last message repeated 1 time May 9 14 49 38 Sun SFV440 a syslogd going down on signal 15 142 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 CODICE DI ESEMPIO 7 7 Output del comando consolehistory run v Continua The system is down syncing file systems done Program terminated 1 ok boot disk Sun Fire V440 No Keyboard Copyright 1998 2003 Sun Microsystems Inc All rights reserved OpenBoot 4 10 3 4096 MB memory installed Serial 53005571 Ethernet address 0 3 ba 28 cd 3 Host ID 8328cd03 Initializing 1MB of memory at addr 123fecc000 Initializing 1MB of memory at addr 123fe02000 Initializing 14MB of memory at addr 123 002000 Initializing 16MB of memory at addr 123e002000 Initializing 992MB of memory at addr 1200000000 Initializing 1024MB of memory at addr 1000000000 Initializing 1024MB of memory at addr 200000000 Initializing 1024MB of memory at addr 0 Rebooting with command boot disk Boot device pci 1f 700000 scsi 2 disk 0 0 File and args SunOS Release 5 8 Version Generic 114696 04 64 bit Copyright 1983 2003 Sun Microsystems Inc All rights reserved Hardware watchdog enabled Indicator SYS_FRONT ACT is now ON configuring IPv4 interfaces ce0 Hostname Sun SFV440 a The system is coming up
64. test diagnostici POST e OpenBoot Il CODICE DI ESEMPIO 7 8 mostra i messaggi di boot restituiti dai test POST Tenere presente che i test POST non hanno restituito alcun messaggio di errore Per un esempio di messaggio di errore POST e ulteriori informazioni sui tali messaggi vedere Informazioni fornite dai messaggi di errore POST a pagina 11 CODICE DI ESEMPIO 7 8 Output del comando consolehistory boot v messaggi di boot restituiti da POST Keyswitch set to diagnostic position OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 Clearing TLBs Power On Reset Executing Power On SelfTest 0 gt Sun Fire TM V440 POST 4 10 3 2003 05 04 22 08 export work staff firmware re post post build 4 10 3 Fiesta chalupa integrated firmware re 0 gt Hard Powerup RST thru SW 0 gt CPUs present in system 0 1 144 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 CODICE DI ESEMPIO 7 8 Output del comando consolehistory boot v messaggi di boot restituiti da POST Continua O gt OBP gt POST Call with 00 00000000 01012000 O gt Diag level set to MIN O gt MFG scrpt mode set NORM 0 gt I O port set to TTYA O gt Start selftest 1 gt Print Mem Config 1 gt Caches Icache is ON Dcache is ON Wcache is ON Pcache is ON 1 gt Memory interleave set to 0 1 gt Bank 0 1024MB 00000010 00000000 gt 00000010 40000000 1 gt Bank 2 1024MB 00000012 00000000 gt 00000012 400000
65. true ok setenv auto boot true Digitare quanto segue In questo modo il sistema operativo verr riavviato automaticamente dopo le operazioni di ripristino e i cicli di spegnimento e accensione futuri Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 8 Per eseguire il reboot del sistema digitare quanto segue ok reset all Quando la variabile auto boot viene impostata su true il sistema memorizza le impostazioni delle variabili di configurazione OpenBoot ed esegue automaticamente il boot Operazioni successive Sostituire le unita FRU indicate negli eventuali messaggi di errore dei test diagnostici OpenBoot Per istruzioni sulle modalita di sostituzione delle FRU consultare la documentazione m Sun Fire V440 Parts Installation and Removal Guide Capitolo 3 Isolamento delle parti danneggiate 77 Visualizzazione dei risultati dei test diagnostici Un riepilogo dei risultati degli ultimi test diagnostici all accensione POST e dei test diagnostici OpenBoot viene salvato durante i cicli di accensione e spegnimento del sistema Operazioni preliminari Eseguire il login alla console di sistema e accedere al prompt ok Per istruzioni vedere m Accesso al prompt ok a pagina 186 Operazioni da eseguire Per visualizzare un riepilogo dei risultati degli ultimi test diagnostici POST digitare quanto segue ok show post results Per visualizzar
66. 0 Riferimento POST all ID fisico e al banco logico 1 gt H W under test CPU3 B0 D1 30602 side 1 Bank 1 CPU Module C3 Per configurare la memoria del sistema necessario sapere cosa si intende per banchi di memoria fisici necessario installare coppie di moduli DIMM con la stessa capacit e dello stesso tipo all interno di ciascun banco fisico Nelle sezioni riportate di seguito vengono fornite informazioni sulla modalit di identificazione della memoria Identificatori fisici Sulla scheda a circuiti di ciascun modulo CPU memoria sono presenti etichette protette che identificano in modo univoco ciascun modulo DIMM installato Il formato di ciascuna etichetta il seguente Bx Dy Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 In questa stringa x indica il banco fisico e y rappresenta il numero del modulo DIMM all interno del banco Inoltre sulla scheda a circuiti presente un numero J protetto che identifica in modo univoco ciascuno slot DIMM Tuttavia il numero dello slot risulta visibile solo se il modulo DIMM non inserito Se viene individuato un errore di memoria in seguito all esecuzione dei test POST nel relativo messaggio viene specificato l ID fisico del modulo DIMM danneggiato e il numero J dello slot di tale modulo rendendo pi semplice l identificazione delle parti da sostituire Nota Per garantire la compatibilit e ottenere
67. 00 O gt Print Mem Config 0 gt Caches Icache is ON Dcache is ON Wcache is ON Pcache is ON O gt Memory interleave set to 0 0 gt Bank 0 1024MB 00000000 00000000 gt 00000000 40000000 0 gt Bank 2 1024MB 00000002 00000000 gt 00000002 40000000 O gt INFO 0 gt POST Passed all devices 0 gt POST Return to OBP Il CODICE DI ESEMPIO 7 9 mostra l inizializzazione di OpenBoot PROM CODICE DI ESEMPIO 7 9 Output del comando consolehistory boot v inizializzazione di OpenBoot PROM Keyswitch set to diagnostic position OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 Clearing TLBs POST Results Cpu 0000 0000 0000 0000 00 0000 0000 0000 0000 01 ffff ffff 00a 2b73 02 ffff ffff ffff ffrff POST Results Cpu 0000 0000 0000 0001 00 0000 0000 0000 0000 o1 fFfff ffff 00a 2b73 02 ffff ffff ffff frfrff Membase 0000 0000 0000 0000 MemSize 0000 0000 0004 0000 Init CPU arrays Done Probing pci 1d 700000 Device 1 Nothing there Probing pci 1d 700000 Device 2 Nothing there Nel seguente output di esempio viene illustrata l intestazione del sistema CODICE DI ESEMPIO 7 10 Output del comando consolehistory boot v visualizzazione dell intestazione del sistema Sun Fire V440 No Keyboard Copyright 1998 2003 Sun Microsystems Inc All rights reserved OpenBoot 4 10 3 4096 MB memory installed Serial 53005571 Ethernet address 0 3 ba 28 cd 3 Host ID 8328cd03 Capitolo 7 Risoluzione
68. 40 Parts Installation and Removal Guide Se i test diagnostici POST non rilevano alcun problema sebbene non sia possibile avviare il sistema provare a eseguire i test diagnostici interattivi OpenBoot Per informazioni vedere m Isolamento dei guasti mediante i test diagnostici interattivi OpenBoot a pagina 75 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Isolamento dei guasti mediante i test diagnostici interattivi OpenBoot Operazioni preliminari Eseguire il login alla console di sistema e accedere al prompt ok Per istruzioni vedere m Accesso al prompt ok a pagina 186 I test OpenBoot richiedono l accesso ad alcune risorse hardware utilizzate dal sistema operativo tali test non risultano pertanto affidabili se eseguiti successivamente a un blocco del sistema operativo o dopo l uso della sequenza di tasti L1 A Stop A necessario ripristinare sempre il sistema sia prima che dopo l esecuzione dei test diagnostici OpenBoot Di seguito vengono fornite le istruzioni per effettuare tale operazione Operazioni da eseguire Impostare la variabile di configurazione OpenBoot auto boot su false Digitare quanto segue ok setenv auto boot false Ripristinare oppure spegnere e riaccendere il sistema Richiamare i test diagnostici OpenBoot Digitare quanto segue ok obdiag Vengono visualizzati il prompt obdiag gt e il menu dei test illustrato nella
69. 56MB fi 48 0 2GB O 49 0 2GB Memory Module Groups ControllerID GroupID Labels Status 0 0 C0 P0 B0 DO 0 0 C0 P0 B0 DI1 bes 3 0 C3 P0 B0 DI1 Se si utilizza l opzione verbose v del comando prtdiag vengono restituite anche le informazioni sullo stato del pannello principale dei dischi e delle ventole nonch sugli alimentatori sulle revisioni hardware e sulle temperature del sistema CODICE DI ESEMPIO 2 10 Output dell opzione Verbose del comando prtdiag Temperature sensors Location Sensor Temperature Lo LoWarn HiWarn Hi Status SCSIBP T_AMB 26C SLIG oc 65C 75C okay co PO T_CORE 55C 10C oc 97C 102C okay Capitolo 2 Diagnostica e processo di boot 29 30 Se viene rilevata una condizione di surriscaldamento il comando prtdiag restituisce un messaggio di errore warning o failednella colonna Status CODICE DI ESEMPIO 2 11 Output con indicazione di surriscaldamento del comando prtdiag Temperature sensors Location Sensor Temperature Lo LoWarn HiWarn Hi Status SCSIBP T_AMB 26C 11C oc 65C 75C okay C0 PO T_CORE 99C 10C oc 97C 102C failed Allo stesso modo se viene rilevato il guasto di un componente il comando prtdiag restituisce un errore nella colonna Status appropriata CODICE DI ESEMPIO 2 12 Output con indicazione di guasto del comando prtdiag Fan Status FT1 F0 FO failed 0 rpm Nell esempio seguente viene riportato il formato in cui viene visualizzato lo stato d
70. 86 Monitoraggio del sistema mediante Sun Management Center Il software Sun Management Center un prodotto flessibile in cui sono disponibili diverse funzioni e opzioni La modalit di utilizzo di tale strumento dipende dalle caratteristiche della rete e dalle specifiche esigenze e preferenze degli utenti necessario stabilire quale ruolo il sistema Sun Fire V440 deve svolgere all interno del dominio Sun Management Center Per ulteriori dettagli vedere Monitoraggio del sistema mediante Sun Management Center a pagina 39 Operazioni preliminari Questa procedura presuppone che si preveda di caricare il software per agenti di Sun Management Center sul sistema Sun Fire V440 in modo da poterne eseguire il monitoraggio Vengono inoltre fornite informazioni su come eseguire tale operazione Questa procedura presuppone anche che uno o pi computer siano stati o verranno impostati come server e console Sun Management Center I server e le console fanno parte dell infrastruttura che consente di eseguire il monitoraggio dei sistemi mediante l uso del software Sun Management Center Generalmente il software per server e console non viene installato sui sistemi Sun Fire V440 di cui si desidera eseguire il monitoraggio ma su altre macchine Per informazioni dettagliate vedere la documentazione m Sun Management Center Software User s Guide Per completare questa procedura necessario disporre della distribuzione originale del sof
71. 9 processor operates at 1280 MHz and has a sparcv9 floating point processor Comando showrev Il comando showrev consente di visualizzare le informazioni sulla revisione dell hardware e del software correnti Nel seguente CODICE DI ESEMPIO 2 17 viene riportato un possibile output restituito dal comando showrev CODICE DI ESEMPIO 2 17 Output del comando showrev Hostname wgs94 111 Hostid 83195f01 Release 5 8 Kernel architecture sun4u Application architecture sparc Hardware provider Sun Microsystems Domain Ecd East Sun COM Kernel version SunOS 5 8 chalupa28 _11 12 03 02 2002 root 12 03 02 SunOS Internal Development chalupa28 gate Se si utilizza l opzione p questo comando consente di visualizzare le patch installate Nel seguente CODICE DI ESEMPIO 2 18 viene riportato un possibile output parziale del comando showrev utilizzato con l opzione p Output del comando showrev p Patch 112663 01 Obsoletes Requires 108652 44 Incompatibles Packages SUNWxwplt Patch 111382 01 Obsoletes Requir Incompatibles Packages SUNWxwplt Patch 111626 02 Obsoletes Requir Incompatibles Packages SUNWolrte SUNWolslb Patch 111741 02 Obsoletes Requir Incompatibles Packages SUNWxwmod SUNWxwmox Patch 111844 02 Obsoletes Requir Incompatibles Packages SUNWxwopt Patch 112781 01 Obsoletes Requir Incompatibles Packages SUNWxwopt Patch 108714 07 Obsoletes Requir Incom
72. Al prompt sc gt digitare il comando reset o i comandi poweroff e poweron Richiede che la variabile di configurazione input devi ce OpenBoot sia impostata su keyboard Per ulteriori informazioni vedere Accesso alla console di sistema mediante un monitor grafico a pagina 203 e Riferimento per le impostazioni delle variabili di configurazione OpenBoot della console di sistema a pagina 207 Appendice A Configurazione della console di sistema 187 Uso della porta di gestione seriale In questa procedura si assume che la console di sistema sia diretta alle porte di gestione seriale e di rete configurazione predefinita Quando si accede alla console di sistema mediante un dispositivo collegato alla porta di gestione seriale il primo punto di accesso corrisponde al controller di sistema ALOM ed al relativo prompt sc gt Una volta eseguita la connessione al controller di sistema ALOM possibile passare alla console di sistema Per ulteriori informazioni sul controller di sistema ALOM vedere m Monitoraggio del sistema mediante Sun Advanced Lights Out Manager a pagina 38 m Monitoraggio del sistema mediante Sun Advanced Lights Out Manager a pagina 87 m Sun Advanced Lights Out Manager ALOM Online Help Operazioni preliminari Accertarsi che il dispositivo di connessione sia impostato sui seguenti parametri m 9600 baud a 8bit m Nessuna parit m lbit di stop m Nessun handshaking Operazioni da eseguire
73. Boot e false il sistema rimane sul prompt ok fino a quando non viene digitato il comando boot Determina il livello o il tipo di diagnostica eseguito L impostazione predefinita min e off non viene eseguito alcun test e min vengono eseguiti solo i test di base e max possibile che vengano eseguiti test pi approfonditi in base al dispositivo In particolare viene eseguito un controllo completo della memoria Determina i dispositivi su cui verranno eseguiti i test OpenBoot Diagnostics L impostazione predefinita none e none i test non vengono eseguiti su alcun dispositivo e normal i test vengono eseguiti sui dispositivi su scheda basati su scheda madre con funzioni di diagnostica automatica e all itest vengono eseguiti su tutti i dispositivi con funzioni di diagnostica automatica Attiva e disattiva la modalit diagnostica del sistema e seleziona il dispositivo e il file di boot L impostazione predefinita false e true i test diagnostici POST e i test OpenBoot Diagnostics vengono eseguiti se le condizioni post trigger e obdiag trigger vengono soddisfatte Il boot del sistema viene eseguito mediante i parametri diag device e diag file e false i test diagnostici POST e i test OpenBoot Diagnostics non vengono eseguiti anche se vengono soddisfatte le condizioni post trigger e obdiag trigger Il boot del sistema viene eseguito mediante i parametri boot device e boot file NOTA possibile attivare la
74. Bs POST Results Cpu 0000 0000 0000 0000 00 0000 0000 0000 0000 01 fFfff ffff 00a 2b73 02 ffff ffff ffff ffrff POST Results Cpu 0000 0000 0000 0001 00 0000 0000 0000 0000 01 fFfff ffff 00a 2b73 02 ffff ffff ffff frfrff Membase 0000 0000 0000 0000 MemSize 0000 0000 0004 0000 Init CPU arrays Done Probing pci 1d 700000 Device 1 Nothing there Probing pci 1d 700000 Device 2 Nothing there Capitolo 7 Risoluzione dei problemi hardware 157 Nel seguente output di esempio viene illustrata l intestazione del sistema CODICE DI ESEMPIO 7 23 Output del comando consolehistory boot v visualizzazione dell intestazione del sistema Sun Fire V440 No Keyboard Copyright 1998 2003 Sun Microsystems Inc All rights reserved OpenBoot 4 10 3 4096 MB memory installed Serial 53005571 Ethernet address 0 3 ba 28 cd 3 Host ID 8328cd03 Nel seguente output di esempio vengono illustrati i test diagnostici OpenBoot Per un esempio di messaggio di errore dei test diagnostici OpenBoot e ulteriori informazioni sui tali messaggi vedere Informazioni fornite dai messaggi di errore OpenBoot Diagnostics a pagina 21 CODICE DI ESEMPIO 7 24 Output del comando consolehistory boot v test diagnostici OpenBoot Running diagnostic script obdiag normal Testing pci 1 700000 network 1 Testing pci le 600000 ide d Testing pci le 600000 isa 7 flashprom 2 0 Testing pci le 600000 isa 7 serial 0 2e8 Testing pci le
75. CE keyswitch change event state UNKNOWN May 9 14 52 57 Sun SFV440 a rmclomv Keyswitch Position has changed to Unknown state May 9 14 52 58 Sun SFV440 a rmclomv NOTICE keyswitch change event state LOCKED May 9 14 52 58 Sun SFV440 a rmclomv KeySwitch Position has changed to Locked State May 9 14 53 00 Sun SFV440 a rmclomv NOTICE keyswitch change event state NORMAL May 9 14 53 01 Sun SFV440 a rmclomv KeySwitch Position has changed to On State sc gt 3 Esaminare il log di boot ALOM Digitare quanto segue sc gt consolehistory boot v Il log di boot ALOM contiene messaggi di boot restituiti dai test POST dal firmware OpenBoot e dal software Solaris dopo l ultimo ripristino del server Quando si esamina l output per identificare un problema verificare i messaggi di errore restituiti dai test diagnostici POST e OpenBoot Il CODICE DI ESEMPIO 7 21 mostra i messaggi di boot restituiti dai test POST Tenere presente che POST non ha restituito alcun messaggio di errore Per un esempio di messaggio di errore POST e ulteriori informazioni sui tali messaggi vedere Informazioni fornite dai messaggi di errore POST a pagina 11 CODICE DI ESEMPIO 7 21 Output del comando consolehistory boot v messaggi di boot restituiti da POST Keyswitch set to diagnostic position OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 Clearing TLBs Power On Reset 156 Server Sun Fire V440 Guida a
76. Capitolo 2 Diagnostica e processo di boot 51 TABELLA 2 12 Descrizione dei test OpenBoot Diagnostics In questa sezione viene fornita una descrizione dei test e dei comandi OpenBoot Diagnostics disponibili Per informazioni di base sull uso di tali test vedere Fase 2 test OpenBoot Diagnostics a pagina 17 Test nel menu OpenBoot Diagnostics Nome test Funzione FRU interessata flashprom 2 0 i2c 0 320 ide d network 1 network 2 rmc comm 0 3e8 rtc 0 70 scsi 2 scsi 2 1 serial 0 3 8 serial 0 2e8 usb a usb b Esegue un test della somma di controllo sulla PROM di boot Esegue il test del sottosistema di monitoraggio ambientale I2C che include diversi sensori della temperatura e altri sensori presenti sulla scheda madre e su altre unit FRU Esegue il test del controller IDE su scheda e del sottosistema del bus IDE che controlla l unit DVD ROM Esegue il test del controller Ethernet su scheda mediante test di loopback interni Pu anche eseguire test di loopback esterni ma solo se installato un connettore di loopback non fornito Svolge le stesse funzioni del test precedente per l altro controller Ethernet su scheda Esegue il test delle comunicazioni con il controller di sistema ALOM e richiede l esecuzione della diagnostica ALOM Esegue il test dei registri del clock in tempo reale e ne verifica il funzionamento Esegue il test delle unit disco SCSI intern
77. Center non in grado di determinare lo stato del dispositivo 40 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Modalita di funzionamento di Sun Management Center Il prodotto Sun Management Center comprende tre componenti software m Livello agenti m Livello server m Livello console necessario installare i moduli del livello agenti sui sistemi da monitorare Tali moduli raccolgono le informazioni sullo stato del sistema dai file di log dalle strutture ad albero dei dispositivi e dalle origini specifiche della piattaforma e le inviano al componente server Il livello server gestisce un database di grandi dimensioni in cui sono contenute le informazioni sullo stato di una vasta gamma di piattaforme Sun In questo database aggiornato frequentemente sono presenti informazioni su schede unit nastro alimentatori e dischi nonch sui parametri del sistema operativo quali quelli relativi al carico all uso delle risorse e allo spazio su disco possibile creare soglie di allarme specifiche e fare in modo che ne venga segnalato l eventuale superamento Il livello console consente di visualizzare i dati raccolti in un formato standard Il software Sun Management Center fornisce un interfaccia grafica per l utente GUI Graphical User Interface standalone un interfaccia della riga di comando CLI Command Line Interface Java nonch un interfaccia basata su browser Web Le inte
78. Configurazione della console di sistema 201 Operazioni da eseguire 1 Aprire una finestra Shell Tool 2 Digitare quanto segue eeprom grep ttyb mode Deve essere restituito il seguente output ttyb mode 9600 8 n 1 Questa riga di codice indica che la porta seriale del server Sun Fire V440 configurata come segue 9600 baud 8 bit Nessuna parita 1 bit di stop Nessun protocollo di sincronizzazione Operazioni successive Per ulteriori informazioni sulle impostazioni della porta seriale vedere la pagina man eeprom Per istruzioni relative all impostazione delle variabili di configurazione OpenBoot vedere m Visualizzazione e impostazione delle variabili di configurazione OpenBoot a pagina 60 202 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Accesso alla console di sistema mediante un monitor grafico Operazioni preliminari In seguito all installazione iniziale possibile installare un monitor grafico locale e impostarlo per accedere alla console di sistema Non possibile utilizzare un monitor grafico locale per eseguire l installazione iniziale del sistema n per visualizzare i messaggi dei test diagnostici all accensione POST Per informazioni dettagliate sulle opzioni della console di sistema vedere m Informazioni sulla comunicazione con il sistema a pagina 174 Per installare un monitor grafico locale nec
79. ED L eccezione provoca una perdita d integrita del sistema che metterebbe a repentaglio il sistema qualora il software Solaris continuasse a funzionare Per questo motivo il software Solaris si arresta in modo anomalo senza registrare alcun dettaglio dell errore di 134 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 eccezione dello stato RED nel file var adm messages I CODICE DI ESEMPIO 7 2 mostra un esempio di avviso di eccezione dello stato RED proveniente dalla console di sistema CODICE DI ESEMPIO 7 2 Avviso di eccezione dello stato RED Sun SFV440 a console login RED State Exception Error enable reg 0000 0001 00 0 001 ECCR 0000 0000 02f0 4c00 CPU 0000 0000 0000 0002 TL 0000 0000 0000 0005 TT 0000 0000 0000 0010 TPC 0000 0000 0100 4200 TnPC 0000 0000 0100 4204 MTSTATE 0000 0044 8200 1507 TL 0000 0000 0000 0004 TT 0000 0000 0000 0010 TPC 0000 0000 0100 4200 TnPC 0000 0000 0100 4204 TSTATE 0000 0044 8200 1507 TL 0000 0000 0000 0003 TT 0000 0000 0000 0010 TPC 0000 0000 0100 4680 TnPC 0000 0000 0100 4684 TSTATE 0000 0044 8200 1507 TL 0000 0000 0000 0002 TT 0000 0000 0000 0034 TPC 0000 0000 0100 7164 TnPC 0000 0000 0100 7168 MTSTATE 0000 0044 8200 1507 TL 0000 0000 0000 0001 TT 0000 0000 0000 004e TPC 0000 0001 0001 fd24 TnPC 0000 0001 0001 fd28 MTSTATE 0000 0000 8200 1207 SC Alert Host System has Reset SC Alert Host System has read
80. MINATO SCOPO O NON VIOLAZIONE FATTA ECCEZIONE PER LE GARANZIE PREVISTE DALLA LEGGE KA Adobe PostScript Sommario Prefazione xi Parte I Diagnostica 1 Panoramica sugli strumenti diagnostici 1 Gamma di strumenti 2 2 Diagnostica e processo di boot 7 Informazioni sulla diagnostica e sul processo di boot 8 Prologo boot del controller di sistema 9 Fase 1 firmware OpenBoot e POST 9 Fase 2 test OpenBoot Diagnostics 17 Fase 3 ambiente operativo 25 Riepilogo degli strumenti disponibili e del processo di boot 34 Informazioni su come isolare i guasti nel sistema 35 Informazioni sul monitoraggio del sistema 37 Monitoraggio del sistema mediante Sun Advanced Lights Out Manager 38 Monitoraggio del sistema mediante Sun Management Center 39 Informazioni sull analisi del sistema 43 Analisi del sistema mediante il software SunVTS 44 Analisi del sistema mediante Hardware Diagnostic Suite 46 Sommario iii Identificazione dei moduli di memoria 48 Identificatori fisici 48 Banchi logici 49 Corrispondenza tra banchi logici e fisici 50 Identificazione dei moduli CPU memoria 51 Descrizione dei test OpenBoot Diagnostics 52 Riferimenti per la decodifica dei messaggi dei test diagnostici 2C 54 Riferimenti per la terminologia negli output dei test diagnostici 56 3 Isolamento delle parti danneggiate 59 Visualizzazione e impostazione delle variabili di configurazione OpenBoot 60 Uso del LED di localizzazione 61 Impostazione del sistema in m
81. Model pei 66 MB pcil08e abba network SUNW pci ce pei 33 MB isa su serial pei 33 MB isa su serial 0 0 C0 P0 B0 DO C0 P0 B0 DI1 0 1 CO P0 B1 D0 C0 P0 B1 D1 160 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 CODICE DI ESEMPIO 7 27 Output del comando prtdiag v Continua System PROM revisions OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 OBDIAG 4 10 3 2003 05 02 20 26 i 8 Verificare che tutti i processi dell utente e del sistema funzionino Digitare quanto segue ps ef Nell output restituito dal comando ps ef vengono illustrati tutti i processi l ora di inizio il tempo di esecuzione e le opzioni complete della riga di comando del processo Per identificare un problema del sistema esaminare l output per individuare voci mancanti nella colonna CMD Il CODICE DI ESEMPIO 7 28 mostra l output del comando ps ef di un server Sun Fire V440 correttamente funzionante CODICE DI ESEMPIO 7 28 Output del comando ps ef UID root root root root root root root root userl root root root root root root root root root root root daemon root root root root root root PID PPID C STIME TTY TIME CMD 0 0 0 14 51 32 0 17 sched 1 0 0 14 51 32 0 00 etc init 2 0 0 14 51 32 0 00 pageout 3 0 0 14 51 32 0 02 fsflush 291 1 0 14 51 47 0 00 usr lib saf sac t 300 205 1 0 14 51 44 0 00 usr lib lpsched 312 148 0 14 54 33
82. ODICE DI ESEMPIO 7 30 iostat E riporta Hard Errors 2 per il dispositivo di I O sdo 162 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 CODICE DI ESEMPIO 7 30 Output del comando iostat E sdo Soft Errors 0 Hard Errors 2 Transport Errors 0 Vendor TOSHIBA Product DVD ROM SD C2612 Revision 1011 Serial No 04 17 02 Size 18446744073 71GB lt 1 bytes gt Media Error 0 Device Not Ready 2 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 sdl Soft Errors 0 Hard Errors 0 Transport Errors 0 Vendor SEAGATE Product ST336607LSUN36G Revision 0207 Serial No 3JA0BW6Y00002317 Size 36 42GB lt 36418595328 bytes gt Media Error 0 Device Not Ready 0 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 sd2 Soft Errors 0 Hard Errors 0 Transport Errors 0 Vendor SEAGATE Product ST336607LSUN36G Revision 0207 Serial No 3JA0BRQJ00007316 Size 36 42GB lt 36418595328 bytes gt Media Error 0 Device Not Ready 0 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 sd3 Soft Errors 0 Hard Errors 0 Transport Errors 0 Vendor SEAGATE Product ST336607LSUN36G Revision 0207 Serial No 3JA0BWL000002318 Size 36 42GB lt 36418595328 bytes gt Media Error 0 Device Not Ready 0 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 sd4 Soft Errors 0 Hard Errors 0 Transport Errors 0
83. POK OK 4 Digitare il comando showfru sc gt showfru In modo analogo al comando prtfru c dell ambiente operativo Solaris questo comando visualizza le informazioni per l identificazione delle unit FRU statiche disponibili per diverse unit FRU del sistema Le informazioni fornite comprendono la data e il luogo di produzione e il numero di parte Sun CODICE DI ESEMPIO 4 7 Rapporti ALOM sulle informazioni per l identificazione delle unit FRU FRU_PROM at PSO SEEPROM Timestamp MON SEP 16 16 47 05 2002 Description PWR SUPPLY CHALUPA 75 EFF H P Manufacture Location DELTA ELECTRONICS CHUNGLI TAIWAN Sun Part No 3001501 Sun Serial No T00065 Vendor JDEC code 3AD Initial HW Dash Level 01 Initial HW Rev Level 02 Shortname PS Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 5 Digitare il comando showlogs sc gt showlogs Questo comando mostra uno storico degli eventi del sistema degni di nota gli eventi pi recenti vengono riportati per ultimi CODICE DI ESEMPIO 4 8 ALOM Rapporti sugli eventi registrati FEB 28 19 45 06 host utente 0006001la SC Host Watchdog Reset Disabled FEB 28 19 45 06 host utente 00060003 SC System booted FEB 28 19 45 43 host utente 00060000 SC Login User admin Logged on FEB 28 19 45 51 host utente 0004000e SC Request to Power Off Host Immediately FEB 28 19 45 55 host_utente 00040002 Host Syste
84. Pin 3 TXD Pin 3 RXD Pin 4 Signal Ground Pin 4 Signal Ground Pin 5 Signal Ground Pin 5 Signal Ground Pin 6 RXD Pin 6 TXD Pin 7 DSR DCD Pin 7 DTR Pin 8 CTS Pin 8 RTS 192 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 2 Aprire una sessione di terminale sul dispositivo da collegare e digitare telnet indirizzo IP del server terminal numero porta Per esempio nel caso di un server Sun Fire V440 collegato alla porta 10000 di un server terminal con indirizzo IP 192 20 30 10 necessario digitare quanto segue telnet 192 20 30 10 10000 3 Se si desidera utilizzare ttyb anzich la porta di gestione seriale effettuare quanto segue a Reindirizzare la console di sistema modificando le variabili di configurazione OpenBoot Al prompt ok digitare i seguenti comandi ok setenv input device ttyb ok setenv output device ttyb Nota possibile accedere al prompt sc gt e visualizzare i messaggi POST solo dalla porta di gestione seriale o dalla porta di gestione di rete Nota Sono disponibili molte altre variabili di configurazione OpenBoot Sebbene tali variabili non incidano sul dispositivo hardware utilizzato per accedere alla console di sistema alcune determinano i test diagnostici eseguiti dal sistema e i messaggi visualizzati sulla console di sistema Per informazioni dettagliate vedere Controllo della diagnostica POST a p
85. Please wait NIS domainname is Ecd East Sun COM Starting IPv4 router discovery starting rpc services rpcbind keyserv ypbind done Setting netmask of 100 to 255 0 0 0 Setting netmask of ce0 to 255 255 255 0 Setting default IPv4 interface for multicast add net 224 0 4 gateway Sun SFV440 a syslog service starting Print services started volume management starting The system is ready Capitolo 7 Risoluzione dei problemi hardware 143 CODICE DI ESEMPIO 7 7 Output del comando consolehistory run v Continua Sun SFV440 a console login May 9 14 52 57 Sun SFV440 a rmclomv NOTICE keyswitch change event state UNKNOWN May 9 14 52 57 Sun SFV440 a rmclomv Keyswitch Position has changed to Unknown state May 9 14 52 58 Sun SFV440 a rmclomv NOTICE keyswitch change event state LOCKED May 9 14 52 58 Sun SFV440 a rmclomv KeySwitch Position has changed to Locked State May 9 14 53 00 Sun SFV440 a rmclomv NOTICE keyswitch change event state NORMAL May 9 14 53 01 Sun SFV440 a rmclomv KeySwitch Position has changed to On State sc gt 3 Esaminare il log di boot ALOM Digitare quanto segue sc gt consolehistory boot v Il log di boot ALOM contiene messaggi di boot restituiti dai test POST dal firmware OpenBoot e dal software Solaris dopo l ultimo ripristino del server Quando si esamina l output per identificare un problema verificare i messaggi di errore restituiti dai
86. Size Implementation Mask Status Location O 1281 MHz 1MB SUNW UltraSPARC IIli 2 3 online 1 1281 MHz 1MB SUNW UltraSPARC IITi 2 3 online gt 2 1281 MHz 1MB SUNW UltraSPARC IIli 2 3 online 3 1281 MHz 1MB SUNW UltraSPARC IIli 2 3 online IO Devices Bus Freq Slot Name Type MHz Status Path Model pei 66 MB pcil08e abba network SUNW pci ce okay pci lc 600000 network 2 pei 33 MB isa su serial okay pci le 600000 isa 7 serial 0 3 8 pei 33 MB isa su serial okay pci le 600000 isa 7 serial 0 2e8 pci 66 MB pcil08e abba network SUNW pci ce okay pci 1f 700000 network 1 pei 66 MB scsi pcil000 30 scsi 2 LSI 1030 okay pci 1 700000 scsi 2 Il comando prtdiag genera una grande quantit di output sulla configurazione della memoria del sistema Di seguito viene riportato un altro estratto 28 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 CODICE DI ESEMPIO 2 9 Output del comando prtdiag sulla configurazione della memoria Memory Configuration Base Address Size Interleave Factor Contains 0x0 4GB 16 BankIDs 0 1 2 3 15 0x1000000000 4GB 16 BankIDs 16 17 18 31 0x2000000000 4GB 16 BankIDs 32 33 34 47 0x3000000000 4GB 2 BankIDs 48 49 Bank Table Physical Location ID ControllerID GroupID Size Interleave Way 0 0 256MB O Ly259 15 1 0 2
87. T a pagina 73 Isolamento dei guasti mediante i test diagnostici interattivi OpenBoot a pagina 75 m Visualizzazione dei risultati dei test diagnostici a pagina 78 In questo capitolo sono incluse anche le seguenti sezioni m Informazioni su come scegliere uno strumento per l isolamento dei guasti a pagina 79 Per informazioni di base sugli strumenti disponibili vedere m Informazioni su come isolare i guasti nel sistema a pagina 35 59 Nota Molte delle procedure descritte in questo capitolo presuppongono una conoscenza di base del firmware OpenBoot e della modalita di accesso al prompt ok Per informazioni di base vedere Informazioni sul prompt ok a pagina 181 Per istruzioni vedere Accesso al prompt ok a pagina 186 Visualizzazione e impostazione delle variabili di configurazione OpenBoot Le istruzioni switch e le variabili di configurazione OpenBoot memorizzate nella scheda di configurazione del sistema determinano le modalita e i tempi di esecuzione dei test diagnostici all accensione POST e dei test OpenBoot In questa sezione viene descritto come accedere alle variabili di configurazione OpenBoot e come modificarle Per un elenco delle principali variabili di configurazione OpenBoot vedere la TABELLA 2 1 Operazioni preliminari Sospendere il software del sistema operativo del server per accedere al prompt ok Per informazioni vedere m Accesso al prompt ok a pagina 186 Operazioni da esegui
88. Unit FRU su cui agiscono gli strumenti di analisi del sistema FRU SunVTS Hardware Diagnostic Suite Scheda ALOM v Gruppo scheda del connettore Nessuno strumento Vedere la TABELLA 2 5 per suggerimenti sull isolamento dei guasti Modulo CPU memoria v y DIMM v y Unit disco y v Unita DVD ROM y Vano ventole 0 ventola CPU Nessuno strumento Vedere la TABELLA 2 10 per suggerimenti sull isolamento dei guasti Vano ventole 1 ventole CPU Nessuno strumento Vedere la TABELLA 2 10 per suggerimenti sull isolamento dei guasti Scheda madre y v Alimentatore v Piano posteriore SCSI y Lettore della scheda di Nessuno strumento Vedere la TABELLA 2 5 configurazione del sistema per suggerimenti sull isolamento dei guasti Scheda configurazione v del sistema Capitolo 2 Diagnostica e processo di boot 43 44 Alcune unita FRU non vengono isolate da alcuno strumento di analisi del sistema TABELLA 2 10 Unita FRU che non possibile isolare direttamente mediante gli strumenti di analisi del sistema FRU Suggerimenti per la diagnostica Gruppo scheda del connettore Vedere la TABELLA 2 5 Cavo unita DVD CD ROM Vedere la TABELLA 2 5 Vano ventole 0 ventola CPU Se questa unita FRU non funziona correttamente ALOM restituisce il seguente messaggio di avviso SC Alert PCI_FAN FTO Failed Vano ventole 1 ventola CPU Se questa unita FRU non funziona correttame
89. a Tale metodo provoca la perdita totale della coerenza e delle informazioni sullo stato del sistema L uso di tale metodo potrebbe danneggiare i file system del server i quali vengono tuttavia generalmente ripristinati mediante il comando fsck Si consiglia di utilizzare il ripristino manuale solo se non possibile utilizzare nessuno degli altri metodi descritti Attenzione L uso del ripristino manuale provoca una perdita dei dati sullo stato del sistema e deve essere utilizzato solo come ultima risorsa In seguito a un ripristino manuale del sistema tutte le informazioni di stato vengono perse impedendo l identificazione della causa del problema fino a quando tale problema non si verifica di nuovo Importante l accesso al prompt ok sospende l ambiente operativo Solaris importante tenere presente che quando si accede al prompt ok da un server Sun Fire V440 in esecuzione l ambiente operativo Solaris viene sospeso e il sistema viene sottoposto al controllo del firmware Vengono sospesi anche tutti i processi in esecuzione nell ambiente operativo ed possibile che lo stato di tali processi non possa essere ripristinato I test diagnostici e i comandi eseguiti dal prompt ok possono avere effetto sullo stato del sistema In alcuni casi potrebbe pertanto non essere possibile riprendere l esecuzione dell ambiente operativo dal punto in cui si verificata la sospensione Sebbene nella maggior parte dei casi sia possibile utilizzare il
90. a collegati al bus USB ok test all pci 1 700000 Nota I comandi OpenBoot Diagnostics non sono affidabili se eseguiti successivamente a un blocco del sistema in quanto in tal caso lo stato della memoria risulta imprevedibile In questo caso si consiglia di eseguire un ripristino del sistema prima di tali comandi Informazioni fornite dai messaggi di errore OpenBoot Diagnostics I messaggi di errore OpenBoot Diagnostics vengono riportati sotto forma di tabella in cui viene fornita una breve descrizione del problema vengono indicati il dispositivo hardware danneggiato e il test secondario non riuscito e vengono fornite ulteriori informazioni sulla diagnostica Nel seguente CODICE DI ESEMPIO 2 2 viene riportato un messaggio di errore OpenBoot Diagnostics indicante un guasto al controller IDE CODICE DI ESEMPIO 2 2 Messaggio di er rore OpenBoot Diagnostics Testing pci l DEVICE DEVICE ex MACHINE SERIAL DATE CONTROLS e 600000 ide d ERROR IDE device did not reset busy bit not set pci le 600000 ide d pci le 600000 ide d Sun Fire V44 51994289 0 11 28 2001 14 4 diag level min Error pci le 600000 ide d selftest failed return code 1 Selftest at pci le 600000 ide d errors 1 0 20 failed 16 21 GMT test args Capitolo 2 Diagnostica e processo di boot 21 22 Test dei dispositivi del bus I C Il test OpenBoot Diagnostics i2c 0 320 analizza i dispositivi d
91. a e alla risoluzione dei problemi Luglio 2003 CAPITOLO 3 Isolamento delle parti danneggiate La funzione principale degli strumenti diagnostici consiste nell isolare un componente hardware danneggiato al fine di poterlo rimuovere e sostituire con rapidita Poich i server sono macchine particolarmente complesse su cui possono verificarsi guasti di diversa natura non esiste un unico strumento in grado di isolare tutti i guasti hardware Sono tuttavia disponibili diversi strumenti Sun che consentono di individuare il componente da sostituire In questo capitolo vengono fornite le informazioni che consentono di scegliere gli strumenti migliori e viene descritto come utilizzare tali strumenti per individuare una parte danneggiata nel server Sun Fire V440 Viene inoltre indicato come utilizzare il LED di localizzazione per isolare un sistema guasto in una stanza in cui sono presenti numerosi altri sistemi Vengono descritte le seguenti operazioni m Visualizzazione e impostazione delle variabili di configurazione OpenBoot a pagina 60 Uso del LED di localizzazione a pagina 61 Impostazione del sistema in modalit diagnostica a pagina 63 Come ignorare i test diagnostici basati su firmware a pagina 64 Come ignorare temporaneamente i test diagnostici a pagina 66 Ottimizzazione dei test diagnostici a pagina 67 Isolamento dei guasti mediante l uso dei LED a pagina 69 Isolamento dei guasti mediante i test diagnostici POS
92. a il circuito integrato specifico DEVICE NAME SCSI probabilmente danneggiato Questo livello di isolamento dei guasti risulta particolarmente utile ai fini della riparazione 12 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Possibile implicazione di pi unit FRU in un errore POST Ciascun test viene eseguito a un livello talmente basso che i test diagnostici POST risultano spesso molto pi precisi nell indicazione dei dettagli relativi all errore ad esempio i valori numerici di risultati previsti e ottenuti di quanto non siano nella segnalazione dell unit FRU responsabile dell errore Si prenda ad esempio in considerazione il diagramma a blocchi di un percorso di dati all interno di un server Sun Fire V440 illustrato nella FIGURA 2 2 Bridge Dispositivo CPU O PCI Modulo Scheda madre CPU memoria FIGURA 2 2 Diagnostica POST eseguita sulle unit FRU La linea tratteggiata nella FIGURA 2 2 rappresenta un confine tra le unit FRU Si supponga che un test diagnostico POST venga eseguito nella CPU nella parte sinistra del diagramma e tenti di accedere ai registri in un dispositivo PCI presente nella parte destra del diagramma Se l accesso viene negato possibile che sia presente un guasto nel dispositivo PCI o con meno probabilit in uno dei percorsi di dati o componenti di accesso a tale dispositivo PCI I test diagnostici POST possono
93. ag v Vedere dal CODICE DI ESEMPIO 2 8 al CODICE DI ESEMPIO 2 13 per l output prtdiag v completo restituito da un server Sun Fire V440 correttamente funzionante CODICE DI ESEMPIO 7 14 Output del comando prtdiag v System Configuration Sun Microsystems sun4u Sun Fire V440 System clock frequency 177 MHZ Memory size 4GB Sessa css ee ee Soe alles pe Sella toltanto a tue uuont ES CPU CPU Temperature Fan CPU Freq Size Impl Mask Die Ambient Speed Unit 0 1062 MHz 1MB US IITi 2 3 1 1062 MHz 1MB US IITi 23 IO Devices Brd Type MHz Slot Name Model 0 pei 66 MB pcil08e abba network SUNW pci ce 0 pci 33 MB isa su serial 0 pci 33 MB isa su serial 0 0 C0 P0 B0 DO C0 P0 B0 DI 0 1 C0 P0 B1 DO C0 P0 B1 DI1 148 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 CODICE DI ESEMPIO 7 14 Output del comando prtdiag v Continua System PROM revisions OBDIAG 4 10 3 2003 05 02 20 26 OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 8 Verificare che tutti i processi dell utente e del sistema funzionino Digitare quanto segue ps ef Nell output restituito dal comando ps ef vengono illustrati tutti i processi l ora di inizio il tempo di esecuzione e le opzioni complete della riga di comando del processo Per identificare un problema del sistema esaminare l
94. agina 13 b Per rendere valide tali modifiche spegnere il sistema Digitare quanto segue ok power off Il sistema memorizza in modo permanente le modifiche ai parametri e si spegne Nota possibile spegnere il sistema anche utilizzando il pulsante di alimentazione del pannello principale Appendice A Configurazione della console di sistema 193 c Collegare il cavo seriale null modem alla porta ttyb sul server Sun Fire V440 Se necessario utilizzare l adattatore del cavo DB 9 o DB 25 fornito con il server d Accendere il sistema Per le procedure di accensione vedere la documentazione Server Sun Fire V440 Guida di amministrazione Operazioni successive Se necessario proseguire con l installazione o con l esecuzione dei test diagnostici Al termine chiudere la sessione digitando la sequenza di escape del server terminal e uscire dalla finestra Per ulteriori informazioni sul collegamento e l utilizzo del controller di sistema ALOM vedere m Sun Advanced Lights Out Manager ALOM Online Help Se la console di sistema stata reindirizzata a ttyb e si desidera ripristinare le impostazioni della console in modo che utilizzi le porte di gestione seriale e di rete vedere m Riferimento per le impostazioni delle variabili di configurazione OpenBoot della console di sistema a pagina 207 Accesso alla console di sistema mediante la connessione tip Operazioni preliminari In questa procedu
95. and cleared bootmode In alcuni casi isolati il software pu causare un errore irreversibile di ripristino o un eccezione dello stato RED Generalmente si tratta di problemi relativi al driver del dispositivo che possono essere identificati facilmente possibile ottenere queste informazioni tramite SunSolve Online vedere Siti Web a pagina 116 oppure contattando Sun o il fornitore di driver di terze parti Le informazioni pi importanti da tenere in considerazione durante la diagnosi di un errore irreversibile di ripristino o un eccezione dello stato RED sono Output della console di sistema al momento dell errore m Cronologia dei recenti servizi di manutenzione dei sistemi che riscontrano errori irreversibili di ripristino o eccezioni dello stato RED L acquisizione dei messaggi e delle indicazioni della console di sistema al momento dell errore consente di isolare la vera causa dell errore In alcuni casi la vera causa dell errore originario potrebbe essere dissimulata da indicazioni di errore false provenienti da un altra parte del sistema Ad esempio i risultati dei test POST indicati Capitolo 7 Risoluzione dei problemi hardware 135 136 dall output restituito dal comando prt diag potrebbero indicare componenti danneggiati quando di fatto i componenti danneggiati non sono la causa effettiva dell errore irreversibile di ripristino Nella maggior parte dei casi un componente idoneo riporter effettivamente l e
96. are Finestra Details igs97 95 Details Menu Views Viste fisica e logica Physical View system Logical View system Total Memory 4 0GB TaalProcessos SC 9 Eseguire il monitoraggio del sistema Sun Fire V440 utilizzando la vista fisica e la vista logica a Selezionare Physical View system dal menu Views La vista fisica consente di interagire con le viste fotorealistiche del sistema Sun Fire V440 frontale posteriore e dall alto Quando si selezionano i singoli componenti hardware e le singole funzioni le informazioni sullo stato e sulle proprieta del componente in questione vengono visualizzate sulla destra Wgs97 95 Info Browser Alarms Modules Applications Hardware Vista fotorealistica frontale mi il See ont 0 Refresh Devils Componente selezionato unit disco Views system Name disk Location HDDI Informazioni Description Hard disk drive 2nd 46m unita disco Operational Status OK Additional Info Availability Running Redundancy Status Physical Path c1t1d0 Type Fixed Disk Hard Error Count 0 Soft Error Count 3 Transport Error Count 0 sila Di K S o QEEPX 7 84 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 b Selezionare Logical View system dal menu Views La vista logica consente di sfogliare u
97. are e della configurazione del sistema determinati tipi di errori vengono catturati solo temporaneamente Pertanto necessario considerare e registrare tutte le informazioni disponibili immediatamente prima di tentare qualsiasi azione correttiva Ad esempio POST raggruppa un elenco di componenti danneggiati durante i ripristini Tuttavia le informazioni sui componenti danneggiati vengono definite dopo un ripristino del sistema In modo analogo lo stato dei LED in un sistema bloccato va perso quando si riavvia o si ripristina il sistema Se si riscontrano problemi del sistema con cui non si ha alcuna familiarit raccogliere pi informazioni possibili prima di tentare una qualsiasi azione di rimedio Nell elenco di attivit riportato di seguito viene descritto un approccio di base alla raccolta di informazioni m Raccogliere il maggior numero possibile di informazioni sugli errori messaggi e indicazioni di errore dal sistema Per ulteriori informazioni sulle origini dei messaggi e delle indicazioni di errore vedere Informazioni sugli errori dal controller di sistema ALOM a pagina 131 Informazioni sugli errori restituite da Sun Management Center a pagina 131 e Informazioni sugli errori restituite dal sistema a pagina 131 m Raccogliere il maggior numero possibile di informazioni sul sistema esaminando e verificando l ambiente operativo il firmware e la configurazione hardware del sistema Per analizzare in modo accurato i messagg
98. are il software SunVTS Digitare quanto segue opt SUNWvts bin sunvts display sistema visualizzazione 0 In questa stringa sistema visualizzazione indica il nome della macchina dalla quale stato eseguito il login in modo remoto al server Sun Fire V440 Se il software SunVTS stato installato in una directory diversa da quella predefinita ovvero opt modificare il percorso indicato nel comando precedente in modo appropriato Capitolo 5 Analisi del sistema 105 L interfaccia GUI di SunVTS viene visualizzata sullo schermo del sistema di visualizzazione SunVTS Diagnostic O Commands View Options Reports Scheduler Help Le ERRE l Start Log Meter Model Sun Fire V440 Testing status Hostname wgs97 9 System passes O Comulative errors O ElapsedTasttime 000 00 00 Last Option File gt AC Coverage no_coverage System map Physical Logical Select Devices Green Pass Red Fail Auto Config O USB Devices Exclusive C Online Default M Processor s None N Memory Call M Network C Intervention O Comm Ports O IDE Devices uatao Select Test Mode M OtherDevices Connection M SCSI Devices mpto Functional r_ CSI Devices mpt1 Ta Test messages 5 Pulsante Log Pulsanti Avvia e Interrompi Area di selezione dei test
99. associati all etichetta T_CORE calcolano le temperature interne dei chip del processore Nell output riportato nel CODICE DI ESEMPIO 4 1 MB si riferisce alla scheda madre e Cn a una determinata CPU Per informazioni sull identificazione dei moduli CPU vedere Identificazione dei moduli CPU memoria a pagina 51 Capitolo 4 Monitoraggio del sistema 89 Il comando showenvironment indica anche la posizione dell interruttore di controllo del sistema e la condizione dei tre LED del pannello principale CODICE DI ESEMPIO 4 2 Rapporti ALOM sulla posizione dell interruttore e sui LED di stato del sistema Il comando showenvironment segnala lo stato delle ventole e dei dischi del sistema CODICE DI ESEMPIO 4 3 Rap porti ALOM sulle ventole e sui dischi del sistema Disk Status Service OK to Remove HDDO OK OFF OFF HDD1 OK OFF OFF HDD2 OK OFF OFF HDD3 OK OFF OFF Fan Status Speed Low FTO FO OK 3729 750 FTO F1 OK 3688 750 FO OK 3214 750 90 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 I sensori di tensione situati sulla scheda madre eseguono il monitoraggio di importanti tensioni del sistema che vengono poi segnalate dal comando showenvironment CODICE DI ESEMPIO 4 4 Rapporti ALOM sulle tensioni della scheda madre Voltage sensors in Volts Sensor Status Voltage LowSoft LowWarn HighWarn HighSoft MB V_ 1V5 OK 1 48 1 20 1 27 172 1 80 MB V_VCCTM OK 2
100. ause mediante l uso di specifici strumenti e tecniche per la risoluzione dei problemi In questa sezione vengono descritti gli strumenti e le tecniche per la risoluzione dei problemi che possono essere controllati utilizzando le variabili di configurazione Meccanismo di sorveglianza hardware Il meccanismo di sorveglianza hardware rappresentato da un timer hardware che viene continuamente ripristinato quando il sistema operativo in esecuzione Nel caso di un blocco del sistema il sistema operativo non pi in grado di ripristinare il timer A questo punto il timer cessa di funzionare e provoca un ripristino automatico avviato esternamente XIR Externally Initiated Reset visualizzando le informazioni di debug nella console di sistema Il meccanismo di sorveglianza hardware abilitato per impostazione predefinita Se tale meccanismo disabilitato prima di poterlo riattivare necessario configurare l ambiente operativo Solaris Capitolo 6 Opzioni per la risoluzione dei problemi 119 La variabile di configurazione error reset recovery consente di controllare il comportamento del meccanismo di sorveglianza hardware nel momento in cui il timer cessa di funzionare Di seguito sono riportate le impostazioni della variabile error reset recovery m boot predefinita Ripristina il timer e tenta di eseguire il reboot del sistema a sync consigliata Tenta di generare automaticamente un file core dump ripristinare il timer e
101. azioni e avvisare gli utenti della imminente interruzione dell operativit Per informazioni sulle procedure di backup e di arresto appropriate consultare la documentazione di amministrazione del sistema Solaris Operazioni da eseguire Stabilire il metodo di accesso al prompt ok da utilizzare Per ulteriori dettagli vedere Informazioni sul prompt ok a pagina 181 Per istruzioni consultare la TABELLA A 2 TABELLA A 2 Metodi di accesso al prompt ok Metodo di accesso Operazioni da eseguire Chiusura regolare dell ambiente operativo Solaris e Da una finestra Shell Tool o Command Tool eseguire un comando appropriato ad esempio shutdown o init in base a quanto descritto nella documentazione di amministrazione del sistema Solaris Comando break o console del controller di sistema ALOM Al prompt sc gt digitare il comando ALOM break possibile utilizzare anche il comando console purch il software dell ambiente operativo non sia in esecuzione e che il server sia gi sottoposto al controllo del firmware OpenBoot Tasti L1 A Stop A o tasto Break e Su una tastiera Sun collegata direttamente al server Sun Fire V440 premere contemporaneamente i tasti Stop e A oppure e Da un terminale alfanumerico collegato premere il tasto Break Ripristino XIR Externally Initiated Reset e Al prompt sc gt digitare il comando reset x Ripristino manuale del sistema e
102. azioni sul prompt sc gt a pagina 179 Per eseguire questa procedura necessario aver impostato la configurazione predefinita della console di sistema affinch sia possibile passare dal controller di sistema alla console di sistema Per informazioni vedere m Informazioni sulla comunicazione con il sistema a pagina 174 m Accesso mediante la porta di gestione di rete a pagina 178 Operazioni da eseguire 1 Esaminare il log degli eventi ALOM Digitare quanto segue sc gt showlogs Il log degli eventi ALOM indica gli eventi del sistema quali eventi di ripristino e modifiche allo stato degli indicatori LED verificatisi al momento dell ultima esecuzione del boot del sistema Per identificare i problemi esaminare l output relativo ai LED di richiesta di assistenza accesi Il CODICE DI ESEMPIO 7 31 mostra un esempio di log degli eventi in cui viene indicato che il LED di richiesta di assistenza del pannello principale acceso 164 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 CODICE DI ESEMPIO 7 31 Output del comando showlogs MAY 09 16 54 27 Sun SFV440 a 00060003 SC System booted MAY 09 16 54 27 Sun SFV440 a 00040029 Host system has shut down MAY 09 16 56 35 Sun SFV440 a 00060000 SC Login User admin Logged on MAY 09 16 56 54 Sun SFV440 a 00060000 SC Login User admin Logged on MAY 09 16 58 11 Sun SFV440 a 00040001 SC Request
103. azioni sulla configurazione del terminale 5 Se si desidera utilizzare ttyb anzich la porta di gestione seriale effettuare quanto segue a Reindirizzare la console di sistema modificando le variabili di configurazione OpenBoot Al prompt ok digitare i seguenti comandi ok setenv input device ttyb ok setenv output device ttyb Nota possibile accedere al prompt sc gt e visualizzare i messaggi POST solo dalla porta di gestione seriale o dalla porta di gestione di rete Nota Sono disponibili molte altre variabili di configurazione OpenBoot Sebbene tali variabili non incidano sul dispositivo hardware utilizzato per accedere alla console di sistema alcune determinano i test diagnostici eseguiti dal sistema e i messaggi visualizzati sulla console di sistema Per informazioni dettagliate vedere Controllo della diagnostica POST a pagina 13 b Per rendere valide tali modifiche spegnere il sistema Digitare quanto segue ok power off Il sistema memorizza in modo permanente le modifiche ai parametri e si spegne Nota possibile spegnere il sistema anche utilizzando il pulsante di alimentazione del pannello anteriore c Collegare il cavo seriale null modem alla porta ttyb sul server Sun Fire V440 Se necessario utilizzare l adattatore del cavo DB 9 o DB 25 fornito con il server d Accendere il sistema Per le procedure di accensione vedere la documentazione Server Sun Fire V440 Gui
104. blemi di blocco del sistema 171 verifica della configurazione del core dump 127 T tastiera collegamento 205 tasto Break terminale alfanumerico 183 187 terminale alfanumerico accesso alla console di sistema 199 verifica velocit di trasmissione in baud 201 terminale verifica velocit in baud 201 termini negli output dei test diagnostici tabella 56 test diagnostici attivazione 63 come ignorare 15 come ignorare temporaneamente 16 66 disponibilit durante il processo di boot tabella 34 termini negli output tabella 56 test diagnostici all accensione POST messaggi di boot 144 modalit di esecuzione 73 test diagnostico all accensione vedere POST test OpenBoot Diagnostics causa dell esecuzione 15 comando test 20 comando test all 21 controllo 18 descrizione 17 descrizioni tabella 52 esecuzione dal prompt ok 20 funzione e copertura 17 menu interattivo 19 messaggi di errore interpretazione 21 percorsi hardware dei dispositivi 20 test stress Sun VTS uso 44 vedere anche analisi del sistema test comando test OpenBoot Diagnostics 20 test all comando test OpenBoot Diagnostics 21 test args parole chiave per la variabile tabella 18 test args variabile 18 Tivoli Enterprise Console vedere strumenti di monitoraggio di terze parti 216 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 U uadmin comando Solaris 182 unita centrale
105. cc scsi fru prom 0 a8 rmc fru prom 0 a6 Scheda madre CPU 2 Modulo CPU DIMM 0 Modulo CPU DIMM 1 Modulo CPU DIMM 2 Modulo CPU DIMM 3 CPU 1 Modulo CPU DIMM 0 Modulo CPU DIMM 1 Modulo CPU DIMM 2 Modulo CPU DIMM 3 memoria 2 memoria 2 memoria 2 memoria 2 memoria 1 memoria 1 memoria 1 memoria 1 Piano posteriore SCSI Scheda ALOM Esegue il controllo della frequenza di clock del bus PCI Contiene le informazioni sulla configurazione delle unit FRU Contiene le informazioni sulla configurazione delle unit FRU Contiene le informazioni sulla configurazione delle unit FRU Contiene le informazioni sulla configurazione delle unit FRU Contiene le informazioni sulla configurazione delle unit FRU Contiene le informazioni sulla configurazione delle unit FRU Contiene le informazioni sulla configurazione delle unit FRU Contiene le informazioni sulla configurazione delle unit FRU Contiene le informazioni sulla configurazione delle unit FRU Contiene le informazioni sulla configurazione delle unit FRU Contiene le informazioni sulla configurazione delle unit FRU Contiene le informazioni sulla configurazione delle unit FRU Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 TABELLA 2 14 Dispositivi del bus PC presenti in un serverSun Fire V440 Co
106. cessario Nessuna Nessuna Capitolo 3 Isolamento delle parti danneggiate 71 72 4 Controllare il LED del DVD ROM L unit DVD ROM dotata di un LED di alimentazione attivita che indica quanto segue Nome LED colore Informazione Azione Alimentazione Attivit verde Se acceso o lampeggiante l unit funziona normalmente Se questo LED spento e si certi che il sistema riceva alimentazione controllare l unit DVD ROM ed i relativi cavi 5 Controllare i LED della porta Ethernet Due LED della porta Ethernet sono situati sul pannello posteriore del sistema Nome LED colore Informazione Azione Collegamento Attivit verde Velocit ambra Se acceso stato stabilito un collegamento Se lampeggiante c attivit nel sistema Entrambi gli stati indicano un funzionamento normale Se acceso stata stabilita una connessione Ethernet Gigabit Se spento stata stabilita una connessione Ethernet 10 100 Mbps Se questo LED spento e si certi che in corso un tentativo di collegamento controllare i cavi Ethernet Operazioni successive Se i LED non rilevano l origine di un probabile problema provare a impostare il server sulla modalit diagnostica Per informazioni vedere m Impostazione del sistema in modalit diagnostica a pagina 63 anche possibile eseguire i test diagnostici all accensione POST Per info
107. che in presenza di un grave problema hardware 64 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Operazioni preliminari Eseguire il login alla console di sistema e accedere al prompt ok Per istruzioni vedere m Accesso al prompt ok a pagina 186 Operazioni da eseguire Accertarsi che l interruttore di controllo di sistema del server sia impostato sulla posizione normale L impostazione dell interruttore sulla posizione di diagnostica ha la priorit sulle impostazioni delle variabili di configurazione OpenBoot e provoca l esecuzione dei test diagnostici Disattivare le variabili diag switch e diag script Digitare quanto segue ok setenv diag switch false ok setenv diag script none Impostare le variabili di attivazione della configurazione OpenBoot in modo da ignorare i test diagnostici Digitare quanto segue ok setenv post trigger none ok setenv obdiag trigger none Operazioni successive A questo punto il server Sun Fire V440 configurato in modo da ridurre al minimo il tempo impiegato per il reboot Se successivamente si desidera imporre di nuovo l esecuzione dei test diagnostici vedere m Impostazione del sistema in modalit diagnostica a pagina 63 Capitolo 3 Isolamento delle parti danneggiate 65 Come ignorare temporaneamente i test diagnostici Operazioni preliminari Il controller di sistema ALOM fornisce un metodo alte
108. cs anche direttamente dal prompt ok A tal fine digitare il comando test seguito dal percorso hardware completo del dispositivo o dei dispositivi su cui eseguire il test Ad esempio ok test pci 1c 600000 scsi 2 1 Nota Per indicare il percorso corretto di un dispositivo hardware necessario conoscere esattamente l architettura hardware del server Sun Fire V440 In mancanza di tali informazioni possibile utilizzare il comando OpenBoot show devs vedere Comando show devs a pagina 24 che consente di visualizzare un elenco di tutti i dispositivi configurati Per personalizzare un singolo test possibile utilizzare il comando test args come indicato di seguito ok test pci le 600000 usb b test args verbose subtests 20 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Tale comando ha effetto solo sul test corrente e non modifica il valore della variabile di configurazione OpenBoot test args possibile utilizzare il comando test all per eseguire il test di tutti i dispositivi presenti nella struttura ad albero ok test all Se si specifica un percorso in corrispondenza del comando test all viene eseguito il test solo del dispositivo specificato e dei relativi dispositivi figlio Nell esempio seguente viene riportato il comando che consente di eseguire il test del bus USB e di tutti i dispositivi con funzione di diagnostica automatic
109. ctor per verificare che l installazione del server Sun Fire V440 sia stata completata con successo L uso contemporaneo di questi due strumenti consente di valutare il sistema relativamente a Livello minimo richiesto per l ambiente operativo Presenza di patch chiave fondamentali Livelli appropriati per il firmware del sistema Componenti hardware non supportati Capitolo 6 Opzioni per la risoluzione dei problemi 117 Quando Sun Install Check Tool e Sun Explorer Data Collector identificano possibili problemi viene generato un rapporto che fornisce istruzioni specifiche per risolverli Sun Install Check Tool disponibile all indirizzo http sunsolve sun com Su questo sito fare clic sul collegamento a Sun Install Check Tool Vedere anche Informazioni su Sun Explorer Data Collector a pagina 118 118 Informazioni su Sun Explorer Data Collector Sun Explorer Data Collector uno strumento di raccolta dei dati del sistema utilizzato talvolta dai centri di assistenza Sun per risolvere i problemi nei sistemi Sun SPARC e x86 In determinate situazioni di supporto i centri di assistenza Sun possono richiedere di installare ed eseguire questo strumento Se si installato Sun Install Check Tool durante l installazione iniziale stato installato anche Sun Explorer Data Collector Se non si installato Sun Install Check Tool possibile installare Sun Explorer Data Collector in un secondo momento senza Sun Install Check Tool Se
110. d eseguire il reboot del sistema m none equivalente a un esecuzione manuale di un ripristino XIR dal controller di sistema ALOM Passa al prompt ok consentendo all utente di eseguire i comandi ed effettuare il debugging del sistema Per ulteriori informazioni sul meccanismo di sorveglianza hardware e sul ripristino XIR consultare la documentazione Server Sun Fire V440 Guida di amministrazione Per ulteriori informazioni sulla risoluzione di un problema di blocco del sistema vedere le seguenti sezioni m Risposta allo stato di blocco del sistema a pagina 133 m Risoluzione dei problemi di un sistema bloccato a pagina 170 Impostazioni per il ripristino automatico del sistema Le funzioni per il ripristino automatico del sistema ASR Automatic System Recovery consentono al sistema di riprendere a funzionare dopo il verificarsi di guasti ed errori hardware reversibili Quando la funzione ASR attivata la diagnostica del firmware del sistema rileva automaticamente i componenti hardware guasti Un apposita funzione di configurazione automatica nel firmware OpenBoot consente al sistema di annullare la configurazione dei componenti danneggiati e di ripristinare il funzionamento del sistema Finch il sistema in grado di funzionare senza il componente danneggiato le funzioni ASR consentiranno di eseguire il reboot automatico senza intervento da parte dell operatore Le modalit di configurazione delle impostazioni ASR incidono non
111. da di amministrazione 200 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Operazioni successive A questo punto possibile eseguire i comandi di sistema e visualizzare i messaggi di sistema utilizzando il terminale alfanumerico Se necessario proseguire con l installazione o con la procedura di diagnostica Al termine digitare la sequenza di escape del terminale alfanumerico Per ulteriori informazioni sul collegamento e l utilizzo del controller di sistema ALOM vedere m Sun Advanced Lights Out Manager ALOM Online Help Se la console di sistema stata reindirizzata a ttyb e si desidera ripristinare le impostazioni della console in modo che utilizzi le porte di gestione seriale e di rete vedere m Riferimento per le impostazioni delle variabili di configurazione OpenBoot della console di sistema a pagina 207 Verifica delle impostazioni della porta seriale su tt yb Questa procedura consente di verificare la velocit di trasmissione in baud e altre impostazioni della porta seriale utilizzate dal server Sun Fire V440 per comunicare con un dispositivo collegato alla relativa porta ttyb Nota La porta di gestione seriale funziona sempre a 9600 baud 8 bit nessuna parit e 1 bit di stop Operazioni preliminari necessario aver effettuato il login al server Sun Fire V440 sul quale deve essere in esecuzione il software del sistema operativo Solaris Appendice A
112. da monitorare siano attivi e in esecuzione poich questo strumento si basa sull ambiente operativo Solaris Per istruzioni vedere Monitoraggio del sistema mediante Sun Management Center a pagina 82 Per informazioni dettagliate sul prodotto vedere la documentazione Sun Management Center Software User s Guide Informazioni aggiornate Per ottenere informazioni aggiornate sul prodotto accedere al sito Web Sun Management Center all indirizzo http www sun com sunmanagementcenter Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Informazioni sull analisi del sistema E relativamente semplice individuare il guasto esplicito di un componente del sistema Tuttavia quando un sistema presenta un problema che si verifica a intermittenza o un comportamento anomalo l uso di uno strumento software che analizzi e solleciti i sottosistemi contribuisce a individuare l origine un possibile problema ed evita cos lunghi periodi di funzionalit ridotta o di inattivit del sistema Sono disponibili due strumenti Sun di analisi dei server Sun Fire V440 m Software SunVTS m Software Hardware Diagnostic Suite Nella TABELLA 2 9 vengono illustrate le unit FRU che ciascuno strumento di analisi del sistema in grado di isolare in caso di problemi Si tenga presente che i singoli strumenti non eseguono necessariamente il test di tutti i componenti o percorsi di una determinata unit FRU TABELLA 2 9
113. dei problemi hardware 145 Nel seguente output di esempio vengono illustrati i test diagnostici OpenBoot Per un esempio di messaggio di errore dei test diagnostici OpenBoot e ulteriori informazioni sui tali messaggi vedere Informazioni fornite dai messaggi di errore OpenBoot Diagnostics a pagina 21 CODICE DI ESEMPIO 7 11 Output del comando consolehistory boot v test diagnostici OpenBoot Running Testing Testing Testing Testing Testing Testing Testing gpio 0 Testing Testing Testing Testing Testing diagnostic script obdiag normal pci 1 700000 network 1 pci le 600000 ide d pci le 600000 isa 7 flashprom 2 0 pci le 600000 isa 7 serial 0 2e8 pci le 600000 isa 7 serial 0 3 8 pci le 600000 isa 7 rtc 0 70 pci le 600000 isa 7 12c 0 320 tests 42 gpio 0 44 gpio 0 46 gpio 0 48 pci le 600000 isa 7 i2c 0 320 tests hardware monitor 0 5c pci le 600000 isa 7 i2c 0 320 tests temperature sensor 0 9c pci ic 600000 network 2 pci 1 700000 scsi 2 1 pci 1f 700000 scsi 2 Nel seguente output di esempio viene illustrata l inizializzazione della memoria mediante OpenBoot PROM CODICE DI ESEMPIO 7 12 Output del comando consolehistory boot v inizializzazione della memoria Initializing 1MB of memory at addr 123fe02000 Initializing 12MB of memory at addr 123 000000 Initializing 1008MB of memory at addr 1200000000 Initializing 1024MB of memory at addr 1000000000 Initializi
114. del bus Converte gli indirizzi del bus PC e isola i dispositivi del bus Rileva la temperatura dello stampo della CPU Contiene le informazioni sulla configurazione delle unit FRU Contiene le informazioni sulla configurazione delle unit FRU Contiene le informazioni sulla configurazione delle unit FRU Contiene le informazioni sulla configurazione delle unit FRU Capitolo 2 Diagnostica e processo di boot 55 TABELLA 2 14 Dispositivi del bus PC presenti in un serverSun Fire V440 Continua Indirizzo FRU associata Funzione del dispositivo dimm spd 0 bc Modulo CPU memoria 0 Contiene le informazioni sulla DIMM 3 configurazione delle unita FRU temperature 0 90 CPU 3 Rileva la temperatura dello stampo della CPU cpu fru prom 0 ee CPU 3 Contiene le informazioni sulla configurazione delle unita FRU dimm spd 0 e6 Modulo CPU memoria 3 Contiene le informazioni sulla DIMM 0 configurazione delle unit FRU dimm spd 0 e8 Modulo CPU memoria 3 Contiene le informazioni sulla DIMM 1 configurazione delle unit FRU dimm spd 0 ea Modulo CPU memoria 3 Contiene le informazioni sulla DIMM 2 configurazione delle unit FRU dimm spd 0 ec Modulo CPU memoria 3 Contiene le informazioni sulla DIMM 3 configurazione delle unit FRU Riferimenti per la terminologia negli output dei test diagnostici In alcuni casi i messaggi di stato e di errore visualizzati in seguito all esecuzione dei test dia
115. di emergenza ma la stabilit e le prestazioni del sistema verranno alterate Poich il sistema ancora funzionante tentare di isolare il guasto utilizzando diversi metodi e strumenti al fine di garantire che la parte che si ritiene danneggiata sia veramente la causa del problema verificatosi Per informazioni vedere m Informazioni su come isolare i guasti nel sistema a pagina 35 Per informazioni sull installazione e la sostituzione di parti sostituibili in loco FRU vedere la documentazione m Sun Fire V440 Server Parts Installation and Removal Guide 140 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Risoluzione dei problemi di un sistema dopo un reboot non previsto Operazioni preliminari Eseguire il login al controller di sistema e accedere al prompt sc gt Per informazioni vedere m Informazioni sul prompt sc gt a pagina 179 Per eseguire questa procedura necessario aver impostato la configurazione predefinita della console di sistema affinch sia possibile passare dal controller di sistema alla console di sistema Per informazioni vedere m Informazioni sulla comunicazione con il sistema a pagina 174 m Accesso mediante la porta di gestione di rete a pagina 178 Operazioni da eseguire Esaminare il log degli eventi ALOM Digitare quanto segue sc gt showlogs Il log degli eventi ALOM riporta gli eventi del sistema quali eventi di ripri
116. diagnosi del sistema a un livello superiore di copertura per determinare la causa del reboot se quest ultima non indicata chiaramente dai file dei messaggi del sistema e della console di sistema Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 Risoluzione dei problemi di un sistema con risposta da parte del sistema operativo Operazioni preliminari Eseguire il login al controller di sistema e accedere al prompt sc gt Per informazioni vedere m Informazioni sul prompt sc gt a pagina 179 Per eseguire questa procedura necessario aver impostato la configurazione predefinita della console di sistema affinch sia possibile passare dal controller di sistema alla console di sistema Per informazioni vedere m Informazioni sulla comunicazione con il sistema a pagina 174 m Accesso mediante la porta di gestione di rete a pagina 178 Operazioni da eseguire Esaminare il log degli eventi ALOM Digitare quanto segue sc gt showlogs Il log degli eventi ALOM riporta gli eventi del sistema quali eventi di ripristino e modifiche allo stato degli indicatori LED che si sono verificati dall ultimo boot del sistema Il CODICE DI ESEMPIO 7 3 mostra un esempio di log degli eventi in cui viene indicato che il LED di richiesta di assistenza del pannello principale acceso CODICE DI ESEMPIO 7 3 Output del comando showlogs 09 09 09 09 09 09 09 09 09
117. diagnostica POST 11 df k comando Solaris 125 diag level variabile impostazione 14 impostazione per i test OpenBoot Diagnostics 18 uso nella risoluzione dei problemi di sospensione del sistema 171 diagnostica automatica incorporata BIST IEEE 1275 compatibile 17 64 68 test args variabile e 18 diag script variabile 14 uso nella risoluzione dei problemi di blocco dei sistemi 171 diag switch variabile impostazione 14 directory savecore 127 dispositivi SCSI diagnostica dei problemi 23 dispositivi struttura ad albero definizione 17 raccolta dati 41 dispositivo di swap salvataggio del core dump 123 dumpadm s comando Solaris 126 dumpadm comando Solaris 124 E eccezioni dello stato RED risoluzione dei problemi 153 risposta 134 errori di ripristino irreversibili risoluzione dei problemi 153 errori irreversibili di ripristino risposta 134 eventi di ripristino tipi 15 F fasi del processo di boot 8 file etc remote 195 file bounds 127 file di log 25 41 firmware vedere anche firmware OpenBoot danneggiamento 16 sistema disegno 9 firmware OpenBoot 9 60 82 103 frequenza di clock CPU 32 FRU Field Replaceable Unit confini 13 dati memorizzati nella SEEPROM 32 elenco gerarchico 31 gestione mediante diversi strumenti diagnostici tabella 35 43 livello di revisione hardware 32 non isolate mediante gli strumenti di analisi del sistema tabella 44 non isolate mediante
118. dispositivi alla console di sistema 177 Canali separati per la console di sistema e il controller di sistema 185 Collegamento del pannello patch tra un server terminal e un server Sun Fire V440 192 Connessione tip tra un server Sun Fire V440 e un altro sistema Sun 195 vii viii Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 Tabelle TABELLA 1 1 TABELLA 2 1 TABELLA 2 2 TABELLA 2 3 TABELLA 2 4 TABELLA 2 5 TABELLA 2 6 TABELLA 2 7 TABELLA 2 8 TABELLA 2 9 TABELLA 2 10 TABELLA 2 11 TABELLA 2 12 TABELLA 2 13 TABELLA 2 14 TABELLA 2 15 TABELLA 4 1 TABELLA 4 2 TABELLA 5 1 Riepilogo degli strumenti diagnostici 2 Variabili di configurazione OpenBoot 14 Parole chiave per la variabile di configurazione OpenBoot test args 18 Disponibilita degli strumenti diagnostici 34 Unita FRU su cui agiscono gli strumenti di isolamento dei guasti 35 Unit FRU che non possibile isolare direttamente mediante gli strumenti di isolamento dei guasti 36 Elementi monitorati mediante ALOM 38 Elementi monitorati mediante Sun Management Center 39 Stati dei dispositivi rilevati da Sun Management Center 40 Unit FRU su cui agiscono gli strumenti di analisi del sistema 43 Unit FRU che non possibile isolare direttamente mediante gli strumenti di analisi del sistema 44 Banchi di memoria logici e fisici in un server Sun Fire V440 50 Test nel menu OpenBoot Diagn
119. dispositivi visualizzati nel menu dei test OpenBoot Diagnostics Disponibile anche dal prompt ok Esegue il test del solo dispositivo identificato dal numero della voce di menu Una funzione simile disponibile dal prompt ok Per informazioni vedere Prompt ok comandi test e test all a pagina 20 Esegue il test dei soli dispositivi identificati dai numeri delle voci di menu Esegue il test di tutti i dispositivi nel menu dei test OpenBoot Diagnostics ad eccezione di quelli identificati dai numeri delle voci di menu Visualizza le propriet selezionate dei dispositivi identificati dai numeri delle voci di menu Le informazioni fornite variano in base al tipo di dispositivo Capitolo 2 Diagnostica e processo di boot 53 54 Riferimenti per la decodifica dei messaggi dei test diagnostici I C Nella TABELLA 2 14 viene fornita una descrizione di ciascun dispositivo IC presente in un server Sun Fire V440 e viene indicato come associare ciascun indirizzo I2C all unit FRU appropriata Per ulteriori informazioni sui test dei dispositivi I C vedere Test dei dispositivi del bus I C a pagina 22 TABELLA 2 14 Indirizzo FRU associata Dispositivi del bus PC presenti in un serverSun Fire V440 Funzione del dispositivo clock generator 0 d2 cpu fru prom 0 de dimm spd 0 d6 dimm spd 0 d8 dimm spd 0 da dimm spd 0 dc cpu fru prom 0 ce dimm spd 0 c6 dimm spd 0 c8 dimm spd 0 ca dimm spd 0
120. e Esegue il test delle unit disco SCSI esterne collegate Esegue il test di tutte le possibili velocit di trasmissione in baud supportate dalle linee seriali ttya e ttyb Per ciascuna velocit esegue test di loopback interni ed esterni su ciascuna linea Esegue il test dei registri su cui abilitata la scrittura dei controller host USB Open Scheda madre Scheda madre alimentatori dischi SCSI moduli CPU memoria Scheda madre unit DVD ROM Scheda madre Scheda madre Scheda ALOM Scheda madre Scheda madre piano posteriore SCSI dischi SCSI Scheda madre cavo SCSI dischi SCSI Scheda madre Scheda madre 52 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Nella TABELLA 2 13 viene fornita una descrizione dei comandi che possibile digitare al prompt obdiag gt TABELLA 2 13 Comandi del menu dei test OpenBoot Diagnostics Comando Descrizione exit Esce dai test OpenBoot Diagnostics e torna al prompt ok help Visualizza una breve descrizione di ciascun comando set default variabile setenv variabile valore test all test test except what OpenBoot Diagnostics e di ciascuna variabile di configurazione OpenBoot Ripristina il valore predefinito di una variabile di configurazione OpenBoot Imposta il valore di una variabile di configurazione OpenBoot Disponibile anche dal prompt ok Esegue il test di tutti i
121. e GSunVTS sono disponibili strumenti non standard come ad esempio file di log contenenti sistemi per circoscrivere le possibili cause di un problema La vasta gamma di strumenti diagnostici disponibili comprende pacchetti software standalone test diagnostici all accensione POST Power On Self Test basati su firmware e LED hardware che indicano se gli alimentatori sono in funzione Solo alcuni strumenti diagnostici consentono di analizzare diversi sistemi da un unica console Mentre alcuni strumenti sollecitano il sistema mediante l esecuzione contemporanea di pi test test stress altri strumenti effettuano test sequenziali consentendo al sistema di continuare a eseguire le normali funzioni Alcuni strumenti diagnostici funzionano in standby o quando il sistema fuori linea mentre per altri necessario che il sistema operativo sia attivo e in esecuzione Nella TABELLA 1 1 viene fornito un riepilogo di tutti gli strumenti disponibili La maggior parte di tali strumenti viene descritta in dettaglio all interno del presente manuale mentre altri vengono ulteriormente descritti nella documentazione Server Sun Fire V440 Guida di amministrazione Per alcuni strumenti inoltre disponibile un apposita documentazione completa Per ulteriori informazioni vedere la prefazione TABELLA 1 1 Riepilogo degli strumenti diagnostici Strumento Funzione diagnostico Tipo Funzione Accessibilit e disponibilit remota Sun Hardware Esegu
122. e la documentazione Server Sun Fire V440 Guida di amministrazione possibile accendere e spegnere il LED di localizzazione dalla console di sistema oppure utilizzando l interfaccia della riga di comando ALOM Sun Advanced Lights Out Manager Nota anche possibile utilizzare il software Sun Management Center per accendere e spegnere il LED di localizzazione Per ulteriori dettagli consultare la documentazione Sun Management Center Capitolo 3 Isolamento delle parti danneggiate 61 Operazioni preliminari Accedere alla console di sistema o al controller di sistema Per istruzioni vedere m Accesso al prompt ok a pagina 186 m Passaggio dal controller di sistema ALOM alla console di sistema a pagina 185 Operazioni da eseguire 1 Determinare lo stato corrente del LED di localizzazione Effettuare una delle operazioni riportate di seguito m Dalla console di sistema digitare quanto segue usr sbin locator The system locator is on m Dalla controller di sistema ALOM digitare quanto segue sc gt showlocator Locator LED is ON 2 Accendere il LED di localizzazione Effettuare una delle operazioni riportate di seguito m Dalla console di sistema digitare quanto segue usr sbin locator n m Dal controller di sistema ALOM digitare quanto segue sc gt setlocator on 3 Spegnere il LED di localizzazione Effettuare una delle operazioni riportate di seguito
123. e valore predefinito Nota I punti 3 4 e 5 si verificano automaticamente quando abilitato il meccanismo di sorveglianza hardware Capitolo 7 Risoluzione dei problemi hardware 171 6 Se in seguito a un ripristino XIR il sistema non accede al prompt ok effettuare le seguenti operazioni a Ruotare l interruttore di controllo del sistema sulla posizione di diagnostica In questo modo il sistema esegue i test diagnostici POST e OpenBoot durante l avvio b Tenere premuto il pulsante di alimentazione del sistema per cinque secondi Questa operazione provoca uno spegnimento immediato c Attendere almeno 30 secondi quindi accendere il sistema premendo il pulsante di alimentazione Nota inoltre possibile utilizzare il controller di sistema ALOM per impostare i livelli dei test diagnostici POST e OpenBoot e per spegnere e riavviare il sistema Vedere la Sun Advanced Lights Out Manager ALOM Online Help 7 Utilizzare i test diagnostici POST e OpenBoot per diagnosticare i problemi del sistema Quando il sistema inizia la sequenza di avvio esegue anche i test diagnostici POST e OpenBoot Vedere Isolamento dei guasti mediante i test diagnostici POST a pagina 73 e Isolamento dei guasti mediante i test diagnostici interattivi OpenBoot a pagina 75 8 Esaminare il contenuto del file var adm messages Ricercare le seguenti informazioni sullo stato del sistema m Qualsiasi differenza sostanziosa nella stampigliat
124. e 5 8 Version Generic 114696 04 64 bit Copyright 1983 2003 Sun Microsystems Inc All rights reserved Hardware watchdog enabled Indicator SYS_FRONT ACT is now ON configuring IPv4 interfaces ce0 Hostname Sun SFV440 a The system is coming up Please wait NIS domainname is Ecd East Sun COM Starting IPv4 router discovery starting rpc services rpcbind keyserv ypbind done Setting netmask of 100 to 255 0 0 0 Setting netmask of ce0 to 255 255 255 0 Setting default IPv4 interface for multicast add net 224 0 4 gateway Sun SFV440 a syslog service starting 166 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 CODICE DI ESEMPIO 7 32 Output del comando consolehistory run v Continua Print services started volume management starting The system is ready Sun SFV440 a console login May 9 14 52 57 Sun SFV440 a rmclomv NOTICE keyswitch change event state UNKNOWN May 9 14 52 57 Sun SFV440 a rmclomv Keyswitch Position has changed to Unknown state May 9 14 52 58 Sun SFV440 a rmclomv NOTICE keyswitch change event state LOCKED May 9 14 52 58 Sun SFV440 a rmclomv KeySwitch Position has changed to Locked State May 9 14 53 00 Sun SFV440 a rmclomv NOTICE keyswitch change event state NORMAL May 9 14 53 01 Sun SFV440 a rmclomv KeySwitch Position has changed to On State sc gt Nota Le stampigliature delle date per i log ALOM
125. e V440 Clearing TLBs POST Results Cpu 0000 0000 0000 0000 00 0000 0000 0000 0000 01 fFff ffff 00a 2b73 402 ffff ffff ffrff ffrff POST Results Cpu 0000 0000 0000 0001 00 0000 0000 0000 0000 01 fFfff ffff 00a 2b73 02 ffff ffff ffrff ffrff Membase 0000 0000 0000 0000 MemSize 0000 0000 0004 0000 Init CPU arrays Done Probing pci 1d 700000 Device 1 Nothing there Probing pci 1d 700000 Device 2 Nothing there 96 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Nel seguente output di esempio viene illustrata l intestazione del sistema CODICE DI ESEMPIO 4 12 Output del comando consolehistory boot v visualizzazione dell intestazione del sistema Sun Fire V440 No Keyboard Copyright 1998 2003 Sun Microsystems Inc All rights reserved OpenBoot 4 10 3 4096 MB memory installed Serial 53005571 Ethernet address 0 3 ba 28 cd 3 Host ID 8328cd03 Nel seguente output di esempio vengono illustrati i test diagnostici OpenBoot CODICE DI ESEMPIO 4 13 Output del comando consolehistory boot v test diagnostici OpenBoot Running diagnostic script obdiag normal Testing pci 1f 700000 network 1 Testing pci le 600000 ide d Testing pci le 600000 isa 7 flashprom 2 0 Testing pci le 600000 isa 7 serial 0 2e8 Testing pci le 600000 isa 7 serial 0 3 8 Testing pci le 600000 isa 7 rtc 0 70 Testing pci le 600000 isa 7 12c 0 320 tests gpio 0 42 gpio 0 44
126. e il monitoraggio delle Pu funzionare in standby Progettato Advanced software condizioni ambientali genera e quando il sistema per l accesso Lights Out e firmware messaggi di avviso esegue operativo non in remoto Manager le operazioni di base di esecuzione ALOM isolamento dei guasti e fornisce accesso remoto alla console LED Hardware Indicano lo stato dell intero Accessibili dal telaio del Locale ma sistema e di determinati sistema e disponibili se il accessibile componenti sistema alimentato mediante ALOM POST Firmware Esegue il test dei componenti Pu essere eseguito Locale ma principali del sistema ovvero all avvio sebbene ci non accessibile CPU memoria e circuiti integrati sia previsto per mediante del bridge di I O della scheda impostazione predefinita ALOM madre Disponibile quando il sistema operativo non in esecuzione 2 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 TABELLA 1 1 Riepilogo degli strumenti diagnostici Continua Strumento Funzione diagnostico Tipo Funzione Accessibilit e disponibilit remota Diagnostica Firmware Esegue il test dei componenti del Pu essere eseguita Locale ma OpenBoot sistema in particolare delle automaticamente all avvio accessibile periferiche e dei dispositivi di I O sebbene ci non sia mediante previsto per impostazione ALOM predefinita Pu anche essere eseguita in modo interattivo Disponibile q
127. e in esecuzione in un ambiente di produzione Per ulteriori informazioni vedere Analisi del sistema mediante Hardware Diagnostic Suite a pagina 46 Strumento di generazione dei rapporti Il software Performance Reporting Manager un componente aggiuntivo di Sun Management Center che consente di creare rapporti sullo stato delle macchine in uso Questo strumento consente di generare rapporti contenenti dati relativi a prestazioni hardware configurazioni pacchetti software patch e allarmi per un sottoinsieme arbitrario di sistemi gestiti nel centro dati Interoperabilit con gli strumenti di terze parti Nel caso di reti eterogenee in cui vengono utilizzati strumenti di monitoraggio o di gestione di terze parti possibile trarre vantaggio dal supporto di Tivoli Enterprise Console BMC Patrol e HP Openview offerto dal software Sun Management Center A chi utile Sun Management Center Il software Sun Management Center adatto principalmente agli amministratori di sistemi che hanno il compito di monitorare centri dati di grandi dimensioni o altre installazioni con numerose piattaforme da controllare In caso di installazioni di dimensioni inferiori necessario valutare se i vantaggi offerti da Sun Management Center giustificano la necessit di gestire un database delle informazioni sullo stato del sistema le cui dimensioni sono generalmente superiori ai 700 Mbyte Per utilizzare Sun Management Center necessario che i server
128. e informazioni generalmente restituite a Descrizione dell unit FRU Nome del produttore e posizione m Numero parte e numero di serie m Livelli di revisione hardware Le informazioni sulle seguenti unit FRU del server Sun Fire V440 vengono visualizzate mediante il comando prt fru Scheda ALOM Moduli CPU DIMM Scheda madre Piano posteriore SCSI Alimentatori Informazioni simili vengono restituite mediante il comando showfru del controller di sistema ALOM Per ulteriori informazioni sul comando showfru e su altri comandi ALOM vedere Monitoraggio del sistema mediante Sun Advanced Lights Out Manager a pagina 87 Comando psrinfo Il comando psrinfo consente di visualizzare la data e l ora di collegamento in linea di ciascuna CPU Se si utilizza l opzione verbose v vengono visualizzate ulteriori informazioni sulle CPU inclusa la frequenza di clock Di seguito viene riportato un esempio di output restituito dal comando psrinfo utilizzato con l opzione v 32 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 CODICE DI ESEMPIO 2 18 CODICE DI ESEMPIO 2 16 Output del comando psrinfo v Status of processor 0 as of 04 11 03 12 03 45 Processor has been on line since 04 11 01 10 53 03 The sparcv9 processor operates at 1280 MHz and has a sparcv9 floating point processor Status of processor 1 as of 04 11 03 12 03 45 Processor has been on line since 04 11 03 10 53 05 The sparcv
129. e istruzioni per l isolamento delle parti danneggiate Il capitolo Capitolo 4 un capitolo procedurale fornisce istruzioni per il monitoraggio del sistema Il capitolo Capitolo 5 un capitolo procedurale fornisce istruzioni per l analisi del sistema La Parte II di questo manuale tratta la risoluzione dei problemi Il Capitolo 6 un capitolo concettuale e procedurale descrive le opzioni di risoluzione dei problemi disponibili e fornisce informazioni per l implementazione di tali opzioni Il Capitolo 7 un capitolo concettuale e procedurale descrive gli approcci per la risoluzione dei problemi e fornisce istruzioni per la soluzione dei problemi hardware L Appendice A contiene sia procedure che concetti e fornisce informazioni di base sulla console di sistema e il controller di sistema nonch sul relativo uso Uso dei comandi UNIX In questo documento potrebbero non essere incluse informazioni relative ai comandi e alle procedure di base UNIX ad esempio quelli per l arresto e il boot del sistema e per la configurazione dei dispositivi Per informazioni di questo tipo consultare i seguenti riferimenti m Solaris Handbook for Sun Peripherals m Documentazione in linea AnswerBook2 per l ambiente operativo Solaris m Altra documentazione relativa al software fornita con il sistema xii Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Convenzioni tipografiche Caratte
130. e un riepilogo dei risultati degli ultimi test diagnostici OpenBoot digitare quanto segue ok show obdiag results Dovrebbe essere visualizzato un elenco di componenti hardware che varia in base al sistema in uso con l indicazione dell esito positivo o negativo dei test POST od OpenBoot accanto a ciascun componente 78 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Informazioni su come scegliere uno strumento per l isolamento dei guasti In questa sezione viene indicato come scegliere lo strumento pi appropriato per isolare una parte danneggiata in un server Sun Fire V440 Prima di selezionare uno strumento prendere in considerazione quanto riportato di seguito 1 stato eseguito il controllo dei LED Per alcuni componenti di sistema sono disponibili LED incorporati che avvisano l utente qualora sia necessario effettuare la sostituzione Per istruzioni dettagliate vedere Isolamento dei guasti mediante l uso dei LED a pagina 69 2 possibile eseguire il boot del sistema m Se non possibile eseguire il boot del sistema necessario eseguire i test diagnostici basati su firmware i quali non dipendono dal sistema operativo m Se possibile eseguire il boot opportuno utilizzare uno strumento pi completo Nella FIGURA 3 1 viene illustrato il tipico processo di isolamento dei guasti 3 Si desidera eseguire i test in modo remoto Sia Sun Management Ce
131. edere alla console di sistema dal controller di sistema ALOM digitare il comando console al prompt sc gt Per accedere al controller di sistema ALOM dalla console di sistema digitare la sequenza di escape del controller di sistema che per impostazione predefinita corrisponde a cancelletto punto Per ulteriori informazioni vedere Informazioni sulla comunicazione con il sistema a pagina 174 Informazioni sul prompt sc gt a pagina 179 Informazioni sul prompt ok a pagina 181 Uso della porta di gestione seriale a pagina 188 Sun Advanced Lights Qut Manager ALOM Online Help Accesso al prompt ok Operazioni preliminari In questa procedura vengono descritti diversi metodi di accesso al prompt ok alcuni dei quali risultano meno appropriati di altri Per informazioni dettagliate sull uso di ciascun metodo vedere m Informazioni sul prompt ok a pagina 181 186 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Nota L accesso al prompt ok nel server Sun Fire V440 implica la sospensione di tutte le applicazioni e del software del sistema operativo Una volta eseguiti i comandi firmware e i test basati su firmware dal prompt ok potrebbe non essere possibile riprendere l esecuzione dal punto in cui si verificata la sospensione Se possibile eseguire una copia di backup dei dati del sistema prima di avviare la procedura Chiudere o interrompere inoltre tutte le applic
132. egistrazione degli errori syslogd registra automaticamente diversi errori e avvertenze del sistema in file di messaggi Per impostazione predefinita molti di questi messaggi di sistema vengono visualizzati sulla console di sistema e memorizzati nel file var adm messages possibile stabilire dove devono essere memorizzati questi messaggi oppure inviarli a un sistema remoto impostando la registrazione dei messaggi di sistema Per ulteriori informazioni vedere la sezione relativa alla 122 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 personalizzazione della registrazione dei messaggi di sistema nella documentazione System Administration Guide Advanced Administration all interno di Solaris System Administrator Collection Per alcuni guasti una notevole quantit di dati viene inviata alla console di sistema Poich i messaggi di log ALOM vengono scritti in un buffer circolare contenente 64 KB di dati possibile che l output di identificazione del componente guasto originale venga sovrascritto Pertanto possibile che si desideri esaminare ulteriori opzioni di registrazione della console di sistema come le soluzioni di terze parti o SRS Net Connect Per ulteriori informazioni su SRS Net Connect vedere Informazioni su Sun Remote Services Net Connect collegamento in rete ai servizi remoti Sun a pagina 119 Ulteriori informazioni su SRS Net Connect sono disponibili all indirizzo h
133. ei LED del sistema mediante il comando prtdiag CODICE DI ESEMPIO 2 13 Visualizzazione dello stato dei LED mediante il comando prt diag Led State Location Led State Color MB ACT on green MB SERVICE on amber MB LOCATE off white PSO POK off green PSO STBY off green Comando prtfru Nel server Sun Fire V440 presente un elenco di tutte le unit sostituibili in loco FRU del sistema disposte in ordine gerarchico e sono disponibili informazioni specifiche sulle varie unit FRU Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Il comando prt fru consente di visualizzare tale elenco gerarchico e le informazioni contenute nei dispositivi Serial Electrically Erasable Programmable Read Only Memory SEEPROM presenti su diverse unit FRU Nel seguente CODICE DI ESEMPIO 2 14 viene riportato un estratto dell elenco gerarchico delle unit FRU generato mediante il comando prt fru utilizzato con l opzione 1 CODICE DI ESEMPIO 2 14 Output del comando prtfru 1 rutree frutree chassis fru frutree chassis SC Label SC frutree chassis SC Label SC system controller container frutree chassis MB Label MB frutree chassis MB Label MB system board container frutree chassis MB Label MB system board BAT Label BAT icon frutree chassis PS0 Label PS0 frutree chassis PS0 Label PS0 power supply container frutree chassis PS1 Label PS1 frutree chassis HDD0 Label HDDO frutree c
134. ei guasti Consultare il Capitolo 2 per istruzioni e la sezione Informazioni sull analisi del sistema a pagina 43 per informazioni di base LED di segnalazione guasti acceso si no Sostituire la parte Il sistema si esegue il boot Y Eseguire test POST Eseguire test POST Y Considerare esecuzione dell analisi del sistema Errore POST Eseguire test OBDiag Errore OBDiag no si A si no Errore Problema sw Problema x lei i isco o del disco Controllare dischi disco software FIGURA 3 1 Scelta di uno strumento per l isolamento dei guasti hardware 80 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 CAPITOLO 4 Monitoraggio del sistema Se il sistema non funziona correttamente gli strumenti diagnostici consentono di individuare la causa del problema questo l utilizzo principale degli strumenti diagnostici che rappresenta tuttavia un approccio a posteriori in quanto risulta utile solo dopo il guasto completo di un componente Alcuni strumenti diagnostici consentono di agire a priori eseguendo il monitoraggio del sistema ancora integro Gli strumenti di monitoraggio avvisano gli amministratori circa l imminenza di un guasto consentendo di pianificare gli interventi di manutenzione e migliorando la disponibilit del sistema Il monitoraggio remoto conse
135. ell interfaccia seriale direttamente al server Sun Fire V440 Vedere Uso della porta di gestione seriale a pagina 188 m Collegare un cavo di collegamento esterno breakout cable dell interfaccia seriale a un pannello patch e utilizzare il cavo patch diretto fornito da Sun per collegare il pannello patch al server Appendice A Configurazione della console di sistema 191 10 11 12 13 14 15 nHoacoceooceedooboo NOOOooooooooooo ej Server ge l terminal Cavo diretto a Pannello _____ patch Cavo patch collegato alla porta di gestione seriale Server Sun Fire V440 FIGURA A 4 Collegamento del pannello patch tra un server terminal e un server Sun Fire V440 Se i pin per la porta di gestione seriale non corrispondono a quelli per le porte RJ 45 sul server terminal necessario creare un cavo incrociato che colleghi ciascun pin nella porta seriale del server Sun Fire V440 al pin corrispondente nella porta seriale del server terminal Nella TABELLA A 3 viene indicato il modo in cui necessario incrociare il cavo TABELLA A 3 Incroci dei pin per il collegamento a un server terminal standard Pin della porta seriale Sun Fire V440 connettore RJ 45 Pin della porta seriale del server terminal Pin 1 RTS Pin 1 CTS Pin 2 DTR Pin 2 DSR
136. ella GUI oppure inviati tramite posta elettronica Capitolo 2 Diagnostica e processo di boot 37 Monitoraggio del sistema mediante Sun Advanced Lights Out Manager Sun Advanced Lights Out Manager ALOM consente di monitorare e controllare il server su una porta seriale o un interfaccia di rete Il controller di sistema ALOM fornisce un interfaccia della riga di comando CLI Command Line Interface che consente di amministrare il server da ubicazioni remote Ci potrebbe risultare particolarmente utile nel caso di server distribuiti in diverse aree geografiche o fisicamente inaccessibili ALOM consente anche di accedere in remoto alla console di sistema e di eseguire test diagnostici ad esempio POST che richiederebbero altrimenti la vicinanza fisica alla porta seriale del server ALOM inoltre in grado di inviare messaggi di notifica tramite posta elettronica sui guasti hardware o altri eventi del server Il controller di sistema ALOM funziona in modo indipendente e utilizza l alimentazione di standby del server Pertanto il firmware e il software ALOM continuano a funzionare anche se il sistema operativo del server non in linea o il server viene spento Il software ALOM consente di monitorare gli elementi del server Sun Fire V440 riportati di seguito TABELLA 2 6 Elementi monitorati mediante ALOM Elemento monitorato Informazioni fornite da ALOM Comando da digitare Unit disco Ventole e vani ven Moduli CPU memo
137. ema appare bloccato tentare pi approcci al fine di ottenere una risposta da parte del sistema Vedere Risposta allo stato di blocco del sistema a pagina 133 Risposta allo stato di blocco del sistema Risolvere un problema di blocco del sistema pu risultare un processo difficile in quanto la causa principale del blocco potrebbe essere dissimulata da false indicazioni di errore derivanti da un altra parte del sistema Pertanto importante esaminare attentamente tutte le fonti di informazione disponibili prima di tentare qualsiasi rimedio Inoltre utile comprendere il tipo di blocco verificatosi sul sistema Queste informazioni sugli stati di blocco sono importanti soprattutto per i centri di assistenza qualora sia necessario contattarli Un blocco software del sistema pu essere caratterizzato da uno dei seguenti sintomi L utilizzabilit e le prestazioni del sistema diminuiscono gradualmente I nuovi tentativi di accesso al sistema non riescono Alcune parti del sistema non rispondono possibile portare il sistema al livello del prompt ok di OpenBoot Capitolo 7 Risoluzione dei problemi hardware 133 Alcuni blocchi software potrebbero ripristinarsi da soli mentre altri richiederanno l interruzione del sistema al fine di raccogliere informazioni al livello del prompt di OpenBoot Un blocco software dovrebbe rispondere a un segnale di arresto inviato tramite la console di sistema In caso di blocco hardware del sistema
138. emote Il controller di sistema ALOM consente di effettuare le seguenti operazioni Attivare e disattivare il sistema Controllare il LED di localizzazione Modificare le variabili di configurazione OpenBoot Visualizzare informazioni sullo stato dell ambiente del sistema Visualizzare i log degli eventi del sistema Inoltre possibile utilizzare il controller di sistema ALOM per accedere alla console di sistema purch non sia stata reindirizzata L accesso alla console di sistema consente di effettuare le seguenti operazioni Eseguire i test diagnostici OpenBoot Visualizzare l output dell ambiente operativo Solaris Visualizzare l output dei test POST Eseguire i comandi firmware al prompt ok Visualizzare gli errori che si verificano quando l ambiente operativo Solaris si arresta in modo anomalo Capitolo 6 Opzioni per la risoluzione dei problemi 121 Per ulteriori informazioni su ALOM vedere m Monitoraggio del sistema mediante Sun Advanced Lights Out Manager a pagina 38 m Monitoraggio del sistema mediante Sun Advanced Lights Out Manager a pagina 87 m Sun Advanced Lights Out Manager ALOM Online Help Per ulteriori informazioni sulla console di sistema vedere l Appendice A Registrazione della console di sistema La registrazione della console consente di raccogliere e registrare l output della console di sistema Tale funzione consente di catturare i messaggi della console affinch sia possibile registrare e anali
139. emoved il lettore della scheda funziona correttamente e il cavo integro Cavo del lettore della scheda di configurazione del sistema Cavo dell interruttore di Se l interruttore di controllo del sistema non risponde controllo del sistema ALOM non riconosce la posizione dell interruttore ma il pulsante di alimentazione funziona correttamente e il sistema rimane acceso molto probabile che tale cavo non sia collegato correttamente o sia danneggiato Un altra possibilit sebbene pi remota data un problema con il lettore della scheda di configurazione del sistema Nota La maggior parte dei cavi di ricambio per il server Sun Fire V440 sono disponibili solo all interno di un kit di cavi con numero di parte Sun 560 2713 Informazioni sul monitoraggio del sistema Sono disponibili i due seguenti strumenti Sun in grado di segnalare in anticipo eventuali problemi evitando tempi di inattivit del sistema m Sun Advanced Lights Out Manager ALOM m Sun Management Center Questi strumenti di monitoraggio consentono di specificare i criteri in base ai quali sorvegliare il sistema Ad esempio possibile abilitare gli avvisi per gli eventi del sistema ad esempio temperature eccessive guasti agli alimentatori o alle ventole e i ripristini del sistema e fare in modo che venga ricevuta una notifica qualora si verifichino tali eventi Gli avvisi relativi a eventuali problemi possono essere trasmessi mediante icone d
140. enti apportati al prodotto e viene fornita la documentazione pi aggiornata non inclusa nei manuali SunVTS User s Guide e SunVTS Test Reference Manual Capitolo 2 Diagnostica e processo di boot 45 46 Questi documenti sono disponibili sul CD ROM Solaris Supplement e sul Web all indirizzo http www sun com documentation anche possibile vedere il file README di SunVTS disponibile nella directory opt SUNWvts nel quale vengono fornite informazioni aggiornate sulla versione installata del prodotto Software SunVTS e meccanismi di protezione Durante l installazione del software SunVTS necessario scegliere uno dei due tipi di protezione disponibili Basic o Sun Enterprise Authentication Mechanism SEAM L opzione Basic utilizza un file di protezione locale presente nella directory di installazione di SunVTS per limitare gli utenti i gruppi e gli host a cui consentito utilizzare il software SunVTS La protezione SEAM si basa sul protocollo di autenticazione delle reti standard Kerberos e garantisce la protezione nell ambito dell autenticazione degli utenti l integrit dei dati e la riservatezza per le transazioni su rete Se nella postazione in uso viene utilizzata la protezione SEAM necessario avere il software client e server SEAM installato nell ambiente di rete e configurato correttamente nel software Solaris e SunVTS Se la protezione SEAM non viene utilizzata necessario non selezionare l opzione SEAM durante l i
141. er impostato la configurazione predefinita della console di sistema affinch sia possibile passare dal controller di sistema alla console di sistema Per informazioni vedere m Informazioni sulla comunicazione con il sistema a pagina 174 m Accesso mediante la porta di gestione di rete a pagina 178 Per ulteriori informazioni sugli errori irreversibili di ripristino e le eccezioni dello stato RED vedere Risposta agli errori irreversibili di ripristino e alle eccezioni dello stato RED a pagina 134 Per un esempio di messaggio di errore irreversibile di ripristino vedere il CODICE DI ESEMPIO 7 1 Per un esempio di messaggio di eccezioni dello stato RED vedere il CODICE DI ESEMPIO 7 2 Operazioni da eseguire Esaminare il log degli eventi ALOM Digitare quanto segue sc gt showlogs Il log degli eventi ALOM indica gli eventi del sistema quali eventi di ripristino e modifiche allo stato degli indicatori LED che si sono verificati dall ultimo boot del sistema Il CODICE DI ESEMPIO 7 19mostra un esempio di log degli eventi in cui viene indicato che il LED di richiesta di assistenza del pannello principale acceso CODICE DI ESEMPIO 7 19 Output del comando showlogs MAY 09 MAY 09 MAY 09 MAY 09 16 16 16 16 1 27 Sun SFV440 a 00060003 SC System booted 1 27 Sun SFV440 a 00040029 Host system has shut down 35 Sun SFV440 a 00060000 SC Login User admin Logged on 54 Sun SFV440 a 00060000
142. ere Accesso al prompt ok a pagina 186 7 Impostare le variabili di configurazione OpenBoot in modo appropriato Dalla console di sistema esistente digitare quanto segue ok setenv input device keyboard ok setenv output device screen Nota Sono disponibili molte altre variabili di configurazione OpenBoot Sebbene tali variabili non incidano sul dispositivo hardware utilizzato per accedere alla console di sistema alcune determinano i test diagnostici eseguiti dal sistema e i messaggi visualizzati sulla console di sistema Per informazioni dettagliate vedere Controllo della diagnostica POST a pagina 13 8 Per rendere effettive le modifiche apportate digitare quanto segue ok reset all 206 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Il sistema memorizza le modifiche ai parametri ed esegue automaticamente il boot quando la variabile di configurazione OpenBoot auto boot impostata su true valore predefinito Nota Per memorizzare le modifiche ai parametri spegnere e riaccendere il sistema utilizzando il pulsante di alimentazione del pannello principale Operazioni successive A questo punto possibile eseguire i comandi di sistema e visualizzare i messaggi di sistema sul monitor grafico locale Se necessario proseguire con l installazione o con la procedura di diagnostica Se si desidera reindirizzare la console di sistema sulle porte di gesti
143. eset Executing Power On SelfTest 0 gt Sun Fire TM V440 POST 4 10 3 2003 05 04 22 08 export work staff firmware re post post build 4 10 3 Fiesta chalupa integrated firmware re Capitolo 4 Monitoraggio del sistema 95 CODICE DI ESEMPIO 4 10 Output del comando consolehistory boot v messaggi di boot restituiti da POST Continua 0 gt Hard Powerup RST thru SW 0 gt CPUs present in system 0 1 0 gt OBP gt POST Call with 00 00000000 01012000 O gt Diag level set to MIN 0 gt MFG scrpt mode set NORM 0 gt I O port set to TTYA 0 gt O gt Start selftest 1 gt Print Mem Config 1 gt Caches Icache is ON Dcache is ON Wcache is ON Pcache is ON 1 gt Memory interleave set to 0 1 gt Bank 0 1024MB 00000010 00000000 gt 00000010 40000000 1 gt Bank 2 1024MB 00000012 00000000 gt 00000012 40000000 O gt Print Mem Config 0 gt Caches Icache is ON Dcache is ON Wcache is ON Pcache is ON O gt Memory interleave set to 0 0 gt Bank 0 1024MB 00000000 00000000 gt 00000000 40000000 0 gt Bank 2 1024MB 00000002 00000000 gt 00000002 40000000 O gt INFO 0 gt POST Passed all devices 0 gt 0 gt POST Return to OBP Nel seguente output di esempio viene illustrata l inizializzazione di OpenBoot PROM CODICE DI ESEMPIO 4 11 Output del comando consolehistory boot v inizializzazione di OpenBoot PROM Keyswitch set to diagnostic position OBP 4 10 3 2003 05 02 20 25 Sun Fir
144. essario disporre dei seguenti componenti m Scheda frame buffer grafica PCI supportata dal sistema e relativo driver software m Scheda frame buffer grafica PCI a colori a 8 24 bit il numero parte Sun X3768A o X3769A attualmente supportato m Monitor con risoluzione appropriata per supportare il frame buffer m Tastiera USB compatibile Sun tastiera USB Sun Type 6 m Mouse USB compatibile Sun mouse USB Sun e tappetino Operazioni da eseguire Installare la scheda grafica in uno slot PCI appropriato L installazione deve essere eseguita da personale di assistenza qualificato Per ulteriori informazioni consultare il documento Sun Fire V440 Server Parts Installation and Removal Guide o contattare il centro di assistenza di fiducia Appendice A Configurazione della console di sistema 203 2 Collegare il cavo video del monitor alla porta appropriata sulla scheda grafica Serrare le viti zigrinate per fissare il collegamento 3 Collegare il cavo di alimentazione del monitor a una presa di alimentazione CA 204 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 4 Collegare il cavo USB della tastiera a una porta USB nel pannello posteriore del server Sun Fire V440 Appendice A Configurazione della console di sistema 205 5 Collegare il cavo USB del mouse a una porta USB nel pannello posteriore del server Sun Fire V440 6 Accedere al prompt ok Per ulteriori informazioni ved
145. esso dedicano una sottorete separata alla gestione del sistema Se nel proprio centro dati in uso tale configurazione collegare la porta di gestione di rete a questa sottorete Nota La porta di gestione di rete una porta 10BASE T e viene utilizzata esclusivamente con il controller di sistema ALOM La porta di gestione di rete non supporta connessioni a reti da 100 Mbps o 1 Gbps Appendice A Configurazione della console di sistema 189 Operazioni da eseguire 1 Collegare un cavo Ethernet alla porta di gestione di rete 2 Eseguire il login al controller di sistema ALOM attraverso la porta di gestione seriale Per ulteriori informazioni sulla connessione alla porta di gestione seriale vedere Uso della porta di gestione seriale a pagina 188 3 Digitare uno dei seguenti comandi m Se la rete utilizza indirizzi IP statici digitare quanto segue sc gt setsc if network true sc gt setsc netsc ipaddr indirizzo ip sc gt setsc netsc ipnetmask indirizzo ip sc gt setsc netsc ipgateway indirizzo ip possibile utilizzare anche il comando setupsc m Sela rete utilizza il protocollo DHCP Dynamic Host Configuration Protocol digitare quanto segue sc gt setsc netsc dhcp 4 Per verificare le impostazioni di rete digitare quanto segue sc gt shownetwork 5 Eseguire il logout dalla sessione del controller di sistema ALOM Operazioni successive Per collegare la console di sistema
146. funzionare I dischi rigidi o i moduli di memoria di un server con risorse di memoria o disco numerose o ridondanti sono un esempio di parti non fondamentali In questi casi il software Hardware Diagnostic Suite viene eseguito fino all individuazione dell origine del problema senza avere alcun effetto sul funzionamento del sistema pertanto necessario mantenere in funzione il server su cui viene eseguito il test e spegnerlo solo nel caso sia necessario un intervento di riparazione Se la parte difettosa inseribile a caldo possibile completare l intero ciclo di diagnosi e riparazione senza influire in alcun modo sul lavoro degli utenti del sistema Requisiti per l uso di Hardware Diagnostic Suite Il software Hardware Diagnostic Suite basato su Sun Management Center e pu pertanto essere eseguito solo se il centro dati impostato per l esecuzione di Sun Management Center In altre parole necessario che un server master sia dedicato all esecuzione del software per server di Sun Management Center in grado di supportare il database del software Sun Management Center contenente le informazioni sullo stato della piattaforma inoltre necessario installare e configurare il software per agenti di Sun Management Center sul sistema da monitorare nonch installare la parte relativa alla console del software Sun Management Center da utilizzare come interfaccia del software Hardware Diagnostic Suite Per istruzioni sull imp
147. g platform SUNW Sun Fire V440 ufsboot Loading platform sun4u ufsboot SunOS Release 5 8 Version Generic 114696 04 64 bit Copyright 1983 2003 Sun Microsystems Inc All rights reserved Hardware watchdog enabled sc gt 4 Per informazioni su un errore controllare il file var adm messages Ricercare le seguenti informazioni sullo stato del sistema m Qualsiasi differenza sostanziosa nella stampigliatura della data del software Solaris o dei messaggi di applicazione m Messaggi di avvertenza su tutti i componenti hardware o software m Informazioni restituite dagli ultimi login di root per determinare se gli amministratori del sistema sono in grado di fornire informazioni sullo stato del sistema al momento del blocco 5 Se possibile verificare se il sistema ha salvato un file core dump I file core dump forniscono informazioni utili all assistenza tecnica per la diagnosi dei problemi del sistema Per ulteriori informazioni sui file core dump vedere Informazioni sul processo core dump a pagina 123 e la sezione relativa alle informazioni sulla gestione dei crash dei sistema nella documentazione Solaris System Administration Guide 6 Controllare i LED di sistema possibile utilizzare il controller di sistema ALOM per verificare lo stato dei LED di sistema Per informazioni sui LED di sistema vedere la documentazione Server Sun Fire V440 Guida di amministrazione Capitolo 7 Risoluzione dei problemi hardware 159
148. gato alla porta SERIAL MGT del server oppure utilizzando una connessione telnet alla porta NET MGT Per eseguire questa procedura inoltre necessario aver impostato la configurazione predefinita della console di sistema affinch sia possibile passare dal controller di sistema alla console di sistema Per informazioni vedere m Informazioni sulla comunicazione con il sistema a pagina 174 m Accesso mediante la porta di gestione di rete a pagina 178 Capitolo 4 Monitoraggio del sistema 87 88 Operazioni da eseguire 1 Se necessario digitare la sequenza di escape del controller di sistema Se non ancora visualizzato il prompt sc gt digitare la sequenza di escape del controller di sistema Per impostazione predefinita questa sequenza cancelletto punto ok Se necessario eseguire il login a ALOM Se non si eseguito il login a ALOM verra richiesto di digitare le seguenti informazioni Please login admin Please Enter password Immettere il nome di login e la password dell account admin oppure il nome e la password di un account di login differente se ne stato configurato uno Ai fini di questa procedura all account devono essere associati i privilegi completi Nota La prima volta che si accede a ALOM non risulta impostata alcuna password per l account admin Viene richiesto di fornirne una la prima volta che si tenta di eseguire un comando privilegiato Prendere nota
149. gitare quanto segue sc gt bootmode diag Questo comando sostituisce temporaneamente l impostazione diag switch dei test diagnostici OpenBoot del server provocando l esecuzione dei test diagnostici all accensione POST durante i cicli di accensione e spegnimento Se il server non esegue il ciclo di accensione e spegnimento entro 10 minuti viene ripristinato sui valori predefiniti b Eseguire il ciclo di accensione e spegnimento del sistema Digitare quanto segue sc gt poweroff Are you sure you want to power off the system y n y sc gt poweron L esecuzione dei test diagnostici POST ha inizio nel momento in cui viene eseguito il reboot del sistema Tuttavia non verranno visualizzati messaggi finch non si passa da ALOM alla console di sistema Per informazioni dettagliate vedere Passaggio dal controller di sistema ALOM alla console di sistema a pagina 185 Capitolo 4 Monitoraggio del sistema 99 c Passare alla console di sistema Digitare quanto segue sc gt console Enter to return to ALOM 0 gt Sun Fire TM V440 POST 4 10 0 2003 04 01 22 28 export work staff firmware re post post build 4 10 0 Fiesta chalupa integrated firmware re 0 gt Hard Powerup RST thru SW 0 gt CPUs present in system 0 1 2 3 0 gt OBP gt POST Call with 00 00000000 01008000 A questo punto dovrebbero essere visualizzati l output della console e i messaggi POST L esattezza del testo visua
150. gli strumenti di isolamento dei guasti tabella 36 numero parte 32 POST e 13 produttore 32 fsck comando Solaris 184 G gestione delle patch firmware 117 software 117 gestione delle patch del firmware 117 gestione delle patch del software 117 211 go comando OpenBoot 184 guasti isolamento strumenti in base all unit FRU tabella 35 uso dei test diagnostici OpenBoot 75 uso dei test diagnostici POST 73 uso dei test OpenBoot Diagnostics 21 uso di POST 12 H H W under test vedere interpretazione dei messaggi di errore Hardware Diagnostic Suite componente aggiuntivo di Sun Management Center 42 informazioni sull analisi del sistema 46 hardware percorsi dei dispositivi 20 24 hardware risoluzione dei problemi 129 hardware visualizzazione della revisione con showrev 33 HP Openview vedere strumenti di monitoraggio di terze parti I I2C indirizzi dei dispositivi tabella 54 IEEE 1275 compatibile diagnostica automatica incorporata 17 64 68 indirizzo bitwalk diagnostica POST 11 dispositivi I2C tabella 54 init comando Solaris 182 187 inizializzazione della memoria 146 inizializzazione di OpenBoot PROM 145 input device variabile 15 Integrated Drive Electronics vedere bus IDE interpretazione dei messaggi di errore POST 11 test 2C 22 test OpenBoot Diagnostics 21 interruttore di controllo del sistema modifica delle posizioni nella risoluzione dei problemi 169 iosta
151. gnostici POST e OpenBoot Diagnostics includono acronimi o abbreviazioni che fanno riferimento a componenti hardware secondari Nella TABELLA 2 15 vengono fornite informazioni per la decodifica di tali termini i quali vengono inoltre associati a unit FRU specifiche se appropriato TABELLA 2 15 Abbreviazioni o acronimi negli output dei test diagnostici Termine Descrizione FRU associate ADC Analog to Digital Converter Scheda madre APC Advanced Power Control funzione fornita Scheda madre mediante il circuito integrato Southbridge Bell Elemento del circuito ripetitore che fa parte Scheda madre del bus di sistema CRC Cyclic Redundancy Check Nessuna DMA Direct Memory Access negli output dei test Scheda PCI diagnostici in genere fa riferimento a un controller su una scheda PCI 56 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 TABELLA 2 15 Abbreviazioni o acronimi negli output dei test diagnostici Continua Termine Descrizione FRU associate HBA Host Bus Adapter Scheda madre e altre PC Inter Integrated Circuit scritto anche I2C bus di Varie vedere la dati seriale bidirezionale a due cavi utilizzati TABELLA 2 14 principalmente per il monitoraggio e il controllo ambientale IO Bridge Bus di sistema al circuito integrato del bridge PCI Scheda madre come Tomatillo JBus Architettura di interconnessione del sistema Scheda madre costituita dai bus di dati e
152. gpio 0 46 gpio 0 48 Testing pci le 600000 isa 7 i2c 0 320 tests hardware monitor 0 5c Testing pci le 600000 isa 7 i2c 0 320 tests temperature sensor 0 9c Testing pci lc 600000 network 2 Testing pci 1 700000 scsi 2 1 Testing pci 1f 700000 scsi 2 Nel seguente output di esempio viene illustrata l inizializzazione della memoria mediante OpenBoot PROM CODICE DI ESEMPIO 4 14 Output del comando consolehistory boot v inizializzazione della memoria Initializing 1MB of memory at addr 123fe02000 Initializing 12MB of memory at addr 123 000000 Initializing 1008MB of memory at addr 1200000000 Initializing 1024MB of memory at addr 1000000000 Initializing 1024MB of memory at addr 200000000 Capitolo 4 Monitoraggio del sistema 97 CODICE DI ESEMPIO 4 14 Output del comando consolehistory boot v inizializzazione della memoria Initializing 1024MB of memory at addr 0 1 ok boot disk Nel seguente output di esempio viene illustrato il boot del sistema e il caricamento del software Solaris CODICE DI ESEMPIO 4 15 Output del comando consolehistory boot v boot del sistema e caricamento del software Solaris Rebooting with command boot disk Boot device pci 1f 700000 scsi 2 disk 0 0 File and args Loading ufs file system package 1 4 04 Aug 1995 13 02 54 FCode UFS Reader 1 11 97 07 10 16 19 15 Loading platform SUNW Sun Fire V440 ufsboot Loading platform s
153. hassis HDD0 Label HDD0 disk fru osta frutree chassis PCI0 Label PCI0 frutree chassis PCI1 Label PCI1 frutree chassis PCI2 Label PCI2 Nel seguente CODICE DI ESEMPIO 2 15 viene riportato un estratto dei dati SEEPROM generati mediante il comando prt fru utilizzato con l opzione c CODICE DI ESEMPIO 2 15 Output del comando prtfru c frutree chassis SC Label SC system controller container SEGMENT SD ManR ManR UNIX Timestamp32 Wed Dec 31 19 00 00 EST 1969 ManR Fru Description ASSY CHLPA RMC ManR Manufacture_ Loc ManR Sun Part _No 5016346 ManR Sun Serial No ManR Vendor_ Name NO JEDEC CODE FOR THIS VENDOR ManR Initial HW Dash Level 03 ManR Initial HW Rev Level ManR Fru Shortname CHLPA RMC SpecPartNo 885 0084 03 frutree chassis MB Label MB system board container SEGMENT SD ManR ManR UNIX_Timestamp32 Mon Nov 4 15 35 24 EST 2002 ManR Fru_Description ASSY CHLPA MOTHERBOARD N gt gt Capitolo 2 Diagnostica e processo di boot 31 CODICE DI ESEMPIO 2 15 Output del comando prt fru c Continua ManR Manufacture Loc Celestica Toronto Ontario ManR Sun_ Part No 5016344 ManR Sun Serial No 000001 ManR Vendor Name Celestica ManR Initial HW Dash Level 03 ManR Initial HW Rev Level 06 ManR Fru Shortname CHLPA MB SpecPartNo 885 0060 02 I dati visualizzati mediante il comando prt fru variano in base al tipo di unit FRU Di seguito vengono riportate l
154. he l esecuzione di determinati comandi OpenBoot quali probe scsi probe scsi all o probe ide pu provocare la sospensione del sistema Ripristino XIR Externally Initiated Reset Utilizzare il comando reset x del controller di sistema ALOM per eseguire un ripristino XIR Externally Initiated Reset L esecuzione di un ripristino XIR pu interrompere lo stallo che provoca la sospensione del sistema ma impedisce la chiusura regolare delle applicazioni Non rappresenta pertanto il metodo di accesso al prompt ok pi appropriato a meno che non si stia tentando di risolvere un problema di sospensione del sistema L esecuzione di un ripristino XIR offre il vantaggio di poter eseguire il comando sync per generare un file dump dello stato corrente del sistema a fini diagnostici Per ulteriori informazioni sul comando reset x vedere la Sun Advanced Lights Out Manager ALOM Online Help Appendice A Configurazione della console di sistema 183 Attenzione Poich il ripristino XIR impedisce una chiusura regolare delle applicazioni consigliabile utilizzarlo solo se i metodi descritti precedentemente non dovessero funzionare Ripristino manuale del sistema Per ripristinare il server utilizzare il comando reset del controller di sistema ALOM oppure i comandi poweroff e poweron Come ultima risorsa possibile accedere al prompt ok mediante l esecuzione di un ripristino manuale del sistema o lo spegnimento e la riaccensione del sistem
155. i anche se non possibile eseguire il boot del sistema devono essere indipendenti dal sistema operativo L indipendenza dal sistema operativo implica tuttavia l impossibilit da parte di tali strumenti di utilizzare le numerose risorse del sistema per rilevare le cause pi complesse dei guasti 4 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Un altro fattore che rende lo scenario ancora pi complesso rappresentato dai diversi requisiti di diagnostica richiesti dalle diverse postazioni possibile ad esempio dover amministrare un singolo computer oppure un intero centro dati costituito da numerose attrezzature montate in rack I sistemi possono inoltre essere installati in remoto ad esempio in aree a cui non possibile accedere fisicamente infine necessario prendere in considerazione le diverse funzioni che si desidera eseguire mediante gli strumenti diagnostici m Isolamento dei guasti identificando il componente hardware sostituibile interessato m Analisi del sistema per identificare problemi meno evidenti collegati o meno all hardware m Monitoraggio del sistema per individuare i problemi prima che diventino pi gravi ed evitare tempi di inattivit non previsti Nessuno di tali strumenti diagnostici in grado di eseguire in modo ottimale tutte le funzioni descritte in precedenza Anzich un unico strumento diagnostico Sun rende disponibili diversi strumenti ciasc
156. i dati che li collegano 1 gt ERROR TEST Data Bitwalk on Slave 3 1 gt H W under test CPU3 BO D1 J0602 side 1 Bank 1 CPU Module C3 1 gt Repair Instructions Replace items in order listed by H W under test above 1 gt MSG ERROR miscompare on mem test Address 00000030 001b0040 Expected ffffffff fffffffe Observed fffffbff fffffff6 In questo caso il guasto stato individuato nel modulo DIMM con etichetta J0602 e associato alla CPU 3 Per informazioni sui diversi modi in cui la memoria viene identificata nei messaggi firmware vedere Identificazione dei moduli di memoria a pagina 48 Informazioni fornite dai messaggi di errore POST Di seguito vengono indicate le informazioni riportate nell output di un test diagnostico all accensione POST mediante il quale viene rilevato un errore m Test specifico non riuscito m Circuito integrato o componente secondario specifico probabilmente guasto m Unit sostituibili in loco FRU che potrebbero dover essere sostituite a partire da quella che necessario sostituire con maggiore probabilit Capitolo 2 Diagnostica e processo di boot 11 Di seguito viene riportato un estratto di output POST contenente un altro messaggio di errore CODICE DI ESEMPIO 2 1 Messaggio di errore POST 1 gt ERROR TEST IO Bridge unit 0 PCI id test 1 gt H W under test Motherboard I0 Bridge 0 CPU 1 gt Repair Instructions Replace items in order listed by H W under test above
157. i e le indicazioni di errore l utente o i centri di assistenza Sun devono conoscere l ambiente operativo del sistema i livelli di revisione delle patch e la configurazione hardware specifica Vedere Registrazione delle informazioni relative al sistema a pagina 132 m Confrontare le caratteristiche della propria situazione con le ultime informazioni pubblicate relative al sistema Spesso i problemi riscontrati con cui non si ha alcuna familiarit sono stati notati diagnosticati e risolti da altri utenti Queste informazioni possono consentire all utente di evitare spese inutili per la sostituzione di componenti che in realt non sono danneggiati Per informazioni sulle origini vedere Informazioni aggiornate sulla risoluzione dei problemi a pagina 116 130 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 Informazioni sugli errori dal controller di sistema ALOM Nella maggior parte dei casi di risoluzione dei problemi possibile utilizzare il controller di sistema ALOM come fonte principale di informazioni sul sistema Sul server Sun Fire V440 il controller di sistema ALOM consente l accesso a diversi log di sistema e ad altre informazioni sul sistema anche quando il sistema spento Per ulteriori informazioni su ALOM vedere m Monitoraggio del sistema mediante Sun Advanced Lights Out Manager a pagina 38 m Monitoraggio del sistema mediante Sun Advanced Lights Out Manager a pagi
158. i monitoraggio e di controllo ambientale collegati al bus Inter Integrated Circuit I2C del server Sun Fire V440 e ne notificano lo stato Nei messaggi di errore e di stato generati dal test OpenBoot Diagnostics i2c 0 320 vengono indicati gli indirizzi hardware dei dispositivi del bus PC Testing pci le 600000 isa 7 i2c 0 320 dimm spd 0 b6 L indirizzo del dispositivo I C viene indicato alla fine del percorso hardware Nell esempio precedente l indirizzo 0 b6 e indica un dispositivo che si trova in corrispondenza dell indirizzo esadecimale b6 sul segmento 0 del bus IC Per informazioni su come decodificare l indirizzo dei dispositivi vedere Riferimenti per la decodifica dei messaggi dei test diagnostici I C a pagina 54 Come indicato nella TABELLA 2 14 dimm spd 0 b6 corrisponde al modulo DIMM 0 sul modulo CPU memoria 0 Se il test i2c 0 320 indica la presenza di un errore in dimm spd 0 b6 necessario sostituire tale modulo DIMM Alti comandi OpenBoot Oltre agli strumenti diagnostici basati su firmware standard sono disponibili diversi comandi che possibile richiamare dal prompt ok Tali comandi OpenBoot consentono di visualizzare le informazioni necessarie a valutare la condizione di un server Sun Fire V440 Di seguito vengono riportati alcuni comandi disponibili printenv probe scsi e probe scsi all probe scsi show devs Nelle seguenti sezioni vengono descritte le informazioni fornite mediante l esecuz
159. i sistema Alcuni comandi Solaris consentono di visualizzare dati che possibile utilizzare durante la valutazione delle condizioni di un server Sun Fire V440 Di seguito vengono riportati alcuni comandi disponibili comando prtconf comando prtdiag comando prtfru comando psrinfo comando showrev Nelle seguenti sezioni vengono descritte le informazioni fornite mediante l esecuzione di tali comandi Per istruzioni sulle modalit di utilizzo dei comandi in questione vedere Uso dei comandi Solaris per le informazioni di sistema a pagina 101 oppure vedere la pagina man appropriata Comando prtconf Il comando prtconf consente di visualizzare la struttura ad albero dei dispositivi Solaris nella quale sono inclusi tutti i dispositivi controllati mediante il firmware OpenBoot e altri dispositivi aggiuntivi tra cui i singoli dischi che possono essere riconosciuti solo dal software dell ambiente operativo Nell output restituito dal comando prtconf viene indicata anche la quantit totale di memoria del sistema Nel seguente CODICE DI ESEMPIO 2 7 viene riportato un estratto di output del comando prtconf modificato per motivi di spazio 26 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 CODICE DI ESEMPIO 2 7 Output del comando prt conf System Configuration Sun Microsystems sun4u Memory size 16384 Megabytes System Peripherals Software Nodes SUNW Sun Fire V440 packages driver not
160. iag 30 connessione tip 177 194 console di sistema altri metodi di configurazione 178 configurazione predefinita 174 176 connessione tip 177 194 definizione 174 messaggi 8 modalita di accesso connessione tip 194 monitor grafico locale 203 terminale alfanumerico 199 monitor grafico locale 179 registrazione dei messaggi di errore 122 variabili di configurazione OpenBoot riferimento 207 console comando controller di sistema 100 182 183 186 187 console vedere console di sistema consolehistory boot v comando controller di sistema errori di ripristino irreversibili ed eccezioni stato RED 156 uso nella risoluzione dei problemi 144 uso nella risoluzione di problemi di boot 168 consolehistory run v comando controller di sistema errori di ripristino irreversibili ed eccezioni stato RED 154 uso nella risoluzione dei problemi dopo un reboot non previsto 142 uso nella risoluzione di problemi di boot 165 210 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 controller di sistema vedere anche ALOM come ignorare i test diagnostici 16 introduzione 9 piano posteriore SCSI 36 core dump abilitazione per la risoluzione dei problemi 124 uso nella risoluzione dei problemi 123 verifica 126 CPU Central Processing Unit unita centrale di elaborazione master 9 11 numerazione dei moduli del processore 51 visualizzazione delle informazioni 32 D data bitwalk
161. iagnostica e sul processo di boot a pagina 8 Una volta eseguito il boot dell ambiente operativo possibile utilizzare la console di sistema per visualizzare i messaggi del sistema UNIX e inserire i comandi UNIX Uso della console di sistema Per utilizzare la console di sistema necessario collegare al server componenti hardware che consentano di inserire dati nel sistema e di recuperarli Inizialmente potrebbe essere necessario configurare tali componenti hardware nonch caricare e configurare applicazioni software appropriate necessario anche assicurarsi che la console di sistema sia diretta alla porta appropriata sul pannello posteriore del server Sun Fire V440 solitamente quella alla quale collegato il dispositivo hardware della console Vedere la FIGURA A 1 A tale scopo impostare le variabili di configurazione OpenBoot input device e output device Appendice A Configurazione della console di sistema 175 Server Sun Fire V440 Porte Dispositivi di console SERIAL MGT Impostazioni delle variabili di configurazione OpenBoot 4 Linea tip input device ttya output device ttya Terminale NET MGT alfanumerico input device ttyb Server Console GC som trae Reh RIE SE terminal sistema output device ttyb E ttyb N N N input device keyboard Moni onitor NS es Se ee Ss ee n ra gt 4 I grafico output device screen Scheda grafica
162. icati al momento dell installazione del software di sistema Oltre ai pacchetti SunVTS stessi per eseguire il software SunVTS a partire dalla versione 5 1 sono necessari alcuni pacchetti di librerie runtime e XML che potrebbero non essere installati come impostazione predefinita sul software Solaris 8 Operazioni preliminari Questa procedura presuppone che l ambiente operativo Solaris sia in esecuzione sul server Sun Fire V440 e che l utente abbia accesso alla riga di comando Solaris Per ulteriori informazioni vedere m Informazioni sulla comunicazione con il sistema a pagina 174 Operazioni da eseguire Verificare la presenza dei pacchetti SunVTS Digitare quanto segue pkginfo 1 SUNWvts SUNWvtsx SUNWvtsmn m Se il software SunVTS caricato vengono visualizzate informazioni sui pacchetti m Se il software SunVTS non caricato viene visualizzato un messaggio di errore per ogni pacchetto mancante ERROR information for SUNWvts was not found ERROR information for SUNWvtsx was not found Capitolo 5 Analisi del sistema 109 Di seguito vengono indicati i pacchetti appropriati Pacchetto Descrizione SUNWvts Kernel interfaccia utente e test binari a 32 bit SunVTS SUNWvtsx Test binari a 64 bit e kernel SunVTS SUNWvtsmn Pagine man SunVTS 2 Solo Solaris 8 Verificare la presenza di ulteriori applicazioni software necessarie E necessario eseguire questa operazione solo se si des
163. iche al file e che il codice hardwire sia stato modificato o eliminato controllare che il codice corrisponda a quello riportato nel seguente esempio ed eventualmente apportare le modifiche appropriate CODICE DI ESEMPIO A 1 Codice di hardwire in etc remote versioni recenti del software di sistema hardwire dv dev term b br 9600 el C S 0 U D ie 0e D Nota Se si desidera utilizzare la porta seriale A del sistema Sun anzich la porta seriale B modificare tale codice sostituendo dev term b con dev term a m Seilnumero visualizzato mediante il comando uname r corrisponde a una versione precedente alla 5 0 Controllare il file etc remote e aggiungere il codice seguente qualora non sia gi presente CODICE DI ESEMPIO A 2 Codice di hardwire in etc remote versioni precedenti del software di sistema hardwire dv dev ttyb br 9600 el C S 0 U D ie 0e D Nota Se si desidera utilizzare la porta seriale A del sistema Sun anzich la porta seriale B modificare tale codice sostituendo dev ttyb con dev ttya 198 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Operazioni successive A questo punto il file etc remote configurato correttamente Continuare a stabilire la connessione tip alla console di sistema del server Sun Fire V440 Per informazioni consultare le seguenti sezioni m Accesso alla console di sistema mediante la
164. idera installare ed eseguire il software SunVTS 5 1 o versioni successive compatibili sull ambiente operativo Solaris 8 Per utilizzare il software SunVTS 5 1 sono necessari ulteriori pacchetti che potrebbero non essere stati installati con il software Solaris 8 Per eseguire tale verifica digitare il seguente comando pkginfo 1 SUNWlxml SUNWlxmlx SUNWzlib SUNWzlibx Questo comando consente di verificare la presenza dei pacchetti indicati di seguito Pacchetto Descrizione Note SUNX1xml1 Libreria XML 32 bit Richiesto da SunVTS 5 1 SUNW1xm1x Libreria XML 64 bit SUNWzlib Libreria di compressione Zip Necessario per 32 bit le librerie XML SUNWZlibx Libreria di compressione Zip 64 bit 3 Se necessario caricare i pacchetti mancanti Utilizzare l utility pkgadd per caricare sul sistema i pacchetti SunVTS e dei supporti individuati durante la procedura descritta al Punto 1 o al Punto 2 Nel caso dell ambiente operativo Solaris 8 i pacchetti SunVTS e XML sono inclusi nel CD Software Supplement I pacchetti zlib sono inclusi nel CD di installazione principale Solaris all interno del gruppo di software Solaris completo Tenere presente che opt SUNWvts la directory di installazione predefinita del software SunVTS 110 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 4 Caricare le patch per SunVTS se necessario Le patch per il software SunVTS vengono
165. indicare la mancata riuscita del test ma non il motivo Pertanto sebbene i test diagnostici POST possano fornire dati particolarmente precisi sulla natura dell errore nel test diverse unit FRU potrebbero essere indicate come possibile causa dell errore Controllo della diagnostica POST possibile eseguire il controllo dei test diagnostici POST e di altri aspetti del processo di boot impostando le variabili di configurazione OpenBoot nella scheda di configurazione del sistema In genere per rendere effettive le modifiche apportate alle variabili di configurazione OpenBoot necessario eseguire un ripristino del server Capitolo 2 Diagnostica e processo di boot 13 Nella TABELLA 2 1 viene fornito un elenco delle variabili pi importanti e utili Informazioni dettagliate su tali variabili sono fornite nel manuale OpenBoot Command Reference Manual Istruzioni sulla modalit di modifica delle variabili di configurazione OpenBoot vengono fornite nella sezione Visualizzazione e impostazione delle variabili di configurazione OpenBoot a pagina 60 TABELLA 2 1 Variabili di configurazione OpenBoot Variabile di configurazione OpenBoot Descrizione e parole chiave auto boot diag level diag script diag switch Determina se il sistema operativo viene avviato automaticamente L impostazione predefinita true e true il sistema operativo viene avviato automaticamente al termine dell inizializzazione del firmware Open
166. ingoli test facendo clic con il pulsante destro del mouse sul nome del test Ad esempio nella figura riportata al Punto 5 se si fa clic con il pulsante destro del mouse sulla stringa di testo ce0 nettest viene visualizzato un menu di configurazione del test Ethernet in questione TABELLA 5 1 Test SunVTS utili da eseguire su un sistema Sun Fire V440 Test SunVTS Unit FRU analizzate dai test cputest fputest iutest Modulo CPU memoria scheda madre lidcachetest indirettamente 12cachetest 12sramtest mptest mpconstest systest disktest Dischi cavi piano posteriore SCSI dvdtest cdtest Dispositivo DVD cavo scheda madre env test i2c2test Alimentatori vani ventole LED scheda madre scheda ALOM scheda di configurazione SCC modulo CPU memoria DIMM piano posteriore SCSI nettest netlbtest Interfaccia di rete cavo di rete scheda madre pmemtest vmemtest DIMM modulo CPU memoria scheda madre ssptest Scheda ALOM sutest Scheda madre porta seriale ttyb usbkbtest disktest Dispositivi USB cavo scheda madre controller USB Capitolo 5 Analisi del sistema 107 108 8 Avviare i test Fare clic sul pulsante Avvia situato nella parte superiore sinistra della finestra SunVTS per avviare l esecuzione dei test attivati I messaggi di stato e di errore vengono visualizzati nell area dei messaggi dei test disponibile nella parte inferiore della finestra possibile interrompere l esecuzione dei tes
167. io modificare ulteriormente tale file Per ulteriori dettagli vedere Modifica del file etc remote a pagina 197 3 In una finestra Shell Tool del sistema Sun digitare quanto segue o tip hardwire Il sistema Sun restituisce il seguente output connected A questo punto la finestra Shell Tool una finestra tip diretta al server Sun Fire V440 mediante la porta seriale del sistema Sun Questa connessione viene stabilita e mantenuta anche se il server Sun Fire V440 completamente spento o stato appena avviato Nota Utilizzare la finestra Shell Tool o un terminale CDE come dtterm non una finestra Command Tool E possibile che alcuni comandi tip non funzionino correttamente in una finestra Command Tool Appendice A Configurazione della console di sistema 195 4 Se si desidera utilizzare ttyb anzich la porta di gestione seriale effettuare quanto segue a Reindirizzare la console di sistema modificando le variabili di configurazione OpenBoot Al prompt ok digitare i seguenti comandi ok setenv input device ttyb ok setenv output device ttyb Nota E possibile accedere al prompt sc gt e visualizzare i messaggi POST solo dalla porta di gestione seriale o dalla porta di gestione di rete Nota Sono disponibili molte altre variabili di configurazione OpenBoot Sebbene tali variabili non incidano sul dispositivo hardware utilizzato per accedere alla console di sistema alc
168. ione di tali comandi Per istruzioni sulle modalit di utilizzo dei comandi in questione vedere Uso dei comandi OpenBoot per le informazioni di sistema a pagina 102 oppure vedere la pagina man appropriata Comando printenv Il comando printenv consente di visualizzare le variabili di configurazione OpenBoot Vengono visualizzati i valori correnti e i valori predefiniti delle variabili Per informazioni dettagliate vedere Visualizzazione e impostazione delle variabili di configurazione OpenBoot a pagina 60 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Per un elenco delle principali variabili di configurazione OpenBoot vedere la TABELLA 2 1 Comandi probe scsi e probe scsi all I comandi probe scsi e probe scsi all consentono di diagnosticare i problemi che si verificano nei dispositivi SCSI collegati e interni Attenzione Se stato utilizzato il comando halt o la sequenza di tasti L1 A Stop A per accedere al prompt ok l uso del comando probe scsi o probe scsi all pu provocare un blocco del sistema Il comando probe scsi comunica con tutti i dispositivi SCSI collegati ai controller SCSI su scheda Il comando probe scsi all ha tuttavia accesso anche ai dispositivi collegati alle schede host installate negli slot PCI Per qualsiasi dispositivo SCSI collegato e attivo i comandi probe scsi e probe scsi all consentono di visualizzare i numeri della destinazione e dell unit
169. ione iniziale verr richiesto di inserire un nome utente e una password ogni volta che si accede al controller di sistema ALOM Accesso mediante pi sessioni del controller possibile avere fino a cinque sessioni del controller di sistema ALOM attive contemporaneamente una sessione attraverso la porta di gestione seriale e un massimo di quattro sessioni attraverso la porta di gestione di rete Gli utenti di ciascuna di tali sessioni possono immettere comandi al prompt sc gt ma solo un utente alla volta pu accedere alla console di sistema e solo se la console di sistema stata configurata in modo da essere accessibile mediante le porte di gestione seriale e di rete Per ulteriori informazioni vedere m Uso della porta di gestione seriale a pagina 188 m Attivazione della porta di gestione di rete a pagina 189 Le altre sessioni del controller di sistema ALOM possono solo visualizzare l attivit della console di sistema fino a quando l utente attivo non esegue il logout dalla console di sistema Tuttavia il comando console f se attivato consente agli utenti di ottenere l accesso alla console di sistema dall utente attivo Per ulteriori informazioni vedere Sun Advanced Lights Qut Manager ALOM Online Help 180 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Metodi di accesso al prompt sc gt E possibile accedere al prompt sc gt in diversi modi Tali metodi sono illustrati
170. ipristino inizializzato dall utente o dal sistema operativo I comandi OpenBoot boot e reset all e il comando Solaris reboot sono esempi di eventi di ripristino inizializzati dall utente e all resets qualsiasi tipo di ripristino del sistema e none non viene eseguito alcun test diagnostico POST o OpenBoot Diagnostics input device Seleziona il dispositivo di input della console di sistema L impostazione predefinita ttya e ttya porte di gestione seriale e della rete e ttyb porta seriale B incorporata keyboard tastiera collegata di un monitor grafico locale output device Seleziona il dispositivo sul quale vengono visualizzati i risultati dei test diagnostici e altri output della console di sistema L impostazione predefinita ttya e ttya porte di gestione seriale e della rete e ttyb porta seriale B incorporata e screen schermo collegato di un monitor grafico locale Non possibile visualizzare i messaggi POST su un monitor grafico Tali messaggi vengono pertanto inviati alla porta ttya anche se la variabile output device impostata su screen Allo stesso modo i test diagnostici POST supportano solo la porta ttya come dispositivo di input Nota Le impostazioni di tali variabili influiscono sia sui test OpenBoot Diagnostics che sulla diagnostica POST Capitolo 2 Diagnostica e processo di boot 15 16 Diagnostica affidabilita e disponibilita Le variabili di configurazione OpenBoot descritte nel
171. is riflettono l orario locale server Pertanto un singolo evento pu generare messaggi che sembrano registrati in momenti differenti su log differenti 2 Esaminare il log di esecuzione ALOM Digitare quanto segue sc gt consolehistory run v Questo comando mostra il log contenente l output della console di sistema pi recente relativo ai messaggi di boot restituiti dal software Solaris Durante la risoluzione dei problemi esaminare l output per individuare errori hardware o software registrati dall ambiente operativo sulla console di sistema Il CODICE DI ESEMPIO 7 20 mostra un esempio di output restituito dal comando consolehistory run v CODICE DI ESEMPIO 7 20 Output del comando consolehistory run v May 9 14 48 22 Sun SFV440 a rmclomv SC Login User admin Logged on init 0 INIT New run level 0 The system is coming down Please wait System services are now being stopped 154 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 CODICE DI ESEMPIO 7 20 Output del comando consolehistory run v Continua Print services stopped May 9 14 49 18 Sun SFV440 a last message repeated 1 time May 9 14 49 38 Sun SFV440 a syslogd going down on signal 15 The system is down syncing file systems done Program terminated 1 ok boot disk Sun Fire V440 No Keyboard Copyright 1998 2003 Sun Microsystems Inc All rights reserved OpenBoot 4 10 3
172. istema Alcuni errori sono provocati da interazioni e incompatibilit tra hardware e software Se si dispone di tutte le informazioni relative al sistema possibile che si sia in grado di risolvere rapidamente un problema aggiornando semplicemente il firmware del sistema La conoscenza di recenti aggiornamenti o sostituzioni di componenti pu evitare che vengano sostituiti componenti non danneggiati 132 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 Informazioni sugli stati degli errori del sistema Durante la risoluzione dei problemi importante comprendere il tipo di errore verificatosi per distinguere tra blocchi del sistema reali e apparenti e per rispondere in modo appropriato alle condizioni di errore in modo da preservare le informazioni utili Risposta agli stati degli errori del sistema A seconda della gravit di un errore del sistema un server Sun Fire V440 potrebbe o meno rispondere ai comandi eseguiti sul sistema Una volta raccolte tutte le informazioni disponibili possibile avviare l azione Le azioni dipendono dalle informazioni gi raccolte e dallo stato del sistema Indicazioni da tenere presenti m Evitare l esecuzione di un ciclo di accensione e spegnimento del sistema finch non sono state raccolte tutte le informazioni possibili Le informazioni sugli errori potrebbero andare perse durante il ciclo di accensione e spegnimento del sistema m Se il sist
173. istema al prompt ok tramite l operazione precedente eseguire un ripristino XIR L esecuzione di un ripristino XIR ripristina il sistema e mantiene lo stato del sistema precedente al ripristino affinch sia possibile salvare le indicazioni e le informazioni sugli errori temporanei Un ripristino XIR equivale a un ripristino hardware diretto Per ulteriori informazioni sul ripristino XIR vedere Ripristino XIR Externally Initiated Reset a pagina 183 5 Se un ripristino XIR consente al sistema di accedere al prompt ok effettuare le seguenti operazioni a Eseguire il comando printenv Questo comando visualizza le impostazioni delle variabili di configurazione OpenBoot b Impostare la variabile auto boot su true la variabile diag switch su true la variabile diag level su max e le variabili post trigger e obdiag trigger su all resets c Eseguire il comando sync per ottenere un file core dump I file core dump forniscono informazioni utili all assistenza tecnica per la diagnosi dei problemi del sistema Per ulteriori informazioni sui file core dump vedere Informazioni sul processo core dump a pagina 123 e la sezione relativa alle informazioni sulla gestione dei crash dei sistema nella documentazione Solaris System Administration Guide all interno di Solaris System Administrator Collection Il reboot del sistema viene eseguito automaticamente purch la variabile di configurazione OpenBoot auto boot sia impostata su tru
174. k a pagina 186 103 104 Analisi del sistema mediante il software SunVTS Operazioni preliminari necessario che l ambiente operativo Solaris sia in esecuzione Accertarsi inoltre che il software SunVTS Sun Validation Test Suite sia installato sul sistema Per informazioni vedere m Come verificare se il software SunVTS installato a pagina 109 Il software SunVTS richiede l uso di uno dei due schemi di protezione disponibili Per eseguire la procedura descritta in questa sezione necessario che tali schemi siano configurati in modo appropriato Per informazioni dettagliate vedere m SunVTS User s Guide m Software SunVTS e meccanismi di protezione a pagina 46 Il software SunVTS dispone sia di un interfaccia a caratteri sia di un interfaccia grafica In questa procedura si presuppone che si utilizzi l interfaccia grafica utente GUI Graphical User Interface su un sistema su cui viene eseguito l ambiente Common Desktop Environment CDE Per ulteriori informazioni sull interfaccia TTY a caratteri di SunVTS e specificamente per istruzioni sulla modalit di accesso a tale interfaccia mediante i comandi tip o telnet vedere la documentazione SunVTS User s Guide Sono disponibili diverse modalita di esecuzione del software SunVTS Questa procedura presuppone che si utilizzi la modalita predefinita Funzionale Per una descrizione di tali modalita vedere m Analisi del sistema mediante il software SunVTS a
175. l esperienza e al buon senso possono risolvere molti problemi che potrebbero sorgere In questo capitolo vengono descritte le seguenti attivit m Risoluzione dei problemi di un sistema con risposta da parte del sistema operativo a pagina 137 m Risoluzione dei problemi di un sistema dopo un reboot non previsto a pagina 141 m Risoluzione degli errori irreversibili di ripristino e delle eccezioni dello stato RED a pagina 153 m Risoluzione dei problemi di un sistema che non esegue il boot a pagina 164 m Risoluzione dei problemi di un sistema bloccato a pagina 170 In questo capitolo sono incluse anche le seguenti sezioni m Raccolta di informazioni durante la risoluzione dei problemi a pagina 130 m Informazioni sugli stati degli errori del sistema a pagina 133 m Informazioni sui reboot non previsti a pagina 136 129 Raccolta di informazioni durante la risoluzione dei problemi Una certa familiarit con una vasta gamma di unit e una qualche esperienza con determinati tipi di guasti comuni di una macchina possono risultare preziose durante la risoluzione dei problemi del sistema La definizione di un approccio sistematico nei confronti dell analisi e della soluzione di problemi relativi a un determinato sistema consente di identificare e risolvere rapidamente la maggior parte dei problemi man mano che si verificano Il server Sun Fire V440 indica e registra gli eventi e gli errori in diversi modi A seconda del softw
176. l meglio le informazioni riportate in questo documento necessario avere una conoscenza approfondita degli argomenti trattati nel seguente manuale m Server Sun Fire V440 Guida di amministrazione Contenuto del manuale La prima parte di questo manuale organizzato diversamente dagli altri dello stesso prodotto Ciascun capitolo contiene materiale concettuale o procedurale ma non entrambi I capitoli concettuali consentono di ottenere informazioni di base per comprendere il contesto delle attivit eseguite mentre i capitoli procedurali consentono di accedere rapidamente a istruzioni dettagliate con poco o nessun materiale descrittivo xi I capitoli nella seconda parte di questo manuale nonch l appendice contengono sia materiale procedurale che concettuale Per identificare rapidamente le informazioni la prima pagina di ciascun capitolo contiene un elenco di riepilogo degli argomenti trattati nel capitolo stesso Il materiale di riferimento riportato alla fine di ciascun capitolo Questo manuale diviso in due parti La Parte I descrive gli strumenti diagnostici Il Capitolo 1 un capitolo concettuale fornisce una panoramica degli strumenti diagnostici disponibili per l uso con il server Sun Fire V440 Il Capitolo 2 un capitolo concettuale fornisce informazioni dettagliate sull uso e le funzionalit dei vari strumenti diagnostici e sulla loro interrelazione Il capitolo Capitolo 3 un capitolo procedurale fornisc
177. la TABELLA 2 1 consentono di controllare l esecuzione dei test diagnostici e gli eventi da cui vengono generati Per impostazione predefinita i test diagnostici basati sul firmware sono disabilitati in modo da ridurre i tempi necessari per il reboot di un server Tuttavia la mancata esecuzione di tali test crea alcuni problemi di affidabilit del sistema La mancata esecuzione dei test diagnostici pu provocare situazioni in cui un server con componenti hardware danneggiati rimane bloccato in un ciclo continuo di boot e interruzioni In base al tipo di problema possibile che tale ciclo si verifichi a intermittenza Poich i test diagnostici non vengono mai richiamati in seguito a tali interruzioni non viene creata alcuna voce di registro n viene visualizzato alcun messaggio della console significativo Nella sezione Impostazione del sistema in modalit diagnostica a pagina 63 viene descritto come impostare il server per l esecuzione dei test diagnostici all avvio Nella sezione Come ignorare i test diagnostici basati su firmware a pagina 64 vengono fornite informazioni sulla disabilitazione della diagnostica del firmware Come ignorare temporaneamente i test diagnostici Anche se il server stato impostato per l esecuzione automatica dei test diagnostici al momento del reboot possibile ignorare tali test per un singolo ciclo di boot Ci pu essere utile qualora si desideri riconfigurare il server oppure nei rari casi in
178. la distribuzione originale di Sun Management Center che dal supplemento Per istruzioni vedere la documentazione fornita con la distribuzione e il supplemento Sul sistema Sun Fire V440 eseguire l utility di configurazione del software per agenti L utility di configurazione fa parte della distribuzione di Sun Management Center Per ulteriori informazioni vedere la documentazione Sun Management Center Software User s Guide Sul server Sun Management Center installare il software di supplemento necessario installare i componenti supplementari del server per eseguire il monitoraggio di un sistema Sun Fire V440 Sul server Sun Management Center eseguire l utility di configurazione L utility di configurazione fa parte della distribuzione di Sun Management Center Per ulteriori informazioni vedere la documentazione Sun Management Center Software User s Guide Sul server Sun Management Center aggiungere il sistema Sun Fire V440 a un dominio amministrativo possibile eseguire tale operazione automaticamente mediante lo strumento Discovery Manager oppure manualmente creando un oggetto dal menu Edit della console Per istruzioni specifiche vedere la documentazione Sun Management Center Software User s Guide Capitolo 4 Monitoraggio del sistema 83 7 Su una console Sun Management Center fare doppio clic sull icona del sistema Sun Fire V440 Viene visualizzata la finestra Details 8 Fare clic sulla scheda Hardw
179. la massima disponibilit del sistema necessario sostituire i moduli DIMM in coppie E necessario considerare entrambi i moduli DIMM in un banco fisico come una singola unit FRU Banchi logici I banchi logici riflettono l architettura della memoria interna del sistema anzich l architettura delle unit FRU del sistema Nel server Sun Fire V440 ciascun banco logico include sue moduli DIMM fisici Poich i messaggi relativi allo stato generati dal firmware fanno riferimento solo ai banchi logici non possibile servirsi di tali messaggi per isolare un problema di memoria dovuto a un singolo modulo DIMM danneggiato Nei messaggi di errore POST vengono invece riportati i guasti a livello di FRU Nota Per isolare i guasti nel sottosistema di memoria eseguire i test diagnostici POST Capitolo 2 Diagnostica e processo di boot 49 Corrispondenza tra banchi logici e fisici Nella TABELLA 2 11 viene indicata l associazione tra i banchi di memoria logici e fisici nel server Sun Fire V440 TABELLA 2 11 Banchi di memoria logici e fisici in un server Sun Fire V440 Banco logici Identificatori fisici nel formato dell output del nel formato della scheda a firmware circuiti Banco fisico Banco 0 B0 DO e BO D1 Banco 0 Banco 1 Banco 2 B1 DO e B1 D1 Banco 1 Banco 3 Nella FIGURA 2 4 le stesse associazioni vengono riportate in formato grafico B1 D1 B1 DO Diciture sulla scheda a circuiti B0 D1 BO DO
180. lemi con risposta da parte del sistema operativo 140 uso nella risoluzione dei problemi dopo un reboot non previsto 147 A agenti Sun Management Center 41 alimentazione di standby ALOM 38 ALOM Advanced Lights Out Manager vedere anche controller di sistema accesso alla console di sistema 121 informazioni su 87 isolamento dei guasti ai cavi 36 isolamento dei guasti SCC 37 monitoraggio del sistema 38 87 notifica tramite posta elettronica 38 soglie di avvertenza segnalate 89 soglie di avvertenza segnalate da 91 uso nella risoluzione dei problemi 121 analisi del sistema Hardware Diagnostic Suite 46 SunVTS 44 104 attivita per la risoluzione dei problemi 129 auto boot variabile impostazione per OpenBoot Diagnostics 14 avvertenza soglie segnalate da ALOM 89 banchi di memoria fisici e logici 48 POST riferimento 48 Big Admin risorsa per la risoluzione dei problemi 117 sito Web 117 BIST vedere diagnostica automatica incorporata blocchi del sistema 16 BMC Patrol vedere strumenti di monitoraggio di terze parti bootmode diag comando controller di sistema 99 break comando controller di sistema 182 183 187 bus IDE 24 C cavi alimentazione scheda del connettore 36 dati SCSI 36 interruttore di controllo del sistema 37 isolamento dei guasti 35 44 lettore della scheda di configurazione del sistema 37 tastiera e mouse 206 unit DVD ROM 36 cavo dei dati SCSI isolamento dei guasti 36 cav
181. lizzato sullo schermo dipende dallo stato del server Sun Fire V440 e dal tempo impiegato per passare alla console di sistema dopo l accensione del sistema Nota Tutti messaggi della console di sistema o POST che potrebbero risultare mancanti rimangono memorizzati nel log di boot ALOM Per accedere al log di boot digitare consolehistory boot v dal prompt sc gt Operazioni successive Per ulteriori informazioni sulle funzioni della riga di comando ALOM vedere la m Sun Advanced Lights Out Manager ALOM Online Help Per ulteriori informazioni sul controllo dei test diagnostici POST vedere m Controllo della diagnostica POST a pagina 13 Per informazioni sull interpretazione dei messaggi di errore POST vedere m Informazioni fornite dai messaggi di errore POST a pagina 11 100 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 Uso dei comandi Solaris per le informazioni di sistema In questa sezione viene descritto come eseguire i comandi Solaris per le informazioni di sistema su un server Sun Fire V440 Per indicazioni sulle informazioni restituite da tali comandi vedere Comandi Solaris per le informazioni di sistema a pagina 26 oppure le pagine man appropriate Operazioni preliminari E necessario che il sistema operativo sia attivo e in esecuzione Operazioni da eseguire 1 Stabilire il tipo di informazioni di sistema che si desidera visualizzare Per ulteriori info
182. lla diagnostica e alla risoluzione dei problemi Luglio 2003 CODICE DI ESEMPIO 4 9 Output del comando consolehistory run v Continua Setting default IPv4 interface for multicast add net 224 0 4 gateway Sun SFV440 a syslog service starting Print services started volume management starting The system is ready Sun SFV440 a console login May 9 14 52 57 Sun SFV440 a rmclomv NOTICE keyswitch change event state UNKNOWN May 9 14 52 57 Sun SFV440 a rmclomv Keyswitch Position has changed to Unknown state May 9 14 52 58 Sun SFV440 a rmclomv NOTICE keyswitch change event state LOCKED May 9 14 52 58 Sun SFV440 a rmclomv KeySwitch Position has changed to Locked State May 9 14 53 00 Sun SFV440 a rmclomv NOTICE keyswitch change event state NORMAL May 9 14 53 01 Sun SFV440 a rmclomv KeySwitch Position has changed to On State sc gt 7 Esaminare il log di boot ALOM Digitare quanto segue sc gt consolehistory boot v Il log di boot ALOM contiene messaggi di boot restituiti da POST dal firmware OpenBoot e dal software Solaris dopo l ultimo ripristino del server host Nel seguente output di esempio vengono illustrati i messaggi di boot restituiti da POST CODICE DI ESEMPIO 4 10 Output del comando consolehistory boot v messaggi di boot restituiti da POST Keyswitch set to diagnostic position OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 Clearing TLBs Power On R
183. lla diagnostica e alla risoluzione dei problemi e Luglio 2003 CODICE DI ESEMPIO 7 21 Output del comando consolehistory boot v messaggi di boot restituiti da POST Executing Power On SelfTest 0 gt Sun Fire TM V440 POST 4 10 3 2003 05 04 22 08 export work staff firmware re post post build 4 10 3 Fiesta chalupa integrated firmware re 0 gt Hard Powerup RST thru SW 0 gt CPUs present in system 0 1 0 gt OBP gt POST Call with 00 00000000 01012000 O gt Diag level set to MIN 0 gt MFG scrpt mode set NORM 0 gt I O port set to TTYA 0 gt O gt Start selftest 1 gt Print Mem Config 1 gt Caches Icache is ON Dcache is ON Wcache is ON Pcache is ON 1 gt Memory interleave set to 0 Ls Bank 0 1024MB 00000010 00000000 gt 00000010 40000000 Ts Bank 2 1024MB 00000012 00000000 gt 00000012 40000000 O gt Print Mem Config 0 gt Caches Icache is ON Dcache is ON Wcache is ON Pcache is ON O gt Memory interleave set to 0 0 gt Bank 0 1024MB 00000000 00000000 gt 00000000 40000000 0 gt Bank 2 1024MB 00000002 00000000 gt 00000002 40000000 O gt INFO 0 gt POST Passed all devices 0 gt 0 gt POST Return to OBP Nel seguente output viene illustrata l inizializzazione di OpenBoot PROM CODICE DI ESEMPIO 7 22 Output del comando consolehistory boot v inizializzazione di OpenBoot PROM Keyswitch set to diagnostic position OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 Clearing TL
184. login a showusers ALOM e vengono fornite informazioni sui tipi di connessione Per istruzioni sull uso di ALOM per monitorare un sistema Sun Fire V440 vedere Monitoraggio del sistema mediante Sun Advanced Lights Out Manager a pagina 87 Monitoraggio del sistema mediante Sun Management Center Il software Sun Management Center consente di monitorare a livello aziendale i server e le workstation Sun compresi i relativi sottosistemi i componenti e le periferiche necessario che il sistema monitorato sia attivo e in esecuzione e che sui diversi sistemi della rete siano installati tutti i componenti software appropriati I singoli dispositivi sono suddivisi in tre categorie fisici logici e ambientali Sun Management Center consente di monitorare i dispositivi riportati di seguito sul server Sun Fire V440 TABELLA 2 7 Elementi monitorati mediante Sun Management Center Dispositivo Categoria del monitorato dispositivo Informazioni fornite da Sun Management Center CPU Logico Vengono indicati la presenza e lo stato delle CPU Ambientale Viene indicata la temperatura delle CPU e vengono segnalati eventuali problemi collegati alla temperatura DIMM Fisico Viene indicata la presenza dei moduli e vengono fornite informazioni sugli errori Unit disco Logico Vengono indicati la presenza e lo stato delle unit e vengono fornite informazioni sugli errori LED Logico Viene indicato lo stato dei LED Ventole Fisico Vengono indicati la
185. lteriori informazioni sulle variabili di configurazione OpenBoot e su come tali variabili incidono sui test diagnostici vedere Controllo della diagnostica POST a pagina 13 Operazioni successive Se si sospetta che i problemi rilevati durante i diagnostici basati su firmware siano dovuti a un immagine del firmware incompatibile o danneggiata necessario ripristinare il firmware ad uno stato affidabile Per ulteriori informazioni sul ripristino del firmware di sistema contattare il rappresentante dell assistenza autorizzato Ottimizzazione dei test diagnostici Per ottimizzare l affidabilit del sistema consigliabile impostare i test diagnostici POST e OpenBoot in modo che vengano avviati in caso di qualsiasi errore del sistema operativo o ripristino Inoltre consigliabile fare in modo che vengano eseguiti automaticamente i test pi completi Per informazioni di base vedere m Diagnostica affidabilit e disponibilit a pagina 16 Operazioni preliminari Eseguire il login alla console di sistema e accedere al prompt ok Per istruzioni vedere m Accesso al prompt ok a pagina 186 Operazioni da eseguire Tra le seguenti operazioni effettuare quella che risulta pi pratica Impostare l interruttore di controllo di sistema del server sulla posizione di diagnostica Capitolo 3 Isolamento delle parti danneggiate 67 E possibile eseguire tale operazione dal pannello principale del server oppure mediante l in
186. m has Reset FEB 28 19 45 56 host_utente 00040029 Host system has shut down FEB 28 19 46 16 host_utente 00040001 SC Request to Power On Host FEB 28 19 46 18 host_utente 0004000b Host System has read and cleared bootmode FEB 28 19 55 17 host_utente 00060000 SC Login User admin Logged on FEB 28 19 56 59 host_utente 00060000 SC Login User admin Logged on FEB 28 20 27 06 host utente 0004004f Indicator SYS FRONT ACT is now ON FEB 28 20 40 47 host_utente 00040002 Host System has Reset Nota I messaggi di log ALOM vengono scritti in un buffer circolare di lunghezza limitata 64 KB Quando il buffer pieno i messaggi pi vecchi vengono sovrascritti da quelli pi recenti 6 Esaminare il log di esecuzione ALOM Digitare quanto segue sc gt consolehistory run v Questo comando mostra il log contenente l output della console di sistema pi recente restituito da POST OpenBoot PROM e dai messaggi di boot di Solaris Questo log registra inoltre l output restituito dall ambiente operativo del server CODICE DI ESEMPIO 4 9 Output del comando consolehistory run v May 9 14 48 22 Sun SFV440 a rmclomv SC Login User admin Logged on init 0 INIT New run level 0 The system is coming down Please wait Capitolo 4 Monitoraggio del sistema 93 CODICE DI ESEMPIO 4 9 Output del comando consolehistory run v Continua System services are now being
187. miare tempo e ridurre al minimo le interruzioni qualora il sistema riscontrasse alcuni problemi In questo capitolo vengono descritte le seguenti operazioni m Abilitazione del processo core dump a pagina 124 m Verifica della configurazione del core dump a pagina 126 In questo capitolo sono incluse anche le seguenti sezioni m Informazioni aggiornate sulla risoluzione dei problemi a pagina 116 m Informazioni sulla gestione delle patch del firmware e del software a pagina 117 m Informazioni su Sun Install Check Tool a pagina 117 m Informazioni su Sun Explorer Data Collector a pagina 118 m Informazioni sulla configurazione del sistema per la risoluzione dei problemi a pagina 119 115 Informazioni aggiornate sulla risoluzione dei problemi Sun continuera a raccogliere e pubblicare informazioni sul server Sun Fire V440 per molto tempo dopo la pubblicazione della documentazione iniziale del sistema possibile ottenere le informazioni pi aggiornate sulla risoluzione dei problemi del server nelle Note sul prodotto e sui siti Web Sun Queste risorse consentono di comprendere e diagnosticare i problemi che potrebbero verificarsi Note sul prodotto Server Sun Fire V440 Note sul prodotto contiene informazioni aggiornate sul sistema compreso quanto riportato di seguito m Patch software correnti necessarie e consigliate m Informazioni aggiornate sulla compatibilit dell hardware e del driver m Problemi noti e relative desc
188. mo luogo il codice presente nel chip PROM di boot Tale codice a cui viene fatto riferimento come firmware OpenBoot rappresenta un sistema operativo su scala ridotta Tuttavia diversamente dai sistemi operativi standard in grado di eseguire diverse applicazioni per pi utenti contemporaneamente il firmware OpenBoot viene eseguito in modalit monoutente e consente unicamente di configurare il sistema ed eseguirne il boot Il firmware OpenBoot consente inoltre di eseguire i test diagnostici basati sul firmware al fine di garantire che l hardware sia sufficientemente integro da consentire il funzionamento dell ambiente operativo standard Al momento dell accensione del sistema il firmware OpenBoot viene eseguito direttamente dal chip PROM di boot in quanto in questa fase non ancora stato verificato il corretto funzionamento della memoria del sistema Subito dopo l accensione i componenti hardware del sistema rilevano che almeno un modulo CPU attivo e sta inviando una richiesta di accesso al bus ci indica almeno un funzionamento parziale del modulo CPU in questione Tale modulo verr adottato come CPU master e sar responsabile dell esecuzione delle istruzioni del firmware OpenBoot Il firmware OpenBoot determina in primo luogo la necessit di eseguire i test diagnostici all accensione POST e altri eventuali test La diagnostica POST rappresenta un blocco di codice distinto memorizzato in un area differente del PROM
189. mpostando le variabili di configurazione OpenBoot Vedere Riferimento per le impostazioni delle variabili di configurazione OpenBoot della console di sistema a pagina 207 E possibile anche impostare le variabili di configurazione OpenBoot utilizzando il controller di sistema ALOM Per informazioni vedere la Guida in linea di Sun Advanced Lights Out Manager ALOM Accesso alla console di sistema mediante un monitor grafico Il server Sun Fire V440 viene distribuito senza mouse tastiera monitor o scheda frame buffer per la visualizzazione della grafica a bitmap Per installare un monitor grafico sul server occorre installare una scheda buffer frame in uno slot PCI e collegare monitor mouse e tastiera alle porte appropriate sul pannello posteriore Una volta avviato il sistema potrebbe essere necessario installare il driver software corretto per la scheda PCI installata Per istruzioni dettagliate sull hardware vedere Accesso alla console di sistema mediante un monitor grafico a pagina 203 Nota I messaggi di stato e di errore generati dai test diagnostici all accensione POST Power On Self Test non vengono visualizzati su un monitor grafico locale Informazioni sul prompt sc gt Il controller di sistema ALOM viene eseguito indipendentemente dal server Sun Fire V440 e dallo stato di alimentazione del sistema Quando si collega un server Sun Fire V440 all alimentazione CA il controller di sistema ALOM viene avviato immedia
190. n SFV440 59 Sun SFV440 0 0 40 Sun SFV440 44 Sun SFV440 a a a a Nota Le registrazioni dell orario per i log ALOM riflettono l orario UTC Universal Time Coordinated mentre le registrazioni dell orario per l ambiente operativo Solaris riflettono l orario locale server Pertanto un singolo evento pu generare messaggi che sembrano registrati in momenti differenti su log differenti Esaminare lo stato dell ambiente di sistema Digitare quanto segue sc gt showenvironment Il comando showenvironment riporta molti dati utili quali le indicazioni della temperatura lo stato del sistema e dei LED dei componenti la tensione della scheda madre lo stato dei dischi del sistema le ventole gli interruttori di circuito della scheda madre e i convertitori CC CC dei moduli CPU Il CODICE DI ESEMPIO 7 4 un estratto di output restituito dal comando showenvironment indica che il LED di richiesta di assistenza del pannello principale acceso Quando si esamina l output completo restituito dal comando showenvironment controllare lo stato di tutti i LED di richiesta di assistenza e verificare che lo stato di tutti i componenti sia corretto Vedere il CODICE DI ESEMPIO 4 1 per un esempio di output completo restituito dal comando showenvironment CODICE DI ESEMPIO 7 4 Output del comando showenvironment System Indicator Status SYS_FRONT LOCATE SYS_FRONT SERVICE SYS_FRONT ACT OFF ON ON sc gt
191. n elenco gerarchico dei componenti del sistema disposti all interno di una struttura ad albero con cartelle nidificate CA system Vista logica co Gi system board Cicoro Ci cpu i corPorBo i coPo BI T_core ______ Componente selezionato omc Der De Quando si seleziona un componente hardware le relative informazioni di stato e di produzione vengono visualizzate in un apposita tabella sulla destra Property Value Name T_CORE Location CWPO Description CPU 0 core temperature m Operational Status OK Additional Info Current Reading 54 0 Informazioni sullo stato Units Degrees Celcius del componente Lower Non Critical Threshold 0 selezionato Upper Non Critical Threshold 97 Lower Critical Threshold 10 Upper Critical Threshold 102 Lower Fatal Threshold 20 Upper Fatal Threshold 120 Nota La gerarchia della vista logica si basa sulla struttura ad albero dei dispositivi FRU e i nomi indicati in questa gerarchia sono gli stessi di quelli visualizzati con il comando prtfru Per ulteriori informazioni vedere Comando prt fru a pagina 30 Per ulteriori informazioni sulle viste logica e fisica vedere la documentazione Sun Management Center Software User s Guide Capitolo 4 Monitoraggio del sistema 85 86 10 Eseguire il monitoraggio del sistema Sun Fire V440 utilizzando le tabelle delle proprieta dei dati di Config Reader Per accedere a tali informazioni effettuare quan
192. na 87 m Sun Advanced Lights Out Manager ALOM Online Help Informazioni sugli errori restituite da Sun Management Center Se il software Sun Management Center installato e sono in esecuzione il sistema e l ambiente operativo Sun Management Center consente di monitorare lo stato di diversi componenti del sistema Per ulteriori informazioni vedere m Monitoraggio del sistema mediante Sun Management Center a pagina 39 m Monitoraggio del sistema mediante Sun Management Center a pagina 82 Informazioni sugli errori restituite dal sistema A seconda dello stato del sistema necessario verificare pi fonti possibili tra quelle riportate di seguito per le indicazioni sugli errori e registrare le informazioni ottenute a Output restituito dal comando prtdiag v Se il software Solaris in esecuzione eseguire il comando prtdiag v per acquisire le informazioni memorizzate con i test diagnostici OpenBoot e POST Tutte le informazioni sullo stato corrente del sistema ricavate con questi test vanno perse nel momento in cui viene ripristinato il sistema Vedere Risoluzione dei problemi di un sistema con risposta da parte del sistema operativo a pagina 137 m Output restituito dai comandi show post results e show obdiag results Dal prompt ok prompt eseguire il comando show post results o show obdiag results per visualizzare i riepiloghi dei risultati ricavati rispettivamente dai pi recenti test diagnostici POST e OpenBoot I risulta
193. ndicare che il sistema controllato dal firmware OpenBoot Di seguito vengono riportati i casi in cui pu verificarsi il controllo del firmware OpenBoot m Per impostazione predefinita il sistema viene fornito con il controllo del firmware OpenBoot attivato prima dell installazione dell ambiente operativo m Il sistema esegue il boot al prompt ok se la variabile di configurazione OpenBoot auto boot impostata su false m Il sistema passa al livello di esecuzione 0 in modo regolare quando l ambiente operativo viene arrestato m Il controllo del firmware OpenBoot viene ripristinato in caso di crash dell ambiente operativo Appendice A Configurazione della console di sistema 181 m Durante il processo di boot se si verifica un grave problema hardware che impedisce l esecuzione dell ambiente operativo viene ripristinato il controllo del firmware OpenBoot del sistema m Se si verifica un grave problema hardware mentre il sistema in esecuzione l ambiente operativo passa gradualmente al livello di esecuzione 0 a possibile attivare manualmente il controllo del firmware sul sistema al fine di eseguire comandi basati sul firmware o test diagnostici Quest ultima situazione quella che maggiormente interessa gli amministratori che spesso si trovano a dover utilizzare il prompt ok I diversi metodi disponibili per eseguire tale operazione sono descritti nella sezione Metodi di accesso al prompt ok a pagina 182 Per is
194. ndo Solaris 182 187 sistema operativo procedura di emergenza 16 sistema blocchi 16 sistema chiusura regolare 182 187 sistema ripristino manuale 184 187 software ambiente operativo sospensione 184 software visualizzazione della revisione con showrev 33 soglie di avvertenza segnalate da ALOM 89 91 soglie avvertenze segnalate da ALOM 91 215 sospensione del software dell ambiente operativo 184 spazio swap calcolo 125 SRS Net Connect 119 stati degli errori sistema 133 strumenti di monitoraggio di terze parti 42 strumenti diagnostici funzioni 5 non standard 2 25 riepilogo tabella 2 strumenti diagnostici non standard vedere anche LED struttura ad albero dei dispositivi definizione 17 raccolta dati 41 Solaris visualizzazione 26 Sun Enterprise Authentication Mechanism SEAM 46 Sun Explorer Data Collector 118 Sun Install Check Tool 117 Sun Management Center agenti 82 generazione di rapporti 42 informazioni 82 monitoraggio 82 server e console 82 verifica informale dei sistemi 41 Sun Remote Services Net Connect 119 Sun Validation and Test Suite vedere SunVTS SunMC vedere Sun Management Center SunSolve Online risorse per la risoluzione dei problemi 116 sito Web 117 SunVTS analisi del sistema 44 104 informazioni 104 test stress 44 verifica installazione 109 swap 1 comando Solaris 125 sync comando Solaris dopo l uso di un ripristino XIR 183 uso nella risoluzione dei pro
195. ne dell interruttore uso nella risoluzione dei problemi di sospensione del sistema 170 POST test diagnostico all accensione causa dell esecuzione 15 controllo 13 CPU master 11 criteri di valutazione 10 decodifica dei termini 12 definizione 9 funzione 10 isolamento guasti in base al livello di FRU 12 limiti di visualizzazione dei messaggi 15 messaggi di errore interpretazione 11 problemi persistenti 10 riparazione 12 post trigger variabile impostazione 15 uso nella risoluzione dei problemi di sospensione del sistema 171 poweroff comando controller di sistema 99 poweron comando controller di sistema 99 printenv comando OpenBoot descrizione 22 uso nella risoluzione dei problemi di sospensione del sistema 171 probe ide comando OpenBoot 24 183 probe scsi e probe scsi all comandi OpenBoot 23 183 problema che si verifica a intermittenza 10 43 47 procedura di emergenza del sistema operativo 16 processo di boot riepilogo delle fasi 8 PROM di boot funzione 9 illustrazione 10 prompt ok metodi di accesso 182 186 rischi legati all immissione di comandi 184 prompt sc gt metodi di accesso 181 relazione con il prompt ok 185 prtconf comando Solaris 26 prtdiag v comando Solaris definizione 27 uso nella risoluzione degli errori di ripristino irreversibili e delle eccezioni dello stato RED 160 uso nella risoluzione dei problemi 131 uso nella risoluzione dei problemi con rispos
196. necessarie dovuta a vari motivi primo tra tutti la complessit del server Si prenda in considerazione il circuito ripetitore del bus incorporato in tutti i server Sun Fire V440 Tale circuito connette tra loro tutte le CPU e le interfacce di I O ad alta velocit vedere la FIGURA 1 1 rilevando e adattando le comunicazioni Capitolo 1 Panoramica sugli strumenti diagnostici 3 in base ai moduli CPU presenti Questo sofisticato strumento di interconnessione ad alta velocita rappresenta solo un aspetto dell architettura avanzata del server Sun Fire V440 Memoria Memoria Memoria Memoria CPU 0 CPU 1 CPU 2 CPU 3 JBus Scheda madre Circuito ripetitore del bus TTYB SERIAL MGT NET MGT SCC Slot PCI Controller m_ _ __ Controller USB Controller Controller Porte disco SCSI e DVD Ethernet 12C SCSI USB e Ethernet Controller Ethernet Bus 12C Slot PCI Verso alimentatori ventole e altri componenti FIGURA 1 1 Vista schematica e semplificata di un server Sun Fire V440 Si tenga presente inoltre la necessit di disporre di strumenti diagnostici che funzionino anche se non possibile eseguire il boot del sistema Gli strumenti diagnostici in grado di isolare i problem
197. ng 1024MB of memory at addr 200000000 Initializing 1024MB of memory at addr 0 1 ok boot disk 146 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 Nel seguente output di esempio viene illustrato il boot del sistema e il caricamento del software Solaris CODICE DI ESEMPIO 7 13 Output del comando consolehistory boot v boot del sistema e caricamento del software Solaris Rebooting with command boot disk Boot device pci 1f 700000 scsi 2 disk 0 0 File and args Loading ufs file system package 1 4 04 Aug 1995 13 02 54 FCode UFS Reader 1 11 97 07 10 16 19 15 Loading platform SUNW Sun Fire V440 ufsboot Loading platform sun4u ufsboot SunOS Release 5 8 Version Generic 114696 04 64 bit Copyright 1983 2003 Sun Microsystems Inc All rights reserved Hardware watchdog enabled sc gt 4 Verificare il file var adm messages per le indicazioni su un errore Ricercare le seguenti informazioni sullo stato del sistema m Qualsiasi differenza notevole nella registrazione dell orario del software Solaris o dei messaggi di applicazione m Messaggi di avvertenza su tutti i componenti hardware o software m Informazioni restituite dagli ultimi login di root per determinare se gli amministratori del sistema sono in grado di fornire informazioni sullo stato del sistema al momento del blocco 5 Se possibile verificare se il sistema ha salvato un file core dump
198. ngere un altro sistema presente sulla stessa sottorete hub o router Se i servizi NFS vengono utilizzati dal sistema danneggiato stabilire se l attivit NFS presente su altri sistemi d Cambiare posizione all interruttore di controllo del sistema mentre si osserva la console di sistema Ad esempio spostare l interruttore dalla posizione normale a quella di diagnostica oppure dalla posizione di blocco a quella normale Se la console di sistema registra il cambiamento di posizione dell interruttore il sistema non completamente bloccato Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 2 Se nessuna sessione utente risponde registrare lo stato dei LED di sistema I LED di sistema possono indicare un errore hardware nel sistema E possibile utilizzare il controller di sistema ALOM per verificare lo stato dei LED di sistema Vedere la documentazione Server Sun Fire V440 Guida di amministrazione per ulteriori informazioni sui LED di sistema 3 Tentare di far accedere il sistema al prompt ok Per istruzioni vedere Accesso al prompt ok a pagina 186 Se il sistema non pu accedere al prompt ok il blocco del sistema pu essere classificato come un blocco software In caso contrario il blocco del sistema pu essere classificato come un blocco hardware Per ulteriori informazioni vedere Risposta allo stato di blocco del sistema a pagina 133 4 Se non si riesce a far accedere il s
199. nita FRU sono elencate nella TABELLA 2 5 nella quale vengono indicati alcuni suggerimenti per individuare eventuali problemi collegati a esse TABELLA 2 5 Unita FRU che non possibile isolare direttamente mediante gli strumenti di isolamento dei guasti FRU Suggerimenti per la diagnostica Gruppo scheda del connettore Cavo di alimentazione della scheda del connettore Cavo dell unita DVD ROM Piano posteriore SCSI Cavo dei dati SCSI E difficile distinguere i problemi che presentano sintomi simili Il firmware genera diversi messaggi di errore in cui viene indicata l impossibilit di accedere alle variabili di configurazione OpenBoot ad esempio Could not read diag level from NVRAM In ALOM viene indicato che il LED di richiesta di assistenza del pannello principale acceso Se il software ALOM in grado di rilevare la posizione dell interruttore del sistema ma indica che non vi sono ventole in fase di rotazione possibile che il cavo non sia collegato correttamente o sia danneggiato Se il test OpenBoot Diagnostics segnala un problema con l unit CD DVD che persiste anche dopo la sostituzione di tale unit molto probabile che tale cavo sia danneggiato o non sia collegato correttamente Tuttavia anche possibile che si sia verificato un problema con la scheda madre possibile analizzare alcuni percorsi del piano posteriore SCSI mediante alcuni test SunVTS 12c2test e disktest sebbene
200. non siano strumenti diagnostici esaustivi anche possibile monitorare la temperatura ambientale del piano posteriore utilizzando il comando showenvironment del controller di sistema ALOM Vedere Monitoraggio del sistema mediante Sun Advanced Lights Out Manager a pagina 87 difficile distinguere i problemi che presentano sintomi simili Il firmware genera diversi messaggi di errore in cui viene indicata l impossibilit di accedere alle variabili di configurazione OpenBoot ad esempio Could not read diag level from NVRAM In ALOM viene indicato che il LED di richiesta di assistenza del pannello principale acceso 36 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 TABELLA 2 5 Unita FRU che non possibile isolare direttamente mediante gli strumenti di isolamento dei guasti Continua FRU Suggerimenti per la diagnostica Lettore della scheda di Se l interruttore di controllo del sistema e il pulsante di configurazione del sistema alimentazione non rispondono e si certi del corretto e funzionamento degli alimentatori probabile che il problema sia dovuto al lettore SCC e al relativo cavo Per eseguire il test di tali componenti accedere a ALOM eseguire il comando resetsc eseguire di nuovo il login a ALOM e rimuovere la scheda del controller di sistema Se viene visualizzato un messaggio di avviso che indica che la scheda SCC stata rimossa SCC card has been r
201. nstallazione del software SunVTS Se viene abilitato uno schema di protezione non corretto durante l installazione o se lo schema di protezione desiderato non viene configurato in modo appropriato potrebbe non essere possibile eseguire i test SunVTS Per ulteriori informazioni vedere la documentazione SunVTS User s Guide e le istruzioni fornite con il software SEAM Analisi del sistema mediante Hardware Diagnostic Suite Per il prodotto Sun Management Center disponibile lo strumento Hardware Diagnostic Suite opzionale che possibile acquistare separatamente Hardware Diagnostic Suite progettato per analizzare un sistema di produzione mediante l esecuzione di test sequenziali L esecuzione di test sequenziali implica un impatto ridotto sul sistema da parte del software Hardware Diagnostic Suite Diversamente da SunVTS che sollecita il sistema utilizzando numerose risorse a causa dell esecuzione contemporanea di diversi test vedere Analisi del sistema mediante il software SunVTS a pagina 44 Hardware Diagnostic Suite consente di effettuare i test anche durante l esecuzione sul server di altre applicazioni Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Uso ottimale di Hardware Diagnostic Suite Hardware Diagnostic Suite progettato principalmente per rilevare un problema sospetto o che si verifica a intermittenza su una parte non fondamentale di un server che continua comunque a
202. nte ALOM restituisce il seguente messaggio di avviso SC Alert CPU FAN FT1 Failed Cavo dei dati SCSI Vedere la TABELLA 2 5 Cavo di alimentazione della scheda Vedere la TABELLA 2 5 del connettore Analisi del sistema mediante il software SunVTS Lo strumento Validation Test Suite del software SunVTS consente di eseguire il test stress del sistema e del sottosistema possibile visualizzare e controllare una sessione SunVTS attraverso una rete Utilizzando un sistema remoto possibile visualizzare lo stato di avanzamento della sessione di test modificare le opzioni di diagnostica e controllare tutte le funzioni di test eseguite su un altra macchina in rete Sono disponibili le cinque seguenti modalit di esecuzione del software SunVTS indicate di seguito m Connessione il software SunVTS verifica la presenza di controller dei dispositivi in tutti i sottosistemi Questa operazione che richiede solo alcuni minuti un ottimo metodo per controllare le connessioni del sistema m Funzionale l analisi del software SunVTS viene eseguita solo su sottosistemi specifici selezionati dall utente Questa modalit attiva per impostazione predefinita Nella modalit Funzionale i test selezionati vengono eseguiti contemporaneamente Poich in tal caso vengono utilizzate numerose risorse di sistema necessario non eseguire altre applicazioni nello stesso momento m Configurazione automatica il software SunVTS rileva a
203. nte inoltre agli amministratori di controllare lo stato di numerose macchine da un unica postazione centralizzata Sono disponibili due strumenti Sun per il monitoraggio dei server m Sun Management Center m Sun Advanced Lights Out Manager ALOM Oltre a questi strumenti sono disponibili comandi Sun basati su software e su firmware che consentono di visualizzare diversi tipi di informazioni di sistema Sebbene non siano uno strumento di monitoraggio vero e proprio tali comandi consentono di eseguire una verifica immediata dello stato dei diversi aspetti e componenti del sistema In questo capitolo vengono descritte le operazioni necessarie per utilizzare tali strumenti al fine di eseguire il monitoraggio del server Sun Fire V440 Vengono descritte le seguenti operazioni m Monitoraggio del sistema mediante Sun Management Center a pagina 82 m Monitoraggio del sistema mediante Sun Advanced Lights Out Manager a pagina 87 m Uso dei comandi Solaris per le informazioni di sistema a pagina 101 m Uso dei comandi OpenBoot per le informazioni di sistema a pagina 102 Per informazioni di base sugli strumenti disponibili vedere il Capitolo 2 81 Nota Molte delle procedure descritte in questo capitolo presuppongono una conoscenza di base del firmware OpenBoot e della modalita di accesso al prompt ok Per informazioni di base vedere Informazioni sul prompt ok a pagina 181 Per istruzioni vedere Accesso al prompt ok a pagina 1
204. nter che il controller di sistema ALOM consentono di eseguire i test da un server remoto inoltre possibile reindirizzare l output della console di sistema sull interfaccia ALOM in modo da poter visualizzare ed eseguire in remoto i test ad esempio la diagnostica POST che richiederebbero altrimenti la vicinanza fisica alla porta seriale sul pannello posteriore del server Il software SunVTS uno strumento di analisi del sistema consente anche di eseguire test in remoto utilizzando l interfaccia grafica del prodotto o la modalit tty mediante un login remoto o una sessione Telnet 4 Si desidera eseguire il test su un unit specifica che si presuppone sia la causa del problema Se si ha gi un idea sulla possibile causa del problema possibile utilizzare uno strumento diagnostico in grado di eseguire il test direttamente sulla presunta origine del problema m Nella TABELLA 2 4 viene indicato lo strumento di isolamento degli errori appropriato per ciascuna parte hardware sostituibile m Nella TABELLA 2 9 viene indicato lo strumento di analisi del sistema appropriato per ciascuna parte hardware sostituibile Capitolo 3 Isolamento delle parti danneggiate 79 5 Il problema si verifica a intermittenza o collegato al software Se la causa del problema non individuabile in un componente hardware che presenta guasti evidenti possibile utilizzare uno strumento di analisi del sistema al posto di uno strumento di isolamento d
205. ntinua Indirizzo FRU associata Funzione del dispositivo power supply fru prom 0 a4 motherboard fru prom 0 a2 temperature sensor 0 9c temperature 0 80 temperature 0 64 hardware monitor 0 5c gpio 0 48 gpio 0 46 gpio 0 44 gpio 0 42 12c bridge 0 18 i2c bridge 0 16 temperature 0 30 cpu fru prom 0 be dimm spd 0 b6 dimm spd 0 b8 dimm spd 0 ba Alimentatore Scheda madre Piano posteriore SCSI CPU 2 CPU 1 Scheda madre Scheda madre Piano posteriore SCSI Scheda madre Piano posteriore SCSI Scheda madre Scheda madre CPU 0 CPU 0 Modulo CPU memoria 0 DIMM 0 Modulo CPU memoria 0 DIMM 1 Modulo CPU memoria 0 DIMM 2 Contiene le informazioni sulla configurazione delle unita FRU Contiene le informazioni sulla configurazione delle unita FRU Rileva la temperatura ambientale del sistema Rileva la temperatura dello stampo della CPU Rileva la temperatura dello stampo della CPU Esegue il monitoraggio delle temperature delle tensioni e delle velocita delle ventole Gestisce i LED del sistema e le indicazioni delle condizioni di surriscaldamento della CPU Indica lo stato dei dischi e gestisce i LED di segnalazione dei guasti e di rimozione consentita Indica lo stato degli alimentatori e della CPU Indica lo stato dell interruttore e gestisce i LED di attivita Converte gli indirizzi del bus PC e isola i dispositivi
206. nza di un segno di spunta all interno della tabella indica la possibilit di isolare un guasto a una determinata unit FRU mediante lo strumento di diagnostica in questione TABELLA 2 4 Unit FRU su cui agiscono gli strumenti di isolamento dei guasti LED Alloggia OpenBoot FRU ALOM mento FRU Diags POST Scheda ALOM v Vv VA Gruppo scheda del connettore Nessuno strumento Vedere la TABELLA 2 5 per suggerimenti sull isolamento dei guasti Modulo CPU memoria v VA v DIMM v Unita disco VA VA VA v Unita DVD ROM Vano ventole 0 ventola CPU y VA Vano ventole 1 ventole CPU VA v Scheda madre VA Vv VA y Alimentatore v v y Piano posteriore SCSI Nessuno strumento Vedere la TABELLA 2 5 per suggerimenti sull isolamento dei guasti Lettore della scheda di Nessuno strumento Vedere la TABELLA 2 5 configurazione del sistema per suggerimenti sull isolamento dei guasti Scheda configurazione del Nessuno strumento Vedere la TABELLA 2 5 sistema per suggerimenti sull isolamento dei guasti Oltre alle unit FRU elencate nella TABELLA 2 4 sono disponibili diversi componenti di sistema sostituibili per lo pi cavi che non possibile isolare direttamente mediante uno strumento diagnostico Nella maggior parte dei casi possibile Capitolo 2 Diagnostica e processo di boot 35 determinare quale tra questi componenti danneggiato agendo a eliminazione Alcune di tali u
207. o del lettore della scheda di configurazione del sistema isolamento dei guasti 37 209 cavo del lettore SCC vedere cavo del lettore della scheda di configurazione del sistema cavo dell interruttore di controllo del sistema isolamento dei guasti 37 cavo dell unita DVD ROM isolamento dei guasti 36 cavo di alimentazione della scheda del connettore isolamento dei guasti 36 chiusura regolare del sistema 182 187 circuito ripetitore del bus 3 Cisco AS2511 RJ vedere server terminal comandi ALOM vedere comandi del controller di sistema comandi del controller di sistema vedere anche ALOM bootmode diag 99 break 182 183 187 console 100 182 183 186 187 consolehistory boot v 100 144 156 168 consolehistory run v 142 154 165 poweroff 99 poweron 99 reset x 183 sequenza di escape 88 181 186 showenvironment 38 88 138 showfru 92 showlogs 93 showplatform 38 99 showusers 39 98 comandi OpenBoot printenv 22 171 probe ide 24 probe scsi e probe scsi all 23 reset all 206 rischi 184 show devs 24 show post results 131 comandi Solaris df k 125 dumpadm 124 dumpadm s 126 fsck 184 init 182 187 lostat E 151 162 iostat xtc 150 162 ping 170 pkginfo 110 prtconf 26 prtdiag v 27 139 148 160 prtfru 31 ps ef 149 161 170 psrinfo 32 raidctl 152 showrev 33 shutdown 182 187 swap 1 125 sync 171 183 uadmin 182 condizione di surriscaldamento determinazione con prtd
208. o effetti anche sui test OpenBoot Diagnostics In particolare possibile determinare il livello dei test OpenBoot Diagnostics o annullarne completamente l esecuzione impostando in modo appropriato la variabile diag level Inoltre per i test OpenBoot Diagnostics viene utilizzata una variabile speciale denominata test args che consente di personalizzare la modalit di funzionamento dei test Per impostazione predefinita test args impostata per contenere una stringa vuota tuttavia possibile impostare la variabile test args su una o pi parole chiave riservate ciascuna delle quali provoca un effetto differente sui test OpenBoot Diagnostics Nella TABELLA 2 2 viene fornito un elenco delle parole chiave disponibili TABELLA 2 2 Parole chiave per la variabile di configurazione OpenBoot test args Parola chiave Funzione bist Richiama un test diagnostico automatico incorporato BIST sui dispositivi esterni e sulle periferiche debug Visualizza tutti i messaggi di debug iopath Verifica l integrit dei bus e delle interconnessioni loopback Analizza il percorso di loopback esterno del dispositivo media Verifica l accessibilit ai dispositivi esterni e alle periferiche restore Tenta di ripristinare lo stato originale del dispositivo nel caso di mancata riuscita della precedente esecuzione del test silent Visualizza gli errori anzich lo stato di ciascun test subtests Visualizza il test principale e ciascun test sec
209. o spazio di swap sia sufficiente per eseguire il dump della memoria Digitare il comando swap 1 swap 1 swapfile dev swaplo blocks free dev dsk c0t3d0s0 32 24 16 4097312 4062048 dev dsk c0t3d0s0 32 8 16 4097312 4060576 dev dsk c0t3d0s0 32 9 16 4097312 4065808 Per determinare la quantita disponibile di byte dello spazio di swap moltiplicare il numero nella colonna blocks per 512 Ricavando il numero di blocchi dalla prima voce cOt3d0s0 effettuare il seguente calcolo 4097312 x 512 2097823744 Il risultato approssimativo 2 GB 3 Verificare che lo spazio del file system sia sufficiente per i file core dump Digitare il comando df k df k var crash uname n Per impostazione predefinita l ubicazione in cui sono memorizzati i file savecore var crash uname n Ad esempio per il server sistema la directory predefinita var crash sistema Il file system specificato deve disporre di spazio sufficiente per i file core dump Se in seguito all uso del comando savecore vengono visualizzati messaggi indicanti la mancanza di spazio sufficiente nel file var crash possibile utilizzare qualsiasi altro file system installato localmente non NFS Di seguito riportato un esempio di messaggio derivante dall uso del comando savecore System dump time Wed Apr 23 17 03 48 2003 savecore not enough space in var crash sf440 a 216 MB avail 246 MB needed Eseguire le
210. odalit diagnostica 63 Come ignorare i test diagnostici basati su firmware 64 Come ignorare temporaneamente i test diagnostici 66 Ottimizzazione dei test diagnostici 67 Isolamento dei guasti mediante l uso dei LED 69 Isolamento dei guasti mediante i test diagnostici POST 73 Isolamento dei guasti mediante i test diagnostici interattivi OpenBoot 75 Visualizzazione dei risultati dei test diagnostici 78 Informazioni su come scegliere uno strumento per l isolamento dei guasti 79 4 Monitoraggio del sistema 81 Monitoraggio del sistema mediante Sun Management Center 82 Monitoraggio del sistema mediante Sun Advanced Lights Out Manager 87 Uso dei comandi Solaris per le informazioni di sistema 101 Uso dei comandi OpenBoot per le informazioni di sistema 102 iv Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 5 Analisi del sistema 103 Analisi del sistema mediante il software SunVTS 104 Come verificare se il software SunVTS installato 109 Parte II Risoluzione dei problemi 6 Opzioni per la risoluzione dei problemi 115 Informazioni aggiornate sulla risoluzione dei problemi 116 Note sul prodotto 116 Siti Web 116 Informazioni sulla gestione delle patch del firmware e del software 117 Informazioni su Sun Install Check Tool 117 Informazioni su Sun Explorer Data Collector 118 Informazioni su Sun Remote Services Net Connect collegamento in rete ai servizi remoti Sun 119 Informazioni sulla c
211. olamento delle parti danneggiate 73 74 2 Accendere il server Effettuare una delle operazioni riportate di seguito m Premere il pulsante di alimentazione sul pannello principale del server m Accedere al controller di sistema ALOM e digitare quanto segue ok sc gt Quindi dal prompt sc gt digitare quanto segue sc gt poweron sc gt console ok Il sistema esegue i test diagnostici POST e visualizza i messaggi di stato e di errore mediante il terminale seriale locale Nota Se si continua ad utilizzare il prompt sc gt non verra visualizzato alcun output POST E necessario tornare al prompt ok digitando il comando console come descritto precedentemente Esaminare l output dei test POST In ciascun messaggio di errore POST viene indicata l unit sostituibile in loco FRU Field Replaceable Unit che rappresenta la causa pi probabile del guasto In alcuni casi possono essere indicate pi possibile cause le quali vengono elencate a partire dalla pi probabile Nota Se nell output dei test POST sono presenti nomi codificati o acronimi che non si in grado di interpretare vedere la TABELLA 2 15 nella sezione Riferimenti per la terminologia negli output dei test diagnostici a pagina 56 Operazioni successive Sostituire le eventuali unit FRU indicate nei messaggi di errore POST Per istruzioni sulle modalit di sostituzione consultare il seguente documento m Sun Fire V4
212. ollegamento dei dispositivi alla console di sistema L uso di una linea tip preferibile rispetto alla connessione di un terminale alfanumerico in quanto la linea tip consente di utilizzare le funzioni del sistema a finestre e del sistema operativo sul computer utilizzato per il collegamento al server Sun Fire V440 Sebbene l ambiente operativo Solaris identifichi la porta di gestione seriale come ttya tale porta non una porta seriale multifunzione Se si desidera utilizzare una porta seriale multifunzione con il server ad esempio per collegare una stampante seriale utilizzare la porta seriale standard a 9 pin sul pannello posteriore del server Sun Fire V440 L ambiente operativo Solaris identifica tale porta come ttyb Per istruzioni sull accesso alla console di sistema mediante un server terminal vedere Accesso alla console di sistema mediante un server terminal a pagina 191 Per istruzioni sull accesso alla console di sistema mediante un terminale alfanumerico vedere Uso della porta di gestione seriale a pagina 188 Per istruzioni sull accesso alla console di sistema mediante una linea tip vedere Accesso alla console di sistema mediante la connessione tip a pagina 194 Appendice A Configurazione della console di sistema 177 Accesso mediante la porta di gestione di rete Una volta assegnato un indirizzo IP alla porta di gestione di rete possibile collegare un dispositivo con funzionalit Ethernet e accedere alla con
213. on 0207 Serial No 3JA0BRQJ00007316 Size 36 42GB lt 36418595328 bytes gt Media Error 0 Device Not Ready 0 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 sd3 Soft Errors 0 Hard Errors 0 Transport Errors 0 Vendor SEAGATE Product ST336607LSUN36G Revision 0207 Serial No 3JA0BWL000002318 Size 36 42GB lt 36418595328 bytes gt Media Error 0 Device Not Ready 0 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 sd4 Soft Errors 0 Hard Errors 0 Transport Errors 0 Vendor SEAGATE Product ST336607LSUN36G Revision 0207 Serial No 3JA0AGQS00002317 Size 36 42GB lt 36418595328 bytes gt Media Error 0 Device Not Ready 0 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 Capitolo 7 Risoluzione dei problemi hardware 151 11 Verificare che tutti i dispositivi RAID con copia speculare funzionino Digitare quanto segue raidctl Questo comando mostra lo stato dei dispositivi RAID Per identificare un problema esaminare l output del comando Disk Status che non riporta OK come stato Per ulteriori informazioni sulla configurazione dei dispositivi RAID con copia speculare vedere la sezione relativa alle informazioni sulla copia speculare dei dischi hardware nella documentazione Server Sun Fire V440 Guida di amministrazione CODICE DI ESEMPIO 7 18 Output del comando raidct1l raidctl RAID RAID RAID Disk
214. ondario richiamato verbose Visualizza i messaggi di stato dettagliati relativi a tutti i test callers N Visualizza il backtrace di N chiamanti quando si verifica un errore e callers 0 visualizza il backtrace di tutti i chiamanti prima dell errore Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 TABELLA 2 2 Parole chiave per la variabile di configurazione OpenBoot test args Parola chiave Funzione Continua l esecuzione del test fino a quando non vengono individuati N errori errors N e errors 0 visualizza tutti i rapporti degli errori senza terminare l esecuzione del test Per applicare pi personalizzazioni al test OpenBoot Diagnostics possibile utilizzare la variabile test args in un elenco di parole chiave separate da virgola come illustrato nell esempio seguente ok setenv test args debug loopback media Uso del menu dei test OpenBoot Diagnostics possibile eseguire i test OpenBoot Diagnostics con estrema facilit e in modo interattivo mediante un apposito menu accessibile digitando obdiag al prompt ok Per istruzioni dettagliate vedere Isolamento dei guasti mediante i test diagnostici interattivi OpenBoot a pagina 75 Vengono visualizzati il prompt obdiag gt e il menu interattivo OpenBoot Diagnostics FIGURA 2 3 In questo menu vengono visualizzati solo i dispositivi rilevati dal firmware OpenBoot Per una breve descrizione di ciascun
215. one con il sistema 174 Informazioni sul prompt sc gt 179 Informazioni sul prompt ok 181 Passaggio dal controller di sistema ALOM alla console di sistema 185 Accesso al prompt ok 186 Uso della porta di gestione seriale 188 Attivazione della porta di gestione di rete 189 Accesso alla console di sistema mediante un server terminal 191 Accesso alla console di sistema mediante la connessione tip 194 Modifica del file etc remote 197 Accesso alla console di sistema mediante un terminale alfanumerico 199 Verifica delle impostazioni della porta seriale suttyb 201 Accesso alla console di sistema mediante un monitor grafico 203 Riferimento per le impostazioni delle variabili di configurazione OpenBoot della console di sistema 207 Indice 209 vi Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Figure FIGURA 1 1 FIGURA 2 1 FIGURA 2 2 FIGURA 2 3 FIGURA 2 4 FIGURA 2 5 FIGURA 3 1 FIGURA A 1 FIGURA A 2 FIGURA A 3 FIGURA A 4 FIGURA A 5 Vista schematica e semplificata di un server Sun Fire V440 4 PROM di boot e SCC 10 Diagnostica POST eseguita sulle unit FRU 13 Menu interattivo dei test OpenBoot Diagnostics 19 Associazione tra banchi di memoria logici e moduli DIMM 50 Numerazione di moduli CPU memoria 51 Scelta di uno strumento per l isolamento dei guasti hardware 80 Indirizzamento della console di sistema a porte e dispositivi diversi 176 Porte per il collegamento dei
216. one seriale e di rete vedere m Riferimento per le impostazioni delle variabili di configurazione OpenBoot della console di sistema a pagina 207 Riferimento per le impostazioni delle variabili di configurazione OpenBoot della console di sistema La console di sistema del server Sun Fire V440 viene diretta per impostazione predefinita sulle porte di gestione seriale e di rete SERIAL MGT e NET MGT Tuttavia possibile reindirizzare la console di sistema alla porta seriale DB 9 ttyb o a un monitor grafico locale alla tastiera o al mouse possibile anche reindirizzare la console di sistema alle porte di gestione seriale e di rete Appendice A Configurazione della console di sistema 207 Alcune variabili di configurazione OpenBoot controllano i dispositivi di input e di output utilizzati dalla console di sistema Nella tabella riportata di seguito viene indicato come impostare tali variabili per utilizzare le porte di gestione seriale e di rete ttyb o un monitor grafico locale come connessione alla console di sistema TABELLA A 4 Variabili di configurazione OpenBoot che influiscono sulla console di sistema Impostazione per inviare l output della console ai seguenti dispositivi Nome variabile di configurazione Porte di gestione OpenBoot seriale e di rete Porta seriale ttyb Monitor grafico locale output device ttya ttyb screen input device ttya ttyb keyboard L output dei test POST viene
217. onfigurazione OpenBoot auto boot su false il boot dell ambiente operativo non viene eseguito al termine dei test basati sul firmware Oltre agli strumenti standard la cui esecuzione si basa sul software dell ambiente operativo Solaris sono disponibili altre risorse che possibile utilizzare per la valutazione o il monitoraggio delle condizioni di un server Sun Fire V440 Di seguito vengono riportate alcune risorse disponibili m File di log dei messaggi di errore e di sistema m Comandi Solaris per le informazioni di sistema File di log dei messaggi di errore e di sistema I messaggi di errore e altri messaggi di sistema vengono salvati nel file var adm messages I messaggi che vengono registrati in questo file hanno diverse origini tra cui il sistema operativo il sottosistema di controllo ambientale e diverse applicazioni software Nel caso del software dell ambiente operativo Solaris il daemon syslogd e il relativo file di configurazione etc syslogd conf controllano la modalit di gestione dei messaggi di errore Per informazioni sul file var adm messages e sulle altre origini delle informazioni di sistema vedere la sezione sulla personalizzazione della registrazione dei messaggi di sistema nella documentazione System Administration Guide Advanced Administration che fa parte della documentazione Solaris System Administration Collection Capitolo 2 Diagnostica e processo di boot 25 Comandi Solaris per le informazioni d
218. onfigurazione del sistema per la risoluzione dei problemi 119 Meccanismo di sorveglianza hardware 119 Impostazioni per il ripristino automatico del sistema 120 Funzioni remote per la risoluzione dei problemi 121 Registrazione della console di sistema 122 Informazioni sul processo core dump 123 Abilitazione del processo core dump 124 Verifica della configurazione del core dump 126 Risoluzione dei problemi hardware 129 Raccolta di informazioni durante la risoluzione dei problemi 130 Informazioni sugli errori dal controller di sistema ALOM 131 Informazioni sugli errori restituite da Sun Management Center 131 Informazioni sugli errori restituite dal sistema 131 Registrazione delle informazioni relative al sistema 132 Sommario v Informazioni sugli stati degli errori del sistema 133 Risposta agli stati degli errori del sistema 133 Risposta allo stato di blocco del sistema 133 Risposta agli errori irreversibili di ripristino e alle eccezioni dello stato RED 134 Informazioni sui reboot non previsti 136 Risoluzione dei problemi di un sistema con risposta da parte del sistema operativo 137 Risoluzione dei problemi di un sistema dopo un reboot non previsto 141 Risoluzione degli errori irreversibili di ripristino e delle eccezioni dello stato RED 153 Risoluzione dei problemi di un sistema che non esegue il boot 164 Risoluzione dei problemi di un sistema bloccato 170 A Configurazione della console di sistema 173 Informazioni sulla comunicazi
219. oni della console in modo che utilizzi le porte di gestione seriale e di rete vedere m Riferimento per le impostazioni delle variabili di configurazione OpenBoot della console di sistema a pagina 207 Modifica del file etc remote Potrebbe essere necessario eseguire questa procedura per accedere al server Sun Fire V440 mediante una connessione tip da un sistema Sun su cui viene eseguita una versione precedente del software dell ambiente operativo Solaris L esecuzione di questa procedura potrebbe inoltre essere necessaria se il file etc remote sul sistema Sun stato modificato e non contiene pi un codice hardwire appropriato Operazioni preliminari In questa procedura si assume che sia stato eseguito il login come superutente alla console di un sistema Sun da utilizzare per stabilire una connessione tip al server Sun Fire V440 Operazioni da eseguire Determinare la versione del software dell ambiente operativo Solaris installato sul sistema Sun Digitare quanto segue uname r Il sistema restituisce il numero di versione Appendice A Configurazione della console di sistema 197 2 Effettuare una delle operazioni indicate di seguito in base al numero visualizzato m Se il numero visualizzato mediante il comando uname r corrisponde alla versione 5 0 o successiva Il software per server distribuito con un codice appropriato per hardwire nel file etc remote Se si ha il dubbio che siano state apportate modif
220. ontroller di sistema ALOM Per ulteriori informazioni vedere Server Sun Fire V440 Guida di amministrazione 182 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Comando break o console del controller di sistema ALOM Se si digita break in corrispondenza del prompt sc gt il sistema Sun Fire V440 in esecuzione viene sottoposto al controllo del firmware OpenBoot Se il sistema operativo gi stato chiuso possibile utilizzare il comando console anzich break per accedere al prompt ok Una volta sottoposto il sistema al controllo del firmware OpenBoot necessario considerare che l esecuzione di alcuni comandi OpenBoot come probe scsi probe scsi all o probe ide pu provocare la sospensione del sistema Tasti L1 A Stop A o tasto Break Qualora sia impossibile chiudere regolarmente il sistema possibile accedere al prompt ok digitando la sequenza di tasti L1 A o Stop A da una tastiera Sun oppure premendo il tasto Break su un eventuale terminale alfanumerico collegato al server Sun Fire V440 Nota Questi metodi per l accesso al prompt ok risultano validi solo se la console di sistema stata reindirizzata alla porta appropriata Per informazioni dettagliate vedere Riferimento per le impostazioni delle variabili di configurazione OpenBoot della console di sistema a pagina 207 Quando si utilizzano questi metodi per accedere al comando ok necessario tenere presente c
221. ostazione di Sun Management Center vedere la documentazione Sun Management Center Software User s Guide Per informazioni su Hardware Diagnostic Suite vedere la documentazione Sun Management Center Hardware Diagnostic Suite User s Guide Capitolo 2 Diagnostica e processo di boot 47 48 Identificazione dei moduli di memoria Il firmware del sistema inclusi i test POST fa riferimento alla memoria in diversi modi Nella maggior parte dei casi ad esempio durante l esecuzione dei test o la visualizzazione delle informazioni di configurazione il firmware fa riferimento a banchi di memoria Si tratta di banchi logici e fisici Vedere il CODICE DI ESEMPIO 2 19 CODICE DI ESEMPIO 2 19 Riferimento POST ai banchi di memoria logici O gt Memory interleave set to 0 0 gt Bank 0 512MB 00000000 00000000 gt 00000000 20000000 0 gt Bank 1 512MB 00000001 00000000 gt 00000001 20000000 0 gt Bank 2 512MB 00000002 00000000 gt 00000002 20000000 0 gt Bank 3 512MB 00000003 00000000 gt 00000003 20000000 Tuttavia nell output degli errori POST vedere il CODICE DI ESEMPIO 2 20 il firmware fornisce un identificatore dello slot di memoria B0 D1 J0602 La dicitura BO D1 identifica lo slot di memoria ed visibile sulla scheda a circuiti quando il modulo DIMM installato mentre l etichetta J0602 identifica ugualmente lo slot di memoria ma visibile solo rimuovendo il modulo DIMM dallo slot CODICE DI ESEMPIO 2 2
222. ostics 52 Comandi del menu dei test OpenBoot Diagnostics 53 Dispositivi del bus 12C presenti in un serverSun Fire V440 54 Abbreviazioni o acronimi negli output dei test diagnostici 56 Uso dei comandi Solaris per le informazioni di sistema 101 Uso dei comandi OpenBoot per la visualizzazione delle informazioni 102 Test SunVTS utili da eseguire su un sistema Sun Fire V440 107 x TABELLA 6 1 TABELLA A 1 TABELLA A 2 TABELLA A 3 TABELLA A 4 Impostazioni delle variabili di configurazione OpenBoot per l attivazione del ripristino automatico del sistema ASR 121 Metodi di comunicazione con il sistema 174 Metodi di accesso al prompt ok 187 Incroci dei pin per il collegamento a un server terminal standard 192 Variabili di configurazione OpenBoot che influiscono sulla console di sistema 208 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Prefazione Nella documentazione Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi destinata agli amministratori di sistema esperti vengono fornite informazioni descrittive sul server Sun Fire V440 e sui relativi strumenti diagnostici nonch informazioni specifiche sulla diagnosi e la risoluzione dei problemi del server Operazioni preliminari In questo manuale si presuppone che l utente conosca i termini e i concetti di rete di computer e sappia utilizzare l ambiente operativo Solaris Per utilizzare a
223. output per individuare voci mancanti nella colonna CMD Il CODICE DI ESEMPIO 7 15 mostra l output del comando ef di un server Sun Fire V440 correttamente funzionante ps CODICE DI ESEMPIO 7 15 Output del comando ps ef UID PID PPID C STI root 0 0o 0 14 51 root 1 0o 0 14 51 root 2 0o 0 14 51 root 3 O 0 14 51 root 291 1 O 14 51 root 205 1 0 14 51 root 312 148 O 14 54 root 169 1 0 14 51 userl 314 312 0 14 54 root 53 1 0 14 51 root 59 1 O 14 51 root 100 1 0 14 51 root 131 1 0 14 51 40 root 118 1 0 14 51 root 121 1 0 14 51 root 148 1 O 14 51 root 218 1 0 14 51 root 199 1 0 14 51 root 162 1 0 14 51 daemon 166 1 0 14 51 root 181 1 0 14 51 root 283 1 0 14 51 47 root 184 1 O 14 51 ME 32 32 32 32 47 144 33 42 33 36 37 40 2 w NNW ANOO 4 4 4 4 4 4 4 4 43 T Vv VID w w w w w ww A A 4 Vv VV cv TY TIME ley 00 00 1 02 00 00 00 00 00 00 102 00 ts 1 o o o oo o o ooo ooo o 00 00 00 00 00 00 00 0 00 o o o ooo oo 0 00 usr lib dmi snmpXdmid s Sun SFV440 a 0 00 CMD sched etc init pageout fsflush usr lib saf sac t 300 usr lib lpsched in telnetd usr lib autofs automountd csh usr lib sysevent syseventd usr lib picl picld usr sbin in rdisc s usr lib netsvc yp ypbind broadcast usr sbin rpcbind usr sbin keyserv usr sbin inetd s usr lib power powerd usr sbin nscd usr lib nfs lockd
224. patibles Packages SUNWdtbas SUNWdtbax Capitolo 2 Diagnostica e processo di boot 33 Riepilogo degli strumenti disponibili e del processo di boot Sono disponibili diversi strumenti diagnostici utilizzabili durante le diverse fasi del processo di boot Nella TABELLA 2 3 viene fornito un riepilogo degli strumenti disponibili in base alla fase del processo in corso TABELLA 2 3 Disponibilita degli strumenti diagnostici Strumenti diagnostici disponibili Fase Isolamento dei guasti Monitoraggio del sistema Analisi del sistema Prima dell avvio del LED ALOM nessuno sistema operativo POST Comandi OpenBoot OpenBoot Diagnostics Dopo l avvio del LED ALOM SunVTS sistema operativo Sun Management Center Hardware Comandi Solaris Diagnostic Suite Se il sistema spento ma nessuno ALOM nessuno disponibile l alimentazione di standby 34 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Informazioni su come isolare i guasti nel sistema Ciascuno strumento disponibile per l isolamento dei guasti in grado di rilevare la presenza di guasti nelle diverse unit sostituibili in loco FRU Nelle righe della colonna a sinistra della TABELLA 2 4 vengono elencate le unit FRU presenti in un sistema Sun Fire V440 Gli strumenti diagnostici disponibili vengono riportati nelle intestazioni di colonna nella parte superiore della tabella La prese
225. periodicamente rese disponibili sul sito Web SunSolve Online Tali patch consentono di aggiornare il software e correggerne i difetti In alcuni casi necessario installare tali patch per poter eseguire correttamente determinati test Operazioni successive Per informazioni sull installazione fare riferimento alla documentazione SunVTS User s Guide alla documentazione Solaris appropriata e alla pagina man pkgadd Capitolo 5 Analisi del sistema 111 112 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 PARTE II Risoluzione dei problemi I capitoli compresi in questa parte della documentazione Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi descrivono gli approcci da seguire per evitare e risolvere gli eventuali problemi derivanti da difetti hardware Per informazioni di base sugli strumenti diagnostici nonch per istruzioni dettagliate sull uso di tali strumenti vedere i capitoli nella Parte I Diagnostica Nella Parte II sono inclusi i seguenti capitoli m Capitolo 6 Opzioni per la risoluzione dei problemi m Capitolo 7 Risoluzione dei problemi hardware CAPITOLO 6 Opzioni per la risoluzione dei problemi Esistono diverse opzioni per la risoluzione dei problemi che possono essere implementate quando si imposta e si configura il server Sun Fire V440 Se si imposta il sistema tenendo presente la risoluzione dei problemi possibile rispar
226. pitolo 3 per le procedure di isolamento delle parti m Capitolo 4 per le procedure di monitoraggio del sistema m Capitolo 5 per le procedure di analisi del sistema Potrebbe anche essere utile consultare quanto segue m Appendice A per informazioni sulla console di sistema Informazioni sulla diagnostica e sul processo di boot Al momento dell accensione di un sistema Sun se si presta attenzione alle procedure eseguite durante il processo di boot possibile rendersi conto che sulla console vengono visualizzati diversi messaggi simili al seguente 0 gt Sun Fire TM V440 POST 4 10 0 2003 04 01 22 28 export work staff firmware_re post post build 4 10 0 Fiesta chalupa integrated firmware_re 0 gt Hard Powerup RST thru SW 0 gt CPUs present in system 0 1 2 3 0 gt OBP gt POST Call with 00 00000000 01008000 0 gt Diag level set to MAX O gt MFG scrpt mode set to NONE 0 gt I O port set to TTYA 0 gt O gt Start selftest Una volta compreso il processo di boot questi messaggi la cui descrizione verra fornita pi avanti non saranno pi cos incomprensibili possibile ignorare i test diagnostici basati sul firmware per ridurre i tempi necessari al server per il reboot Durante la lettura delle informazioni fornite di seguito tuttavia si presupponga che il boot del sistema sia stato eseguito in modalit diagnostica che implica l esecuzione dei test basati sul firmware Per le istruzioni vedere
227. put Per un elenco di tali dispositivi vedere la TABELLA A 1 TABELLA A 1 Metodi di comunicazione con il sistema Durante Dopo l installazio l installazio Dispositivi di accesso alla console di sistema disponibili ne ne Un server terminal collegato alla porta di gestione seriale Vv Vv SERIAL MGT o ttyb Vedere e Uso della porta di gestione seriale a pagina 188 e Accesso alla console di sistema mediante un server terminal a pagina 191 e Verifica delle impostazioni della porta seriale su ttyb a pagina 201 e Riferimento per le impostazioni delle variabili di configurazione OpenBoot della console di sistema a pagina 207 Un terminale alfanumerico o dispositivo simile collegato alla porta V v di gestione seriale SERIAL MGT o ttyb Vedere e Uso della porta di gestione seriale a pagina 188 e Accesso alla console di sistema mediante un terminale alfanumerico a pagina 199 e Verifica delle impostazioni della porta seriale su ttyb a pagina 201 e Riferimento per le impostazioni delle variabili di configurazione OpenBoot della console di sistema a pagina 207 Una linea tip collegata alla porta di gestione seriale SERIAL y v MGT o ttyb Vedere e Uso della porta di gestione seriale a pagina 188 e Accesso alla console di sistema mediante la connessione tip a pagina 194 e Modifica del file etc remote a pagina 197 e Verifica delle impostazioni della porta seriale su ttyb a pagina 201 e Riferimento
228. ra si assume che l accesso alla console di sistema del server Sun Fire V440 venga eseguito collegando la porta seriale di un altro sistema Sun alla porta di gestione seriale SERIAL MGT del server Sun Fire V440 194 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Operazioni da eseguire 1 Collegare il cavo seriale RJ 45 e l adattatore RJ 45 o DB 25 fornito Il cavo e l adattatore devono essere collegati tra la porta seriale di un altro sistema Sun e la porta di gestione seriale sul pannello posteriore del server Sun Fire V440 Ulteriori informazioni sul cavo e la scheda seriali tra cui la disposizione dei pin e i numeri parte vengono fornite nel documento Sun Fire V440 Server Parts Installation and Removal Guide Vedere la FIGURA A 5 Porta di gestione seriale Porta seriale connessione tip e Altro sistema Sun FIGURA A 5 Connessione tip tra un server Sun Fire V440 e un altro sistema Sun 2 Accertarsi che nel file etc remote sul sistema Sun sia presente un codice appropriato per hardwire Nella maggior parte delle versioni del software del sistema operativo Solaris distribuiti a partire dal 1992 disponibile un file etc remote con il codice hardwire appropriato Tuttavia se sul sistema Sun viene eseguita una versione precedente del software dell ambiente operativo Solaris oppure se il file etc remote stato modificato potrebbe essere necessar
229. re Per visualizzare i valori correnti di tutte le variabili di configurazione OpenBoot utilizzare il comando printenv Nell esempio seguente viene riportato un breve estratto di output restituito da tale comando ok printenv Variable Name Value Default Value diag level min min diag switch false false 60 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Per impostare o modificare il valore di una variabile di configurazione OpenBoot utilizzare il comando setenv ok setenv diag level max diag level max Per impostare le variabili di configurazione OpenBoot che accettano pi parole chiave inserire uno spazio tra le varie parole chiave ok setenv post trigger power on reset error reset post trigger power on reset error reset Nota La variabile test args differisce leggermente da tutte le altre variabili di configurazione OpenBoot in quanto richiede un unico argomento costituito da un elenco di parole chiave separate da virgole Per informazioni dettagliate vedere Controllo dei test OpenBoot Diagnostics a pagina 18 Le modifiche apportate alle variabili di configurazione OpenBoot diventano in genere effettive al successivo reboot del sistema Uso del LED di localizzazione Il LED di localizzazione consente di individuare rapidamente un sistema tra diversi sistemi presenti in una stanza Per informazioni di base sui LED di sistema veder
230. re Significato Esempi AaBbCc123 Nomi di comandi file e directory l output del computer sullo schermo AaBbCc123 Testo digitato dall utente per distinguerlo dall output del computer sullo schermo AaBbCc123 Titoli di manuali nuovi termini nuove parole o parole da evidenziare Sostituire le variabili della riga di comando con nomi e valori reali Modificare il file login Utilizzare il comando 1s a per ottenere un elenco di tutti i file o Nuova posta su Password Vedere il capitolo 6 del Manuale dell utente Queste opzioni sono denominate classi Per eseguire questa operazione necessario disporre dell accesso di superutente Per eliminare un file digitare rm nomefile Le impostazioni sul browser in uso potrebbero non corrispondere a quelle indicate Prompt del sistema Tipo di prompt Prompt Shell Bourne e Korn Superutente della shell Bourne e Korn Shell C Superutente della shell C Controller di sistema ALOM Firmware OpenBoot Diagnostica OpenBoot nome macchina nome macchina sc gt ok obdiag gt Prefazione xiii Documentazione correlata Numero Applicazione Titolo di parte Informazioni aggiornate sul Server Sun Fire V440 Note sul prodotto 817 2833 prodotto Panoramica sul collegamento Sun Fire V440 Server Setup 817 2852 dei cavi e sull accensione Cabling and Power On Installazione del sistema inclusi Server Sun Fire V440 G
231. registrato negli Stati Uniti e in altri paesi distribuito su licenza esclusivamente da X Open Company Ltd Sun Sun Microsystems il logo Sun AnswerBook2 docs sun com Sun Fire OpenBoot SunVTS Java SunSolve e Solaris sono marchi o marchi registrati di Sun Microsystems Inc negli Stati Uniti e in altri paesi Tutti i marchi SPARC sono utilizzati su licenza e sono marchi o marchi registrati di SPARC International Inc negli Stati Uniti e in altri paesi I prodotti contrassegnati con marchi SPARC sono basati su un architettura sviluppata da Sun Microsystems Inc OPEN LOOK e l interfaccia grafica utente Sun sono state sviluppate da Sun Microsystems Inc per i suoi utenti e licenziatari Sun riconosce gli sforzi innovativi di Xerox nella ricerca e nello sviluppo del concetto di interfaccia utente grafica o visiva per l industria informatica Sun etiene una licenza non esclusiva di Xerox per la Xerox Graphical User Interface tale licenza copre anche i licenziatari Sun che implementano le GUI OPEN LOOK e che comunque rispettano gli accordi stabiliti nei contratti di licenza Sun Diritti del governo statunitense uso commerciale L uso da parte del governo soggetto alle condizioni standard del contratto di Sun Microsystems Inc nonch del FAR e dei relativi supplementi QUESTA DOCUMENTAZIONE VIENE FORNITA SENZA ALCUNA CONDIZIONE O GARANZIA ESPLICITA O IMPLICITA INCLUSE EVENTUALI GARANZIE IMPLICITE DI COMMERCIABILITA IDONEITA A UN DETER
232. rfacce Java rappresentano uno strumento di monitoraggio particolarmente intuitivo in quanto consente di visualizzare la configurazione fisica e logica del sistema Altre funzionalit di Sun Management Center Il software Sun Management Center rende disponibili numerosi strumenti aggiuntivi tra cui un meccanismo di verifica informale una suite di diagnostica aggiuntiva opzionale e uno strumento di generazione dei rapporti che consentono un interazione tra il prodotto ed eventuali utility di gestione prodotte da altre societ installate in un ambiente di elaborazione eterogeneo Verifica informale Sebbene il software per agenti di Sun Management Center debba essere installato su tutti i server da monitorare questo prodotto consente di verificare in modo informale una piattaforma supportata anche se il software per agenti non installato In questo caso pur non disponendo di tutte le funzioni di monitoraggio possibile aggiungere il server a un elenco visualizzato nell interfaccia di Sun Management Center fare in modo che Sun Management Center verifichi periodicamente che il server sia attivo e in esecuzione e ne notifichi l eventuale interruzione Capitolo 2 Diagnostica e processo di boot 41 42 Suite di diagnostica aggiuntiva Lo strumento Hardware Diagnostic Suite disponibile come pacchetto avanzato acquistabile come aggiunta al prodotto Sun Management Center Questa suite consente di analizzare un sistema mentre attivo
233. ri termali e di altro tipo presenti sulla scheda madre moduli CPU memoria moduli DIMM alimentatore e piano posteriore SCSI m Qualsiasi scheda PCI opzionale con funzione di diagnostica automatica incorporata IEEE 1275 compatibile I test OpenBoot Diagnostics vengono eseguiti automaticamente mediante uno script ogni volta che il sistema viene avviato in modalit diagnostica Tuttavia anche possibile eseguire i test OpenBoot Diagnostics manualmente in base a quando indicato nella sezione successiva Analogamente alla diagnostica POST i test OpenBoot Diagnostics sono in grado di rilevare gli errori persistenti Per individuare problemi che si verificano a intermittenza eseguire uno strumento di analisi del sistema Vedere Informazioni sull analisi del sistema a pagina 43 Capitolo 2 Diagnostica e processo di boot 17 18 Controllo dei test OpenBoot Diagnostics Quando si riavvia il sistema possibile eseguire i test OpenBoot Diagnostics in modo interattivo da un apposito menu oppure inserendo i comandi direttamente al prompt ok Nota I test OpenBoot Diagnostics non sono affidabili se eseguiti successivamente a un blocco del sistema in quanto in tal caso lo stato della memoria risulta imprevedibile In questo caso si consiglia di eseguire un ripristino del sistema prima di tali test La maggior parte delle variabili di configurazione OpenBoot utilizzate per controllare i test diagnostici POST vedere la TABELLA 2 1 hann
234. ria Stato del sistema operativo Alimentatori Temperatura del sistema Viene indicato se in ciascuno slot presente un unit e se showenvironment le unit sono associate allo stato OK tole Viene fornita la velocit delle ventole e viene indicato se i vani showenvironment ventole sono associati allo stato OK Viene indicata la presenza di un modulo CPU memoria e viene showenvironment fornita la temperatura misurata su ciascuna CPU Vengono inoltre segnalati eventuali problemi collegati alla temperatura Viene indicato lo stato del sistema operativo ad esempio in showplatform esecuzione interrotto in fase di inizializzazione o altro Viene indicato se in ciascun vano presente un alimentatore showenvironment e se l alimentatore associato allo stato OK Vengono indicate le temperature della CPU e ambientale in showenvironment base alle misurazioni eseguite in diversi vani del sistema e vengono segnalati eventuali problemi collegati alla temperatura 38 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 TABELLA 2 6 Elementi monitorati mediante ALOM Continua Elemento monitorato Informazioni fornite da ALOM Comando da digitare Pannello principale Vengono fornite indicazioni sulla posizione dell interruttore showenvironment del server Sessioni utente di controllo del sistema e sullo stato dei LED Vengono indicati gli utenti che hanno eseguito il
235. riflettono l orario UTC Universal Time Coordinated mentre le stampigliature delle date per l ambiente operativo Solaris riflettono l orario locale server Pertanto un singolo evento pu generare messaggi che sembrano registrati in momenti differenti su log differenti Nota Il controller di sistema ALOM funziona indipendentemente dal sistema e utilizza l alimentazione di standby del server Pertanto il software e il firmware ALOM continuano a funzionare quando la macchina spenta Capitolo 7 Risoluzione dei problemi hardware 167 3 Esaminare il log di boot ALOM Digitare quanto segue sc gt consolehistory boot v Il log di boot ALOM contiene messaggi restituiti dai test POST dal firmware OpenBoot e dal software Solaris dopo l ultimo ripristino del server Quando si esamina l output per identificare un problema verificare i messaggi di errore restituiti dai test diagnostici POST e OpenBoot Il CODICE DI ESEMPIO 7 33 riporta i messaggi di boot restituiti dai test POST Tenere presente che POST non ha restituito alcun messaggio di errore Per un esempio di messaggio di errore POST e ulteriori informazioni sui tali messaggi vedere Informazioni fornite dai messaggi di errore POST a pagina 11 CODICE DI ESEMPIO 7 33 Output del comando consolehistory boot v messaggi di boot From POST Keyswitch set to diagnostic position OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 Clearing TLBs Power On Reset Executing
236. rizioni comprese le soluzioni Le note sul prodotto pi aggiornate sono disponili all indirizzo http www sun com documentation Siti Web SunSolve Online Questo sito contiene una raccolta di risorse per le informazioni sull assistenza tecnica Sun L accesso ad alcune delle informazioni presenti su questo sito dipende dal livello del contratto di assistenza sottoscritto con Sun Questo sito comprende m Patch Support Portal Portale di supporto delle patch Tutti gli elementi necessari per scaricare e installare patch compresi gli strumenti le patch di prodotto le patch di sicurezza le patch firmate i driver x86 e cos via m Sun Install Check Tool Strumento di controllo dell installazione di Sun Un utility che pu essere utilizzata per verificare l installazione e la configurazione appropriate per un nuovo server Sun Fire Questa risorsa verifica in un server Sun Fire le patch valide l hardware l ambiente operativo e la configurazione m Sun System Handbook Manuale per i sistemi Sun Un documento che contiene informazioni tecniche e fornisce l accesso a gruppi di discussione per la maggior parte dell hardware Sun compreso il server Sun Fire V440 m Documenti di supporto bollettini di sicurezza e relativi collegamenti 116 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 E possibile accedere al sito Web SunSolve Online al seguente indirizzo http sunsolve sun
237. rmazioni vedere m Isolamento dei guasti mediante i test diagnostici POST a pagina 73 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Isolamento dei guasti mediante i test diagnostici POST In questa sezione viene descritto come eseguire i test diagnostici all accensione POST per isolare i guasti che si verificano in un server Sun Fire V440 Per informazioni di base sui test diagnostici POST e sul processo di boot consultare il Capitolo 2 Operazioni preliminari Eseguire il login alla console di sistema e accedere al prompt ok Per istruzioni vedere m Accesso al prompt ok a pagina 186 In questa procedura si assume che il sistema sia in modalit diagnostica Per informazioni vedere m Impostazione del sistema in modalit diagnostica a pagina 63 Per eseguire questa procedura necessario anche aver impostato la configurazione predefinita della console di sistema affinch sia possibile passare dal controller di sistema alla console di sistema Per informazioni vedere m Informazioni sulla comunicazione con il sistema a pagina 174 m Accesso mediante la porta di gestione di rete a pagina 178 Operazioni da eseguire Facoltativo Impostare la variabile di configurazione OpenBoot diag level su max Digitare quanto segue ok setenv diag level max diag level max In questo modo viene eseguito il test pi approfondito possibile Capitolo 3 Is
238. rmazioni vedere Comandi Solaris per le informazioni di sistema a pagina 26 2 Digitare il comando appropriato a un prompt della console di sistema Vedere la TABELLA 4 1 TABELLA 4 1 Uso dei comandi Solaris per le informazioni di sistema Comando Informazione Stringa da digitare Note prtconf Informazioni sulla usr sbin prtconf configurazione del sistema prtdiag Informazioni sulla usr platform Utilizzare l opzione v configurazione e sulla uname i per ulteriori dettagli diagnostica sbin prtdiag prtfru Gerarchia delle unit FRU usr sbin prtfru Utilizzare l opzione 1 per e contenuto della memoria visualizzare la gerarchia SEEPROM Utilizzare l opzione c per visualizzare i dati SEEPROM psrinfo Data e ora di collegamento in usr sbin psrinfo Utilizzare l opzione v linea di ciascuna CPU frequenza per ottenere la frequenza di di clock del processore clock e altre informazioni showrev Informazioni sulla revisione usr bin showrev Utilizzare l opzione p hardware e software per visualizzare le patch software Capitolo 4 Monitoraggio del sistema 101 Uso dei comandi OpenBoot per le informazioni di sistema In questa sezione viene descritto come eseguire i comandi OpenBoot per la visualizzazione di diversi tipi di informazioni di sistema relative a un server Sun Fire V440 Per indicazioni sulle informazioni restituite da tali comandi vedere Alti comandi OpenBoot a pagina 22 oppure le pagine
239. rnativo per ignorare i test diagnostici ed eseguire il boot del sistema Questa procedura solo di ausilio nei casi in cui si verificano le seguenti condizioni m Il sistema configurato per l esecuzione automatica dei test diagnostici all accensione m l hardware funzionante e in grado di eseguire il boot ma un malfunzionamento o un incompatibilit del firmware ne impediscono l esecuzione Operazioni da eseguire 1 Eseguire il login al controller di sistema ALOM e accedere al prompt scsc gt 2 Digitare quanto segue sc gt bootmode skip diag Questo comando consente di configurare temporaneamente il sistema in modo che vengano ignorati i test diagnostici basati su firmware indipendentemente dall impostazione delle variabili di configurazione OpenBoot 3 Entro 10 minuti spegnere e riaccendere il sistema Digitare quanto segue sc gt poweroff Are you sure you want to power off the system y n y sc gt poweron necessario eseguire i comandi precedenti entro 10 minuti dall uso di ALOM per cambiare la modalit di boot Dieci minuti dopo aver eseguito il comando ALOM bootmode il sistema ripristina la modalit di boot predefinita e il suo 66 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 funzionamento viene regolato dalle impostazioni correnti delle variabili di configurazione OpenBoot incluse diag switch post trigger e obdiag trigger Per u
240. rrore irreversibile di ripristino Analizzando l output della console di sistema al momento dell errore possibile evitare di sostituire componenti sulla base di queste indicazioni di errore false Inoltre la conoscenza della cronologia dei servizi di manutenzione di un sistema con errori temporanei consente di evitare continue sostituzioni di componenti danneggiati che non risolvono il problema Informazioni sui reboot non previsti A volte potrebbe verificarsi un reboot non previsto del sistema In questo caso accertarsi che il reboot non sia stata causato da un guasto Ad esempio gli errori L2 cache che si verificano nello spazio utente non nello spazio kernel potrebbero causare la registrazione dei dati relativi ai guasti L2 cache da parte del software Solaris e il reboot del sistema Le informazioni registrate potrebbero essere sufficienti a risolvere e risolvere il problema Se il reboot non stato causato da un guasto si potrebbe trattare di un errore irreversibile di ripristino o da un eccezione dello stato RED Vedere Risoluzione degli errori irreversibili di ripristino e delle eccezioni dello stato RED a pagina 153 Inoltre le impostazioni ASR e POST del sistema possono determinare una risposta a determinate condizioni di errore da parte del sistema Se i test POST non vengono avviati durante il processo di reboot o se i livelli di diagnostica del sistema non sono impostati su max possibile che si debba eseguire la
241. sole di sistema mediante la rete In questo modo possibile eseguire il monitoraggio e il controllo remoti Inoltre mediante la porta di gestione di rete sono disponibili fino a quattro connessioni simultanee al prompt sc gt del controller di sistema Per istruzioni sull impostazione della porta di gestione di rete vedere Attivazione della porta di gestione di rete a pagina 189 Per ulteriori informazioni sulla console di sistema e sul controller di sistema ALOM vedere m Informazioni sul prompt sc gt a pagina 179 m Informazioni sul prompt ok a pagina 181 Configurazione alternativa della console di sistema Nella configurazione predefinita gli avvisi del controller di sistema e l output della console di sistema appaiono nella stessa finestra Al termine dell installazione iniziale del sistema possibile reindirizzare la console di sistema in modo che utilizzi la porta seriale ttyb o la porta di una scheda grafica per la ricezione dell input e l invio dell output Impostando la console di sistema in questo modo possibile dividere gli avvisi del controller di sistema e l output della console di sistema in due finestre separate Tuttavia tale configurazione alternativa della console presenta anche i seguenti svantaggi l output POST pu essere indirizzato solo sulle porte di gestione seriale e di rete e non su ttyb o sulla porta di una scheda grafica m Se la console di sistema stata indirizzata su ttyb non sar
242. stema Il CODICE DI ESEMPIO 7 32 mostra un esempio di output restituito dal comando consolehistory run v CODICE DI ESEMPIO 7 32 Output del comando consolehistory run v May 9 14 48 22 00 Sun SFV440 a rmclomv SC Login User admin Logged on init 0 INIT New run level 0 The system is coming down Please wait System services are now being stopped Print services stopped May 9 14 49 18 Sun SFV440 a last message repeated 1 time Capitolo 7 Risoluzione dei problemi hardware 165 CODICE DI ESEMPIO 7 32 Output del comando consolehistory run v Continua May 9 14 49 38 Sun SFV440 a syslogd going down on signal 15 The system is down syncing file systems done Program terminated 1 ok boot disk Sun Fire V440 No Keyboard Copyright 1998 2003 Sun Microsystems Inc All rights reserved OpenBoot 4 10 3 4096 MB memory installed Serial 53005571 Ethernet address 0 3 ba 28 cd 3 Host ID 8328cd03 Initializing 1MB of memory at addr 123fecc000 Initializing 1MB of memory at addr 123fe02000 Initializing 14MB of memory at addr 123 002000 Initializing 16MB of memory at addr 123e002000 Initializing 992MB of memory at addr 1200000000 Initializing 1024MB of memory at addr 1000000000 Initializing 1024MB of memory at addr 200000000 Initializing 1024MB of memory at addr 0 Rebooting with command boot disk Boot device pci 1f 700000 scsi 2 disk 0 0 File and args SunOS Releas
243. ster Removable ATAPI Model TOSHIBA DVD ROM SD C2512 Device 1 Primary Slave Not Present Comando show devs Il comando show devs consente di ottenere un elenco dei percorsi hardware di tutti i dispositivi presenti nella struttura ad albero dei dispositivi firmware Nel seguente CODICE DI ESEMPIO 2 6 viene riportato un possibile output del comando modificato per motivi di spazio CODICE DI ESEMPIO 2 6 Output del comando show devs ok show devs i2c 1 464000 pci 1f 700000 ppm le 0 pci le 600000 pci 1d 700000 ppm ic 0 pci lc 600000 memory controller 2 0 SUNW ULtraSPARC IIIi 2 0 virtual memory memory m0 10 aliases options Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 CODICE DI ESEMPIO 2 6 Output del comando show devs openprom packages i2c 1 464000 idprom 0 50 Fase 3 ambiente operativo Se i test OpenBoot Diagnostics eseguiti su un sistema riescono in genere viene eseguito il boot dell ambiente operativo multiutente che nella maggior parte dei sistemi Sun rappresentato dall ambiente operativo Solaris Se il server viene eseguito in modalit multiutente vengono utilizzati gli strumenti di diagnostica basati su software ad esempio SunVTS e il software Sun Management Center che offrono funzioni di monitoraggio analisi e isolamento degli errori pi avanzate Nota Se si imposta la variabile di c
244. stino e modifiche allo stato degli indicatori LED che si sono verificati dall ultimo boot del sistema Il CODICE DI ESEMPIO 7 6 mostra un esempio di log degli eventi in cui viene indicato che il LED di richiesta di assistenza del pannello principale acceso CODICE DI ESEMPIO 7 6 Output del comando showlogs 09 09 09 09 09 09 09 09 09 16 16 16 16 16 16 16 16 16 54 54 56 56 58 58 58 58 58 27 Sun SFV440 27 Sun SFV44 35 Sun SFV44 54 Sun SFV44 11 Sun SFV44 11 Sun SFV44 13 Sun SFV44 a 00060003 SC System booted a 00040029 Host system has shut down a 00060000 SC Login User admin Logged on a 00060000 SC Login User admin Logged on a a a 00040001 SC Request to Power On Host 00040002 Host System has Reset 0004000b Host System has read and cleared bootmode 13 Sun SFV440 a 0004004f Indicator PS0 POK is now ON 13 Sun SFV440 a 0004004f Indicator PS1 POK is now ON Capitolo 7 Risoluzione dei problemi hardware 141 CODICE DI ESEMPIO 7 6 Output del comando showlogs Continua MAY 09 16 59 19 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 00 46 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 01 51 Sun SFV440 a 0004004f Indicator SYS_FRONT SERVICE is now ON MAY 09 17 03 22 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 03 22 Sun SFV440 0004004f Indicator SYS_FRONT SERVICE is now
245. stopped Print services stopped May 9 14 49 18 Sun SFV440 a last message repeated 1 time May 9 14 49 38 Sun SFV440 a syslogd going down on signal 15 The system is down syncing file systems done Program terminated 1 ok boot disk Sun Fire V440 No Keyboard Copyright 1998 2003 Sun Microsystems Inc All rights reserved OpenBoot 4 10 3 4096 MB memory installed Serial 53005571 Ethernet address 0 3 ba 28 cd 3 Host ID 8328cd03 Initializing 1MB of memory at addr 123fecc000 Initializing 1MB of memory at addr 123fe02000 Initializing 14MB of memory at addr 123 002000 Initializing 16MB of memory at addr 123e002000 Initializing 992MB of memory at addr 1200000000 Initializing 1024MB of memory at addr 1000000000 Initializing 1024MB of memory at addr 200000000 Initializing 1024MB of memory at addr 0 Rebooting with command boot disk Boot device pci 1f 700000 scsi 2 disk 0 0 File and args SunOS Release 5 8 Version Generic 114696 04 64 bit Copyright 1983 2003 Sun Microsystems Inc All rights reserved Hardware watchdog enabled Indicator SYS_FRONT ACT is now ON configuring IPv4 interfaces ce0 Hostname Sun SFV440 a The system is coming up Please wait NIS domainname is Ecd East Sun COM Starting IPv4 router discovery starting rpc services rpcbind keyserv ypbind done Setting netmask of 100 to 255 0 0 0 Setting netmask of ce0 to 255 255 255 0 94 Server Sun Fire V440 Guida a
246. t E comando Solaris uso nella risoluzione degli errori di ripristino irreversibili e delle eccezioni dello stato RED 162 uso nella risoluzione dei problemi dopo un reboot non previsto 151 iostat xtc comando Solaris uso nella risoluzione degli errori di ripristino irreversibili e delle eccezioni dello stato RED 162 uso nella risoluzione dei problemi dopo un reboot non previsto 150 isolamento dei guasti procedure 59 strumenti in base all unit FRU tabella 35 uso dei LED di sistema 69 uso dei test diagnostici OpenBoot 75 uso dei test diagnostici POST 73 uso dei test OpenBoot Diagnostics 21 uso di POST 12 J J numeri 11 49 L LED alimentazione OK alimentatore 71 alimentazione attivit unit DVD ROM 72 attivit unit disco 71 attivit del sistema sistema 70 isolamento dei guasti 69 localizzazione sistema 61 70 richiesta assistenza alimentatore 71 sistema 70 unit disco 71 rimozione consentita alimentatore 71 unit disco 71 standby disponibile alimentatore 71 uso nella risoluzione dei problemi 132 LED del DVD ROM isolamento dei guasti 72 LED dell alimentatore isolamento dei guasti 71 LED delle unit disco isolamento dei guasti 71 212 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 LED di alimentazione OK alimentatore 71 LED di alimentazione attivit unita DVD ROM 72 LED di attivita unita disco 71 LED di a
247. t in qualsiasi momento facendo clic sul pulsante Interrompi Operazioni successive Durante l esecuzione dei test SunVTS regista tutti i messaggi di stato e di errore Per visualizzare tali messaggi fare clic sul pulsante Log oppure selezionare File di log dal menu Report Viene visualizzata una finestra dalla quale possibile scegliere di visualizzare i seguenti log m Informazione vengono fornite informazioni dettagliate su tutti i messaggi di stato e di errore visualizzati nell area dei messaggi dei test m Errore test vengono fornite informazioni dettagliate sui messaggi di errore relativi ai singoli test m Errore Kernel VTS vengono indicati i messaggi di errore relativi al software SunVTS Tali messaggi risultano utili nel caso di un comportamento anomalo del software SunVTS in particolare all avvio m Messaggi UNIX var adm messages file contenente messaggi generati dal sistema operativo e da varie applicazioni m File di log var opt SUNWvts logs directory contenente i file di log Per ulteriori informazioni vedere la documentazione fornita con il software SunVTS Un elenco di tale documentazione presente nella sezione Documentazione correlata a pagina xiv Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 Come verificare se il software SunVTS installato SunVTS Il software SunVTS costituito da pacchetti opzionali che possono o meno essere stati car
248. t ok ma non carica l ambiente operativo possibile che si debba modificare l impostazione della variabile boot device nel firmware del sistema Per informazioni sull utilizzo dei comandi probe vedere Uso dei comandi OpenBoot per le informazioni di sistema a pagina 102 E possibile utilizzare i comandi probe per visualizzare informazioni sui dispositivi SCSI e IDE attivi Per informazioni sulle modifiche al dispositivo di boot predefinito vedere la documentazione Solaris System Administration Guide Basic Administration a Provare a caricare l ambiente operativo per un utente singolo da un CD Inserire un CD dell ambiente operativo Solaris valido in un unit DVD ROM o CD ROM del sistema e immettere boot cdrom s dal prompt ok b Se l esecuzione del boot del sistema avviene dal CD e l ambiente operativo viene caricato verificare quanto segue m Se l esecuzione del boot del sistema avviene generalmente da un disco rigido del sistema controllare l unit disco del sistema e un immagine di boot valida m Se l esecuzione del boot del sistema avviene generalmente dalla rete controllare la configurazione di rete i cavi Ethernet e la scheda di rete del sistema c Se il sistema accede al prompt ok ma non carica l ambiente operativo dal CD verificare quanto segue m Impostazioni delle variabili OpenBoot boot device diag device e auto boot m Struttura ad albero dei dispositivi OpenBoot PROM Per ulteriori informazioni
249. ta Il controller di sistema consente inoltre di accedere alle informazioni sui log di boot ottenute durante l ultimo ripristino del sistema Per ulteriori informazioni sulla console di sistema vedere l Appendice A m File core generati da errori Questi file si trovano nella directory var crash Per ulteriori informazioni vedere Informazioni sul processo core dump a pagina 123 Registrazione delle informazioni relative al sistema In quanto parte delle procedure operative standard importante poter disporre in qualsiasi momento delle seguenti informazioni relative al sistema m Livelli delle patch correnti per l ambiente operativo e il firmware del sistema Versione dell ambiente operativo Solaris Informazioni sulla configurazione hardware specifica Informazioni sul driver e su unit opzionali Registrazioni di servizi di manutenzione recenti La disponibilit e la verifica di tutte queste informazioni consentono di riconoscere pi facilmente tutti i problemi gi identificati da altri utenti Queste informazioni sono inoltre necessarie se si contatta l assistenza Sun o l assistenza tecnica autorizzata fondamentale conoscere la versione e i livelli di revisione delle patch dell ambiente operativo del sistema i livelli di revisione delle patch del firmware e la configurazione hardware specifica prima di tentare di risolvere qualsiasi problema Spesso i problemi si verificano dopo che sono state apportate modifiche al s
250. ta da parte del sistema operativo 139 uso nella risoluzione dei problemi dopo un reboot non previsto 148 prtfru comando Solaris 31 ps ef comando Solaris uso nella risoluzione degli errori di ripristino irreversibili e delle eccezioni dello stato RED 161 uso nella risoluzione dei problemi di sospensione del sistema 170 uso nella risoluzione dei problemi dopo un reboot non previsto 149 psrinfo comando Solaris 32 214 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 R raidct1 comando Solaris uso nella risoluzione dei problemi in seguito a un reboot non previsto 152 reboot non previsto 136 registrazione errori 154 reset x comando controller di sistema 183 reset all comando OpenBoot 206 revisione hardware e software visualizzazione con showrev 33 rimozione consentita LED alimentatore 71 unit disco 71 riparazione funzionalit POST 12 ripristino automatico del sistema ASR Automatic System Recovery attivazione variabili di configurazione OpenBoot 120 garanzia di affidabilit 16 uso nella risoluzione dei problemi 120 ripristino manuale del sistema 184 187 ripristino XIR Externally Initiated Reset accesso al prompt ok 187 uso nella risoluzione dei problemi 119 uso nella risoluzione dei problemi di sospensione del sistema 171 183 risoluzione dei problemi approccio sistematico 130 blocco del sistema 170 con risposta da parte del sistema
251. tamente e inizia il monitoraggio del sistema Nota Per visualizzare i messaggi di boot del controller di sistema ALOM necessario collegare un terminale alfanumerico alla porta di gestione seriale prima di collegare i cavi di alimentazione CA al server Sun Fire V440 possibile eseguire il login al controller di sistema ALOM in qualsiasi momento indipendentemente dallo stato di alimentazione del sistema a condizione che l alimentazione CA sia collegata al sistema e che sia possibile interagire con il sistema Appendice A Configurazione della console di sistema 179 E possibile anche accedere al prompt del controller di sistema ALOM sc gt dal prompt ok o dal prompt Solaris se la console di sistema stata configurata come accessibile mediante le porte di gestione seriale e di rete Per ulteriori informazioni vedere m Accesso al prompt ok a pagina 186 m Passaggio dal controller di sistema ALOM alla console di sistema a pagina 185 Il prompt sc gt indica che l utente sta interagendo direttamente con il controller di sistema ALOM Tale prompt viene visualizzato per primo quando si esegue il login al sistema mediante la porta di gestione seriale o la porta di gestione di rete indipendentemente dallo stato di alimentazione del sistema Nota Quando si accede al controller di sistema ALOM per la prima volta viene richiesta la creazione di un nome utente e di una password per gli accessi successivi Dopo questa configuraz
252. terfaccia ALOM qualora la sessione di diagnostica venga eseguita in remoto dal display della console m Impostare la variabile diag switch su true Digitare quanto segue ok setenv diag switch true 2 Impostare la variabile di configurazione OpenBoot diag script su all Digitare quanto segue ok setenv diag script all In questo modo i test diagnostici OpenBoot vengono eseguiti automaticamente su tutti i componenti della scheda madre e su tutti i dispositivi IEEE 1275 compatibili Nota Se si desidera che i test diagnostici OpenBoot esaminino solo i dispositivi basati sulla scheda madre impostare la variabile diag script su normal 3 Impostare le variabili di configurazione OpenBoot per l avvio dei test diagnostici Digitare quanto segue ok setenv post trigger all resets ok setenv obdiag trigger all resets 4 Impostare il massimo livello di test diagnostico POST Digitare quanto segue ok setenv diag level max Ci assicura il livello massimo di test possibile Il completamento del livello di test massimo richiede molto pi tempo rispetto a quello minimo A seconda della configurazione del sistema potrebbe essere necessario attendere ancora da 10 a 20 minuti affinch venga completato il boot del sistema 68 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Isolamento dei guasti mediante l uso dei LED Sebbene non rappresentino uno str
253. test OpenBoot Diagnostics vedere la TABELLA 2 12 nella sezione Descrizione dei test OpenBoot Diagnostics a pagina 52 obdiag 1 flashprom 2 0 2 i2c 0 320 3 ide d 4 network 1 5 network 2 6 rmc comm 0 3e8 7 rtce 0 70 8 scsi 2 9 scsi 2 1 10 serial 0 2e8 11 serial 0 3 8 12 usb a 13 usb b Commands test test all except help what setenv set default exit diag passes 1 diag level min test args FIGURA 2 3 Menu interattivo dei test OpenBoot Diagnostics Capitolo 2 Diagnostica e processo di boot 19 Comandi interattivi OpenBoot Diagnostics Ciascun test OpenBoot Diagnostics viene eseguito dal prompt obdiag gt digitando quanto segue obdiag gt test n In questa stringa n rappresenta il numero associato a una determinata voce di menu Nota I comandi OpenBoot Diagnostics non sono affidabili se eseguiti successivamente a un blocco del sistema in quanto in tal caso lo stato della memoria risulta imprevedibile In questo caso si consiglia di eseguire un ripristino del sistema prima di tali comandi Sono disponibili diversi altri comandi che possibile utilizzare al prompt obdiag gt Per una descrizione di tali comandi vedere la TABELLA 2 13 nella sezione Descrizione dei test OpenBoot Diagnostics a pagina 52 possibile ottenere un riepilogo di tali informazioni digitando help al prompt obdiag gt Prompt ok comandi test e test all E possibile eseguire i test OpenBoot Diagnosti
254. ti dei test vengono salvati durante i cicli di accensione e spegnimento e forniscono un indicazione dei componenti che hanno superato o meno i test diagnostici POST o OpenBoot Vedere Visualizzazione dei risultati dei test diagnostici a pagina 78 Capitolo 7 Risoluzione dei problemi hardware 131 m Stato dei LED di sistema I LED di sistema possono essere visualizzati in diverse ubicazioni sul sistema oppure utilizzando il controller di sistema ALOM Accertarsi di verificare tutti i LED delle porte di rete per l attivit prima di esaminare il sistema Tutte le informazioni sullo stato del sistema ricavate dai LED andranno perse nel momento in cui viene ripristinato il sistema Per ulteriori informazioni sull utilizzo dei LED per la risoluzione dei problemi del sistema vedere Isolamento dei guasti mediante l uso dei LED a pagina 69 m Log Solaris Se in esecuzione il software Solaris verificare i file di messaggi nel file var adm messages Per ulteriori informazioni vedere la sezione relativa alla personalizzazione della registrazione dei messaggi di sistema nella documentazione Solaris System Administration Guide Advanced Administration Guide all interno di Solaris System Administrator Collection m Console di sistema possibile accedere ai messaggi della console di sistema restituiti dai test diagnostici OpenBoot e POST utilizzando il controller di sistema ALOM purch la console di sistema non sia stata reindirizza
255. to Power On Host MAY 09 16 58 11 Sun SFV440 a 00040002 Host System has Reset MAY 09 16 58 13 Sun SFV440 a 0004000b Host System has read and cleared bootmode MAY 09 16 58 13 Sun SFV440 a 0004004f Indicator PS0 POK is now ON MAY 09 16 58 13 Sun SFV440 a 0004004f Indicator PS1 POK is now ON MAY 09 16 59 19 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 00 46 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 01 51 Sun SFV440 a 0004004f Indicator SYS FRONT SERVICE is now ON MAY 09 17 03 22 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 03 22 Sun SFV440 a 0004004f Indicator SYS_FRONT SERVICE is now OFF MAY 09 17 03 24 Sun SFV440 a 0004000b Host System has read and cleared bootmode MAY 09 17 04 30 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 05 59 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 06 40 Sun SFV440 a 0004004f Indicator SYS FRONT SERVICE is now ON MAY 09 17 07 44 Sun SFV440 a 0004004f Indicator SYS FRONT ACT is now ON 2 Esaminare il log di esecuzione ALOM Digitare quanto segue sc gt consolehistory run v Questo comando mostra il log contenente l output della console di sistema pi recente relativo ai messaggi di boot provenienti dall ambiente operativo Solaris Durante la risoluzione dei problemi esaminare l output per individuare gli errori hardware o software registrati dall ambiente operativo sulla console di si
256. to segue a Fare clic sulla scheda Browser b Fare clic sull icona Hardware nella vista gerarchica Scheda Browser ugs97 95 Details Icona Hardware Icona Config Reader Cartelle delle categorie secondarie B System Q 5 Physical Components __ B Fans A Power Supplies B Expansion Cards E Memory Modules E Other Components Environmental Sensors c Aprire l icona Config Reader nella vista gerarchica Sotto l icona Config Reader si trovano le icone delle cartelle relative alle categorie di dati Physical Logical e Sensor d Aprire l icona della cartella Physical Components Sotto questa cartella si trovano le cartelle secondarie relative a varie categorie secondarie di componenti compresi ventole alimentatori e simili e Aprire una cartella delle categorie secondarie Sotto questa cartella si trovano le icone delle singole tabelle delle propriet dei dati f Fare clic sull icona di una tabella delle propriet dei dati per visualizzare le informazioni di stato del componente hardware in questione In queste tabelle sono presenti il nome l ubicazione e la descrizione di ciascun dispositivo il relativo stato operativo e diversi tipi di informazioni dipendenti dal dispositivo Per ulteriori informazioni sulle tabelle delle propriet dei dati di Config Reader vedere la documentazione Sun Management Center 3 x Supplement for Sun Fire Sun Blade and Netra Systems Ser
257. truzioni dettagliate vedere Accesso al prompt ok a pagina 186 Metodi di accesso al prompt ok Sono disponibili diversi metodi per accedere il prompt ok in base allo stato del sistema e al metodo di accesso alla console di sistema Tali metodi vengono riportati di seguito a partire dal pi appropriato Chiusura regolare dell ambiente operativo Solaris Comando break o console del controller di sistema ALOM Tasti L1 A Stop A o tasto Break Ripristino XIR Externally Initiated Reset Ripristino manuale del sistema Di seguito viene fornita una descrizione di ciascun metodo Per istruzioni vedere Accesso al prompt ok a pagina 186 Chiusura regolare Il metodo migliore di accedere al prompt ok consiste nell eseguire la chiusura dell ambiente operativo immettendo un comando appropriato ad esempio il comando shutdown init o uadmin come descritto nella documentazione di amministrazione del sistema Solaris anche possibile utilizzare il pulsante di alimentazione per avviare una chiusura regolare del sistema La chiusura regolare del sistema evita che si verifichino perdite di dati consente di avvisare preventivamente gli utenti e provoca un interruzione minima delle attivit In genere possibile utilizzare questo metodo purch l ambiente operativo Solaris sia in esecuzione e non si siano verificati danni irreversibili all hardware possibile eseguire una chiusura regolare del sistema anche dal prompt di comandi del c
258. ttivita del sistema sistema 70 LED di localizzazione sistema 61 70 LED di richiesta assistenza alimentatore 71 sistema 70 unit disco 71 LED di sistema isolamento dei guasti 69 LED di standby disponibile alimentatore 71 lettore SCC vedere lettore della scheda di configurazione del sistema light emitting diode vedere LED livelli di esecuzione descrizione 181 prompt ok 181 log degli eventi ALOM uso nella risoluzione dei problemi 153 uso nella risoluzione dei problemi con risposta da parte del sistema operativo 137 uso nella risoluzione dei problemi dopo un reboot non previsto 141 uso nella risoluzione di problemi di boot 164 log di boot ALOM uso nella risoluzione degli errori di ripristino irreversibili e delle eccezioni dello stato RED 156 uso nella risoluzione dei problemi dopo un reboot non previsto 144 uso nella risoluzione di problemi di boot 168 log di esecuzione ALOM uso nella risoluzione degli errori di ripristino irreversibili e delle eccezioni dello stato RED 154 uso nella risoluzione dei problemi dopo un reboot non previsto 142 uso nella risoluzione di problemi di boot 165 M master CPU 9 11 meccanismo sorveglianza hardware uso nella risoluzione dei problemi 119 memoria del sistema determinazione della quantit 26 identificazione dei moduli 48 memoria banchi fisici e logici 48 POST riferimento 48 messaggi dei test diagnostici OpenBoot 146 messaggi di errore OpenBoot Diagnostics
259. ttp www sun com service support Alcuni produttori di terze parti offrono server terminal di registrazione dei dati e soluzioni di gestione della console di sistema centralizzata che consentono di monitorare e registrare l output di molti sistemi A seconda del numero di sistemi amministrati questi possono offrire soluzioni per la registrazione delle informazioni relative alla console di sistema Per ulteriori informazioni sulla console di sistema vedere l Appendice A Informazioni sul processo core dump Per alcuni guasti un tecnico Sun potrebbe aver bisogno di analizzare un file core dump del sistema per determinare la causa principale di un guasto del sistema Sebbene il processo core dump sia abilitato per impostazione predefinita necessario configurare il sistema affinch il file core dump venga salvato in un ubicazione con sufficiente spazio inoltre possibile che si desideri cambiare la directory predefinita del core dump in un altra ubicazione locale per una migliore gestione dei core dump del sistema In determinati ambienti di diagnostica e preproduzione consigliabile cambiare la directory in quanto i file core dump possono occupare una notevole quantit di spazio sul file system Lo spazio di swap viene utilizzato per salvare il dump della memoria del sistema Per impostazioni predefinita il software Solaris utilizza il primo dispositivo di swap definito Il primo dispositivo di swap noto come dispositivo d
260. tware Sun Management Center e del supplemento appropriato per il sistema Sun Fire V440 possibile scaricare il software pi aggiornato dal Web come indicato nella procedura Per impostare il sistema Sun Fire V440 come server o console Sun Management Center vedere le seguenti documentazioni m Sun Management Center Software Installation Guide m Sun Management Center Software User s Guide Vedere inoltre gli altri documenti forniti con il software Sun Management Center 82 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Nota Il software Sun Management Center rende disponibili due tipi di interfaccia della console standalone e basata su browser Questa procedura presuppone l uso di una console grafica standalone basata sulla tecnologia Java L interfaccia della console basata su browser Web il cui aspetto e le cui funzioni sono leggermente differenti viene descritta nella documentazione Sun Management Center Software User s Guide Operazioni da eseguire Scaricare il supplemento Sun Management Center corretto per il sistema Sun Fire V440 Ricercare il supplemento Sun Management Center 3 x Supplement for Sun Fire Sun Blade and Netra Systems disponibile per lo scaricamento gratuito sul sito Web http www sun com sunmanagementcenter Sul sistema Sun Fire V440 installare il software per agenti Sun Management Center necessario installare i componenti per agenti sia dal
261. uando il sistema operativo non in esecuzione Comandi Firmware Visualizzano vari tipi di Disponibili quando il Locale ma OpenBoot informazioni di sistema sistema operativo non in accessibile esecuzione mediante ALOM Comandi Software Visualizzano vari tipi di Richiedono il sistema Locale e su Solaris informazioni di sistema operativo rete SunVTS Software Analizza e sollecita il sistema Richiede il sistema Visualizzato eseguendo test contemporanei operativo Potrebbe essere e controllato necessario installare su rete il software SunVTS separatamente Sun Software Esegue il monitoraggio delle Richiede l esecuzione del Progettato Management condizioni ambientali sistema operativo sia su per l accesso Center dell hardware e delle prestazioni sistemi monitorati sia remoto software di pi sistemi Genera su sistemi master Richiede messaggi di avviso relativi un database dedicato sul a diverse condizioni server master Hardware Software Analizza il sistema in funzione Pacchetto aggiuntivo Progettato Diagnostic mediante test sequenziali e indica opzionale di Sun per l accesso Suite le unit sostituibili in loco Management Center da remoto FRU Field Replaceable Unit danneggiate acquistare separatamente Richiede il sistema operativo e il software Sun Management Center Per quale motivo sono disponibili tutti questi strumenti diagnostici La mancanza di un unico test diagnostico comprensivo di tutte le funzionalit
262. ugli strumenti diagnostici Il server Sun Fire V440 cosi come il software e il firmware forniti con esso contengono molti strumenti e funzionalita di diagnostica che consentono di effettuare quanto segue m Isolare i problemi in caso di guasto di un componente sostituibile in loco m Monitorare lo stato di funzionamento del sistema m Analizzare il sistema per individuare un problema intermittente o il principio di un guasto In questo capitolo vengono descritti gli strumenti diagnostici che possibile utilizzare con il server In questo capitolo inclusa la seguente sezione m Gamma di strumenti a pagina 2 Per informazioni di base complete sugli strumenti diagnostici leggere il presente capitolo quindi passare al Capitolo 2 per informazione sull integrazione di tali strumenti Se si interessati solo alle istruzioni sull uso degli strumenti diagnostici ignorare i primi due capitoli e passare direttamente ai seguenti capitoli m Capitolo 3 per le procedure di isolamento delle parti m Capitolo 4 per le procedure di monitoraggio del sistema m Capitolo 5 per le procedure di analisi del sistema Potrebbe anche essere utile consultare quanto segue m Appendice A per informazioni sulla console di sistema Gamma di strumenti E disponibile una vasta gamma di strumenti diagnostici Sun utilizzabili con il server Sun Fire V440 Oltre agli strumenti standard ad esempio il software Comprehensive Validation Test Suit
263. uida di installazione 817 2803 l installazione in rack e il cablaggio Amministrazione Server Sun Fire V440 Guida di amministrazione 817 2812 Installazione e rimozione delle Sun Fire V440 Server Parts Installation and 816 7729 parti Removal Guide Sun Advanced Lights Out Sun Advanced Lights Out Manager ALOM 817 2488 Manager Online Help Sun Validation Test Suite SunVTS User s Guide 816 5144 VT SARTO SunVTS Test Reference Manual 816 5145 SunVTS Quick Reference Card 816 5146 SunVTS Documentation Supplement 817 2116 Sun Management Center Sun Management Center Software User s Guide 806 5942 Hardware Diagnostic Suite Sun Management Center Hardware Diagnostic 816 5005 Suite User s Guide Variabili di configurazione OpenBoot Command Reference Manual 816 1177 OpenBoot xiv Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Accesso alla documentazione Sun E possibile visualizzare stampare o acquistare un ampia gamma di documentazione Sun incluse le versioni localizzate all indirizzo http www sun com documentation Nota Per informazioni importanti sulla sicurezza e le dichiarazioni di conformit relative al server Sun Fire V440 consultare il manuale Sun Fire V440 Guida alla sicurezza e alla conformit numero di parte 816 7731 disponibile nel CD della documentazione oppure in linea all indirizzo riportato sopra Assistenza tecnica Sun Per eventuali domande sul prodotto alle quali
264. umento di diagnostica standard i LED situati sul telaio e su determinati componenti del sistema possono essere utilizzati come elementi di segnalazione di base di un numero limitato di guasti hardware Operazioni preliminari possibile visualizzare lo stato dei LED controllando direttamente il pannello principale e il pannello posteriore del sistema E possibile anche visualizzare lo stato di determinati LED dall interfaccia della riga di comando del controller di sistema ALOM Nota La maggior parte dei LED disponibili sul pannello principale sono presenti anche sul pannello posteriore E anche possibile visualizzare lo stato dei LED in remoto utilizzando il software Sun Management Center qualora tale strumento sia stato precedentemente installato Per informazioni dettagliate sull installazione dei software Sun Management Center consultare i seguenti documenti m Sun Management Center Software User s Guide Capitolo 3 Isolamento delle parti danneggiate 69 70 Operazioni da eseguire 1 Controllare i LED di sistema Un gruppo di tre LED presente nella parte superiore sinistra del pannello principale gli stessi LED sono situati anche sul pannello posteriore Nella tabella seguente vengono riportate le informazioni fornite da ciascuno di questi LED Nome LED posizione colore Informazione Azione Localizzazione sinistra bianco Richiesta assistenza centro ambra Attivita del sistema destra
265. ump Durante un core dump del sistema il sistema salva la memoria principale del kernel nel dispositivo dump Il contenuto del dump viene compresso durante il processo dump con un rapporto 3 1 ossia se il sistema utilizzava 6 GB di memoria del kernel Capitolo 6 Opzioni per la risoluzione dei problemi 123 il file dump sara di 2 GB Nel caso di un sistema tipico le dimensioni del dispositivo dump devono corrispondere almeno a un terzo delle dimensioni della memoria totale del sistema Per le istruzioni su come calcolare la quantita di spazio di swap disponibile vedere Abilitazione del processo core dump a pagina 124 Abilitazione del processo core dump Generalmente si tratta di un attivit che deve essere completata prima di inserire un sistema nell ambiente di produzione Operazioni preliminari Accedere alla console di sistema Per informazioni vedere m Informazioni sulla comunicazione con il sistema a pagina 174 Operazioni da eseguire 1 Verificare che il processo core dump sia abilitato In qualit di superutente digitare il comando dumpadm dumpadm Dump content kernel pages Dump device dev dsk c0t0dosl1 swap Savecore directory var crash machinename Savecore enabled yes Per impostazione predefinita il processo core dump abilitato nell ambiente operativo Solaris 8 124 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi e Luglio 2003 2 Verificare che l
266. un4u ufsboot SunOS Release 5 8 Version Generic 114696 04 64 bit Copyright 1983 2003 Sun Microsystems Inc All rights reserved Hardware watchdog enabled sc gt 8 Digitare il comando showusers sc gt showusers Questo comando visualizza tutti gli utenti attualmente collegati ad ALOM CODICE DI ESEMPIO 4 16 Rapporti ALOM sulle sessioni utente attive username connection login time client IP addr console admin serial FEB 28 19 45 system admin net 1 MAR 03 14 43 129 BELL Pe LTI sc gt In questo caso osservare che sono presenti contemporaneamente due utenti amministrativi distinti Il primo ha eseguito il login tramite la porta SERIAL MGT e pu accedere alla console di sistema Il secondo utente ha eseguito il login tramite la connessione telnet da un altro host alla porta NET MGT e pu visualizzare la sessione della console di sistema ma non pu eseguire i comandi della console 98 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 9 Digitare il comando showplatform sc gt showplatform Questo comando visualizza lo stato del sistema operativo ossia Running Stopped Initializing o altro CODICE DI ESEMPIO 4 17 Rapporti ALOM sullo stato del sistema operativo Domain Status host utente OS Running sc gt 10 Utilizzare ALOM per eseguire i test diagnostici POST Questa operazione comporta diverse procedure a Di
267. une determinano i test diagnostici eseguiti dal sistema e i messaggi visualizzati sulla console di sistema Per informazioni dettagliate vedere Controllo della diagnostica POST a pagina 13 b Per rendere valide tali modifiche spegnere il sistema Digitare quanto segue ok power off Il sistema memorizza in modo permanente le modifiche ai parametri e si spegne Nota E possibile spegnere il sistema anche utilizzando il pulsante di alimentazione del pannello principale c Collegare il cavo seriale null modem alla porta ttyb sul server Sun Fire V440 Se necessario utilizzare l adattatore del cavo DB 9 o DB 25 fornito con il server d Accendere il sistema Per le procedure di accensione vedere la documentazione Server Sun Fire V440 Guida di amministrazione 196 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Operazioni successive Se necessario proseguire con l installazione o con l esecuzione dei test diagnostici Una volta completate le operazioni nella finestra tip chiudere la sessione tip digitando tilde punto e chiudere la finestra Per ulteriori informazioni sui comandi tip vedere la pagina man luxadm Per ulteriori informazioni sul collegamento e l utilizzo del controller di sistema ALOM vedere m Sun Advanced Lights Out Manager ALOM Online Help Se la console di sistema stata reindirizzata a ttyb e si desidera ripristinare le impostazi
268. uno dei quali ha funzioni e applicazioni specifiche Per avere un idea pi completa dell effettivo funzionamento di ciascuno strumento necessario conoscere le procedure che vengono eseguite al momento dell avvio del server ovvero durante il cosiddetto processo di boot Tale argomento verr trattato nel successivo capitolo Capitolo 1 Panoramica sugli strumenti diagnostici 5 6 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 CAPITOLO 2 Diagnostica e processo di boot In questo capitolo vengono descritti gli strumenti che consentono di isolare i guasti e di monitorare e analizzare i sistemi e vengono fornite informazioni sull uso congiunto di tali strumenti In questo capitolo sono incluse le seguenti sezioni m Informazioni sulla diagnostica e sul processo di boot a pagina 8 m Informazioni su come isolare i guasti nel sistema a pagina 35 m Informazioni sul monitoraggio del sistema a pagina 37 m Informazioni sull analisi del sistema a pagina 43 m Identificazione dei moduli di memoria a pagina 48 m Descrizione dei test OpenBoot Diagnostics a pagina 52 m Riferimenti per la decodifica dei messaggi dei test diagnostici I C a pagina 54 m Riferimenti per la terminologia negli output dei test diagnostici a pagina 56 Se si interessati solo alle istruzioni sull uso degli strumenti diagnostici ignorare questo capitolo e passare direttamente ai seguenti capitoli m Ca
269. uovere l alimentatore senza rischi Rimuovere l alimentatore se necessario Nota Rimuovere un alimentatore guasto solo quando disponibile un alimentatore da installare in sostituzione Entrambi gli alimentatori devono essere presenti per assicurare la corretta circolazione dell aria e il raffreddamento del telaio Se acceso si verificato un problema con l alimentatore o con la ventola interna Se spento la corrente CC trasmessa dall alimentatore non sufficiente Se spento l alimentatore non riceve corrente CA oppure non produce alimentazione standby da 5V adeguata 3 Controllare i LED delle unit disco I LED delle unit disco sono situati dietro lo sportello sinistro del sistema A destra di ciascuna unit disco presente una serie di tre LED Nella tabella seguente vengono riportate le informazioni fornite da ciascuno di questi LED Nome LED posizione colore Informazione Sostituire l alimentatore Rimuovere e riposizionare l alimentatore Se il problema persiste sostituire l alimentatore Controllare il cavo e la presa di alimentazione Se necessario sostituire l alimentatore Azione Rimozione consentita alto blu Richiesta assistenza centro ambra Attivit basso verde Se acceso possibile rimuovere il disco senza rischi Questo LED riservato ad un uso futuro Se acceso o lampeggiante il disco funziona normalmente Rimuovere il disco se ne
270. ura della data del software Solaris o dei messaggi di applicazione m Messaggi di avvertenza su tutti i componenti hardware o software m Informazioni restituite dagli ultimi login di root per determinare se gli amministratori del sistema sono in grado di fornire informazioni sullo stato del sistema al momento del blocco 9 Se possibile verificare se il sistema ha salvato un file core dump I file core dump forniscono informazioni utili all assistenza tecnica per la diagnosi dei problemi del sistema Per ulteriori informazioni sui file core dump vedere Informazioni sul processo core dump a pagina 123 e la sezione relativa alle informazioni sulla gestione dei crash dei sistema nella documentazione Solaris System Administration Guide all interno di Solaris System Administrator Collection 172 Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 APPENDICE A Configurazione della console di sistema In questa appendice viene descritta la console di sistema e vengono illustrate le relative modalita di configurazione su un server Sun Fire V440 nonch la relazione tra la console di sistema e il controller di sistema In 5 questo capitolo vengono descritte le seguenti attivita Accesso al prompt ok a pagina 186 Uso della porta di gestione seriale a pagina 188 Attivazione della porta di gestione di rete a pagina 189 Accesso alla console di sistema mediante un server terminal a
271. utomaticamente tutti i sottosistemi e li analizza in uno dei due seguenti modi Server Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 m Test minimo il software SunVTS esegue un solo passaggio di verifica su tutti i sottosistemi Nelle configurazioni di sistema standard questa opzione richiede una o due ore di tempo m Test completo il software SunVTS una verifica completa di tutti i sottosistemi viene eseguita pi volte anche per 24 ore consecutive m Esclusiva il software SunVTS esegue l analisi solo su sottosistemi specifici selezionati dall utente I test selezionati vengono eseguiti uno alla volta Alcuni test sono disponibili solo in questa modalit tra cui 11dcachetest 12cachetest 12sramtest mpconstest mptest e systest m In linea il software SunVTS esegue l analisi solo su sottosistemi specifici selezionati dall utente I test selezionati vengono eseguiti uno alla volta fino all esecuzione di un controllo completo del sistema Questa modalit risulta utile se si desidera effettuare i test contemporaneamente all esecuzione di altre applicazioni Poich il software SunVTS in grado di eseguire diversi test contemporaneamente utilizzando pertanto numerose risorse del sistema necessario prestare particolare attenzione quando lo si utilizza su un sistema di produzione Durante l esecuzione del test stress di un sistema mediante la modalit Test completo del software SunVTS
272. ver Sun Fire V440 Guida alla diagnostica e alla risoluzione dei problemi Luglio 2003 Operazioni successive Sono disponibili ulteriori funzioni del software Sun Management Center oltre a quelle descritte in questo manuale In particolare possibile impostare gli allarmi e gestire le funzionalit di protezione Per informazioni su questi e su altri argomenti vedere la documentazione Sun Management Center Software User s Guide e le altre documentazioni fornite con il software Sun Management Center Monitoraggio del sistema mediante Sun Advanced Lights Out Manager In questa sezione viene descritto come utilizzare Sun Advanced Lights Out Manager ALOM per eseguire il monitoraggio del server Sun Fire V440 e vengono fornite informazioni su alcune delle principali funzioni di tale strumento Per informazioni di base su ALOM vedere m Monitoraggio del sistema mediante Sun Advanced Lights Out Manager a pagina 38 m Sun Advanced Lights Out Manager ALOM Online Help Operazioni preliminari Eseguire il login alla console di sistema e accedere al prompt ok Per istruzioni vedere m Accesso al prompt ok a pagina 186 Per collegarsi e utilizzare il controller di sistema ALOM sono disponibili diversi metodi a seconda della configurazione del centro dati e della relativa rete Questa procedura presuppone che si preveda di eseguire il monitoraggio del sistema Sun Fire V440 tramite un terminale alfanumerico o un server terminal colle
273. zzare i dati relativi ai guasti del sistema come ad esempio i dettagli sugli errori per ripristino in seguito a un errore irreversibile e l output POST La registrazione della console utile soprattutto durante la risoluzione di errori irreversibili di ripristino Fatal Reset e di eccezioni dello stato RED RED State Exceptions In queste condizioni l ambiente operativo Solaris si arresta in modo anomalo e sebbene invii messaggi alla console di sistema il software dell ambiente operativo non registra alcun messaggio nelle ubicazioni tradizionali del file system come il file var adm messages Di seguito viene riportato un estratto dal file var adm messages CODICE DI ESEMPIO 6 1 Informazioni sul file var adm messages May 9 08 42 17 Sun SFV440 a SUNW UltraSPARC IIIi ID 904467 kern info NOTICE AFTO Corrected memory RCE Event detected by CPUO at TL 0 errID 0x0000005 4 2b0814 May 9 08 42 17 Sun SFV440 a AFSR 0x00100000 lt PRIV gt 82000000 lt RCE gt AFAR 0x00000023 3 808960 May 9 08 42 17 Sun SFV440 a Fault_PC lt unknown gt J_REQ 2 May 9 08 42 17 Sun SFV440 a MB P2 B0 J0601 30602 May 9 08 42 17 Sun SFV440 a unix ID 752700 kern warning WARNING AFTO Sticky Softerror encountered on Memory Module MB P2 B0 J0601 J0602 May 9 08 42 19 Sun SFV440 a SUNW UltraSPARC IIIi ID 263516 kern info NOTICE AFTO Corrected memory CE Event detected by CPU2 at TL 0 errID 0x0000005 c52 509c Il daemon di r

Download Pdf Manuals

image

Related Search

Related Contents

取扱説明書  Targus Geo 15.6"  Nr.: 11010 BT  Transaction Exception Trends  Nyko Charge Link PS3 USB Charging Cable  ポケモンアートアカデミー 1 ご使用になる前に 準備する 2  Radio programming device with access to a remote database  Bienvenue Mercredi Jeudi Vendredi Samedi  Validación de una versión reducida en español del  7-5 Aparelho do DVD Vídeo  

Copyright © All rights reserved.
Failed to retrieve file