Home
Sun Fire V440 Server Diagnostics and Troubleshooting Guide
Contents
1. Sun Fire V440 Server ABBILDUNG A 4 Patch Panel Anschluss zwischen einem Terminalserver und einem Sun Fire V440 Server Anhang A Konfigurieren der Systemkonsole 193 Wenn die Anschlussbelegung der seriellen Verwaltungsschnittstelle nicht mit der Anschlussbelegung der RJ 45 Anschltisse des Terminalservers bereinstimmen m ssen Sie ein bergangskabel erstellen bei dem jeder Kontakt der seriellen Schnittstelle des Sun Fire V440 Servers dem entsprechenden Kontakt der seriellen Schnittstelle des Terminalservers zugeordnet wird TABELLE A 3 zeigt die berg nge die mit dem Kabel hergestellt werden m ssen TABELLE A 3 Kontakt berg nge f r den Anschluss an einen typischen Terminalserver Kontakt der seriellen Schnittstelle RJ 45 Anschluss des Sun Fire V440 Kontakt der seriellen Schnittstelle am Terminalserver Kontakt 1 RTS Kontakt 1 CTS Kontakt 2 DTR Kontakt 2 DSR Kontakt 3 TXD Kontakt 3 RXD Kontakt 4 Signalerde Kontakt 4 Signalerde Kontakt 5 Signalerde Kontakt 5 Signalerde Kontakt 6 RXD Kontakt 6 TXD Kontakt 7 DSR DCD Kontakt 7 DTR Kontakt 8 CTS Kontakt 8 RTS 2 ffnen Sie eine Terminalsitzung auf dem Ger t mit dem die Verbindung hergestellt wird und geben Sie Folgendes ein telnet IP Adresse des Terminalservers Anschlussnummer F r einen Sun Fire V440 Server der mit Anschluss 1000
2. Edit auf der Konsole erstellen Diesbez gliche Anweisungen finden Sie im Sun Management Center Software User s Guide 7 Doppelklicken Sie auf einer Sun Management Center Konsole auf das Symbol f r das Sun Fire V440 System Das Fenster Details wird ge ffnet 8 Klicken Sie auf die Registerkarte Hardware wgs97 95 Details Fenster Details p wgs97 95 Registerkarte Hardware Men Views Physische und logische Hard Physical View Ansichten system Logical View system c p 9 berwachen Sie das Sun Fire V440 System mit Hilfe physischer und logischer Ansichten Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 a W hlen Sie die Option Physical View system im Men Views Die physische Ansicht erm glicht Ihnen die Interaktion mit fotorealistischen Ansichten des Sun Fire V440 Systems von vorne von hinten und von oben Wenn Sie einzelne Hardwarekomponenten und funktionen markieren werden auf der rechten Seite die jeweiligen Status und Produktinformationen angezeigt wgs97 95 xd Fotorealistische Ansicht Vorderseite system Front Refresh Details Markierte Komponente Festplattenlaufwerk Name disk Location HDD1 Operational Status OK Additional Info Availability Running Redundancy Status Physical
3. Kapitel 2 Diagnose und Boot Prozess 11 Testen der FRUs Ein wichtiger Bestandteil der POST Fehlermeldungen ist die Zeile H W under test die zweite Zeile in CODE BEISPIEL 2 1 Die Zeile H W under test gibt an welche FRUs vermutlich f r den Fehler verantwortlich sind In CODE BEISPIEL 2 1 werden zwei verschiedene FRUs angegeben Anhand TABELLE 2 15 in der diese Fehlermeldungen n her erl utert werden k nnen Sie feststellen dass dieser POST Fehler wahrscheinlich durch defekte integrierte Schaltungen IO Bridge oder elektrische Verbindungen auf der Hauptplatine verursacht wurde Zus tzlich weist die Fehlermeldung darauf hin dass die Master CPU in diesem Fall CPU 1 defekt sein k nnte Informationen zur Nummerierung der Sun Fire V440 CPUs finden Sie unter Identifizieren von CPU Speichermodulen auf Seite 46 Obgleich es ber den Rahmen dieses Handbuchs hinausgeht sollten Sie wissen dass sich mit Hilfe von POST Fehlermeldungen Fehler auch ber die FRU Ebene hinaus identifizieren lassen Im aktuellen Beispiel wird in der Zeile MSG die sich direkt unter der Zeile H W under test befindet die betreffende integrierte Schaltung angegeben DEVICE NAME SCSI die wahrscheinlich defekt ist Diese Identifizierungsebene ist besonders hilfreich f r die Reparaturabteilung Warum kann ein POST Fehler mehrere FRUs angeben Da jeder Test auf einer so niedrigen Stufe ausgef hrt wird meldet die POST Diagnose h ufig eher die kleinst
4. Initializing 1MB of memory at addr 123fe02000 Initializing 12MB of memory at addr 123 000000 Initializing 1008MB of memory at addr 1200000000 Initializing 1024MB of memory at addr 1000000000 Initializing 1024MB of memory at addr 200000000 Initializing 1024MB of memory at addr 0 1 ok boot disk 156 Sun FireTM 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Die folgende Beispielausgabe zeigt den Systemstart und das Laden der Solaris Software CODE BEISPIEL 7 26 Ausgabe des Befehls consolehistory boot v Systemstart und Laden der Solaris Software Rebooting with command boot disk Boot device pci 1f 700000 scsi 2 disk 0 0 File and args Loading ufs file system package 1 4 04 Aug 1995 13 02 54 FCode UFS Reader 1 11 97 07 10 16 19 15 Loading platform SUNW Sun Fire V440 ufsboot Loading platform sun4u ufsboot SunOS Release 5 8 Version Generic_114696 04 64 bit Copyright 1983 2003 Sun Microsystems Inc All rights reserved Hardware watchdog enabled sc gt 4 Pr fen Sie die Datei var adm messages auf Hinweise auf einen Fehler Suchen Sie nach den folgenden Informationen tiber den Systemstatus m Gro e L cken in den Zeitstempeln der Solaris Software oder der Anwendungsmeldungen a Warnmeldungen ber Hardware oder Softwarekomponenten m Informationen ber die letzten root Anmeldungen um festzustellen ob Systemadministratoren eventuell Informationen
5. auf Seite 56 Eine Liste wichtiger OpenBoot Konfigurationsvariablen finden Sie in TABELLE 2 1 Die Befehle probe scsi und probe scsi all Die Befehle probe scsi und probe scsi all untersuchen Probleme mit angeschlossenen und internen SCSI Ger ten Achtung Wenn Sie die Eingabeaufforderung ok mit dem Befehl halt oder der Tastenfolge L1 A Stop A angezeigt haben und danach den Befehl probe scsi oder probe scsi all eingeben kann das System h ngen bleiben Der Befehl probe scsi kommuniziert mit allen SCSI Ger ten die an On Board SCSI Controller angeschlossen sind Der Befehl probe scsi all greift dar ber hinaus auf alle Ger te zu die an Hostadaptern in PCI Steckpl tzen angeschlossen sind Mit den Befehlen probe scsi und probe scsi all werden f r alle angeschlossenen und aktiven SCSI Ger te die Nummern des Ziels und der Einheit sowie eine Ger tebeschreibung mit Typ und Hersteller angezeigt Kapitel 2 Diagnose und Boot Prozess 21 CODE BEISPIEL 2 3 Folgendes Beispiel ist eine Ausgabe des Befehls probe scsi Ausgabe des Befehls probe scsi Target Unit Target Unit 0 0 1 0 ok probe scsi Disk FUJITSU MAN3367M SUN36G 1502 71132959 Blocks 34732 MB Disk FUJITSU MAN3367M SUN36G 1502 71132959 Blocks 34732 MB CODE BEISPIEL 2 4 Und hier eine Ausgabe des Befehls probe scsi all Ausgabe des Befehls probe scsi all Target Unit Target Unit 0 0 1 0 ok probe scsi all pcei 1f
6. 0 gt Print Mem Config O gt Caches Icache is ON Dcache is ON Wcache is ON Pcache is ON 0 gt Memory interleave set to 0 0 gt Bank 0 1024MB 00000000 00000000 gt 00000000 40000000 0 gt Bank 2 1024MB 00000002 00000000 gt 00000002 40000000 O gt INFO 0 gt POST Passed all devices 0 gt POST Return to OBP CODE BEISPIEL 7 9 zeigt die Initialisierung des OpenBoot PROM CODE BEISPIEL7 9 Ausgabe des Befehls consolehistory boot v OpenBoot PROM Initialisierung Keyswitch set to diagnostic position OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 Clearing TLBs POST Results Cpu 0000 0000 0000 0000 00 0000 0000 0000 0000 01 ffff ffff f00a 2b73 02 ffff ffff ffff ffff POST Results Cpu 0000 0000 00000 0001 00 0000 0000 0000 0000 01 ffff ffff f00a 2b73 402 FELL fFffL fffL ffff Membase 0000 0000 0000 0000 Kapitel 7 Beheben von Hardwareproblemen 143 CODE BEISPIEL7 9 Ausgabe des Befehls consolehistory boot v OpenBoot PROM Initialisierung MemSize 0000 0000 0004 0000 Init CPU arrays Done Probing pci 1d 700000 Device 1 Nothing there Probing pci 1d 700000 Device 2 Nothing there Die folgende Beispielausgabe zeigt den Startbildschirm CODE BEISPIEL 7 10 Ausgabe des Befehls consolehistory boot v Anzeige des Startbildschirms Sun Fire V440 No Keyboard Copyright 1998 2003 Sun Microsystems Inc All rights reserved OpenBoot 4 10 3 4096 MB memory installed Seri
7. Auszuf hrende Arbeitsschritte Pr fen Sie das ALOM Ereignisprotokoll Geben Sie Folgendes ein sc gt showlogs Das ALOM Ereignisprotokoll enth lt Systemereignisse wie R cksetzereignisse und nderungen des LED Status die seit dem letzten Systemstart aufgetreten sind CODE BEISPIEL 7 3 zeigt ein Beispiel f r ein Ereignisprotokoll aus dem hervorgeht dass die auf der Vorderseite befindliche LED Wartung erforderlich leuchtet Ausgabe des Befehls showlogs 09 09 09 09 09 09 09 09 09 16 16 16 16 16 16 16 16 16 54 54 56 56 58 58 58 58 58 27 Sun SFV440 27 Sun SFV44 35 Sun SFV44 54 Sun SFV44 11 Sun SFV44 11 Sun SFV44 13 Sun SFV44 a 00060003 SC System booted a 00040029 Host system has shut down a 00060000 SC Login User admin Logged on a 00060000 SC Login User admin Logged on a a a 00040001 SC Request to Power On Host 00040002 Host System has Reset 0004000b Host System has read and cleared bootmode 13 Sun SFV440 a 0004004f Indicator PSO POK is now ON 13 Sun SFV440 a 0004004f Indicator PS1 POK is now ON Kapitel 7 Beheben von Hardwareproblemen 135 CODE BEISPIEL 7 3 Ausgabe des Befehls showlogs Fortsetzung 09 09 09 09 09 09 09 09 09 09 136 16 17 17 17 174 a 17 173 17 17 59 00 OL O32 03 03 04 05 06 07
8. MAY 09 16 59 19 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 00 46 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 01 51 Sun SFV440 a 0004004f Indicator SYS FRONT SERVICE is now ON MAY 09 17 03 22 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 03 22 Sun SFV440 a 0004004f Indicator SYS FRONT SERVICE is now OFF MAY 09 17 03 24 Sun SFV440 a 0004000b Host System has read and cleared bootmode MAY 09 17 04 30 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 05 59 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 06 40 Sun SFV440 a 0004004f Indicator SYS FRONT SERVICE is now ON MAY 09 17 07 44 Sun SFV440 a 0004004f Indicator SYS FRONT ACT is now ON sc gt Hinweis In den Zeitstempeln der ALOM Protokolle wird die UTC Zeit Universal Time Coordinated angegeben in den Zeitstempeln der Solaris Betriebssystemumgebung dagegen die lokale Server Zeit Ein einzelnes Ereignis kann daher Meldungen hervorrufen die in verschiedenen Protokollen scheinbar zu verschiedenen Zeiten aufgezeichnet wurden 2 Pr fen Sie das ALOM Ausf hrungsprotokoll Geben Sie Folgendes ein sc gt consolehistory run v Mit diesem Befehl wird das Protokoll angezeigt das die neueste Konsolenausgabe mit Boot Meldungen der Solaris Betriebssystemumgebung enth lt Untersuchen Sie bei der Fehlerbehebung die Ausgabe auf Hardware oder Softwarefehler die von der 140 Sun Fire 440 Server Handbuch zur Fehlersuche und be
9. Nach der Herstellung der Verbindung mit dem ALOM System Controller k nnen Sie zur Systemkonsole selbst wechseln Weitere Informationen ber den ALOM System Controller finden Sie unter Anhang A Konfigurieren der Systemkonsole 189 m berwachen des Systems mit Sun Advanced Lights Out Manager auf Seite 35 m berwachen des Systems mit Sun Advanced Lights Out Manager auf Seite 86 m Sun Advanced Lights Out Manager ALOM Online Help Vorbereitung Stellen Sie sicher dass das Ger t mit dem die Verbindung hergestellt wird folgenderma en eingestellt ist m 9600 Baud m 8 Bit m Parit t keine m 1 Stoppbit m Kein Handshaking Auszuf hrende Arbeitsschritte 1 Richten Sie eine ALOM System Controller Sitzung ein Weitere Anweisungen finden Sie in der Sun Advanced Lights Out Manager ALOM Online Help 2 Geben Sie an der Eingabeaufforderung des ALOM System Controllers Folgendes ein sc gt console Mit dem Befehl console wechseln Sie zur Systemkonsole 3 Um wieder zur Eingabeaufforderung sc gt zur ckzukehren geben Sie die Escape Sequenz ein ok die Zeichen werden auf dem Bildschirm nicht wiederholt N chste Schritte Anweisungen zur Verwendung des ALOM System Controllers finden Sie unter m Sun Advanced Lights Out Manager ALOM Online Help 190 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Aktivieren der Netzwerkverwaltungsschnittstelle
10. Vorbereitung Sie m ssen der Netzwerkverwaltungsschnittstelle eine IP Adresse zuweisen bevor Sie die Schnittstelle verwenden k nnen Wenn Sie die Netzwerkverwaltungsschnittstelle erstmalig konfigurieren m ssen Sie zun chst ber die serielle Verwaltungsschnittstelle eine Verbindung mit dem ALOM System Controller herstellen und der Netzwerkverwaltungsschnittstelle eine IP Adresse zuweisen Sie k nnen die IP Adresse entweder manuell zuweisen oder die Schnittstelle konfigurieren um die IP Adresse per DHCP Dynamic Host Configuration Protocol von einem anderen Server zu beziehen Hinweis Die der Netzwerkverwaltungsschnittstelle zugewiesene IP Adresse ist eindeutig und von der IP Adresse des Sun Fire V440 Servers unabh ngig In Datencentern wird h ufig ein separates Teilnetz f r die Systemverwaltung reserviert Ist Ihr Datencenter entsprechend konfiguriert verbinden Sie die Netzwerkverwaltungsschnittstelle mit diesem Teilnetz Hinweis Die Netzwerkverwaltungsschnittstelle ist eine 1OBASE T Schnittstelle und ausschlie lich f r den ALOM System Controller reserviert Die Netzwerkverwaltungsschnittstelle unterst tzt keine Verbindungen mit 100 Mbit s oder 1Gbit s Netzwerken Auszuf hrende Arbeitsschritte 1 Verbinden Sie ein Ethernet Kabel mit der Netzwerkverwaltungsschnittstelle 2 Melden Sie sich ber die serielle Verwaltungsschnittstelle beim ALOM System Controller an Weitere Informationen zur Herstellung ein
11. auf Seite 182 Diesbez gliche Anweisungen erhalten Sie unter Wechseln zur Eingabeaufforderung ok auf Seite 188 103 berpr fen des Systems mit der SunVTS Software Vorbereitung Die Betriebsumgebung Solaris muss ausgef hrt werden Au erdem muss die berpr fungssoftware SunVTS auf dem System installiert sein Siehe m Ist die Software SunVTS installiert auf Seite 108 Die SunVTS Software erfordert die Verwendung von zwei Sicherheitsschemata Das ausgew hlte Sicherheitsschema muss einwandfrei konfiguriert sein damit Sie dieses Verfahren durchf hren k nnen Siehe m SunVTS User s Guide m SunVTS Software und Sicherheit auf Seite 42 Die SunVTS Software verf gt sowohl ber zeichen als auch ber grafikbasierte Benutzeroberfl chen Die hier beschriebene Vorgehensweise setzt voraus dass Sie die grafische Benutzeroberfl che GUI auf einem System einsetzen auf dem CDE Common Desktop Environment ausgef hrt wird Weitere Informationen ber die zeichenbasierte TTY Schnittstelle von SunVTS und insbesondere Anweisungen zum Aufrufen dieser Schnittstelle mit den Befehlen tip oder telnet finden Sie im SunVTS User s Guide F r die Ausf hrung von SunVTS stehen mehrere Modi zur Verf gung Das nachfolgend beschriebene Verfahren geht von der Standardeinstellung funktionaler Modus aus Eine bersicht der verschiedenen Modi finden Sie unter m berpr fen des Systems mit der SunVTS Software au
12. All rights reserved Kapitel7 Beheben von Hardwareproblemen 141 CODE BEISPIEL 7 7 Ausgabe des Befehls consolehistory run v Fortsetzung Hardware watchdog enabled Indicator SYS_FRONT ACT is now ON configuring IPv4 interfaces ce0 Hostname Sun SFV440 a The system is coming up Please wait NIS domainname is Ecd East Sun COM Starting IPv4 router discovery starting rpc services rpcbind keyserv ypbind done Setting netmask of 100 to 255 0 0 0 Setting netmask of ce0 to 255 255 255 0 Setting default IPv4 interface for multicast add net 224 0 4 gateway Sun SFV440 a syslog service starting Print services started volume management starting The system is ready Sun SFV440 a console login May 9 14 52 57 Sun SFV440 a rmclomv NOTICE keyswitch change event state UNKNOWN May 9 14 52 57 Sun SFV440 a rmclomv Keyswitch Position has changed to Unknown state May 9 14 52 58 Sun SFV440 a rmclomv NOTICE keyswitch change event state LOCKED May 9 14 52 58 Sun SFV440 a rmclomv KeySwitch Position has changed to Locked State May 9 14 53 00 Sun SFV440 a rmclomv NOTICE keyswitch change event state NORMAL May 9 14 53 01 Sun SFV440 a rmclomv KeySwitch Position has changed to On State sc gt 3 Pr fen Sie das ALOM Boot Protokoll Geben Sie Folgendes ein sc gt consolehistory boot v Das ALOM Boot Protokoll enth lt Boot Meldungen von POST OpenBoot Firmware und
13. beispielsweise Network aufgelistet wie aus der Abbildung unten hervorgeht Um eine Kategorie zu erweitern klicken Sie mit der rechten Maustaste auf das H Symbol links neben dem Kategorienamen Processor s Memory Network ceO nettest _ ceO netlbtest _ cel netlbtest 106 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 6 Optional W hlen Sie die Tests aus die Sie ausf hren m chten Bestimmte Tests sind standardm ig aktiviert Sie k nnen diese Einstellungen bernehmen Alternativ haben Sie die M glichkeit einzelne Tests oder Testbl cke mit einem Mausklick in das Kontrollk stchen neben dem Testnamen oder dem Testkategorienamen zu aktivieren bzw zu deaktivieren Ein Test ist aktiviert wenn das Kontrollk stchen neben seinem Namen markiert ist enth lt dieses K stchen keine Markierung ist der zugeh rige Test deaktiviert TABELLE 5 1 enth lt eine Reihe von Tests die f r einen Sun Fire V440 Server besonders empfehlenswert sind Hinweis In TABELLE 5 1 werden die FRUs in der Reihenfolge aufgef hrt in der sie als wahrscheinliche Ursache f r das Fehlschlagen des Tests in Frage kommen 7 Optional Passen Sie einzelne Tests an Ihre individuellen Anforderungen an Klicken Sie mit der rechten Maustaste auf den Namen des Tests den Sie anpassen wollen In der Abbildung unter Schritt 5 erscheint beispielsweise nach einem Klick mit der rechten Mausta
14. ber den Blockierungsstatus sind besonders wichtig f r Sun Supporttechniker wenn Sie sich an diese wenden Eine weiche Systemblockierung l sst sich durch eines der folgenden Symptome charakterisieren m Die Verwendbarkeit oder Leistung des Systems nimmt allm hlich ab m Neue Versuche auf das System zuzugreifen schlagen fehl m Einige Komponenten des Systems reagieren scheinbar nicht mehr m Sie k nnen das System zur OpenBoot Eingabeaufforderung ok herunterfahren Kapitel7 Beheben von Hardwareproblemen 131 Manche weichen Blockierungen verschwinden von selbst w hrend bei anderen das System unterbrochen werden muss damit Informationen an der OpenBoot Eingabeaufforderung gesammelt werden k nnen Bei einer weichen Blockierung reagiert das System auf ein Unterbrechungssignal das ber die Systemkonsole gesendet wird Bei einer harten Systemblockierung reagiert das System nicht mehr auf ein Unterbrechungssignal Von einer harten Systemblockierung k nnen Sie ausgehen wenn alle Abhilfema nahmen gegen weiche Blockierungen erfolglos waren Siehe Fehlerbehebung in einem blockierten System auf Seite 168 Reaktion auf Fatal Reset Fehler und RED State Exceptions Fatal Reset Fehler und RED State Exceptions werden h ufig durch Hardwareprobleme verursacht Fatal Reset Hardwarefehler sind das Ergebnis eines vom System erkannten unzul ssigen Hardwarestatus Ein Fatal Reset Hardwarefehler ist entweder ein vor bergehender F
15. den wirklichen Grund des Fehlers zu identifizieren In bestimmten F llen wird der wirkliche Grund f r den urspr nglichen Fehler unter Umst nden durch falsche Fehleranzeigen anderer Kapitel7 Beheben von Hardwareproblemen 133 Systemkomponenten verschleiert Zum Beispiel werden in den POST Ergebnissen etwa in der Ausgabe des Befehls prtdiag eventuell ausgefallene Komponenten angegeben w hrend die ausgefallenen Komponenten tats chlich gar nicht die Ursache f r den Fatal Reset Fehler sind In den meisten F llen wird der Fatal Reset Fehler von einer eigentlich funktionierende Komponente gemeldet Durch die Analyse der Systemkonsolenausgabe zum Zeitpunkt des Fehlers k nnen Sie den Austausch von Komponenten auf Grundlage falscher Fehleranzeigen vermeiden Dar ber hinaus kann die Kenntnis des Wartungsverlaufs eines Systems auf dem vor bergehende Fehler auftreten dazu beitragen den wiederholten Austausch ausgefallener Komponenten zu vermeiden durch den sich das Problem nicht beseitigen l sst Unerwartete Neustarts Gelegentlich erfolgt ein unerwarteter Neustart des Systems Stellen Sie in diesem Fall sicher dass der Neustart nicht durch einen Absturz verursacht wurde Fehler im L2 Cache beispielsweise die im Benutzerbereich nicht im Kernelbereich auftreten f hren eventuell dazu dass die Fehlerdaten des L2 Cache von der Solaris Software protokolliert werden und das System neu gestartet wird Die protokollierten
16. e screen Auf dem angeschlossenen Bildschirm eines lokalen Grafikmonitors POST Meldungen k nnen nicht auf einem lokalen Grafikmonitor angezeigt werden Sie werden an ttya ausgegeben selbst wenn output device auf screen gesetzt ist Ebenso kann POST Eingaben nur von ttya annehmen Hinweis Diese Variablen beeinflussen sowohl die OpenBoot Diagnostics Tests als auch die POST Tests Diagnose Zuverl ssigkeit und Verf gbarkeit Mit den in TABELLE 2 1 beschriebenen OpenBoot Konfigurationsvariablen k nnen Sie nicht nur die Arbeitsweise der Diagnosetests steuern sondern auch festlegen wodurch sie ausgel st werden Die firmwarebasierten Diagnosetests sind standardm ig deaktiviert um den Neustart eines Servers zu verk rzen Wenn Sie diese Tests berspringen besteht jedoch die Gefahr dass die Zuverl ssigkeit des System beeintr chtigt wird 14 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Durch das Auslassen der Diagnosetests kann ein Server mit defekter Hardware so blockiert werden dass er st ndig startet und abst rzt Je nach der Art des Problems kann sich dieser Zyklus auch sporadisch wiederholen Da die Diagnosetests nicht aufgerufen wurden k nnen die Abst rze auftreten ohne dass diese protokolliert oder aussagekr ftige Konsolenmeldungen aufgezeichnet werden Im Abschnitt Versetzen des Systems in den Diagnosemodus auf Seite 59 erfahren Sie wie Sie sicherstellen dass Ihr
17. hrend Sie die Systemkonsole beobachten Stellen Sie den Systemsteuerungsschalter z B von Normal auf Diagnostics oder von Locked auf Normal Wenn die Systemkonsole die nderung der Position des Systemsteuerungsschalters protokolliert ist das System nicht vollst ndig blockiert Gibt es keine reagierenden Benutzersitzungen zeichnen Sie den Status der System LEDs auf Die System LEDs geben eventuell einen Hinweis auf einen Hardwarefehler im System Mit dem ALOM System Controller k nnen Sie den Status der System LEDs pr fen Weitere Informationen ber die System LEDs finden unter Sun Fire V440 Server Administrationshandbuch Versuchen Sie das System bis zur Eingabeaufforderung ok hochzufahren Diesbez gliche Anweisungen erhalten Sie unter Wechseln zur Eingabeaufforderung ok auf Seite 188 Wenn das System zur Eingabeaufforderung ok gelangt handelt es sich um eine weiche Blockierung Andernfalls liegt eine harte Blockierung vor Weitere Informationen hierzu finden Sie unter Reaktion auf Systemblockierungen auf Seite 131 Wenn Sie das System mit dem eben genannten Schritt nicht zur Eingabeaufforderung ok hochfahren konnten f hren Sie einen XIR aus Durch einen XIR wird das System zur ckgesetzt und der Status des Systems vor dem Zur cksetzen aufgezeichnet so dass Hinweise und Meldungen ber vor bergehende Fehler gespeichert werden Ein XIR entspricht dem direkten Zur cksetzen de
18. keine Eingabeaufforderung wurden vom System zuvor unter Umst nden keine Konsolenmeldungen erzeugt In diesem Fall l sst sich durch Dr cken der Eingabetaste des Terminals eine Eingabeaufforderung erzeugen Um ber den ALOM System Controller auf die Systemkonsole zuzugreifen geben Sie an der Eingabeaufforderung sc gt den Befehl console ein Um ber die Systemkonsole auf den ALOM System Controller zuzugreifen geben Sie die Escape Sequenz des System Controllers ein Diese lautet standardm ig Doppelkreuz Punkt Weitere Informationen erhalten Sie in folgenden Abschnitten bersicht ber die Kommunikation mit dem System auf Seite 174 Die Eingabeaufforderung sc gt auf Seite 180 Die Eingabeaufforderung ok auf Seite 182 Verwendung der seriellen Verwaltungsschnittstelle auf Seite 189 Sun Advanced Lights Out Manager ALOM Online Help Anhang A Konfigurieren der Systemkonsole 187 Wechseln zur Eingabeaufforderung ok Vorbereitung Nachstehend werden verschiedene M glichkeiten beschrieben um zur Eingabeaufforderung ok zu gelangen Jedoch ist nicht jede Methode gleicherma en zu empfehlen Genaue Informationen zu den einzelnen Vorgehensweisen finden Sie unter m Die Eingabeaufforderung ok auf Seite 182 Hinweis Mit dem Herunterfahren des Sun Fire V440 Servers auf die Eingabeaufforderung ok werden alle Anwendungen sowie das Betriebssystem angehalten Nachdem Sie an der Eingabeaufforderung ok Fi
19. m ssen Sie lediglich eine Escape Sequenz oder Escape Befehle eingeben Die Escape Sequenz und Escape Befehle k nnen nicht eingesetzt werden wenn die Systemkonsole an ttyb oder zur Schnittstelle einer Grafikkarte umgeleitet wird m Der System Controller protokolliert Konsolenmeldungen bestimmte Meldungen werden jedoch nicht protokolliert wenn die Systemkonsole an ttyb oder zur Schnittstelle einer Grafikkarte umgeleitet wird Die fehlenden Informationen k nnen von Bedeutung sein wenn Sie sich im Falle eines Problems an den Kundendienst von Sun wenden m ssen Aus den genannten Gr nden ist es sinnvoll die Standardkonfiguration der Systemkonsole beizubehalten Die Konfiguration der Systemkonsole wird durch die Einstellung von OpenBoot Konfigurationsvariablen ge ndert Siehe Referenz f r die Einstellungen der OpenBoot Konfigurationsvariablen der Systemkonsole auf Seite 209 OpenBoot Konfigurationsvariablen k nnen auch mit dem ALOM System Controller eingestellt werden Einzelheiten hierzu finden Sie in der Sun Advanced Lights Out Manager ALOM Online Help Zugriff auf die Systemkonsole ber einen Grafikmonitor Der Sun Fire V440 Server wird ohne Maus Tastatur Monitor oder Grafikkarte f r die Anzeige von Bitmap Grafikdaten geliefert Wenn Sie einen lokalen Grafikmonitor f r den Server installieren wollen m ssen Sie eine Grafikkarte in einen PCI Steckplatz einbauen und einen Monitor eine Maus und eine Tastatur mit den ents
20. oder Softwarefehler die von der Betriebssystemumgebung in der Systemkonsole protokolliert wurden CODE BEISPIEL 7 20 zeigt ein Beispiel f r die Ausgabe des Befehls consolehistory run v Ausgabe des Befehls consolehistory run v May 9 14 48 22 Sun SFV440 a rmclomv SC Login User admin Logged on init INIT New run level 0 The system is coming down Please wait System services are now being stopped 0 152 Sun FireTM 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 CODE BEISPIEL 7 20 Ausgabe des Befehls consolehistory run v Fortsetzung Print services stopped May 9 14 49 18 Sun SFV440 a last message repeated 1 time May 9 14 49 38 Sun SFV440 a syslogd going down on signal 15 The system is down syncing file systems done Program terminated 1 ok boot disk Sun Fire V440 No Keyboard Copyright 1998 2003 Sun Microsystems Inc All rights reserved OpenBoot 4 10 3 4096 MB memory installed Serial 53005571 Ethernet address 0 3 ba 28 cd 3 Host ID 8328cd03 Initializing 1MB of memory at addr 123fecc000 Initializing 1MB of memory at addr 123fe02000 Initializing 14MB of memory at addr 123 002000 Initializing 16MB of memory at addr 123e002000 Initializing 992MB of memory at addr 1200000000 Initializing 1024MB of memory at addr 1000000000 Initializing 1024MB of memory at addr 200000000 Initializing 1024MB of memory at addr 0 Rebooting with command boot dis
21. 0 1 2 3 0 gt OBP gt POST Call with 00 00000000 01008000 Die Konsolenausgabe und POST Meldungen werden angezeigt Der auf dem Bildschirm angezeigte Text richtet sich nach dem Status des Sun Fire V440 Servers und nach der Zeit die zwischen dem Einschalten des Systems und dem Wechsel zur Systemkonsole vergeht Hinweis Systemkonsolen oder POST Meldungen die Sie verpassen werden im ALOM Boot Protokoll gespeichert Um auf das Boot Protokoll zuzugreifen geben Sie an der Eingabeaufforderung sc gt den Befehl consolehistory boot v ein N chste Schritte Weitere Informationen tiber die ALOM Befehlszeilenfunktionen finden Sie unter m Sun Advanced Lights Out Manager ALOM Online Help Weitere Informationen ber die Steuerung der POST Tests finden Sie unter m Steuerung des POST Tests auf Seite 13 Informationen zur Interpretation der POST Fehlermeldungen finden Sie unter m Was bedeuten die POST Fehlermeldungen auf Seite 11 Kapitel 4 berwachen des Systems 99 Verwenden von Solaris Systeminformationsbefehlen Nachfolgend wird die Ausf hrung von Solaris Systeminformationsbefehlen auf einem Sun Fire V440 Server beschrieben N here Informationen zu diesen Befehlen finden Sie unter Befehle zur Abfrage von Solaris Systeminformationen auf Seite 24 oder auf den entsprechenden Seiten des Handbuchs Vorbereitung Das Betriebssystem muss ausgef hrt werden Auszuf hrende Arbeitsschritte 1 W hl
22. 0 gt O gt Start selftest 1 gt Print Mem Config 1 gt Caches Icache is ON Dcache is ON Wcache is ON Pcache is ON 1 gt Memory interleave set to 0 Ts Bank 0 1024MB 00000010 00000000 gt 00000010 40000000 1 Bank 2 1024MB 00000012 00000000 gt 00000012 40000000 0 gt Print Mem Config O gt Caches Icache is ON Dcache is ON Wcache is ON Pcache is ON 0 gt Memory interleave set to 0 0 gt Bank 0 1024MB 00000000 00000000 gt 00000000 40000000 0 gt Bank 2 1024MB 00000002 00000000 gt 00000002 40000000 O gt INFO 0 gt POST Passed all devices 0 gt O gt POST Return to OBP Das folgende Beispiel zeigt die Initialisierung des OpenBoot PROM CODE BEISPIEL 7 22 Ausgabe des Befehls consolehistory boot v OpenBoot PROM Initialisierung Keyswitch set to diagnostic position OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 Clearing TLBs POST Results Cpu 0000 0000 0000 0000 00 0000 0000 0000 0000 01 ffff ffff f00a 2b73 02 ffff ffff ffff ffff POST Results Cpu 0000 0000 00000 0001 00 0000 0000 0000 0000 01 ffff ffff f00a 2b73 402 FLLL fFffL fffL ffff Membase 0000 0000 0000 0000 MemSize 0000 0000 0004 0000 Init CPU arrays Done Probing pci 1d 700000 Device 1 Nothing there Probing pci 1d 700000 Device 2 Nothing there Kapitel 7 Beheben von Hardwareproblemen 155 Die folgende Beispielausgabe zeigt den Startbildschirm CODE BEISPIEL 7 23 Ausgabe des Befehls consolehistory
23. 170 Diagnosemodus Funktion 8 Server 59 Diagnosetests Aktivieren 59 auslassen 14 in der Ausgabe verwendete Bezeichnungen Tabelle 52 Verf gbarkeit w hrend des Boot Prozesses Tabelle 32 vor bergehend auslassen 15 62 Diagnosewerkzeuge Aufgaben 5 inoffizielle 2 23 bersicht Tabelle 2 diag script Variable 13 diag switch Variable Einstellen 13 Verwendung bei Fehlerbehebung blockierter Systeme 170 dumpadm s Befehl Solaris 124 dumpadm Befehl Solaris 122 DVD ROM LED Fehler isolieren 68 E Eingabeaufforderung ok Zugriffsm glichkeiten 183 Einschaltselbsttest siehe POST error reset recovery Variable Einstellung f r Fehlerbehebung 117 Externally Initiated Reset XIR Verwendung bei Fehlerbehebung 117 Verwendung bei Fehlerbehebung in blockiertem System 169 184 Zugriff auf die Eingabeaufforderung ok 189 F Fatal Reset Fehler Fehlerbehebung 151 Reaktion 132 Fehlerbehebung bei reagierendem Betriebssystem 135 blockiertes System 168 Boot Probleme 162 Fatal Reset Fehler 151 Fehlerinformationen 128 Fehlerprotokollierung 119 Konfigurationsvariablen verwenden f r 117 RED State Exceptions 151 systematische Herangehensweise 128 unerwarteter Neustart 139 Fehlerbehebungsthemen 127 Fehlerisolierung mit OpenBoot Diagnostics 20 72 mit POST 12 69 System LEDs verwenden 65 Verfahren 55 Werkzeuge nach FRU Tabelle 32 Fehlermeldungen OpenBoot Diagnostics Bedeutungen 20 POST
24. 184 Testen der Speicherauszugskonfiguration 124 Verwendung bei Fehlerbehebung in blockiertem System 170 Systemaktivit t LED System 66 Systemblockierungen 15 System Controller Siehe auch ALOM Diagnosetests berspringen 15 Einf hrung 8 SCSI R ckwandplatine und 34 System Controller Befehle Siehe auch ALOM bootmode diag 98 break 183 189 console 99 183 187 189 consolehistory boot v 99 142 154 166 consolehistory run v 140 152 164 Escape Sequenz 87 181 187 poweroff 98 poweron 98 reset x 184 showenvironment 35 87 136 showfru 91 showlogs 92 showplatform 36 98 showusers 36 97 Systemkonsole andere Konfigurationsm glichkeiten 178 definiert 174 lokaler Grafikmonitor 179 Meldungen 8 OpenBoot Konfigurationsvariablen Referenz 209 Protokollieren von Fehlermeldungen 119 Standardkonfiguration Erl uterung 174 177 tip Verbindung 177 196 Zugriff tiber Alphanumerisches Terminal 201 Lokaler Grafikmonitor 205 tip Verbindung 196 System LEDs Fehler identifizieren 65 218 Systemspeicher Gesamtgr e anzeigen 24 Module bezeichnen 44 Systemsteuerungsschalter Position bei Fehlerbehebung ndern 167 T Taktgeschwindigkeit CPU 30 Tastatur anschlie en 207 Terminal Baudratentest 203 Terminalserver 193 test Befehl OpenBoot Diagnostics 19 test all Befehl OpenBoot Diagnostics 19 test args Variable 17 test args Variable Schl sselw rter Tabelle 17 tip Ver
25. 2002 SunOS Internal Development root 12 03 02 chalupa28 gate Mit der Option p zeigt der Befehl die installierten Patches an CODE BEISPIEL 2 18 ist ein Ausschnitt aus der Ausgabe von showrev mit der Option p CODE BEISPIEL 2 18 Ausgabe des Befehls showrev p Patch 112663 01 Obsoletes Requires 108652 44 Incompatibles Packages SUNWxwplt Patch 111382 01 Obsoletes Requires Incompatibles Packages SUNWxwplt Patch 111626 02 Obsoletes Requires Incompatibles Packages SUNWolrte SUNWolslb Patch 111741 02 Obsoletes Requires Incompatibles Packages SUNWxwmod SUNWxwmox Patch 111844 02 Obsoletes Requires Incompatibles Packages SUNWxwopt Patch 112781 01 Obsol Requires Incompatibles Packages SUNWxwopt Patch 108714 07 Obsoletes Requires Incompatibles Packages SUNWdtbas SUNWdtbax ct un Kapitel 2 Diagnose und Boot Prozess 31 Werkzeuge und der Boot Prozess Eine bersicht In den einzelnen Stufen des Boot Prozesses stehen unterschiedliche Diagnosewerkzeuge zur Verf gung TABELLE 2 3 gibt einen berblick ber die verf gbaren Werkzeuge und wann diese Werkzeuge verwendet werden k nnen TABELLE 2 3 Verf gbarkeit der Diagnosewerkzeuge Verf gbare Diagnosewerkzeuge Stufe Fehlerisolierung System berwachung Systempr fung Vor dem Start des LEDs ALOM keine Betriebssystems POST OpenBoot Befehle OpenBoot Diagnostics Nach dem Start des LEDs
26. 56 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Den Wert einer OpenBoot Konfigurationsvariable setzen bzw ndern Sie mit dem Befehl setenv ok setenv diag level max diag level max Um OpenBoot Konfigurationsvariablen festzulegen die mehrere Schl sselw rter akzeptieren m ssen Sie die Schl sselw rter durch ein Leerzeichen voneinander trennen ok setenv post trigger power on reset error reset post trigger power on reset error reset Hinweis Die Variable test args unterscheidet sich von den anderen OpenBoot Konfigurationsvariablen da sie ein einziges Argument erfordert das aus einer Liste von Schl sselw rtern besteht die durch Kommata voneinander getrennt sind Weitere Informationen finden Sie unter Steuerung der OpenBoot Diagnostics auf Seite 16 Die nderungen die Sie an OpenBoot Konfigurationsvariablen vornehmen werden in der Regel erst nach dem n chsten Neustart wirksam Bedienung der Locator LED Mit Hilfe der Locator LED sind Sie in der Lage schnell ein bestimmtes System unter zahlreichen anderen in einem Raum ausfindig zu machen Hintergrundinformationen zu den LEDs des Systems finden Sie im Sun Fire V440 Server Administrationshandbuch Sie k nnen die Locator LED ber die Systemkonsole oder ber die Sun Advanced Lights Out Manager ALOM Befehlszeilenschnittstelle Command Line Interface CLI ein und ausschalten Hinweis Auch mi
27. 65 Locator System 57 66 Standby verf gbar Netzteil 67 Systemaktivit t System 66 Verwendung bei Fehlerbehebung 130 Wartung erforderlich Festplattenlaufwerk 68 Netzteil 67 System 66 Locator LED System 57 66 Logische Ansicht Sun Management Center 38 M Manuelles Zurticksetzen des Systems 185 189 Master CPU 9 10 Maus anschlie en 208 Monitor anschlie en 205 N Netzteil LEDs Fehler identifizieren 67 Netzwerkverwaltungsschnittstelle NET MGT Standardverbindung der Systemkonsole 177 Zugriff auf ALOM System Controller und Systemkonsole 186 Neustart unerwartet 134 Nummer der Einheit probe scsi 21 O OBDIAG siehe OpenBoot Diagnostics obdiag trigger Variable Einstellen 14 Verwendung bei Fehlerbehebung in blockiertem System 170 ok Eingabeaufforderung Risiken bei der Ausf hrung von Befehlen 185 Zugriffsm glichkeiten 188 OpenBoot Diagnostics Aufgabe und Ger te 16 Ausf hrung ausl sen 14 Beschreibung 16 Beschreibungen Tabelle 47 Fehlermeldungen Bedeutungen 20 Hardware Ger tepfade in 19 interaktives Men 18 steuern 16 test Befehl 19 test all Befehl 19 von der Eingabeaufforderung ok 19 OpenBoot Diagnostics Meldungen 144 OpenBoot PROM Initialisierung 143 OpenBoot Befehle printenv 21 170 probe ide 22 probe scsi und probe scsi all 21 reset all 209 Risiken 185 show devs 23 show post results 129 OpenBoot Firmware 9 56 80 103 OpenBoot Ko
28. 7 28 Ausgabe des Befehls ps ef Fortsetzung root 235 root 233 root 245 root 247 root 256 root 294 root 304 root 274 etc snmp conf root 334 root 281 root 282 root 292 root 324 233 0 14 51 44 1 0 14 51 44 I 0 14 51 45 2 L 0 14 51 45 2 1 0 14 51245772 291 274 0 14 51 47 0 14 51 51 1 0 14 51 46 292 1 1 al 314 oo 00 15 14 14 14 14 51 SE 00 59 console 47 Ble 47 console 54 51 pts 1 47 0 00 usr lib efcode sparcv9 efdaemon 0 00 usr sadm lib smc bin smcboot 0 00 usr sadm lib smc bin smcboot 0 00 usr sbin vold 0 00 usr lib sendmail bd q15m 0 00 usr lib saf ttymon 0 00 mibiisa r p 32826 0 00 usr lib snmp snmpdx y c 00 ps ef 00 usr lib dmi dmispd 00 usr dt bin dtlogin daemon 00 sh 00 sh ooo 00 9 Stellen Sie fest ob alle E A Ger te und Aktivit ten noch laufen und funktionieren Geben Sie Folgendes ein iostat xtc Mit diesem Befehl werden alle E A Ger te angezeigt und es wird die Aktivit t jedes Ger ts gemeldet Um ein Problem zu identifizieren untersuchen Sie die Ausgabe auf installierte Ger te die nicht aufgef hrt werden CODE BEISPIEL 7 29 zeigt die Ausgabe des Befehls iostat xtc eines intakten Sun Fire V440 Servers CODE BEISPIEL 7 29 Ausgabe des Befehls iostat xtc devi sdo sdl sd2 sd3 sd4 nfsl nfs2 nfs3 nfs4 ce r s 0 0 ooooo0o00o0
29. ACT on green MB SERVICE on amber MB LOCATE off white PSO POK off green PSO STBY off green Der Befehl prtfru Der Sun Fire V440 Server zeichnet alle FRUs des Systems sowie spezielle Informationen ber die einzelnen FRUs in einer hierarchischen Liste auf 28 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 Der Befehl prtfru kann sowohl diese hierarchische Liste als auch die auf den SEEPROM Serial Electrically Erasable Programmable Read Only Memory Ger ten vieler FRUs gespeicherten Daten anzeigen CODE BEISPIEL 2 14 ist ein Ausschnitt einer hierarchischen FRU Liste die mit der Option 1 des Befehls prt fru generiert wurde CODE BEISPIEL 2 14 Ausgabe des Befehls prtfru 1 rutree rutree chassis fru frutree chassis SC Label SC frutree chassis SC Label SC system controller container frutree chassis MB Label MB frutree chassis MB Label MB system board container frutree chassis MB Label MB system board BAT Label BAT Kl frutree chassis PS0 Label PS0 frutree chassis PS0 Label PSO power supply container frutree chassis PS1 Label PS1 frutree chassis HDDO Label HDDO frutree chassis HDDO Label HDDO disk fru basta frutree chassis PCI0 Label PCI0 frutree chassis PCI1 Label PCI1 frutree chassis PCI2 Label PCI2 CODE BEISPIEL 2 15 ist ein Ausschnitt der von prt fru c generierten SEEPROM Daten CODE BEISPIEL 2 15 Ausgabe des Befehls prt fru c frutree chas
30. ALOM SunVTS Betriebssystems Sun Management Center Hardware Diagnostic Solaris Infobefehle Suite System ist ausgeschaltet keine ALOM keine aber die Standby Stromversorgung ist verf gbar E Isolieren von Systemfehlern Mit jedem der f r die Fehlerisolierung zur Verf gung stehenden Werkzeuge lassen sich Fehler in verschiedenen Field Replaceable Units FRUs erkennen Die Zeilenbeschriftungen auf der linken Seite von TABELLE 2 4 geben die FRUs eines Sun Fire V440 Servers an Die zur Verf gung stehenden Diagnosewerkzeuge sind oben in den Spalten berschriften angegeben Ein H kchen gibt an dass ein Fehler in der jeweiligen FRU durch das betreffende Werkzeug isoliert werden kann TABELLE 2 4 Fehlerisolierungswerkzeuge f r FRUs LEDs OpenBoot FRU ALOM Geh use Auf FRU Diags POST ALOM Karte y v v Anschlusskarte Keine Erkennung Hinweise zur Fehlerisolierung finden Sie in TABELLE 2 5 CPU Speichermodul v v DIMMs y 32 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 TABELLE 2 4 Fehlerisolierungswerkzeuge f r FRUs Fortsetzung LEDs OpenBoot FRU ALOM Gehause Auf FRU Diags POST Festplatte y v y v DVD ROM Laufwerk v y L ftereinbaurahmen 0 v v PCI L fter L ftereinbaurahmen 1 v v CPU L fter Hauptplatine y v y v Netzteil v v v SCSI R ckwandplatine Keine Erkennung Hinweise zur Fehleris
31. Aktivierung der ASR Funktion finden Sie im Sun Fire V440 Server Administrationshandbuch 118 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Funktionen zur Fehlerbehebung von entfernten Standorten aus Mit dem Sun Advanced Lights Out Manager ALOM System Controller k nnen Sie von einem entfernten Standort aus Fehler im System beheben und das System pr fen Der ALOM System Controller bietet Ihnen die folgenden M glichkeiten m Ein und Ausschalten der Stromversorgung des Systems m Steuern der Locator LED m ndern der OpenBoot Konfigurationsvariablen m Anzeigen von Informationen zum Umgebungsstatus des Systems m Anzeigen von Systemereignisprotokollen Zus tzlich k nnen Sie mit dem ALOM System Controller auf die Systemkonsole zugreifen falls diese nicht umgeleitet wurde Mit dem Zugriff auf die Systemkonsole haben Sie folgende M glichkeiten Ausf hren von OpenBoot Diagnostics Tests Anzeigen der Ausgabe der Solaris Betriebssystemumgebung Anzeigen der POST Ausgabe Eingeben von Firmwarebefehlen an der Eingabeaufforderung ok Anzeigen von Fehlerereignissen bei Abst rzen der Solaris Betriebssystemumgebung Weitere Informationen zu ALOM finden Sie unter m berwachen des Systems mit Sun Advanced Lights Out Manager auf Seite 35 m berwachen des Systems mit Sun Advanced Lights Out Manager auf Seite 86 m Sun Advanced Lights Out Manager ALOM Online Help Weitere Informationen ber die Systemkons
32. BIST Built In Self Test IEEE 1275 kompatibel 16 60 64 test args Variable und 17 iostat E Befehl Solaris Verwendung bei Behebung von Fatal Reset Fehlern und RED State Exceptions 161 Verwendung bei Fehlerbehebung nach unerwartetem Neustart 149 iostat xtc Befehl Solaris 214 Verwendung bei Behebung von Fatal Reset Fehlern und RED State Exceptions 160 Verwendung bei Fehlerbehebung nach unerwartetem Neustart 148 Isolieren von Fehlern mit OpenBoot Diagnostics 20 72 mit POST 12 69 Werkzeuge nach FRU Tabelle 32 J Nummern 11 45 K Kabel DVD ROM Laufwerk 34 Fehler isolieren 33 40 Leseger t f r Systemkonfigurationskarte 34 SCSI Daten 34 Stromversorgung f r Anschlusskarte 33 Systemsteuerungsschalter 34 Tastatur und Maus 208 Kabel des DVD ROM Laufwerks Fehler isolieren 34 Kabel des Leseger ts f r die Systemkonfigurationskarte Fehler isolieren 34 Kabel des SCC Leseger ts siehe Kabel des Leseger ts f r die Systemkonfigurationskarte Kabel des Systemsteuerungsschalters Fehler isolieren 34 Konsole siehe Systemkonsole L L1 A Tastenfolge 189 Laufwerk LEDs Fehler identifizieren 68 LED Light Emitting Diode siehe LEDs LEDs Aktiv Plattenlaufwerk 68 Ausbau OK Festplattenlaufwerk 68 Netzteil 67 Betrieb OK Netzteil 67 Betrieb Aktivit t DVD ROM Laufwerk 68 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 Fehler identifizieren
33. Bedeutungen 11 Fehlerprotokollierung 152 Fehlerzust nde System 131 Field Replaceable Unit siehe FRU Firmware Siehe auch OpenBoot Firmware Besch digung 15 System Zeichnung 9 FRU Field Replaceable Unit austauschbares Teil bzw Modul Grenzen zwischen 12 Hardwareversion 30 Hersteller 30 hierarchische Liste 29 im SEEPROM gespeicherte Daten 30 nicht durch Fehlerisolierungswerkzeuge isolierbar Tabelle 33 nicht durch System berpr fungswerkzeuge isolierbar Tabelle 40 POST und 12 Teilenummer 30 von verschiedenen Diagnosewerkzeugen berpr ft Tabelle 32 40 sck Befehl Solaris 185 213 G Ger tebaum Daten erfassen von 37 definiert 15 Solaris anzeigen 24 Ger tepfade Hardware 19 23 go Befehl OpenBoot 185 H H W under test siehe Bedeutung von Fehlermeldungen Hardware Diagnostic Suite Sun Management Center Add on 38 Uberpriifung des Systems mit 43 Hardware Geratepfade 19 23 Hardwareversionen mit showrev anzeigen 31 Hardware Watchdog Mechanismus Verwendung bei Fehlerbehebung 117 Herunterfahren ordnungsgem Vorteile 183 189 HP Openview siehe berwachungswerkzeuge anderer Hersteller I2C Gerateadressen Tabelle 50 IDE Bus 22 IEEE 1275 kompatibler integrierter Selbsttest 16 60 64 init Befehl Solaris 189 Inoffizielle Diagnosewerkzeuge 2 23 Siehe auch LEDs input device Variable 14 Integrated Drive Electronics siehe IDE Bus Integrierter Selbsttest
34. Computers AaBbCc123 Buchtitel neu eingef hrte Lesen Sie Kapitel 6 im Begriffe oder Betonungen Ersetzen Sie die Befehlszeilenvariablen durch echte Namen oder Werte Benutzerhandbuch Diese Optionen werden als Klassenoptionen bezeichnet Dazu m ssen Sie als Superuser angemeldet sein Geben Sie zum L schen einer Datei rm Dateiname ein Die Einstellungen Ihres Browsers weichen m glicherweise von diesen Einstellungen ab Eingabeaufforderungen des Systems Art der Eingabeaufforderung Eingabeaufforderung Bourne Shell und Korn Shell Bourne Shell und Korn Shell Superuser C Shell C Shell Superuser ALOMSystem Controller OpenBoot Firmware OpenBoot Diagnostics Computername Computername sc gt ok obdiag gt Vorwort xiii Zugeh rige Dokumentation Teilenum Zweck Titel mer Neueste Produktinformationen Sun Fire V440 Server Produkthinweise 817 2830 bersicht ber Verkabelung Sun Fire V440 Server Setup 817 2851 und Einschalten Cabling and Power On Systeminstallation Sun Fire V440 Server Installationshandbuch 817 2802 einschlie lich Rackeinbau und Verkabelung Administration Sun Fire V440 Server Administrationshandbuch 817 2811 Ein und Ausbau von Sun Fire V440 Server Parts Installation and 816 7729 Komponenten Removal Guide Sun Advanced Lights Out Sun Advanced Lights Out Manager ALOM 817 2487 Manager Online Help Sun Validation Test Suite SunVTS User s Guide 816 5144
35. DIE DOKUMENTATION WIRD IN DER VORLIEGENDEN FORM GELIEFERT UND ALLE AUSDR CKLICHEN ODER IMPLIZITEN BEDINGUNGEN ZUSICHERUNGEN UND GEWAHRLEISTUNGEN EINSCHLIESSLICH JEGLICHER IMPLIZITEN GEW HRLEISTUNG HINSICHTLICH HANDELS BLICHEN QUALITAT DER EIGNUNG FUR EINEN BESTIMMTEN ZWECK UND DER WAHRUNG DER RECHTE DRITTER WERDEN AUSGESCHLOSSEN SOWEIT EIN SOLCHER HAFTUNGSAUSSCHLUSS GESETZLICH ZUL SSIG IST 4 Adobe PostScript Inhalt Vorwort xi Part I Diagnose 1 bersicht ber die Diagnosewerkzeuge 1 Eine breite Palette von Werkzeugen 2 2 Diagnosewerkzeuge und Boot Prozess 7 Uber Diagnose und Boot Prozess 8 Prolog Start des System Controllers 8 Erste Stufe OpenBoot Firmware und POST 9 Zweite Stufe OpenBoot Diagnostics Tests 15 Dritte Stufe Die Betriebssystemumgebung 23 Werkzeuge und der Boot Prozess Eine bersicht 32 Isolieren von Systemfehlern 32 berwachen des Systems 35 berwachen des Systems mit Sun Advanced Lights Out Manager 35 berwachen des Systems mit Sun Management Center 36 berpr fen des Systems 39 berpr fen des Systems mit der SunVTS Software 41 berpr fen des Systems mit der Hardware Diagnostic Suite 43 Inhalt iii Referenz f r die Bezeichnung der Speichermodule 44 Physische Bezeichner 45 Logische B nke 45 Entsprechung zwischen logischen und physischen B nken 46 Identifizieren von CPU Speichermodulen 46 Referenz zu den Tests und Befehlen der OpenBoot Diagnostics 47 Referenz zu den Testme
36. Dabei steht System mit Anzeige f r den Namen des entfernten Systems ber das Sie sich am Sun Fire V440 Server angemeldet haben Wenn Sie SunVTS nicht im Standardverzeichnis opt installiert haben ndern Sie den Pfad in dem oben stehenden Befehl entsprechend Kapitel5 Testen des Systems 105 Die grafische Benutzeroberfl che von SunVTS erscheint auf dem Bildschirm des Systems mit Grafikanzeige SunVTS Diagnostic ejO Commands View Options Reports Scheduler Help Le ERREA l Start Log Meter Model Sun Fire V440 Testing status Hostname wgs97 9 st time 000 00 00 Last Option File AC Coverage no_coverage System passes O Couiative errors O Elapsed te Select Devices System map Physical Logical Green Pass Red Fail gt Schaltflache Log _ Default M Processor s C None M Memory Gall F M Network rn 5 Schaltfl chen Start C Intervention OU Comm Ports St O IDE Devices uatao und wolop Select Test Mode M OtherDevices Connection M SCSI Devices mpto Testauswahlbereich Functional FL ECSI Devices mpt1 Auto Config O USB Devices Exclusive Online Modusauswahlbereich 3 Test messages Clear Bereich f r Testmeldungen kA H g 5 Erweitern Sie die Testlisten um die einzelnen Tests anzuzeigen Im Testauswahlbereich werden Tests nach Kategorien
37. Enth lt Informationen zur FRU Konfiguration Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 TABELLE 2 14 2C Bus Gerate auf einem Sun Fire V440 Server Fortsetzung Adresse Zugeh rige FRU Funktion des Ger ts motherboard fru prom 0 a2 temperature sensor 0 9c temperature 0 80 temperature 0 64 hardware monitor 0 5c gpio 0 48 gpio 0 46 gpio 0 44 gpio 0 42 i2c bridge 0 18 i2c bridge 0 16 temperature 0 30 cpu fru prom 0 be dimm spd 0 b6 dimm spd 0 b8 dimm spd 0 ba dimm spd 0 bc temperature 0 90 Hauptplatine SCSI R ckwandplatine CPU 2 CPU 1 Hauptplatine Hauptplatine SCSI R ckwandplatine Hauptplatine SCSI R ckwandplatine Hauptplatine Hauptplatine CPU 0 CPU 0 CPU Speichermodul 0 DIMM 0 CPU Speichermodul 0 DIMM 1 CPU Speichermodul 0 DIMM 2 CPU Speichermodul 0 DIMM 3 CPU 3 Enth lt Informationen zur FRU Konfiguration Erfasst die Umgebungstemperatur des Systems Erfasst die CPU Temperatur Erfasst die CPU Temperatur Uberwacht Temperaturen Spannungen und L ftergeschwindigkeiten Steuert die System LEDs und die Anzeige der CPU berhitzung Zeigt den Laufwerkstatus an und steuert die LEDs zur Fehleranzeige sowie zur Freigabe des Ausbaus Gibt den Status von Netzteil und CPU an Gibt den Status des Systemschalters an und steuert die Aktivitats LE
38. Geben Sie an der Eingabeaufforderung ok den Befehl sync ein Auf der Systemkonsole sollten Meldungen zum Speicherauszug angezeigt werden Das System startet neu W hrend dieses Prozesses werden die savecore Meldungen angezeigt 3 Warten Sie bis der Neustart des Systems abgeschlossen ist 124 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 4 Suchen Sie im savecore Verzeichnis nach Speicherauszugsdateien Die Dateien hei en unix y und vmcore y dabei steht y f r die ganzzahlige Auszugsnummer Au erdem sollte die Datei bounds vorhanden sein Diese enth lt die n chste von savecore verwendete Absturznummer Wird kein Speicherauszug erstellt f hren Sie die unter Aktivieren des Speicherauszugsprozesses auf Seite 121 beschriebenen Schritte aus Kapitel6 Optionen zur Fehlerbehebung 125 126 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 KAPITEL 7 Optionen zur Fehlerbehebung Der Begriff Fehlerbehebung bezieht sich auf die h ufig heuristische und an der Praxis orientierte Anwendung von Diagnosewerkzeugen zur Ermittlung der Ursachen von Systemproblemen Jedes Systemproblem erfordert eine spezielle Behandlung Es ist nicht m glich fertige Rezepte f r jedes Problem anzubieten Dieses Kapitel enth lt jedoch einige Herangehensweisen und Ma nahmen mit denen sich in Verbindung mit Erfahrung und praktischen berlegungen viele eventuelle Probleme l sen las
39. Generic _114696 04 64 bit Copyright 1983 2003 Sun Microsystems Inc All rights reserved Hardware watchdog enabled Indicator SYS _FRONT ACT is now ON configuring IPv4 interfaces ce0 Hostname Sun SFV440 a The system is coming up Please wait NIS domainname is Ecd East Sun COM Starting IPv4 router discovery starting rpc services rpcbind keyserv ypbind done Setting netmask of 100 to 255 0 0 0 Setting netmask of ce0 to 255 255 255 0 Kapitel 4 berwachen des Systems 93 CODE BEISPIEL 4 9 Ausgabe des Befehls consolehistory run v Fortsetzung Setting default IPv4 interface for multicast add net 224 0 4 gateway Sun SFV440 a syslog service starting Print services started volume management starting The system is ready Sun SFV440 a console login May 9 14 52 57 Sun SFV440 a rmclomv NOTICE keyswitch change event state UNKNOWN May 9 14 52 57 Sun SFV440 a rmclomv Keyswitch Position has changed to Unknown state May 9 14 52 58 Sun SFV440 a rmclomv NOTICE keyswitch change event state LOCKED May 9 14 52 58 Sun SFV440 a rmclomv KeySwitch Position has changed to Locked State May 9 14 53 00 Sun SFV440 a rmclomv NOTICE keyswitch change event state NORMAL May 9 14 53 01 Sun SFV440 a rmclomv KeySwitch Position has changed to On State sc gt 7 Pr fen Sie das ALOM Boot Protokoll Geben Sie Folgendes ein sc gt consolehistory boot v Das ALOM Boot Protoko
40. Ger te zu konfigurieren TABELLE A 1 enth lt eine bersicht der entsprechenden Optionen TABELLE A 1 Kommunikationsm glichkeiten W hrend der Nach der Ger te f r den Zugriff auf die Systemkonsole Installation Installation Ein Terminalserver der mit der seriellen Verwaltungsschnittstelle v v SERIAL MGT oder ttyb verbunden ist Informationen hierzu finden Sie in den folgenden Abschnitten e Verwendung der seriellen Verwaltungsschnittstelle auf Seite 189 e Zugriff auf die Systemkonsole ber einen Terminalserver auf Seite 192 e Pr fen der Einstellungen der seriellen Schnittstellen f r ttyb auf Seite 203 e Referenz f r die Einstellungen der OpenBoot Konfigurationsvariablen der Systemkonsole auf Seite 209 Ein alphanumerisches Terminal oder ein hnliches Ger t das mit v v der seriellen Verwaltungsschnittstelle SERIAL MGT oder ttyb verbunden ist Informationen hierzu finden Sie in den folgenden Abschnitten e Verwendung der seriellen Verwaltungsschnittstelle auf Seite 189 e Zugriff auf die Systemkonsole ber ein alphanumerisches Terminal auf Seite 201 e Pr fen der Einstellungen der seriellen Schnittstellen f r ttyb auf Seite 203 e Referenz f r die Einstellungen der OpenBoot Konfigurationsvariablen der Systemkonsole auf Seite 209 174 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 TABELLE A 1 Kommunikationsm
41. Informationen reichen m glicherweise aus um das Problem zu identifizieren und zu l sen Wurde der Neustart nicht durch einen Absturz verursacht war unter Umst nden ein Fatal Reset Fehler oder eine RED State Exception die Ursache daf r Siehe Behebung von Fatal Reset Fehlern und RED State Exceptions auf Seite 151 Die Reaktion des Systems auf bestimmte Fehler kann auch durch die ASR und POST Einstellungen festgelegt werden Wenn POST w hrend des Neustarts nicht aufgerufen wird oder wenn die Systemdiagnosestufe nicht auf max gesetzt ist m ssen Sie die Systemdiagnose m glicherweise auf einer h heren Stufe ausf hren um den Grund f r den Neustart zu ermitteln falls dieser aus den Systemmeldungen und den Systemkonsolendateien nicht eindeutig hervorgeht 134 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 CODE BEISPIEL 7 3 Fehlerbehebung in einem System mit reagierendem Betriebssystem Vorbereitung Melden Sie sich beim System Controller an um zur Eingabeaufforderung sc gt zu gelangen Weitere Informationen finden Sie unter a Die Eingabeaufforderung sc gt auf Seite 180 Hierbei wird vorausgesetzt dass die Systemkonsole standardm ig konfiguriert ist so dass Sie zwischen dem System Controller und der Systemkonsole wechseln k nnen Siehe a bersicht ber die Kommunikation mit dem System auf Seite 174 m Zugriff ber die Netzwerkverwaltungsschnittstelle auf Seite 178
42. Schaltung JBus JBus PCI gt Boot E A PROM Bridge TTYB PGI SERIAL MGT 4 SCC Steckplatz PCI NET MGT GE T Bus USB SCSI Festplatte und DVD 12C Ethernet SCSI Controller Controller Controller __ Controller USB und Ethernet Schnittstellen ea ae PCI Bus Zu Netzteilen L ftern und anderen Komponenten ABBILDUNG 1 1 Vereinfachtes Schema eines Sun Fire V440 Servers Bedenken Sie auch dass einige Diagnosetests ausgef hrt werden m ssen wenn sich das System nicht starten l sst Ein Diagnoseverfahren das in einem solchen Fall Probleme isolieren soll muss unabh ngig vom Betriebssystem laufen Einem solchen vom Betriebssystem unabh ngigen Diagnoseverfahren stehen aber die betr chtlichen Ressourcen des Betriebssystems nicht zur Verf gung mit denen sich die komplexen Ursachen eines Fehlers aufkl ren lassen Hinzu kommt dass unterschiedliche Standorte verschiedene Anforderungen an die Diagnose stellen Es besteht ein Unterschied darin ob Sie einen einzelnen Computer oder ein komplettes Datencenter mit unz hligen Ger teracks verwalten Zudem kann Ihr System auch remote implementiert werden vielleicht sogar an unzug nglichen Orten Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Und denken Sie schlie lich an die verschiedenen Aufgaben die Sie mit Ihren Diagnosewerkzeugen ausf hren m chten m F
43. Seite 13 ausf hrlicher besprochen 210 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Index SYMBOLE etc remote Datei 197 etc syslogd conf Datei 24 var adm messages Datei Fehlerprotokollierung 24 Verwendung bei Fehlerbehebung bei reagierendem Betriebssystem 138 Verwendung bei Fehlerbehebung nach unerwartetem Neustart 145 A Absturz des Betriebssystems 15 Absturz Betriebssystem 15 Adressen Bitwalk POST Test 10 der PC Ger te Tabelle 50 Agents Sun Management Center 37 Aktiv LED Plattenlaufwerk 68 ALOM Advanced Lights Out Manager Siehe auch System Controller E Mail Benachrichtigung und 35 Isolierung von SCC Fehlern und 34 Kabelfehlerisolierung und 33 schrittweise Anleitung 86 System berwachung mit 35 86 Verwendung bei Fehlerbehebung 119 Warnschwellenwerte gemeldet von 88 90 Zugriff auf die Systemkonsole 119 ALOM Ausf hrungsprotokoll Verwendung bei Behebung von Fatal Reset Fehlern und RED State Exceptions 152 Verwendung bei Behebung von Startproblemen 164 Verwendung bei Fehlerbehebung nach unerwartetem Neustart 140 ALOM Befehle siehe System Controller Befehle ALOM Boot Protokoll Verwendung bei Behebung von Fatal Reset Fehlern und RED State Exceptions 154 Verwendung bei Behebung von Startproblemen 166 Verwendung bei Fehlerbehebung nach unerwartetem Neustart 142 ALOM Freignisprotokoll Verwendung bei Behebung von Startproblemen 163 Verwendung
44. Seite 28 Weitere Informationen zu physischen und logischen Ansichten finden Sie im Sun Management Center Software User s Guide 84 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 10 berwachen Sie das Sun Fire V440 System unter Verwendung der Eigenschaftstabellen des Config Readers Gehen Sie folgenderma en vor um auf diese Informationen zuzugreifen a Klicken Sie auf die Registerkarte Browser b Klicken Sie auf das Hardware Symbol in der Hierarchie Registerkarte Browser wgs97 95 Details Symbol Hardware Symbol Config Reader 9 a Common Config Reader 7 Ordner f r 4 Unterkategorien B System Q A Physical Components B Fans A Power Supplies B Expansion Cans B Memory Modules E Other Components Environmental Sensors c Offnen Sie das Symbol Config Reader in der Hierarchie Unter dem Symbol Config Reader finden Sie Symbole f r die Datenkategorien Physical Logical und Sensor d ffnen Sie das Ordnersymbol Physical Components Unter diesem Ordner finden Sie Unterordner f r verschiedene Komponentenunterkategorien wie L fter Netzteile usw e ffnen Sie einen Unterkategorieordner Unter diesem Ordner finden Sie Symbole f r einzelne Dateneigenschaftstabellen f Klicken Sie auf ein solches Symbol um Statusinformationen f r die jeweilige Hardwarekomponente anzuzeigen Diese
45. Server muss die Betriebssystemumgebungssoftware Solaris ausgef hrt werden Anhang A Konfigurieren der Systemkonsole 203 Auszuf hrende Arbeitsschritte 1 ffnen Sie ein Shell Tool Fenster 2 Geben Sie Folgendes ein eeprom grep ttyb mode 3 Als Antwort muss die folgende Anzeige erscheinen ttyb mode 9600 8 n 1 Diese Zeile gibt die Konfiguration der seriellen Schnittstelle des Sun Fire V440 Servers an m 9600 Baud m 8 Bit m Parit t keine m 1 Stoppbit m Kein Handshake Protokoll N chste Schritte Weitere Informationen zu den Einstellungen der seriellen Anschl sse finden Sie auf der eeprom Man Page Anweisungen zur Einstellung der OpenBoot Konfigurationsvariablen finden Sie unter m Anzeigen und Setzen von OpenBoot Konfigurationsvariablen auf Seite 56 204 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Zugriff auf die Systemkonsole ber einen lokalen Grafikmonitor Vorbereitung Nach der erstmaligen Installation des Systems k nnen Sie einen lokalen Grafikmonitor installieren und f r den Zugriff auf die Systemkonsole einrichten Sie k nnen einen lokalen Grafikmonitor nicht f r die Erstinstallation des Systems und nicht zur Anzeige von POST Meldungen verwenden Detaillierte Informationen zu den Optionen f r die Systemkonsole finden Sie unter a bersicht ber die Kommunikation mit dem System auf Seite 174 Zum Installieren eines lo
46. Speicherauszugsdateien enthalten wertvolle Informationen die Ihren Supportanbieter bei der Diagnose von Systemproblemen unterst tzen Weitere Informationen ber Speicherauszugsdateien finden Sie unter bersicht ber den Speicherauszugsprozess auf Seite 121 und Managing System Crash Information im Solaris System Administration Guide Uberpriifen Sie die LEDs des Systems Mit dem ALOM System Controller k nnen Sie den Status der System LEDs pr fen Informationen tiber die LEDs des Systems finden Sie im Sun Fire V440 Server Administrationshandbuch Pr fen Sie die Ausgabe des Befehls prtdiag v Geben Sie Folgendes ein sc gt console Enter to return to ALOM usr platform uname i sbin prtdiag v Mit dem Befehl prtdiag v haben Sie Zugriff auf Informationen die von den POST und OpenBoot Diagnostics Test gespeichert wurden Beim Zur cksetzen des Systems gehen alle Informationen dieses Befehls ber den aktuellen Systemstatus verloren Wenn Sie die Ausgabe untersuchen um Probleme zu identifizieren berpr fen Sie ob alle installierten CPU Module PCI Karten und Speichermodule aufgef hrt werden Stellen Sie fest ob Wartungs LEDs leuchten und ob das System PROM die aktuelle Firmwareversion enth lt CODE BEISPIEL 7 14 zeigt einen Auszug der Ausgabe des Befehls prtdiag v Eine vollst ndige Ausgabe des Befehls prtdiag v f r einen intakten Sun Fire V440 Server finden Sie in CODE BEISPIEL 2 8 bi
47. Sun Blade and Netra Systems das kostenlos von der folgenden Website heruntergeladen werden kann http www sun com sunmanagementcenter Installieren Sie auf dem Sun Fire V440 System die Agent Software Sun Management Center Sie miissen die Agent Komponenten sowohl der Originalsoftware Sun Management Center als auch der Erg nzung installieren Anweisungen hierzu finden Sie in der Dokumentation zur Software sowie zur Erg nzung F hren Sie auf dem Sun Fire V440 System das Einrichtungsdienstprogramm aus um die Agent Software zu konfigurieren Das Einrichtungsdienstprogramm ist Teil der Sun Management Center Software Weitere Informationen hierzu finden Sie im Sun Management Center Software User s Guide Installieren Sie auf dem Sun Management Center Server die Erg nzungssoftware Sie m ssen die Server Erg nzungskomponenten installieren um ein Sun Fire V440 System berwachen zu k nnen F hren Sie auf dem Sun Management Center Server das Einrichtungsdienstprogramm aus Das Einrichtungsdienstprogramm ist Teil der Sun Management Center Software Weitere Informationen hierzu finden Sie im Sun Management Center Software User s Guide Kapitel 4 berwachen des Systems 81 82 6 Binden Sie auf dem Sun Management Center Server das Sun Fire V440 System in eine Verwaltungsdom ne ein Sie k nnen diese Aufgabe entweder automatisch durch das Werkzeug Discovery Manager erledigen lassen oder manuell ein Objekt ber das Men
48. V440 Server Schnittstellen Konsolengerate SERIAL MGT Einstellungen fur OpenBoot Konfigurationsvariablen tip Verbindung input device ttya output device ttya N Alphanumerisches NET MG Terminal input device ttyb Terminal Systemi o o es eee ee gt Server konsole output device ttyb 1 ttyb N N N input device keyboard Grafik N er a eS a gt 4 F output device screen Grafikkarten Bilgschirmi ABBILDUNG A 1 Umleiten der Systemkonsole an verschiedene Schnittstellen und Ger te Die nachfolgenden Abschnitte enthalten Hintergrundinformationen und Verweise auf Anweisungen f r die einzelnen Ger te die Sie f r den Zugriff auf die Systemkonsole ausw hlen k nnen Anweisungen f r den Anschluss und die Konfiguration von Hardwarekomponenten f r den Zugriff auf die Systemkonsole finden Sie weiter unten in diesem Anhang 176 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Standardverbindung f r die Systemkonsole ber die serielle Verwaltungsschnittstelle und die Netzwerkverwaltungsschnittstelle Auf Sun Fire V440 Servern wird die Systemkonsole vorkonfiguriert so dass Ein und Ausgabe nur ber Hardwareger te m glich sind die an die serielle oder die Netzwerkverwaltungsschnittstelle angeschlossen sind Da die Netzwerkverwaltungsschnittstelle jedoch erst verf gbar ist wenn Sie ihr eine IP Adresse zuweisen m ssen Sie zun chst eine Verbindung mit der seriellen Verwaltungsschnittstelle her
49. VT BUNTES SunVTS Test Reference Manual 816 5145 SunVTS Quick Reference Card 816 5146 SunVTS Documentation Supplement 817 2116 Sun Management Center Sun Management Center Software User s Guide 806 5942 Hardware Diagnostic Suite Sun Management Center Hardware Diagnostic 816 5005 Suite User s Guide OpenBoot OpenBoot Command Reference Manual 816 1177 Konfigurationsvariablen xiv Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Zugriff auf die Sun Dokumentation Unter der folgenden Internetadresse k nnen Sie eine breite Auswahl von Sun Dokumentationen einschlie lich lokalisierter Versionen lesen drucken oder kaufen http www sun com documentation Hinweis Wichtige Sicherheits Kompatibilit ts und Konformit tsinformationen zum Sun Fire V440 Server finden Sie im Sun Fire V440 Server Safety and Compliance Guide Teilenummer 816 7731 auf der Dokumentations CD oder online auf der oben angegebenen Website Kontaktieren der technischen Unterst tzung von Sun Bei technischen Fragen zu diesem Produkt die in diesem Dokument nicht beantwortet werden finden Sie weitere Informationen unter http www sun com service contacting Kommentare und Anregungen Wir bem hen uns um eine stetige Verbesserung unserer Dokumentation und freuen uns ber Ihre Kommentare und Anregungen Senden Sie uns Ihre Kommentare unter http www sun com hwdocs feedback Bitte geben Sie den Titel und die Te
50. Variablenwert test all test test except what Beschreibung Beendet die OpenBoot Diagnostics und kehrt zur Eingabeaufforderung ok zur ck Zeigt eine kurze Beschreibung der einzelnen OpenBoot Diagnostics Befehle und OpenBoot Konfigurationsvariablen an Stellt den Standardwert einer OpenBoot Konfigurationsvariable wieder her Setzt den Wert einer OpenBoot Konfigurationsvariable auch verf gbar an der Eingabeaufforderung ok Pr ft alle im OpenBoot Diagnostics Men angezeigten Ger te auch verf gbar an der Eingabeaufforderung ok Pr ft nur das durch die Men elementnummer bezeichnete Ger t Eine hnliche Funktion ist auch an der Eingabeaufforderung ok verf gbar Siehe Die Eingabeaufforderung ok die Befehle test und test all auf Seite 19 Pr ft nur die durch die Men elementnummern bezeichneten Ger te Pr ft alle Ger te des OpenBoot Diagnostics Men s mit Ausnahme der durch die Men elementnummern bezeichneten Ger te Zeigt ausgew hlte Eigenschaften der durch die Men elementnummern bezeichneten Ger te an Je nach Ger tetyp werden unterschiedliche Informationen angezeigt Kapitel 2 Diagnose und Boot Prozess 49 50 Referenz zu den Testmeldungen der I C Diagnose TABELLE 2 14 gibt die einzelnen I C Ger te eines Sun Fire V440 Servers sowie die I2C Adressen der jeweiligen FRUs an Weitere Informationen ber I2C Tests finden Sie unter I2C Bus Geratet
51. Verlauf wichtiger Systemereignisse angezeigt wobei das j ngste Ereignis zuletzt aufgef hrt wird ALOM Berichte ber protokollierte Ereignisse CODE BEISPIEL 4 9 FEB 28 19 45 06 myhost 0006001la SC Host Watchdog Reset Disabled FEB 28 19 45 06 myhost 00060003 SC System booted FEB 28 19 45 43 myhost 00060000 SC Login User admin Logged on FEB 28 19 45 51 myhost 0004000e SC Request to Power Off Host Immediately FEB 28 19 45 55 myhost 00040002 Host System has Reset FEB 28 19 45 56 myhost 00040029 Host system has shut down FEB 28 19 46 16 myhost 00040001 SC Request to Power On Host FEB 28 19 46 18 myhost 0004000b Host System has read and cleared bootmode FEB 28 19 55 17 myhost 00060000 SC Login User admin Logged on FEB 28 19 56 59 myhost 00060000 SC Login User admin Logged on FEB 28 20 27 06 myhost 0004004f Indicator SYS FRONT ACT is now ON FEB 28 20 40 47 myhost 00040002 Host System has Reset Hinweis Die ALOM Protokollmeldungen werden in einen so genannten Ringspeicher von begrenzter L nge 64 KB geschrieben Ist der Speicher gef llt werden die ltesten Meldungen durch die neuesten berschrieben 6 Pr fen Sie das ALOM Ausf hrungsprotokoll Geben Sie Folgendes ein sc gt consolehistory run v Mit diesem Befehl wird das Protokoll angezeigt das die neueste Konsolenausgabe mit POST OpenBoot PROM und Solaris Boot Meldungen enth lt Dar ber hinaus wi
52. auf Serielle Verwaltungs schnittstelle und Name der OpenBoot Netzwerkverwaltungs Serielle Schnittstelle Konfigurationsvariablen schnittstelle ttyb Lokaler Grafikmonitor output device ttya ttyb screen input device ttya ttyb keyboard Die POST Ausgabe wird weiterhin zur seriellen Verwaltungsschnittstelle umgeleitet da eine Umleitung auf einen Grafikmonitor nicht m glich ist Die serielle Verwaltungsschnittstelle und die Netzwerkverwaltungsschnittstelle werden in den OpenBoot Konfigurationsvariablen als ttya dargestellt Die serielle Verwaltungsschnittstelle eignet sich jedoch nicht als serielle Standardverbindung Wenn Sie ein herk mmliches serielles Ger t beispielsweise einen Drucker an das System anschlie en m chten m ssen Sie es mit ttyb nicht mit der seriellen Verwaltungsschnittstelle verbinden Weitere Informationen finden Sie im Sun Fire V440 Server Administrationshandbuch Die Eingabeaufforderung sc gt und POST Meldungen stehen nur ber die serielle Verwaltungsschnittstelle und die Netzwerkverwaltungsschnittstelle zur Verf gung Wenn die Systemkonsole zur Schnittstelle ttyb oder einem lokalen Grafikmonitor umgeleitet wird ist zudem der Befehl console des ALOM System Controllers unwirksam Neben den OpenBoot Konfigurationsvariablen die in TABELLE A 4 beschrieben sind wird das Systemverhalten durch weitere Variablen beeinflusst Diese Variablen werden unter Steuerung des POST Tests auf
53. auf Seite 75 Hintergrundinformationen zu den Werkzeugen finden Sie unter 55 m Isolieren von Systemfehlern auf Seite 32 Hinweis F r viele in diesem Kapitel beschriebenen Prozeduren m ssen Sie mit der OpenBoot Firmware bereits vertraut sein und wissen wie Sie auf die Eingabeaufforderung ok zugreifen Hintergrundinformationen finden Sie unter Die Eingabeaufforderung ok auf Seite 182 Diesbez gliche Anweisungen erhalten Sie unter Wechseln zur Eingabeaufforderung ok auf Seite 188 Anzeigen und Setzen von OpenBoot Konfigurationsvariablen Parameter und OpenBoot Konfigurationsvariablen die auf der Systemkonfigurationskarte gespeichert sind bestimmen wie und wann POST Diagnoseroutinen und OpenBoot Diagnosetests ausgef hrt werden Nachfolgend erfahren Sie wie Sie auf die OpenBoot Konfigurationsvariablen zugreifen um sie zu ndern Eine Liste wichtiger OpenBoot Konfigurationsvariablen finden Sie in TABELLE 2 1 Vorbereitung Halten Sie das Betriebssystem des Servers an um zur Eingabeaufforderung ok zu gelangen Siehe m Wechseln zur Eingabeaufforderung ok auf Seite 188 Auszuf hrende Arbeitsschritte Zeigen Sie die aktuellen Werte aller OpenBoot Konfigurationsvariablen mit dem Befehl printenv an Das nachstehende Beispiel enth lt einen kurzen Auszug der Ausgabe dieses Befehls ok printenv Variable Name Value Default Value diag level min min diag switch false false
54. bei Fehlerbehebung 151 Verwendung bei Fehlerbehebung bei reagierendem Betriebssystem 135 Verwendung bei Fehlerbehebung nach unerwartetem Neustart 139 Alphanumerisches Terminal Baudrate Uberpriifung 203 Systemkonsolenzugriff 201 Anhalten der Betriebssystemumgebungssoftware 185 Anzeige des Startbildschirms 144 Ausbau OK LED Festplattenlaufwerk 68 Netzteil 67 Auslagerungsbereich berechnen 122 Auslagerungsger t Speicherauszug speichern 121 211 auto boot Variable einstellen f r OpenBoot Diagnostics 13 Verwendung bei Behebung von Startproblemen 168 Automatische Systemwiederherstellung ASR aktivieren OpenBoot Konfigurationsvariablen 118 Verwendung bei Fehlerbehebung 118 Zuverl ssigkeit sicherstellen 15 B B nke Speicher physisch und logisch 44 POST Adressierung 44 Baudrate Einstellung des alphanumerischen Terminals 201 berpr fen 204 Baum Ger te Daten erfassen von 37 definiert 15 Bedeutung von Fehlermeldungen P C Tests 20 OpenBoot Diagnostics 20 POST 11 Befehl init Solaris 183 Befehl shutdown Solaris 183 Befehl uadmin Solaris 183 Belastungstest Siehe auch Priifen des Systems Sun VTS verwenden 41 Betrieb OK LED Netzteil 67 Betrieb Aktivit t LED DVD ROM Laufwerk 68 Betriebsebenen Eingabeaufforderung ok und 182 Erkl rung 182 Betriebssystemumgebungssoftware anhalten 185 Bezeichnungen in Diagnoseausgabe Tabelle 52 Big Admin Fehlerbehebungsressource 11
55. bei dem defekten Teil um eine hot plug f hige Komponente handelt l uft der gesamte Diagnose und Reparaturzyklus mit minimaler Auswirkung auf die Systembenutzer ab Voraussetzungen f r die Hardware Diagnostic Suite Da die Hardware Diagnostic Suite Bestandteil von Sun Management Center ist k nnen Sie die Suite nur dann ausf hren wenn Sie das Datencenter f r Sun Management Center eingerichtet haben Das hei t die Sun Management Center Serversoftware muss auf einem dedizierten Master Server laufen der die Datenbank mit den Plattformstatusinformationen des Sun Management Center unterst tzt Kapitel 2 Diagnose und Boot Prozess 43 Au erdem muss die Sun Management Center Agentsoftware auf den zu untersuchenden Systemen installiert und eingerichtet sein Schlie lich muss die Konsole der Sun Management Center Software installiert sein Sie ist die Schnittstelle zur Hardware Diagnostic Suite Anweisungen zur Einrichtung von Sun Management Center finden Sie im Sun Management Center Software User s Guide Informationen ber die Hardware Diagnostic Suite finden Sie im Sun Management Center Hardware Diagnostic Suite User s Guide Referenz f r die Bezeichnung der Speichermodule Die Systemfirmware einschlie lich POST adressiert den Arbeitsspeicher auf verschiedene Weise In den meisten F llen beispielsweise bei der Ausf hrung von Tests oder der Anzeige von Konfigurationsdaten werden von der Firmware Speicherb nke ange
56. berpr fen des Systems mit der Hardware Diagnostic Suite Zu Sun Management Center geh rt die optionale Hardware Diagnostic Suite die als Add on erh ltlich ist Die Hardware Diagnostic Suite wurde speziell zur Untersuchung von Produktionssystemen entwickelt in denen die Tests nacheinander ausgef hrt werden Durch ihre sequentiellen Tests stellt die Hardware Diagnostic Suite nur eine geringe zus tzliche Last f r das System dar Im Gegensatz zu SunVTS das durch seine zahlreichen parallel ausgef hrten Tests eine starke Belastung f r den Server darstellt siehe berpr fen des Systems mit der SunVTS Software auf Seite 41 l sst die Hardware Diagnostic Suite w hrend der Ausf hrung der Tests auch andere Programme auf dem Server zu Wann sollten Sie die Hardware Diagnostic Suite ausf hren Die Hardware Diagnostic Suite eignet sich besonders zur Untersuchung eines m glichen oder sporadisch auftretenden Problems eines unkritischen Teils innerhalb eines ansonsten intakten Servers Dazu geh ren beispielsweise problematische Festplattenlaufwerke oder Speichermodule auf einem Server mit ausreichenden oder sogar redundanten Festplatten und Arbeitsspeicherressourcen In solchen F llen l uft die Hardware Diagnostic Suite nahezu unmerklich bis sie die Ursache des Problems herausgefunden hat Der getestete Server bleibt w hrenddessen im Produktionsmodus und muss nur f r eine eventuelle Reparatur heruntergefahren werden Falls es sich
57. boot v Anzeige des Startbildschirms Sun Fire V440 No Keyboard Copyright 1998 2003 Sun Microsystems Inc All rights reserved OpenBoot 4 10 3 4096 MB memory installed Serial 53005571 Ethernet address 0 3 ba 28 cd 3 Host ID 8328cd03 Die folgende Beispielausgabe zeigt die OpenBoot Diagnostics Tests Unter Bedeutung der Fehlermeldungen der OpenBoot Diagnostics auf Seite 20 finden Sie ein Beispiel f r eine OpenBoot Diagnostics Fehlermeldung und weitere Informationen ber OpenBoot Diagnostics Fehlermeldungen CODE BEISPIEL 7 24 Ausgabe des Befehls consolehistory boot v OpenBoot Diagnostics Tests Running Testing Testing Testing Testing Testing Testing Testing gpio 0 Testing Testing Testing Testing Testing diagnostic script obdiag normal pcei 1f 700000 network 1 pci le 600000 ide d pci le 600000 isa 7 flashprome 2 0 pci le 600000 isa 7 serial 0 2e8 pcei le 600000 isa 7 serial 0 3 8 pci le 600000 isa 7 rtc 0 70 pci le 600000 isa 7 i2c 0 320 tests 42 gpi0 0 44 gpi0 0 46 gpio 0 48 pci le 600000 isa 7 i2c 0 320 tests hardware monitor 0d 5c pci le 600000 isa 7 i2c 0 320 tests temperature sensor 0 9c pci ic 600000 network 2 pcei 1f 700000 scsi 2 1 pcei 1f 700000 scsi 2 Das folgende Beispiel zeigt die Ausgabe bei der Initialisierung des Speichers durch das OpenBoot PROM CODE BEISPIEL 7 25 Ausgabe des Befehls consolehistory boot v Speicherinitialisierung
58. che Log oder w hlen die Option Log Files im Men Reports Ein Protokollfenster wird ge ffnet in dem Sie die folgenden Protokolle anzeigen k nnen m Information Detaillierte Versionen aller Status und Fehlermeldungen im Bereich f r Testmeldungen m Test Error Ausf hrliche Fehlermeldungen einzelner Tests m VTS Kernel Error Fehlermeldungen die sich auf die Software SunVTS selbst beziehen Hier sollten Sie nach Hinweisen auf ein merkw rdiges Startverhalten von SunVTS suchen m UNIX Messages var adm messages Eine Datei die Meldungen enth lt die vom Betriebssystem und verschiedenen Anwendungen erzeugt wurden m Log Files var opt SUNWvts logs Ein Verzeichnis das die Protokolldateien enth lt Weitere Informationen zu diesem Thema finden Sie in den Handb chern zur SunVTS Software Diese Handb cher sind im Abschnitt Zugeh rige Dokumentation auf Seite xiv aufgelistet Ist die Software SunVTS installiert SunVTS besteht aus optionalen Paketen die bei der Installation der Systemsoftware unter Umst nden nicht installiert wurden Neben den SunVTS Paketen selbst erfordert die SunVTS Software ab Version 5 1 bestimmte XML und Laufzeitbibliotheken die unter Solaris 8 eventuell nicht standardm ig installiert sind 108 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Vorbereitung F r die folgenden Schritte wird vorausgesetzt dass die Solaris Betriebssyste
59. das IDE Bus Untersystem das das DVD Laufwerk kontrolliert Pr ft die On board Ethernet Controller durch interne Loopback Tests Kann auch externe Loopback Tests ausf hren wenn ein Loopback Stecker angebracht ist der Loopback Stecker ist nicht im Paket enthalten Wie oben f r den zweiten On board Ethernet Controller Testet die Kommunikation mit dem ALOM System Controller und verlangt dass die ALOM Tests ausgef hrt werden Pr ft die Register der Echtzeit Uhr und stellt fest ob sie l uft Pr ft interne SCSI Laufwerke Pr ft eventuell angeschlossene externe SCSI Laufwerke Pr ft alle m glichen von den seriellen Verbindungen ttya und ttyb unterst tzten Baudraten F hrt an jeder Leitung mit jeder Geschwindigkeit interne und externe Loopback Tests durch Pr ft die beschreibbaren Register des USB Open Host Controllers Getestete FRU s Hauptplatine Hauptplatine Netzteile SCSI Laufwerke CPU Speichermodule Hauptplatine DVD ROM Laufwerk Hauptplatine Hauptplatine ALOM Karte Hauptplatine Hauptplatine SCSI R ckwandplatine SCSI Laufwerke Hauptplatine SCSI Kabel SCSI Laufwerke Hauptplatine Hauptplatine 48 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 TABELLE 2 13 beschreibt die Befehle der Eingabeaufforderung obdiag gt TABELLE 2 13 Mentibefehle der OpenBoot Diagnostics Befehl exit help set default Variable setenv
60. dass sie die Eingabe der seriellen Schnittstelle ttyb empf ngt und ihre Ausgabe an diese Schnittstelle oder an die Schnittstelle einer Grafikkarte sendet Der Hauptvorteil einer solchen Konfiguration der Systemkonsole besteht darin dass damit die Warnmeldungen des System Controllers und die Ausgabe der Systemkonsole auf zwei separate Fenster verteilt werden Diese alternative Konsolenkonfiguration hat jedoch einige schwerwiegende Nachteile 178 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 m POST Ausgabe kann nur an die serielle Schnittstelle und die Netzwerkverwaltungsschnittstelle geleitet werden Sie kann nicht an ttyb oder an die Schnittstelle einer Grafikkarte geleitet werden m Wenn Sie die Systemkonsole an ttyb geleitet haben k nnen Sie diese Schnittstelle nicht f r ein anderes serielles Ger t verwenden m In einer Standardkonfiguration erm glichen die serielle Schnittstelle und die Netzwerkverwaltungsschnittstelle das ffnen von bis zu vier zus tzlichen Fenstern in denen Sie die Aktivit t der Systemkonsole sehen aber nicht beeinflussen k nnen Sie k nnen diese Fenster nicht ffnen wenn die Systemkonsole an ttyb oder zur Schnittstelle einer Grafikkarte umgeleitet wird m In einer Standardkonfiguration erm glichen die serielle Schnittstelle und die Netzwerkverwaltungsschnittstelle den Wechsel zwischen der Anzeige der Systemkonsolen und der System Controller Ausgabe auf demselben Ger t Dazu
61. defekt waren und ob die wirklich defekte Hardware bisher noch nicht entdeckt wurde Fehlerbehebung in einem System das nicht startet Ein System ist auf Grund von Hardware oder Softwareproblemen eventuell nicht mehr in der Lage zu starten Wenn Sie vermuten dass das System wegen Softwareproblemen nicht starten kann lesen Sie den Abschnitt Troubleshooting Miscellaneous Software Problems im Solaris System Administration Guide Advanced Administration Wenn Sie vermuten dass das System auf Grund eines Hardwareproblems nicht starten kann ermitteln Sie die m glichen Ursachen mit Hilfe der folgenden Schritte Vorbereitung Melden Sie sich beim System Controller an um zur Eingabeaufforderung sc gt zu gelangen Weitere Informationen finden Sie unter m Die Eingabeaufforderung sc gt auf Seite 180 Hierbei wird vorausgesetzt dass die Systemkonsole standardm ig konfiguriert ist so dass Sie zwischen dem System Controller und der Systemkonsole wechseln k nnen Siehe sm bersicht ber die Kommunikation mit dem System auf Seite 174 m Zugriff ber die Netzwerkverwaltungsschnittstelle auf Seite 178 162 Sun FireTM 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Auszuf hrende Arbeitsschritte 1 Pr fen Sie das ALOM Ereignisprotokoll Geben Sie Folgendes ein sc gt showlogs CODE BEISPIEL 7 31 Das ALOM Ereignisprotokoll zeigt Systemereignisse wie Resetereignisse und nderunge
62. den Diagnosemodus Durch Umgehen firmwarebasierter Diagnosetests l sst sich der Startvorgang des Servers beschleunigen Die nachstehend beschriebene Vorgehensweise stellt sicher dass POST und OpenBoot Diagnosetests beim Start des Systems ausgef hrt werden Hintergrundinformationen finden Sie unter m Diagnose Zuverl ssigkeit und Verf gbarkeit auf Seite 14 Vorbereitung Melden Sie sich bei der Systemkonsole an um zur Eingabeaufforderung ok zu gelangen Anweisungen hierzu finden Sie unter m Wechseln zur Eingabeaufforderung ok auf Seite 188 Auszuf hrende Arbeitsschritte W hlen Sie eine der nachstehenden M glichkeiten aus Bringen Sie den Systemsteuerungsschalter des Servers in die Position Diagnose Sie k nnen diese Einstellung entweder auf der Vorderseite des Ger ts oder wenn Sie die Testsitzung an einem entfernten Standort ber einen Konsolenbildschirm ausf hren mit Hilfe der ALOM Schnittstelle vornehmen m Setzen Sie die OpenBoot Konfigurationsvariable diag switch Geben Sie die folgende Zeile ein ok setenv diag switch true Kapitel3 Identifizieren ausgefallener und fehlerhafter Komponenten 59 2 Setzen Sie die OpenBoot Konfigurationsvariable diag script auf normal Geben Sie die folgende Zeile ein ok setenv diag script normal Damit k nnen die OpenBoot Diagnostics Tests auf allen Hauptplatinenkomponenten automatisch ausgef hrt werden Hinweis Wen
63. den Access Center der Softwareleistung mehrerer berwachten Systemen als konzipiert Systeme L st bei verschiedenen auch auf dem Hauptsystem Bedingungen Alarme aus laufen Dedizierte Datenbank auf dem Hauptserver erforderlich Hardware Software Pr fung des laufenden Systems Separat zu beziehen als F r Remote Diagnostic durch sequentielle Tests Meldet optionales Add on zum Access Suite auch defekte FRUs Field Sun Management Center konzipiert Replaceable Units Betriebssystem und Software Sun Management Center erforderlich Warum gibt es so viele unterschiedliche Diagnosewerkzeuge Es gibt zahlreiche Gr nde nicht zuletzt die Komplexit t des Servers weshalb die Diagnoseverfahren nicht in einem einzigen umfassenden Diagnosetest zusammengefasst sind Nehmen Sie zum Beispiel den Bus Repeater eines jeden Sun Fire V440 Servers Diese Schaltung verbindet alle CPUs und Hochgeschwindigkeits E A Schnittstellen siehe ABBILDUNG 1 1 und passt die Daten bertragung entsprechend der Anzahl vorhandener CPU Module an Diese raffinierte extrem schnelle Verbindung ist nur eine Facette der hochentwickelten Architektur des Sun Fire V440 Servers Kapitel 1 bersicht ber die Diagnosewerkzeuge 4 Speicher Speicher Speicher Speicher CPU 0 CPU 1 CPU 2 CPU 3 Hauptplatine JBus Bus Repeater
64. einer der beiden folgenden Methoden Zuverl ssigkeitstest SunVTS f hrt einen Testdurchgang an allen Untersystemen aus und beendet die Untersuchung danach Dieser Test dauert bei typischen Systemkonfigurationen ein bis zwei Stunden Ausf hrlicher Test SunVTS untersucht s mtliche Untersysteme in mehreren Testdurchlaufen bis zu 24 Stunden lang m Ausschlie licher Modus SunVTS untersucht nur die von Ihnen gew hlten Untersysteme Es wird immer nur ein ausgew hlter Test ausgef hrt Einige Tests k nnen nur in diesem Modus ausgef hrt werden Hierzu geh ren 11dcachetest l2cachetest 12sramtest mpconstest mptest und systest m Online Modus SunVTS untersucht nur die von Ihnen gew hlten Untersysteme Die ausgew hlten Tests werden nacheinander ausgef hrt bis das gesamte System getestet wurde Dieser Modus eignet sich f r die Durchf hrung von Tests w hrend der Ausf hrung anderer Anwendungen Da SunVTS zahlreiche Tests parallel ausf hrt und dabei betr chtliche Systemressourcen an sich zieht sollten Sie sich genau berlegen wann Sie diese Tests in einer Produktionsumgebung durchf hren W hrend eines Belastungstests im ausf hrlichen Testmodus von SunVTS sollten auf dem untersuchten System keine anderen Anwendungen laufen Kapitel 2 Diagnose und Boot Prozess 41 F r SunVTS ist die Solaris Betriebssystemumgebung erforderlich Der zu untersuchende Sun Fire V440 Server muss daher w hrend der Tests aktiv sein Die SunVT
65. gelangen Anweisungen hierzu finden Sie unter m Wechseln zur Eingabeaufforderung ok auf Seite 188 Auszuf hrende Arbeitsschritte Bringen Sie den Systemsteuerungsschalter des Servers in Normalstellung Wenn Sie den Schalter auf Diagnose stellen werden die Einstellungen der OpenBoot Konfigurationsvariablen au er Kraft gesetzt und die Diagnosetests ausgef hrt Deaktivieren Sie die Variablen diag switch und diag script Geben Sie Folgendes ein ok setenv diag switch false ok setenv diag script none Nehmen Sie die entsprechenden Einstellungen an den OpenBoot Konfigurationsvariablen vor damit die Diagnosetests umgangen werden Geben Sie Folgendes ein ok setenv post trigger none ok setenv obdiag trigger none N chste Schritte Der Sun Fire V440 Server ist jetzt f r eine m glichst kurze Neustartzeit konfiguriert Wenn Sie Ihre Absicht ndern und die Diagnosetests wieder ausgef hrt werden sollen lesen Sie die folgenden Abschnitte m Versetzen des Systems in den Diagnosemodus auf Seite 59 Kapitel3 Identifizieren ausgefallener und fehlerhafter Komponenten 61 Tempor res Umgehen der Diagnosetests Vorbereitung Der ALOM System Controller verf gt ber eine inoffizielle Methode zum Umgehen der Diagnosetests und zum Neustarten des Systems Diese Vorgehensweise ist nur unter folgenden ungew hnlichen Umst nden von Nutzen m Das System ist so konfiguriert dass Diagnos
66. hrung der Betriebssystemumgebung an dem Punkt fortzusetzen an dem sie angehalten wurde Obwohl durch den Befehl go die Ausf hrung in den meisten F llen wieder aufgenommen wird m ssen Sie im Allgemeinen jedes Mal wenn Sie das System auf die Eingabeaufforderung ok herunterfahren damit rechnen dass ein Neustart erforderlich ist um wieder zur Betriebssystemumgebung zu gelangen Vor dem Anhalten der Betriebssystemumgebung sollten Sie stets die Dateien sichern die Benutzer von dem bevorstehenden Herunterfahren informieren und das System ordnungsgem herunterfahren Es ist jedoch nicht immer m glich diese Vorsichtsma nahmen zu ergreifen insbesondere wenn das System eine Fehlfunktion aufweist Anhang A Konfigurieren der Systemkonsole 185 Weitere Informationen Informationen zur OpenBoot Firmware finden Sie im OpenBoot 4 x Command Reference Manual Eine Online Version dieses Handbuchs ist in dem mit der Solaris Software mitgelieferten OpenBoot Collection AnswerBook enthalten Wechseln zwischen dem ALOM System Controller und der Systemkonsole Der Sun Fire V440 Server verf gt ber zwei Verwaltungsschnittstellen namens SERIAL MGT und NET MGT die sich auf der R ckseite des Servers befinden Wenn die Systemkonsole die serielle Schnittstelle und die Netzwerkverwaltungsschnittstelle verwendet Standardkonfiguration bieten diese Schnittstellen ber spezielle Kan le Zugriff auf die Systemkonsole bzw auf den ALOM System Co
67. lib dmi snmpXdmid s Sun SFV440 a 1 0 14 51 43 0 00 usr sbin cron 233 0 14 51 44 0 00 usr sadm lib smc bin smcboot 1 0 14 51 44 0 00 usr sadm lib smc bin smcboot 1 0 14 51 45 0 00 usr sbin vold 1 0 14 51 45 0 00 usr lib sendmail bd q15m 1 0 14 51 45 0 00 usr lib efcode sparcv9 efdaemon 291 0 14 51 47 0 00 usr lib saf ttymon 274 0 14 51 51 0 00 mibiisa r p 32826 1 0 14 51 46 0 00 usr lib snmp snmpdx y c 292 0 15 00 59 console 0 00 ps ef 9 Stellen Sie fest ob alle E A Ger te und Aktivit ten noch laufen und funktionieren Geben Sie Folgendes ein iostat xtc Mit diesem Befehl werden alle E A Ger te angezeigt und es wird die Aktivit t jedes Ger ts gemeldet Um ein Problem zu identifizieren untersuchen Sie die Ausgabe auf installierte Ger te die nicht aufgef hrt werden CODE BEISPIEL 7 16 zeigt die Ausgabe des Befehls iostat xtc eines intakten Sun Fire V440 Servers Ausgabe des Befehls iostat xtc extended device statistics tty cpu device r s w s kr s kw s wait actv svc t w b tin tout us sy wt id sdo 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 183 0 2 2 96 sdi 6 5 12 49 5 7 9 0 0 0 2 24 6 0 3 sd2 0 2 0 0 0 0 0 0 80120 04 0 0 0 0 0 sd3 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 sd4 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 nfsl 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 o nfs2 0 0 0 0 0 1 0 0 0 0 0 0 9 6 0 0 148 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 CODE BEISPIEL
68. shutdown Befehl Solaris 189 Softwareversionen mit showrev anzeigen 31 Solaris Befehle df k 123 dumpadm 122 dumpadm s 124 fsck 185 Herunterfahren 183 init 183 189 n n n iostat E 149 161 iostat xtc 148 160 ping 168 pkginfo 110 prtconf 24 prtdiag v 25 137 146 158 prtfru 29 ps ef 147 159 168 psrinfo 30 raidctl 150 showrev 31 shutdown 189 swap 1 122 sync 170 184 uadmin 183 Speicherauszug fiir Fehlerbehebung aktivieren 121 testen 124 Verwendung bei Fehlerbehebung 121 Speicherbanke physisch und logisch 44 POST Adressierung 44 Speicherinitialisierung 145 Sporadische Probleme 10 39 43 SRS Net Connect 116 Standby verf gbar LED Netzteil 67 Standby Stromversorgung ALOM und 35 Stromversorgungskabel f r Anschlusskarte Fehler isolieren 33 Stufen des Boot Prozesses 8 Sun Explorer Data Collector 116 Sun Install Check Tool 115 Sun Management Center Agenten 80 Berichte erzeugen 38 schrittweise Anleitung 80 Server und Konsolen 80 Systeme inoffiziell berwachen 38 berwachung 80 Sun Remote Services Net Connect 116 Sun Validation and Test Suite siehe SunVTS SunMC siehe Sun Management Center SunSolve Online Fehlerbehebungsressourcen 114 Website 114 SunVTS 217 Belastungstest mit 41 Installation berpr fen 108 Pr fen des Systems 41 104 schrittweise Anleitung 104 swap 1 Befehl Solaris 122 sync Befehl Solaris Nach Erzeugung eines XIR
69. und Laufwerke sowie Betriebssystemparameter wie Belastung Ressourcennutzung und Festplattenspeicher Sie k nnen Schwellenwerte f r Alarme festlegen und werden benachrichtigt wenn diese Schwellenwerte berschritten werden Von der Konsolenschicht werden die gesammelten Daten in einem Standardformat angezeigt Sun Management Center verf gt sowohl ber eine eigenst ndige auf Java beruhende grafische Benutzeroberfl che als auch ber eine Befehlszeilenschnittstelle sowie ber eine Webbrowser Benutzeroberfl che Die Java Schnittstellen bieten physische und logische Ansichten des Systems zur intuitiven System berwachung Weitere Funktionen von Sun Management Center Sun Management Center enth lt zahlreiche weitere Werkzeuge beispielsweise einen inoffiziellen berwachungsmechanismus ein optionales Add on Diagnosepaket und ein Programm zur Erzeugung von Berichten In einer heterogenen Computerumgebung kann diese Software mit den Verwaltungsprogrammen anderer Hersteller zusammenarbeiten Inoffizielle berwachung Die Agent Software von Sun Management Center muss auf den zu berwachenden Servern geladen sein Allerdings erm glicht das Produkt auch die inoffizielle berwachung einer unterst tzten Plattform selbst wenn die Agent Software nicht auf dem System installiert ist In diesem Fall stehen Ihnen zwar nicht alle berwachungsfunktionen zur Verf gung Sie k nnen den Server aber in eine Liste in der Sun Management Center Schnitts
70. 0 oHOOoDNDNDN 1 UL extended device statistics tty cpu w s kr s kw s wait actv svc_t w b tin tout us sy wt id 0 0 0 0 0 0 0 0 0 0 0 0 0 0 183 0 2 2 96 1 2 49 5 7 93 0 0 032 24 6 0 3 0 0 0 0 9 0 0 0 eB 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 9 6 0 0 0 0 0 6 0 0 0 0 0 0 1 4 0 0 0 0 0 1 0 0 0 0 0 0 Bal 0 0 160 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 10 berpr fen Sie Fehler die mit E A Ger ten zusammenh ngen Geben Sie Folgendes ein iostat E Von diesem Befehl werden Fehler f r alle E A Ger te gemeldet Um ein Problem zu identifizieren untersuchen Sie die Ausgabe f r alle Fehlertypen mit einem Wert von mehr als 0 In CODE BEISPIEL 7 30 meldet der Befehl iostat Ez B Hard Errors 2 f r das E A Ger te sdo CODE BEISPIEL7 30 Ausgabe des Befehls iostat E sdo Soft Errors 0 Hard Errors 2 Transport Errors 00000 Vendor TOSHIBA Product DVD ROM SD C2612 Revision 1011 Serial No 04 17 02 Size 18446744073 71GB lt 1 bytes gt Media Error 0 Device Not Ready 2 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 sdl Soft Errors 0 Hard Errors 0 Transport Errors 0 Vendor SEAGATE Product ST336607LSUN36G Revision 0207 Serial No 3JAOBW6Y00002317 Size 36 42GB lt 36418595328 bytes gt Media Error 0 Device Not Ready 0 No Device 0 Recoverable 0 Illegal
71. 0 Servers verbinden Auszuf hrende Arbeitsschritte 1 Schlie en Sie das serielle RJ 45 Kabel und den RJ 45 oder DB 25 Adapter an Das Kabel und der Adapter verbinden die serielle Schnittstelle eines anderen Sun Systems mit der seriellen Verwaltungsschnittstelle auf der R ckseite des Sun Fire V440 Servers Stiftbelegung Bestellnummern und andere Informationen ber das serielle Kabel und den Adapter finden Sie im Sun Fire V440 Server Parts Installation and Removal Guide Siehe ABBILDUNG A 5 Serielle Verwaltungsschnittstelle Serieller Anschluss tip Verbindung j Anderes Sun System ABBILDUNG A 5 Eine tip Verbindung zwischen einem Sun Fire V440 Server und einem anderen Sun System 196 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 2 Stellen Sie sicher dass die Datei etc remote auf dem Sun System einen Eintrag f r hardwire enth lt Die meisten Versionen der Betriebssystemumgebungssoftware Solaris die seit 1992 ausgeliefert wurden enthalten die Datei etc remote mit dem entsprechenden Eintrag hardwire Wenn auf dem Sun System eine ltere Version der Betriebssystemumgebungssoftware Solaris ausgef hrt wird oder die Datei etc remote ge ndert wurde m ssen Sie die Datei unter Umst nden bearbeiten Genaue Informationen finden Sie unter ndern der Datei etc remote auf Seite 199 3 Geben Sie in einem Shell Tool Fenster auf dem Sun System Folgendes ein tip hard
72. 0 TPC 0000 0000 0100 4200 TnPC 0000 0000 0100 4204 TSTATE 0000 0044 8200 1507 TL 0000 0000 0000 0004 TT 0000 0000 0000 0010 TPC 0000 0000 0100 4200 TnPC 0000 0000 0100 4204 TSTATE 0000 0044 8200 1507 TL 0000 0000 0000 0003 TT 0000 0000 0000 0010 TPC 0000 0000 0100 4680 TnPC 0000 0000 0100 4684 TSTATE 0000 0044 8200 1507 TL 0000 0000 0000 0002 TT 0000 0000 0000 0034 TPC 0000 0000 0100 7164 TnPC 0000 0000 0100 7168 TSTATE 0000 0044 8200 1507 TL 0000 0000 0000 0001 TT 0000 0000 0000 004e TPC 0000 0001 0001 fd24 TnPC 0000 0001 0001 fd28 TSTATE 0000 0000 8200 1207 SC Alert Host System has Reset SC Alert Host System has read and cleared bootmode In bestimmten F llen kann ein Fatal Reset Fehler oder eine RED State Exception durch Software verursacht werden In der Regel handelt es sich dabei um Treiberprobleme die ohne weiteres identifiziert werden k nnen Sie erhalten diese Informationen ber SunSolve Online siehe Websites auf Seite 114 ber Sun oder den Hersteller des Treibers Die wichtigsten Informationen die Sie bei der Diagnose eines Fatal Reset Fehlers oder einer RED State Exception sammeln m ssen sind folgende m Ausgabe der Systemkonsole zum Zeitpunkt des Fehlers m Aktueller Wartungsverlauf f r Systeme auf denen Fatal Reset Fehler oder RED State Exceptions aufgetreten sind Die Aufzeichnung der Anzeigen und Meldungen der Systemkonsole zum Zeitpunkt des Fehlers kann dazu beitragen
73. 0 0 256MB 0y L273 15 1 0 256MB Fr 48 0 2GB 0 4 49 0 2GB Memory Module Groups ControllerID GroupID Labels Status 0 0 C0 P0 B0 DO 0 0 co Po Bo D1 42 3 0 C3 P0 BO D1 Neben den oben aufgef hrten Informationen gibt der Befehl prtdiag mit der Option v zus tzlich den Status der Frontplatte der Festplatten der L fter der Netzteile sowie Hardware Versionen und Systemtemperaturen zurtick CODE BEISPIEL 2 10 Ausgabe des Befehls prtdiag mit der Option v Temperature sensors Location Sensor Temperature Lo LoWarn HiWarn Hi Status SCSIBP T_AMB 26C SLIG oc 65C 75C okay co PO T_CORE 55C 10C oc 97C 102C okay Kapitel 2 Diagnose und Boot Prozess 27 Bei berhitzung wird von prtdiag in der Status Spalte warning oder failed angezeigt CODE BEISPIEL 2 11 Ausgabe des Befehls prtdiag mit berhitzungsanzeige Temperature sensors Location Sensor Temperature Lo LoWarn HiWarn Hi Status SCSIBP T_AMB 26C 11C oc 65C 75C okay C0 PO T_CORE 99C 10C oc 97C 102C failed Auch beim Ausfall einer bestimmten Komponente meldet prtdiag einen Fehler in der entsprechenden Statusspalte CODE BEISPIEL 2 12 Ausgabe des Befehls prtdiag mit Fehleranzeige Fan Status FT1 F0 FO failed 0 rpm Aus dem folgenden Beispiel geht hervor wie mit dem Befehl prtdiag der Status der System LEDs angezeigt wird CODE BEISPIEL 2 13 prtdiag mit LED Statusanzeigen Led State Location Led State Color MB
74. 0 eines Terminalservers verbunden ist dessen IP Adresse 192 20 30 10 lautet geben Sie z B Folgendes ein telnet 192 20 30 10 10000 3 Wenn Sie ttyb anstelle der seriellen Verwaltungsschnittstelle verwenden m chten gehen Sie folgenderma en vor a Leiten Sie die Systemkonsole um indem Sie die OpenBoot Konfigurationsvariablen ndern Geben Sie an der Eingabeaufforderung ok die folgenden Befehle ein ok setenv input device ttyb ok setenv output device ttyb 194 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Hinweis Ein Zugriff auf die Eingabeaufforderung sc gt und die Anzeige von POST Meldungen sind nur ber die serielle Verwaltungsschnittstelle oder die Netzwerkverwaltungsschnittstelle m glich Hinweis Es gibt viele weitere OpenBoot Konfigurationsvariablen Obwohl sie keinen Einfluss darauf haben welches Hardwareger t f r den Zugriff auf die Systemkonsole verwendet wird bestimmen einige dieser Variablen welche Diagnosetests das System ausf hrt und welche Mitteilungen an der Konsole angezeigt werden Weitere Informationen finden Sie unter Steuerung des POST Tests auf Seite 13 b Damit die nderungen wirksam werden schalten Sie das System aus Geben Sie Folgendes ein ok power off Das System speichert die ge nderten Parameter dauerhaft und schaltet sich ab Hinweis Sie k nnen das System auch mit dem Netzschalter auf der Vo
75. 0 gt Bank 2 1024MB 00000002 00000000 gt 00000002 40000000 O gt INFO 0 gt POST Passed all devices 0 gt 0 gt POST Return to OBP Das folgende Beispiel zeigt die Ausgabe bei der Initialisierung des OpenBoot PROM CODE BEISPIEL 4 11 Ausgabe des Befehls consolehistory boot v OpenBoot PROM Initialisierung Keyswitch set to diagnostic position OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 Clearing TLBs POST Results Cpu 0000 0000 0000 0000 00 0000 0000 0000 0000 01 ffff ffff f00a 2b73 02 ffff ffff ffff ffff POST Results Cpu 0000 0000 00000 0001 00 0000 0000 0000 0000 01 ffff ffff f00a 2b73 402 ffff ffff ffff ffff Membase 0000 0000 0000 0000 MemSize 0000 0000 0004 0000 Init CPU arrays Done Probing pci 1d 700000 Device 1 Nothing there Probing pci 1d 700000 Device 2 Nothing there Kapitel 4 berwachen des Systems 95 Die folgende Beispielausgabe zeigt den Startbildschirm CODE BEISPIEL 4 12 Ausgabe des Befehls consolehistory boot v Anzeige des Startbildschirms Sun Fire V440 No Keyboard Copyright 1998 2003 Sun Microsystems Inc All rights reserved OpenBoot 4 10 3 4096 MB memory installed Serial 53005571 Ethernet address 0 3 ba 28 cd 3 Host ID 8328cd03 Die folgende Beispielausgabe zeigt die OpenBoot Diagnostics Tests CODE BEISPIEL 4 13 Ausgabe des Befehls consolehistory boot v OpenBoot Diagnostics Tests Running diagnostic script obdiag normal Testi
76. 100 Verwenden von OpenBoot Informationsbefehlen auf Seite 101 Hintergrundinformationen zu den Werkzeugen finden Sie unter Kapitel 2 79 Hinweis F r viele in diesem Kapitel beschriebenen Prozeduren m ssen Sie mit der OpenBoot Firmware bereits vertraut sein und wissen wie Sie auf die Eingabeaufforderung ok zugreifen Hintergrundinformationen finden Sie unter Die Eingabeaufforderung ok auf Seite 182 Diesbez gliche Anweisungen erhalten Sie unter Wechseln zur Eingabeaufforderung ok auf Seite 188 berwachen des Systems mit Sun Management Center Sun Management Center ist ein flexibles Produkt mit einer F lle von Funktionen und Optionen Der Einsatz dieser Software h ngt sowohl von den Einstellungen und Eigenschaften Ihres Netzwerks als auch von Ihren Anforderungen ab Bestimmen Sie welche Rolle Ihr Sun Fire V440 System innerhalb der Sun Management Center Dom ne spielen soll Genaue Informationen finden Sie unter berwachen des Systems mit Sun Management Center auf Seite 36 Vorbereitung Die nachstehend beschriebene Vorgehensweise erfordert dass Sie die Agent Software Sun Management Center auf dem Sun Fire V440 System zur berwachung installieren und f hrt Sie Schritt f r Schritt ans Ziel Eine weitere Voraussetzung ist die Einrichtung eines oder mehrerer Computer als Sun Management Center Server und Konsolen Server und Konsolen sind Teil der Infrastruktur zur berwachung von Systemen mitte
77. 19 Sun SFV440 a 00040002 Host System has Reset 46 Sun SFV440 a 00040002 Host System has Reset 51 Sun SFV440 a 0004004f Indicator SYS_FRONT SERVICE is now ON 22 Sun SFV440 a 00040002 Host System has Reset 22 Sun SFV440 0004004f Indicator SYS_FRONT SERVICE is now OFF 24 Sun SFV440 a 0004000b Host System has read and cleared bootmode 30 Sun SFV440 a 00040002 Host System has Reset 59 Sun SFV440 a 00040002 Host System has Reset 40 Sun SFV440 a 0004004f Indicator SYS FRONT SERVICE is now ON 44 Sun SFV440 a 0004004f Indicator SYS FRONT ACT is now ON Hinweis In den Zeitstempeln der ALOM Protokolle wird die UTC Zeit Universal Time Coordinated angegeben in den Zeitstempeln der Solaris Betriebssystemumgebung dagegen die lokale Server Zeit Ein einzelnes Ereignis kann daher Meldungen hervorrufen die in verschiedenen Protokollen scheinbar zu verschiedenen Zeiten aufgezeichnet wurden Pr fen Sie den Status der Systemumgebung Geben Sie Folgendes ein sc gt showenvironment Der Befehl showenvironment gibt viele ntitzliche Daten zuriick z B Temperaturwerte den Status der System und Komponenten LEDs Hauptplatinenspannungen den Status der Systemlaufwerke der L fter der Stromunterbrecher der Hauptplatine und der Gleichspannungswandlers des CPU Moduls CODE BEISPIEL 7 4 ein Auszug der Ausgabe des Befehls showenvironment besagt dass die auf der Vorderseite befindl
78. 2 OK OFF OFF HDD3 OK OFF OFF Fan Status Speed Low FTO FO OK 3729 750 FTO F1 OK 3688 750 FO OK 3214 750 Kapitel 4 berwachen des Systems 89 Spannungssensoren auf der Hauptplatine berwachen wichtige Systemspannungen die mit dem Befehl showenvironment gemeldet werden CODE BEISPIEL 4 4 ALOM Berichte ber Hauptplatinenspannungen Voltage sensors in Volts Sensor Status Voltage LowSoft LowWarn HighWarn HighSoft MB V_ 1V5 OK 1 48 1 20 1 27 1 72 1 80 MB V_VCCTM OK 2 51 2 00 2 12 2 87 3 00 MB V_NETO 1V2D OK 15 25 0 96 1 02 1 38 1 44 MB V_NETI1_1V2D OK 1 26 0 96 1 02 138 1 44 MB V_NETO_1V2A OK 1 26 0 96 1 02 1 38 1 44 MB V_NETI1_1V2A OK 1 26 0 96 1 02 1 38 1 44 MB V_ 3V3 OK 3 34 2 64 2 80 3 79 3 96 MB V_ 3V3STBY OK 3 33 2 64 2 80 35 7 9 3 96 MB BAT V_BAT OK 3 26 2 25 a a MB V_SCSI_CORE OK 1 79 1 53 1 62 1 98 2 07 MB V_ 5V OK 5 04 4 25 4 50 550 5 275 MB V_ 12V OK 12 00 10 20 10 80 13 20 13 80 MB V 12V OK 12 04 13 80 13 20 10 80 10 20 Hinweis Die Schwellenwerte f r Warnungen und ordnungsgem es softwaregesteuertes Herunterfahren die im CODE BEISPIEL 4 4 erscheinen werden werkseitig festgelegt und k nnen nicht ge ndert werden Mit dem Befehl showenvironment werden der Status jedes Netzteils und der Status der vier LEDs auf den Netzteilen gemeldet CODE BEISPIEL 4 5 ALOM Berichte ber den Netzteilstatus Power Supply Indicators Supply POK STBY Service OK to Remove PSO ON ON OFF
79. 39 40 Welche FRUs die beiden System berpr fungswerkzeuge isolieren k nnen entnehmen Sie bitte TABELLE 2 9 Einzelne Werkzeuge pr fen nicht in jedem Fall alle Komponenten oder Pfade einer bestimmten FRU TABELLE 2 9 Die von den System berpr fungswerkzeugen gepr ften FRUs FRU SunVTS Hardware Diagnostic Suite ALOM Karte v Anschlusskarte Keine berpr fung Hinweise zur Fehlerisolierung finden Sie in TABELLE 2 5 CPU Speichermodul y v DIMMs v Festplatte v DVD ROM Laufwerk v L ftereinbaurahmen 0 PCI L fter Keine berpr fung Hinwei finden Sie in TABELLE 2 10 se zur Fehlerisolierung L ftereinbaurahmen 1 CPU L fter Keine berpr fung Hinwei finden Sie in TABELLE 2 10 se zur Fehlerisolierung Hauptplatine y v Netzteil s SCSI R ckwandplatine y Leseger t f r Systemkonfigurationskarte Keine berpr fung Hinwei finden Sie in TABELLE 2 5 se zur Fehlerisolierung Systemkonfigurationskarte v Einige FRUs werden von keinem System berpr fungswerkzeug erkannt TABELLE 2 10 Nicht durch System berpr fungswerkzeuge isolierbare FRUs FRU Hinweise zur Diagnose Anschlusskarte Kabel des DVD CD ROM Laufwerks L ftereinbaurahmen 0 PCI L fter L ftereinbaurahmen 1 CPU L fter Siehe TABELLE 2 5 Siehe TABELLE 2 5 Bei Ausfall dieser FRU gibt ALOM ein Warnmeldung aus SC Alert PCI_FAN FTO Failed Be
80. 4 Website 114 BIST siehe Integrierter Selbsttest Blockierungen System 15 212 BMC Patrol siehe berwachungswerkzeuge anderer Hersteller boot device Variable Verwendung bei Behebung von Startproblemen 167 bootmode diag Befehl System Controller 98 Boot PROM Abbildung 9 Funktion 9 Boot Prozess bersicht ber Stufen 8 bounds Datei 125 break Befehl System Controller 183 189 Bus Repeater Schaltung 3 Cc Cisco AS2511 RJ siehe Terminalserver console Befehl System Controller 99 183 187 189 consolehistory boot v Befehl System Controller Verwendung bei Behebung von Fatal Reset Fehlern und RED State Exceptions 154 Verwendung bei Behebung von Startproblemen 166 Verwendung bei Fehlerbehebung 142 consolehistory run v Befehl System Controller Verwendung bei Behebung von Fatal Reset Fehlern und RED State Exceptions 152 Verwendung bei Behebung von Startproblemen 164 Verwendung bei Fehlerbehebung nach unerwartetem Neustart 140 CPU Central Processing Unit Informationen anzeigen 30 Master 9 10 Nummerierung von Prozessormodulen 47 D Data Bitwalk POST Test 10 Datei etc remote ndern 199 df k Befehl Solaris 123 diag device Variable Verwendung bei Behebung von Startproblemen 168 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 diag level Variable einstellen f r OpenBoot Diagnostics 16 Verwendung bei Fehlerbehebung in blockiertem System
81. 7 16 Ausgabe des Befehls iostat xtc Fortsetzung nfs3 0 1 0 0 0 6 0 0 0 0 0 0 1 4 0 0 nfs4 0 0 0 0 0 1 0 0 0 0 0 0 Bi 0 0 10 berpr fen Sie Fehler die mit E A Ger ten zusammenh ngen Geben Sie Folgendes ein iostat E Von diesem Befehl werden Fehler f r alle E A Ger te gemeldet Um ein Problem zu identifizieren untersuchen Sie die Ausgabe f r alle Fehlertypen mit einem Wert von mehr als 0 In CODE BEISPIEL 7 17 meldet der Befehl iostat Ez B Hard Errors 2 f r das E A Ger te sdo CODE BEISPIEL 7 17 Ausgabe des Befehls iostat E sdo Soft Errors 0 Hard Errors 2 Transport Errors 0 Vendor TOSHIBA Product DVD ROM SD C2612 Revision 1011 Serial No 04 17 02 Size 18446744073 71GB lt 1 bytes gt Media Error 0 Device Not Ready 2 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 sdl Soft Errors 0 Hard Errors 0 Transport Errors 0 Vendor SEAGATE Product ST336607LSUN36G Revision 0207 Serial No 3JAOBW6Y00002317 Size 36 42GB lt 36418595328 bytes gt Media Error 0 Device Not Ready 0 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 sd2 Soft Errors 0 Hard Errors 0 Transport Errors 0 Vendor SEAGATE Product ST336607LSUN36G Revision 0207 Serial No 3JA0BRQJ00007316 Size 36 42GB lt 36418595328 bytes gt Media Error 0 Device Not Ready 0 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 sd3 Sof
82. 7 Ausgabe des Befehls prtconf System Configuration Sun Microsystems sun4u Memory size 16384 Megabytes System Peripherals Software Nodes SUNW Sun Fire V440 packages driver not attached SUNW builtin drivers driver not attached deblocker driver not attached disk label driver not attached pci instance 1 pci instance 2 isa instance 0 flashprom driver not attached rte driver not attached i2c instance 0 i2c bridge driver not attached i2c bridge driver not attached temperature instance 3 driver not attached Mit der Option p gibt der Befehl prtconf hnliche Informationen zur ck wie der OpenBoot Befehl show devs siehe Der Befehl show devs auf Seite 23 Diese Ausgabe f hrt nur die von der System Firmware kompilierten Ger te auf Der Befehl prtdiag Der Befehl prtdiag zeigt eine Tabelle mit Diagnoseinformationen ber den Status der Systemkomponenten an Das Anzeigeformat des Befehls prtdiag h ngt von der auf dem System laufenden Solaris Betriebssystemumgebung ab Das folgende Beispiel ist ein Ausschnitt der prtdiag Ausgabe eines intakten Sun Fire V440 Servers mit Solaris 8 Kapitel 2 Diagnose und Boot Prozess 25 CODE BEISPIEL 2 8 CPU und E A Ausgabe von prtdiag System Configuration Sun Microsystems sun4u Sun Fire V440 System clock frequency 183 MHZ Memory size 16GB seeteco ss Se sles ae eee os Se oe eee Cpg Se ses See ee ee eee ee ES CPU CPU CP
83. 700000 scsi 2 1 pcei 1f 700000 scsi 2 Disk FUJITSU MAN3367M SUN36G 1502 71132959 Blocks 34732 MB Disk FUJITSU MAN3367M SUN36G 1502 71132959 Blocks 34732 MB Der Befehl probe ide Der Befehl probe ide erm glicht die Kommunikation mit allen IDE Integrated Drive Electronics Ger ten die am IDE Bus angeschlossen sind Dies ist der interne Systembus f r Speicherger te wie das DVD ROM Laufwerk Achtung Wenn Sie die Eingabeaufforderung ok mit dem Befehl halt oder der Tastenfolge L1 A Stop A angezeigt haben und danach den Befehl probe ide eingeben kann das System h ngen bleiben Folgendes Beispiel ist eine Ausgabe des Befehls probe ide CODE BEISPIEL2 5 Ausgabe des Befehls probe ide ok probe ide Device 0 Primary Master Removable ATAPI Model TOSHIBA DVD ROM SD C2512 Device 1 Primary Slave Not Present 22 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 Der Befehl show devs Mit dem Befehl show devs werden die Hardware Ger tepfade aller Ger te des Firmware Ger tebaums aufgelistet CODE BEISPIEL 2 6 zeigt eine Beispielausgabe die aus Platzgr nden gek rzt wurde CODE BEISPIEL 2 6 Ausgabe des Befehls show devs ok show devs i2c 1f 464000 pci 1f 700000 ppm le O0 pci le 600000 pci ld 700000 ppm ic 0 pei 1c 600000 memory controller 2 0 SUNW UltraSPARC IIIi 2 0 virtual memory memory mO 10 aliases options openprom packag
84. AY 09 16 58 13 Sun SFV440 a 0004004f Indicator PS1 POK is now ON MAY 09 16 59 19 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 00 46 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 01 51 Sun SFV440 a 0004004f Indicator SYS_FRONT SERVICE is now ON MAY 09 17 03 22 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 03 22 Sun SFV440 a 0004004f Indicator SYS_FRONT SERVICE is now OFF MAY 09 17 03 24 Sun SFV440 a 0004000b Host System has read and cleared bootmode MAY 09 17 04 30 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 05 59 Sun SFV440 a 00040002 Host System has Reset MAY 09 17 06 40 Sun SFV440 a 0004004f Indicator SYS_FRONT SERVICE is now ON MAY 09 17 07 44 Sun SFV440 a 0004004f Indicator SYS_FRONT ACT is now ON sc gt Hinweis In den Zeitstempeln der ALOM Protokolle wird die UTC Zeit Universal Time Coordinated angegeben in den Zeitstempeln der Solaris Betriebssystemumgebung dagegen die lokale Server Zeit Ein einzelnes Ereignis kann daher Meldungen hervorrufen die in verschiedenen Protokollen scheinbar zu verschiedenen Zeiten aufgezeichnet wurden 2 Pr fen Sie das ALOM Ausf hrungsprotokoll Geben Sie Folgendes ein CODE BEISPIEL 7 20 sc gt consolehistory run v Mit diesem Befehl wird das Protokoll angezeigt das die neueste Konsolenausgabe mit Boot Meldungen der Solaris Software enth lt Untersuchen Sie bei der Fehlerbehebung die Ausgabe auf Hardware
85. B OK 26 20 1 0 0 60 65 75 SCSIBP T_AMB OK 23 18 10 0 65 75 85 MB T_AMB OK 28 18 10 0 65 75 85 Hinweis Die Schwellenwerte f r Warnungen und ordnungsgem es softwaregesteuertes Herunterfahren die im CODE BEISPIEL 4 1 erscheinen werden werkseitig festgelegt und k nnen nicht ge ndert werden Die im CODE BEISPIEL 4 1 mit T_AMB bezeichneten Sensoren messen die Umgebungstemperaturen an den CPU Speichermodulen an der Hauptplatine und an der SCSI R ckwandplatine Die mit T_CORE bezeichneten Sensoren messen die internen Temperaturen der Prozessoren selbst In der in CODE BEISPIEL 4 1 gezeigten Ausgabe steht MB f r die Hauptplatine motherboard w hrend sich Cn auf eine bestimmte CPU bezieht Informationen ber die Identifizierung von CPU Modulen finden Sie unter Identifizieren von CPU Speichermodulen auf Seite 46 88 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Mit dem Befehl showenvironment werden au erdem die Position des Systemsteuerungsschalters und der Status der drei LEDs auf der Vorderseite zur ckgegeben CODE BEISPIEL 4 2 ALOM Berichte ber die Position des Systemsteuerungsschalters und die Systemstatus LEDs Mit dem Befehl showenvironment wird der Status der Systemlaufwerke und Liifter angegeben CODE BEISPIEL 4 4 ALOM Berichte ber Systemlaufwerke und L fter Systemlaufwerke Disk Status Service OK to Remove HDDO OK OFF OFF HDD1 OK OFF OFF HDD
86. C Ger teadresse steht am Ende des Hardwarepfads In diesem Beispiel lautet die Adresse 0 b6 d h das Ger t befindet sich an der Hexadezimaladresse b6 auf Segment 0 des I C Busses Wie diese Ger teadresse interpretiert wird erfahren Sie unter Referenz zu den Testmeldungen der I C Diagnose auf Seite 50 Der TABELLE 2 14 k nnen Sie entnehmen dass dimm spd 0 b6 DIMM 0 im CPU Speichermodul 0 entspricht Meldet der Test 12c 0 320 einen Fehler f r dimm spd 0 b6 m ssen Sie dieses DIMM austauschen 20 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 Weitere OpenBoot Befehle Zus tzlich zu den offiziellen firmwarebasierten Diagnosewerkzeugen k nnen Sie einige Befehle ber die Eingabeaufforderung ok aufrufen Diese OpenBoot Befehle sagen etwas ber den Zustand eines Sun Fire V440 Servers aus Dazu geh ren die Befehle printenv probe scsi und probe scsi all probe ide show devs Die von diesen Befehlen zur ckgegebenen Informationen werden in den folgenden Abschnitten beschrieben Anleitungen zur Verwendung der Befehle finden Sie im Abschnitt Verwenden von OpenBoot Informationsbefehlen auf Seite 101 bzw auf der entsprechenden Man Page Der Befehl printenv Der Befehl printenv zeigt die OpenBoot Konfigurationsvariablen an und zwar sowohl die aktuellen als auch die Standardwerte dieser Variablen Weitere Informationen finden Sie unter Anzeigen und Setzen von OpenBoot Konfigurationsvariablen
87. Ds bersetzt PC Bus Adressen und isoliert Busger te bersetzt I2C Bus Adressen und isoliert Busger te Erfasst die CPU Temperatur Enth lt Informationen zur FRU Konfiguration Enth lt Informationen zur FRU Konfiguration Enth lt Informationen zur FRU Konfiguration Enth lt Informationen zur FRU Konfiguration Enth lt Informationen zur FRU Konfiguration Erfasst die CPU Temperatur Kapitel 2 Diagnose und Boot Prozess 51 TABELLE 2 14 _T C Bus Ger te auf einem Sun Fire V440 Server Fortsetzung Adresse Zugeh rige FRU Funktion des Ger ts cpu fru prom 0 ee CPU 3 Enth lt Informationen zur FRU Konfiguration dimm spd 0 e6 CPU Speichermodul 3 Enth lt Informationen zur DIMM 0 FRU Konfiguration dimm spd 0 e8 CPU Speichermodul 3 Enth lt Informationen zur DIMM 1 FRU Konfiguration dimm spd 0 ea CPU Speichermodul 3 Enth lt Informationen zur DIMM 2 FRU Konfiguration dimm spd 0 ec CPU Speichermodul 3 Enth lt Informationen zur DIMM 3 FRU Konfiguration Referenz der in der Diagnoseausgabe verwendeten Begriffe Die Status und Fehlermeldungen der POST und OpenBoot Diagnostics Tests enthalten gelegentlich Akronyme oder Abkiirzungen fiir Hardware Unterkomponenten Mit Hilfe von TABELLE 2 15 k nnen Sie diese Bezeichnungen entschl sseln und sie gegebenenfalls den zugeh rigen FRUs zuordnen TABELLE 2 15 In der Diagnoseausgabe verwendete Abk rzungen oder Akronyme Be
88. Funktion der Systemkonsole In der Systemkonsole werden Status und Fehlermeldungen angezeigt die w hrend des Systemstarts durch firmwarebasierte Tests erzeugt wurden Nach Beendigung dieser Tests haben Sie die M glichkeit bestimmte Befehle f r die Firmware einzugeben um das Verhalten des Systems zu ndern Weitere Informationen zu den Tests die w hrend des Boot Prozesses ausgef hrt werden finden Sie unter ber Diagnose und Boot Prozess auf Seite 8 Nach dem Start der Betriebssystemumgebung gibt die Systemkonsole UNIX Systemmeldungen aus und akzeptiert UNIX Befehle Anhang A Konfigurieren der Systemkonsole 175 Verwendung der Systemkonsole Um mit der Systemkonsole arbeiten zu k nnen ben tigen Sie einige Hilfsmittel zur Datenein und ausgabe Dazu m ssen Sie einige Hardwarekomponenten an das System anschlie en Zun chst m ssen Sie diese Hardware unter Umst nden einrichten und auch die entsprechende Software installieren und konfigurieren Zudem m ssen Sie sicherstellen dass die Systemkonsole zur entsprechenden Schnittstelle auf der R ckseite des Sun Fire V440 Servers geleitet wird Dies ist in der Regel die Schnittstelle an die das als Konsole verwendete Hardwareger t angeschlossen wird Siehe ABBILDUNG A 1 Zu diesem Zweck weisen Sie den OpenBoot Konfigurationsvariablen input device und output device die entsprechenden Werte zu Sun Fire
89. IEL 4 17 ALOM Berichte ber den Status des Betriebssystems Domain Status myhost OS Running sc gt 10 F hren Sie mit ALOM die POST Tests aus Hierzu sind mehrere Schritte erforderlich a Geben Sie Folgendes ein sc gt bootmode diag Mit diesem Befehl wird die OpenBoot Diagnostics Einstellung f r diag switch vor bergehend au er Kraft gesetzt und durch Aus und Einschalten der Stromversorgung wird die Ausf hrung der POST Tests erzwungen Wenn der Server innerhalb von 10 Minuten nicht wieder eingeschaltet wird werden die Standardeinstellungen wiederhergestellt b Schalten Sie das System ein und aus Geben Sie Folgendes ein sc gt poweroff Are you sure you want to power off the system y n y sc gt poweron Die POST Tests werden ausgef hrt sobald das System neu gestartet wird Meldungen sehen Sie jedoch erst wenn Sie vom ALOM zur Systemkonsole wechseln Weitere Informationen finden Sie unter Wechseln zwischen dem ALOM System Controller und der Systemkonsole auf Seite 186 98 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 c Wechseln Sie zur Systemkonsole Geben Sie Folgendes ein sc gt console Enter to return to ALOM O gt Sun Fire TM V440 POST 4 10 0 2003 04 01 22 28 export work staff firmware_re post post build 4 100 0 Fiesta chalupa integrated firmware_re 0 gt Hard Powerup RST thru SW O gt CPUs present in system
90. OFF PS1 ON ON OFF OFF Supply Status PSO OK PS1 OK 90 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Schlie lich gibt dieser Befehl einen Bericht ber den Status der Stromunterbrecher der Hauptplatine Bezeichnung MB FF_SCSIx sowie der Gleichspannungswandler des CPU Moduls Bezeichnung CnPO FF_POK zur ck CODE BEISPIEL 4 6 ALOM Berichte ber Stromunterbrecher und Gleichspannungswandler Current sensors Sensor Status MB FF SCSIA OK MB FF_SCSIB OK MB FF_POK OK C0 PO FF_POK OK C1 PO FF_POK OK C2 P0 FF_POK OK C3 PO FF_POK OK 4 Geben Sie den Befehl showfru ein sc gt showfru Mit diesem Befehl werden ebenso wie mit dem Befehl prt fru c der Solaris Betriebssystemumgebung die verfiigbaren Informationen tiber die statischen FRU IDs fiir verschiedene System FRUs zuriickgegeben Diese Informationen umfassen das Datum und den Ort der Herstellung sowie die Sun Teilenummer CODE BEISPIEL 4 7 ALOM Berichte ber FRU IDs FRU_PROM at PSO SEEPROM Timestamp MON SEP 16 16 47 05 2002 Description PWR SUPPLY CHALUPA 75 EFF H P Manufacture Location DELTA ELECTRONICS CHUNGLI TAIWAN Sun Part No 3001501 Sun Serial No T00065 Vendor JDEC code 3AD Initial HW Dash Level 01 Initial HW Rev Level 02 Shortname PS Kapitel 4 berwachen des Systems 91 5 CODE BEISPIEL 4 8 Geben Sie den Befehl showlogs ein sc gt showlogs Mit diesem Befehl wird ein
91. Out Manager auf Seite 35 Erste Stufe OpenBoot Firmware und POST Jeder Sun Fire V440 Server enth lt einen Chip mit ca 2 MByte firmwarebasiertem Code Dieser Chip ist das sogenannte Boot PROM Nach Einschalten des Systems f hrt das System zun chst den Code im Boot PROM aus Dieser Code als OpenBoot Firmware bezeichnet ist bereits ein kleines abgeschlossenes Betriebssystem Im Gegensatz zum herk mmlichen Betriebssystem das zahlreiche Anwendungen f r mehrere gleichzeitige Benutzer ausf hren kann l uft die OpenBoot Firmware allerdings nur im Single User Modus und ist nur zur Konfiguration und zum Booten des Systems gedacht Die OpenBoot Firmware startet au erdem eine firmwarebasierte Diagnose mit der das System getestet wird Auf diese Weise wird sichergestellt dass die Hardware in Ordnung ist und die normale Betriebssystemumgebung ausgef hrt werden kann Sobald das System eingeschaltet wird startet die OpenBoot Firmware aus dem Boot PROM denn zu diesem Zeitpunkt ist der Systemspeicher noch nicht auf Funktionst chtigkeit berpr ft Bald danach stellt die Systemhardware fest dass mindestens ein CPU Modul eingeschaltet ist Es wird eine Bus Zugriffsanforderung ausgegeben die anzeigt dass die betreffende CPU zumindest teilweise einsatzbereit ist Diese CPU ist die Master CPU Sie ist verantwortlich f r die Ausf hrung der OpenBoot Firmware Anweisungen Die OpenBoot Firmware pr ft dann zun chst ob der Einschaltse
92. Pakete vorhanden sind Paket Beschreibung Anmerkung SUNX1xml XML Bibliothek 32 Bit F r SunVTS 5 1 erforderlich SUNW1xm1x XML Bibliothek 64 Bit SUNWzlib Zip Komprimierungsbibliothek 32 Ben tigte XML Bibliotheken Bit SUNWz1libx Zip Komprimierungsbibliothek 64 Bit 3 Installieren Sie gegebenenfalls fehlende Pakete Installieren Sie mit dem Dienstprogramm pkgadd SunVTS und Unterst tzungspakete auf dem System die Sie ben tigen wie Sie in Schritt 1 oder Schritt 2 festgestellt haben Bei der Solaris 8 Betriebssystemumgebung befinden sich SunVTS und die XML Pakete auf der Software Supplement CD Die z1ib Pakete sind auf der prim ren Installations CD fiir Solaris in der Gruppe Entire Solaris Software enthalten Standardm ig wird die Software SunVTS im Verzeichnis opt SUNWvts installiert 4 Installieren Sie gegebenenfalls Patches fur SunVTS Auf der SunSolve Online M Website werden regelm ig Patches f r SunVTS bereitgestellt Diese Patches enthalten Erweiterungen und Bugfixes In manchen F llen werden Tests erst nach der Installation der Patches korrekt ausgef hrt N chste Schritte Anweisungen zur Installation finden Sie in SunVTS User s Guide in der entsprechenden Dokumentation von Solaris sowie auf der pkgadd Man Page 110 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 TEIL II Fehlerbehebung Die folgenden Kapitel dieses Teils im Sun Fire 440 Server Handbuc
93. Path o1t1d0 Type Fixed Disk Hard Error Count 0 Soft Error Count 3 Transport Error Count 0 Informationen zum Festplattenlaufwerk Kapitel 4 berwachen des Systems 83 b W hlen Sie die Option Logical View system im Men Views In der logischen Ansicht k nnen Sie eine Hierarchie von Systemkomponenten durchsuchen die als Struktur mit verschachtelten Ordnern aufgebaut ist Logische Ansicht EI system aco C system boarn c coPo cpu C COPOBO CI COPOB1 T_corE _ _ ___ Ausgew hlte Komponente orci 0 e2 Acs Wenn Sie eine Hardwarekomponente markieren werden Status und Produktinformationen zu dieser Komponente in einer Eigenschaftstabelle auf der rechten Seite angezeigt Property Value Name T_CORE Location CO PO Description CPU 0 core temperature m Operational Status OK Additional Info Current Reading 54 0 Statusinformationen Units Degrees Celcius zu einer ausgew hlten Lower Non Critical Threshold 0 Komponente Upper Non Critical Threshold 97 Lower Critical Threshold 10 Upper Critical Threshold 102 Lower Fatal Threshold 20 Upper Fatal Threshold 120 Hinweis Die Hierarchie der logischen Ansicht beruht auf dem FRU Ger tebaum Die in dieser Hierarchie angezeigten Namen sind identisch mit denen die bei Eingabe des Befehls prt fru angezeigt werden Weitere Informationen zu diesem Thema finden Sie unter Der Befehl prtfru auf
94. Protokoll Geben Sie Folgendes ein sc gt consolehistory boot v Das ALOM Boot Protokoll enth lt Boot Meldungen von POST OpenBoot Firmware und der Solaris Software nach dem letzten Zur cksetzen des Servers Wenn Sie die Ausgabe untersuchen um ein Problem zu identifizieren suchen Sie nach Fehlermeldungen der POST und OpenBoot Diagnostics Tests CODE BEISPIEL 7 21 zeigt die Ausgabe der POST Boot Meldungen Beachten Sie dass von POST keine Fehlermeldungen zur ckgegeben wurden Unter Was bedeuten die POST Fehlermeldungen auf Seite 11 finden Sie ein Beispiel f r eine POST Fehlermeldung und weitere Informationen ber POST Fehlermeldungen CODE BEISPIEL7 21 Ausgabe des Befehls consolehistory boot v Boot Meldungen von POST Keyswitch set to diagnostic position OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 Clearing TLBs Power On Reset 154 Sun FireTM 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 CODE BEISPIEL7 21 Ausgabe des Befehls consolehistory boot v Boot Meldungen von POST Fortsetzung Executing Power On SelfTest 0 gt Sun Fire TM V440 POST 4 10 3 2003 05 04 22 08 export work staff firmware _re post post build 4 10 3 Fiesta chalupa integrated firmware_re 0 gt Hard Powerup RST thru SW 0 gt CPUs present in system 0 1 0 gt OBP gt POST Call with 00 00000000 01012000 0 gt Diag level set to MIN O gt MFG scrpt mode set NORM 0 gt I O port set to TTYA
95. Prozess 33 TABELLE 2 5 Nicht durch Fehlerisolierungswerkzeuge erkennbare FRUs Fortsetzung FRU Hinweise zur Diagnose Kabel des DVD ROM Laufwerks SCSI R ckwandplatine SCSI Datenkabel Leseger t f r die Systemkonfigurationskarte und Kabel des Leseger ts f r die Systemkonfigurationskarte Systemsteuerungs schalterkabel Wenn die OpenBoot Diagnostics ein Problem mit dem CD DVD Laufwerk festgestellt haben das sich nicht durch den Austausch des Laufwerks beheben l sst k nnte erstens dieses Kabel defekt oder falsch angeschlossen sein oder zweitens ein Problem der Hauptplatine vorliegen Obwohl es sich bei SunVTS nicht um ein ersch pfendes Diagnosewerkzeug handelt k nnen mit einigen Tests i2c2test und disktest bestimmte Verbindungen der SCSI R ckwandplatine gepr ft werden Zus tzlich k nnen Sie die Umgebungstemperatur der R ckwandplatine mit dem Befehl showenvironment des ALOM System Controllers berwachen siehe berwachen des Systems mit Sun Advanced Lights Out Manager auf Seite 86 Probleme mit dieser Komponente lassen sich nur schwer von Problemen mit hnlichen Symptomen unterscheiden Die Firmware erzeugt viele Fehlermeldungen die besagen dass ein Zugriff auf die OpenBoot Konfigurationsvariablen nicht m glich ist zum Beispiel Could not read diag level from NVRAM ALOM zeigt an dass die Wartungs LED auf der Vorderseite leuchtet Wenn der Systemsteuerungsschalter
96. Request 0 Predictive Failure Analysis 0 sd2 Soft Errors 0 Hard Errors 0 Transport Errors 0 Vendor SEAGATE Product ST336607LSUN36G Revision 0207 Serial No 3JA0BRQJ00007316 Size 36 42GB lt 36418595328 bytes gt Media Error 0 Device Not Ready 0 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 sd3 Soft Errors 0 Hard Errors 0 Transport Errors 0 Vendor SEAGATE Product ST336607LSUN36G Revision 0207 Serial No 3JAOBWLO00002318 Size 36 42GB lt 36418595328 bytes gt Media Error 0 Device Not Ready 0 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 sd4 Soft Errors 0 Hard Errors 0 Transport Errors 0 Vendor SEAGATE Product ST336607LSUN36G Revision 0207 Serial No 3JA0AGQS00002317 Size 36 42GB lt 36418595328 bytes gt Media Error 0 Device Not Ready 0 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 Kapitel 7 Beheben von Hardwareproblemen 161 11 berpr fen Sie die Produkthinweise zum System und die Website von SunSolve Online auf aktuelle Informationen Treiberaktualisierungen und frei zug ngliche Dokumente f r das System 12 berpr fen Sie den aktuelle Wartungsverlauf des Systems Ein System auf dem in j ngster Zeit mehrfach Fatal Reset Fehler aufgetreten sind und auf dem mehrfach FRU ersetzt wurden sollte genau berwacht werden um festzustellen ob die zuletzt ausgetauschten Komponenten tats chlich
97. S Softwarepakete sind optional erh ltlich d h nicht unbedingt auf Ihrem System vorinstalliert Weitere Informationen hierzu erhalten Sie unter Ist die Software SunVTS installiert auf Seite 108 Sie sollten unbedingt die aktuelle Version von SunVTS verwenden damit Sie ber die neuesten Tests verf gen Wenn Sie die aktuelle SunVTS Software herunterladen m chten rufen Sie im Webbrowser die folgende Website auf http www sun com oem products vts Anweisungen zur Ausf hrung der SunVTS Software zur berpr fung eines Sun Fire V440 Servers finden Sie unter berpr fen des Systems mit der SunVTS Software auf Seite 104 Weitere Informationen zu diesem Produkt finden Sie in folgenden Handb chern m SunVTS User s Guide Beschreibt Leistungsmerkmale von SunVTS sowie den Start und die Bedienung der verschiedenen Schnittstellen m SunVTS Test Reference Manual Beschreibt alle Tests und Optionen sowie die Befehlszeilenargumente von SunVTS m SunVTS Quick Reference Card Gibt einen berblick ber die Hauptmerkmale der grafischen Benutzeroberfl che GUI m SunVTS Documentation Supplement Beschreibt die neuesten Produkterweiterungen und enth lt Dokumentationsaktualisierungen die nicht im SunVTS User s Guide und im SunVTS Test Reference Manual enthalten sind Diese Dokumente finden Sie auf der Solaris Supplement CD ROM und im WWW unter http www sun com documentation Sie sollten auch die SunVTS README Datei i
98. SUN microsystems Sun Fire V440 Server Handbuch zur Fehlersuche und behebung Sun Microsystems Inc 4150 Network Circle Santa Clara CA 95054 U S A 650 960 1300 Teilenummer 817 2865 10 Juli 2003 Version A Bitte senden Sie Ihre Anmerkungen zu diesem Dokument an http www sun com hwdocs feedback Copyright 2003 Sun Microsystems Inc 4150 Network Circle Santa Clara Kalifornien 95054 USA Alle Rechte vorbehalten Sun Microsystems Inc hat die geistigen Eigentumsrechte f r die Technik die in diesem Dokument beschrieben ist Insbesondere und ohne Einschr nkung k nnen die geistigen Eigentumsrechte ein oder mehrere der US Patente umfassen die unter http www sun com patents aufgelistet sind sowie ein oder mehrere zus tzliche Patente bzw laufende Patentanmeldungen in den USA und in anderen L ndern Dieses Dokument und das ne Produkt werden als Lizenz vertrieben wodurch seine Verwendung Vervielf ltigung Verbreitung und Dekompilierung eingeschr nkt sind Ohne vorherige schriftliche Genehmigung von Sun und gegebenenfalls seiner Lizenzgeber darf dieses Produkt oder Dokument weder ganz noch auszugsweise in irgendeiner Form oder mit irgendwelchen Mitteln reproduziert werden Die Software von Fremdherstellern einschlie lich der Schriftentechnologie ist urheberrechtlich gesch tzt und wird von Sun Lieferanten lizenziert Teile dieses Produkts k nnen auf Berkeley BSD Systemen basieren die von der University of Calif
99. Server die Diagnosetests beim Starten ausf hrt Im Abschnitt Umgehen der Firmware Diagnose auf Seite 60 wird erl utert wie Sie die Firmware Diagnose deaktivieren Vor bergehendes Auslassen der Diagnosetests Auch wenn Sie den Server so einrichten dass Diagnosetests beim Neustart automatisch ausgef hrt werden k nnen die Diagnosetests f r einen einzelnen Boot Zyklus bersprungen werden Dies ist kann hilfreich sein wenn Sie den Server neu konfigurieren oder in den seltenen F llen in denen die POST oder OpenBoot Diagnostics Iests selbst h ngen so dass der Server nicht gestartet und nicht eingesetzt werden kann Diese H nger verdanken sich in der Regel einer Besch digung der Firmware insbesondere der Programmierung eines inkompatiblen Firmware Image in die PROMs des Servers Wenn Sie die Diagnosetests f r einen einzelnen Boot Zyklus wirklich berspringen m ssen ist dies mit dem ALOM System Controller ohne weiteres m glich Weitere Anweisungen finden Sie in der Tempor res Umgehen der Diagnosetests auf Seite 62 Maximieren der Zuverl ssigkeit Die Diagnosetests werden standardm ig nicht ausgef hrt nachdem das System vom Benutzer oder vom Betriebssystem zur ckgesetzt wurde Das bedeutet dass das System nach einem Absturz des Betriebssystems die Diagnosetests nicht ausf hrt Um eine maximale Zuverl ssigkeit sicherzustellen insbesondere bei der automatischen Systemwiederherstellung ASR Automatic Syst
100. System tiberwachen Weitere Informationen zu diesem Thema finden Sie unter m berwachen des Systems mit Sun Management Center auf Seite 36 m berwachen des Systems mit Sun Management Center auf Seite 80 Fehlerinformationen vom System Je nach dem Status des Systems sollten Sie m glichst viele der folgenden Quellen auf Fehleranzeigen berpr fen und die gefundenen Informationen aufzeichnen m Ausgabe des Befehls prtdiag v Wenn die Solaris Software ausgef hrt wird geben Sie den Befehl prtdiag v ein um von OpenBoot Diagnostics und POST Tests gespeicherte Informationen zu erfassen Beim Zur cksetzen des Systems gehen alle Informationen dieser Tests ber den aktuellen Systemstatus verloren Siehe Fehlerbehebung in einem System mit reagierendem Betriebssystem auf Seite 135 m Ausgabe der Befehle show post results und show obdiag results Geben Sie an der Eingabeaufforderung ok den Befehl show post results oder show obdiag results ein um Zusammenfassungen der Ergebnisse der letzten POST bzw OpenBoot Diagnostics Iests anzuzeigen Die Testergebnisse werden unabh ngig vom Ein und Ausschalten des Systems gespeichert Sie k nnen ihnen entnehmen welche Bauteile die POST bzw OpenBoot Diagnostics Tests bestanden haben und welche nicht Siehe Anzeigen von Diagnosetestergebnissen auf Seite 74 Kapitel7 Beheben von Hardwareproblemen 129 m Status der System LEDs Die System LEDs sind an verschiedenen Stellen a
101. Tabellen enthalten den Namen die Position und die Beschreibung aller Ger te sowie deren jeweiligen Betriebsstatus und viele weitere ger teabh ngige Informationen Weitere Informationen ber die Dateneigenschaftstabellen des Config Readers finden Sie im Sun Management Center 3 x Supplement for Sun Fire Sun Blade and Netra Systems Kapitel 4 berwachen des Systems 85 N chste Schritte Der Funktionsumfang der Software Sun Management Center geht weit ber die Beschreibung im vorliegenden Handbuch hinaus Vielleicht interessieren Sie sich ja besonders f r die Einstellung der Alarmfunktionen und die Sicherheitsverwaltung Diese Themen sowie zahlreiche weitere Funktionen werden ausf hrlich im Sun Management Center Software User s Guide und den sonstigen Dokumenten der Sun Management Center Software behandelt 86 berwachen des Systems mit Sun Advanced Lights Out Manager Nachfolgend erfahren Sie wie Sie mit dem Sun Advanced Lights Out Manager ALOM einen Sun Fire V440 Server berwachen Eine genaue Anleitung f hrt Sie schrittweise durch die wichtigsten Funktionen des Werkzeugs Hintergrundinformationen ber ALOM finden Sie unter m berwachen des Systems mit Sun Advanced Lights Out Manager auf Seite 35 m Sun Advanced Lights Out Manager ALOM Online Help Vorbereitung Melden Sie sich bei der Systemkonsole an um zur Eingabeaufforderung ok zu gelangen Anweisungen hierzu finden Sie unter m Wechseln
102. U Freq Size Implementation Mask Status Location 0 1281 MHz 1MB SUNW UltraSPARC IIIi 2 3 online 1 1281 MHz 1MB SUNW UltraSPARC IIIi 2 3 online z 2 1281 MHz 1MB SUNW UltraSPARC IIIi 2 3 online 3 1281 MHz 1MB SUNW UltraSPARC IIIi 2 3 online 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 IO Devices 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 Bus Freq Slot Name Type MHz Status Path Model pci 66 MB pcil08e abba network SUNW pci ce okay pci 1c 600000 network 2 pci 33 MB isa su serial okay pci le 600000 isa 7 serial 0 3 8 pci 33 MB isa su serial okay pci le 600000 isa 7 serial 0 2e8 pei 66 MB pcil08e abba network SUNW pci ce okay pci 1f 700000 network 1 pei 66 MB scsi pcil000 30 scsi 2 LSI 1030 okay pci 1f 700000 scsi 2 Der Befehl prtdiag liefert viele Informationen ber die Konfiguration des Systemhauptspeichers Es folgen weitere Ausz ge aus der Ausgabe 26 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 CODE BEISPIEL2 9 Ausgabe des Befehls prtdiag ber die Speicherkonfiguration Memory Configuration 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 Base Address Size Interleave Factor Contains 0x0 AGB 16 BankIDs 0 1 2 3 15 0x1000000000 AGB 16 BankIDs 16 17 18 fou 0x2000000000 4GB 16 BankIDs 32 33 34 47 0x3000000000 4GB 2 BankIDs 48 49 Bank Table Physical Location ID ControllerID GroupID Size Interleave Way
103. UNG 2 3 dargestellt 4 Optional Legen Sie die gew nschte Teststufe fest Unter Umst nden m chten Sie einen m glichst umfassenden Test ausf hren Setzen Sie zu diesem Zweck die OpenBoot Konfigurationsvariable diag level auf max obdiag gt setenv diag level max Hinweis Wenn diag level auf off gesetzt ist meldet die OpenBoot Firmware f r alle Kerntests den Status bestanden zur ck f hrt aber keine Tests aus Sie k nnen jede beliebige OpenBoot Konfigurationsvariable siehe TABELLE 2 1 ber die Eingabeaufforderung obdiag gt auf die gleiche Weise einstellen 72 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 5 Geben Sie den entsprechenden Befehl und die Nummern der Tests ein die ausgef hrt werden sollen Um beispielsweise alle verf gbaren OpenBoot Diagnostics Tests ausf hren zu lassen geben Sie Folgendes ein obdiag gt test all Einen ganz bestimmten Test legen Sie mit der folgenden Eingabe fest obdiag gt test Dabei steht f r die Nummer des jeweiligen Tests Eine Liste der Befehle der OpenBoot Diagnostics Tests finden Sie unter Interaktive Befehle der OpenBoot Diagnostics auf Seite 18 Das Men mit den nummerierten Tests ist in ABBILDUNG 2 3 dargestellt 6 Verlassen Sie das Testmen wenn die OpenBoot Diagnostics Tests abgeschlossen sind Geben Sie Folgendes ein obdiag gt exit Die Eingabeaufforderung ok wird wi
104. Weitere Informationen hierzu finden Sie in der Sun Fire V440 Server Administrationshandbuch ALOM System Controller Befehl break oder console Wenn Sie an der Eingabeaufforderung sc gt den Befehl break eingeben bernimmt die OpenBoot Firmware zwangsweise die Steuerung des Sun Fire V440 Systems Ist das Betriebssystem bereits heruntergefahren k nnen Sie anstelle des Befehls break den Befehl console aufrufen um die Eingabeaufforderung ok zu erreichen Anhang A Konfigurieren der Systemkonsole 183 N Nachdem Sie die Steuerung des Systems durch die OpenBoot Firmware erzwungen haben besteht die Gefahr dass bestimmte OpenBoot Befehle z B probe scsi probe scsi all oder probe ide zum Aufh ngen des Systems f hren Tastenfolge L1 A Stop A oder Unterbrechungstaste Wenn es unm glich oder nicht ratsam ist das System ordnungsgem herunterzufahren gelangen Sie zur Eingabeaufforderung ok indem Sie auf einer Sun Tastatur die Tastenfolge L1 A Stop A eingeben oder auf einem alphanumerischen Terminal das an den Sun Fire V440 Server angeschlossen ist die Unterbrechungstaste betatigen Hinweis Diese Vorgehensweise zum Aufrufen der Eingabeaufforderung ok funktionieren nur wenn die Systemkonsole zur entsprechenden Schnittstelle umgeleitet wurde Weitere Informationen finden Sie unter Referenz f r die Einstellungen der OpenBoot Konfigurationsvariablen der Systemkonsole auf Seite 209 Bei diesen Methoden zum Aufruf
105. al 53005571 Ethernet address 0 3 ba 28 cd 3 Host ID 8328cd03 Die folgende Beispielausgabe zeigt die OpenBoot Diagnostics Tests Unter Bedeutung der Fehlermeldungen der OpenBoot Diagnostics auf Seite 20 finden Sie ein Beispiel f r eine OpenBoot Diagnostics Fehlermeldung und weitere Informationen ber OpenBoot Diagnostics Fehlermeldungen CODE BEISPIEL 7 11 Ausgabe des Befehls consolehistory boot v OpenBoot Diagnostics Tests Running diagnostic script obdiag normal Testing pci 1f 700000 network 1 Testing pci le 600000 ide d Testing pci le 600000 isa 7 flashprom 2 0 Testing pci le 600000 isa 7 serial 0 2e8 Testing pci l1e 600000 isa 7 serial 0 3 8 Testing pci l1e 600000 isa 7 rtc 0 70 Testing pci le 600000 isa 7 i2c 0 320 tests gpio 0 42 gpio 0 44 gpio 0 46 gpio 0 48 Testing pci le 600000 isa 7 i2c 0 320 tests hardware monitor 0 5c Testing pci le 600000 isa 7 i2c 0 320 tests temperature sensor 0 9c Testing pci 1c 600000 network 2 Testing pci 1f 700000 scsi 2 1 Testing pci 1f 700000 scsi 2 144 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Das folgende Beispiel zeigt die Ausgabe bei der Initialisierung des Speichers durch das OpenBoot PROM CODE BEISPIEL 7 12 Ausgabe des Befehls consolehistory boot v Speicherinitialisierung Initializing 1MB of memory at addr 123fe02000 Initializing 12MB of memory at addr 123 000000 Initial
106. atchdog Mechanismus wieder aktiviert werden kann Mit der Konfigurationsvariablen error reset recovery k nnen Sie steuern wie sich der Hardware Watchdog Mechanismus verh lt wenn der Timer abl uft Im Folgenden werden die Einstellungen f r error reset recovery aufgef hrt m boot Standardwert Setzt den Timer zur ck und versucht das System neu zu starten m sync empfohlen Versucht automatisch eine Speicherauszugsdatei zu erzeugen den Timer zur ckzusetzen und das System neu zu starten m none entspricht der manuellen Ausl sung eines XIR ber den ALOM System Controller Ruft auf dem Server die Eingabeaufforderung ok auf so dass Sie Befehle eingeben und Fehler im System suchen k nnen Weitere Informationen ber den Hardware Watchdog Mechanismus und XIR finden Sie im Sun Fire V440 Server Administrationshandbuch Informationen zur Fehlerbehebung in blockierten Systemen finden Sie unter m Reaktion auf Systemblockierungen auf Seite 131 m Fehlerbehebung in einem blockierten System auf Seite 168 Kapitel6 Optionen zur Fehlerbehebung 117 Einstellungen f r die automatische Systemwiederherstellung Automatic System Recovery ASR ASR erm glicht die Wiederaufnahme des Systembetriebs nach weniger schwerwiegenden Hardware Fehlern oder Ausf llen Wenn ASR aktiviert ist werden ausgefallene Hardwarekomponenten von Diagnoseroutinen der Systemfirmware automatisch erkannt Mit Hilfe einer in der OpenBoot Firmwa
107. ation Guide Basic Administration a Versuchen Sie die Betriebssystemumgebung f r einen Benutzer von einer CD zu laden Legen Sie eine g ltige CD mit der Solaris Betriebssystemumgebung in das DVD ROM oder CD ROM Laufwerk des Systems und geben Sie an der Eingabeaufforderung ok den Befehl boot cdrom s ein b Wenn das System von der CD bootet und die Betriebssystemumgebung geladen wird berpr fen Sie die folgenden Punkte m Wenn das System normal von einer Festplatte des Systems startet berpr fen Sie die Festplatte des System auf Probleme und ein g ltiges Boot Image m Wenn das System normal ber das Netzwerk startet berpr fen Sie die Netzwerkkonfiguration des Systems die Ethernet Kabel und die Netzwerkkarte des Systems Kapitel7 Beheben von Hardwareproblemen 167 c Wenn das System zur Eingabeaufforderung ok gelangt aber die Betriebssystemumgebung nicht von der CD geladen wird berpr fen Sie die folgenden Punkte m OpenBoot Variableneinstellungen boot device diag device und auto boot m OpenBoot PROM Ger tebaum Weitere Informationen hierzu finden Sie unter Der Befehl show devs auf Seite 23 m Wird der Startbildschirm vor der Eingabeaufforderung ok angezeigt m Meldungen ber Fehler des Diagnosetests oder Hardwarefehlermeldungen vor der Anzeige der Eingabeaufforderung ok Fehlerbehebung in einem blockierten System Vorbereitung Hierbei wird vorausgesetzt dass die Systemkonsole standard
108. auf Seite 196 ndern der Datei etc remote auf Seite 199 Pr fen der Einstellungen der seriellen Schnittstellen f r ttyb auf Seite 203 Zugriff auf die Systemkonsole ber ein alphanumerisches Terminal auf Seite 201 m Zugriff auf die Systemkonsole ber einen lokalen Grafikmonitor auf Seite 205 Au erdem enth lt der Anhang noch die folgenden Informationen bersicht ber die Kommunikation mit dem System auf Seite 174 Die Eingabeaufforderung sc gt auf Seite 180 Die Eingabeaufforderung ok auf Seite 182 Wechseln zwischen dem ALOM System Controller und der Systemkonsole auf Seite 186 m Referenz f r die Einstellungen der OpenBoot Konfigurationsvariablen der Systemkonsole auf Seite 209 173 bersicht ber die Kommunikation mit dem System F r die Installation der Systemsoftware oder die Diagnose von Problemen m ssen Sie auf einer unteren Ebene mit dem System kommunizieren k nnen Zu diesem Zweck steht Ihnen die Systemkonsole zur Verf gung Mit ihrer Hilfe k nnen Sie Meldungen anzeigen und Befehle ausf hren Auf jedem Computer kann es jeweils nur eine Systemkonsole geben Bei der erstmaligen Systeminstallation ist die serielle Verwaltungsschnittstelle SERIAL MGT die Standardschnittstelle f r den Zugriff auf die Systemkonsole Nach der Installation haben Sie die M glichkeit die Systemkonsole f r die Eingabe von verschiedenen Ger ten bzw die Ausgabe an verschiedene
109. behebung auf Seite 117 bersicht ber aktualisierte Fehlerbehebungsinformationen Sun sammelt und ver ffentlicht auch weit nach dem Versand der urspr nglichen Systemdokumentation Informationen ber den Sun Fire V440 Server Aktuelle Fehlerbehebungsinformationen f r den Server finden Sie in den Produkthinweisen und auf den Sun Websites Mit Hilfe dieser Ressourcen k nnen Sie eventuell auftretende Probleme verstehen und diagnostizieren 113 Produkthinweise Produkthinweise zum Sun Fire V440 Server enthalten aktuelle Informationen ber das System beispielsweise m aktuelle empfohlene und erforderliche Software Patches m aktualisierte Informationen zur Kompatibilit t von Hardware und Treibern m Bekannte Probleme und Fehlerbeschreibungen einschlie lich L sungen und Behelfsl sungen Die aktuellen Produkthinweise erhalten Sie unter http www sun com documentation Websites SunSolve Online Diese Website enth lt eine Sammlung von Ressourcen f r technische Informationen und Supportinformationen von Sun Der Zugriff auf bestimmte Informationen auf dieser Website h ngt von Ihrem Servicevertrag mit Sun ab Diese Website hat folgende Inhalte m Patch Support Portal Alles was Sie zum Herunterladen und Installieren von Patches ben tigen u a Tools Produktpatches Sicherheitspatches signierte Patches x86 Treiber m Sun Install Check Tool Ein Dienstprogramm mit dem Sie berpr fen k nnen ob ein neuer S
110. ber den Systemstatus zum Zeitpunkt der Blockierung geben k nnen 5 Falls m glich pr fen Sie ob das System eine Speicherauszugsdatei angelegt hat Speicherauszugsdateien enthalten wertvolle Informationen die Ihren Supportanbieter bei der Diagnose von Systemproblemen unterst tzen Weitere Informationen ber Speicherauszugsdateien finden Sie unter bersicht ber den Speicherauszugsprozess auf Seite 121 und Managing System Crash Information im Solaris System Administration Guide 6 Uberpriifen Sie die LEDs des Systems Mit dem ALOM System Controller k nnen Sie den Status der System LEDs pr fen Informationen tiber die LEDs des Systems finden Sie im Sun Fire V440 Server Administrationshandbuch Kapitel 7 Beheben von Hardwareproblemen 157 7 Pr fen Sie die Ausgabe des Befehls prtdiag v Geben Sie Folgendes ein sc gt console Enter to return to ALOM usr platform uname i sbin prtdiag v Mit dem Befehl prtdiag v haben Sie Zugriff auf Informationen die von den POST und OpenBoot Diagnostics Iest gespeichert wurden Beim Zur cksetzen des Systems gehen alle Informationen dieses Befehls ber den aktuellen Systemstatus verloren Wenn Sie die Ausgabe untersuchen um Probleme zu identifizieren berpr fen Sie ob alle installierten CPU Module PCI Karten und Speichermodule aufgef hrt werden Stellen Sie fest ob Wartungs LEDs leuchten und ob das System PROM die aktuelle Firmwareversion enth
111. bindung 177 196 Tivoli Enterprise Console siehe berwachungswerkzeuge anderer Hersteller U berhitzung mit prtdiag feststellen 28 berpr fen der Baudrate 203 berwachen des Systems E Mail Benachrichtigung und 35 mit dem ALOM System Controller 35 86 mit OpenBoot Befehlen 21 101 mit Solaris Befehlen 24 100 mit Sun Management Center 80 berwachungswerkzeuge anderer Hersteller 39 Unterbrechungstaste alphanumerisches Terminal 184 189 USB Ger te OpenBoot Diagnostics Selbsttests ausf hren auf 19 V Variable auto boot Einstellen 182 Variable diag level Einstellen 13 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Version Hardware und Software anzeigen mit showrev 31 Verwaltung von Firmwarepatches 115 Verwaltung von Patches Firmware 115 Software 115 Verwaltung von Softwarepatches 115 Ww Warnschwellenwerte von ALOM gemeldet 88 90 Wartung erforderlich LED Festplattenlaufwerk 68 Netzteil 67 System 66 x XIR siehe Externally Initiated Reset Z Zielnummer probe scsi 21 Zur cksetzen des Systems manuell 185 189 219 220 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003
112. bk rzungen oder Akronyme 52 Verwenden von Befehlen zur Abfrage von Solaris Systeminformationen 100 Verwenden von OpenBoot Informationsbefehlen 102 N tzliche SunVTS Tests f r einen Sun Fire V440 Server 107 Einstellungen der OpenBoot Konfigurationsvariablen zur ASR Aktivierung 118 TABELLE A 1 Kommunikationsm glichkeiten 174 TABELLE A2 M glichkeiten f r den Zugriff auf die Eingabeaufforderung ok 189 TABELLE A3 KontaktUbergange f r den Anschluss an einen typischen Terminalserver 194 TABELLE A 4 OpenBoot Konfigurationsvariablen die sich auf die Systemkonsole auswirken 210 x Sun Fire V440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Vorwort Das Sun Fire 440 Server Handbuch zur Fehlersuche und behebung wurde f r erfahrene Systemadministratoren entwickelt Es enth lt eine Beschreibung des Sun Fire V440 Servers und seiner Diagnosewerkzeuge sowie spezifische Informationen zur Diagnose und Behebung von Serverproblemen Einige einleitende Worte Es wird vorausgesetzt dass Sie die Konzepte und Begriffe von Computernetzwerken kennen und mit der Betriebssystemumgebung Solaris eingehend vertraut sind Um die Informationen in diesem Dokument umfassend nutzen zu k nnen m ssen Sie die in diesem Buch behandelten Themen gr ndlich kennen m Sun Fire V440 Server Administrationshandbuch Aufbau dieses Handbuchs Dieses Buch ist im ersten Teil ein wenig anders gegliedert als Sie dies von anderen B chern k
113. ches Icache is ON Dcache is ON Wcache is ON Pcache is ON 1 gt Memory interleave set to 0 ls T gt Bank 0 1024MB 00000010 00000000 gt 00000010 40000000 Bank 2 1024MB 00000012 00000000 gt 00000012 40000000 0 gt Print Mem Config O gt Caches Icache is ON Dcache is ON Wcache is ON Pcache is ON 0 gt Memory interleave set to 0 0 gt 0 gt O gt INFO 0 gt 0 gt O gt POST Bank 0 1024MB 00000000 00000000 gt 00000000 40000000 Bank 2 1024MB 00000002 00000000 gt 00000002 40000000 POST Passed all devices Return to OBP 4 Bringen Sie den Systemsteuerungsschalter des Servers in die Position Diagnose Schalten Sie das System ein Wenn das System nicht startet liegt eventuell ein grundlegendes Hardwareproblem vor Falls Sie in letzter Zeit keine Anderungen am System vorgenommen haben wenden Sie sich an den autorisierten Kundendienst Wenn auf dem System die Eingabeaufforderung ok angezeigt aber die Betriebssystemumgebung nicht geladen wird m ssen Sie in der Systemfirmware eventuell die Einstellung f r boot device ndern Informationen ber die Verwendung der probe Befehle finden Sie im Abschnitt Verwenden von OpenBoot Informationsbefehlen auf Seite 101 Mit den probe Befehlen k nnen Sie Informationen ber aktive SCSI und IDE Ger te anzeigen Informationen ber die nderung des standardm igen Boot Ger ts finden Sie im Solaris System Administr
114. chnittstelle und die Netzwerkverwaltungsschnittstelle verwenden m chten lesen Sie den folgenden Abschnitt m Referenz f r die Einstellungen der OpenBoot Konfigurationsvariablen der Systemkonsole auf Seite 209 Zugriff auf die Systemkonsole ber ein alphanumerisches Terminal Vorbereitung Bei den folgenden Schritten wird vorausgesetzt dass Sie f r den Zugriff auf die Systemkonsole des Sun Fire V440 Servers die serielle Schnittstelle eines alphanumerischen Terminals mit der seriellen Verwaltungsschnittstelle SERIAL MGT des Sun Fire V440 Servers verbinden Auszuf hrende Arbeitsschritte Verbinden Sie das serielle Kabel mit dem seriellen Anschluss des alphanumerischen Terminals Verwenden Sie ein serielles RJ 45 Nullmodemkabel oder ein serielles RJ 45 Kabel und einen Nullmodemadapter Stecken Sie das Kabel in die Buchse des seriellen Anschlusses des Terminals Verbinden Sie das andere Ende des seriellen Kabels mit der seriellen Verwaltungsschnittstelle des Sun Fire V440 Servers Schlie en Sie das Netzkabel des alphanumerischen Terminals an die Stromversorgung an Stellen Sie am Terminal die Empfangsoptionen ein 9600 Baud 8 Bit Parit t keine 1 Stoppbit Anhang A Konfigurieren der Systemkonsole 201 m Kein Handshake Protokoll Informationen zur Konfiguration des Terminals finden Sie in der zugeh rigen Dokumentation 5 Wenn Sie ttyb anstelle der seriellen Verwaltungsschnittstelle verwenden m cht
115. chungen oder Andeutungen von Problemen durch das System In diesem Kapitel werden die Diagnosewerkzeuge vorgestellt die Sie auf dem Server einsetzen k nnen Folgendes Thema wird behandelt m Eine breite Palette von Werkzeugen auf Seite 2 Wenn Sie umfassende Hintergrundinformationen ber die Diagnosewerkzeuge w nschen lesen Sie dieses Kapitel und anschlie end Kapitel 2 um festzustellen wie die Werkzeuge zusammenarbeiten Wenn Sie nur wissen m chten wie die Diagnosewerkzeuge eingesetzt werden k nnen Sie die beiden ersten Kapitel berspringen und die folgenden Kapitel lesen m Kapitel 3 Vorgehensweise zum Identifizieren von Komponenten m Kapitel 4 Vorgehensweise bei der System berwachung m Kapitel 5 Vorgehensweise bei der System berpr fung Hilfreich ist eventuell auch m Anhang A mit Informationen ber die Systemkonsole Eine breite Palette von Werkzeugen Sun stellt f r seinen Sun Fire V440 Server eine ganze Reihe von Diagnosewerkzeugen zur Verf gung Die Bandbreite reicht von den offiziellen Werkzeugen wie der Software SunVTS einer umfassenden Validation Test Suite bis hin zu eher inoffiziellen Werkzeugen wie Protokolldateien in denen sich m glicherweise hilfreiche Hinweise f r die Fehlersuche finden lassen Ebenso reicht das Spektrum von Standalone Softwarepaketen ber Firmware basierte Diagnoseverfahren durch Einschaltselbsttests Power on Self test POST bis hin zu Hardware LEDs die eine f
116. d 4 network 1 5 network 2 6 rmc comm 0 3e8 7 rtc 0 70 8 scsi 2 9 scsi 2 1 10 serial 0 2e8 11 serial 0 3f8 12 usb a 13 usb b Commands test test all except help what setenv set default exit diag passes 1 diag level min test args ABBILDUNG 2 3 Interaktives Menti der OpenBoot Diagnostics Interaktive Befehle der OpenBoot Diagnostics Einzelne OpenBoot Diagnostics Tests k nnen Sie durch Eingabe des folgenden Befehls an der Eingabeaufforderung obdiag gt ausf hren obdiag gt test n wobei n die Nummer des gew nschten Men elements ist Hinweis Nach dem Anhalten des Betriebssystems lassen sich die Befehle der OpenBoot Diagnostics nicht zuverl ssig ausf hren da sich der Arbeitsspeicher des Systems danach in einem unvorhersagbaren Zustand befindet Vor dem Ausf hren dieser Befehle empfiehlt es sich daher das System zur ckzusetzen Die Eingabeaufforderung obdiag gt stellt zahlreiche weitere Befehle zur Verf gung Eine Beschreibung dieser Befehle finden Sie in TABELLE 2 13 unter Referenz zu den Tests und Befehlen der OpenBoot Diagnostics auf Seite 47 Die gleichen Informationen werden angezeigt wenn Sie nach obdiag gt help eingeben 18 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Die Eingabeaufforderung ok die Befehle test und test all Die OpenBoot Diagnostics Tests k nnen auch direkt von der Eingabeaufforderung ok ausgef hrt werden Dazu geben S
117. d args Loading ufs file system package 1 4 04 Aug 1995 13 02 54 FCode UFS Reader 1 11 97 07 10 16 19 15 Loading platform SUNW Sun Fire V440 ufsboot Loading platform sun4u ufsboot SunOS Release 5 8 Version Generic_114696 04 64 bit Copyright 1983 2003 Sun Microsystems Inc All rights reserved Hardware watchdog enabled sc gt 8 Geben Sie den Befehl showusers ein sc gt showusers Mit diesem Befehl werden alle Benutzer angezeigt die derzeit beim ALOM angemeldet sind CODE BEISPIEL 4 16 ALOM Berichte ber aktive Benutzersitzungen username connection login time console admin serial FEB 28 19 45 admin net 1 MAR 03 14 43 sc gt client IP addr system 129 1A ELLs LEL Beachten Sie in diesem Fall dass es zwei verschiedene administrative Benutzer gleichzeitig gibt Der erste Benutzer ist tiber die Schnittstelle SERIAL MGT angemeldet und hat Zugriff auf die Systemkonsole Der zweite Benutzer ist von einem anderen Host ber eine telnet Verbindung mit der Schnittstelle NET MGT angemeldet Der zweite Benutzer kann die Systemkonsolensitzung zwar anzeigen aber keine Konsolenbefehle eingeben Kapitel 4 berwachen des Systems 97 9 Geben Sie den Befehl showplat form ein sc gt showplatform Mit diesem Befehl wird der Status des Betriebssystems angezeigt Die Statusbezeichnungen lauten beispielsweise Running Stopped Initializing usw CODE BEISP
118. das Passwort f r das Konto admin oder den Namen und das Passwort f r ein anderes Anmeldekonto ein falls ein solches f r Sie eingerichtet wurde F r die folgenden Schritte muss dieses Konto ber volle Benutzerrechte verf gen Hinweis Beim ersten Zugriff auf ALOM ist noch kein Passwort f r das Konto admin festgelegt Sobald Sie versuchen einen Befehl auszuf hren f r den spezielle Berechtigungen erforderlich sind werden Sie aufgefordert ein Passwort einzugeben Notieren Sie sich das eingegebene Passwort und bewahren Sie es zur sp teren Verwendung auf Die Eingabeaufforderung sc gt wird angezeigt ScC gt Nun haben Sie Zugriff auf die Befehlszeilenschnittstelle des ALOM System Controllers 3 Geben Sie an der Eingabeaufforderung sc gt den Befehl showenvironment ein sc gt showenvironment Mit diesem Befehl werden zahlreiche n tzliche Daten angezeigt zun chst beispielsweise die Temperaturwerte einer Reihe von Temperatursensoren Kapitel 4 berwachen des Systems 87 CODE BEISPIEL 4 1 ALOMBerichte ber Systemtemperaturen Environmental Status System Temperatures Temperatures in Celsius Sensor Status Temp LowHard LowSoft LowWarn HighWarn HighSoft HighHard C0 PO T_CORE OK 43 20 10 0 97 102 120 C1 P0 T CORE OK 50 20 10 0 97 102 120 C2 PO T_CORE OK 56 20 10 0 97 102 120 CO T_AMB OK 26 20 10 0 60 65 75 C1 T_AMB OK 27 20 10 0 60 65 75 C2 T_AM
119. dem sie installiert sind Diese Steckpl tze sind von links nach rechts mit 0 bis 3 nummeriert wenn Sie von vorn auf das Chassis des Sun Fire V440 Servers schauen siehe ABBILDUNG 2 5 ABBILDUNG 25 Nummerierung von CPU Speichermodulen Wenn in einem Sun Fire V440 Server z B nur zwei CPU Speichermodule installiert sind und diese im linken und rechten Steckplatz sitzen werden sie von der Firmware als CPU 0 und CPU 3 bezeichnet Das in der oben aufgefiihrten POST Fehlermeldung genannte ausgefallene DIMM befindet sich somit im rechten CPU Speichermodul C3 und wird auf der Platine dieses Moduls mit BO D1 bezeichnet Referenz zu den Tests und Befehlen der OpenBoot Diagnostics In diesem Abschnitt werden die verf gbaren Tests und Befehle der OpenBoot Diagnostics beschrieben Hintergrundinformationen zu diesen Tests finden Sie unter Zweite Stufe OpenBoot Diagnostics Tests auf Seite 15 Kapitel 2 Diagnose und Boot Prozess 47 TABELLE 2 12 Aus dem Men der OpenBoot Diagnostics abrufbare Tests Name des Tests flashprom 2 0 i2c 0 320 ide d network 1 network 2 rmc comm 0 3e8 rtc 0 70 scsi 2 scsi 2 1 serial 0 3 8 serial 0 2e8 usb a usb eb Funktion F hrt einen Pr fsummentest am Boot PROM aus Pr ft das PC Umgebungs berwachungsuntersystem zu dem zahlreiche Temperaturf hler und andere Sensoren auf der Hauptplatine und auf anderen FRUs geh ren Pr ft den On board IDE Controller sowie
120. der Eingabeaufforderung ok besteht die Gefahr dass bestimmte OpenBoot Befehle z B probe scsi probe scsi all und probe ide zum Aufhangen des Systems f hren XIR Externally Initiated Reset F hren Sie mit dem Befehl reset x des ALOM System Controllers ein XIR aus Durch die Erzwingung eines XIR l sst sich die Blockierung des Systems unter Umst nden beseitigen Allerdings ist kein ordnungsgem es Herunterfahren der Anwendungen m glich Deshalb sollten Sie diese Methode f r den Zugriff auf die Eingabeaufforderung ok nur dann w hlen wenn Sie Systemblockierungen dieser Art beheben m chten Die Erzeugung eines XIR hat den Vorteil dass Sie den Befehl sync ausf hren k nnen um den aktuellen Systemzustand f r Diagnosezwecke in einer Speicherauszugsdatei abzulegen Weitere Informationen ber den Befehl reset x finden Sie in der Sun Advanced Lights Out Manager ALOM Online Help Achtung Da ein XIR ein ordnungsgem es Herunterfahren von Anwendungen verhindert sollten Sie dies nur versuchen wenn die zuvor beschriebenen Methoden nicht funktionieren 184 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Manuelles Zur cksetzen des Systems Setzen Sie den Server mit dem Befehl reset x des ALOM System Controllers oder den Befehlen poweroff und poweron zur ck Der Zugriff auf die Eingabeaufforderung ok durch manuelles Zur cksetzen oder durch Aus und Einschalten des Systems sollte nur als letzt
121. der Solaris Betriebssystemumgebung steuern der D mon syslogd und dessen Konfigurationsdatei etc syslogd conf die Behandlung der Fehlermeldungen Informationen ber die Datei var adm messages und andere Quellen f r Systeminformationen finden Sie unter How to Customize System Message Logging im System Administration Guide Advanced Administration das Bestandteil der Systemverwaltungsdokumentation von Solaris ist Befehle zur Abfrage von Solaris Systeminformationen Einige Solaris Befehle geben Informationen ber den Zustand eines Sun Fire V440 Servers aus Dazu geh ren die folgenden Befehle prtconf prtdiag prtfru psrinfo showrev Die von diesen Befehlen zur ckgegebenen Informationen werden in den folgenden Abschnitten beschrieben Anleitungen zur Verwendung der Befehle finden Sie im Abschnitt Verwenden von Solaris Systeminformationsbefehlen auf Seite 100 bzw auf der entsprechenden Man Page Der Befehl prt conf Mit dem Befehl prtconf wird der Solaris Ger tebaum angezeigt Dieser Baum enth lt neben den von der OpenBoot Firmware gepr ften Ger ten weitere Ger te wie einzelne Festplatten die nur von der Betriebssystemumgebungssoftware verwaltet werden Au erdem wird mit prtconf der Gesamtsystemspeicher angezeigt CODE BEISPIEL 2 7 ist ein Ausschnitt aus der Ausgabe von prtconf der aus Platzgr nden gek rzt wurde 24 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 CODE BEISPIEL 2
122. der Solaris Software nach dem letzten Zur cksetzen des Servers Wenn Sie die Ausgabe untersuchen um ein Problem zu identifizieren suchen Sie nach Fehlermeldungen der POST und OpenBoot Diagnostics Tests 142 Sun FireTM 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 CODE BEISPIEL 7 8 zeigt die Ausgabe der POST Boot Meldungen Beachten Sie dass von POST keine Fehlermeldungen zur ckgegeben wurden Unter Was bedeuten die POST Fehlermeldungen auf Seite 11 finden Sie ein Beispiel f r eine POST Fehlermeldung und weitere Informationen ber POST Fehlermeldungen CODE BEISPIEL7 8 Ausgabe des Befehls consolehistory boot v Boot Meldungen von POST Keyswitch set to diagnostic position OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 Clearing TLBs Power On Reset Executing Power On SelfTest O gt Sun Fire TM V440 POST 4 10 3 2003 05 04 22 08 export work staff firmware_re post post build 4 10 3 Fiesta chalupa integrated firmware_re 0 gt Hard Powerup RST thru SW 0 gt CPUs present in system 0 1 0 gt OBP gt POST Call with 00 00000000 01012000 0 gt Diag level set to MIN O gt MFG scrpt mode set NORM 0 gt I O port set to TTYA O gt Start selftest 1 gt Print Mem Config 1 gt Caches Icache is ON Dcache is ON Wcache is ON Pcache is ON 1 gt Memory interleave set to 0 1 gt Bank 0 1024MB 00000010 00000000 gt 00000010 40000000 1 gt Bank 2 1024MB 00000012 00000000 gt 00000012 40000000
123. der console Betriebssystemumgebungssoftware nicht ausgef hrt wird und der Server bereits von der OpenBoot Firmware gesteuert wird Tastenfolge L1 A Stop A Dr cken Sie auf einer Sun Tastatur die direkt mit dem Sun Fire oder Unterbrechungstaste V440 Server verbunden ist gleichzeitig die Tasten Stop und A oder e Bet tigen Sie auf einem angeschlossenen alphanumerischen Terminal die Unterbrechungstaste Externally Initiated e Geben Sie an der Eingabeaufforderung sc gt den Befehl reset Reset XIR x ein Manuelles Zur cksetzen Geben Sie an der Eingabeaufforderung sc gt den Befehl reset des Systems oder die Befehle poweroff und poweron ein Dazu muss die OpenBoot Konfigurationsvariable input device auf keyboard gesetzt sein Weitere Informationen dazu finden Sie unter Zugriff auf die Systemkonsole ber einen lokalen Grafikmonitor auf Seite 205 und Referenz f r die Einstellungen der OpenBoot Konfigurationsvariablen der Systemkonsole auf Seite 209 Verwendung der seriellen Verwaltungsschnittstelle Die folgenden Schritte setzen voraus dass die Systemkonsole die serielle Verwaltungsschnittstelle und die Netzwerkverwaltungsschnittstelle verwendet Standardkonfiguration Wenn Sie ber ein Ger t das an die serielle Verwaltungsschnittstelle angeschlossen ist auf die Systemkonsole zugreifen ist der erste Zugriffspunkt der ALOM System Controller und dessen Eingabeaufforderung sc gt
124. die Ausgabe auf fehlende Eintr ge in der Spalte CMD CODE BEISPIEL 7 28 zeigt die Ausgabe des Befehls ps ef f r einen intakten Sun Fire V440 Server CODE BEISPIEL 7 28 Ausgabe des Befehls ps ef UID PID PPID C STIME TTY TIME CMD root 0 0 0 14 51 32 0 17 sched root 274 1 0 14 51 32 0 00 etce init root 2 O 9 14 51 32 2 0 00 pageout root 3 0 0 14 51 32 0 02 fsflush root 291 1 0 14 51 47 0 00 usr lib saf sac t 300 root 205 1 0 14 51 44 0 00 usr lib lpsched root 312 148 0 14 54 33 0 00 in telnetd root 169 1 0 14 51 42 0 00 usr lib autofs automountd userl 314 312 0 14 54 33 pts 1 0 00 csh root 53 1 0 14 51 36 0 00 usr lib sysevent syseventd root 59 1 0 14 51 37 0 02 usr lib picl picld root 100 1 0 14 51 40 0 00 usr sbin in rdisc s root 131 1 0 14 51 40 0 00 usr lib netsvc yp ypbind broadcast root 118 1 0 14 51 40 0 00 usr sbin rpcbind root 121 1 0 14 51 40 0 00 usr sbin keyserv root 148 1 0 14 51 42 0 00 usr sbin inetd s root 226 1 0 14 51 44 0 00 usr lib utmpd root 218 1 0 14 51 44 0 00 usr lib power powerd root 199 1 0 14 51 43 0 00 usr sbin nscd root 162 1 0 14 51 42 0 00 usr lib nfs lockd daemon 166 1 0 14 51 42 0 00 usr lib nfs statd root 181 1 0 14 51 43 0 00 usr sbin syslogd root 283 1 0 14 51 47 0 00 usr lib dmi snmpXdmid s Sun SFV440 a root 184 1 0 14 51 43 0 00 usr sbin cron Kapitel 7 Beheben von Hardwareproblemen 159 CODE BEISPIEL
125. die gro e Datencenter oder andere Installationen mit zahlreichen Computerplattformen berwachen m ssen Bei kleineren Installationen gilt es die Vorteile von Sun Management Center gegen die Anforderung abzuw gen eine umfangreiche Datenbank mit Systemstatusinformationen normalerweise ber 700 MByte warten zu m ssen F r den Einsatz von Sun Management Center ist die Solaris Betriebssystemumgebung erforderlich Daher m ssen die zu berwachenden Server laufen wenn Sie das Center verwenden m chten Anweisungen hierzu finden Sie unter berwachen des Systems mit Sun Management Center auf Seite 80 Weitere Informationen zu diesem Produkt finden Sie im Sun Management Center Software User s Guide Aktuelle Informationen Aktuelle Informationen zu diesem Produkt erhalten Sie auf der Sun Management Center Website unter http www sun com sunmanagementcenter berpr fen des Systems Der Ausfall einer Systemkomponente ist relativ einfach zu erkennen Wenn ein System allerdings sporadische Probleme aufweist oder sich seltsam verh lt lassen sich mittels eines Softwarewerkzeugs das die vielen Untersysteme des Computers testet oder berpr ft die Quelle eines anstehenden Problems erkennen und Ausfallzeiten oder Funktionseinschr nkungen vermeiden Sun stellt zwei Werkzeuge zur berpr fung von Sun Fire V440 Servern bereit m SunVTS Software a Hardware Diagnostic Suite Software Kapitel 2 Diagnose und Boot Prozess
126. dule auf Seite 44 Referenz zu den Tests und Befehlen der OpenBoot Diagnostics auf Seite 47 Referenz zu den Testmeldungen der I C Diagnose auf Seite 50 Referenz der in der Diagnoseausgabe verwendeten Begriffe auf Seite 52 Wenn Sie nur wissen m chten wie die Diagnosewerkzeuge eingesetzt werden berspringen Sie dieses Kapitel und lesen Sie die folgenden Kapitel m Kapitel 3 Vorgehensweise zum Identifizieren von Komponenten m Kapitel 4 Vorgehensweise bei der System berwachung m Kapitel 5 Vorgehensweise bei der System berpr fung Hilfreich ist eventuell auch m Anhang A mit Informationen ber die Systemkonsole ber Diagnose und Boot Prozess Sicherlich haben Sie schon fters ein Sun System hochgefahren und dem Boot Prozess zugesehen Vielleicht wurden auf der Konsole dabei Meldungen wie die folgenden angezeigt 0 gt Sun Fire TM V440 POST 4 10 0 2003 04 01 22 28 export work staff firmware_re post post build 4 10 0 Fiesta chalupa integrated firmware_re 0 gt Hard Powerup RST thru SW O gt CPUs present in system 0 1 2 3 0 gt OBP gt POST Call with 00 00000000 01008000 0 gt Diag level set to MAX O gt MFG scrpt mode set to NONE 0 gt I O port set to TTYA 0 gt O gt Start selftest Die in diesen Meldungen enthaltenen Informationen werden klar wenn Sie den Boot Prozess verstanden haben Eine Erl uterung der Meldungen finden Sie weiter hinten in diesem Handbuch Sie k
127. dwire ge ndert oder gel scht wurde vergleichen Sie den Eintrag mit dem folgenden Beispiel und bearbeiten Sie ihn gegebenenfalls CODE BEISPIELA 1 Eintrag f r hardwire in der Datei etc remote letzte Systemsoftware hardwire dv dev term b br 9600 el C S Q U D ie 0e D Hinweis Wenn Sie statt der seriellen Schnittstelle B lieber die serielle Schnittstelle A des Sun Systems verwenden m chten ersetzen Sie dev term b durch dev term a m Wenn die Nummer die mit dem Befehl uname r angezeigt wird niedriger als 5 0 ist berpr fen Sie die Datei etc remote und f gen Sie gegebenenfalls den folgenden Eintrag hinzu CODE BEISPIELA 2 Eintrag f r hardwire in der Datei etc remote ltere Systemsoftware hardwire dv dev ttyb br 9600 el C S Q U D ie 0e D Hinweis Wenn Sie statt der seriellen Schnittstelle B lieber die serielle Schnittstelle A des Sun Systems verwenden m chten ersetzen Sie dev ttyb durch dev ttya N chste Schritte Die Datei etc remote ist jetzt korrekt konfiguriert Fahren Sie mit der Einrichtung der tip Verbindung zur Systemkonsole des Sun Fire V440 Servers fort Siehe m Zugriff auf die Systemkonsole ber eine tip Verbindung auf Seite 196 200 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Wenn Sie die Systemkonsole zur Schnittstelle ttyb umgeleitet haben und Sie f r die Systemkonsole wieder die serielle Verwaltungss
128. e nderungen an den OpenBoot Konfigurationsvariablen werden grunds tzlich erst nach einem Neustart des Servers wirksam In TABELLE 2 1 werden die wichtigsten und hilfreichsten Variablen aufgef hrt Das OpenBoot Command Reference Manual enth lt eine ausf hrlichere Darstellung der Variablen Anweisungen zur Einstellung der OpenBoot Konfigurationsvariablen finden Sie in Anzeigen und Setzen von OpenBoot Konfigurationsvariablen auf Seite 56 TABELLE 2 1 OpenBoot Konfigurationsvariablen OpenBoot Konfigurationsvariable Beschreibung und Schl sselw rter auto boot diag level diag script diag switch Legt fest ob das Betriebssystem automatisch gestartet wird Die Standardeinstellung ist true e true Das Betriebssystem wird automatisch gestartet sobald die Initialisierung von der OpenBoot Firmware abgeschlossen wurde e false Die Eingabeaufforderung ok wird so lange angezeigt bis Sie boot eingeben Legt die Stufe bzw den Typ der ausgef hrten Tests fest Die Standardeinstellung ist min e off Keine Tests e min Nur die grundlegenden Tests werden ausgef hrt e max Je nach Ger t k nnen umfassendere Tests ausgef hrt werden Der Arbeitsspeicher wird besonders gr ndlich gepr ft Legt fest welche Ger te von den OpenBoot Tests untersucht werden Die Standardeinstellung ist none e none Keine Ger te werden getestet e normal Ger te auf der Platine basierend auf der Hauptplatine f r die es Selb
129. e Ausgabe des Befehls ps ef f r einen intakten Sun Fire V440 Server CODE BEISPIEL7 15 Ausgabe des Befehls ps ef UID PID PPID C STIME TTY TIME CMD root 0 0 0 14 51 32 0 17 sched root 1 0 0 14 51 32 0 00 etce init root 2 0 0 14 51 32 0 00 pageout root 3 0 0 14 51 32 0 02 fsflush root 291 1 0 14 51 47 0 00 usr lib saf sac t 300 root 205 1 0 14 51 44 0 00 usr lib lpsched root 312 148 0 14 54 33 0 00 in telnetd root 169 1 0 14 51 42 0 00 usr lib autofs automountd userl 314 312 0 14 54 33 pts 1 0 00 csh root 53 1 0 14 51 36 0 00 usr lib sysevent syseventd Kapitel7 Beheben von Hardwareproblemen 147 CODE BEISPIEL 7 15 Ausgabe des Befehls ps ef Fortsetzung CODE BEISPIEL 7 16 root 59 root 100 root 131 root 118 root 121 root 148 root 218 root 199 root 162 daemon 166 root 181 root 283 root 184 root 235 root 233 root 245 root 247 root 256 root 294 root 304 root 274 etc snmp conf root 334 1 0 14 51 37 0 02 usr lib picl picld 1 0 14 51 40 0 00 usr sbin in rdisc s 1 0 14 51 40 0 00 usr lib netsvc yp ypbind broadcast 1 0 14 51 40 0 00 usr sbin rpcbind 1 0 14 51 40 0 00 usr sbin keyserv 1 0 14 51 42 0 00 usr sbin inetd s 1 0 14 51 44 0 00 usr lib power powerd 1 0 14 51 43 0 00 usr sbin nscd 1 0 14 51 42 0 00 usr lib nfs lockd 1 0 14 51 42 0 00 usr lib nfs statd 1 0 14 51 43 0 00 usr sbin syslogd 1 0 14 51 47 0 00 usr
130. e M glichkeit in Betracht gezogen werden Bei dieser Vorgehensweise gehen die Systemkoh renz sowie alle Zustandsinformationen verloren Bei einem manuellen Zur cksetzen des Systems werden unter Umst nden die Dateisysteme des Servers besch digt obwohl sie sich mit dem Befehl fsck f r gew hnlich wiederherstellen lassen Verwenden Sie diese Methode nur wenn die anderen M glichkeiten keinen Erfolg bringen Achtung Die Erzwingung einer manuellen Systemr cksetzung f hrt zum Verlust von Systemzustandsdaten und sollte nur als letzte M glichkeit in Betracht gezogen werden Nach dem manuellen Zur cksetzen des Systems sind alle Zustandsinformationen verloren so dass die Behebung der Problemursache erst nach dem erneuten Auftreten des Problems m glich ist Wichtig Durch den Zugriff auf die Eingabeaufforderung ok wird die Solaris Betriebssystemumgebung angehalten Wenn Sie von einem funktionierenden Sun Fire V440 Server aus auf die Eingabeaufforderung ok zugreifen halten Sie die Betriebssystemumgebung an und bergeben die Steuerung des Systems an die Firmware Alle Prozesse die unter der Betriebssystemumgebung ausgef hrt wurden werden ebenfalls angehalten und der Zustand dieser Prozesse kann unter Umst nden nicht mehr wiederhergestellt werden Die Diagnosetests und Befehle die Sie an der Eingabeaufforderung ok ausf hren k nnen den Zustand des Systems beeintr chtigen Das bedeutet dass es nicht immer m glich ist die Ausf
131. e Sun Management Center Software bietet eine unternehmensweite berwachung von Sun Servern und Workstations einschlie lich ihrer Subsysteme Komponenten und Peripherieger te Das berwachte System muss laufen und die erforderlichen Softwarekomponenten m ssen auf den einzelnen Systemen des Netzwerks installiert sein Die einzelnen Ger te verteilen sich auf drei Kategorien physische logische und Umgebungsger te Sun Management Center erm glicht die berwachung folgender Ger te des Sun Fire V440 Servers TABELLE 2 7 Von Sun Management Center berwachte Ger te berwachtes Ger t Ger tekategorie Sun Management Center stellt fest CPUs logisch Vorhandensein und Status der CPU Umgebung CPU Temperatur und Temperaturwarnungen DIMMs physisch Vorhandensein von Modulen und Fehlerinformationen Plattenlaufwerke logisch Vorhandensein Status und Fehlerinformationen zu Laufwerken 36 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 TABELLE 2 7 Von Sun Management Center berwachte Ger te Fortsetzung berwachtes Ger t Ger tekategorie Sun Management Center stellt fest Anzeigen LEDs logisch Anzeigestatus L fter physisch Vorhandensein und Status der L fter Umgebung L ftergeschwindigkeit Netzwerkschnittst logisch Vorhandensein Status und Fehlerinformationen der ellen Ger te PCI Karten physisch Vorhandensein der Karte Netzteile physisch Vorhandensein und Status der Netzteile Umgebung Systemspan
132. eder angezeigt 7 Setzen Sie die OpenBoot Konfigurationsvariable auto boot wieder auf true ok setenv auto boot true Geben Sie Folgendes ein Das Betriebssystem kann nun wieder nach einem System Reset oder einem Neustart automatisch hochfahren 8 Um das System neu zu starten geben Sie Folgendes ein ok reset all Das System speichert die Einstellungen der OpenBoot Konfigurationsvariablen und bootet automatisch wenn die Variable auto boot auf true gesetzt ist Kapitel3 Identifizieren ausgefallener und fehlerhafter Komponenten 73 N chste Schritte Versuchen Sie die in den etwaigen Fehlermeldungen der OpenBoot Diagnostics angegebene n FRU bzw FRUs zu ersetzen Ausf hrliche Informationen zum Austausch von FRUs finden Sie unter m Sun Fire V440 Server Parts Installation and Removal Guide Anzeigen von Diagnosetestergebnissen Eine Zusammenfassung der Ergebnisse der letzten POST und OpenBoot Diagnostics Iests bleibt auch nach dem Abschalten gespeichert Vorbereitung Melden Sie sich bei der Systemkonsole an um zur Eingabeaufforderung ok zu gelangen Anweisungen hierzu finden Sie unter m Wechseln zur Eingabeaufforderung ok auf Seite 188 Auszuf hrende Arbeitsschritte Mit dem folgenden Befehl zeigen Sie eine Zusammenfassung der letzten Ausf hrung der POST Tests an ok show post results Mit dem folgenden Befehl zeigen Sie eine Zusammenfassung der letzten Aus
133. ehler auf FRU Ebene an Hinweis F hren Sie die POST Tests aus um Fehler im Speichersubsystem zu isolieren Kapitel 2 Diagnose und Boot Prozess 45 Entsprechung zwischen logischen und physischen B nken TABELLE 2 11 zeigt die Zuordnung zwischen logischen und physischen B nken f r den Sun Fire V440 Server TABELLE 2 11 Logische und physische Speicherb nke in einem Sun Fire V440 Server Logische Bank Physische Bezeichner in Firmware Ausgabe enthalten auf Platine angegeben Physische Bank Bank 0 BO DO und BO D1 Bank 0 Bank 1 Bank 2 B1 D0 und B1 D1 Bank 1 Bank 3 In ABBILDUNG 2 4 ist dieselbe Zuordnung dargestellt B1 D1 B1 DO Kennzeichnungen auf Platine gt BO Di BO DO Logische Logische Bank 2 Bank 0 yp DIMMs Logische Logische Bank 3 Bank 1 Physische Bank 1 Physische Bank 0 ABBILDUNG 2 4 Zuordnung logischer Speicherb nke zu DIMMs Identifizieren von CPU Speichermodulen Da jedem CPU Speichermodul eigene DIMMs zugeordnet sind m ssen Sie das CPU Speichermodul identifizieren das ein defektes DIMM enth lt Diese Informationen sind in der POST Fehlermeldung enthalten 1 gt H W under test CPU3 BO D1 J0602 side 1 Bank 1 CPU Module C3 In diesem Beispiel hei t das betreffende Modul CPU Module C3 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Die Prozessoren sind entsprechend dem Steckplatz nummeriert in
134. ehler oder ein harter Fehler Ein vor bergehender Fehler verursacht sporadische Ausf lle Ein harter Fehler verursacht dauerhafte Ausf lle die stets gleich ablaufen CODE BEISPIEL 7 1 zeigt ein Beispiel f r eine Fatal Reset Fehlermeldung der Systemkonsole CODE BEISPIEL7 1 Fatal Reset Fehlermeldung Sun SFV440 a console login Fatal Error Reset CPU 0000 0000 0000 0002 AFSR 0210 9000 0200 0000 JETO PRIV OM TO AFAR 0000 0280 0ec0 c180 SC Alert Host System has Reset SC Alert Host System has read and cleared bootmode Eine RED State Exception ist in der Regel ein vom System erkannter Hardwarefehler Es gibt keine Wiederherstellungsinformationen mit deren Hilfe Sie eine RED State Exception beseitigen k nnen Die Ausnahme verursacht einen Verlust der Systemintegrit t durch die das System gef hrdet w rde wenn die Solaris Software weiter ausgef hrt w rde Deshalb wird die Solaris Software nicht ordnungsgem 132 Sun FireTM 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 beendet und in der Datei var adm messages werden keine Details zum RED State Exception Fehler aufgezeichnet CODE BEISPIEL 7 2 zeigt ein Beispiel f r einen RED State Exception Alarm der Systemkonsole CODE BEISPIEL7 2 RED State Exception Alarm Sun SFV440 a console login RED State Exception Error enable reg 0000 0001 00f0 001f ECCR 0000 0000 02f0 4c00 CPU 0000 0000 0000 0002 TL 0000 0000 0000 0005 TT 0000 0000 0000 001
135. ehlerisolierung bis hin zu einer bestimmten austauschbaren Hardwarekomponente m Systempr fung zur Aufdeckung versteckter hardware oder softwarebezogener Probleme m System berwachung zur Fr herkennung von Problemen bevor sie zu ungeplanten Ausfallzeiten f hren Nicht jedes Diagnosewerkzeug kann f r all diese unterschiedlichen Aufgaben optimal ausgerichtet sein An Stelle eines einzigen umfassenden Diagnosewerkzeugs bietet Sun daher eine Palette mit Werkzeugen an von denen jedes seine eigenen St rken und Einsatzgebiete hat Damit Sie sich ein Bild ber die Zusammenarbeit der einzelnen Werkzeuge machen k nnen m ssen Sie verstehen was beim Hochfahren des Servers also w hrend des Boot Prozesses geschieht Dies wird im n chsten Kapitel erl utert Kapitel 1 bersicht ber die Diagnosewerkzeuge 6 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 KAPITEL 2 Diagnosewerkzeuge und Boot Prozess In diesem Kapitel werden die Werkzeuge vorgestellt mit deren Hilfe Sie Fehler identifizieren und mit denen Sie die Systeme tiberwachen sowie tiberpriifen Au erdem wird erl utert wie die verschiedenen Werkzeuge zusammenarbeiten Folgende Themen werden behandelt ber Diagnose und Boot Prozess auf Seite 8 Lsolieren von Systemfehlern auf Seite 32 berwachen des Systems auf Seite 35 berpr fen des Systems auf Seite 39 Referenz f r die Bezeichnung der Speichermo
136. einer internen L fter Wenn diese LED ausgeschaltet ist erzeugt das Netzteil nicht gen gend Gleichstrom Ist diese LED ausgeschaltet wird das Netzteil entweder nicht von der Netzspannung erreicht oder das Netzteil erzeugt nicht gen gend 5 V Standby Strom Ersetzen Sie das Netzteil Entfernen Sie das Netzteil und bauen Sie sie wieder ein Wenn diese Ma nahme nicht den gew nschten Erfolg bringt ersetzen Sie das Netzteil berpr fen Sie das Netzkabel sowie die Steckdose an die es angeschlossen ist Tauschen Sie das Netzteil gegebenenfalls aus Kapitel 3 Identifizieren ausgefallener und fehlerhafter Komponenten 67 68 3 Kontrollieren Sie die LEDs f r die Plattenlaufwerke Die Laufwerk LEDs befinden sich hinter der linken Systemt r Unmittelbar rechts neben jedem Laufwerk befindet sich eine Gruppe mit jeweils drei LEDs Ihrem Status k nnen Sie die folgenden Informationen entnehmen LED Name Position Farbe Hinweis Ma nahme Ausbau OK Wenn diese LED leuchtet Entfernen Sie die Platte bei oben blau kann die Festplatte sicher Bedarf ausgebaut werden Wartung erforderlich Diese LED ist f r zuk nftige nicht zutreffend Mitte gelb Zwecke reserviert Aktiv Wenn diese LED leuchtet oder nicht zutreffend unten gr n blinkt arbeitet die Festplatte normal 4 berpr fen Sie die LED f r das DVD ROM Laufwerk Das DVD ROM Laufwerk verf gt ber eine Betrieb Aktivit ts LED die f
137. em Ausf hren dieser Befehle empfiehlt es sich daher das System zur ckzusetzen Kapitel 2 Diagnose und Boot Prozess 19 Bedeutung der Fehlermeldungen der OpenBoot Diagnostics OpenBoot Diagnostics Fehlermeldungen werden in tabellarischer Form mit einer kurzen bersicht ber das Problem das betroffene Hardwareger t den nicht bestandenen Untertest sowie weiteren Diagnoseinformationen ausgegeben CODE BEISPIEL 2 2 ist ein Beispiel f r eine Fehlermeldung der OpenBoot Diagnostics die ber den Ausfall des IDE Controllers informiert CODE BEISPIEL 2 2 Fehlermeldung der OpenBoot Diagnostics Testing pci le 600000 ide d ERROR IDE device did not reset busy bit not set DEVICE pci le 600000 ide d DEVICE pci le 600000 ide d ex MACHINE Sun Fire V440 SERIAL 51994289 DATE 10 17 2002 20 17 43 GMT CONTROLS diag level min test args Error pci le 600000 ide d selftest failed return code 1 Selftest at pci le 600000 ide d errors 1 n2eeeeeeeeeennnn failed I C Bus Geratetests Mit dem OpenBoot Diagnostics Test i2c 0 320 werden die Umgebungsiiberwachung sowie die an den I2C Bus des Sun Fire V440 Servers angeschlossenen Steuerungsger te berpr ft und eventuelle Fehler zur ckgegeben Die Fehler und Statusmeldungen des OpenBoot Diagnostics Tests i2c 0 320 enthalten die Hardware Adressen der I2C Bus Gerate Testing pci le 600000 isa 7 i2c 0 320 dimm spd 0 b6 Die P
138. em Recovery k nnen Sie das System so konfigurieren dass die firmwarebasierten Diagnosetests nach allen R cksetzereignissen ausgef hrt werden Diesbez gliche Anweisungen erhalten Sie unter Ausf hren umfassender Diagnosetests auf Seite 63 Zweite Stufe OpenBoot Diagnostics Tests Nach der Ausf hrung der POST Tests kennzeichnet POST den Status defekter Ger te mit FAILED und bergibt die Steuerung des Systems an die OpenBoot Firmware Die OpenBoot Firmware kompiliert eine hierarchische Liste aller Ger te des Systems Diese Auflistung wird als Ger tebaum bezeichnet Der Ger tebaum ist von System zu System unterschiedlich beinhaltet aber sowohl die integrierten Systemkomponenten als auch optionale PCI Bus Ger te Der Ger tebaum enth lt keine Komponenten die von den POST Tests mit FAILED gekennzeichnet wurden Kapitel 2 Diagnose und Boot Prozess 15 Nach der erfolgreichen Ausf hrung der POST Tests beginnt die OpenBoot Firmware mit den OpenBoot Diagnostics Tests Wie die POST Tests handelt es sich beim Code der OpenBoot Diagnostics um im Boot PROM residente Firmware Aufgabe der OpenBoot Diagnostics Tests Die OpenBoot Diagnostics Iests sind auf die System E A und die Peripherieger te ausgerichtet Jedes Ger t des Ger tebaums das ber einen IEEE 1275 kompatiblen Selbsttest verf gt wird unabh ngig vom Hersteller von den OpenBoot Diagnostics erfasst Auf einem Sun Fire V440 Server pr fen die OpenBoot Diag
139. en gehen Sie folgenderma en vor a Leiten Sie die Systemkonsole um indem Sie die OpenBoot Konfigurationsvariablen ndern Geben Sie an der Eingabeaufforderung ok die folgenden Befehle ein ok setenv input device ttyb ok setenv output device ttyb Hinweis Ein Zugriff auf die Eingabeaufforderung sc gt und die Anzeige von POST Meldungen sind nur ber die serielle Verwaltungsschnittstelle oder die Netzwerkverwaltungsschnittstelle m glich Hinweis Es gibt viele weitere OpenBoot Konfigurationsvariablen Obwohl sie keinen Einfluss darauf haben welches Hardwareger t f r den Zugriff auf die Systemkonsole verwendet wird bestimmen einige dieser Variablen welche Diagnosetests das System ausf hrt und welche Mitteilungen an der Konsole angezeigt werden Weitere Informationen finden Sie unter Steuerung des POST Tests auf Seite 13 b Damit die Anderungen wirksam werden schalten Sie das System aus Geben Sie Folgendes ein ok power off Das System speichert die ge nderten Parameter dauerhaft und schaltet sich ab Hinweis Sie k nnen das System auch mit dem Netzschalter auf der Vorderseite ausschalten c Verbinden Sie das Nullmodemkabel mit der ttyb Schnittstelle am Sun Fire V440 Server Verwenden Sie gegebenenfalls im Lieferumfang des Servers enthaltenen DB 9 oder DB 25 Kabeladapter 202 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 d Schalten S
140. en bevor Sie Korrekturma nahmen in Angriff nehmen POST beispielsweise sammelt ausgefallene Komponenten in einer Liste die auch nach R cksetzereignissen erhalten bleibt Nach dem Zur cksetzen eines Systems werden die Informationen ber ausgefallene Komponenten jedoch gel scht Ebenso geht der LED Status eines blockierten Systems beim Neustart oder Zur cksetzen des Systems verloren Wenn Sie auf Systemprobleme sto en die Sie noch nicht kennen sammeln Sie m glichst viele Informationen bevor Sie Abhilfema nahmen versuchen Die folgende Aufgabenliste stellt eine grundlegende Vorgehensweise bei der Sammlung von Informationen dar m Sammeln Sie m glichst viele Fehlerinformationen Fehleranzeigen und meldungen aus dem System Weitere Informationen ber Quellen f r Fehleranzeigen und meldungen finden Sie unter Fehlerinformationen des ALOM System Controllers auf Seite 129 Fehlerinformationen von Sun Management Center auf Seite 129 und Fehlerinformationen vom System auf Seite 129 m Sammeln Sie m glichst viele Informationen ber das System indem Sie die Betriebssystemumgebung die Firmware und die Hardwarekonfiguration des Systems einer Pr fung unterziehen Um Fehleranzeigen und meldungen genau analysieren zu k nnen m ssen Sie oder ein Sun Supporttechniker die Betriebssystemumgebung des Systems und die Patchversionen sowie die spezifische Hardwarekonfiguration kennen Siehe Aufzeichnen von Informationen be
141. en Details eines Fehlers beispielsweise die numerischen Werte der erwarteten und tats chlichen Ergebnisse als die daf r verantwortlichen FRUs Falls Sie der Fehlerursache damit nicht n her kommen hilft Ihnen vielleicht das in ABBILDUNG 2 2 dargestellte Blockdiagramm eines Datenpfads innerhalb eines Sun Fire V440 Servers weiter E A PCI CPU Bridge Ger t CPU Speicher Hauptplatine Modul ABBILDUNG 2 2 POST Tests ber mehrere FRUs Die gestrichelte Linie in ABBILDUNG 2 2 gibt eine Grenze zwischen FRUs an Angenommen in der CPU auf der linken Seite des Diagramms l uft ein POST Test ab Mit diesem Test wird versucht auf Register in einem PCI Ger t zuzugreifen das sich auf der rechten Seite des Diagramms befindet Schl gt dieser Zugriff fehl so liegt das entweder an einem defekten PCI Ger t oder was weniger wahrscheinlich ist an einem der mit dem PCI Ger t verbundenen Datenpfade oder Komponenten Der POST Test kann Ihnen nur sagen dass der Test fehlgeschlagen ist nicht aber warum Obwohl der POST Test also sehr pr zise Daten ber die Art des Testfehlers gibt k nnen in diesem Fall drei verschiedene FRUs daf r verantwortlich sein 12 Sun FireTM 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Steuerung des POST Tests Sie steuern den POST Test und andere Aspekte des Boot Prozesses durch die Einstellung der OpenBoot Konfigurationsvariablen auf der Systemkonfigurationskart
142. en Sie die Systeminformationen aus die angezeigt werden sollen Weitere Informationen zu diesem Thema finden Sie unter Befehle zur Abfrage von Solaris Systeminformationen auf Seite 24 2 Geben Sie den entsprechenden Befehl an der Eingabeaufforderung der Systemkonsole ein Siehe TABELLE 4 1 TABELLE 4 1 Verwenden von Befehlen zur Abfrage von Solaris Systeminformationen Befehl Anzeige Erforderliche Eingabe Anmerkung prtconf Informationen zur usr sbin prtconf Systemkonfiguration prtdiag Diagnose und usr platform Weitere Einzelheiten Konfigurationsinformationen uname i erhalten Sie mit der sbin prtdiag Option v prtfru FRU Hierarchie und SEEPROM usr sbin prtfru Mit der Option 1 zeigen Speicherinhalt Sie die Hierarchie an Mit der Option c zeigen Sie die SEEPROM Daten an psrinfo Datum und Uhrzeit der usr sbin psrinfo Mit der Option v rufen Sie Inbetriebnahme der einzelnen die Taktfrequenz sowie CPUs Prozessortaktfrequenz weitere Daten ab showrev Revisionsinformationen zu usr bin showrev Mit der Option p zeigen Hardware und Software Sie Software Patches an 100 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Verwenden von OpenBoot Informationsbefehlen Nachstehend erfahren Sie wie Sie OpenBoot Befehle ausf hren um verschiedene Systeminformationen ber einen Sun Fire V440 Server abzurufen N here Informationen zu diesen Befehlen finden Sie unter Weitere OpenBoot Befeh
143. en Sun Fire V440 Server finden Sie in CODE BEISPIEL 2 8 bis CODE BEISPIEL 2 13 Ausgabe des Befehls prtdiag v System Configuration Sun Microsystems sun4u Sun Fire V440 System clock frequency 177 MHZ Memory size 4GB JJ A CPUs eee ese ees s eee ss sees pees esse se secs ES CPU CPU Temperature Fan CPU Freq Size Impl Mask Die Ambient Speed Unit 0 1062 MHz 1MB US IIIi 2 3 u 1 1062 MHz 1MB US IIIi 2 3 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 IO Devices 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 Bus Freq Brd Type MHz Slot Name Model 0 pei 66 MB pcil08e abba network SUNW pci ce 0 pci 33 MB isa su serial 0 pei 33 MB isa su serial Memory Module Groups Kapitel 7 Beheben von Hardwareproblemen 137 CODE BEISPIEL7 5 Ausgabe des Befehls prtdiag v Fortsetzung 0 0 co P0 B0 D0 C0 P0 BO D1 0 1 C0 P0 B1 D0 C0 P0 B1 D1 1 0 C1 P0 B0 D0 C1 P0 B0 D1 1 1 C1 P0 B1 D0 C1 P0 B1 D1 OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 OBDIAG 4 10 3 2003 05 02 20 26 4 Uberpriifen Sie die LEDs des Systems 5 Pr fen Sie die Datei var adm messages Die folgenden Meldungen sind eindeutige Hinweise auf ausgefallene Komponenten m Warnmeldungen der Solaris Software tiber Hardware oder Softwarekomponenten m ALOM Umgebungsmeldungen ber eine ausgefallene Komponente etwa einen L fter oder ein Netzteil Gibt es keinen klaren Hinweis auf eine ausgefallene Komponente unt
144. ennen Jedes Kapitel enth lt entweder Beschreibungen oder Anleitungen aber nicht beides In den beschreibenden Kapiteln finden Sie die Hintergrundinformationen die Sie ben tigen um den Kontext der auszuf hrenden Aufgaben zu verstehen ber die Anleitungskapitel haben Sie raschen Zugriff auf schrittweise Anleitungen mit nur wenigen oder gar keinen Erl uterungen Die Kapitel im zweiten Teil dieses Buchs sowie im Anhang enthalten eine Mischung von Anleitungen und Beschreibungen xi Damit Sie die Informationen schnell finden k nnen sind die Themen des Kapitels auf der ersten Seite jedes Kapitels in einer Liste zusammengefasst Referenzmaterial erscheint je nach Bedarf am Ende jedes Kapitels Dieses Buch gliedert sich in zwei Teile Teil I befasst sich mit Diagnosewerkzeugen Kapitel 1 ein erl uterndes Kapitel gibt eine bersicht ber die f r den Sun Fire V440 Server verf gbaren Diagnosewerkzeuge Kapitel 2 ein erl uterndes Kapitel enth lt detaillierte Informationen ber die Verwendung und F higkeiten der verschiedenen Diagnosewerkzeuge und erl utert deren Zusammenhang Kapitel 3 ein Anleitungskapitel enth lt Anweisungen zur Identifizierung ausgefallener Komponenten Kapitel 4 ein Anleitungskapitel enth lt Anweisungen zur berwachung des Systems Kapitel 5 ein Anleitungskapitel enth lt Anweisungen zur berpr fung des Systems Teil II dieses Buchs befasst sich mit der Fehlerbehebung Kapitel 6 ein Besch
145. er Verbindung mit der seriellen Verwaltungsschnittstelle finden Sie unter Verwendung der seriellen Verwaltungsschnittstelle auf Seite 189 3 Geben Sie einen der folgenden Befehle ein Anhang A Konfigurieren der Systemkonsole 191 m Wenn in Ihrem Netzwerk statische IP Adressen verwendet werden geben Sie Folgendes ein sc gt setsc if_network true sc gt setsc netsc_ipaddr IP Adresse sc gt setsc netsc_ipnetmask IP Adresse sc gt setsc netsc_ipgateway IP Adresse Sie k nnen auch den Befehl setupsc verwenden m Wenn das Netzwerk mit DHCP arbeitet geben Sie Folgendes ein sc gt setsc netsc_dhcp 4 Um die Netzwerkeinstellungen zu berpr fen geben Sie Folgendes ein sc gt shownetwork 5 Melden Sie sich von der ALOM System Controller Sitzung ab N chste Schritte Um ber die Netzwerkverwaltungsschnittstelle eine Verbindung mit der Systemkonsole herzustellen verwenden Sie f r die in Schritt 3 oben angegebene IP Adresse den Befehl telnet Zugriff auf die Systemkonsole ber einen Terminalserver Vorbereitung Bei den folgenden Schritten wird vorausgesetzt dass Sie f r den Zugriff auf die Systemkonsole des Sun Fire V440 Servers einen Terminalserver mit der seriellen Verwaltungsschnittstelle SERIAL MGT des Sun Fire V440 Servers verbinden 192 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Auszuf hrende Arbeitsschritte 1 F hren Sie die ph
146. er listed by H W under test above 1 gt MSG ERROR miscompare on mem test Address 00000030 001b0040 Expected ffffffff fffffffe Observed fffffbff fffffff6 In diesem Fall wurde festgestellt dass das DIMM mit der Bezeichnung J0602 das der CPU 3 zugeordnet ist defekt ist Informationen tiber die verschiedenen Bezeichnungen von Arbeitsspeicherkomponenten in den Firmware Meldungen finden Sie unter Referenz f r die Bezeichnung der Speichermodule auf Seite 44 Was bedeuten die POST Fehlermeldungen Bei Nichtbestehen eines bestimmten POST Tests gibt der Test verschiedene Informationen tiber den Fehler aus m Welcher Test nicht bestanden wurde m Welche integrierte Schaltung bzw welche Komponente vermutlich defekt ist m Welche FRUs vermutlich ausgetauscht werden m ssen in der Reihenfolge der Wahrscheinlichkeit eines Ausfalls Hier ein weiterer Ausschnitt aus einer POST Ausgabe mit einer anderen Fehlermeldung CODE BEISPIEL2 1 POST Fehlermeldung 1 gt FEHLER TEST IO Bridge unit 0 PCI id test 1 gt H W under test Motherboard IO Bridge 0 CPU 1 gt Repair Instructions Replace items in order listed by H W under test above 1 gt MSG ERROR PCI Master Abort Detected for TOMATILLO 0 PCI BUS A DEVICE NUMBER 2 DEVICE NAME SCSI 1 gt END_ERROR 1 gt 1 gt ERROR TEST IO Bridge unit 0 PCI id test 1 gt H W under test Motherboard IO Bridge 0 CPU 1 gt MSG Test Failed 1 gt END_ERROR
147. erden Aktualisierungen der Firmware und Betriebssystemumgebung ben tigt um ein Problem zu diagnostizieren oder zu l sen Planen Sie regelm ige Aktualisierungen der Firmware und Software des Systems so dass Sie die Firmware und Software nicht zu einem ungelegenen Zeitpunkt aktualisieren m ssen Die neuesten Patches und Aktualisierungen f r den Sun Fire V440 Server finden Sie auf den Websites die unter Websites auf Seite 114 aufgelistet sind bersicht ber das Sun Install Check Tool Bei der Installation des Sun M Install Check Tools wird auch Sun Explorer Data Collector installiert Das Sun Install Check Tool verwendet Sun Explorer Data Collector mit dem Sie berpr fen k nnen ob der Sun Fire V440 Server optimal installiert wurde Mit Hilfe dieser Tools l sst sich das System auf folgende Punkte berpr fen Erforderliche Mindeststufe der Betriebssystemumgebung Vorhandensein wichtiger Patches Richtige Stufe der Systemfirmware Nicht unterst tzte Hardwarekomponenten Wenn das Sun Install Check Tool und Sun Explorer Data Collector potenzielle Probleme entdecken wird ein Bericht mit speziellen Anweisungen zur Beseitigung der Probleme erzeugt Das Sun Install Check Tool ist unter der folgenden Adresse erh ltlich http sunsolve sun com Klicken Sie auf dieser Website auf den Link zum Sun Install Check Tool Kapitel6 Optionen zur Fehlerbehebung 115 Siehe auch bersicht ber den Sun Explorer Data Collector au
148. ere Informationen tiber showfru und andere ALOM Befehle finden Sie unter berwachen des Systems mit Sun Advanced Lights Out Manager auf Seite 86 Der Befehl psrinfo Der Befehl psrinfo zeigt das Datum und die Uhrzeit an an dem die einzelnen CPUs online geschaltet wurden Mit der Option v zeigt der Befehl zus tzliche Informationen ber die CPUs einschlie lich der Taktgeschwindigkeit an Die folgende Beispielausgabe stammt von dem Befehl psrinfo mit der Option v 30 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 CODE BEISPIEL 2 16 Ausgabe des Befehls psrinfo v Status of processor 0 as of 04 11 03 12 03 45 Processor has been on line since 04 11 03 10 53 03 The sparcv9 processor operates at 1280 MHz and has a sparcv9 floating point processor Status of processor 1 as of 04 11 03 12 03 45 Processor has been on line since 04 11 03 10 53 05 The sparcv9 processor operates at 1280 MHz and has a sparcv9 floating point processor Der Befehl showrev Mit dem Befehl showrev werden die Versionen der aktuellen Hardware und Softwarekomponenten angezeigt CODE BEISPIEL 2 17 ist eine Beispielausgabe des Befehls showrev CODE BEISPIEL 2 17 Ausgabe des Befehls showrev Hostname wgs94 111 Hostid 83195 01 Release 5 8 Kernel architecture sun4u Application architecture sparc Hardware provider Sun Microsystems Domain Ecd East Sun COM Kernel version SunOS 5 8 chalupa28_11 12 03 02
149. erf gung Diese M glichkeiten sind aufgef hrt in der empfohlenen Reihenfolge m Ordnungsgem es Herunterfahren der Solaris Betriebssystemumgebung m ALOM System Controller Befehl break oder console m Tastenfolge L1 A Stop A oder Unterbrechungstaste m Externally Initiated Reset XIR m Manuelles Zur cksetzen des Systems Eine Beschreibung der einzelnen Methoden folgt im Anschluss Diesbez gliche Anweisungen erhalten Sie unter Wechseln zur Eingabeaufforderung ok auf Seite 188 Ordnungsgem es Herunterfahren Die bevorzugte Methode f r den Zugriff auf die Eingabeaufforderung ok besteht im Herunterfahren der Betriebssystemumgebung durch die Eingabe eines entsprechenden Befehls z B shutdown init oder uadmin Eine Beschreibung der in Frage kommenden Befehle finden Sie in der Systemverwaltungsdokumentation von Solaris Mit dem Netzschalter des Systems k nnen Sie ebenfalls ein ordnungsgem es Herunterfahren des Systems ausl sen Das ordnungsgem e Herunterfahren des Systems beugt Datenverlust vor gibt Ihnen Gelegenheit die Benutzer vorab zu informieren und verursacht nur eine minimale Unterbrechung In der Regel steht einem ordnungsgem en Herunterfahren nichts entgegen vorausgesetzt die Betriebssystemumgebung Solaris wird ausgef hrt und die Hardware weist keinen schwerwiegenden Ausfall auf An der Eingabeaufforderung des ALOM System Controllers k nnen Sie das System ebenfalls ordnungsgem herunterfahren
150. ernet Controllers Bezieht sich auf die Systemkonfigurationskarte SCC Abkiirzung fiir OpenBoot Firmware Physische Schnittstelle Teil des Ethernet Controllers Power On Self Test Einschaltselbsttest Real Time Clock Echtzeituhr Receive Kommunikationsprotokoll Eine IEEE 1149 1 Standard Methode zur berwachung und nderung des Inhalts von ASICs und Systemkomponenten Integrierte Schaltung die u a den ALOM UART Anschluss steuert Systembus zur integrierten Schaltung der PCI Bridge Transmit Kommunikationsprotokoll Hauptplatine Hauptplatine nicht zutreffend Hauptplatine Hauptplatine Systemkonfigurationskarte nicht zutreffend Hauptplatine nicht zutreffend Hauptplatine Hauptplatine nicht zutreffend Hauptplatine Hauptplatine Hauptplatine Universal Asynchronous Receiver Transmitter Hauptplatine ALOM Karte Hardware am seriellen Anschluss Update ended Interrupt Enable eine Funktion der Echtzeituhr Ein byte weiter Bus f r langsame Ger te Hauptplatine Hauptplatine Kapitel 2 Diagnose und Boot Prozess 53 54 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 KAPITEL 3 Identifizieren ausgefallener und fehlerhafter Komponenten Die wichtigste Aufgabe von Diagnosewerkzeugen besteht in der Identifizierung ausgefallener und fehlerhafter Hardwarekomponenten damit sie schnell entfernt und ersetzt werden k nnen Die zahlreichen Fehlerzust
151. ersuchen Sie die installierten Anwendungen das Netzwerk oder die Laufwerkskonfiguration N chste Schritte Gibt es klare Hinweise darauf dass eine Komponente ausgefallen ist oder ausf llt ersetzen Sie sie so schnell wie m glich Handelt es sich bei dem Problem um den best tigten Ausfall einer Umgebungskomponente ersetzen Sie den L fter oder das Netzteil so schnell wie m glich Ein System mit redundanter Konfiguration ist zwar weiterhin eingeschr nkt funktionsf hig die Stabilit t und Leistung des Systems sind jedoch beeintr chtigt Da das System noch funktionsf hig ist versuchen Sie den Fehler mit verschiedenen 138 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Verfahren und Werkzeugen zu identifizieren Auf diese Weise stellen Sie sicher dass das Teil das nach Ihrer Vermutung defekt ist wirklich die Ursache f r das aufgetretene Problem ist Siehe m Isolieren von Systemfehlern auf Seite 32 Informationen zur Installation und zum Austauschen von FRUs finden Sie im m Sun Fire V440 Server Parts Installation and Removal Guide Fehlerbehebung in einem System nach einem unerwarteten Neustart Vorbereitung Melden Sie sich beim System Controller an um zur Eingabeaufforderung sc gt zu gelangen Weitere Informationen finden Sie unter m Die Eingabeaufforderung sc gt auf Seite 180 Hierbei wird vorausgesetzt dass die Systemkonsole standardm ig konfiguriert ist so das
152. erwendung bei Fehlerbehebung in blockiertem System 170 probe ide Befehl OpenBoot 22 184 probe scsi und probe scsi all Befehle OpenBoot 21 184 Protokolldateien 24 37 Prozessor siehe CPU Prozessorgeschwindigkeit anzeigen 30 prtconf Befehl Solaris 24 prtdiag v Befehl Solaris definiert 25 Verwendung bei Behebung von Fatal Reset Fehlern und RED State Exceptions 158 216 Verwendung bei Fehlerbehebung 129 Verwendung bei Fehlerbehebung bei reagierendem Betriebssystem 137 Verwendung bei Fehlerbehebung nach unerwartetem Neustart 146 prtfru Befehl Solaris 29 Priifen des Systems mit der Hardware Diagnostic Suite 43 mit SunVTS 41 104 ps ef Befehl Solaris Verwendung bei Behebung von Fatal Reset Fehlern und RED State Exceptions 159 Verwendung bei Fehlerbehebung in blockiertem System 168 Verwendung bei Fehlerbehebung nach unerwartetem Neustart 147 psrinfo Befehl Solaris 30 R raidct1 Befehl Solaris Verwendung bei Fehlerbehebung nach unerwartetem Neustart 150 RED State Exceptions Fehlerbehebung 151 Reaktion 132 Reparaturabteilung POST Fahigkeiten und 12 reset x Befehl System Controller 184 reset all Befehl OpenBoot 209 Reset Ereignisse Typen 14 S savecore Verzeichnis 125 sc gt Eingabeaufforderung Zugriffsm glichkeiten 181 Zusammenhang mit der Eingabeaufforderung ok 186 SCC siehe Systemkonfigurationskarte SCC Leseger t siehe Leseger t f r Systemkonfigura
153. es i2c 1f 464000 idprom 0 50 Dritte Stufe Die Betriebssystemumgebung Wenn ein System die OpenBoot Diagnostics besteht versucht es normalerweise seine Multiuser Betriebssystemumgebung zu starten F r die meisten Sun Systeme bedeutet dies die Solaris Betriebssystemumgebung Sobald der Server im Mehrbenutzermodus l uft haben Sie Zugriff auf softwarebasierte Diagnosewerkzeuge wie SunVTS und Sun Management Center Diese Werkzeuge bieten Ihnen zus tzliche berwachungs Pr f und Fehlerisolierungsm glichkeiten Hinweis Wenn Sie die OpenBoot Konfigurationsvariable auto boot auf false setzen wird die Betriebssystemumgebung nach Beendigung der firmwarebasierten Tests nicht gestartet Neben den offiziellen Werkzeugen die ber der Betriebssystemumgebungssoftware von Solaris laufen stehen Ihnen weitere Ressourcen zur Verf gung mit denen Sie den Zustand eines Sun Fire V440 Servers feststellen oder berwachen k nnen Hierzu geh ren die folgenden Ressourcen m Protokolldateien f r Fehler und Systemmeldungen m Befehle zur Abfrage von Solaris Systeminformationen Kapitel 2 Diagnose und Boot Prozess 23 Protokolldateien f r Fehler und Systemmeldungen Fehler und andere Systemmeldungen werden in der Datei var adm messages gespeichert Die in diese Datei geschriebenen Meldungen stammen von mehreren Systemkomponenten wie dem Betriebssystem der Umgebungs berwachung und verschiedenen Softwareanwendungen Bei
154. ests auf Seite 20 TABELLE 2 14 P C Bus Ger te auf einem Sun Fire V440 Server Adresse Zugeh rige FRU Funktion des Ger ts clock generator 0 d2 cpu fru prom 0 de dimm spd 0 d6 dimm spd 0 d8 dimm spd 0 da dimm spd 0 dc cpu fru prom 0 ce dimm spd 0 c6 dimm spd 0 c8 dimm spd 0 ca dimm spd 0 cc scsi fru prom 0 a8 rmc fru prom 0 a6 power supply fru prom 0 a4 Hauptplatine CPU 2 CPU Speichermodul 2 DIMM 0 CPU Speichermodul 2 DIMM 1 CPU Speichermodul 2 DIMM 2 CPU Speichermodul 2 DIMM 3 CPU 1 CPU Speichermodul 1 DIMM 0 CPU Speichermodul 1 DIMM 1 CPU Speichermodul 1 DIMM 2 CPU Speichermodul 1 DIMM 3 SCSI R ckwandplatine ALOM Karte Netzteil Steuert die Taktfrequenz des PCI Busses Enth lt Informationen zur FRU Konfiguration Enth lt Informationen zur FRU Konfiguration Enth lt Informationen zur F RU Konfiguration Enth lt Informationen zur FRU Konfiguration Enth lt Informationen zur FRU Konfiguration Enth lt Informationen zur FRU Konfiguration Enth lt Informationen zur FRU Konfiguration Enth lt Informationen zur FRU Konfiguration Enth lt Informationen zur FRU Konfiguration Enth lt Informationen zur FRU Konfiguration Enth lt Informationen zur FRU Konfiguration Enth lt Informationen zur FRU Konfiguration
155. etests beim Einschalten automatisch ausgef hrt werden m Die Hardware ist funktionsf hig und zu einem Start in der Lage der Start wird jedoch durch eine fehlerhafte oder inkompatible Firmware verhindert Auszuf hrende Arbeitsschritte 1 Melden Sie sich beim ALOM System Controller an um zur Eingabeaufforderung sc zu gelangen 2 Geben Sie Folgendes ein sc gt bootmode skip diag Mit diesem Befehl wird das System vor bergehend so konfiguriert dass die firmwarebasierten Diagnosetests unabh ngig von der Einstellung der OpenBoot Konfigurationsvariablen bergangen werden 3 Schalten Sie das System innerhalb von 10 Minuten aus und wieder ein Geben Sie Folgendes ein sc gt poweroff Are you sure you want to power off the system y n y sc gt poweron Sie m ssen die oben angegebenen Befehle bei Verwendung von ALOM innerhalb von 10 Minuten ausf hren um den Boot Modus zu ndern Zehn Minuten nach der Eingabe des ALOM Befehls bootmode wird der standardm ige Boot Modus des 62 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 Systems wiederhergestellt Dieser wird durch die aktuellen Einstellungen der OpenBoot Konfigurationsvariablen diag switch post trigger und obdiag trigger bestimmt Weitere Informationen ber die OpenBoot Konfigurationsvariablen und deren Einfluss auf die Diagnose finden Sie unter Steuerung des POST Tests auf Seite 13 N chste Schritte Wenn S
156. etriebssystemumgebung angehalten wird m Bei einem Absturz der Betriebssystemumgebung wird das System wieder von der OpenBoot Firmware gesteuert m Wenn w hrend des Boot Prozesses ein ernstes Hardwareproblem aufgetreten ist das die Ausf hrung der Betriebssystemumgebung verhindert bernimmt die OpenBoot Firmware wieder die Steuerung des Systems Kommt es w hrend des Systembetriebs zu einem ernsten Hardwareproblem wechselt die Betriebssystemumgebung bergangslos zur Betriebsebene 0 m Sie lassen den Server bewusst von der Firmware steuern um firmwarebasierte Befehle oder Diagnosetests auszuf hren Das letzte der oben beschriebenen Szenarien betrifft Sie als Systemverwalter am h ufigsten da es Situationen geben wird in denen Sie zur Eingabeaufforderung ok gelangen m ssen Eine Beschreibung der verschiedenen M glichkeiten die Ihnen in diesem Zusammenhang zur Verf gung stehen finden Sie unter M glichkeiten f r den Zugriff auf die Eingabeaufforderung ok auf Seite 183 Ausf hrliche Informationen zu diesem Thema finden Sie unter Wechseln zur Eingabeaufforderung ok auf Seite 188 182 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 M glichkeiten f r den Zugriff auf die Eingabeaufforderung ok Je nach Zustand des Systems und abh ngig von den Mitteln mit denen Sie auf die Systemkonsole zugreifen stehen Ihnen verschiedene M glichkeiten f r den Zugriff auf die Eingabeaufforderung ok zur V
157. f hrung der OpenBoot Diagnostics Tests an ok show obdiag results Sie sollten nun eine systemabh ngige Liste der Hardwarekomponenten sehen der Sie entnehmen k nnen welche Bauteile die POST bzw OpenBoot Diagnostics Tests bestanden haben und welche nicht 74 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 Referenz f r die Auswahl eines Werkzeugs zur Fehleridentifizierung Die nachstehenden Informationen helfen Ihnen das richtige Werkzeug auszuw hlen um eine fehlerhafte oder ausgefallene Komponente in einem Sun Fire V440 Server zu ermitteln Stellen Sie sich die folgenden Fragen bei der Wahl eines Werkzeugs 1 Haben Sie die LEDs kontrolliert Bestimmte Systemkomponenten verf gen ber integrierte LEDs die Sie darauf aufmerksam machen dass das betreffende Bauteil ersetzt werden muss Ausf hrliche Informationen zu diesem Thema finden Sie unter Identifizieren von Fehlern mit Hilfe von LEDs auf Seite 65 2 F hrt das System hoch m Wenn das System nicht hochf hrt m ssen Sie betriebssystemunabh ngige firmwarebasierte Diagnosetests ausf hren m Wenn das System in der Lage ist zu booten sollten Sie ein Werkzeug verwenden das umfangreichere Tests durchf hrt Ein typischer Vorgang der Fehleridentifizierung ist in ABBILDUNG 3 1 dargestellt ies Beabsichtigen Sie die Tests von einem entfernten Standort auszuf hren Sowohl die Software Sun Management Center als a
158. f Fatal Reset Fehler und RED State Exceptions auf Seite 132 Ein Beispiel f r eine Fatal Reset Fehlermeldung finden Sie unter CODE BEISPIEL 7 1 Ein Beispiel f r eine RED State Exception Meldung finden Sie unter CODE BEISPIEL 7 2 Auszuf hrende Arbeitsschritte Pr fen Sie das ALOM Ereignisprotokoll Geben Sie Folgendes ein sc gt showlogs Das ALOM Ereignisprotokoll enth lt Systemereignisse wie R cksetzereignisse und nderungen des LED Status die seit dem letzten Systemstart aufgetreten sind CODE BEISPIEL 7 19 zeigt ein Beispiel f r ein Ereignisprotokoll aus dem hervorgeht dass die auf der Vorderseite befindliche LED Wartung erforderlich leuchtet Ausgabe des Befehls showlogs 09 09 09 09 09 16 16 16 16 16 54 54 56 56 584 27 Sun SFV440 a 00060003 SC System booted 27 Sun SFV440 a 00040029 Host system has shut down 35 Sun SFV440 a 00060000 SC Login User admin Logged on 54 Sun SFV440 a 00060000 SC Login User admin Logged on 11 Sun SFV440 a 00040001 SC Request to Power On Host Kapitel7 Beheben von Hardwareproblemen 151 CODE BEISPIEL 7 19 Ausgabe des Befehls showlogs Fortsetzung MAY 09 16 58 11 Sun SFV440 a 00040002 Host System has Reset MAY 09 16 58 13 Sun SFV440 a 0004000b Host System has read and cleared bootmode MAY 09 16 58 13 Sun SFV440 a 0004004f Indicator PSO POK is now ON M
159. f Seite 116 bersicht ber den Sun Explorer Data Collector Sun Explorer Data Collector ist ein Tool zur Erfassung von Systemdaten das von Sun Supporttechnikern gelegentlich zur Behebung von Fehlern in Sun SPARC und x86 Systemen verwendet wird In bestimmten F llen werden Sie von Sun Supporttechnikern unter Umst nden aufgefordert dieses Tool zu installieren und auszuf hren Wenn Sie bei der Erstinstallation das Sun Install Check Tool installiert haben wurde auch Sun Explorer Data Collector installiert Falls Sie das Sun Install Check Tool nicht installiert haben k nnen Sie Sun Explorer Data Collector sp ter ohne das Sun Install Check Tool installieren Wenn Sie dieses Tool bei der Ersteinrichtung des Systems installieren m ssen Sie es nicht zu einem sp teren und dann h ufig ung nstigen Zeitpunkt installieren Das Sun Install Check Tool zusammen mit Sun Explorer Data Collector und Sun Explorer Data Collector eigenst ndige Version erhalten Sie unter http sunsolve sun com Klicken Sie auf dieser Website auf den entsprechenden Link bersicht ber Sun Remote Services Net Connect Sun Remote Services SRS Net Connect ist eine Sammlung von Systemverwaltungsdiensten die Sie bei der Steuerung der Datenverarbeitungsumgebung unterst tzen Mit Hilfe dieser ber das Web bereitgestellten Dienste k nnen Sie Systeme berwachen Leistungs und Trendberichte erstellen und automatische Benachrichtigungen ber Systemere
160. f Seite 41 Eine weitere Voraussetzung ist dass der Sun Fire V440 Server keinen Monitor besitzt mit dem Bitmap Grafiken angezeigt werden k nnen In diesem Fall greifen Sie auf die SunVTS GUI zu indem Sie sich ber ein entferntes System mit Grafikbildschirm anmelden Und schlie lich erfahren Sie wie Sie die SunVTS Tests im Allgemeinen ausf hren Einzelne Tests setzen unter Umst nden bestimmte Hardwarekomponenten voraus oder ben tigen spezielle Treiber Kabel oder Loopback Anschl sse Informationen zu den Testoptionen und voraussetzungen finden Sie im m SunVTS Test Reference Manual m SunVTS Documentation Supplement 104 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Auszuf hrende Arbeitsschritte Melden Sie sich als Superuser an einem System mit Grafikanzeige an Grafikkarte und Monitor dieses Systems sollten in der Lage sein die Bitmap Grafiken der SunVTS GUI anzuzeigen Aktivieren Sie die Fernanzeige Geben Sie an dem System mit Grafikanzeige die folgende Zeile ein usr openwin bin xhost Testsystem Ersetzen Sie Testsystem durch den Namen des Sun Fire V440 Servers der getestet werden soll Melden Sie sich ber ein entferntes System als Superuser am Sun Fire V440 Server an Verwenden Sie dazu beispielsweise den Befehl rlogin oder telnet Starten Sie die SunVTS Software Geben Sie Folgendes ein opt SUNWvts bin sunvts display System mit Anzeige 0
161. fnen Sie den ALOM System Controller und geben Sie Folgendes ein ok sc gt Geben Sie an der Eingabeaufforderung ok gt Folgendes ein sc gt poweron sc gt console ok Das System f hrt die POST Diagnoseroutinen aus und zeigt Status sowie Fehlermeldungen auf dem lokalen seriellen Terminal an 70 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Hinweis Wenn Sie die Eingabeaufforderung sc gt nicht verlassen sehen Sie die POST Ausgabe nicht Kehren Sie zur Eingabeaufforderung ok zur ck indem Sie den Befehl console wie oben beschrieben eingeben berpr fen Sie die POST Ausgabe Jede POST Fehlermeldung enth lt einen Hinweis auf die FRU die am wahrscheinlichsten f r das Problem verantwortlich ist Gelegentlich k nnen auch mehrere Ursachen in Frage kommen In einem solchen Fall werden die M glichkeiten in der Reihenfolge ihrer Wahrscheinlichkeit aufgelistet Hinweis Sollte die POST Ausgabe Codenamen und Akronyme enthalten die Ihnen unbekannt sind siehe TABELLE 2 15 unter Referenz der in der Diagnoseausgabe verwendeten Begriffe auf Seite 52 N chste Schritte Versuchen Sie die von den POST Fehlermeldungen angegebene n FRU bzw FRUs zu ersetzen Ausf hrliche Informationen zu diesem Thema finden Sie unter m Sun Fire V440 Server Parts Installation and Removal Guide Wenn im Rahmen der POST Diagnoseroutinen keine Probleme erkannt wurden Ihr System abe
162. g Sie k nnen den LED Status direkt von der Vorder bzw R ckseite des Systems ablesen Der Status bestimmter LEDs kann auch mit der Befehlszeilenschnittstelle des ALOM System Controllers angezeigt werden Hinweis Die meisten LEDs auf der Vorderseite finden sich auf der R ckseite des Ger ts wieder Mit der Software Sun Management Center k nnen Sie den LED Status auch an einem entfernten Standort anzeigen wenn Sie diese Werkzeuge vorab einrichten N here Einzelheiten zur Einrichtung der Software Sun Management Center finden Sie unter m Sun Management Center Software User s Guide Kapitel3 Identifizieren ausgefallener und fehlerhafter Komponenten 65 Auszuf hrende Arbeitsschritte 1 berpr fen Sie die LEDs des Systems Die drei LEDs in der oberen linken Ecke auf der Vorderseite finden sich auch auf der R ckseite des Ger ts wieder Ihrem Status k nnen Sie die folgenden Informationen entnehmen LED Name Position Farbe Hinweis Ma nahme Locator links wei Wartung erforderlich Mitte gelb Systemaktivit t rechts gr n Der Systemverwalter kann diese LED einschalten um ein System zu kennzeichnen das beobachtet werden muss Wenn diese LED leuchtet hat die Hardware oder Software ein Systemproblem erkannt Wenn diese LED blinkt befindet sich das Betriebssystem im Boot Prozess Ist die LED aus hat das Betriebssystem angehalten Bestimmen eines bestimmten Systems un
163. gen Sie den Systemsteuerungsschalter des Servers in die Position Diagnose Damit wird das System gezwungen beim Start die POST und OpenBoot Diagnostics Tests auszuf hren b Dr cken Sie f r f nf Sekunden den Netzschalter des Systems Dies bewirkt ein sofortiges Herunterfahren der Hardware c Warten Sie mindestens 30 Sekunden Schalten Sie das System danach mit dem Netzschalter wieder ein Hinweis Sie k nnen auch den ALOM System Controller verwenden um die Stufe der POST und OpenBoot Diagnostics Iests festzulegen und das System auszuschalten sowie neu zu starten Informationen hierzu finden Sie in der Sun Advanced Lights Out Manager ALOM Online Help 170 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 7 Verwenden Sie die POST und OpenBoot Diagnostics Tests zur Erkennung von Systemproblemen Wenn das System die Startsequenz beginnt werden die POST und OpenBoot Diagnostics Tests ausgef hrt Siehe Identifizieren von Fehlern mit Hilfe von POST Tests auf Seite 69 und Identifizieren von Fehlern anhand der interaktiven OpenBoot Diagnostics Tests auf Seite 71 8 Pr fen Sie den Inhalt der Datei var adm messages Suchen Sie nach den folgenden Informationen tiber den Systemstatus m Gro e L cken in den Zeitstempeln der Solaris Software oder der Anwendungsmeldungen m Warnmeldungen tiber Hardware oder Softwarekomponenten m Informationen ber die letzten root Anmeldunge
164. ger t bezeichnet Bei einem Systemspeicherauszug speichert das System den Inhalt des Kernelspeichers im Auszugsger t Der Inhalt des Auszugs wird w hrend des Auszugsprozesses in einem Verh ltnis von 3 1 komprimiert Wenn das System also beispielsweise 6 GB Kernelspeicher belegt hat die Auszugsdatei eine Gr e von etwa 2 GB Bei einem typischen System sollte die Kapazit t des Auszugsger ts mindestens ein Drittel der Gr e des Systemhauptspeichers betragen Anweisungen zur Berechnung der Gr e des verf gbaren Auslagerungsbereichs finden Sie unter Aktivieren des Speicherauszugsprozesses auf Seite 121 Aktivieren des Speicherauszugsprozesses Diese Aufgabe wird in der Regel direkt vor dem Eingliedern eines Systems in die Produktionsumgebung ausgef hrt Vorbereitung ffnen Sie die Systemkonsole Siehe a bersicht ber die Kommunikation mit dem System auf Seite 174 Kapitel6 Optionen zur Fehlerbehebung 121 Auszuf hrende Arbeitsschritte 1 berpr fen Sie ob der Speicherauszugsprozess aktiviert ist Wenn Sie sich als root angemeldet haben geben Sie den Befehl dumpadnm ein dumpadm Dump content kernel pages Dump device dev dsk c0Ot0d0sl1 swap Savecore directory var crash machinename Savecore enabled yes In der Betriebssystemumgebung Solaris 8 ist der Speicherauszugsprozess standardm ig aktiviert 2 berpr fen Sie ob der Auslagerungsbereich f r den Speicherauszug gr
165. glichkeiten Fortsetzung W hrend der Nach der Ger te f r den Zugriff auf die Systemkonsole Installation Installation Eine tip Verbindung mit der seriellen Verwaltungsschnittstelle v v SERIAL MGT oder ttyb Informationen hierzu finden Sie in den folgenden Abschnitten e Verwendung der seriellen Verwaltungsschnittstelle auf Seite 189 e Zugriff auf die Systemkonsole ber eine tip Verbindung auf Seite 196 e ndern der Datei etc remote auf Seite 199 e Pr fen der Einstellungen der seriellen Schnittstellen f r ttyb auf Seite 203 e Referenz f r die Einstellungen der OpenBoot Konfigurationsvariablen der Systemkonsole auf Seite 209 Eine Ethernet Verbindung mit der v Netzwerkverwaltungsschnittstelle NET MGT Informationen hierzu finden Sie in den folgenden Abschnitten e Aktivieren der Netzwerkverwaltungsschnittstelle auf Seite 191 Ein lokaler Grafikbildschirm Grafikkarte Grafikmonitor Maus v usw Informationen hierzu finden Sie in den folgenden Abschnitten e Zugriff auf die Systemkonsole ber einen lokalen Grafikmonitor auf Seite 205 e Referenz f r die Einstellungen der OpenBoot Konfigurationsvariablen der Systemkonsole auf Seite 209 Nach der erstmaligen Systeminstallation k nnen Sie die Systemkonsole umleiten so dass sie die Eingabe der seriellen Schnittstelle ttyb empf ngt und ihre Ausgabe an diese Schnittstelle sendet
166. h Warnungen f r Systemereignisse wie zu hohe Temperaturen Ausfall von Netzteilen oder L ftern Systemr cksetzungen zu aktivieren und sich bei Auftreten dieser Ereignisse benachrichtigen zu lassen Die Warnungen k nnen ber Symbole der grafischen Benutzeroberfl che der Software oder per E Mail gemeldet werden wenn ein Problem auftritt berwachen des Systems mit Sun Advanced Lights Out Manager Sun Advanced Lights Out Manager ALOM erm glicht die berwachung und Steuerung des Servers ber eine serielle Schnittstelle oder eine Netzwerkschnittstelle Der ALOM System Controller verf gt ber eine Befehlszeilenschnittstelle ber die Sie den Server von entfernten Standorten aus verwalten k nnen Dies kann besonders hilfreich sein wenn die Server weit voneinander entfernt oder nicht zug nglich sind Mit ALOM k nnen Sie zudem von einem entfernten Standort auf die Systemkonsole zugreifen und bestimmte Diagnosen z B POST ausf hren f r die anderenfalls die physikalische Erreichbarkeit der seriellen Serverschnittstelle erforderlich w re Hardwarefehler oder andere Serverereignisse kann ALOM dann per E Mail melden Der ALOM System Controller l uft autonom und verwendet die Standby Stromversorgung des Servers Deshalb arbeiten die ALOM Firmware und Software auch weiter wenn das Betriebssystem des Servers nicht am Netz ist oder wenn die Stromversorgung des Servers selbst ausgeschaltet ist ALOM erm glicht die berwachung fo
167. h direkt beim ALOM System Controller anmelden Siehe Aktivieren der Netzwerkverwaltungsschnittstelle auf Seite 191 Anhang A Konfigurieren der Systemkonsole 181 Die Eingabeaufforderung ok Ein Sun Fire V440 Server auf dem die Betriebssystemumgebung Solaris installiert ist kann auf unterschiedlichen Betriebsebenen arbeiten Es folgt eine bersicht ber die Betriebsebenen Eine ausf hrliche Beschreibung finden Sie in der Systemverwaltungsdokumentation von Solaris In den meisten F llen arbeitet ein Sun Fire V440 Server auf den Betriebsebenen 2 oder 3 bei denen es sich um Mehrbenutzermodi mit Zugriff auf alle System und Netzwerkressourcen handelt Gelegentlich wird das System auch auf der Betriebsebene 1 ausgef hrt d h im Einzelbenutzerverwaltungsmodus Die niedrigste Ebene ist jedoch die Betriebsebene 0 In diesem Modus kann das System sicher abgeschaltet werden Wenn ein Sun Fire V440 Server auf Betriebsebene 0 arbeitet wird die Eingabeaufforderung ok angezeigt Diese Eingabeaufforderung gibt an dass die OpenBoot Firmware das System steuert F r diesen Fall gibt es zahlreiche Szenarien m Standardm ig bernimmt die OpenBoot Firmware die Steuerung des Systems vor der Installation der Betriebssystemumgebung m Das System wird mit der Eingabeaufforderung ok gestartet wenn die OpenBoot Konfigurationsvariable auto boot auf false gesetzt ist m Das System wechselt ordnungsgem zur Betriebsebene 0 wenn die B
168. h zur Fehlersuche und behebung geben Hinweise zur Vermeidung und Beseitigung von Problemen die auf Grund von Hardwaredefekten auftreten k nnen Hintergrundinformationen ber Diagnosewerkzeuge sowie detaillierte Anweisungen zum Einsatz dieser Werkzeuge finden Sie in den Kapiteln in Teil I Diagnose Der zweite Teil des vorliegenden Handbuchs enthalt die folgenden Kapitel m Kapitel 6 Fehlerbehebungsoptionen m Kapitel 7 Optionen zur Fehlerbehebung KAPITEL 6 Fehlerbehebungsoptionen Bei der Einrichtung und Konfiguration des Sun Fire V440 Servers k nnen Sie verschiedene Fehlerbehebungsoptionen implementieren Wenn Sie bereits bei der Einrichtung des Systems die Fehlerbehebung ber cksichtigen k nnen Sie beim Auftreten von Problemen im System Zeit sparen und Betriebsunterbrechungen minimieren Im Rahmen dieser Erl uterungen werden die folgenden Themen behandelt m Aktivieren des Speicherauszugsprozesses auf Seite 121 m Testen der Speicherauszugskonfiguration auf Seite 124 Au erdem enth lt das Kapitel noch die folgenden Informationen a bersicht ber aktualisierte Fehlerbehebungsinformationen auf Seite 113 a bersicht ber die Verwaltung von Firmware und Softwarepatches auf Seite 115 m bersicht ber das Sun Install Check Tool auf Seite 115 sm bersicht ber den Sun Explorer Data Collector auf Seite 116 m bersicht ber die Konfiguration des Systems f r die Fehler
169. hebung Juli 2003 Betriebssystemumgebung in der Systemkonsole protokolliert wurden CODE BEISPIEL 7 7 zeigt ein Beispiel f r die Ausgabe des Befehls consolehistory run v CODE BEISPIEL7 7 Ausgabe des Befehls consolehistory run v May 9 14 48 22 Sun SFV440 a rmclomv SC Login User admin Logged on init 0 INIT New run level 0 The system is coming down Please wait System services are now being stopped Print services stopped May 9 14 49 18 Sun SFV440 a last message repeated 1 time May 9 14 49 38 Sun SFV440 a syslogd going down on signal 15 The system is down syncing file systems done Program terminated 1 ok boot disk Sun Fire V440 No Keyboard Copyright 1998 2003 Sun Microsystems Inc All rights reserved OpenBoot 4 10 3 4096 MB memory installed Serial 53005571 Ethernet address 0 3 ba 28 cd 3 Host ID 8328cd03 Initializing 1MB of memory at addr 123fecc000 Initializing 1MB of memory at addr 123fe02000 Initializing 14MB of memory at addr 123 002000 Initializing 16MB of memory at addr 123e002000 Initializing 992MB of memory at addr 1200000000 Initializing 1024MB of memory at addr 1000000000 Initializing 1024MB of memory at addr 200000000 Initializing 1024MB of memory at addr 0 Rebooting with command boot disk Boot device pci 1f 700000 scsi 2 disk 0 0 File and args SunOS Release 5 8 Version Generic_114696 04 64 bit Copyright 1983 2003 Sun Microsystems Inc
170. hren Sie gegebenenfalls mit der Installation bzw Diagnose fort Wenn Sie die Systemkonsole wieder zu der seriellen Verwaltungsschnittstelle und der Netzwerkverwaltungsschnittstelle umleiten m chten lesen Sie den folgenden Abschnitt m Referenz f r die Einstellungen der OpenBoot Konfigurationsvariablen der Systemkonsole auf Seite 209 Referenz f r die Einstellungen der OpenBoot Konfigurationsvariablen der Systemkonsole Die Sun Fire V440 Systemkonsole wird standardm ig zur seriellen Verwaltungsschnittstelle und Netzwerkverwaltungsschnittstelle SERIAL MGT und NET MGT geleitet Sie k nnen die Systemkonsole jedoch zur seriellen DB 9 Schnittstelle ttyb oder zu einem lokalen Grafikmonitor einer Tastatur und Maus umleiten Es ist auch m glich die Systemkonsole wieder zu der seriellen Verwaltungsschnittstelle und der Netzwerkverwaltungsschnittstelle umzuleiten Anhang A Konfigurieren der Systemkonsole 209 Bestimmte OpenBoot Konfigurationsvariablen steuern mit welchen Ein und Ausgabeger ten die Systemkonsole arbeitet Aus der folgenden Tabelle geht hervor wie diese Variablen einzustellen sind um ber die serielle Verwaltungsschnittstelle und die Netzwerkverwaltungsschnittstelle ber ttyb oder einen lokalen Grafikmonitor eine Verbindung mit der Systemkonsole herzustellen TABELLE A 4 OpenBoot Konfigurationsvariablen die sich auf die Systemkonsole auswirken Einstellung f r die Umleitung der Systemkonsolenausgabe
171. i Ausfall dieser FRU gibt ALOM ein Warnmeldung aus SC Alert CPU_FAN FT1 Failed Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 TABELLE 2 10 Nicht durch System berpr fungswerkzeuge isolierbare FRUs FRU Hinweise zur Diagnose SCSI Datenkabel Siehe TABELLE 2 5 Stromversorgungskabel fiir Siehe TABELLE 2 5 Anschlusskarte Uberpriifen des Systems mit der SunVTS Software Mit dem Software berpr fungspaket SunVTS werden das System und dessen Untersysteme Belastungstests unterzogen Eine SunVTS Sitzung kann ber das Netzwerk angezeigt und gesteuert werden Mit Hilfe eines Remote Systems k nnen Sie so eine laufende SunVTS Testsitzung berwachen die Testoptionen ndern und alle Testfunktionen f r ein anderes System im Netzwerk steuern Die SunVTS Software kann in f nf Testmodi laufen m Verbindungsmodus SunVTS berpr ft das Vorhandensein von Ger tecontrollern auf allen Untersystemen Dieser Test dauert in der Regel nur wenige Minuten und eignet sich gut zur berpr fung der Systemverbindungen m Funktionaler Modus SunVTS untersucht nur die von Ihnen gew hlten Untersysteme Dies ist der Standardmodus Im funktionalen Modus werden ausgew hlte Tests parallel ausgef hrt In diesem Modus werden die Systemressourcen stark belastet Daher sollten Sie keine anderen Anwendungen gleichzeitig ausf hren m AutoKonfig Modus SunVTS erkennt automatisch alle Untersysteme und pr ft sie mit
172. iche LED Wartung erforderlich leuchtet Wenn Sie die vollstandige Ausgabe des Befehls showenvironment priifen kontrollieren Sie den Status aller Wartungs LEDs und stellen Sie fest ob f r alle Komponenten der Status OK gemeldet wird Ein Beispiel f r eine vollst ndige Ausgabe des Befehls showenvironment finden Sie in CODE BEISPIEL 4 1 CODE BEISPIEL7 4 Ausgabe des Befehls showenvironment System Indicator Status Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 CODE BEISPIEL 7 5 Pr fen Sie die Ausgabe des Befehls prtdiag v Geben Sie Folgendes ein CODE BEISPIEL 7 4 Ausgabe des Befehls showenvironment Fortsetzung sc gt sc gt console Enter to return to ALOM usr platform uname i sbin prtdiag v Mit dem Befehl prtdiag v haben Sie Zugriff auf Informationen die von den POST und OpenBoot Diagnostics Test gespeichert wurden Beim Zur cksetzen des Systems gehen alle Informationen dieses Befehls tiber den aktuellen Systemstatus verloren Wenn Sie die Ausgabe untersuchen um Probleme zu identifizieren berpr fen Sie ob alle installierten CPU Module PCI Karten und Speichermodule aufgeftihrt werden Stellen Sie fest ob Wartungs LEDs leuchten und ob das System PROM die aktuelle Firmwareversion enthalt CODE BEISPIEL 7 5 zeigt einen Auszug der Ausgabe des Befehls prtdiag v Eine vollst ndige Ausgabe des Befehls prtdiag v fiir einen intakt
173. ie das System ein Anweisungen zum Einschalten finden Sie im Sun Fire V440 Server Administrationshandbuch N chste Schritte Sie k nnen ber das alphanumerische Terminal Systembefehle ausf hren und Systemmeldungen anzeigen Fahren Sie gegebenenfalls mit der Installation bzw Diagnose fort Wenn Sie die Arbeit abgeschlossen haben geben Sie die Escape Sequenz des alphanumerischen Terminals ein Weitere Informationen ber die Herstellung einer Verbindung mit dem ALOM System Controller und dessen Verwendung finden Sie unter m Sun Advanced Lights Out Manager ALOM Online Help Wenn Sie die Systemkonsole zur Schnittstelle ttyb umgeleitet haben und Sie f r die Systemkonsole wieder die serielle Verwaltungsschnittstelle und die Netzwerkverwaltungsschnittstelle verwenden m chten lesen Sie den folgenden Abschnitt m Referenz f r die Einstellungen der OpenBoot Konfigurationsvariablen der Systemkonsole auf Seite 209 Pr fen der Einstellungen der seriellen Schnittstellen f r ttyb Mit Hilfe dieser Prozedur k nnen Sie die Baudrate sowie andere Einstellungen der seriellen Schnittstelle berpr fen die vom Sun Fire V440 Server zur Kommunikation mit einem Ger t verwendet werden das mit der Schnittstelle ttyb verbunden ist Hinweis Die serielle Verwaltungsschnittstelle arbeitet stets mit 9600 Baud 8 Bit ohne Parit t und mit 1 Stoppbit Vorbereitung Sie m ssen am Sun Fire V440 Server angemeldet sein und auf dem
174. ie den Befehl test gefolgt vom vollst ndigen Hardwarepfad des bzw der zu pr fenden Ger te ein Beispiel ok test pci 1c 600000 scsi 2 1 Hinweis Die richtige Eingabe des Hardware Ger tepfads erfordert genaue Kenntnisse der Hardware Architektur des Sun Fire V440 Servers Wenn Sie die Architektur nicht kennen ist es eventuell hilfreich den OpenBoot Befehl show devs siehe Der Befehl show devs auf Seite 23 zu verwenden Mit diesem Befehl wird eine Liste aller konfigurierten Ger te angezeigt Einzelne Tests k nnen Sie mit dem Befehl test args wie folgt einstellen ok test pci le 600000 usb b test args verbose subtests Dieser Befehl wirkt sich nur auf den aktuellen Test aus Er hat keine Auswirkung auf den Wert der OpenBoot Konfigurationsvariable test args Alle Ger te des Ger tebaums k nnen mit dem Befehl test all gepr ft werden ok test all Wenn Sie f r test all ein Pfadargument angeben werden nur das betreffende Ger t und seine untergeordneten Komponenten gepr ft Mit dem folgenden Befehl werden beispielsweise der USB Bus und alle Ger te gepr ft die mit dem USB Bus verbunden sind und ber einen Selbsttest verf gen ok test all pci 1 700000 Hinweis Nach dem Anhalten des Betriebssystems lassen sich die Befehle der OpenBoot Diagnostics nicht zuverl ssig ausf hren da sich der Arbeitsspeicher des Systems danach in einem unvorhersagbaren Zustand befindet Vor d
175. ie vermuten das die bei der Firmware Diagnose beobachteten Probleme durch ein inkompatibles und besch digtes Firmware Image verursacht werden sollten Sie nun die Zuverl ssigkeit der Systemfirmware wiederherstellen Weitere Informationen ber die Wiederherstellung der Systemfirmware erhalten Sie bei einem qualifizierten Kundendienst Ausf hren umfassender Diagnosetests Um die Zuverl ssigkeit des Systems zu erh hen empfiehlt es sich bei einem Absturz des Betriebssystems oder bei R cksetzereignissen POST und OpenBoot Diagnostics Tests ausl sen sowie automatisch m glichst umfassende Tests ausf hren zu lassen Hintergrundinformationen finden Sie unter m Diagnose Zuverl ssigkeit und Verf gbarkeit auf Seite 14 Vorbereitung Melden Sie sich bei der Systemkonsole an um zur Eingabeaufforderung ok zu gelangen Anweisungen hierzu finden Sie unter m Wechseln zur Eingabeaufforderung ok auf Seite 188 Auszuf hrende Arbeitsschritte W hlen Sie eine der nachstehenden M glichkeiten aus m Bringen Sie den Systemsteuerungsschalter des Servers in die Position Diagnose Kapitel3 Identifizieren ausgefallener und fehlerhafter Komponenten 63 Sie k nnen diese Einstellung entweder auf der Vorderseite des Servers oder wenn Sie die Testsitzung an einem entfernten Standort ber einen Konsolenbildschirm ausf hren mit Hilfe der ALOM Schnittstelle vornehmen m Setzen Sie die Variable diag switch auf true Gebe
176. ignisse empfangen Diese Dienste bieten Ihnen die M glichkeit beim Auftreten von Systemereignissen schneller zu reagieren und potenzielle Schwierigkeiten zu beheben bevor sie zu Problemen werden Weitere Informationen ber SRS Net Connect finden Sie unter http www sun com service support srs netconnect 116 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 bersicht ber die Konfiguration des Systems f r die Fehlerbehebung F r Systemfehler sind jeweils bestimmte Symptome charakterisch Jedes Symptom l sst sich mit bestimmten Fehlerbehebungstools und verfahren auf ein oder mehrere Probleme oder Ursachen zur ckf hren In diesem Abschnitt werden die Fehlerbehebungstools und verfahren beschrieben die Sie ber Konfigurationsvariablen steuern k nnen Hardware Watchdog Mechanismus Der Hardware Watchdog Mechanismus ist ein Hardware Timer der st ndig zur ckgesetzt wird solange das Betriebssystem l uft Wenn das System h ngt ist das Betriebssystem nicht mehr in der Lage den Timer zur ckzusetzen Sobald der eingestellte Grenzwert f r den Timer berschritten wurde wird automatisch ein extern initiierter Reset XIR ausgel st und auf der Systemkonsole werden Informationen zur Fehlersuche angezeigt Der Hardware Watchdog Mechanismus ist standardm ig aktiviert Wenn der Hardware Watchdog Mechanismus deaktiviert ist muss die Solaris Betriebssystemumgebung konfiguriert werden bevor der Hardware W
177. ilenummer Ihres Dokuments an Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Teilenummer 817 2865 10 Vorwort xv xvi Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 TEIL I Diagnose In den f nf Kapiteln dieses Teils des Sun Fire 440 Server Handbuch zur Fehlersuche und behebung werden die hardware firmware und softwarebasierten Diagnosewerkzeuge des Servers vorgestellt Sie erfahren wie diese Werkzeuge kombiniert werden k nnen und wie Sie mit Hilfe der Werkzeuge das System berwachen pr fen und Fehler im System identifizieren k nnen Informationen und ausf hrliche Anweisungen zur Behebung bestimmter Serverprobleme finden Sie in den Kapiteln von Teil II Fehlerbehebung Der erste Teil des vorliegenden Handbuchs enth lt die folgenden Kapitel Kapitel 1 bersicht ber die Diagnosewerkzeuge Kapitel 2 Diagnosewerkzeuge und Boot Prozess Kapitel 3 Identifizieren ausgefallener und fehlerhafter Komponenten Kapitel 4 berwachen des Systems Kapitel 5 berpr fen des Systems KAPITEL 1 bersicht ber die Diagnosewerkzeuge Der Sun Fire V440 Server und die mit ihm ausgelieferte Software und Firmware enthalten viele Diagnosewerkzeuge und Leistungsmerkmale zu Ihrer Unterst tzung m Isolieren von Problemen bei Ausfall einer vor Ort austauschbaren Komponente m berwachung des Zustands eines funktionierenden Systems m Veranlassung zum Aufdecken von Unterbre
178. ire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 m Referenz f r die Einstellungen der OpenBoot Konfigurationsvariablen der Systemkonsole auf Seite 209 ndern der Datei etc remote Unter Umst nden m ssen Sie wie nachstehend beschrieben vorgehen wenn Sie von einem Sun Server auf dem eine ltere Version der Betriebssystemumgebungssoftware Solaris ausgef hrt wird ber eine tip Verbindung auf die den Sun Fire V440 Server zugreifen Auch wenn die Datei etc remote auf dem Sun System ge ndert wurde oder den Eintrag hardwire nicht mehr enth lt sind die folgenden Schritte erforderlich Vorbereitung Bei den folgenden Schritten wird vorausgesetzt dass Sie als Superuser bei der Systemkonsole eines Sun Systems angemeldet sind das Sie f r die Herstellung einer tip Verbindung mit dem Sun Fire V440 Server verwenden m chten Auszuf hrende Arbeitsschritte 1 Bestimmen Sie die Version der Solaris Betriebssystemumgebung die auf dem Sun System installiert ist Geben Sie Folgendes ein uname r Das System zeigt eine Versionsnummer an 2 Je nach Versionsnummer sind die folgenden Schritte auszuf hren a Wenn die Nummer die mit dem Befehl uname r angezeigt wird 5 0 oder h her ist Anhang A Konfigurieren der Systemkonsole 199 Die Serversoftware enth lt einen entsprechenden Eintrag f r hardwire in der Datei etc remote Wenn Sie vermuten dass diese Datei ge ndert und der Eintrag har
179. is eine Komponente ausf llt bevor Sie handeln k nnen Einige Diagnosewerkzeuge erlauben es Ihnen jedoch Ma nahmen zu ergreifen bevor Probleme entstehen indem sie das System im st rungsfreien Zustand berwachen berwachungswerkzeuge machen den Systemverwalter fr hzeitig auf drohende Ausf lle aufmerksam und erm glichen somit eine geplante Wartung sowie eine bessere Systemverf gbarkeit Die Fern berwachung bietet dar ber hinaus eine bequeme M glichkeit den Status einer Vielzahl von Ger ten zentral zu berpr fen Das Angebot von Sun umfasst zwei Werkzeuge f r die berwachung von Servern m Sun Management Center m Sun Advanced Lights Out Manager ALOM Neben diesen Werkzeugen lassen sich mit software und firmwarebasierten Befehlen von Sun verschiedene Systeminformationen anzeigen Auch wenn es sich bei diesen Befehlen streng genommen nicht um ein berwachungswerkzeug handelt so k nnen Sie mit ihrer Hilfe doch auf einen Blick den Status zahlreicher Systemaspekte und komponenten kontrollieren In diesem Kapitel werden die Schritte beschrieben die f r die berwachung Ihres Sun Fire V440 Servers mittels solcher Werkzeuge erforderlich sind Im Rahmen dieser Erl uterungen werden die folgenden Themen behandelt berwachen des Systems mit Sun Management Center auf Seite 80 berwachen des Systems mit Sun Advanced Lights Out Manager auf Seite 86 Verwenden von Solaris Systeminformationsbefehlen auf Seite
180. izing 1 008MB of memory at addr 1200000000 Initializing 1024MB of memory at addr 1000000000 Initializing 1024MB of memory at addr 200000000 Initializing 1024MB of memory at addr 0 5 1 ok boot disk Die folgende Beispielausgabe zeigt den Systemstart und das Laden der Solaris Software CODE BEISPIEL 7 13 Ausgabe des Befehls consolehistory boot v Systemstart und Laden der Solaris Software Rebooting with command boot disk Boot device pci 1f 700000 scsi 2 disk 0 0 File and args Loading ufs file system package 1 4 04 Aug 1995 13 02 54 FCode UFS Reader 1 11 97 07 10 16 19 15 Loading platform SUNW Sun Fire V440 ufsboot Loading platform sun4u ufsboot SunOS Release 5 8 Version Generic _114696 04 64 bit Copyright 1983 2003 Sun Microsystems Inc All rights reserved Hardware watchdog enabled sc gt 4 Pr fen Sie die Datei var adm messages auf Hinweise auf einen Fehler Suchen Sie nach den folgenden Informationen ber den Systemstatus m Gro e L cken in den Zeitstempeln der Solaris Software oder der Anwendungsmeldungen m Warnmeldungen ber Hardware oder Softwarekomponenten m Informationen ber die letzten root Anmeldungen um festzustellen ob Systemadministratoren eventuell Informationen ber den Systemstatus zum Zeitpunkt der Blockierung geben k nnen Kapitel7 Beheben von Hardwareproblemen 145 5 Falls m glich pr fen Sie ob das System eine Speicherauszugsdatei angelegt hat
181. k Boot device pci 1f 700000 scsi 2 disk 0 0 File and args SunOS Release 5 8 Version Generic_114696 04 64 bit Copyright 1983 2003 Sun Microsystems Inc All rights reserved Hardware watchdog enabled Indicator SYS _FRONT ACT is now ON configuring IPv4 interfaces ce0 Hostname Sun SFV440 a The system is coming up Please wait NIS domainname is Ecd East Sun COM Starting IPv4 router discovery starting rpc services rpcbind keyserv ypbind done Setting netmask of 100 to 255 0 0 0 Setting netmask of ce0 to 255 255 255 0 Kapitel 7 Beheben von Hardwareproblemen 153 CODE BEISPIEL 7 20 Ausgabe des Befehls consolehistory run v Fortsetzung Setting default IPv4 interface for multicast add net 224 0 4 gateway Sun SFV440 a syslog service starting Print services started volume management starting The system is ready Sun SFV440 a console login May 9 14 52 57 Sun SFV440 a rmclomv NOTICE keyswitch change event state UNKNOWN May 9 14 52 57 Sun SFV440 a rmclomv Keyswitch Position has changed to Unknown state May 9 14 52 58 Sun SFV440 a rmclomv NOTICE keyswitch change event state LOCKED May 9 14 52 58 Sun SFV440 a rmclomv KeySwitch Position has changed to Locked State May 9 14 53 00 Sun SFV440 a rmclomv NOTICE keyswitch change event state NORMAL May 9 14 53 01 Sun SFV440 a rmclomv KeySwitch Position has changed to On State sc gt 3 Pr fen Sie das ALOM Boot
182. kalen Grafikmonitors ben tigen Sie Folgendes m Eine unterst tzte PCI basierte Grafikkarte mit zugeh rigem Softwaretreiber a Eine 8 24 Bit PCI Farbgrafikkarte zur Zeit werden die Sun Teilenummern X3768A und X3769unterst tzt m Ein Monitor mit der entsprechenden Aufl sung der die Grafikkarte unterst tzt m Eine Sun kompatible USB Tastatur Sun Type 6 USB Tastatur m Eine Sun kompatible USB Maus Sun USB Maus sowie ein Mauspad Auszuf hrende Arbeitsschritte Bauen Sie die Grafikkarte in einen freien PCI Steckplatz ein Die Installation muss von qualifiziertem Kundendienstpersonal vorgenommen werden Weitere Informationen finden Sie im Sun Fire V440 Server Parts Installation and Removal Guide oder wenden Sie sich an einen qualifizierten Kundendienst Anhang A Konfigurieren der Systemkonsole 205 2 Verbinden Sie das Videokabel des Monitors mit dem Videoanschluss der Grafikkarte Ziehen Sie die Schrauben von Hand an um eine sichere Verbindung zu gew hrleisten u ge CN D u iat ner 3 Verbinden Sie das Netzkabel des Monitors mit der Stromversorgung 206 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 4 Schlie en Sie das USB Kabel der Tastatur an eine der USB Schnittstellen auf der R ckseite des Sun Fire V440 Servers an Anhang A Konfigurieren der Systemkonsole 207 5 Schlie en Sie das USB Kabel der Maus an eine der USB Schnittstellen auf der R ckseite des Sun Fire V440 Servers a
183. lbsttest POST und andere Tests durchgef hrt werden sollen Der POST Test ist ein eigenes Codest ck in einem anderen Bereich des Boot PROM siehe ABBILDUNG 2 1 POST SCC Boot PROM Variablen OpenBoot Firmware ABBILDUNG 2 1 Boot PROM und SCC gt 2 MByte Kapitel 2 Diagnose und Boot Prozess 9 Das Ausma dieser Selbsttests und ob sie berhaupt ausgef hrt werden wird durch Konfigurationsvariablen in festgelegt die auf der austauschbaren Systemkonfigurationskarte SCC System Configuration Card abgelegt sind Diese OpenBoot Konfigurationsvariablen werden in Steuerung des POST Tests auf Seite 13 beschrieben Sobald der POST Test feststellt dass ein Teil des Systemspeichers funktioniert werden die Tests in den Systemspeicher geladen Die Funktion des POST Tests Der POST Test untersucht die wichtigsten Systemfunktionen Die erfolgreiche Ausf hrung des POST Tests garantiert nicht dass der Server in allen Bereichen funktionsf hig ist Der n chste Schritt des Boot Prozesses kann aber ausgef hrt werden F r einen Sun Fire V440 Server bedeutet dies m Mindestens eine CPU funktioniert m Mindestens ein Teil 512 MByte des Systemspeichers ist in Ordnung m Die E A Bridges auf der Hauptplatine funktionieren m Der PCI Bus ist intakt d h es gibt keine Kurzschl sse Es ist durchaus m glich dass ein System den POST Test besteht das Betriebssystem aber dennoch nicht gesta
184. ldungen der PC Diagnose 50 Referenz der in der Diagnoseausgabe verwendeten Begriffe 52 3 Identifizieren ausgefallener und fehlerhafter Komponenten 55 Anzeigen und Setzen von OpenBoot Konfigurationsvariablen 56 Bedienung der Locator LED 57 Versetzen des Systems in den Diagnosemodus 59 Umgehen der Firmware Diagnose 60 Tempor res Umgehen der Diagnosetests 62 Ausf hren umfassender Diagnosetests 63 Identifizieren von Fehlern mit Hilfe von LEDs 65 Identifizieren von Fehlern mit Hilfe von POST Tests 69 Identifizieren von Fehlern anhand der interaktiven OpenBoot Diagnostics Tests 71 Anzeigen von Diagnosetestergebnissen 74 Referenz f r die Auswahl eines Werkzeugs zur Fehleridentifizierung 75 4 berwachen des Systems 79 berwachen des Systems mit Sun Management Center 80 berwachen des Systems mit Sun Advanced Lights Out Manager 86 Verwenden von Solaris Systeminformationsbefehlen 100 Verwenden von OpenBoot Informationsbefehlen 101 iv Sun Fire V440 Server Handbuch zur Fehlersuche und behebung Juli 2003 5 berpr fen des Systems 103 berpr fen des Systems mit der SunVTS Software 104 Ist die Software SunVTS installiert 108 Part II Fehlerbehebung 6 Fehlerbehebungsoptionen 113 bersicht ber aktualisierte Fehlerbehebungsinformationen 113 Produkthinweise 114 Websites 114 bersicht ber die Verwaltung von Firmware und Softwarepatches 115 bersicht ber das Sun Install Check Tool 115 bersicht ber den Sun Explo
185. le auf Seite 21 oder auf den entsprechenden Seiten des Handbuchs Vorbereitung Die OpenBoot Informationsbefehle k nnen Sie jederzeit an der Eingabeaufforderung ok eingeben Das bedeutet dass Sie die Befehle in der Regel ausf hren k nnen auch wenn das System die Betriebssystemumgebungssoftware nicht starten kann Auszuf hrende Arbeitsschritte Fahren Sie gegebenenfalls das System herunter um zur Eingabeaufforderung ok zu gelangen Ihre diesbez gliche Vorgehensweise h ngt vom jeweiligen Zustand des Systems ab Falls m glich sollten Sie die Benutzer von Ihrem Vorhaben in Kenntnis setzen und das System ordnungsgem herunterfahren Informationen zu diesem Thema finden Sie unter Die Eingabeaufforderung ok auf Seite 182 W hlen Sie die Systeminformationen aus die angezeigt werden sollen Weitere Informationen zu diesem Thema finden Sie unter Weitere OpenBoot Befehle auf Seite 21 Kapitel 4 berwachen des Systems 101 3 Geben Sie den entsprechenden Befehl an der Eingabeaufforderung der Systemkonsole ein Siehe TABELLE 4 2 TABELLE 4 2 Verwenden von OpenBoot Informationsbefehlen Befehl Anzeige printenv Standardwerte und Einstellungen der OpenBoot Konfigurationsvariablen probe scsi Zieladresse Einheitennummer Ger tetyp und Hersteller aktiver probe scsi all SCSI und IDE Ger te probe ide show devs Hardwareger tepfade aller Ger te in der Systemkonfiguration 102 Sun Fire 440 Serve
186. lgender Teile des Sun Fire V440 Servers TABELLE 2 6 Von ALOM berwachte Teile berwachtes Teil ALOM stellt fest Befehl Plattenlaufwerke Ob in jedem Steckplatz ein Laufwerk vorhanden ist und ob showenvironment dessen Status OK ist L fter und L ftergeschwindigkeit und ob der L ftereinbaurahmen OK showenvironment L ftereinbaurahmen meldet Kapitel 2 Diagnose und Boot Prozess 35 TABELLE26 Von ALOM berwachte Teile Fortsetzung berwachtes Teil ALOM stellt fest Befehl CPU Das Vorhandensein von CPU Speichermodulen CPU showenvironment Speichermodule Temperaturen sowie Temperaturwarnungen Betriebssystemstatus Ob das Betriebssystem l uft angehalten ist initialisiert wird showplatform Netzteile Systemtemperatur Server Frontplatte oder sich in einem anderen Status befindet Ob in jedem Steckplatz ein Netzteil vorhanden ist und ob showenvironment dieses den Zustand OK meldet Temperatur des CPU Kerns und Umgebungstemperatur an showenvironment verschiedenen Stellen des Systems sowie Temperaturwarnungen Position des Systemsteuerungsschalters und LED Status showenvironment Benutzersitzungen Welche Benutzer bei ALOM ber welche Verbindungen showusers angemeldet sind Anleitungen zur berwachung eines Sun Fire V440 Systems mit ALOM erhalten Sie im Abschnitt berwachen des Systems mit Sun Advanced Lights Out Manager auf Seite 86 berwachen des Systems mit Sun Management Center Di
187. ll enthalt Boot Meldungen von POST OpenBoot Firmware und der Solaris Software nach dem letzten Zur cksetzen des Hostservers Das folgende Beispiel zeigt die Ausgabe der POST Boot Meldungen CODE BEISPIEL 4 10 Ausgabe des Befehls consolehistory boot v Boot Meldungen von POST Keyswitch set to diagnostic position OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 Clearing TLBs Power On Reset Executing Power On SelfTest 0 gt Sun Fire TM V440 POST 4 10 3 2003 05 04 22 08 export work staff firmware_re post post build 4 10 3 Fiesta chalupa integrated firmware_re 94 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 CODE BEISPIEL 4 10 Ausgabe des Befehls consolehistory boot v Boot Meldungen von POST Fortsetzung 0 gt Hard Powerup RST thru SW O gt CPUs present in system 0 1 0 gt OBP gt POST Call with 00 00000000 01012000 0 gt Diag level set to MIN O gt MFG scrpt mode set NORM 0 gt I O port set to TTYA 0 gt O gt Start selftest 1 gt Print Mem Config 1 gt Caches Icache is ON Dcache is ON Wcache is ON Pcache is ON 1 gt Memory interleave set to 0 1 gt Bank 0 1024MB 00000010 00000000 gt 00000010 40000000 1 gt Bank 2 1024MB 00000012 00000000 gt 00000012 40000000 0 gt Print Mem Config O gt Caches Icache is ON Dcache is ON Wcache is ON Pcache is ON 0 gt Memory interleave set to 0 0 gt Bank 0 1024MB 00000000 00000000 gt 00000000 40000000
188. llten Sie die folgenden Informationen stets bereithalten Aktuelle Patchversionen der Systemfirmware und Betriebssystemumgebung Version der Solaris Betriebssystemumgebung Informationen ber die spezifische Hardwarekonfiguration Informationen ber optionale Ger te und Treiber Aktuelle Wartungsaufzeichnungen Wenn Sie alle diese Informationen verf gbar halten und stets berpr fen ist es f r Sie einfacher von anderen Anwendern bereits identifizierte Probleme zu erkennen Sie ben tigen diese Informationen auch wenn Sie mit dem Sun Support oder mit Ihrem autorisierten Kundendienst Kontakt aufnehmen Es ist u erst wichtig die Version und die Patchversionen der Betriebssystemumgebung des Systems die Patchversionen der Firmware und die spezielle Hardwarekonfiguration zu kennen bevor Sie versuchen Probleme zu beheben Die Probleme treten h ufig nach nderungen am System auf Manche Fehler werden von inkompatibler und nicht harmonierender Hardware und Software verursacht Wenn Sie alle Systeminformationen zur Hand haben l sst sich ein Problem unter Umst nden bereits rasch durch die Aktualisierung der Systemfirmware l sen Informationen ber aktuelle Upgrades oder den Austausch von Komponenten tragen eventuell dazu bei den Austausch nicht defekter Komponenten zu vermeiden 130 Sun FireTM 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 bersicht ber die Fehlerzust nde des Systems Bei der Fehlerbehebung ko
189. ls der Software Sun Management Center Normalerweise installieren Sie die Server und Konsolensoftware nicht auf den Sun Fire V440 Systemen die Sie berwachen m chten Siehe m Sun Management Center Software User s Guide Um diese Schritte auszuf hren ben tigen Sie sowohl die Originalsoftware Sun Management Center als auch die entsprechende Erg nzung f r das Sun Fire V440 System Die Erg nzung k nnen Sie wie weiter unten beschrieben aus dem Internet herunterladen Wenn Sie das Sun Fire V440 System als Sun Management Center Server oder Konsole einsetzen m chten siehe m Sun Management Center Software Installation Guide m Sun Management Center Software User s Guide 80 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Schlagen Sie auch in den anderen Dokumenten zur Sun Management Center Software nach Hinweis Sun Management Center stellt sowohl Standalone als auch Browser basierte Konsolenschnittstellen zur Verf gung Dieses Verfahren setzt die Verwendung der auf der Java Technologie basierenden grafischen Standalone Konsole voraus Die Webbrowser Konsolenschnittstelle die hinsichtlich Design und Funktion leicht abweicht wird im Sun Management Center Software User s Guide beschrieben Auszuf hrende Arbeitsschritte Laden Sie die richtige Sun Management Center Erg nzung f r das Sun Fire V440 System herunter Suchen Sie nach dem Sun Management Center 3 x Supplement for Sun Fire
190. lt CODE BEISPIEL 7 27 zeigt einen Auszug der Ausgabe des Befehls prtdiag v Eine vollst ndige Ausgabe des Befehls prtdiag v f r einen intakten Sun Fire V440 Server finden Sie in CODE BEISPIEL 2 8 bis CODE BEISPIEL 2 13 CODE BEISPIEL 7 27 Ausgabe des Befehls prtdiag v System Configuration Sun Microsystems sun4u Sun Fire V440 System clock frequency 177 MHZ Memory size 4GB Ee a an CUS te a ES CPU CPU Temperature Fan CPU Freq Size Impl Mask Die Ambient Speed Unit 0 1062 MHz 1MB US IITi 23 1 1062 MHz 1MB US IITi 2 3 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 IO Devices 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 Bus Freq Type MHz Slot Name Model pei 66 MB pcil08e abba network SUNW pci ce pci 33 MB isa su serial pei 33 MB isa su serial 0 0 C0 P0 B0 D0 C0 P0 B0 D1 0 1 C0 P0 B1 D0 C0 P0 B1 D1 158 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 CODE BEISPIEL 7 27 Ausgabe des Befehls prtdiag v Fortsetzung System PROM revisions OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 OBDIAG 4 10 3 2003 05 02 20 26 H 8 berpr fen Sie ob alle Benutzer und Systemprozesse funktionieren Geben Sie Folgendes ein ps ef Die Ausgabe des Befehls ps ef zeigt jeden Prozess dessen Startzeit die Laufzeit und die vollst ndigen Befehlszeilenoptionen des Prozesses Um ein Systemproblem zu identifizieren untersuchen Sie
191. m ig konfiguriert ist so dass Sie zwischen dem System Controller und der Systemkonsole wechseln k nnen Siehe sm bersicht ber die Kommunikation mit dem System auf Seite 174 m Zugriff ber die Netzwerkverwaltungsschnittstelle auf Seite 178 Auszuf hrende Arbeitsschritte 1 berpr fen Sie ob das System blockiert ist a Geben Sie den Befehl ping ein um festzustellen ob Netzwerkaktivit t vorhanden ist b Geben Sie den Befehl ps ef ein um festzustellen ob anderen Benutzersitzungen aktiv sind oder reagieren Wenn eine andere Benutzersitzung aktiv ist pr fen Sie damit den Inhalt der Datei var adm messages auf Hinweise auf das Systemproblem 168 Sun FireTM 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 c Versuchen Sie ber den ALOM System Controller auf die Systemkonsole zuzugreifen Wenn Sie eine funktionierende Verbindung mit der Systemkonsole herstellen k nnen liegt eventuell keine wirkliche Blockierung sondern eher ein mit dem Netzwerk zusammenh ngendes Problem vor Falls Sie Netzwerkprobleme vermuten verwenden Sie die Befehle ping rlogin oder telnet um ein anderes System zu erreichen das sich in demselben Teilnetzwerk befindet bzw mit demselben Hub oder Router verbunden ist Werden von dem betroffenen System NFS Dienste bereitgestellt stellen Sie fest ob NFS Aktivit ten auf den anderen Systemen vorhanden sind d ndern Sie die Stellung des Systemsteuerungsschalters w
192. m System sichtbar bzw k nnen mit dem ALOM System Controller angezeigt werden berpr fen Sie alle LEDs von Netzwerkschnittstellen auf Aktivit t wenn Sie das System untersuchen Beim Zur cksetzen des Systems gehen von den LEDs gelieferte Informationen ber den Systemstatus verloren Weitere Informationen ber die Verwendung der System LEDs zur Behebung von Systemproblemen finden Sie unter Identifizieren von Fehlern mit Hilfe von LEDs auf Seite 65 m Solaris Protokolle Wenn die Solaris Software ausgef hrt wird berpr fen Siedie Meldungsdateien im Verzeichnis var adm messages Weitere Informationen finden Sie unter How to Customize System Message Logging im Solaris System Administration Guide Advanced Administration das Bestandteil der Systemverwaltungsdokumentation von Solaris ist m Systemkonsole Mit dem ALOM System Controller k nnen Sie auf Systemkonsolenmeldungen der OpenBoot Diagnostics und POST Tests zugreifen falls die Systemkonsole nicht umgeleitet wurde Der System Controller bietet auch Zugriff auf die Boot Protokollinformationen des letzten System Resets Weitere Informationen ber die Systemkonsole finden Sie in Anhang A m Bei Abst rzen erzeugte Speicherauszugsdateien Diese Dateien befinden sich im Verzeichnis var crash Weitere Informationen hierzu finden Sie unter bersicht ber den Speicherauszugsprozess auf Seite 121 Aufzeichnen von Informationen ber das System Standardm ig so
193. m Verzeichnis opt SUNWvts lesen Diese Datei enth lt aktuelle Informationen ber die installierte Produktversion SunVTS Software und Sicherheit W hrend der Installation von SunVTS m ssen Sie sich zwischen den Sicherheitsoptionen Basic oder Sun Enterprise Authentication Mechanism SEAM entscheiden Bei der Option Basic werden mit einer lokalen Sicherheitsdatei aus dem Installationsverzeichnis von SunVTS die Benutzer Gruppen und Hosts beschr nkt die Zugriff auf die SunVTS Software haben Die Option SEAM basiert auf dem Standard Netzwerkauthentifizierungsprotokoll Kerberos Sie gew hrleistet eine sichere Benutzerauthentifizierung Datenintegrit t und Datenschutz f r Transaktionen ber Netzwerke Wenn Sie an Ihrem Standort die Sicherheitsoption SEAM verwenden muss die SEAM Client und Serversoftware in der Netzwerkumgebung installiert sein und sowohl in der Solaris als auch in der SunVTS Software korrekt konfiguriert sein Wenn an Ihrem Standort keine SEAM Sicherheit verwendet wird w hlen Sie die Option auch nicht w hrend der Installation der SunVTS Software 42 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Falls Sie w hrend der Installation das falsche Sicherheitsschema aktivieren oder das gew hlte Schema falsch konfigurieren lassen sich die SunVTS Tests unter Umst nden nicht ausf hren Weitere Informationen hierzu finden Sie im SunVTS User s Guide und in den Anleitungen zur SEAM Software
194. m nicht durch eine eindeutig defekte Hardwarekomponente verursacht wird m chten Sie unter Umst nden lieber ein System berpr fungswerkzeug anstelle eines Werkzeugs zur Fehleridentifizierung verwenden Entsprechende Anweisungen finden Sie in Kapitel 2 w hrend Sie unter berpr fen des Systems auf Seite 39 Hintergrundinformationen nachschlagen k nnen 76 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 leuchtet Bauteil ersetzen System OBDiag ausf hren startet POST ausf hren POST ausf hren POST Fehler Eventuell System berpr fung ausf hren Bauteil ersetzen A OBDiag ja Fehler gt A ja Software oder Festplattenproblem Festplatte Festplatten Fehler berpr fen nicht Software Problem ABBILDUNG 3 1 Ausw hlen eines Werkzeugs zur Identifizierung von Hardwarefehlern Kapitel3 Identifizieren ausgefallen er und fehlerhafter Komponenten 77 78 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 KAPITEL 4 berwachen des Systems Bei Systemproblemen k nnen Ihnen Diagnosewerkzeuge helfen die Ursachen zu ermitteln Die meisten Diagnosewerkzeuge werden zu diesem Zweck eingesetzt Allerdings bedeutet diese Vorgehensweise auch dass bereits eine St rung aufgetreten ist Das hei t Sie m ssen warten b
195. mkonsole 177 Separate Kan le f r Systemkonsole und System Controller 186 Patch Panel Anschluss zwischen einem Terminalserver und einem Sun Fire V440 Server 193 Eine tip Verbindung zwischen einem Sun Fire V440 Server und einem anderen Sun System 196 vii viii Sun Fire V440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Tabellen TABELLE 1 1 TABELLE 2 1 TABELLE 2 2 TABELLE 2 3 TABELLE 2 4 TABELLE 2 5 TABELLE 2 6 TABELLE 2 7 TABELLE 2 8 TABELLE 2 9 TABELLE 2 10 TABELLE 2 11 TABELLE 2 12 TABELLE 2 13 TABELLE 2 14 TABELLE 2 15 TABELLE 4 1 TABELLE 4 2 TABELLE 5 1 TABELLE 6 1 bersicht ber die Diagnosewerkzeuge 2 OpenBoot Konfigurationsvariablen 13 Schl sselw rter der OpenBoot Konfigurationsvariable test args 17 Verf gbarkeit der Diagnosewerkzeuge 32 Fehlerisolierungswerkzeuge f r FRUs 32 Nicht durch Fehlerisolierungswerkzeuge erkennbare FRUs 33 Von ALOM berwachte Teile 35 Von Sun Management Center berwachte Ger te 36 Von Sun Management Center gemeldeter Ger testatus 37 Die von den System berpr fungswerkzeugen gepr ften FRUs 40 Nicht durch System berpr fungswerkzeuge isolierbare FRUs 40 Logische und physische Speicherb nke in einem Sun Fire V440 Server 46 Aus dem Men der OpenBoot Diagnostics abrufbare Tests 48 Men befehle der OpenBoot Diagnostics 49 I2C Bus Ger te auf einem Sun Fire V440 Server 50 In der Diagnoseausgabe verwendete A
196. mmt es darauf an zu wissen welcher Fehler aufgetreten ist zwischen wirklichen und scheinbaren Blockierungen des Systems zu unterscheiden und angemessen auf Fehlerbedingungen zu reagieren um wertvolle Informationen zu bewahren Reaktion auf Fehlerzust nde des Systems Je nach der Schwere eines Systemfehlers reagiert ein Sun Fire V440 Server eventuell auf Befehle die Sie auf dem System eingeben oder nicht Sobald Sie alle verf gbaren Informationen gesammelt haben k nnen Sie bestimmte Ma nahmen ergreifen Diese h ngen von den bereits gesammelten Informationen und dem Status des Systems ab Wichtige Richtlinien m Vermeiden Sie das Aus und Einschalten des Systems bis Sie alle verf gbaren Informationen gesammelt haben Die Fehlerinformationen k nnen verloren gehen wenn Sie das System aus und einschalten m Wenn das System zu h ngen scheint unternehmen Sie verschiedene Versuche um eine Reaktion des Systems zu erhalten Siehe Reaktion auf Systemblockierungen auf Seite 131 Reaktion auf Systemblockierungen Die Behebung von Fehlern eines blockierten Systems kann schwierig sein da die Ursache der Blockierung eventuell durch falsche Fehleranzeigen einer anderen Systemkomponente verschleiert wird Daher sollten Sie alle Informationsquellen die Ihnen zur Verf gung stehen sorgf ltig pr fen bevor Sie Abhilfema nahmen ergreifen Hilfreich ist es auch zu wissen welche Art der Systemblockierung vorliegt Diese Informationen
197. mumgebung auf dem Sun Fire V440 Server ausgef hrt wird und dass Sie Zugriff auf die Solaris Befehlszeile haben Weitere Informationen zu diesem Thema finden Sie unter sm bersicht ber die Kommunikation mit dem System auf Seite 174 Auszuf hrende Arbeitsschritte A berpr fen Sie ob die SunVTS Pakete vorhanden sind Geben Sie Folgendes ein pkginfo 1 SUNWvts SUNWvtsx SUNWvtsmn m Wenn SunVTS installiert wurde werden Informationen zu den Paketen angezeigt m Wurde SunVTS nicht installiert erhalten Sie f r jedes fehlende Paket eine Fehlermeldung ERROR information for SUNWvts was not found ERROR information for SUNWvtsx was not found Die Software SunVTS besteht im Einzelnen aus den folgenden Paketen Paket Beschreibung SUNWvts SunVTS Kernel Benutzerschnittstelle sowie 32 Bit Bin rtests SUNWvtsx 64 Bit Binartests und Kernel von SunVTS SUNWvtsmn SunVTS Man Pages Nur bei Solaris 8 Pr fen Sie ob zus tzlich ben tigte Software vorhanden ist Dies ist nur erforderlich wenn Sie SunVTS 5 1 oder h here kompatible Versionen unter der Solaris 8 Betriebssystemumgebung installieren und ausf hren m chten Kapitel5 Testen des Systems 109 SunVTS 5 1 erfordert zus tzliche Pakete die eventuell nicht mit Solaris 8 installiert wurden Um dies festzustellen geben Sie Folgendes ein pkginfo 1 SUNWIxml SUNWlxmlx SUNWzlib SUNWzlibx Damit wird gepriift ob die folgenden
198. n 6 Wechseln Sie zur Eingabeaufforderung ok Weitere Informationen zu diesem Thema finden Sie unter Wechseln zur Eingabeaufforderung ok auf Seite 188 7 Nehmen Sie die entsprechenden Einstellungen an den OpenBoot Konfigurationsvariablen vor Geben Sie an der vorhandenen Systemkonsole die folgenden Zeilen ein ok setenv input device keyboard ok setenv output device screen Hinweis Es gibt viele weitere OpenBoot Konfigurationsvariablen Obwohl sie keinen Einfluss darauf haben welches Hardwareger t f r den Zugriff auf die Systemkonsole verwendet wird bestimmen einige dieser Variablen welche Diagnosetests das System ausf hrt und welche Mitteilungen an der Konsole angezeigt werden Weitere Informationen finden Sie unter Steuerung des POST Tests auf Seite 13 208 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 8 Damit die nderungen an den Parametern wirksam werden m ssen Sie den folgenden Befehl eingeben ok reset all Das System speichert die Parameter nderungen und bootet automatisch wenn die OpenBoot Konfigurationsvariable auto boot auf true Standardwert gesetzt ist Hinweis Die Speicherung der Parameter nderungen ist auch durch einen Neustart des Systems ber den Netzschalter auf der Vorderseite des Servers m glich N chste Schritte Sie k nnen ber den lokalen Grafikmonitor Systembefehle ausf hren und Systemmeldungen anzeigen Fa
199. n eingegeben werden Weitere Informationen finden Sie unter Anzeigen und Setzen von OpenBoot Konfigurationsvariablen auf Seite 56 e error reset Ein von bestimmten irreparablen Hardwarefehlern hervorgerufenes Reset In der Regel kommt es zu einem Fehler Reset wenn die Systemdaten durch ein Hardwareproblem besch digt wurden und das System verwirrt ist Beispiele f r einen solchen Fehler sind CPU und System Watchdog Resets schwerwiegende Fehler und bestimmte CPU Reset Ereignisse Standard e power on reset Ein Reset das durch Dr cken des Einschalters hervorgerufen wird Standard e user reset Ein vom Benutzer oder Betriebssystem veranlasstes Reset Dazu geh ren die OpenBoot Befehle boot und reset all sowie der Solaris Befehl reboot e all resets Jede Art von System Reset e none Es werden keine POST Tests oder OpenBoot Diagnostics Tests ausgef hrt Legt fest woher die Systemkonsoleneingabe stammt Die Standardeinstellung ist ttya e ttya Von der seriellen Verwaltungsschnittstelle und der Netzwerkverwaltungsschnittstelle e ttyb Von der integrierten seriellen Schnittstelle B keyboard Von der angeschlossenen Tastatur des Grafikmonitors Legt fest wo Diagnose und andere Systemkonsolenmeldungen ausgegeben werden Die Standardeinstellung ist ttya e ttya Zur seriellen Verwaltungsschnittstelle und der Netzwerkverwaltungsschnittstelle e ttyb Zur integrierten seriellen Schnittstelle B
200. n nicht aber den Status der einzelnen Tests subtests Zeigt den Haupttest und alle aufgerufenen Untertests an verbose Zeigt ausf hrliche Statusmeldungen zu allen Tests an callers N Zeigt bei einem Fehler eine Liste der letzten N Aufrufer an e callers 0 zeigt eine Liste aller Aufrufer vor dem Fehler an errors N Beendet den Test nach N Fehlern e errors 0 zeigt alle Fehlermeldungen an ohne den Test zu beenden Wenn Sie mehrere Einstellungen der OpenBoot Diagnostics ndern m chten k nnen Sie f r test args eine komma getrennte Schl sselwortliste einsetzen Zum Beispiel ok setenv test args debug loopback media Das Men der OpenBoot Diagnostics Am einfachsten f hren Sie die OpenBoot Diagnostics Tests interaktiv ber ein Men aus Um das Men zu ffnen geben Sie an der Eingabeaufforderung ok den Befehl obdiag ein Weitere Anleitungen finden Sie unter Identifizieren von Fehlern anhand der interaktiven OpenBoot Diagnostics Tests auf Seite 71 Kapitel 2 Diagnose und Boot Prozess 17 Die Eingabeaufforderung obdiag gt und das interaktive Men der OpenBoot Diagnostics ABBILDUNG 2 3 werden angezeigt In diesem Men werden nur die von der OpenBoot Firmware erkannten Ger te angezeigt Eine kurze Beschreibung der einzelnen OpenBoot Diagnostics Tests finden Sie in TABELLE 2 12 unter Referenz zu den Tests und Befehlen der OpenBoot Diagnostics auf Seite 47 obdiag 1 flashprom 2 0 2 i2c 0 320 3 ide
201. n um festzustellen ob Systemadministratoren eventuell Informationen ber den Systemstatus zum Zeitpunkt der Blockierung geben k nnen 9 Falls m glich pr fen Sie ob das System eine Speicherauszugsdatei angelegt hat Speicherauszugsdateien enthalten wertvolle Informationen die Ihren Supportanbieter bei der Diagnose von Systemproblemen unterst tzen Weitere Informationen ber Speicherauszugsdateien finden Sie unter bersicht ber den Speicherauszugsprozess auf Seite 121 und Managing System Crash Information im Solaris System Administration Guide das Bestandteil der Systemverwaltungsdokumentaton von Solaris ist Kapitel 7 Beheben von Hardwareproblemen 171 172 Sun FireTM 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 ANHANG A Konfigurieren der Systemkonsole In diesem Anhang wird die Systemkonsole erl utert es werden verschiedene M glichkeiten zur Konfiguration der Konsole auf einem Sun Fire V440 Server beschrieben und es wird dargelegt wie die Konsole mit dem System Controller zusammenh ngt Im Rahmen dieser Erl uterungen werden die folgenden Themen behandelt Wechseln zur Eingabeaufforderung ok auf Seite 188 Verwendung der seriellen Verwaltungsschnittstelle auf Seite 189 Aktivieren der Netzwerkverwaltungsschnittstelle auf Seite 191 Zugriff auf die Systemkonsole ber einen Terminalserver auf Seite 192 Zugriff auf die Systemkonsole ber eine tip Verbindung
202. n Sie Folgendes ein ok setenv diag switch true 2 Setzen Sie die OpenBoot Konfigurationsvariable diag script auf all Geben Sie Folgendes ein ok setenv diag script all Damit k nnen die OpenBoot Diagnostics Tests auf allen Hauptplatinenkomponenten und auf IEEE 1275 kompatiblen Ger ten automatisch ausgef hrt werden Hinweis Wenn Sie nur die Ger te der Hauptplatine von OpenBoot Diagnostics untersuchen lassen m chten setzen Sie die Variable diag script auf normal 3 Nehmen Sie die entsprechenden Einstellungen an den OpenBoot Konfigurationsvariablen vor damit die Diagnosetests ausgel st werden Geben Sie Folgendes ein ok setenv post trigger all resets ok setenv obdiag trigger all resets 4 Stellen Sie die h chste Stufe f r den POST Test ein Geben Sie Folgendes ein ok setenv diag level max Damit ist gew hrleistet dass die gr ndlichste Teststufe durchgef hrt wird Die Ausf hrung der h chsten Teststufe dauert wesentlich l nger als die der niedrigsten Je nach Systemkonfiguration m ssen Sie auf den Start des Servers zus tzlich 10 bis 20 Minuten warten 64 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Identifizieren von Fehlern mit Hilfe von LEDs Obwohl die LEDs am Geh use und an ausgew hlten Systemkomponenten kein umfassendes Diagnosewerkzeug sind k nnen sie einen ersten Hinweis auf eine Reihe von Hardwarefehlern liefern Vorbereitun
203. n Sie alle IEEE 1275 kompatiblen Ger te nicht nur die auf der Hauptplatine von OpenBoot Diagnostics untersuchen lassen m chten setzen Sie die Variable diag script auf all 3 Nehmen Sie die entsprechenden Einstellungen an den OpenBoot Konfigurationsvariablen vor damit die Diagnosetests ausgel st werden Geben Sie Folgendes ein ok setenv post trigger power on reset error reset ok setenv obdiag trigger power on reset error reset 4 Stellen Sie die h chste Stufe f r den POST Test ein Geben Sie Folgendes ein ok setenv diag level max Damit ist gew hrleistet dass die gr ndlichste Stufe des POST durchgef hrt wird Die Ausf hrung der h chsten Teststufe dauert wesentlich l nger als die der niedrigsten Je nach Systemkonfiguration m ssen Sie auf den Start des Servers zus tzlich 10 bis 20 Minuten warten Umgehen der Firmware Diagnose Durch Umgehen der POST und OpenBoot Diagnostics Tests l sst sich der Startvorgang des Servers beschleunigen Hintergrundinformationen finden Sie unter m Diagnose Zuverl ssigkeit und Verf gbarkeit auf Seite 14 Achtung Das Umgehen der Diagnosetests geht zu Lasten der Systemzuverl ssigkeit da in diesem Fall Startversuche von Systemen mit gr eren Hardwareproblemen nicht unterbunden werden 60 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Vorbereitung Melden Sie sich bei der Systemkonsole an um zur Eingabeaufforderung ok zu
204. n des LED Status die seit dem letzten Systemstart aufgetreten sind Um Probleme zu identifizieren untersuchen Sie die Ausgabe auf Informationen ber eingeschaltete Wartungs LEDs CODE BEISPIEL 7 31 zeigt ein Beispiel f r ein Ereignisprotokoll das besagt dass die auf der Vorderseite befindliche Wartungs LED an ist Ausgabe des Befehls showlogs 09 09 09 09 09 09 09 09 09 09 09 09 09 09 09 09 09 09 09 16 16 16 16 16 16 16 16 16 16 17 hye 178 17 17 17 17 Lye 17 54 54 56 56 58 58 58 58 58 59 46 Sun SFV44 51 Sun SFV44 22 Sun SFV44 22 Sun SFV44 24 Sun SFV440 00 OL 03 03 03 04 05 06 07 13 Sun S 13 Sun S 19 Sun S 44 Sun S 27 Sun SFV44 27 Sun SFV44 35 Sun SFV44 54 Sun SFV44 11 Sun SFV44 11 Sun SFV44 13 Sun SFV44 59 Sun SFV44 40 Sun SFV44 FV44 FV44 FV44 0 FV44 oO y oo m m m m 0 0 0 0 0 0 0 0 0 0 0 0 o 9 m m w 00060003 00040029 00060000 00060000 00040001 0002 000b 0004 0004 0004 0004 0004 0004 0004 0004 004f 004f 0002 0002 004f 0002 0004004f 0004 0004 0004 0004 0004 000b 0002 0002 004f 004f SC System booted Hos SC SC t system has shut down Login User admin Logged on Login User admin Logged on SC Request to Power On Host Hos Hos b
205. nde eines komplexen Servers erfordern den Einsatz mehrerer Diagnosewerkzeuge damit alle m glichen Hardwareausf lle erkannt werden k nnen Sun stellt Ihnen eine Vielzahl von Werkzeugen zur Verf gung die Sie bei der Bestimmung fehlerhafter Komponenten unterst tzen Das vorliegende Kapitel unterst tzt Sie bei der Wahl der besten Werkzeuge und beschreibt deren Einsatz zur Auffindung fehlerhafter und ausgefallener Komponenten im Sun Fire V440 Server Dar ber hinaus erfahren Sie wie Sie mit Hilfe der Locator LED ein ausgefallenes System in einem gro en Raum mit zahlreichen Servern identifizieren k nnen Im Rahmen dieser Erl uterungen werden die folgenden Themen behandelt Anzeigen und Setzen von OpenBoot Konfigurationsvariablen auf Seite 56 Bedienung der Locator LED auf Seite 57 Versetzen des Systems in den Diagnosemodus auf Seite 59 Umgehen der Firmware Diagnose auf Seite 60 Tempor res Umgehen der Diagnosetests auf Seite 62 Ausf hren umfassender Diagnosetests auf Seite 63 ldentifizieren von Fehlern mit Hilfe von LEDs auf Seite 65 ldentifizieren von Fehlern mit Hilfe von POST Tests auf Seite 69 Ldentifizieren von Fehlern anhand der interaktiven OpenBoot Diagnostics Tests auf Seite 71 m Anzeigen von Diagnosetestergebnissen auf Seite 74 Au erdem enth lt das Kapitel noch die folgenden Informationen m Referenz f r die Auswahl eines Werkzeugs zur Fehleridentifizierung
206. nen Terminalserver auf Seite 192 Hinweise f r den Zugriff auf die Systemkonsole ber ein alphanumerisches Terminal finden Sie unter Verwendung der seriellen Verwaltungsschnittstelle auf Seite 189 Hinweise f r den Zugriff auf die Systemkonsole ber eine tip Verbindung erhalten Sie unter Zugriff auf die Systemkonsole ber eine tip Verbindung auf Seite 196 Zugriff ber die Netzwerkverwaltungsschnittstelle Sobald Sie der Netzwerkverwaltungsschnittstelle eine IP Adresse zugewiesen haben k nnen Sie ein Ethernet f higes Ger t anschlie en und ber das Netzwerk auf die Systemkonsole zugreifen So sind Fern berwachung und steuerung m glich Dar ber hinaus sind bis zu vier gleichzeitige Verbindungen mit der Eingabeaufforderung sc gt des System Controllers ber die Netzwerkverwaltungsschnittstelle verf gbar Anweisungen f r die Einrichtung der Netzwerkverwaltungsschnittstelle finden Sie unter Aktivieren der Netzwerkverwaltungsschnittstelle auf Seite 191 Weitere Informationen ber die Systemkonsole und den ALOM System Controller finden Sie unter m Die Eingabeaufforderung sc gt auf Seite 180 m Die Eingabeaufforderung ok auf Seite 182 Alternative Konfiguration f r die Systemkonsole In der Standardkonfiguration erscheinen Warnmeldungen des System Controllers und die Ausgabe der Systemkonsole in demselben Fenster Nach der erstmaligen Systeminstallation k nnen Sie die Systemkonsole umleiten so
207. nfigurationsvariablen ASR aktivieren 118 auto boot 13 diag level 13 diag script 13 diag switch 13 Funktion 10 13 input device 14 mit printenv anzeigen 21 obdiag trigger 14 output device 14 post trigger 14 Systemkonsoleneinstellungen 209 Tabelle 13 Ordnungsgem es Herunterfahren 183 189 output device Variable 14 P Parit t Einstellung des alphanumerischen Terminals 201 berpr fen 204 Patches installiert 31 mit showrev anzeigen 31 PCI Karte Peripheral Component Interconnect Grafikkarte 205 215 Physische Ansicht Sun Management Center 38 ping Befehl Solaris Verwendung bei Fehlerbehebung in blockiertem System 168 pkgadd Dienstprogramm 110 pkginfo Befehl Solaris 110 Position des Systemsteuerungsschalters Verwendung bei Fehlerbehebung in blockiertem System 169 POST Power on Self test POST power on self test ausf hren 69 Ausf hrung ausl sen 14 Bezeichnungen entschl sseln 12 Boot Meldungen 142 dauerhafte Probleme 10 definiert 9 Einschr nkung der Meldungsanzeige 14 Fehleridentifizierung ber FRU Ebene hinaus 12 Fehlermeldungen Bedeutungen 11 Funktion 10 Master CPU 10 Reparaturabteilung 12 steuern 13 Testkriterien 10 post trigger Variable Einstellen 14 Verwendung bei Fehlerbehebung in blockiertem System 170 poweroff Befehl System Controller 98 poweron Befehl System Controller 98 printenv Befehl OpenBoot Beschreibung 21 V
208. ng pci 1f 700000 network l1 Testing pci le 600000 ide d Testing pci l1e 600000 isa 7 flashprom e2 0 Testing pci le 600000 isa 7 serial 0 2e8 Testing pci le 600000 isa 7 serial 0 3f8 Testing pci l1e 600000 isa 7 rtc 0 70 Testing pci le 600000 isa 7 i2c 0 320 tests gpio 0 42 gpi0 0 44 gpio0 0 46 gpic 0 48 Testing pci le 600000 isa 7 i2c 0 320 tests hardware monitore 0d 5c Testing pci le 600000 isa 7 i2c 0 320 tests temperature sensor 0 9c Testing pci 1c 600000 network 2 Testing pci 1f 700000 scsi 2 1 Testing pci 1f 700000 scsi 2 Das folgende Beispiel zeigt die Ausgabe bei der Initialisierung des Speichers durch das OpenBoot PROM CODE BEISPIEL 4 14 Ausgabe des Befehls consolehistory boot v Speicherinitialisierung Initializing 1MB of memory at addr 123fe02000 Initializing 12MB of memory at addr 123 000000 Initializing 1008MB of memory at addr 1200000000 Initializing 1024MB of memory at addr 1000000000 Initializing 1024MB of memory at addr 200000000 Initializing 1024MB of memory at addr 0 1 ok boot disk 96 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Die folgende Beispielausgabe zeigt den Systemstart und das Lad Software CODE BEISPIEL 4 15 Software en der Solaris Ausgabe des Befehls consolehistory boot v Systemstart und Laden der Solaris Rebooting with command boot disk Boot device pci 1f 700000 scsi 2 disk 0 0 File an
209. nn nicht gen gend Speicherplatz vorhanden ist 4 Geben Sie den Befehl df k1 ein um Verzeichnisse mit mehr Speicherplatz zu ermitteln df k1 Filesystem kbytes used avail capacity Mounted on dev dsk c1t0d0s0 832109 552314 221548 72 proc 0 0 0 0 proc fd 0 0 0 0 dev fd mnttab 0 0 0 0 etc mntab swap 3626264 16 362624 81 var run swap 3626656 408 362624 81 tmp dev dsk c1t0d0s7 33912732 9 33573596 export home Kapitel6 Optionen zur Fehlerbehebung 123 5 Geben Sie den Befehl dumpadm s ein um ein Verzeichnis f r die Auszugsdatei festzulegen dumpadm s export home Dump content kernel pages Dump device dev dsk c3t5d0s1 swap Savecore directory export home Savecore enabled yes Mit dem Befehl dumpadm s k nnen Sie das Verzeichnis f r die Auslagerungsdatei festlegen Weitere Informationen finden Sie auf der Man Page zu dumpadm 1M Testen der Speicherauszugskonfiguration Bevor Sie das System in eine Produktionsumgebung eingliedern empfiehlt es sich zu testen ob die Speicherauszugskonfiguration funktioniert Je nach der Gr e des installierten Arbeitsspeichers kann diese Prozedur einige Zeit dauern Vorbereitung Sichern Sie alle Daten und ffnen Sie die Systemkonsole Siehe sm bersicht ber die Kommunikation mit dem System auf Seite 174 Auszuf hrende Arbeitsschritte 1 Fahren Sie das System mit dem Befehl shut down ordnungsgem herunter 2
210. nnen die firmwarebasierten Diagnosetests umgehen um den Neustart eines Servers zu verk rzen In den folgenden Abschnitten gehen wir allerdings davon aus dass das System im Diagnosemodus startet die firmwarebasierten Tests also laufen Weitere Anweisungen finden Sie in der Versetzen des Systems in den Diagnosemodus auf Seite 59 Der Boot Prozess umfasst mehrere Stufen die in den folgenden Abschnitten beschrieben werden Prolog Start des System Controllers auf Seite 8 Erste Stufe OpenBoot Firmware und POST auf Seite 9 Zweite Stufe OpenBoot Diagnostics Tests auf Seite 15 Dritte Stufe Die Betriebssystemumgebung auf Seite 23 Prolog Start des System Controllers Sobald Sie den Sun Fire V440 Server mit einer Steckdose verbinden und noch vor dem Einschalten des Servers startet der System Controller im Server den Selbstdiagnose und Boot Zyklus Der System Controller befindet sich auf der Sun Advanced Lights Out Manager Karte ALOM die im Geh use des Sun Fire V440 Servers installiert ist Die Karte arbeitet mit der Standby Stromversorgung und arbeitet bereits bevor der Server selbst hochgefahren wird 8 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Der System Controller bietet ber die ALOM Befehlszeilenschnittstelle Zugriff auf eine Reihe von Steuerungs und berwachungsfunktionen Weitere Informationen zu ALOM finden Sie unter berwachen des Systems mit Sun Advanced Lights
211. nostics folgende Systemkomponenten m E A Schnittstellen einschlie lich USB und seriellen Schnittstellen SCSI und IDE Controller sowie Ethernet Schnittstellen a ALOM Karte m Tastatur Maus und Bildschirm sofern vorhanden m Inter Integrated Circuit I2C Buskomponenten einschlie lich thermischer und anderer Sensoren auf der Hauptplatine CPU Speichermodule DIMMs Netzteil und SCSI R ckwandplatine m Jede PCI Zusatzkarte mit integriertem IEEE 1275 kompatiblen Selbsttest Die OpenBoot Diagnostics Tests werden automatisch ber ein Skript ausgef hrt wenn das System im Diagnosemodus gestartet wird Die Tests k nnen aber wie im n chsten Abschnitt beschrieben auch manuell ausgef hrt werden Ebenso wie die POST Tests k nnen die OpenBoot Diagnostics Tests dauerhafte Fehler erfassen Um sporadisch auftretende Probleme aufzudecken sollten Sie ein System berpr fungstool ausf hren Siehe berpr fen des Systems auf Seite 39 Steuerung der OpenBoot Diagnostics Die OpenBoot Diagnostics Tests k nnen beim Systemneustart interaktiv ber ein Testmen oder mittels Befehlen direkt an der Eingabeanforderung ok ausgef hrt werden Hinweis Nach dem Anhalten des Betriebssystems lassen sich die OpenBoot Diagnostics nicht zuverl ssig ausf hren da sich der Arbeitsspeicher des Systems danach in einem unvorhersagbaren Zustand befindet Vor dem Ausf hren dieser Tests empfiehlt es sich daher das System zurtickzusetzen Die mei
212. nsole angezeigt werden Weitere Informationen finden Sie unter Steuerung des POST Tests auf Seite 13 b Damit die nderungen wirksam werden schalten Sie das System aus Geben Sie Folgendes ein ok power off Das System speichert die ge nderten Parameter dauerhaft und schaltet sich ab Hinweis Sie k nnen das System auch mit dem Netzschalter auf der Vorderseite ausschalten c Verbinden Sie das Nullmodemkabel mit der ttyb Schnittstelle am Sun Fire V440 Server Verwenden Sie gegebenenfalls im Lieferumfang des Servers enthaltenen DB 9 oder DB 25 Kabeladapter d Schalten Sie das System ein Anweisungen zum Einschalten finden Sie im Sun Fire V440 Server Administrationshandbuch N chste Schritte Fahren Sie mit der Installation bzw der Diagnosetestsitzung fort Wenn Sie das tip Fenster nicht l nger ben tigen beenden Sie Ihre tip Sitzung mit der Eingabe Tilde Punkt und schlie en Sie das Fenster Weitere Informationen zu den tip Befehlen finden Sie auf der tip Man Page Weitere Informationen ber die Herstellung einer Verbindung mit dem ALOM System Controller und dessen Verwendung finden Sie unter m Sun Advanced Lights Out Manager ALOM Online Help Wenn Sie die Systemkonsole zur Schnittstelle ttyb umgeleitet haben und Sie f r die Systemkonsole wieder die serielle Verwaltungsschnittstelle und die Netzwerkverwaltungsschnittstelle verwenden m chten lesen Sie den folgenden Abschnitt 198 Sun F
213. ntroller siehe ABBILDUNG A 3 Systemkonsole ok SERIAL MGT oder NETMGT Schnittstelle LN p leo console LN N7 sc gt System Controller ALOM ABBILDUNG A 3 Separate Kan le f r Systemkonsole und System Controller 186 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Wenn die Systemkonsole f r den Zugriff ber die serielle Schnittstelle und die Netzwerkverwaltungsschnittstelle konfiguriert ist und Sie ber eine dieser Schnittstellen eine Verbindung herstellen k nnen Sie entweder auf die ALOM Befehlszeilenschnittstelle oder die Systemkonsole zugreifen Sie k nnen jederzeit zwischen dem ALOM System Controller und der Systemkonsole wechseln es ist jedoch nicht m glich von einem Terminal oder Shell Tool aus gleichzeitig auf beide Schnittstellen zuzugreifen Die auf dem Terminal oder im Shell Tool angezeigte Eingabeaufforderung gibt an auf welchen Kanal Sie zugreifen m Die Eingabeaufforderung oder besagt dass Sie sich in der Systemkonsole befinden und dass die Betriebssystemumgebung Solaris ausgef hrt wird m Die Eingabeaufforderung ok gibt an dass Sie sich in der Systemkonsole befinden und dass der Server von der OpenBoot Firmware gesteuert wird m Die Eingabeaufforderung sc gt besagt dass Sie mit dem ALOM System Controller arbeiten Hinweis Erscheint kein Text bzw
214. nung und Stromst rken Statusberichte von Sun Management Center Zu jedem Ger t eines berwachten Sun Fire V440 Servers ermittelt Sun Management Center eine der in TABELLE 2 8 aufgef hrten Statusvarianten TABELLE 2 8 Von Sun Management Center gemeldeter Ger testatus Status Bedeutung Degraded Das Ger t arbeitet nicht mit optimaler Leistung Error Es wurde ein Problem erkannt Failure Predicted Nach der verf gbaren Statistik steht der Ausfall des Ger ts bevor Lost Comms Die Kommunikation zwischen Sun Management Center und dem fraglichen Ger t wurde unterbrochen OK Das Ger t arbeitet einwandfrei und es wurden keine Probleme erkannt Stopped Das Ger t ist nicht aktiv Unknown Sun Management Center kann den Ger testatus nicht ermitteln Die Funktionsweise von Sun Management Center Sun Management Center besteht aus drei Softwareeinheiten m Agent Schicht m Serverschicht m Konsolenschicht Die Module der Agent Schicht werden auf den zu berwachenden Systemen installiert Die Module sammeln Systemstatusinformationen aus Protokolldateien Ger teb umen sowie plattformspezifischen Quellen und bergeben diese Daten an die Serverkomponente Kapitel 2 Diagnose und Boot Prozess 37 38 Die Serverschicht f hrt eine gro e Datenbank mit Statusinformationen ber eine breite Palette von Sun Plattformen Diese Datenbank wird regelm ig aktualisiert Sie enth lt Informationen ber Platinen B nder Netzteile
215. o genug ist Geben Sie den Befehl swap 1 ein swap 1 swapfile dev swaplo blocks free dev dsk c0t3d0s0 32 24 16 4097312 4062048 dev dsk c0t1d0s0 32 8 16 4097312 4060576 dev dsk c0t1d0s1 32 9 16 4097312 4065808 Um festzustellen wie viele Byte im Auslagerungsbereich verf gbar sind multiplizieren Sie die Zahl in der Spalte blocks mit 512 Nehmen Sie die Anzahl der Bl cke aus dem ersten Eintrag c0t3d0s0 und rechnen Sie folgenderma en 4097312 x 512 2097823744 Das Ergebnis sind etwa 2 GB 122 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 3 berpr fen Sie ob das Dateisystem gen gend Platz f r die Speicherauszugsdateien bietet Geben Sie den Befehl df kein df k var crash uname n Das Standardverzeichnis f r die savecore Dateien hei t var crash uname n Auf dem Server meinsystem hei t das Standardverzeichnis z B var crash meinsystem Das angegebene Dateisystem muss gen gend Platz f r die Speicherauszugsdateien haben Wird in den Meldungen des Befehls savecore angegeben dass im Verzeichnis var crash nicht gen gend Platz vorhanden ist kann jedes andere lokal eingegliederte Nicht NFS Dateisystem verwendet werden Es folgt eine Beispielmeldung des Befehls savecore System dump time Wed Apr 23 17 03 48 2003 savecore not enough space in var crash sf440 a 216 MB avail 246 MB needed F hren Sie die Schritte 4 und 5 aus we
216. ole finden Sie in Anhang A Protokollierung der Systemkonsole In Konsolenprotokollen wird die Ausgabe der Systemkonsole aufgezeichnet Die Konsolenprotokollierung erfasst Konsolenmeldungen so dass Sie Daten ber Systemausf lle beispielsweise Details zu Fatal Reset Fehlern und die POST Ausgabe analysieren k nnen Die Konsolenprotokollierung ist besonders wertvoll bei der Behebung von Fatal Reset Fehlern und RED State Exceptions In diesen F llen wird die Solaris Betriebssystemumgebung abrupt beendet und obwohl sie Meldungen an die Systemkonsole sendet protokolliert die Betriebssystemumgebungssoftware keine Kapitel6 Optionen zur Fehlerbehebung 119 Meldungen in Dateien des herk mmlichen Dateisystems etwa in der Datei var adm messages Die folgenden Zeilen sind ein Auszug aus der Datei var adm messages CODE BEISPIEL 6 1 Informationen in der Datei var adm messages May 9 08 42 17 Sun SFV440 a SUNW UltraSPARC IIIi ID 904467 kern info NOTICE AFTO Corrected memory RCE Event detected by CPUO at TL 0 errID Ox0000005 4 2b0814 May 9 08 42 17 Sun SFV440 a AFSR 0x00100000 lt PRIV gt 82000000 lt RCE gt AFAR 0x00000023 3 808960 May 9 08 42 17 Sun SFV440 a Fault _PC lt unknown gt J_REQ 2 May 9 08 42 17 Sun SFV440 a MB P2 BO J0601 J0602 May 9 08 42 17 Sun SFV440 a unix ID 752700 kern warning WARNING AFTO Sticky Softerror encountered on Memory Module MB P2 BO J0601 J0602 May 9 08 42 19 Sun SFV440 a SUNW Ult
217. olgende Informationen liefert LED Name Farbe Hinweis Ma nahme Betrieb Aktivit t Wenn diese LED leuchtet oder Ist diese LED ausgeschaltet gr n blinkt arbeitet das Laufwerk und wird das System mit normal Strom versorgt berpr fen Sie das DVD ROM Laufwerk und dessen Kabel Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 5 berpr fen Sie die LEDs f r die Ethernet Schnittstelle Auf der R ckseite des Systems befinden sich zwei LEDs f r die Ethernet Schnittstellen LED Name Farbe Hinweis Ma nahme Verbindung Aktivit t Wenn diese LED leuchtet Wenn diese LED ausgeschaltet gr n besteht eine Verbindung ist und Sie wissen dass der Blinkt die LED ist die Aufbau einer Verbindung Verbindung gerade aktiv In versucht wird berpr fen Sie beiden F llen arbeitet das die Ethernet Kabel Ger t normal Geschwindigkeit Wenn diese LED leuchtet ist gelb eine Gigabit Ethernet Verbindung hergestellt Ist diese LED aus ist eine 10 100 Mbit s Ethernet Verbindung hergestellt N chste Schritte Wenn Sie mit Hilfe der LEDs die Ursache eines vermuteten Problems nicht ermitteln k nnen versuchen Sie den betreffenden Server in den Diagnosemodus zu versetzen Siehe m Versetzen des Systems in den Diagnosemodus auf Seite 59 Sie haben auch die M glichkeit POST Tests auszuf hren Siehe m Identifizieren von Fehlern mit Hilfe von POST Tests auf Sei
218. olierung finden Sie in TABELLE 2 5 Leseger t f r Keine Erkennung Hinweise zur Fehlerisolierung finden Systemkonfigurationskarte Sie in TABELLE 2 5 Systemkonfigurationskarte Keine Erkennung Hinweise zur Fehlerisolierung finden Sie in TABELLE 2 5 Neben den in TABELLE 2 4 aufgef hrten FRUs enth lt das System einige kleinere austauschbare Systemkomponenten in erster Linie Kabel die von keiner Systemdiagnose direkt isoliert werden k nnen Einen Schaden an diesen Komponenten stellen Sie am ehesten fest indem Sie andere M glichkeiten ausschlie en Einige dieser FRUs sind in TABELLE 2 5 aufgef hrt Diese Tabelle enth lt auch Hinweise zur Erkennung von Problemen mit diesen Komponenten TABELLE 2 5 Nicht durch Fehlerisolierungswerkzeuge erkennbare FRUs FRU Hinweise zur Diagnose Anschlusskarte Probleme mit dieser Komponente lassen sich nur schwer von Stromversorgungskabel fiir Anschlusskarte Problemen mit ahnlichen Symptomen unterscheiden Die Firmware erzeugt viele Fehlermeldungen die besagen dass ein Zugriff auf die OpenBoot Konfigurationsvariablen nicht m glich ist zum Beispiel Could not read diag level from NVRAM ALOM zeigt an dass die Wartungs LED auf der Vorderseite leuchtet Wenn die Position des Systemschl sselschalters von ALOM erkannt werden kann aber gemeldet wird dass sich kein L fter dreht hat sich dieses Kabel wahrscheinlich gelockert oder es ist defekt Kapitel 2 Diagnose und Boot
219. oo t System has Reset t System has read and cleared tmode Indicator PSO POK is now ON Indicator PS1 POK is now ON Hos Hos t System has Reset t System has Reset Indicator SYS_FRONT SERVICE is now ON Hos t System has Reset Indicator SYS_FRONT SERVICE is now OFF Hos boo Hos Hos t System has read and cleared tmode t System has Reset t System has Reset Indicator SYS_FRONT SERVICE is now ON Indicator SYS_FRONT ACT is now ON Kapitel7 Beheben von Hardwareproblemen 163 2 Pr fen Sie das ALOM Ausf hrungsprotokoll Geben Sie Folgendes ein sc gt consolehistory run v Mit diesem Befehl wird das Protokoll angezeigt das die neueste Konsolenausgabe mit Boot Meldungen der Solaris Betriebssystemumgebung enth lt Untersuchen Sie bei der Fehlerbehebung die Ausgabe auf Hardware oder Softwarefehler die von der Betriebssystemumgebung in der Systemkonsole protokolliert wurden CODE BEISPIEL 7 32 zeigt ein Beispiel f r die Ausgabe des Befehls consolehistory run v CODE BEISPIEL 7 32 Ausgabe des Befehls consolehistory run v May 9 14 48 22 Sun SFV440 a rmclomv SC Login User admin Logged on init 0 INIT New run level 0 The system is coming down Please wait System services are now being stopped Print services stopped May 9 14 49 18 Sun SFV440 a last message repeated 1 time May 9 14 49 38 Sun SFV440 a syslogd going down on signal 15 The sy
220. orderung sc gt Befehle eingeben jedoch kann immer nur ein Benutzer auf die Systemkonsole zugreifen dies ist nur m glich wenn die Systemkonsole f r den Zugriff ber die serielle Schnittstelle und die Netzwerkverwaltungsschnittstelle konfiguriert wurde Weitere Informationen hierzu finden Sie unter m Verwendung der seriellen Verwaltungsschnittstelle auf Seite 189 m Aktivieren der Netzwerkverwaltungsschnittstelle auf Seite 191 Alle weiteren ALOM System Controller Sitzungen bieten eine passive Ansicht der Aktivit t der Systemkonsole bis sich der aktive Benutzer der Systemkonsole abmeldet Wenn Sie jedoch den Befehl console f aktivieren k nnen sich die Benutzer den Zugriff auf die Systemkonsole streitig machen Weitere Informationen hierzu finden Sie in der Sun Advanced Lights Out Manager ALOM Online Help M glichkeiten f r den Zugriff auf die Eingabeaufforderung sc gt Es gibt verschiedene M glichkeiten die Eingabeaufforderung sc gt aufzurufen Diese sind m Wenn die Systemkonsole zur seriellen Schnittstelle und zur Netzwerkverwaltungsschnittstelle geleitet wird k nnen Sie die Escape Sequenz des ALOM System Controllers eingeben m ber ein Ger t das an die serielle Verwaltungsschnittstelle angeschlossen ist k nnen Sie sich direkt beim ALOM System Controller anmelden Siehe Verwendung der seriellen Verwaltungsschnittstelle auf Seite 189 m ber die Netzwerkverwaltungsschnittstelle k nnen Sie sic
221. ornia lizenziert werden UNIX ist in den USA und in anderen L ndern eine eingetragene Marke die ausschlie lich durch X Open Company Ltd lizenziert wird Sun Sun Microsystems das Sun Logo AnswerBook2 docs sun com Sun Fire OpenBoot SunVTS Java SunSolve und Solaris sind in den USA und anderen L ndern Marken oder eingetragene Marken von Sun Microsystems Inc Alle SPARC Marken werden unter Lizenz verwendet und sind Marken oder eingetragene Marken von SPARC International Inc in den USA und in anderen L ndern Produkte die SPARC Marken tragen basieren auf einer von Sun Microsystems Inc entwickelten Architektur Die grafischen Benutzeroberfl chen OPEN LOOK und Sun wurden von Sun Microsystems Inc f r seine Benutzer und Lizenznehmer entwickelt Sun anerkennt dabei die von Xerox geleistete Forschungs und Entwicklungsarbeit auf dem Gebiet der visuellen und grafischen Benutzeroberfl chen f r die Computerindustrie Sun ist Inhaber einer nicht ausschlie lichen Lizenz von Xerox f r die grafische Benutzeroberfl che von Xerox Diese Lizenz gilt auch f r die Lizenznehmer von Sun die grafische Benutzeroberfl chen von OPEN LOOK implementieren und sich an die schriftlichen Lizenzvereinbarungen mit Sun halten Rechte der Regierung der USA Kommerzielle Software F r bei der Regierung besch ftigte Benutzer gilt die Standardlizenzvereinbarung von Sun Microsystems Inc sowie die einschl gigen Bestimmungen des FAR und seiner Erg nzungen
222. p www sun com service support Bestimmte Fremdhersteller bieten Terminalserver f r die Datenprotokollierung und zentrale Verwaltungsl sungen f r die Systemkonsole an mit denen sich die Ausgabe vieler Systeme berwachen und protokollieren l sst Je nach der Anzahl der verwalteten Systeme bieten diese Hersteller eventuell L sungen f r die Protokollierung der Systemkonsolendaten an Weitere Informationen ber die Systemkonsole finden Sie in Anhang A 120 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 bersicht ber den Speicherauszugsprozess Bei bestimmten Fehlern muss ein Sun Techniker eventuell die Systemspeicherauszugsdatei analysieren um die Ursache eines Systemfehlers zu ermitteln Zwar ist der Speicherauszugsprozess standardm ig aktiviert doch sollten Sie das System so konfigurieren dass die Speicherauszugsdatei in einem ausreichend gro en Verzeichnis gespeichert wird Au erdem sollten Sie als Standardverzeichnis f r die Speicherauszugsdatei ein anderes lokal eingegliedertes Verzeichnis ausw hlen damit Sie Systemspeicherausz ge besser verwalten k nnen In bestimmten Test und Vorproduktionsumgebungen ist dies zu empfehlen da Speicherauszugsdateien viel Speicherplatz im Dateisystem belegen k nnen Der Auszug des Systemspeichers wird im Auslagerungsbereich gespeichert Solaris verwendet standardm ig das erste definierte Auslagerungsger t Das erste Auslagerungsger t wird als Auszugs
223. prechenden Anschl ssen auf der R ckseite des Ger ts verbinden Nach dem Start des Systems ist unter Umst nden die Installation des richtigen Softwaretreibers f r die eingebaute PCI Karte erforderlich N here Informationen zur Hardware finden Sie unter Zugriff auf die Systemkonsole ber einen lokalen Grafikmonitor auf Seite 205 Anhang A Konfigurieren der Systemkonsole 179 Hinweis Im Rahmen der POST Power On Self Test Diagnose k nnen keine Status und Fehlermeldungen auf einem lokalen Grafikmonitor ausgegeben werden Die Eingabeaufforderung sc gt Der ALOM System Controller wird unabh ngig vom Sun Fire V440 Server und unabh ngig vom Stromversorgungsstatus des Systems ausgef hrt Wenn Sie einen Sun Fire V440 Server an das Stromnetz anschlie en wird der ALOM System Controller sofort gestartet und die berwachung des Systems beginnt Hinweis Um die Boot Meldungen des ALOM System Controllers anzuzeigen m ssen Sie vor dem Anschluss der Netzkabel an den Sun Fire V440 Server ein alphanumerisches Terminal mit der seriellen Verwaltungsschnittstelle verbinden Sie k nnen sich jederzeit unabh ngig vom Stromversorgungsstatus des Systems beim ALOM System Controller anmelden solange die Netzversorgung mit dem System verbunden ist und Sie die M glichkeit haben mit dem System zu kommunizieren Falls die Systemkonsole so konfiguriert ist dass sie ber die serielle Schnittstelle und die Netzwerkverwaltungsschnit
224. r Fehlersuche und behebung e Juli 2003 Physische Bezeichner Die Platine f r jedes CPU Speichermodul enth lt eindeutige per Siebdruck aufgebrachte Bezeichnungen f r jedes DIMM auf der Platine Jede Bezeichnung hat die folgende Form Bx Dy Dabei gibt x die physische Bank und y die DIMM Nummer innerhalb der Bank an Zusatzlich wird jeder DIMM Steckplatz durch eine per Siebdruck auf die Platine aufgebrachte J Nummer eindeutig gekennzeichnet Diese Steckplatznummer ist jedoch nur sichtbar wenn das DIMM aus dem Steckplatz entfernt wird Wenn Sie POST ausf hren und ein Speicherfehler gefunden wird enth lt die Fehlermeldung die physische ID des ausgefallenen DIMM und die J Nummer f r den betreffenden Steckplatz So lassen sich die auszutauschenden Teile ohne weiteres identifizieren Hinweis Zur Sicherstellung der Kompatibilit t und Maximierung der Systembetriebszeit sollten Sie DIMMs paarweise austauschen Behandeln Sie die beiden DIMMs in einer physischen Bank als eine FRU Logische Banke Logische Banke bilden die interne Speicherarchitektur des Systems ab nicht die Architektur der System FRUs Im Sun Fire V440 Server erstreckt sich jede logische Bank tiber zwei physische DIMMs Da sich die von der Firmware erzeugten Statusmeldungen nur auf logische Banke beziehen lassen sich mit Hilfe dieser Meldungen Speicherprobleme nicht auf ein bestimmtes ausgefallenes DIMM zur ckf hren POST Fehlermeldungen geben dagegen F
225. r Handbuch zur Fehlersuche und behebung Juli 2003 KAPITEL 5 berpr fen des Systems Gelegentlich ist es nicht m glich ein Serverproblem einer bestimmten Hard oder Softwarekomponente zuzuordnen In diesen F llen ist es unter Umst nden hilfreich ein Diagnosewerkzeug auszuf hren das das System einem Belastungstest unterzieht indem es kontinuierlich eine umfangreiche Reihe von Tests durchf hrt Sun bietet f r den Sun Fire V440 zwei derartige Werkzeuge an m SunVTS Software a Hardware Diagnostic Suite Hardware Diagnostic Suite ist als Erweiterung zur Software Sun Management Center erh ltlich Anweisungen f r den Einsatz der Hardware Diagnostic Suite finden Sie im Sun Management Center Software User s Guide In diesem Kapitel werden die Schritte beschrieben die f r die Verwendung der Software SunVTS zur berpr fung des Sun Fire V440 Servers erforderlich sind Im Rahmen dieser Erl uterungen werden die folgenden Themen behandelt m berpr fen des Systems mit der SunVTS Software auf Seite 104 m Ist die Software SunVTS installiert auf Seite 108 Hintergrundinformationen zu den Werkzeugen und ihrer Verwendung erhalten Sie in Kapitel 1 und Kapitel 2 Hinweis F r die in diesem Kapitel beschriebenen Prozeduren m ssen Sie mit der penBoot Firmware bereits vertraut sein und wissen wie Sie auf die Eingabeaufforderung ok zugreifen Hintergrundinformationen finden Sie unter Die Eingabeaufforderung ok
226. r Hardware Weitere Informationen ber XIR finden Sie unter XIR Externally Initiated Reset auf Seite 184 Wenn das System mit einem XIR zur Eingabeaufforderung ok hochgefahren werden kann f hren Sie folgenden Schritt aus Kapitel7 Beheben von Hardwareproblemen 169 a Geben Sie den Befehl printenv ein Mit diesem werden die Einstellungen der OpenBoot Konfigurationsvariablen angezeigt b Setzen Sie die Variable auto boot auf true die Variable diag switch auf true die Variable diag level auf max und die Variablen post trigger und obdiag trigger auf all resets c Geben Sie den Befehl sync ein um eine Speicherauszugsdatei zu erstellen Speicherauszugsdateien enthalten wertvolle Informationen die Ihren Supportanbieter bei der Diagnose von Systemproblemen unterst tzen Weitere Informationen ber Speicherauszugsdateien finden Sie unter bersicht ber den Speicherauszugsprozess auf Seite 121 und Managing System Crash Information im Solaris System Administration Guide das Bestandteil der Systemverwaltungsdokumentaton von Solaris ist Das System startet automatisch neu falls die OpenBoot Konfigurationsvariable auto boot auf true Standardwert gesetzt ist Hinweis Die Schritte 3 4 und 5 werden bei aktiviertem Hardware Watchdog Mechanismus automatisch ausgef hrt 6 Wenn das System mit einem XIR nicht zur Eingabeaufforderung ok hochgefahren werden kann f hren Sie die folgende Schritte aus a Brin
227. r das System auf Seite 130 m Vergleichen Sie die Besonderheiten Ihrer Situation mit den neuesten ver ffentlichten Informationen ber Ihr System H ufig wurden Probleme die Sie noch nicht kennen von anderen Anwendern diagnostiziert und behoben Mit Hilfe dieser Informationen k nnen Sie einen unn tigen Austausch von Teilen vermeiden die tats chlich gar nicht ausgefallen sind Informationen hierzu finden Sie unter bersicht ber aktualisierte Fehlerbehebungsinformationen auf Seite 113 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Fehlerinformationen des ALOM System Controllers Bei der Fehlerbehebung k nnen Sie grunds tzlich den ALOM System Controller als prim re Informationsquelle ber das System verwenden Der ALOM System Controller gibt Ihnen auf dem Sun Fire V440 Server Zugriff auf verschiedene Systemprotokolle und andere Informationen tiber das System auch wenn das System ausgeschaltet ist Weitere Informationen ber ALOM finden Sie unter m berwachen des Systems mit Sun Advanced Lights Out Manager auf Seite 35 m berwachen des Systems mit Sun Advanced Lights Out Manager auf Seite 86 m Sun Advanced Lights Out Manager ALOM Online Help Fehlerinformationen von Sun Management Center Wenn die Software Sun Management Center installiert ist und das System sowie die Betriebssystemumgebung aktiv sind k nnen Sie mit Management Center den Status verschiedener Komponenten im
228. r dennoch nicht startet f hren Sie die interaktiven OpenBoot Diagnostics Iests aus Siehe m Identifizieren von Fehlern anhand der interaktiven OpenBoot Diagnostics Tests auf Seite 71 Identifizieren von Fehlern anhand der interaktiven OpenBoot Diagnostics Tests Vorbereitung Melden Sie sich bei der Systemkonsole an um zur Eingabeaufforderung ok zu gelangen Anweisungen hierzu finden Sie unter m Wechseln zur Eingabeaufforderung ok auf Seite 188 Kapitel3 Identifizieren ausgefallener und fehlerhafter Komponenten 71 Da die Ausf hrung der OpenBoot Diagnostics Iests den Zugriff auf einige Hardwareressourcen erfordert die auch vom Betriebssystem verwendet werden ist nach dem Anhalten des Betriebssystems oder nach der Tastenfolge L1 A Stop A keine verl ssliche Ausf hrung dieser Tests m glich Sie m ssen das System zur cksetzen bevor Sie die OpenBoot Diagnostics Tests ausf hren Setzen Sie das System nach Beendigung der Tests erneut zur ck Wie Sie dabei vorgehen erfahren Sie im Anschluss Auszuf hrende Arbeitsschritte 1 Setzen Sie die OpenBoot Konfigurationsvariable auto boot auf false Geben Sie Folgendes ein ok setenv auto boot false 2 Setzen Sie das System zur ck oder f hren Sie einen Neustart aus 3 Starten Sie die OpenBoot Diagnostics Geben Sie Folgendes ein ok obdiag Die Eingabeaufforderung obdiag gt und das Testmen werden angezeigt Das Men ist in ABBILD
229. raSPARC IIIi ID 263516 kern info NOTICE AFTO Corrected memory CE Event detected by CPU2 at TL 0 errID 0x0000005 c52 509c Der Fehlerprotokollierungsd mon syslogd zeichnet automatisch verschiedene Systemwarnungen und Fehler in Meldungsdateien auf Standardm ig werden viele dieser Systemmeldungen in der Systemkonsole angezeigt und in der Datei var adm messages gespeichert Durch die Konfiguration der Protokollierung von Systemmeldungen k nnen Sie den Speicherort f r diese Meldungen festlegen oder die Meldungen an ein entferntes System senden lassen Weitere Informationen finden Sie unter How to Customize System Message Logging im System Administration Guide Advanced Administration das Bestandteil der Systemverwaltungsdokumentation von Solaris ist In bestimmten Fehlersituationen wird eine gro e Datenmenge an die Systemkonsole bertragen Da ALOM Protokollmeldungen in einen Ringspeicher geschrieben werden der 64 KB Daten enth lt werden die Meldungen in denen die ausgefallene Komponente genannt wird m glicherweise berschrieben Daher empfiehlt es sich eventuell weitere Optionen f r die Systemkonsolenprotokollierung zu testen beispielsweise SRS Net Connect oder L sungen von Fremdherstellern Weitere Informationen ber SRS Net Connect finden Sie im Abschnitt bersicht ber Sun Remote Services Net Connect auf Seite 116 Weitere Informationen ber SRS Net Connect finden Sie unter htt
230. rd in diesem Protokoll die Ausgabe der Betriebssystemumgebung des Servers aufgezeichnet Ausgabe des Befehls consolehistory run v May 9 14 48 22 Sun SFV440 a rmclomv SC Login User admin Logged on init 0 INIT New run level 0 The system is coming down Please wait 92 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 CODE BEISPIEL 4 9 Ausgabe des Befehls consolehistory run v Fortsetzung System services are now being stopped Print services stopped May 9 14 49 18 Sun SFV440 a last message repeated 1 time May 9 14 49 38 Sun SFV440 a syslogd going down on signal 15 The system is down syncing file systems done Program terminated 1 ok boot disk Sun Fire V440 No Keyboard Copyright 1998 2003 Sun Microsystems Inc All rights reserved OpenBoot 4 10 3 4096 MB memory installed Serial 53005571 Ethernet address 0 3 ba 28 cd 3 Host ID 8328cd03 Initializing 1MB of memory at addr 123fecc000 Initializing 1MB of memory at addr 123fe02000 Initializing 14MB of memory at addr 123 002000 Initializing 16MB of memory at addr 123e002000 Initializing 992MB of memory at addr 1200000000 Initializing 1024MB of memory at addr 1000000000 Initializing 1024MB of memory at addr 200000000 Initializing 1024MB of memory at addr 0 Rebooting with command boot disk Boot device pci 1f 700000 scsi 2 disk 0 0 File and args SunOS Release 5 8 Version
231. rderseite ausschalten c Verbinden Sie das Nullmodemkabel mit der ttyb Schnittstelle am Sun Fire V440 Server Verwenden Sie gegebenenfalls im Lieferumfang des Servers enthaltenen DB 9 oder DB 25 Kabeladapter d Schalten Sie das System ein Anweisungen zum Einschalten finden Sie im Sun Fire V440 Server Administrationshandbuch N chste Schritte Fahren Sie mit der Installation bzw der Diagnosetestsitzung fort Wenn Sie die Arbeit abgeschlossen haben beenden Sie die Sitzung durch Eingabe der Escape Sequenz des Terminalservers und schlie en Sie das Fenster Weitere Informationen ber die Herstellung einer Verbindung mit dem ALOM System Controller und dessen Verwendung finden Sie unter m Sun Advanced Lights Out Manager ALOM Online Help Anhang A Konfigurieren der Systemkonsole 195 Wenn Sie die Systemkonsole zur Schnittstelle ttyb umgeleitet haben und Sie wieder die serielle Verwaltungsschnittstelle und die Netzwerkverwaltungsschnittstelle verwenden m chten lesen Sie den folgenden Abschnitt m Referenz f r die Einstellungen der OpenBoot Konfigurationsvariablen der Systemkonsole auf Seite 209 Zugriff auf die Systemkonsole ber eine tip Verbindung Vorbereitung Bei den folgenden Schritten wird vorausgesetzt dass Sie f r den Zugriff auf die Systemkonsole des Sun Fire V440 Servers die serielle Schnittstelle eines anderen Sun Systems mit der seriellen Verwaltungsschnittstelle SERIAL MGT des Sun Fire V44
232. re enthaltenen Funktion zur automatischen Konfiguration kann das System ausgefallene Komponenten aus der Konfiguration entfernen und den Systembetrieb wiederherstellen Solange das System auch ohne die ausgefallene Komponente arbeitet ist es dank der ASR Funktionen in der Lage automatisch neu zu starten ohne dass dazu ein Eingriff von Benutzerseite erforderlich ist Die Konfiguration der ASR Einstellungen wirkt sich nicht nur auf die Behandlung bestimmter Arten von Ausf llen durch das System sondern auch darauf aus wie Sie bestimmte Probleme beheben k nnen F r den allt glichen Betrieb aktivieren Sie ASR indem Sie die OpenBoot Konfigurationsvariablen wie in TABELLE 6 1 dargestellt einstellen TABELLE 6 1 Einstellungen der OpenBoot Konfigurationsvariablen zur ASR Aktivierung Variable Einstellung auto boot true auto boot on error true diag level max diag switch true diag trigger all resets post trigger all resets diag device auf den Wert fiir boot device setzen Wenn Sie das System so konfigurieren ist sichergestellt dass die Diagnosetests bei den meisten schweren Hardware und Softwarefehlern automatisch ausgef hrt werden Mit dieser ASR Konfiguration k nnen Sie die Problemdiagnose verk rzen da die Ergebnisse der POST und OpenBoot Diagnostics Tests bereits nach dem Auftreten eines Fehlers im System verf gbar sind Weitere Informationen ber die Funktionsweise von ASR und vollst ndige Anweisungen zur
233. reibungs und Anleitungskapitel enth lt Erl uterungen der verf gbaren Fehlerbehebungsoptionen sowie Anweisungen f r die Implementierung der Fehlerbehebungsoptionen In Kapitel 7 einem Beschreibungs und Anleitungskapitel finden Sie Erl uterungen verschiedener Herangehensweisen an die Fehlerbehebung sowie Anweisungen zur Behebung von Hardwareproblemen Anhang A enth lt sowohl Anleitungen als auch Erl uterungen Es bietet Hintergrundinformationen ber die Systemkonsole und den System Controller und gibt Anweisungen zu deren Verwendung Verwenden von UNIX Befehlen Dieses Dokument enth lt unter Umst nden keine Informationen zu grundlegenden UNIX Befehlen und Verfahren z B das Herunterfahren oder Starten des Systems und das Konfigurieren von Ger ten Weiterf hrende Informationen finden Sie in den folgenden Dokumenten m Solaris Handbook for Sun Peripherals m AnswerBook2 Online Dokumentation f r die Betriebssystemumgebung Solaris m Weitere Software Dokumentationen die Sie mit Ihrem System erhalten haben xii Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Typografische Konventionen Schriftart Bedeutung Beispiele AaBbCc123 Namen von Befehlen Dateien Bearbeiten Sie die login Datei und Verzeichnissen in Mit 1s a k nnen Sie alle Dateien Bildschirmausgaben auflisten Sie haben Post AaBbCc123 Tastatureingaben im Gegensatz su zu Bildschirmausgaben des Passwort
234. rer Data Collector 116 Jbersicht ber Sun Remote Services Net Connect 116 bersicht ber die Konfiguration des Systems f r die Fehlerbehebung 117 Hardware Watchdog Mechanismus 117 Einstellungen f r die automatische Systemwiederherstellung Automatic System Recovery ASR 118 Funktionen zur Fehlerbehebung von entfernten Standorten aus 119 Protokollierung der Systemkonsole 119 bersicht ber den Speicherauszugsprozess 121 Aktivieren des Speicherauszugsprozesses 121 Testen der Speicherauszugskonfiguration 124 7 Optionen zur Fehlerbehebung 127 Bei der Fehlerbehebung zu sammelnde Informationen 128 Fehlerinformationen des ALOM System Controllers 129 Fehlerinformationen von Sun Management Center 129 Fehlerinformationen vom System 129 Aufzeichnen von Informationen ber das System 130 Inhalt v bersicht ber die Fehlerzust nde des Systems 131 Reaktion auf Fehlerzust nde des Systems 131 Reaktion auf Systemblockierungen 131 Reaktion auf Fatal Reset Fehler und RED State Exceptions 132 Unerwartete Neustarts 134 Fehlerbehebung in einem System mit reagierendem Betriebssystem 135 Fehlerbehebung in einem System nach einem unerwarteten Neustart 139 Behebung von Fatal Reset Fehlern und RED State Exceptions 151 Fehlerbehebung in einem System das nicht startet 162 Fehlerbehebung in einem blockierten System 168 A Konfigurieren der Systemkonsole 173 bersicht ber die Kommunikation mit dem System 174 Die Eingabeaufforderung
235. rmwarebefehle eingegeben und firmwarebasierte Tests ausgef hrt haben kann unter Umst nden der vorhergehende Zustand des Systems nicht wiederhergestellt werden Versuchen Sie auf jeden Fall die Systemdaten zu sichern bevor Sie die nachstehend beschriebenen Schritte ausf hren Beenden oder halten Sie auch alle Anwendungen an und setzen Sie die Benutzer von der bevorstehenden Unterbrechung des Dienstes in Kenntnis Informationen zu den geeigneten Sicherungs und Abschaltverfahren finden Sie in der Systemverwaltungsdokumentation von Solaris Auszuf hrende Arbeitsschritte 1 W hlen Sie eine Methode um zur Eingabeaufforderung ok zu gelangen Genaue Informationen finden Sie unter Die Eingabeaufforderung ok auf Seite 182 188 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 2 TABELLE A 2 enth lt diesbez glich n tzliche Hinweise TABELLE A 2 M glichkeiten f r den Zugriff auf die Eingabeaufforderung ok Zugriffsmethode Auszuf hrende Arbeitsschritte Ordnungsgem es e Geben Sie in einem Shell Tool oder Command Tool Fenster Herunterfahren der den entsprechenden Befehl ein z B shutdown oder init Solaris Eine Beschreibung der einzelnen Befehle finden Sie in der Betriebssystemumgebung Systemverwaltungsdokumentation von Solaris ALOM System e Geben Sie an der Eingabeaufforderung sc gt den ALOM Befehl Controller Befehl break break ein Der Befehl console ist ebenfalls m glich falls die o
236. rtet werden kann Den POST Test k nnen Sie aber auch ausf hren wenn sich das System nicht starten l sst und dieser Test wird ziemlich sicher die Ursachen der meisten Hardware Probleme feststellen Mit POST werden in der Regel dauerhafte Fehler erfasst Um sporadisch auftretende Probleme zu erfassen sollten Sie ein System berpr fungstool ausf hren Siehe berpr fen des Systems auf Seite 39 Was macht der POST Test Jeder Teil des POST Tests ist ein Einzeltest der eine bestimmte Hardwarekomponente auf Fehler untersucht Speichertests wie Address Bitwalk und Data Bitwalk stellen zum Beispiel fest ob an jede Adresse und in jede Datenzeile Bin rzahlen aus Nullen und Einsen geschrieben werden k nnen W hrend eines solchen Tests werden eventuell Meldungen wie folgende angezeigt 1 gt Data Bitwalk on Slave 3 1 gt Test Bank 0 In diesem Beispiel ist CPU 1 die Master CPU wie durch die Zahl 1 gt angegeben und sie ist gerade dabei den Speicher von CPU 3 zu testen wie die Meldung Slave 3 angibt 10 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Ein Testfehler gibt in diesem Fall genaue Angaben ber bestimmte integrierte Schaltungen ICs die darin enthaltenen Speicherregister oder die Datenpfadverbindungen zur ck 1 gt FEHLER TEST Data Bitwalk on Slave 3 1 gt H W under test CPU3 BO D1 J0602 side 1 Bank 1 CPU Module C3 1 gt Repair Instructions Replace items in ord
237. s CODE BEISPIEL 2 13 CODE BEISPIEL 7 14 Ausgabe des Befehls prtdiag v System Configuration Sun Microsystems sun4u Sun Fire V440 System clock frequency 177 MHZ Memory size 4GB 2 2 2 2 2 2 2 2 CPUS 2 2 2 2 2 2 2 2 2 2 2 ES CPU CPU Temperature Fan CPU Freq Size Impl Mask Die Ambient Speed Unit 0 1062 MHz 1MB US IITi 2 3 1 1062 MHz 1MB US IITi 2 3 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 IO Devices 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 Bus Freq Brd Type MHz Slot Name Model 146 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 CODE BEISPIEL 7 14 Ausgabe des Befehls prtdiag v Fortsetzung 0 pci 66 MB pcil08e abba network SUNW pci ce 0 pci 33 MB isa su serial 0 pei 33 MB isa su serial Memory Module Groups ControllerID GroupID Labels 0 0 C0 P0 B0 D0 C0 P0 B0 D1 0 I C0 P0 B1 D0 C0 P0 B1 D1 OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 OBDIAG 4 10 3 2003 05 02 20 26 8 berpr fen Sie ob alle Benutzer und Systemprozesse funktionieren Geben Sie Folgendes ein ps ef Die Ausgabe des Befehls ps ef zeigt jeden Prozess dessen Startzeit die Laufzeit und die vollst ndigen Befehlszeilenoptionen des Prozesses Um ein Systemproblem zu identifizieren untersuchen Sie die Ausgabe auf fehlende Eintr ge in der Spalte CMD CODE BEISPIEL 7 15 zeigt di
238. s Sie zwischen dem System Controller und der Systemkonsole wechseln k nnen Siehe m bersicht ber die Kommunikation mit dem System auf Seite 174 m Zugriff ber die Netzwerkverwaltungsschnittstelle auf Seite 178 Auszuf hrende Arbeitsschritte 1 Pr fen Sie das ALOM Ereignisprotokoll Geben Sie Folgendes ein sc gt showlogs Kapitel7 Beheben von Hardwareproblemen 139 CODE BEISPIEL 7 6 Das ALOM Ereignisprotokoll enth lt Systemereignisse wie R cksetzereignisse und nderungen des LED Status die seit dem letzten Systemstart aufgetreten sind CODE BEISPIEL 7 6 zeigt ein Beispiel f r ein Ereignisprotokoll aus dem hervorgeht dass die auf der Vorderseite befindliche LED Wartung erforderlich leuchtet Ausgabe des Befehls showlogs MAY 09 16 54 27 Sun SFV440 a 00060003 SC System booted MAY 09 16 54 27 Sun SFV440 a 00040029 Host system has shut down MAY 09 16 56 35 Sun SFV440 a 00060000 SC Login User admin Logged on MAY 09 16 56 54 Sun SFV440 a 00060000 SC Login User admin Logged on MAY 09 16 58 11 Sun SFV440 a 00040001 SC Request to Power On Host MAY 09 16 58 11 Sun SFV440 a 00040002 Host System has Reset MAY 09 16 58 13 Sun SFV440 a 0004000b Host System has read and cleared bootmode MAY 09 16 58 13 Sun SFV440 a 0004004f Indicator PSO POK is now ON MAY 09 16 58 13 Sun SFV440 a 0004004f Indicator PS1 POK is now ON
239. sc gt 180 Die Eingabeaufforderung ok 182 Wechseln zwischen dem ALOM System Controller und der Systemkonsole 186 Wechseln zur Eingabeaufforderung ok 188 Verwendung der seriellen Verwaltungsschnittstelle 189 Aktivieren der Netzwerkverwaltungsschnittstelle 191 Zugriff auf die Systemkonsole ber einen Terminalserver 192 Zugriff auf die Systemkonsole ber eine tip Verbindung 196 ndern der Datei etc remote 199 Zugriff auf die Systemkonsole ber ein alphanumerisches Terminal 201 Pr fen der Einstellungen der seriellen Schnittstellen f r ttyb 203 Zugriff auf die Systemkonsole ber einen lokalen Grafikmonitor 205 Referenz f r die Einstellungen der OpenBoot Konfigurationsvariablen der Systemkonsole 209 Index 211 vi Sun Fire V440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Abbildungen ABBILDUNG 1 1 ABBILDUNG 2 1 ABBILDUNG 2 2 ABBILDUNG 2 3 ABBILDUNG 2 4 ABBILDUNG 2 5 ABBILDUNG 3 1 ABBILDUNG A 1 ABBILDUNG A 2 ABBILDUNG A 3 ABBILDUNG A 4 ABBILDUNG A 5 Vereinfachtes Schema eines Sun Fire V440 Servers 4 Boot PROM und SCC 9 POST Tests Uber mehrere FRUs 12 Interaktives Men der OpenBoot Diagnostics 18 Zuordnung logischer Speicherbanke zu DIMMs 46 Nummerierung von CPU Speichermodulen 47 Auswahlen eines Werkzeugs zur Identifizierung von Hardwarefehlern 77 Umleiten der Systemkonsole an verschiedene Schnittstellen und Ger te 176 Schnittstellen f r den Anschluss von Ger ten an die Syste
240. sen Im Rahmen dieser Erl uterungen werden die folgenden Themen behandelt Fehlerbehebung in einem System mit reagierendem Betriebssystem auf Seite 135 Fehlerbehebung in einem System nach einem unerwarteten Neustart auf Seite 139 Behebung von Fatal Reset Fehlern und RED State Exceptions auf Seite 151 Fehlerbehebung in einem System das nicht startet auf Seite 162 Fehlerbehebung in einem blockierten System auf Seite 168 Au erdem enth lt das Kapitel noch die folgenden Informationen Bei der Fehlerbehebung zu sammelnde Informationen auf Seite 128 bersicht ber die Fehlerzust nde des Systems auf Seite 131 Unerwartete Neustarts auf Seite 134 127 128 Bei der Fehlerbehebung zu sammelnde Informationen Die Kenntnis einer Vielzahl von Ger ten und Erfahrungen mit den blichen Fehlern eines bestimmten Ger ts k nnen sich bei der Behebung von Systemproblemen als wertvoll erweisen Durch eine systematische Herangehensweise an die Untersuchung und L sung der Probleme eines bestimmten Systems stellen Sie sicher dass Sie die meisten Schwierigkeiten bereits im Ansatz erkennen und beseitigen k nnen Ereignisse und Fehler werden vom Sun Fire V440 Server auf verschiedene Weise angezeigt und protokolliert Je nach der Systemkonfiguration und software werden bestimmte Fehlerarten nur vor bergehend erfasst Deshalb m ssen Sie alle verf gbaren Informationen sofort beobachten und aufzeichn
241. sis SC Label SC system controller container SEGMENT SD ManR ManR UNIX Timestamp32 Wed Dec 31 19 00 00 EST 1969 ManR Fru_ Description ASSY CHLPA RMC ManR Manufacture_Loc ManR Sun_Part_No 5016346 ManR Sun_Serial_No ManR Vendor_ Name NO JEDEC CODE FOR THIS VENDOR ManR Initial HW Dash Level 03 ManR Initial HW _Rev_Level ManR Fru_Shortname CHLPA_RMC SpecPartNo 885 0084 03 frutree chassis MB Label MB system board container SEGMENT SD ManR ManR UNIX_Timestamp32 Mon Nov 4 15 35 24 EST 2002 ManR Fru_Description ASSY CHLPA MOTHERBOARD ManR Manufacture Loc Celestica Toronto Ontario Kapitel 2 Diagnose und Boot Prozess 29 CODE BEISPIEL 2 15 Ausgabe des Befehls prtfru c Fortsetzung ManR Sun_Part_No 5016344 ManR Sun_Serial_No 000001 ManR Vendor Name Celestica ManR Initial HW Dash Level 03 ManR Initial_HW_Rev_ Level 06 ManR Fru_Shortname CHLPA_MB SpecPartNo 885 0060 02 Die von prt fru angezeigten Daten variieren je nach FRU Typ In der Regel werden folgende Informationen angezeigt FRU Beschreibung Herstellername und ort Teilenummer und Seriennummer Hardwareversion Mit dem Befehl prt fru werden Informationen ber die folgenden FRUs des Sun Fire V440 Servers angezeigt ALOM Karte CPU Module DIMMs Hauptplatine SCSI Rtickwandplatine Netzteile hnliche Informationen werden vom Befehl showfru des ALOM System Controllers angezeigt Weit
242. sowie der Netzschalter offenbar nicht reagieren die Netzteile jedoch funktionieren liegt die Ursache f r das Problem wahrscheinlich beim Leseger t f r die SCC und dessen Kabel Um diese Komponenten zu testen rufen Sie den ALOM auf geben Sie den Befehl resetsc ein melden Sie sich erneut bei ALOM an und entfernen Sie die Systemkonfigurationskarte Wenn eine Warnung angezeigt wird SCC card has been removed so bedeutet dies dass das Kartenleseger t funktioniert und das Kabel intakt ist Wenn der Systemsteuerungsschalter nicht zu reagieren scheint die Position des Schalters kann von ALOM nicht gelesen werden aber der Netzschalter funktioniert und das System eingeschaltet bleibt k nnte dieses Kabel lose oder defekt sein m glicherweise liegt aber auch ein Problem mit dem Leseger t der Systemkonfigurationskarte vor was jedoch weniger wahrscheinlich ist Hinweis Die meisten Ersatzkabel f r den Sun Fire V440 Server sind nur in einem Kabelsatz mit der Sun Teilenummer 560 2713 erh ltlich 34 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 berwachen des Systems Sun stellt zwei Werkzeuge bereit die Sie bereits vor Auftreten eines Problems warnen und sp tere Ausfallzeiten verhindern Diese Werkzeuge sind m Sun Advanced Lights Out Manager ALOM m Sun Management Center Mit diesen berwachungswerkzeugen k nnen Sie bestimmte Systemeigenschaften beobachten Es ist z B m glic
243. sprochen Hierbei handelt es sich um logische nicht um physische B nke siehe CODE BEISPIEL 2 19 CODE BEISPIEL 2 19 POST Adressierung logischer Speicherb nke 0 gt Speicher Interleave auf 0 gesetzt 0 gt Bank 0 512MB 00000000 00000000 gt 00000000 20000000 0 gt Bank 1 512MB 00000001 00000000 gt 00000001 20000000 0 gt Bank 2 512MB 00000002 00000000 gt 00000002 20000000 0 gt Bank 3 512MB 00000003 00000000 gt 00000003 20000000 In der POST Fehlerausgabe siehe CODE BEISPIEL 2 20 gibt die Firmware jedoch einen Speichersteckplatzbezeichner BO D1 J0602 zur ck Der Speichersteckplatz wird mit BO D1 bezeichnet Diese Bezeichnung ist bei der Installation des DIMM auf der Platine zu sehen Der Speicherplatz wird aufserdem durch die Bezeichnung J0602 gekennzeichnet die jedoch nur zu sehen ist wenn Sie das DIMM aus dem Steckplatz nehmen CODE BEISPIEL 2 20 POST Verweis auf physische ID und logische Bank 1 gt H W under test CPU3 BO D1 J0602 side 1 Bank 1 CPU Module C3 Die Sache wird dadurch noch verwirrender dass bei der Konfiguration des Systemarbeitsspeichers zus tzlich der Begriff physische Speicherb nke ins Spiel kommt DIMMs m ssen paarweise in den einzelnen physischen B nken installiert werden und jeweils die gleiche Kapazit t und den gleichen Typ haben In den folgenden Abschnitten wird erl utert wie der Arbeitsspeicher bezeichnet wird 44 Sun Fire 440 Server Handbuch zu
244. st add net 224 0 4 gateway Sun SFV440 a syslog service starting Print services started volume management starting The system is ready Sun SFV440 a console login May 9 14 52 57 Sun SFV440 a rmclomv NOTICE keyswitch change event state UNKNOWN May 9 14 52 57 Sun SFV440 a rmclomv Keyswitch Position has changed to Unknown state May 9 14 52 58 Sun SFV440 a rmclomv NOTICE keyswitch change event state LOCKED May 9 14 52 58 Sun SFV440 a rmclomv KeySwitch Position has changed to Locked State May 9 14 53 00 Sun SFV440 a rmclomv NOTICE keyswitch change event state NORMAL May 9 14 53 01 Sun SFV440 a rmclomv KeySwitch Position has changed to On State sc gt Kapitel 7 Beheben von Hardwareproblemen 165 Hinweis In den Zeitstempeln der ALOM Protokolle wird die UTC Zeit Universal Time Coordinated angegeben in den Zeitstempeln der Solaris Betriebssystemumgebung dagegen die lokale Server Zeit Ein einzelnes Ereignis kann daher Meldungen hervorrufen die in verschiedenen Protokollen scheinbar zu verschiedenen Zeiten aufgezeichnet wurden Hinweis Der ALOM System Controller l uft unabh ngig vom System und verwendet die Standby Stromversorgung des Servers Die ALOM Firmware und Software funktionieren daher auch dann weiter wenn die Stromversorgung des Systems ausgeschaltet ist 3 Pr fen Sie das ALOM Boot Protokoll Geben Sie Folgendes ein sc gt consolehistory boot
245. ste auf die Textfolge ce0 nettest ein Men zur Konfiguration dieses Ethernet Tests TABELLE 5 1 N tzliche SunVTS Tests f r einen Sun Fire V440 Server SunVTS Tests berpr fte FRUs cputest fputest iutest CPU Speichermodul Hauptplatine lidcachetest indirekt l2cachetest 12sramtest mptest mpconstest systest disktest Festplatten Kabel SCSI Riickwandplatine dvdtest cdtest DVD Ger t Kabel Hauptplatine env6test i2c2test Netzteile L ftereinbaurahmen LEDs Hauptplatine ALOM Karte Systemkonfigurationskarte SCC CPU Speichermodul DIMMs SCSI R ckwandplatine nettest netlbtest Netzwerkschnittstelle Netzwerkkabel Hauptplatine pmemtest vmemtest DIMMs CPU Speichermodul Hauptplatine ssptest ALOM Karte sutest Hauptplatine serielle Schnittstelle ttyb usbkbtest disktest USB Ger te Kabel Hauptplatine USB Controller Kapitel5 Testen des Systems 107 8 Starten Sie den Testvorgang Klicken Sie auf die Schaltfl che Start oben links im SunVTS Fenster um die Ausf hrung der von Ihnen aktivierten Tests zu starten Status und Fehlermeldungen werden im Bereich f r Testmeldungen im unteren Abschnitt des Fensters angezeigt Sie k nnen den Testvorgang jederzeit anhalten indem Sie auf die Schaltfl che Stop klicken N chste Schritte W hrend des Testvorgangs protokolliert SunVTS alle Status und Fehlermeldungen Um diese Meldungen anzuzeigen klicken Sie entweder auf die Schaltfl
246. stellen Normalerweise verbinden Sie eines der folgenden Hardwareger te mit der seriellen Verwaltungsschnittstelle m Terminalserver m Alphanumerisches Terminal oder hnliches Ger t m Eine tip Verbindung mit einem anderen Sun Computer Diese Konfiguration garantiert den sicheren Zugriff am Installationsstandort Serielle Verwaltungsschnittstelle Netzwerkverwaltungsschnittstelle 3 Q T NENNE Serielle Schnittstelle ttyb ABBILDUNG A 2 Schnittstellen f r den Anschluss von Ger ten an die Systemkonsole Unter Umst nden geben Sie der tip Verbindung den Vorzug vor einem alphanumerischen Terminal denn mit tip k nnen Sie auf dem f r die Verbindung mit dem Sun Fire V440 Server verwendeten System Fenster und Betriebssystemfunktionen nutzen Obwohl die serielle Verwaltungsschnittstelle von der Solaris Betriebssystemumgebung als ttya erkannt wird handelt es sich bei dieser Schnittstelle nicht um eine universelle serielle Schnittstelle Wenn Sie an Ihrem Server eine universelle Schnittstelle verwenden m chten z B f r den Anschluss Anhang A Konfigurieren der Systemkonsole 177 eines seriellen Druckers verwenden Sie die normale 9 polige serielle Schnittstelle auf der R ckseite des Sun Fire V440 Diese Schnittstelle wird von der Solaris Betriebssystemumgebung als ttyb erkannt Hinweise f r den Zugriff auf die Systemkonsole ber einen Terminalserver finden Sie unter Zugriff auf die Systemkonsole ber ei
247. stem is down syncing file systems done Program terminated 1 ok boot disk Sun Fire V440 No Keyboard Copyright 1998 2003 Sun Microsystems Inc All rights reserved OpenBoot 4 10 3 4096 MB memory installed Serial 53005571 Ethernet address 0 3 ba 28 cd 3 Host ID 8328cd03 Initializing 1MB of memory at addr 123fecc000 Initializing 1MB of memory at addr 123fe02000 Initializing 14MB of memory at addr 123 002000 Initializing 16MB of memory at addr 123e002000 Initializing 992MB of memory at addr 1200000000 Initializing 1024MB of memory at addr 1000000000 164 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 CODE BEISPIEL 7 32 Ausgabe des Befehls consolehistory run v Fortsetzung Initializing 1024MB of memory at addr 200000000 Initializing 1024MB of memory at addr 0 Rebooting with command boot disk Boot device pci 1f 700000 scsi 2 disk 0 0 File and args SunOS Release 5 8 Version Generic _114696 04 64 bit Copyright 1983 2003 Sun Microsystems Inc All rights reserved Hardware watchdog enabled Indicator SYS _FRONT ACT is now ON configuring IPv4 interfaces ce0 Hostname Sun SFV440 a The system is coming up Please wait NIS domainname is Ecd East Sun COM Starting IPv4 router discovery starting rpc services rpcbind keyserv ypbind done Setting netmask of 100 to 255 0 0 0 Setting netmask of ce0 to 255 255 255 0 Setting default IPv4 interface for multica
248. sten OpenBoot Konfigurationsvariablen mit denen Sie die POST Tests steuern siehe TABELLE 2 1 beeinflussen auch die Ausf hrung der OpenBoot Diagnostics Tests Besonders darauf hingewiesen sei an dieser Stelle allerdings dass die Teststufe der OpenBoot Diagnostics mit der Variable diag level eingestellt bzw die Tests komplett unterdr ckt werden k nnen 16 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Dar ber hinaus verwenden die OpenBoot Diagnostics Tests eine besondere Variable namens test args mit der die Testausf hrung eingestellt werden kann Standardm ig enth lt die Variable test args eine Leerzeichenkette Test args kann aber auch auf ein oder mehrere reservierte Schl sselw rter gesetzt werden die unterschiedliche Auswirkungen auf die OpenBoot Diagnostics haben Zul ssige Schl sselw rter finden Sie in TABELLE 2 2 TABELLE 2 2 Schl sselw rter der OpenBoot Konfigurationsvariable test args Schl sselwort Funktion bist Startet den integrierten Selbsttest Built in Self Test BIST f r externe und Peripherieger te debug Zeigt alle Fehlermeldungen an iopath Pr ft die Bus und Interconnect Integrit t loopback Pr ft den externen Loopback Pfad des Ger ts media Pr ft den Zugriff auf die Medien externer Ger te und Peripherieger te restore Versucht den Originalzustand des Ger ts wiederherzustellen falls die vorherige Testausf hrung fehlgeschlagen ist silent Zeigt nur Fehler a
249. stmalig aufgetreten ist und POST w hrend des Neustarts nicht ausgef hrt wurde f hren Sie POST aus Ist ASR nicht aktiviert ist dies eine gute Gelegenheit ASR zu aktivieren ASR f hrt POST und OpenBoot Diagnostics Iests beim Neustart automatisch aus Wenn ASR aktiviert ist sparen Sie Zeit bei Problemdiagnose da die Ergebnisse der POST und OpenBoot Diagnostics Tests bereits nach einem unerwarteten Neustart verf gbar sind Weitere Informationen ber ASR und vollst ndige Anweisungen zur Aktivierung von ASR finden Sie im Sun Fire V440 Server Administrationshandbuch N chste Schritte Planen Sie je nach Bedarf Wartungsarbeiten f r Servicema nahmen ein 150 Sun FireTM 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 CODE BEISPIEL 7 19 Behebung von Fatal Reset Fehlern und RED State Exceptions Vorbereitung Melden Sie sich beim System Controller an um zur Eingabeaufforderung sc gt zu gelangen Weitere Informationen finden Sie unter m Die Eingabeaufforderung sc gt auf Seite 180 Hierbei wird vorausgesetzt dass die Systemkonsole standardm ig konfiguriert ist so dass Sie zwischen dem System Controller und der Systemkonsole wechseln k nnen Siehe a bersicht ber die Kommunikation mit dem System auf Seite 174 m Zugriff ber die Netzwerkverwaltungsschnittstelle auf Seite 178 Weitere Informationen ber Fatal Reset Fehler und RED State Exceptions finden Sie unter Reaktion au
250. sttests gibt werden getestet e all Alle Ger te f r die es Selbsttests gibt werden getestet Schaltet den Diagnosemodus ein oder aus Au erdem werden das Boot Ger t und die Boot Datei ausgew hlt Die Standardeinstellung ist false e true F hrt den POST Test und die OpenBoot Diagnosetests aus wenn die Bedingungen post trigger bzw obdiag trigger erf llt sind Bewirkt einen Start des Systems mit den Parametern diag device und diag file e false F hrt den POST Test und die OpenBoot Diagnosetests nicht aus auch wenn die Bedingungen post trigger und obdiag trigger erf llt sind Bewirkt einen Start des Systems mit den Parametern boot device und boot file HINWEIS Sie k nnen das System in den Diagnosemodus versetzen indem Sie diese Variable auf true setzen oder indem Sie den Schl sselschalter des Systems auf die Position Diagnose stellen Weitere Informationen finden Sie unter Versetzen des Systems in den Diagnosemodus auf Seite 59 Kapitel 2 Diagnose und Boot Prozess 13 TABELLE 2 1 OpenBoot Konfigurationsvariablen Fortsetzung OpenBoot Konfigurationsvariable Beschreibung und Schl sselw rter post trigger obdiag trigger input device output device Legt die Klasse des Reset Ereignisses fest das POST Tests oder die OpenBoot Diagnosetests ausf hrt Als Variablen k nnen einzelne Schl sselw rter oder Kombinationen der ersten drei Schl sselw rter jeweils getrennt durch ein Leerzeiche
251. t Errors 0 Hard Errors 0 Transport Errors 0 Vendor SEAGATE Product ST336607LSUN36G Revision 0207 Serial No 3JAOBWLO00002318 Size 36 42GB lt 36418595328 bytes gt Media Error 0 Device Not Ready 0 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 sd4 Soft Errors 0 Hard Errors 0 Transport Errors 0 Vendor SEAGATE Product ST336607LSUN36G Revision 0207 Serial No 3JA0AGQS00002317 Size 36 42GB lt 36418595328 bytes gt Media Error 0 Device Not Ready 0 No Device 0 Recoverable 0 Illegal Request 0 Predictive Failure Analysis 0 Kapitel7 Beheben von Hardwareproblemen 149 11 CODE BEISPIEL 7 18 berpr fen Sie ob gespiegelte RAID Ger te funktionieren Geben Sie Folgendes ein raidctl Mit diesem Befehl wird der Status von RAID Ger ten angezeigt Um ein Problem zu identifizieren untersuchen Sie die Ausgabe f r Disk Status f r die nicht OK angegeben wird Weitere Informationen ber die Konfiguration gespiegelter RAID Ger te finden Sie unter bersicht ber die Hardware Plattenspiegelung im Sun Fire V440 Server Administrationshandbuch Ausgabe des Befehls raidct1 raidetl RAID RAID RAID Disk Volume Status Disk Status c1todo RESYNCING c1todo OK c1t1do OK 12 Fuhren Sie ein Systemprufungswerkzeug wie Sun VTS oder Hardware Diagnostic Suite aus Informationen hierzu finden Sie in Kapitel 5 13 Falls der unerwartete Neustart er
252. t Hilfe der Software Sun Management Center l sst sich die Locator LED ein und ausschalten N here Informationen finden Sie in der Sun Management Center Dokumentation Kapitel3 Identifizieren ausgefallener und fehlerhafter Komponenten 57 Vorbereitung ffnen Sie entweder die Systemkonsole oder den System Controller Anweisungen hierzu finden Sie unter m Wechseln zur Eingabeaufforderung ok auf Seite 188 m Wechseln zwischen dem ALOM System Controller und der Systemkonsole auf Seite 186 Auszuf hrende Arbeitsschritte 1 Bestimmen Sie den aktuellen Status der Locator LED Gehen Sie wie nachstehend beschrieben vor m Geben Sie an der Systemkonsole Folgendes ein usr sbin locator The system locator is on m Geben Sie im ALOM System Controller Folgendes ein sc gt showlocator Locator LED is ON 2 Schalten Sie die Locator LED ein Gehen Sie wie nachstehend beschrieben vor m Geben Sie an der Systemkonsole Folgendes ein usr sbin locator n m Geben Sie im ALOM System Controller Folgendes ein sc gt setlocator on 3 Schalten Sie die Locator LED aus Gehen Sie wie nachstehend beschrieben vor m Geben Sie an der Systemkonsole Folgendes ein usr sbin locator 58 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 m Geben Sie im System Controller Folgendes ein sc gt setlocator off Versetzen des Systems in
253. te 69 Identifizieren von Fehlern mit Hilfe von POST Tests Nachfolgend erfahren Sie wie Sie POST Diagnosetests ausf hren um Fehler in einem Sun Fire V440 Server zu identifizieren Hintergrundinformationen zu den POST Diagnosetests und dem Boot Vorgang finden Sie in Kapitel 2 Kapitel3 Identifizieren ausgefallener und fehlerhafter Komponenten 69 Vorbereitung Melden Sie sich bei der Systemkonsole an um zur Eingabeaufforderung ok zu gelangen Anweisungen hierzu finden Sie unter m Wechseln zur Eingabeaufforderung ok auf Seite 188 Bei diesen Schritten wird vorausgesetzt dass sich das System im Diagnosemodus befindet Siehe m Versetzen des Systems in den Diagnosemodus auf Seite 59 Au erdem wird vorausgesetzt dass die Systemkonsole standardm ig konfiguriert ist so dass Sie zwischen dem System Controller und der Systemkonsole wechseln k nnen Siehe a bersicht ber die Kommunikation mit dem System auf Seite 174 m Zugriff ber die Netzwerkverwaltungsschnittstelle auf Seite 178 Auszuf hrende Arbeitsschritte 1 Optional Setzen Sie die OpenBoot Konfigurationsvariable diag level auf max Geben Sie Folgendes ein ok setenv diag level max diag level max Dies f hrt dazu dass die h chste Stufe der Diagnosetests ausgef hrt wird 2 Schalten Sie den Server ein Gehen Sie wie nachstehend beschrieben vor a Dr cken Sie den Netzschalter auf der Vorderseite des Servers m f
254. telle aufnehmen und in bestimmten Intervallen pr fen lassen ob der Server noch l uft Sun Management Center sendet Ihnen dann eine Warnung sobald der Server nicht mehr antwortet Add on Diagnosepaket Die Hardware Diagnostic Suite wird als separat erh ltliches Premium Paket angeboten das Sie Ihrem Sun Management Center hinzuf gen k nnen Mit diesem Paket k nnen Sie ein laufendes System in einer Produktionsumgebung untersuchen Weitere Informationen hierzu finden Sie unter berpr fen des Systems mit der Hardware Diagnostic Suite auf Seite 43 Berichterzeugungsprogramm Der Performance Reporting Manager ist ein Sun Management Center Add on mit dem Sie Berichte erstellen k nnen die ber den Status der Rechner informieren Das Programm erzeugt Berichtsdaten ber Leistung Hardware Konfigurationen Softwarepakete Patches und Alarme f r eine beliebige Auswahl verwalteter Systeme Ihres Datencenters Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Unterst tzung der berwachungswerkzeuge anderer Hersteller Sun Management Center unterst tzt Tivoli Enterprise Console BMC Patrol und HP Openview In einem heterogenen Netzwerk mit netzwerkbasierten System berwachungs oder verwaltungstools anderer Hersteller ist das f r Sie vielleicht ein gro es Plus F r wen ist das Sun Management Center gedacht Die Sun Management Center Software ist in erster Linie auf Systemadministratoren ausgerichtet
255. ter vielen berpr fen Sie die anderen LEDs oder f hren Sie einen Diagnosetest aus um die Ursache des Problems zu ermitteln Nicht zutreffend Da die Locator LED und die LED Wartung erforderlich von der 5 Volt Standby Stromversorgung des Systems gespeist werden leuchten sie auch bei Fehlern und Ausf llen die zum Herunterfahren des Systems f hren Hinweis Um den Status der System LEDs im ALOM anzuzeigen geben Sie an der Eingabeaufforderung sc gt den Befehl showenvironment ein 66 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 2 berpr fen Sie die Netzteil LEDs Jedes Netzteil besitzt vier LEDs die sich sowohl auf der Vorderseite als auch auf der R ckseite des Servers befinden Ihrem Status k nnen Sie die folgenden Informationen entnehmen LED Name Position Farbe Hinweis Ma nahme Ausbau OK oben blau Wartung erforderlich 2 LED von oben gelb Betrieb OK 3 LED von oben gr n Standby verf gbar unten gr n Wenn diese LED leuchtet kann das Netzteil gefahrlos Entfernen Sie n tigenfalls das Netzteil entfernt werden Hinweis Entfernen Sie ein ausgefallenes Netzteil nur wenn Sie ein Ersatznetzteil zur Installation bereit haben Beide Netzteile m ssen eingebaut sein damit eine ausreichende Luftzirkulation und Geh usek hlung gew hrleistet ist Wenn diese LED leuchtet besteht ein Problem mit dem Netzteil oder einem s
256. tionskarte Schwellenwerte von ALOM gemeldete Warnungen 88 90 SCSI Datenkabel Fehler isolieren 34 SCSI Ger te Probleme erkennen 21 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 SEAM Sun Enterprise Authentication Mechanism 42 SERIAL MGT Siehe serielle Verwaltungsschnittstelle Serielle Schnittstelle Anschluss 201 Serielle Verwaltungsschnittstelle SERIAL MGT definiert 174 Einsatzm glichkeiten 189 Ger te f r den Zugriff auf die Systemkonsole 174 Standardverbindung der Systemkonsole 177 tip Verbindung 196 Zugriff auf ALOM System Controller und Systemkonsole 186 show devs Befehl OpenBoot 23 showenvironment Befehl System Controller berwachen des Servers 35 Verwendung bei Fehlerbehebung bei reagierendem Betriebssystem 136 showenvironment Befehl System Controller Umgebungsdaten anzeigen 87 showf ru Befehl System Controller 91 showlogs Befehl System Controller Verwendung bei Behebung von Startproblemen 163 Verwendung bei Fehlerbehebung 151 Verwendung bei Fehlerbehebung bei reagierendem Betriebssystem 135 Verwendung bei Fehlerbehebung nach unerwartetem Neustart 139 Verwendung bei Systemiiberwachung 92 how obdiag results Befehl Verwendung bei Fehlerbehebung 129 howplat form Befehl System Controller 36 98 how post results Befehl OpenBoot Verwendung bei Fehlerbehebung 129 showrev Befehl Solaris 31 showusers Befehl System Controller 36 97
257. tromversorgung des zug nglich Systems POST Firmware Test der Kann beim Start ausgef hrt Lokal aber Hauptsystemkomponenten werden Standard istjedoch via ALOM CPUs Arbeitsspeicher und kein POST Verf gbar bei zug nglich integrierte Schaltungen der E A Br cke auf der Hauptplatine heruntergefahrenem Betriebssystem 2 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 TABELLE 1 1 bersicht ber die Diagnosewerkzeuge Fortsetzung Diagnose Remote werkzeug Typ Funktion Zugriff und Verf gbarkeit Option OpenBoot Firmware Test von Systemkomponenten Kann beim Start ausgef hrt Lokal aber Diagnostics insbesondere von Peripherie werden standardm ig via ALOM und E A Ger ten erfolgt jedoch keine zug nglich Diagnose Kann auch interaktiv ausgef hrt werden Verf gbar bei heruntergefahrenem Betriebssystem OpenBoot Firmware Anzeige verschiedener Verfiigbar bei Lokal aber Befehle Systeminformationen heruntergefahrenem via ALOM Betriebssystem zuganglich Solaris Befehle Software Anzeige verschiedener Betriebssystem erforderlich Lokal und Systeminformationen ber Netzwerk SunVTS Software Systempr fung und belastung Betriebssystem Anzeige und Tests werden parallel ausgef hrt erforderlich Die Software Steuerung SunVTS muss eventuell via separat installiert werden Netzwerk Sun Software berwachung hardwareseitiger Betriebssystem muss F r Remote Management Umgebungsbedingungen sowie sowohl auf
258. tstelle erreichbar ist k nnen Sie auf die Eingabeaufforderung des ALOM System Controllers sc gt auch ber die Eingabeaufforderung ok oder ber die Solaris Eingabeaufforderung zugreifen Weitere Informationen erhalten Sie in folgenden Abschnitten m Wechseln zur Eingabeaufforderung ok auf Seite 188 m Wechseln zwischen dem ALOM System Controller und der Systemkonsole auf Seite 186 Die Eingabeaufforderung sc gt besagt dass Sie direkt mit dem ALOM System Controller kommunizieren Es handelt sich um die erste Eingabeaufforderung die Sie sehen wenn Sie sich ber die serielle Verwaltungsschnittstelle oder die Netzwerkverwaltungsschnittstelle beim System anmelden Die Eingabeaufforderung ist vom Stromversorgungsstatus des Systems unabh ngig Hinweis Beim erstmaligen Zugriff auf den ALOM System Controller m ssen Sie f r den sp teren Zugriff einen Benutzernamen und ein Passwort anlegen Nach dieser Erstkonfiguration werden Sie bei jedem Zugriff auf den ALOM System Controller aufgefordert den Benutzernamen und das Passwort einzugeben 180 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Zugriff ber mehrere Controller Sitzungen Bis zu f nf ALOM System Controller Sitzungen k nnen gleichzeitig aktiv sein eine Sitzung ber die serielle Verwaltungsschnittstelle und bis zu vier Sitzungen ber die Netzwerkverwaltungsschnittstelle Die Benutzer jeder dieser Sitzungen k nnen an der Eingabeauff
259. uch der ALOM System Controller bietet Ihnen die M glichkeit die Tests ber einen entfernten Server auszuf hren Dar ber hinaus erm glicht ALOM die Umleitung der Systemkonsolenausgabe so dass Sie von einem entfernten Standort Tests wie die POST Diagnose anzeigen und ausf hren k nnen die normalerweise die physische N he zur seriellen Schnittstelle auf der R ckseite des Servers erfordern Mit der Software SunVTS einem System berpr fungswerkzeug k nnen Sie die Tests ebenfalls von einem entfernten Standort ausf hren ber eine Anmeldung auf dem entfernten System bzw in einer Telnet Sitzung haben Sie dabei die M glichkeit die grafische Benutzeroberfl che oder den ttya Modus des Programms zu verwenden 4 berpr ft das Werkzeug die vermutete n Quelle n des Problems Vielleicht haben Sie ja schon eine Vermutung worin das Problem besteht In diesem Fall sollten Sie ein Diagnosewerkzeug einsetzen das in der Lage ist die vermuteten Problemursachen zu testen m TABELLE 2 4 enth lt eine bersicht der austauschbaren Hardwarekomponenten die von den einzelnen Werkzeugen zur Fehleridentifizierung erkannt werden k nnen Kapitel3 Identifizieren ausgefallener und fehlerhafter Komponenten 75 m TABELLE 2 9 listet die austauschbaren Hardwarekomponenten auf die von den einzelnen System berpr fungswerkzeugen ber cksichtigt werden 5 Tritt das Problem sporadisch auf oder h ngt es mit der Software zusammen Wenn ein Proble
260. un Fire Server richtig installiert und konfiguriert wurde Damit wird ein Sun Fire Server auf g ltige Patches Hardware Betriebssystemumgebung und Konfiguration berpr ft m Sun System Handbook Ein Dokument mit technischen Informationen das Zugriff auf Diskussionsgruppen f r fast s mtliche Sun Hardware einschlie lich des Sun Fire V440 Servers bietet Supportdokumente Sicherheitsbulletins und verwandte Links Die Website von SunSolve Online ist unter der folgenden Adresse zu finden http sunsolve sun com Big Admin Diese Website ist eine universelle Ressource f r Sun Systemadministratoren Die Big Admin Website ist unter der folgenden Adresse zu finden http www sun com bigadmin 114 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 bersicht ber die Verwaltung von Firmware und Softwarepatches Sun unternimmt alles um sicherzustellen dass jedes System mit der neuesten Firmware und Software ausgeliefert wird Bei komplexen Systemen werden Fehler und Probleme jedoch erst w hrend des Einsatzes entdeckt nachdem die Systeme das Werk bereits verlassen haben H ufig werden diese Probleme durch Patches f r die Systemfirmware behoben Wenn Sie die Firmware des Systems und die Solaris Betriebssystemumgebung stets mit den neuesten empfohlenen und erforderlichen Patches aktualisieren k nnen Sie eventuell Probleme vermeiden die bereits von anderen Anwendern entdeckt und gel st wurden H ufig w
261. unktionierende Stromversorgung signalisieren Einige Diagnosewerkzeuge erm glichen die Untersuchung mehrerer Systeme von einer einzigen Konsole andere nicht W hrend einige Diagnosewerkzeuge das System durch parallele Testlaufe stark belasten f hren andere Werkzeuge ihre Tests nacheinander aus und lassen so gleichzeitig den normalen Systembetrieb zu Einige Diagnosewerkzeuge funktionieren mit Standby Stromversorgung oder wenn das System offline ist f r andere Diagnosewerkzeuge muss das Betriebssystem ausgef hrt werden TABELLE 1 1 enth lt eine vollst ndige bersicht ber die Werkzeuge Die meisten Werkzeuge werden ausf hrlich in diesem Handbuch besprochen andere werden ausf hrlicher im Sun Fire V440 Server Administrationshandbuch erl utert Zu manchen Werkzeugen gibt es eine spezielle umfassende Dokumentation Weitere Informationen hierzu finden Sie im Vorwort TABELLE 1 1 bersicht ber die Diagnosewerkzeuge Diagnose Remote werkzeug Typ Funktion Zugriff und Verf gbarkeit Option Sun Hardware berwachung der Funktionsf hig bei F r Remote Advanced Software Umgebungsbedingungen Standby Versorgung und Access Lights Out und Warnmeldungen grundlegende wenn das Betriebssystem konzipiert Manager Firmware _Fehlerisolierung Zugriff von nicht ausgef hrt wird ALOM Remote Konsole LEDs Hardware Statusanzeige des Gesamtsystems Zugriff ber Lokal aber und bestimmter Komponenten Systemgeh use Verf gbar via ALOM bei S
262. v Das ALOM Boot Protokoll enth lt Boot Meldungen von POST OpenBoot Firmware und der Solaris Software nach dem letzten Zur cksetzen des Servers Wenn Sie die Ausgabe untersuchen um ein Problem zu identifizieren suchen Sie nach Fehlermeldungen der POST und OpenBoot Diagnostics Tests CODE BEISPIEL 7 33 zeigt die Ausgabe der POST Boot Meldungen Beachten Sie dass von POST keine Fehlermeldungen zur ckgegeben wurden Unter Was bedeuten die POST Fehlermeldungen auf Seite 11 finden Sie ein Beispiel f r eine POST Fehlermeldung und weitere Informationen ber POST Fehlermeldungen CODE BEISPIEL 7 33 Ausgabe des Befehls consolehistory boot v Boot Meldungen von POST Keyswitch set to diagnostic position OBP 4 10 3 2003 05 02 20 25 Sun Fire V440 Clearing TLBs Power On Reset Executing Power On SelfTest 0 gt Sun Fire TM V440 POST 4 10 3 2003 05 04 22 08 export work staff firmware _re post post build 4 10 3 Fiesta chalupa integrated firmware_re 0 gt Hard Powerup RST thru SW 0 gt CPUs present in system 0 1 0 gt OBP gt POST Call with 00 00000000 01012000 0 gt Diag level set to MIN O gt MFG scrpt mode set NORM 0 gt I O port set to TTYA 0 gt O gt Start selftest 166 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 CODE BEISPIEL 7 33 Ausgabe des Befehls consolehistory boot v Boot Meldungen von POST Fortsetzung 1 gt Print Mem Config 1 gt Ca
263. wire Das Sun System reagiert mit der Antwort connected Das Shell Tool ist jetzt ein tip Fenster das ber die serielle Schnittstelle des Sun Systems zum Sun Fire V440 Server umgeleitet wird Auch wenn der Sun Fire V440 Server vollst ndig ausgeschaltet ist oder gerade hochf hrt wird diese Verbindung hergestellt und aufrecht erhalten Hinweis Verwenden Sie ein Shell Tool oder ein CDE Terminal beispielsweise dtterm jedoch kein Command Tool Einige tip Befehle werden in einem Command Tool Fenster eventuell nicht richtig ausgef hrt 4 Wenn Sie ttyb anstelle der seriellen Verwaltungsschnittstelle verwenden m chten gehen Sie folgenderma en vor a Leiten Sie die Systemkonsole um indem Sie die OpenBoot Konfigurationsvariablen ndern Geben Sie an der Eingabeaufforderung ok die folgenden Befehle ein ok setenv input device ttyb ok setenv output device ttyb Hinweis Ein Zugriff auf die Eingabeaufforderung sc gt und die Anzeige von POST Meldungen sind nur ber die serielle Verwaltungsschnittstelle oder die Netzwerkverwaltungsschnittstelle m glich Anhang A Konfigurieren der Systemkonsole 197 Hinweis Es gibt viele weitere OpenBoot Konfigurationsvariablen Obwohl sie keinen Einfluss darauf haben welches Hardwareger t f r den Zugriff auf die Systemkonsole verwendet wird bestimmen einige dieser Variablen welche Diagnosetests das System ausf hrt und welche Mitteilungen an der Ko
264. ysische Verbindung zwischen der seriellen Verwaltungsschnittstelle und dem Terminalserver aus Die serielle Verwaltungsschnittstelle des Sun Fire V440 Servers ist eine DTE Schnittstelle Data Terminal Equipment Datenendeinrichtung Die Anschlussbelegung der seriellen Verwaltungsschnittstelle entspricht der Anschlussbelegung f r die RJ 45 Anschltisse des Serial Interface Breakout Kabels von Cisco das f r den Cisco AS2511 RJ Terminalserver vorgesehen ist Wenn Sie einen Terminalserver eines anderen Herstellers verwenden stellen Sie sicher dass die Anschlussbelegung des Sun Fire V440 Servers derjenigen des vorgesehenen Terminalservers entspricht Wenn die Anschlussbelegung der seriellen Schnittstellen des Servers mit der Anschlussbelegung der RJ 45 Anschl sse des Terminalservers bereinstimmen stehen Ihnen zwei Verbindungsoptionen zur Verf gung m Direkter Anschluss eines Breakout Kabels f r serielle Schnittstellen an den Sun Fire V440 Server Siehe Verwendung der seriellen Verwaltungsschnittstelle auf Seite 189 m Anschluss eines Breakout Kabels f r serielle Schnittstellen an ein Patch Panel und Anschluss des Patch Panels ber ein von Sun geliefertes Straight Through Patch Kabel an den Server De i al 0050000000000 Terminal BL Seva Straight Through Kabel JARTEAMAAUNMHHANE EEE A A A IE A Patch Kabel f r serielle Verwaltungsschnittstelle
265. zeichnung Beschreibung Zugeh rige FRU s ADC Analog to Digital Converter Hauptplatine APC Advanced Power Control eine Funktion Hauptplatine der integrierten Southbridge Schaltung Bell Ein Repeater Schaltungselement das Teil Hauptplatine des Systembusses ist CRC Cyclic Redundancy Check nicht zutreffend DMA Direct Memory Access in der PCI Karte Diagnoseausgabe in der Regel ein Controller auf einer PCI Karte HBA Host Bus Adapter Hauptplatine und andere PC Inter Integrated Circuit auch mit PC Verschiedene siehe abgek rzt ein bi direktionaler serieller TABELLE 2 14 Zweidraht Datenbus der in erster Linie f r die Umgebungs berwachung und steuerung eingesetzt wird 52 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung e Juli 2003 TABELLE 2 15 In der Diagnoseausgabe verwendete Abk rzungen oder Akronyme Bezeichnung Beschreibung Zugeh rige FRU s IO Bridge JBus JTAG MAC MII NVRAM OBP PHY POST RTC RX Scan Southbridge Tomatillo TX UART UIE XBus Systembus zur integrierten Schaltung der PCI Bridge identisch mit Tomatillo Die Systemverbindungsarchitekur das hei t die Daten und Adressbusse Joint Test Access Group ein IEEE Standard 1149 1 fiir die Untersuchung von Systemkomponenten Media Access Controller die Hardware Adresse eines Ger ts das an ein Netzwerk angeschlossen ist Media Independent Interface Teil des Eth
266. zur Eingabeaufforderung ok auf Seite 188 Je nach der Einrichtung des Datencenters und dessen Netzwerk gibt es verschiedene M glichkeiten eine Verbindung mit dem ALOM System Controller herzustellen Bei den folgenden Anweisungen wird vorausgesetzt dass Sie das Sun Fire V440 System mittels eines alphanumerischen Terminals oder eines Terminalservers das bzw der an die Schnittstelle SERIAL MGT des Servers angeschlossen ist oder mit Hilfe einer telnet Verbindung ber die Schnittstelle NET MGT berwachen m chten Au erdem wird vorausgesetzt dass die Systemkonsole standardm ig konfiguriert ist so dass Sie zwischen dem System Controller und der Systemkonsole wechseln k nnen Siehe m bersicht ber die Kommunikation mit dem System auf Seite 174 m Zugriff ber die Netzwerkverwaltungsschnittstelle auf Seite 178 Sun Fire 440 Server Handbuch zur Fehlersuche und behebung Juli 2003 Auszuf hrende Arbeitsschritte 1 Geben Sie bei Bedarf die Escape Sequenz des System Controllers ein Wenn die Eingabeaufforderung sc gt noch nicht angezeigt wird geben Sie die Escape Sequenz des System Controllers ein Standardm ig besteht diese Sequenz aus der Zeichenfolge Doppelkreuz Punkt ok 2 Melden Sie sich gegebenenfalls beim ALOM an Wenn Sie noch nicht beim ALOM angemeldet sind werden Sie dazu aufgefordert Please login admin Please Enter password Geben Sie den Anmeldenamen und
Download Pdf Manuals
Related Search
Related Contents
Zanussi ZDF 3010 Dishwasher User Guide Manual Operating Réservé aux professionnels - Knittel Glass Gmbh, Saksa TOKUSHIMA BUS 入口TOKUSHIMA BUS TO KU SH IM A BUS 徳島 Equator EW 620 User's Manual Tripp Lite Cat6 Gigabit Snagless Molded Patch Cable (RJ45 M/M) - Blue, 2-ft. LP-10BP-EN User Manual - Contronics Engineering BV Copyright © All rights reserved.
Failed to retrieve file