Home

Guide de diagnostic des serveurs Sun Fire X4500/X4540

image

Contents

1. Sun Fire X4500 Server Rear 36 3K 38 39 40 4l 42 43 44 45 46 47 96 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 EXEMPLE DE CODE F 3 R capitulatif de l utilitaire hd Suite CGE3 C ET 24 25 c6t2 c6t6 12 123 GEL CES O 1 c6t0 c6t4 b b ne aas amii da ai ia Re summary Vendor HITACHI AMI AMI TEAC Total Storage Devices 15 2 3 4 5s 6 Te 8 9 10 Tiz c5t0 c5t4 c8t0 c8t4 c7t0 c7t4 c t0 c t4 cot0 cot4 it tt FE 4 tt Sit tt tt Att tt s sesess Sun Fire X4500 Server Front Model Count HDS7225SBSUN250G 12 Virtual CDROM 1 Virtual Floppy 1 DV W516GA 1 SES CHET CBCS COUT 7t3 CIET CLEZ ClE7 cot3 COC7 A A A A A A A A A A 26 27 28 29e 30 31 32 33 34 35 CSt2 amp 5t6 c8t2 c8t c7t2 c7t6 ciEt2 cit cOt2 cOt6 14 15 16 LTs 18 19 20 21 22 233 CH L GCHES CCI COES C7EL 765 CLEL CLES COL COS A A A A A A A A A A La commande suivante affiche le type de plate forme x64 TABLEAU F 3 hd p platform Sun Fire X4500 Server La commande suivante affiche le nom de p riph rique cXEtY partir du chemin de p riph rique de stockage PCI de Solaris TABLEAU F 4 hd w pci 3 0 pci1022 7458 a pcillab 11ab 1 disk 0 0 c7t0 pci 3 0 pci1022 7458 a pcillab 11ab 1 disk 0 0 La commande suivante affiche la partition fdisk pour chaque nom de p rip
2. L cran Advanced Settings Param tres avanc s s affiche S lectionnez IPMI 2 0 Configuration Configuration IPMI 2 0 L cran correspondant s affiche S lectionnez l option de menu LAN Configuration Configuration LAN L cran correspondant s affiche D terminez l adresse IP du serveur a S lectionnez l option IP Assignment Affectation d adresse IP que vous voulez utiliser DHCP ou Static Statique a Si vous choisissez DHCP l adresse IP du serveur est extraite du serveur DHCP de votre r seau et s affiche au format suivant Current IP address in BMC XXX XXX XXX XXX a Si vous choisissez Static pour affecter l adresse IP manuellement proc dez comme suit i Tapez l adresse IP dans le champ IP Address Adresse IP Vous pouvez galement entrer le masque de sous r seau et les param tres par d faut de la passerelle dans leurs champs respectifs ii S lectionnez Commit Valider et appuyez sur Retour pour valider les modifications iii S lectionnez Refresh Actualiser et appuyez sur Return Retour pour voir les nouveaux param tres dans le champ Current IP address in BMC Adresse IP actuelle dans le BMC D marrez un navigateur Web et tapez l adresse IP du processeur de service dans la zone d adresse du navigateur Lorsque vous y tes invit tapez un nom d utilisateur et un mot de passe comme suit User Name root Annexe B Journaux d v nements et codes POST 41 10 11
3. Affichage des informations sur les composants avec IPMItool Vous pouvez afficher des informations sur les composants mat riels du syst me Le logiciel fait r f rence ces composants en tant que p riph riques d unit s rempla ables sur site FRU Pour lire les informations d inventaire des FRU sur ces serveurs vous devez d abord avoir programm les ROM des FRU Une fois cette op ration effectu e vous pouvez voir une liste compl te des donn es de FRU disponibles en utilisant la commande fru print comme indiqu dans l exemple suivant seuls deux p riph riques de FRU sont indiqu s dans l exemple mais vous pouvez afficher tous les p riph riques ipmitool I lanplus H lt IPADDR gt U root P changeme fru print FRU Device Description Builtin FRU Device ID 0 Board Mfg BENCHMARK ELECTRONICS Board Product ASSY SERV PROCESSOR X4X00 Board Serial 0060HSV 0523000195 Board Part Number 501 6979 02 Board Extra 000 000 00 Board Extra HUNTSVILLE AL USA Board Extra b302 Board Extra 06 Board Extra GRASP Product Manufacturer SUN MICROSYSTEMS Product Name ILOM FRU Device Description sp net0 fru ID 2 Product Manufacturer MOTOROLA Product Name FAST ETHERNET CONTROLLER Product Part Number MPC8248 FCC Product Serial 00 03 BA D8 73 AC Product Extra OT Product Extra 00 03 BA D8 73 AC Chapitre 4 Utilisation d IPMitool pour afficher les informations syst me 147
4. Fermer la fen tre du fichier journal la fen tre est ferm e Remarque Pour enregistrer les fichiers journaux vous devez enregistrer les fichiers journaux sur un autre syst me r seau ou un support amovible Lorsque vous utilisez le CD de diagnostic amor able le serveur d marre partir du CD Par cons quent les fichiers journaux du test ne se trouvent pas sur le disque dur du serveur et sont supprim s lorsque vous mettez le serveur sous tension 18 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 ANNEXE A Utilisation d IPMItool pour afficher les informations syst me Cette annexe contient des informations sur l utilisation de l Intelligent Platform Management Interface IPMI pour afficher des informations de surveillance et de maintenance relatives votre serveur Elle contient les sections suivantes propos d IPMI page 20 propos d IPMitool page 20 Connexion au serveur avec IPMItool page 21 Utilisation d IPMItool pour lire les capteurs page 23 Utilisation d IPMItool pour afficher le journal SEL System Event Log du processeur de service ILOM page 26 Affichage des informations sur les composants avec IPMItool page 29 Affichage et r glage des DEL de statut page 30 19 propos d IPMI IPMI est une interface de gestion de mat riel ouverte et standard qui permet aux syst mes embarqu s de communiquer Les inform
5. ft0 fm0 fail 3Dh ok 29 0 Predictive Failure Deasserted ft0 fmO0 led ooh ns 29 0 Generic Device 20h 19h 0 ft0 fml fail 3Eh ok 29 1 Predictive Failure Deasserted ft0 fml led ooh ns 29 1 Generic Device 20h 19h 1 ft0 fm2 fail 3Fh ok 29 2 Predictive Failure Deasserted ft0 fm2 1led ooh ns 29 2 Generic Device 20h 19h 2 ft1 fm0 fail 40h ok 29 3 Predictive Failure Deasserted ft1 fm0 led ooh ns 29 3 Generic Device 20h 19h 3 fti fmi fail 41h ok 29 4 Predictive Failure Deasserted ft1 fml led ooh ns 29 4 Generic Device 20h 19h 4 ft1 fm2 fail 42h ok 29 5 Predictive Failure Deasserted ft1 fm2 led ooh ns 29 5 Generic Device 20h 19h 5 ft0 fm0 f0 speed 43h ok 29 0 6000 RPM ft0 fml f0 speed 44h ok 29 1 6000 RPM ft0 fm2 f0 speed 45h ok 29 2 6000 RPM ft1 fm0 f0 speed 46h ok 29 3 6000 RPM ftl fml f0 speed 47h ok 29 4 6000 RPM ft1 fm2 f0 speed 48h ok 29 5 6000 RPM Annexe A Utilisation d IPMitool pour afficher les informations syst me 25 D autres requ tes peuvent inclure un type sp cifique de capteur La commande dans l exemple suivant renvoie une liste de tous les capteurs de temp rature dans l enregistrement des donn es des capteurs ipmitool I lanplus H lt IPADDR gt U root P changeme sdr type temperature sys tempfail 03h ok 23 0 Predictive Failure Deasserted mb t_amb 05h ok 7 0 25 degrees C fp t_amb 14h ok 12 0 25 degrees C ps t_amb 1Bh ok 10 0 24 degrees
6. Inspection initiale du serveur page 1 1 Utilisation du logiciel de diagnostic SunVTS page 2 15 Utilisation d IPMItool pour afficher les informations syst me page A 19 Journaux d v nements et codes POST page B 37 DEL de statut page C 51 Gestion des erreurs page D 61 Utilisation de l interface graphique du processeur de service I LOM pour afficher les informations syst me page E 77 Utilitaire hd page F 89 CHAPITRE 1 Inspection initiale du serveur Ce chapitre aborde les sujets suivants m Organigramme sur le d pannage lors des visites de maintenance page 1 m Collecte des informations sur la visite de maintenance page 3 m Inspection du syst me page 3 m D pannage des probl mes de module DIMM page 7 Organigramme sur le d pannage lors des visites de maintenance L organigramme suivant vous aide d panner le serveur FIGURE 1 1 Organigramme de d pannage Pour effectuer cette t che R unissez des informations sur la visite de maintenance initiale Recherchez tous les probl mes de mise sous tension Effectuez une inspection visuelle externe et une inspection visuelle interne Affichez les journaux d v nements et les messages de l autotest de l allumage du BIOS Affichez les journaux du processeur de service et les informations sur le capteur Affichez les journaux du pr
7. 00 Pr paration de la CPU pour initialisation du syst me d exploitation par copie de tout le contexte du BSP vers tous les processeurs d applications pr sents REMARQUE les AP restent dans l tat CLI HLT 61 70 Erreur OEM POST Cette plage est r serv e aux fabricants de chipsets et de syst mes L erreur associ e cette valeur peut varier en fonction de la plate forme 172 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 ANNEXE G Identification des DEL de statut et de panne Cette annexe contient des informations sur les DEL externes et internes du serveur Sun Fire X4540 Ce chapitre aborde les sujets suivants m Fonctions du panneau avant page 174 m Fonctions du panneau arri re page 176 m DEL de statut internes page 178 Les sections d crivent les contr les et les indicateurs des panneaux avant et arri re du serveur Sun Fire X4540 Elles d crivent les DEL de statut externes que vous pouvez voir l ext rieur du serveur Des sections suppl mentaires d crivent des DEL de statut et de panne internes qui ne sont visibles que lorsque le capot du disque dur le capot du contr leur syst me et le capot du ventilateur sont retir s Les figures et les tableaux suivants d crivent les fonctions et les DEL de statut qui sont visibles l ext rieur du serveur m La FIGURE G 1 Fonctions du panneau avant du serveur Sun Fire X4540 page 174 m La FIGURE G 2 C
8. Boot Settings Configure Settings k o kkkkkkkkkkkkkkkkk kkkkkkkkkkkkkkkkkkkkkkkkkkkkxxkkxx x x during System Boot Boot Settings Configuration Boot Device Priority Hard Disk Drives x k Eor Select Screen i iai Select Item x Enter Go to Sub Screen F1 General Help ci F10 Save and Exit ESC Exit kkkkkkkkkkk kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkS 3 S lectionnez Boot Settings Configuration Configuration des param tres d initialisation L cran Boot Settings Configuration s affiche FIGURE 6 5 cran de configuration des param tres d initialisation du menu Boot Initialisation du BIOS Boot kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk Boot Settings Configuration Allows BIOS to skip k kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk k certain tests while Quick Boot Disabled booting This will System Configuration Display Disabled decrease the time Quiet Boot Disabled needed to boot the Language English system AddOn ROM Display Mode Force BIOS Bootup Num Lock On Wait For F1 If Error Disabled Interrupt 19 Capture Disabled x EE Select Screen i aia Select Item i 4 Change Option w F1 General Help F10 Save and Exit ESC Exit x kkkkkkkkkkkkkkk
9. bille ou un stylet pour appuyer sur le bouton d alimentation et le maintenir enfonc pendant quatre secondes pour couper l alimentation lectrique et passer en mode d alimentation de secours Lorsque l alimentation lectrique est coup e la DEL d alimentation OK situ e sur le panneau avant clignote toutes les trois secondes pour indiquer que le serveur fonctionne en mode d alimentation de secours Reportez vous la FIGURE 1 2 Attention Lorsque vous utilisez le bouton d alimentation pour entrer en mode d alimentation de secours l alimentation alimente toujours la carte GRASP Graphics Redirect and Service Processor et les ventilateurs d alimentation lectrique indiqu s lorsque la DEL d alimentation OK clignote Pour mettre le serveur compl tement hors tension d branchez les cordons d alimentation CA du panneau arri re du serveur Chapitre 1 Inspection initiale du serveur 5 FIGURE 1 2 Panneau avant du serveur Sun Fire X4500 Bouton de DEL d alimentation OK recherche PA OA m OO 07 ommo 1 Ports USB 2 2 Retirez les capots des composants y compris le capot du disque dur le capot du contr leur syst me et le capot du ventilateur si n cessaire Pour plus d informations sur le retrait des capots des composants reportez vous au Sun Fire X4500 Server Service Manual Manuel d entretien du serveur Sun Fire X4500 819 4359 3 Examinez les DEL de statut internes qui peuvent
10. tat CLI HLT de00 Pr paration de la CPU pour initialisation du syst me d exploitation par copie de tout le contexte du BSP vers tous les processeurs d applications pr sents REMARQUE les AP restent dans l tat CLI HLT 8613 Initialisation des registres PM et PM PCI au d but du test POST Initialisation d un pont multi h te si le syst me le prend en charge D finition des options ECC avant l effacement de la m moire Activation des lignes d horloge PCI X dans le 8131 0024 D compression et initialisation de n importe quels modules BIOS de plate forme 862a Initialisation de la ROM BBS 002a DIM Device Initialization Manager g n rique D sactivation de toutes les unit s 042a Unit s ISA PnP D sactivation de toutes les unit s 052a Unit s PCI D sactivation de toutes les unit s 122a Unit s ISA Initialisation des unit s statiques 152a Unit s PCI Initialisation des unit s statiques 252a Unit s PCI Initialisation des unit s de sortie 202c Initialisation de diff rentes unit s D tection et initialisation de l adaptateur vid o install dans le syst me ayant des ROM en option 002e Initialisation de toutes les unit s de sortie 0033 Initialisation du module d initialisation silencieuse Configuration de la fen tre pour affichage des informations texte 0037 Affichage d un message de connexion des informations CPU du message de touche de configuration et des informations OEM 4538 Unit
11. 200 Pre Init Time stamp Power Supply psl pwrok State Deasserted 300 Pre Init Time stamp Entity Presence psl prsnt Device Present Des qualificateurs vous permettent d affiner et de limiter la sortie du journal SEL Pour ne voir que les premiers enregistrements NUM ajoutez ce mot comme qualificateur la commande Pour voir les derniers enregistrements NUM utilisez ce qualificateur Par exemple pour voir les trois derniers enregistrements dans le journal SEL tapez la commande suivante ipmitool I lanplus H lt IPADDR gt U root P changeme sel elist last 3 800 Pre Init Time stamp Entity Presence psl prsnt Device Absent 900 Pre Init Time stamp Phys Security sys intsw Gen Chassis intrusion a00 Pre Init Time stamp Entity Presence ps0 prsnt Device Present Pour voir plus d informations d taill es sur un v nement particulier vous pouvez utiliser la commande se1 get ID dans laquelle vous pr cisez un ID d enregistrement de journal SEL Par exemple ipmitool I lanplus H lt IPADDR gt U root P changeme sel get 0x0a00 SEL Record ID 0a00 Record Type 02 Timestamp 07 06 1970 01 53 58 Generator ID 0020 EvM Revision 04 Sensor Type Entity Presence Annexe A Utilisation d IPMlitool pour afficher les informations syst me 27 Sensor Number 12 Event Type Generic Discrete Event Direction Assertion Event Event Data RAW O1ffff Description Device Present Sensor ID ps
12. Event ID ID de Num ro d v nement dans l ordre partir de 1 l v nement Time Stamp Date et heure auxquelles s est produit l v nement Si le serveur Horodatage NTP Network Time Protocol est activ pour r gler l heure du processeur de service l horloge du processeur de service utilisera le temps universel Pour plus d informations sur les horodatages reportez vous la section Interpr tation des horodatages du journal des v nements page 130 Sensor Name Nom du composant pour lequel un v nement a t enregistr Les Nom du capteur abr viations des noms de capteurs correspondent aux composants suivants sys syst me ou ch ssis e p0 processeur 0 e pl processeur 1 e io carte d E S e ps alimentation lectrique e fp panneau avant e ft plateau de ventilateur e mb carte m re Sensor Type Type de capteur de l v nement sp cifi Type de capteur Description Description de l v nement 4 Pour effacer le journal des v nements cliquez sur le bouton Clear Event Log Effacer le journal des v nements Une bo te de dialogue de confirmation s affiche 5 Cliquez sur OK pour effacer toutes les entr es du journal 6 Si le probl me du serveur n est pas vident apr s avoir consult les journaux et les informations du processeur de service ILOM passez la section Ex cution de tests de diagnostic l aide de SunVTS page 154 Chapitre 3 Utilis
13. ILOM FRU Device Description sp net0 fru ID 2 Product Manufacturer MOTOROLA Product Name FAST ETHERNET CONTROLLER Product Part Number MPC8248 FCC Product Serial 00 03 BA D8 73 AC Product Extra O1 Product Extra 00 03 BA D8 73 AC Affichage et r glage des DEL de statut Dans les Nom du produit toutes les DEL sont command es activement Dans des DEL command es activement le processeur de service est charg des commandes I2C qui activent et d sactivent chaque broche GPIO pour chaque cycle de flashage Utilisez la commande IPMltool suivante pour lire le statut de la DEL ipmitool I lanplus H lt IPADDR gt sunoem led get lt sensor ID gt Utilisez la commande IPMItool suivante pour d finir le statut de la DEL ipmitool I lanplus H lt IPADDR gt sunoem led set lt sensor ID gt lt LED mode gt Ces deux commandes peuvent fonctionner en m me temps sur tous les capteurs en rempla ant a11 par l ID du capteur De cette fa on vous pouvez facilement obtenir une liste de toutes les DEL et de leur statut avec une seule commande 30 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Reportez vous aux sections ID de capteur de DEL page 31 et Modes des DEL page 33 pour plus d informations sur les variables dans ces commandes ID de capteur de DEL Toutes les DEL du serveur sont repr sent es par deux capteurs a Un enregistrement de localisateur de p riph rique g n r
14. IPMItool Une fois le package IPMltool install vous pouvez acc der des informations d taill es sur l utilisation et la syntaxe des commandes sur la page du manuel qui est install Dans une ligne de commande tapez la commande suivante man ipmitool Connexion au serveur avec IPMItool Pour une connexion sur une interface distante vous devez fournir un nom d utilisateur et un mot de passe L utilisateur par d faut avec un acc s administrateur est root avec le mot de passe changeme Cela signifie que vous devez utiliser les param tres U et P pour passer le nom d utilisateur et le mot de passe sur la ligne de commande comme indiqu dans l exemple suivant 138 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 ipmitool I lanplus H lt IPADDR gt U root P changeme chassis status Remarque Si vous rencontrez des probl mes avec la syntaxe de la commande sur votre syst me d exploitation vous pouvez utiliser la commande et le param tre ipmitool h pour d terminer les param tres qui peuvent tre pass s avec la commande ipmitool sur votre syst me d exploitation Vous pouvez aussi vous reporter la page du manuel d IPMltool en tapant man ipmitool Remarque Dans les exemples de commande de cette annexe le nom d utilisateur par d faut root et le mot de passe par d faut changeme sont indiqu s Vous devez taper le nom d utilisateur et le mot de passe qui ont t d finis su
15. 100 Pre Init Time stamp Entity Presence psl prsnt Device Absent 200 Pre Init Time stamp Entity Presence io f0 prsnt Device Absent 300 Pre Init Time stamp Power Supply ps0 vinok State Asserted Num ros et noms de capteurs dans les v nements SEL En fonction de la commande IPMI que vous utilisez le num ro de capteur affich pour un v nement peut appara tre dans des formats l g rement diff rents Consultez les exemples suivants m Le num ro du capteur ps1 prsnt alimentation lectrique 1 pr sente peut appara tre au format 1Fh ou Ox1F m 38h est quivalent 0x38 m 4Bh est quivalent 0x4B La sortie de certaines commandes peut ne pas afficher le nom du capteur avec le num ro de capteur correspondant Pour voir tous les noms de capteurs dans le serveur et les num ros de capteurs correspondants vous pouvez utiliser la commande suivante ipmitool H 129 144 82 21 U root P changeme sdr elist sys id 00h ok 23 0 State Asserted sys intsw O1h ok 23 0 sys psfail 02h ok 23 0 Predictive Failure Asserted 146 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Dans l exemple de sortie ci dessus le nom de capteur se trouve dans la premi re colonne et le num ro de capteur correspondant dans la deuxi me Pour obtenir une explication d taill e de tous les capteurs class s par nom reportez vous au Suppl ment relatif Integrated Lights Out Manager
16. 27 28 29 30 31 32 33 34 35 CHE2 CCHEG C4tE2 C4t6 762 CYE6 C6E2 G6t6 CiL2 CILE6 COE2 cots 12 13 14 LES 16 17 18 T9 20 21 22 23 CSEL c5t5 CAL GAES c7tli 7t5 CELL COS CLEL lt5 COEL co t5 t tt 0 Ts 2 3 4 5 6 Tz 8 gi 10 11 c5t0 c5t4 c4t0 c4t4 c7t0 c7t4 c6t0 c6t4 c t0 c t4 co0t0 cot4 b b tt t RFE t Tey tt t REH t t Lesesee SunFireXx4500 Front Summary Vendor Model Count HITACHI HDS7225SBSUN250G 12 HITACHI HDS7250SASUN500G 2 Total Storage Devices 14 Partition Type Count Solaris2 6 None 3 Otheros 3 98 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 TABLEAU F 6 Sortie de l utilitaire hd d une liste de partition fdisk Suite LinuxNative Solaris LinuxNative IFS NTFS Total partition type 14 La commande suivante permet d afficher le num ro d emplacement physique du disque dur son nom logique et son statut pr sent ou absent du serveur Sun Fire X4500 TABLEAU F 7 hd q Voici un exemple de sortie r pertoriant le num ro d emplacement physique du disque dur son nom logique et son statut du serveur Sun Fire X4500 EXEMPLE DE CODE F 4 Sortie de l utilitaire hd r pertoriant le num ro et le statut de l emplacement physique Num ro d emplacement physique NI OO O1 amp H DONNER RE BRR H O1 amp ND HO NI OO O
17. 67 189 Index 203 204 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008
18. Sensor Specific Events Event Log 4 event entries Event ID Time Stamp Sensor Name Sensor Type Description 4 1213111969 16 01 01 ps1 vinok Power Supply State Asserted Asserted 3 12 31 1969 16 01 01 ps0 prent Entity Presence Device Removed Device Absent Asserted 2 1213111969 16 00 57 ps1 prsnt Entity Presence Device Inserted Device Present Asserted 1 1213171969 16 00 56 ps1 pwrok Power Supply State Deasserted Asserted 3 S lectionnez une cat gorie d v nements que vous voulez afficher dans le journal partir du menu d roulant Vous pouvez choisir parmi les types d v nements suivants m Les v nements sp cifiques au capteur Ces v nements sont li s un capteur sp cifique pour un composant par exemple un capteur de ventilateur ou un capteur d alimentation m Les v nements g n r s par le BIOS Ces v nements sont li s des messages d erreur g n r s dans le BIOS a Les v nements du logiciel de gestion du syst me Ces v nements sont li s des v nements qui se produisent dans le logiciel ILOM 128 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Une fois que vous avez choisi une cat gorie d v nements le tableau Event Log Journal des v nements est mis jour avec les v nements sp cifiques Les champs du journal des v nements sont d crits dans le TABLEAU 3 1 TABLEAU 3 1 Champs du journal des v nements Champ Description
19. e NMI vidage d interruption non masquable Envoie une NMI la CPU Utilis e uniquement pour le d bogage e R initialisation r initialise la CPU mais pas le processeur de service DEL de statut internes Le serveur Sun Fire X4500 poss de des DEL de carte de statut internes pour la carte CPU les emplacements de CPU et de module DIMM sur la carte CPU Consultez les figures et les tableaux suivants pour en savoir plus sur les DEL qui sont visibles l ext rieur du serveur Le TABLEAU C 2 et le TABLEAU C 3 d crivent les DEL internes La FIGURE C 4 d crit les DEL du disque et du plateau de ventilateur Le TABLEAU C 2 d crit les DEL du disque et du plateau de ventilateur La FIGURE C 6 d crit l emplacement des DEL et des boutons Le syst me comporte des DEL internes sur les disques les plateaux de ventilateur et les emplacements PCI 56 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Le TABLEAU C 3 r pertorie des DEL internes TABLEAU C 3 DEL internes Nom Couleur Fonction Disques Statut Vert Clignotant les donn es sont transf r es l unit est OK Erreur Orange Erreur une op ration de maintenance est requise Retrait autoris Bleu L unit est pr te tre retir e Op ration de maintenance autoris e Plateaux de ventilateur Statut Vert L unit est OK Erreur Orange Erreur une op ration de maintenance est requise CPU Reportez vous la FIGURE C 6 Le
20. es corrig es dans la RAM CHIPKILL fournit une d tection correction d erreur 4 bits de m moire de type x4 Activation des lignes d horloge PCI X dans le 8131 20 R affectation de toutes les CPU une seule adresse SMBASE Le BSP est d fini pour que son point d entr e corresponde A000 0 Si moins de 5 connecteurs CPU sont pr sents sur la carte les points d entr e sont s par s par des octets 8000h Si plus de 4 connecteurs CPU sont pr sents les points d entr e sont s par s par des octets 200h Le module CPU est charg de la r affectation de la CPU l adresse appropri e REMARQUE les AP restent dans l tat INIT 24 D compression et initialisation de n importe quel module BIOS de plate forme 30 Initialisation de l interruption de gestion de syst me 2A Initialisation de diff rentes unit s via DIM 2C Initialisation de diff rentes unit s D tection et initialisation de l adaptateur vid o install dans le syst me ayant des ROM en option 2E Initialisation de toutes les unit s de sortie 31 Allocation de m moire pour le module ADM et d compression du module Attribution du contr le au module ADM pour l initialisation Initialisation des modules de langue et de police ADM Activation du module ADM 33 Initialisation du module d initialisation silencieuse Configuration de la fen tre pour affichage des informations texte 37 Affichage d un message de connexion des informations CPU du message de touc
21. ft1 fmO fail 40h ok 29 3 Predictive Failure Deasserted ft1 fmO0 led 00h ns 29 3 Generic Device 20h 19h 3 ftl fml fail 41h ok 29 4 Predictive Failure Deasserted ft1 fml led 00h ns 29 4 Generic Device 20h 19h 4 ft1l fm2 fail 42h ok 29 5 Predictive Failure Deasserted ft1 fm2 led 00h ns 29 5 Generic Device 20h 19h 5 ft0 fmO f0 speed 43h ok 29 0 6000 RPM ft0 fml f0 speed 44h ok 29 1 6000 RPM ft0 fm2 f0 speed 45h ok 29 2 6000 RPM ftl fmO0 f0 speed 46h ok 29 3 6000 RPM ftl fml f0 speed 47h ok 29 4 6000 RPM ft1l fm2 f0 speed 48h ok 29 5 6000 RPM D autres requ tes peuvent inclure un type sp cifique de capteur La commande dans l exemple suivant renvoie une liste de tous les capteurs de temp rature dans l enregistrement des donn es des capteurs ipmitool I lanplus H lt IPADDR gt U root P changeme sdr type temperature sys tempfail 03h ok 23 0 Predictive Failure Deasserted mb t_amb 05h ok 7 0 25 degrees C fp t_amb 14h ok 12 0 25 degrees C ps t_amb 1Bh ok 10 0 24 degrees C io t _amb 22h ok 15 0 23 degrees C p0 t core 2Ch ok 3 0 35 degrees C pl t core 35h ok 3 1 36 degrees C Utilisation d IPMItool pour afficher le journal SEL System Event Log du processeur de service ILOM Le journal SEL System Event Log du processeur de service ILOM permet de stocker tous les v nements syst
22. occurred on last boot press F1 to continue Une erreur Hyper Transport sync flood s est produite lors du dernier d marrage appuyez sur F1 pour continuer PCI SERR PERR Erreur syst me Un Sync floods se produit sur les Journal DMI Fatale ou de parit sur un bus PCI Journal SEL du processeur de service HyperTransport la machine se r initialise et les informations d erreur sont conserv es apr s la r initialisation Le BIOS consigne A Hyper Transport sync flood error occurred on last boot press F1 to continue Une erreur Hyper Transport sync flood s est produite lors du dernier d marrage appuyez sur F1 pour continuer 196 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 TABLEAUH 1 R capitulatif de la gestion des erreurs de mat riel Suite Consign e journal DMI ou SEL du processeur Erreur Description Gestion de service Fatale Erreur de Le BIOS ne Le BIOS affiche un message d erreur Journal DMI Non fatale microcode lors trouve pas ou ne consigne l erreur dans DMI et de l autotest de peut pas charger d marre l allumage du la mise jour du BIOS microcode CPU dans la CPU Ce message est susceptible d appara tre lorsqu une nouvelle CPU est install e sur un contr leur syst me avec un BIOS ancien Dans ce cas le BIOS doit tre mis jour Somme de La v rification de Le BIOS affiche un message d erreur Journal DMI Non fatale contr le CMOS la somme de co
23. pour afficher les informations de surveillance et de maintenance de votre serveur Elle contient les sections suivantes Cr ation d une connexion s rie vers le processeur de service page 78 Affichage des journaux d v nements du processeur de service ILOM page 79 Affichage des informations sur les composants rempla ables page 83 Affichage des lectures du capteur de temp rature de tension et de ventilateur page 85 Pour plus d informations sur l utilisation de l interface graphique du processeur de service ILOM pour effectuer la maintenance du serveur configurer des alertes par exemple reportez vous au Guide d administration de Sun Integrated Lights Out Manager 819 1160 Si l un des journaux ou des crans d informations indique une erreur de module DIMM reportez vous aux sections D pannage des probl mes de module DIMM page 7 et Gestion des erreurs de module DIMM par le syst me page 117 Si le probl me du serveur n est pas vident apr s avoir consult les journaux et les informations du processeur de service ILOM passez la section Ex cution de tests de diagnostic l aide de SunVTS page 154 77 78 Cr ation d une connexion s rie vers le processeur de service Pour effectuer une connexion s rie au processeur de service 1 Connectez un c ble s rie du port de gestion s rie RJ 45 de votre processeur de service ILOM un terminal 2 Appuyez sur la
24. propos d IPMI 137 propos d IPMItool 138 Page de manuel d IPMItool 138 Connexion au serveur avec IPMItool 138 Activation de l utilisateur anonyme 139 Modification du mot de passe par d faut 139 Configuration d une cl SSH 140 Utilisation d IPMItool pour lire les capteurs 140 Lecture du statut des capteurs 140 Lecture de tous les capteurs 140 Lecture de capteurs sp cifiques 141 Sommaire vii Utilisation d IPMItool pour afficher le journal SEL System Event Log du processeur de service ILOM 143 Affichage du journal SEL avec IPMltool 144 Effacement du journal SEL avec IPMItool 145 Utilisation du cache du r f rentiel des donn es des capteurs SDR 145 Num ros et noms de capteurs dans les v nements SEL 146 Affichage des informations sur les composants avec IPMltool 147 Affichage et r glage des DEL de statut 148 ID de capteur de DEL 148 Modes des DEL 150 Groupes de capteur de DEL 151 Utilisation de scripts IPMltool pour les tests 152 7 Utilisation du logiciel de diagnostic SunVTS 153 propos du logiciel de diagnostic SunVTS 153 Acc s SunVTS 154 Documentation SunVTS 154 Ex cution de tests de diagnostic l aide de SunVTS 154 Utilisation du CD de diagnostic amor able 154 Fichiers journaux SunVTS 155 Configuration requise 155 Utilisation du CD de diagnostic amor able 155 Consultation des fichiers journaux SunVTS 156 G Affichage des journaux d v nements et des codes POST 159 Affichage des journ
25. rence 705 1439 154 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Fichiers journaux SunVTS SunVTS permet d acc der quatre fichiers journaux diff rents Le journal d erreur de test Sun VTS contient les messages d erreur de test SunVTS horodat s Le nom du chemin du fichier journal est var sunvts logs sunvts err Ce fichier n est cr que lorsqu une erreur de test SunVTS se produit Le journal d erreur de noyau SunVTS contient les erreurs de sonde et de noyau SunVTS horodat es Les erreurs de noyau SunVTS sont li es l ex cution de SunVTS et non aux tests des p riph riques Le nom du chemin du fichier journal est var sunvts logs vtsk stderr txt Ce fichier n est cr que lorsque SunVTS signale une erreur de noyau SunVTS Le journal d informations Sun VTS contient les messages d informations g n r s lorsque vous lancez et arr tez les sessions de test SunVTS Le nom du chemin du fichier journal est var sunvts logs sunvts in o Ce fichier n est cr que lorsqu une session de test SunVTS est ex cut e Le journal de messages du syst me Solaris est un journal de tous les v nements Solaris g n raux consign s par syslogd Le nom du chemin du fichier journal est var adm messages Configuration requise Pour utiliser le CD de diagnostic amor able du serveur Sun Fire X4540 vous devez disposer d un lecteur CD ROM USB d un clavier d une souris et d un cran raccord s
26. s PCI Initialisation des unit s IPL 5538 Unit s PCI Initialisation des unit s g n rales 8600 Pr paration de la CPU pour initialisation du syst me d exploitation par copie de tout le contexte du BSP vers tous les processeurs d applications pr sents REMARQUE les AP restent dans l tat CLI HLT 46 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Points de contr le des codes POST Les points de contr le des codes POST correspondent au groupe de points de contr le le plus important au cours de la pr initialisation du BIOS Le TABLEAU B 2 d crit le type de points de contr le qui peuvent tre g n r s lors de la phase POST du BIOS Ces points de contr le deux chiffres correspondent la sortie du port 80 le port d E S principal TABLEAU B 2 Points de contr le des codes POST Code POST Description 03 D sactivation de NMI de la parit de la vid o EGA et des contr leurs DMA ce stade seuls les acc s ROM se font vers GPNV Si la taille BB est gale 64 Ko ROM Decode doit tre activ en dessous de FFFF0000h USB doit pouvoir fonctionner dans le segment E000 HT doit programmer l initialisation NB et l initialisation OEM et peut les programmer si n cessaire au d but du POST BIOS ce qui revient remplacer les valeurs par d faut des variables du noyau 04 V rification de l octet de diagnostic CMOS pour d terminer si l alimentation de la batterie fonctionn
27. 1 Contr les et indicateurs du panneau avant Nom Couleur Description 1 Bouton DEL de Blanc recherche 2 Erreur syst me Blanc 3 Alimentation Vert Fonctionnement 4 Bouton Gris d alimentation du syst me 5 DEL de panne Orange avant 6 DEL de panne Orange arri re 7 DEL de surchauffe Orange Les op rateurs peuvent allumer cette DEL distance pour pouvoir rep rer le serveur dans une salle de serveur bond e Appuyez pour mettre hors tension Une pression sur le bouton DEL de recherche pendant cinq secondes ALLUME tous les indicateurs pendant 15 secondes Allum Une op ration de maintenance est requise Fixe L alimentation est activ e Clignotant L alimentation de secours est activ e mais l alimentation principale est d sactiv e teint L alimentation est d sactiv e Pour mettre sous tension l alimentation principale pour tous les composants du serveur Allum Erreur li e au disque dur ou au ventilateur Allum Erreur li e la source d alimentation ou au contr leur syst me maintenance requise Allum Lorsque le syst me est en surchauffe 2 Examinez les DEL du panneau arri re pour voir si des composants ne fonctionnent pas correctement La FIGURE 1 3 indique les fonctions du panneau arri re Le TABLEAU 1 2 d crit chaque fonction Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 FIGURE 1 3 DEL du panneau arri re du serveu
28. 81 et les deux derniers au port 80 44 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 TABLEAU B 1 Codes POST Code POST Description 00d0 Sortie de POR initialisation de l espace de configuration PCI activation de SMBus 8111 00d1 BAT du contr leur de clavier activation depuis PM conomie d nergie CPUID dans CMOS vide 00d2 D sactivation du cache redimensionnement complet de la m moire et v rification de l activation du mode Flat 0043 D tections de m moire et redimensionnement du bloc d initialisation cache d sactiv et APIC IO activ 01d4 Test de la m moire de base 512 Ko Ajustement des strat gies et mise en cache des premiers 8 Mo 01d5 Copie du bloc d initialisation de la m moire ROM vers la m moire RAM inf rieure Le BIOS s ex cute maintenant en dehors de la m moire RAM 01d6 S quence de touches et v rification de la m thode sp cifique de l OEM pour d terminer si la r cup ration du BIOS est forc e Si le code suivant est E0 la r cup ration du BIOS s ex cute Test de la somme de contr le du BIOS principal 01d7 Restauration de CPUID transfert du module d interface d ex cution du bloc d initialisation vers la RAM d termine si l ex cution flash s rie est n cessaire 01d8 D compression du module d ex cution dans la m moire RAM Stockage des informations CPUID en m moire 01d9 Copie du BIOS principal dans la m moire Oida Prise de contr le du POST B
29. Affichage et r glage des DEL de statut Dans ces serveurs toutes les DEL sont command es activement c est dire que le processeur de service est charg des commandes I2C qui activent et d sactivent chaque broche GPIO pour chaque cycle de flashage La commande IPMItool pour lire le statut de la DEL est la suivante ipmitool I lanplus H lt IPADDR gt sunoem led get lt sensor ID gt La commande IPMItool pour r gler le statut de la DEL est la suivante ipmitool I lanplus H lt IPADDR gt sunoem led set lt sensor ID gt lt LED mode gt Il est possible d ex cuter ces deux commandes en m me temps sur tous les capteurs en rempla ant a11 par l ID du capteur De cette fa on vous pouvez facilement obtenir une liste de toutes les DEL et de leur statut avec une seule commande Reportez vous aux sections ID de capteur de DEL page 148 et Modes des DEL page 150 pour plus d informations sur les variables dans ces commandes ID de capteur de DEL Toutes les DEL du serveur sont repr sent es par deux capteurs m Un enregistrement de localisateur de p riph rique g n rique d crit l emplacement du capteur dans le syst me Il poss de le suffixe Led et est le nom contenu dans les commandes led set et led get Vous pouvez obtenir une liste de tous ces capteurs en ex cutant la commande sdr list generic a Un capteur de panne Digital Discrete surveille le statut de la broche de DEL et il est activ lorsque la D
30. C io t_amb 22h ok 15 0 23 degrees C p0 t core 2Ch ok 3 0 35 degrees C pl t core 35h ok 3 1 36 degrees C Utilisation d IPMItool pour afficher le journal SEL System Event Log du processeur de service ILOM Le journal SEL System Event Log du processeur de service ILOM permet de stocker tous les v nements syst me Vous pouvez afficher le journal SEL avec IPMItool Cette rubrique comprend les sections suivantes m Affichage du journal SEL avec IPMltool page 26 m Effacement du journal SEL avec IPMltool page 28 a Utilisation du cache du r f rentiel des donn es des capteurs SDR page 28 a Num ros et noms de capteurs dans les v nements SEL page 29 Affichage du journal SEL avec IPMItool Deux commandes IPMI distinctes vous permettent de voir des niveaux diff rents en d tails dans le journal SEL du processeur de service ILOM m Pour afficher le journal SEL du processeur de service ILOM avec un niveau minimal de d tails tapez la commande sel list ipmitool I lanplus H lt IPADDR gt U root P changeme sel list 100 Pre Init Time stamp Entity Presence 0x16 Device Absent 200 Pre Init Time stamp Entity Presence 0x26 Device Present 300 Pre Init Time stamp Entity Presence 0x25 Device Absent 400 Pre Init Time stamp Phys Security 0x01 Gen Chassis intrusion 500 Pre Init Time stamp Entity Presence 0x12 Device Present 26 Guide de diagnostic de
31. Lecture des capteurs La page de lecture des capteurs s affiche Reportez vous la FIGURE 3 3 Chapitre 3 Utilisation de l interface graphique du processeur de service ILOM pour afficher les informations syst me FIGURE 3 3 Page Sensor Readings Lecture des capteurs ABOUT REFRESH LOG OUT Us ministrator er Sun Integrated Lights Out M Sun Microsystems System Information System Monitoring Configuration User Management Maintenance Sensor Readings Event Logs Locator Indicator Sensor Readings View readings for temperature voltage or fan sensors Select a sensor type category an Sensors z7 Sensor GEETE EH 77 sensors State Asserted sys id State Asserted sys intsw Predictive Failure Deasserted sys psfail Predictive Failure Deasserted sys tempfail Predictive Failure Deasserted sys fanfail Normal mb t_amb 24 degrees C Normal mb v_bat 3 232 Volts Normal mb v_ 3v3sthy 3 217 Volts Unknown mb v_ 3v3 Not Available Unknown mby_ 5v Not Available _Show Thresholds 3 S lectionnez le type de lectures de capteur que vous voulez afficher dans le menu d roulant Vous pouvez s lectionner All Sensors Tous les capteurs Temperature Sensors Capteurs de temp rature Voltage Sensors Capteurs de tension ou Fan Sensors Capteurs de ventilateur 134 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Les lectures du capteur s affichent Le TABLEAU 3 2 d crit l
32. a device E Chassis Information Type Part Number Serial Number Board Information Manufacturer Product Name Serial Number Part Number Product Information Manufacturer Name Product Name Serial Number Part Number Rack Mount Chassis 541 0250 01 0060HSI 0503AM0387 BENCHMARK ELECTRONICS ASY MOTHERBRD GALAXY 1 2 0060HSV 0503000313 500 6974 01 SUN MICROSYSTEMS GALAXY 1 0503AMF 040 602 2813 01 3 Choisissez un composant dans la liste d roulante Les informations sur le composant s lectionn s affichent 4 Si le probl me du serveur n est pas vident apr s avoir consult les informations sur les composants rempla ables passez la section Ex cution de tests de diagnostic l aide de SunVTS page 154 Affichage des lectures du capteur de temp rature de tension et de ventilateur Cette section d crit comment afficher les lectures du capteur de temp rature de tension et de ventilateur du serveur Sun Fire X4540 132 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Six capteurs de temp rature sont surveill s Ils g n rent tous des v nements IPMI consign s dans le journal SEL lorsqu un seuil sup rieur est d pass Trois de ces lectures de capteur sont utilis es pour ajuster les vitesses du ventilateur et effectuer d autres actions telles que l allumage des DEL et la mise hors tension du ch ssis Ces capteurs et leurs seuils respectifs sont le
33. arri re sys psfail led chec de l alimentation syst me sys tempfail led Surchauffe du syst me sys fanfail led chec du ventilateur syst me bp power led Alimentation du panneau arri re bp locate led Localisation du panneau arri re bp alert led Alerte du panneau arri re fp power led Alimentation du panneau avant Annexe A Utilisation d IPMlitool pour afficher les informations syst me 31 32 TABLEAU A 2 ID de capteur de DEL Suite ID de capteur de DEL Description fp locate led fp alert led io hddO led io hdd1 led io hdd2 led io hdd3 led io f0 led p0 led p0 d0 led p0 d1 led p0 d2 led p0 d3 led pl led p1 d0 led pl d1 led p1 d2 led p1 d3 led ft0 fm0 led ft0 fm1 led ft0 fm2 led ft1 fm0 led ft1 fm1 led ft1 fm2 led Localisation du panneau avant Alerte du panneau avant chec du disque dur 0 chec du disque dur 1 chec du disque dur 2 chec du disque dur 3 chec du ventilateur d E S chec de la CPU 0 chec de la CPU 0 et du module DIMM 0 chec de la CPU 0 et du module DIMM 1 chec de la CPU 0 et du module DIMM 2 chec de la CPU 0 et du module DIMM 3 chec de la CPU 1 chec de la CPU 1 et du module DIMM 0 chec de la CPU 1 et du module DIMM 1 chec de la CPU 1 et du module DIMM 2 chec de la CPU 1 et du module DIMM 3 chec du plateau du ventilateur 0 et du module 0 chec du plateau du ventilateur 0 et du module 1 chec du plateau du ventilateur 0 et du module 2
34. au serveur sur lequel vous effectuez les diagnostics Utilisation du CD de diagnostic amor able Pour utiliser le CD de diagnostic amor able du serveur Sun Fire X4540 pour effectuer des diagnostics 1 2 Installez le lecteur de CD ROM USB sur le serveur Sun Fire X4540 Une fois le serveur sous tension ins rez le CD de diagnostic amor able du serveur Sun Fire X4540 705 1439 dans le lecteur de DVD ROM Red marrez le serveur en appuyant sur F2 au d but du red marrage afin de pouvoir modifier le param tre BIOS de priorit du p riph rique d amor age Lorsque le menu principal du BIOS s affiche acc dez au menu d amor age du BIOS Les crans du BIOS contiennent des instructions de navigation dans le BIOS Chapitre 5 Utilisation du logiciel de diagnostic SunVTS 155 5 Dans le menu d amor age du BIOS s lectionnez Boot Device Priority Priorit du p riph rique d amor age L cran correspondant appara t 6 S lectionnez le lecteur de DVD ROM utiliser en tant que p riph rique d amor age principal 7 Enregistrez puis fermez les crans du BIOS 8 Red marrez le serveur Lorsque le serveur red marre partir du CD ins r dans le lecteur de DVD ROM le syst me d exploitation Solaris est amorc puis le logiciel Sun VTS d marre et ouvre sa premi re fen tre de l interface graphique 9 Dans l interface graphique de Sun VTS appuyez sur Entr e ou cliquez sur le bouton Start D
35. chec du plateau du ventilateur 1 et du module 0 chec du plateau du ventilateur 1 et du module 1 chec du plateau du ventilateur 1 et du module 2 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Modes des DEL Vous devez fournir les modes du TABLEAU A 3 dans les commandes led set pour sp cifier le mode dans lequel vous voulez placer la DEL TABLEAU A 3 Modes des DEL Mode Description OFF TEINT DEL teinte ON ALLUM E DEL fixe STANDBY 100 ms allum e 2 900 ms teinte ALIMENTATION DE SECOURS SLOW LENT Vitesse du clignotement 1 Hz FAST RAPIDE Vitesse du clignotement 4 Hz Groupes de capteur de DEL Comme chaque DEL a son propre capteur et peut tre contr l e ind pendamment les capteurs peuvent se chevaucher En particulier il existe des DEL distinctes d finies pour les DEL d alimentation de localisation et d alerte sur les panneaux avant et arri re Il est souhaitable que ces capteurs soient li s afin que les DEL des panneaux avant et arri re puissent tre contr l es en m me temps Ceci est possible via l utilisation des enregistrements d association d entit s Il s agit des enregistrements du SDR qui contiennent une liste des entit s consid r es comme faisant partie d un groupe Pour chaque enregistrement d association d entit nous d finissons galement un autre enregistrement de localisateur de p riph rique g n rique pour indiquer au
36. d alimentation qui ne sont plus sp cifi es pendant plus de 100 ms provoquent un arr t 4 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Inspection externe du serveur Pour effectuer une inspection visuelle du syst me externe 1 Examinez les DEL de statut externes qui peuvent indiquer un dysfonctionnement des composants Pour conna tre l emplacement des DEL et avoir une description de leur comportement reportez vous la section Fonctions du panneau avant page 174 2 V rifiez que rien dans l environnement du serveur ne g ne l entr e d air ou ne fait un contact qui pourrait couper l alimentation 3 Si le probl me n est pas vident passez la section suivante Inspection interne du serveur page 5 Inspection interne du serveur Pour effectuer une inspection visuelle du syst me interne 1 Choisissez une m thode pour mettre le serveur hors tension et passer du mode d alimentation principale au mode d alimentation de secours m Arr t progressif utilisez un stylet ou un stylo bille non conducteur pour enfoncer et rel cher le bouton d alimentation situ sur le panneau avant Cette op ration permet d arr ter correctement un syst me d exploitation ACPI Advanced Configuration and Power Interface Les serveurs qui n utilisent pas un syst me d exploitation ACPI basculent imm diatement en mode d alimentation de secours Arr t d urgence utilisez un stylo
37. de l image d ex cution des diff rents modules BIOS Remplissage de la zone libre dans le segment F000h avec OFFh Initialisation de la table de routage IRQ Microsoft Pr paration du module de langue d ex cution D sactivation de l affichage de la configuration du syst me si n cessaire A4 Initialisation du module de langue d ex cution A7 Affichage de l cran de configuration du syst me s il est activ Initialisation des CPU avant le d marrage ce qui inclut la programmation des MTRR Chapitre 6 Affichage des journaux d v nements et des codes POST 171 TABLEAU 6 2 Points de contr le des codes POST Suite Code POST Description A8 Pr paration de la CPU pour l initialisation du syst me d exploitation y compris des valeurs finales MTRR A9 Attente de l entr e des informations utilisateur dans l cran de configuration si n cessaire AA D sinstallation des vecteurs POST INT1Ch et INTO9h Annulation de l initialisation du module ADM AB Pr paration de BBS pour l initialisation Int 19 AC Programmation des chipsets NB SB n cessaires la fin du test POST juste avant l attribution du contr le au code d initialisation du syst me d exploitation Programmation de la mise en cache du BIOS syst me m moire vive fant me 0F0000h Portage pour traiter les programmations OEM la fin du test POST Copie des donn es OEM de POST_DSEG vers RUN_CSEG B1 Enregistrement du contexte syst me pour ACPI
38. des errata 78 110 106 107 69 63 R activation du cache pour le processeur d initialisation et application dans le BSP des corrections des errata 106 107 69 et 63 si n cessaire En cas de modification d instructions CPU mixtes les erreurs sont recherch es et consign es et une fr quence appropri e pour toutes les CPU est recherch e et appliqu e REMARQUE les AP restent dans l tat CLI HLT HT d finit les valeurs finales de fr quences et de largeurs de liaisons Cette routine est appel e apr s le calcul de la fr quence CPU pour viter les erreurs de programmation Initialisation du contr leur de clavier compatible 8042 D tection de la pr sence d une souris PS 2 D tection de la pr sence d un clavier dans le port KBC Chapitre 6 Affichage des journaux d v nements et des codes POST 169 TABLEAU 6 2 Points de contr le des codes POST Suite Code POST Description 0E Test et initialisation de diff rents p riph riques d entr e Mise jour des variables du noyau D routement du vecteur INTO9h pour que le gestionnaire POST INTO9h obtienne le contr le pour IRQ1 D compression de tous les modules de langue de logo BIOS et de logo Silent 13 Initialisation des registres PM et PM PCI au d but du test POST initialisation d un pont multi h te si le syst me le prend en charge D finition des options ECC avant l effacement de la m moire REDIRECTION crit imm diatement les donn
39. diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Messages d erreur de module DIMM du BIOS Le BIOS affiche et consigne trois types de message d erreur de module DIMM m NODE n Memory Configuration Mismatch Les conditions suivantes provoquent ce message d erreur Les modules DIMM ne sont pas coupl s ex cution en mode 64 bits au lieu de 128 bits La vitesse des modules DIMM n est pas la m me Les modules DIMM ne prennent pas en charge les erreurs ECC Les modules DIMM ne sont pas enregistr s Le MCT s est arr t cause d erreurs dans le module DIMM Le type de module de DIMM tampon ne correspond pas La g n ration de module DIMM I ou Il ne correspond pas Le CL T de module DIMM ne correspond pas Les banques sur un module DIMM deux c t s ne correspondent pas L organisation des modules DIMM ne correspond pas 128 bits Des informations Trc ou Trfc sont manquantes sur le SPD NODE n Paired DIMMs Mismatch NODE n Paired DIMMs Mismatch La condition suivante affiche ce message d erreur Les paires de modules DIMM ne sont pas les m mes ou Checksum ne correspond pas NODE n DIMMs Manufacturer Mismatch Les conditions suivantes affichent ce message d erreur Le fabricant des modules DIMM n est pas pris en charge Seuls les modules DIMM Samsung Micron Infineon et SMART sont pris en charge DEL de panne de module DIMM Dans le serveur Sun Fire X4500 la carte CPU contient huit empl
40. du BIOS h te En permanence via NTP si NTP est activ sur le processeur de service Le NTP par cavalier est activ pour r cup rer rapidement d une mise jour erron e provenant du BIOS ou de l utilisateur Les serveurs NTP fournissent le temps universel Donc si NTP est activ sur le processeur de service son horloge sera au format UTC Via l interface de ligne de commande l interface Web ILOM et IPMI Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Affichage des informations sur les composants rempla ables Selon le composant s lectionn les informations relatives au fabricant au nom du composant au num ro de s rie et au num ro de r f rence peuvent s afficher Pour afficher les informations relatives au composant rempla able 1 Connectez vous au processeur de service en tant qu administrateur ou op rateur pour atteindre l interface graphique Web ILOM a Tapez l adresse IP du processeur de service du serveur dans votre navigateur Web L cran Sun Integrated Lights Out Manager Login connexion Sun Integrated Lights Out Manager s affiche b Tapez vos nom d utilisateur et mot de passe La premi re fois que vous tentez d acc der au processeur de service ILOM vous tes invit taper le nom d utilisateur et le mot de passe par d faut Les nom d utilisateur et mot de passe par d faut sont Nom d utilisateur par d faut root Mot de passe par d faut changeme 2
41. du menu Advanced Avanc s affiche FIGURE 6 3 cran de configuration IPMI 2 0 du menu Advanced Avanc du BIOS Advanced kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk IPMI 2 0 Configuration View all events in the k kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk x BMC Event Log Status Of BMC Working x View BMC System Event Log It will take up to Reload BMC System Event Log 60 Seconds approx Clear BMC System Event Log to read all LAN Configuration BMC SEL records PEF Configuration BMC Watch Dog Timer Action Disabled koek Select Screen kk Select Item Enter Go to Sub Screen FI General Help F10 Save and Exit ESC Exit kkkkkkkkkkk kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkS c Sur l cran IPMI 2 0 Configuration Configuration IPMI 2 0 s lectionnez View BMC System Event Log Afficher journal SEL du BMO Le journal se g n re en 60 secondes environ puis il s affiche l cran 5 Si le probl me avec le serveur n est pas vident passez la section Using the ILOM Service Processor GUI to View System Information page 49 ou la section Using IPMitool to View System Information page 61 Chapitre 6 Affichage des journaux d v nements et des codes POST 161 propos de l autotest de l allumage POST Le BIOS
42. du syst me fournit un autotest de l allumage rudimentaire Apr s la mise sous tension l autotest de l allumage effectue les t ches suivantes m Il v rifie les p riph riques de base n cessaires au fonctionnement du serveur a Ilteste la m moire les contr leurs de disque LSI SAS1068E m Il teste et num re les disques connect s a linitialise les deux contr leurs Intel Dual Gigabit Ethernet L avancement de l autotest est indiqu par des codes POST Ces codes s affichent dans l angle inf rieur droit de l cran VGA du syst me lorsque le test est suffisamment avanc pour initialiser l cran Toutefois les codes s affichent au cours du test et disparaissent trop rapidement de l cran pour tre lus reportez vous la section Codes POST page 166 Une autre m thode d affichage des codes POST consiste rediriger la sortie de la console vers un port s rie reportez vous la section Redirection de la sortie de la console page 163 Ce chapitre contient les sections suivantes m Pr sentation du test POST BIOS de la m moire page 162 m Redirection de la sortie de la console page 163 a Modification des options du POST page 164 m Codes POST page 166 m Points de contr le des codes POST page 168 Pr sentation du test POST BIOS de la m moire Le test POST BIOS de la m moire est effectu de la mani re suivante 1 Le premier m gaoctet de la m moire DRAM est
43. est utilis e Il imprime le message d avertissement du disque qui comprend un horodatage indiquant la date d apparition de l v nement SE Vous permet de sp cifier n importe quel fichier syslog pr c dent g n ralement var adm messages n avec n importe quel message d avertissement de disque 94 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 TABLEAU F 1 Options hd Suite Option Description m Mappe les diff rentes paires possibles de disques pour le syst me du serveur Sun Fire X4500 Cette option de la commande est utile lors du test de l interaction disque disque d un disque un autre dans des emplacements s par s sur le serveur Sun Fire X4500 Pour plus de performances et d autre logiciel de fichiers vous pouvez cr er le pool de disques de plusieurs fa ons Cette option fournit des appariements distincts en fonction des mappages logique physique test s actuellement dans le syst me Les types de mappage pris en charge sont les suivants e Adjacent paires de disques qui se trouvent sur des contr leurs h tes Marvell adjacents e Cross paires de disques qui se trouvent sur des contr leurs h tes Marvell diff rents e Front2back paires de disques qui se trouvent sur les lignes avant et arri re Diagonal paires de disques qui se trouvent des emplacements en diagonale Traduit le chemin de p riph rique PCI de stockage brut Solaris par le nom de p ri
44. et les corrections des errata 78 110 106 107 69 63 C6 R activation du cache pour le processeur d initialisation et application dans le BSP des corrections des errata 106 107 69 et 63 si n cessaire En cas de modification d instructions CPU mixtes les erreurs sont recherch es et consign es et une fr quence appropri e pour toutes les CPU est recherch e et appliqu e REMARQUE les AP restent dans l tat CLI HLT Annexe B Journaux d v nements et codes POST 47 TABLEAU B 2 Points de contr le des codes POST Suite Code POST Description C7 HT d finit les valeurs finales de fr quences et de largeurs de liaisons Cette routine est appel e apr s le calcul de la fr quence CPU pour viter les erreurs de programmation 0A Initialisation du contr leur de clavier compatible 8042 0B D tection de la pr sence d une souris PS 2 0C D tection de la pr sence d un clavier dans le port KBC 0E Test et initialisation de diff rents p riph riques d entr e Mise jour des variables du noyau D routement du vecteur INTO9h pour que le gestionnaire POST INTO9h obtienne le contr le pour IRQ1 D compression de tous les modules de langue de logo BIOS et de logo Silent 13 Initialisation des registres PM et PM PCI au d but du test POST initialisation d un pont multi h te si le syst me le prend en charge D finition des options ECC avant l effacement de la m moire REDIRECTION crit imm diateme
45. faut changeme 2 Dans l onglet System Monitoring Surveillance du syst me choisissez Event Logs Journaux des v nements La page System Event Logs Journaux des v nements syst me s affiche Reportez vous la FIGURE E 1 pour voir un exemple de page d informations Annexe E Utilisation de l interface graphique du processeur de service ILOM pour afficher les informations syst me 79 FIGURE E 1 Page System Event Logs Journaux des v nements syst me ABOUT REFRESH LOG OUT System Information System Monitoring Configuration User Management Remote Control Maintenance Sensor Readings Event Logs Locator Indicator System Event Logs View sensor specific BIOS generated or system management software event logs Select an event log category Sensor Specific Events z Event Log 4 event entries Event ID Time Stamp Sensor Name Sensor Type Description 4 1213111969 16 01 01 ps1 vinok Power Supply State Asserted Asserted 3 12 31 1969 16 01 01 ps0 prent Entity Presence Device Removed Device Absent Asserted 2 1213111969 16 00 57 ps1 prent Entity Presence Device Inserted Device Present Asserted 1 12 31 1969 16 00 56 ps1 pwrok Power Supply State Deasserted Asserted 3 S lectionnez dans le menu d roulant une cat gorie d v nements que vous voulez afficher dans le journal Vous pouvez choisir parmi les types d v nements suivants m Les v nements sp cifiques au capteur Ces
46. lorsque vous mettez le serveur sous tension Chapitre 5 Utilisation du logiciel de diagnostic SunVTS 157 158 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 CHAPITRE 6 Affichage des journaux d v nements et des codes POST Ce chapitre contient des informations sur le journal d v nements du BIOS le journal SEL System Event Log du BMC l autotest de l allumage POST et la redirection de la console Pour plus d informations sur le journal d v nements et les codes POST du BIOS reportez vous au Sun Fire X4540 Server Service Manual Manuel d entretien du serveur Sun Fire X4540 819 4359 Ce chapitre aborde les sujets suivants m Affichage des journaux d v nements page 159 m propos de l autotest de l allumage POST page 162 3 Affichage des journaux d v nements Pour afficher le journal d v nements du BIOS et le journal SEL System Event Log du BMC Activez l alimentation principale pour que tous les composants soient mis sous tension Utilisez un stylo bille ou un stylet non conducteur pour enfoncer et rel cher le bouton d alimentation situ sur le panneau avant du serveur Reportez vous la section FIGURE 1 4 Lorsque l alimentation principale alimente l ensemble du serveur la del d alimentation ok situ e c t du bouton d alimentation s allume en continu Ouvrez l utilitaire de configuration du BIOS en appuyant sur la touche F
47. marrer lorsque vous tes invit d marrer les tests La suite de tests est ex cut e jusqu ce qu une erreur soit d tect e ou que le test soit termin Remarque L amor age du CD dure environ neuf minutes 10 Lorsque le logiciel Sun VTS a termin le test consultez les fichiers journaux g n r s pendant le test Consultation des fichiers journaux Sun VTS 1 Cliquez sur le bouton Log Journal La fen tre Log file Fichier journal s affiche 2 Dans cette fen tre s lectionnez le fichier journal que vous voulez afficher Le contenu du fichier journal s lectionn s affiche dans la fen tre 3 Choisissez les actions suivantes l aide des trois boutons du bas a Imprimer le fichier journal une bo te de dialogue vous permet de sp cifier les options et le nom de l imprimante a Supprimer le fichier journal le fichier ouvert reste affich mais vous ne pourrez plus l afficher une fois ferm Fermer la fen tre du fichier journal la fen tre est ferm e 156 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Remarque Pour enregistrer les fichiers journaux vous devez enregistrer les fichiers journaux sur un autre syst me r seau ou un support amovible Lorsque vous utilisez le CD de diagnostic amor able le serveur d marre partir du CD Par cons quent les fichiers journaux du test ne se trouvent pas sur le disque dur du serveur et sont supprim s
48. mat riel Le mat riel ne g n re du processeur normal aucune interruption ou v rification de service machine L interrogation est d clench e toutes les demi secondes par les interruptions du minuteur SMI et est effectu e par le gestionnaire SMI du BIOS Le gestionnaire SMI du BIOS commence consigner chaque erreur d tect e et arr te la consignation lorsque la limite pour une m me erreur est atteinte L interrogation du BIOS peut tre d sactiv e via l interface du logiciel 194 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 TABLEAUH 1 R capitulatif de la gestion des erreurs de mat riel Suite Consign e journal DMI ou SEL du processeur Erreur Description Gestion de service Fatale Erreur DRAM Avec CHIP KILL La CPU corrige l erreur dans le Journal SEL Fonctionnement 4 bits activ dans la mat riel Le mat riel ne g n re du processeur normal configuration du aucune interruption ou v rification de service BIOS la CPU machine L interrogation est d tecte et corrige d clench e toutes les demi secondes l erreur de par les interruptions du minuteur m moire DRAM SMI et est effectu e par le 4 bits dans gestionnaire SMI du BIOS l interface du Le gestionnaire SMI du BIOS module DIMM commence consigner chaque erreur d tect e et arr te la consignation lorsque la limite pour une m me erreur est atteinte L interrogation du BIOS peut tre d sactiv e via l interface
49. me Vous pouvez afficher le journal SEL avec IPMItool Cette rubrique comprend les sections suivantes Affichage du journal SEL avec IPMltool page 144 a Effacement du journal SEL avec IPMltool page 145 m Utilisation du cache du r f rentiel des donn es des capteurs SDR page 145 m Num ros et noms de capteurs dans les v nements SEL page 146 Chapitre 4 Utilisation d IPMitool pour afficher les informations syst me 143 Affichage du journal SEL avec IPMItool Vous pouvez utiliser deux commandes IPMI diff rentes pour voir des niveaux de d tails diff rents m Affichez le journal SEL du processeur de service ILOM avec un niveau minimal de d tail en utilisant la commande sel list ipmitool I lanplus H lt IPADDR gt U root P changeme sel list 100 Pre Init Time stamp Entity Presence 0x16 Device Absent 200 Pre Init Time stamp Entity Presence 0x26 Device Present 300 Pre Init Time stamp Entity Presence 0x25 Device Absent 400 Pre Init Time stamp Phys Security 0x01 Gen Chassis intrusion 500 Pre Init Time stamp Entity Presence 0x12 Device Present Remarque Lorsque vous utilisez cette commande un enregistrement d v nement donne un num ro de capteur mais il n affiche pas le nom du capteur pour l v nement Par exemple la ligne 100 de l exemple de sortie ci dessus le num ro de capteur est 0x16 Pour plus d informations sur la fa on d tablir une corre
50. me en mode normal Il s agit du mode par d faut de l utilitaire L utilitaire mappe tous les disques durs dans le nom de p riph rique logique Solaris vers les num ros d emplacement physique qui sont indiqu s sur l tiquette du ch ssis du serveur Sun Fire X4500 Il existe trois lignes de statut pour chaque p riph rique e emplacement physique qui correspond l tiquette du ch ssis e emplacement logique qui correspond au nom du p riph rique de stockage Solaris e statut d ex cution du disque cxtY e La syntaxe suivante est utilis e e Fl che pointant vers le haut d signe le p riph rique e p riph rique pr sent et accessible e p riph rique non accessible absent vide e les p riph riques sous le contr leur ne sont pas num r s Le contr leur n est pas num r tant que les emplacements ne contiennent aucun disque connect au contr leur le p riph rique a re u des messages d avertissement g n r s par le sous syst me de stockage b l emplacement du disque est amor able si un syst me d exploitation est install sur le disque d Diagnostique le syst me en scannant des messages d avertissement de n importe quel disque dans le syslog dmesg S il existe un message d avertissement associ au disque l utilitaire mappe l emplacement physique du disque avec le message d avertissement sur la ligne de statut de p riph rique Il appara t en jaune si l option c
51. ne g ne l entr e d air ou ne fait un contact qui pourrait couper l alimentation 4 Si le probl me n est pas vident passez la section suivante Inspection interne du serveur page 110 Inspection interne du serveur Pour effectuer une inspection visuelle l int rieur du serveur 1 Mettez le serveur hors tension passez du mode d alimentation principale au mode d alimentation de secours Choisissez l une des m thodes suivantes l aide d un stylet ou d un stylo bille non conducteur Reportez vous la FIGURE 1 4 m Arr t progressif enfoncez et rel chez le bouton d alimentation situ sur le panneau avant Une pression sur ce bouton permet d arr ter correctement un syst me d exploitation ACPI Advanced Configuration and Power Interface Les serveurs qui n utilisent pas un syst me d exploitation ACPI basculent imm diatement en mode d alimentation de secours 110 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 m Arr t d urgence appuyez sur le bouton d alimentation et maintenez le enfonc pendant quatre secondes pour couper l alimentation lectrique et passer en mode d alimentation de secours Lorsque l alimentation lectrique est coup e la DEL d alimentation OK situ e sur le panneau avant clignote toutes les trois secondes pour indiquer que le serveur fonctionne en mode d alimentation de secours Attention Vous devez d brancher les cordons d alimentatio
52. ou cass D poussi rez les modules DIMM nettoyez les contacts et r installez les S il n y a pas de dommage apparent changez les modules DIMM individuels entre les deux emplacements d une paire donn e Assurez vous qu ils sont bien ins r s et que les loquets d jecteur sont fix s Utilisation des num ros d emplacement de l exemple a Retirez les modules DIMM de la CPUO emplacements 1 et 3 b R installez le module DIMM de l emplacement 1 dans l emplacement 3 Chapitre 1 Inspection initiale du serveur 13 11 12 13 14 15 16 17 18 c R installez le module DIMM de l emplacement 3 dans l emplacement 1 Rebranchez les cordons d alimentation CA sur le serveur Mettez le serveur sous tension et ex cutez de nouveau le test de diagnostic V rifiez le fichier journal a Si l erreur appara t dans la CPUO emplacement 3 l oppos de l erreur d origine dans l emplacement 1 le probl me est li au module DIMM individuel Dans ce cas retournez les deux modules DIMM la paire au Support Center pour les remplacer m Si l erreur appara t toujours dans la CPUO emplacement 1 comme l erreur d origine le probl me n est pas li un module DIMM individuel En revanche elle peut tre caus e par la CPUO ou par l emplacement DIMM Passez l tape suivante Mettez le serveur hors tension une nouvelle fois et d branchez les cordons d alimentation CA Retirez les deux m
53. ration Pour supprimer un fichier tapez rm nomfichier Les param tres de votre navigateur peuvent tre diff rents Sites Web de tiers Sun d cline toute responsabilit quant la disponibilit des sites Web de tiers mentionn s dans le pr sent document Sun n exerce ni cautionnement ni responsabilit quant au contenu aux publicit s aux produits ou tout autre l ment disponible sur ou par l interm diaire des sites ou ressources cit s Sun d cline toute responsabilit quant aux dommages ou pertes r els ou suppos s r sultant de ou li s l utilisation du contenu des biens et des services disponibles sur ou par l interm diaire des sites ou ressources cit s xii Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Vos commentaires sont les bienvenus Sun s efforce d am liorer sa documentation aussi vos commentaires et suggestions nous sont utiles Vous pouvez nous faire part de vos commentaires sur le site http www sun com hwdocs feedback Veuillez mentionner le titre et le num ro de r f rence du document dans vos commentaires Guide de diagnostic des serveurs Sun Fire X4500 X4540 num ro de r f rence 820 6004 10 Pr face xiii xiv Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 PARTIE I Guide de diagnostic du serveur Sun Fire X4500 Cette partie contient le Guide de diagnostic du serveur Sun Fire X4500 et les chapitres suivants
54. root false false true ADMINISTRATOR ipmitool I lanplus H lt IPADDR gt U root P changeme user set password 2 newpass ipmitool I lanplus H lt IPADDR gt U root P newpass chassis status Configuration d une cl SSH Vous pouvez utiliser IPMItool pour configurer une cl SSH pour un utilisateur shell distant Pour cela d terminez l ID utilisateur de l utilisateur du processeur de service distant souhait avec la commande de liste d utilisateurs suivante ipmitool I lanplus H lt IPADDR gt U root P changeme user list Puis fournissez l ID utilisateur et l emplacement de la cl publique RSA ou DSA utiliser avec la commande ipmitool sunoem sshkey Par exemple ipmitool I lanplus H lt IPADDR gt U root P changeme sunoem sshkey set 2 id rsa pub Setting SSH key for user id 2 done Vous pouvez galement effacer la cl d un utilisateur particulier par exemple ipmitool I lanplus H lt IPADDR gt U root P changeme sunoem sshkey del 2 Deleted SSH key for user id 2 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Utilisation d IPMiItool pour lire les capteurs Pour plus d informations sur les commandes IPMI 2 0 prises en charge et le nommage de capteur pour ce serveur reportez vous au Guide d administration de Integrated Lights Out Manager Lecture du statut des capteurs Vous pouvez lire le statut des capteurs en allant d une pr sentation g n rale qui liste to
55. se met en mode d arr t et affiche le message suivant XxXx x x x 4x x Warning Bad Mix of Processors xxxxx x x Multiple core processors cannot be installed with single core processors Fatal Error System Halted R capitulatif de la gestion des erreurs de mat riel Le TABLEAU D 1 r capitule les erreurs de mat riel les plus fr quentes que vous pouvez rencontrer avec ces serveurs 70 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 TABLEAU D 1 R capitulatif de la gestion des erreurs de mat riel Erreur Description Gestion Consign e journal DMI ou SEL du processeur de service Fatale Panne du processeur de service Panne du processeur de service Le processeur de service ne d marre pas lors de la mise sous tension du syst me Le processeur de service d marre mais choue l autotest de l allumage Le processeur de service contr le la r initialisation du syst me le syst me peut alors tre mis sous tension mais il ne quitte pas la r initialisation e Lors de la mise sous tension le chargeur de d marrage du processeur de service allume la DEL d alimentation Lors du d marrage du processeur de service du d marrage de Linux et du contr le de validit du processeur de service la DEL d alimentation clignote e La DEL s teint lors du d marrage du code de gestion pile IPMI du processeur de service e la sortie de l autotest
56. serveurs Sun Fire X4500 X4540 Juillet 2008 FIGURE D 6 cran de journal DMI erreur syst me r pertori e BIOS SETUP UTILITY View Event Log View Event Log 09 12 05 14 23 47 A Hyper Transpor sync flood error occurred c 09 1 5 14 23 36 System Error 53 C Copyrigh 85 2002 American Megatrends Inc Gestion des processeurs incompatibles Cette section r pertorie quelques faits et consid rations sur la fa on dont le serveur g re les processeurs incompatibles m Le BIOS effectue un autotest de l allumage complet m Le BIOS affiche un rapport de toutes les CPU incompatibles comme indiqu dans l exemple suivant AMIBIOS C 2003 American Megatrends Inc BIOS Date 08 10 05 14 51 11 Ver 08 00 10 CPU AMD Opteron tm Processor 254 Speed 2 4 GHz Count 3 CPU Revision CPUO E4 CPUL E6 Microcode Revision CPUO 0 CPUL 0 DRAM Clocking CPUO 400 MHz CPU1 Core0 1 400 MHz Annexe D Gestion des erreurs 69 Sun Fire X4500 Server 1 AMD North Bridge Rev E4 1 AMD North Bridge Rev E6 1 AMD 8111 I O Hub Rev C2 2 AMD 8131 PCI X Controllers Rev B2 System Serial Number O505AMFO28 BMC Firmware Revision 1 00 Checking NVRAM Initializing USB Controllers Done Press F2 to run Setup CTRL E on Remote Keyboard Press F12 to boot from the network CTRL N on Remote Keyboard Press F8 for BBS POPUP CTRL P on Remote Keyboard a Aucun v nement SEL ni DMI n est enregistr m Le syst me
57. soit d Les DEL de CPU sont actives uniquement lorsque le bouton Rappeler est enfonc Elles clignotent pour indiquer une panne sinon elles restent teintes FIGURE C 6 Emplacement des DEL de module de CPU et des boutons CPU 0 sous le dissipateur CPU 1 sous le dissipateur DEL de panne de module DIMM Press to see fault Appuyer pour afficher l erreur Batterfe de CPU 0 a q N 2 Z QO p 3 0 T g D rs o 5G 8 T O0 g d o 45540 jun hi GSS o pana ee 2 o o g 2 S g o D o D 0 o o o o fa D o il o N Lu a 2 Z 7 SE Q DEL de panne DEL de panne DEL de panne de CPU 1 DEL de panne de module DIMM de batterie Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 60 ANNEXE D Gestion des erreurs Cette annexe contient des informations sur la fa on dont les serveurs traitent et consignent les erreurs Elle contient les sections suivantes Gestion des erreurs non corrigibles page 61 Gestion des erreurs corrigibles page 63 Gestion des erreurs de parit PERR page 65 Gestion des erreurs syst me SERR page 67 Gestion des processeurs incompatibles page 69 R capitulatif
58. un seuil donn Temp rature Le processeur de La DEL de demande d op ration de Journal SEL Fatale lev e service surveille les maintenance et la DEL de surchauffe du processeur temp ratures de la du syst me clignotent Le contr leur de service CPU et du syst me syst me est mis hors tension au del et d tecte toute du niveau critique sp cifi temp rature sup rieure un seuil donn Surchauffe du La CPU met le Le CPLD met la CPU hors tension La Journal SEL Fatale processeur signal DEL de demande d op ration de du processeur THERMTRIP_L maintenance et la DEL de surchauffe de service lorsqu elle d tecte du syst me clignotent une condition de surchauffe Panne du Le BIOS ne peut pas Le BIOS passe au p riph rique de Journal DMI Non fatale p riph rique de d marrer depuis un d marrage suivant dans la liste Si tous d marrage p riph rique de la les p riph riques de la liste chouent liste des un message d erreur s affiche p riph riques de r essayez depuis le d but de la liste Le d marrage processeur de service peut contr ler ou modifier l ordre de d marrage 76 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 ANNEXE E Utilisation de l interface graphique du processeur de service ILOM pour afficher les informations syst me Cette annexe contient des informations sur l utilisation de l interface du processeur de service ILOM Integrated Lights Out Manager
59. v nements sont li s un capteur sp cifique pour un composant par exemple un capteur de ventilateur ou un capteur d alimentation m Les v nements g n r s par le BIOS Ces v nements sont li s des messages d erreur g n r s dans le BIOS m Les v nements du logiciel de gestion du syst me Ces v nements sont li s des v nements qui se produisent dans le logiciel ILOM 80 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Une fois que vous avez choisi une cat gorie d v nements le tableau Event Log Journal des v nements est mis jour avec les v nements sp cifiques Les champs du journal des v nements sont d crits dans le TABLEAU E 1 TABLEAU E 1 Champs du journal des v nements Champ Description Event ID ID de l v nement Time Stamp Horodatage Sensor Name Nom du capteur Sensor Type Type de capteur Description Num ro d v nement dans l ordre partir de 1 Date et heure auxquelles s est produit l v nement Si le serveur NTP Network Time Protocol est activ pour r gler l heure du processeur de service l horloge du processeur de service utilisera le temps universel Pour plus d informations sur les horodatages reportez vous la section Interpr tation des horodatages du journal des v nements page 82 Nom du composant pour lequel un v nement a t enregistr Les abr viations des noms de capteurs corre
60. 09 25 2007 03 22 03 System Event 0x12 Undetermined system hardware failure Asserted OEM record e0 00000002000000000029000002 OEM record e0 00000004000000000000b00006 OEM record e0 00000048000000000011110322 OEM record e0 00000058000000000000030000 OEM record e0 000100440000000000feffFF000 OEM record e0 00010048000000000000ff3efa OEM record e0 10ab0000000010000006040012 OEM record e0 10ab0000001111002011110020 OEM record e0 0018304c00f200002000020c0f OEM record e0 0019304c00f200004000020c0f OEM record e0 001a304c00f45aa10015080a13 10 6 77 249 U root P changeme I lanplus sel list 09 25 2007 03 22 03 System Boot Initiated 0x02 Initiated by warm reset Asserted Chapitre 2 D pannage des probl mes de module DIMM 117 17 OEM record e0 001a3054000000000320004880 18 OEM record e0 001b304c00F200001000020c0f 19 OEM record e0 80000002000000000029000002 la OEM record e0 80000004000000000000b00006 1b OEM record e0 80000048000000000011110322 1c OEM record e0 80000058000000000000030000 1d OEM record e0 800100440000000000feff F000 le OEM record e0 80010048000000000000ff3efa 1f 09 25 2007 03 22 06 System Boot Initiated 0x03 Initiated by warm reset Asserted 20 09 25 2007 03 22 06 Processor 0x04 Presence detected Asserted 21 09 25 2007 03 22 15 System Firmware Progress 0x01 Memory initialization Asserted 22 09 25 2007 03 22 16 Mem
61. 1 amp ND R Nom logique c5t4 c4t0 c4t4 c7t0 c7t4 c6t0 c6t4 c1t0 cit4 c0Ot0 c0t4 c5tl c5t5 c4t1 c4t5 c7t1 c7t5 c6t1 c6t5 citl cit5 c0t1 c0Ot5 c5t2 c5t Statut present present present present present present present present present present present present present absent absent absent absent absent absent absent absent absent absent absent absent Annexe F Utilitaire ha 99 EXEMPLE DE CODE F 4 Sortie de l utilitaire hd r pertoriant le num ro et le statut de l emplacement physique Suite Num ro d emplacement Nom logique Statut physique 26 c4t2 absent 27 c4t6 absent 28 c7t2 absent 29 c7t6 absent 30 c t2 absent 31 c6t6 absent 32 c1t2 absent 33 c1t6 absent 34 c0t2 absent 35 c0t6 absent 36 c5t3 absent 37 c5t7 absent 38 c4t3 absent 39 c4t7 absent 40 c7t3 absent 41 c7t7 absent 42 c t3 absent 43 c t7 absent 44 c1t3 absent 45 c1t7 absent 46 c0t3 absent 47 c0t7 absent La commande suivante affiche le num ro de contr leur du disque dur du serveur Sun Fire X4500 et les n uds de p riph rique PCI correspondants Elle permet de d terminer le num ro du contr leur HBA en fonction du n ud de p riph rique PCI partir des messages syslog TABLEAU F 8 F hd j devices pci 0 0 pci1022 7458 1 pcillab 11ab l cO devices pci 0 0 pci1022 7458 2 pcillab 11ab l c1 devices pci 1 0 pci1022 7458 3 pcillab 11ab l c4 devices pci 1 0 pci1022 7458 4
62. 12 Password changeme L cran principal de l interface graphique Sun Integrated Lights Out Manager s affiche Cliquez sur l onglet Remote Control Contr le distance Cliquez sur l onglet Redirection D finissez la profondeur de couleurs de la console de redirection sur 6 ou 8 bits Cliquez sur le bouton Start Redirection D marrer la redirection Lorsque vous y tes invit tapez un nom d utilisateur et un mot de passe comme suit User Name root Password changeme L cran en cours du POST s affiche Modification des options du POST Ce s instructions sont facultatives mais vous pouvez les utiliser pour modifier les op rations ex cut es par le serveur au cours du test POST Pour modifier les options du POST Pour modifier les options du POST 1 Initialisez l utilitaire de configuration du BIOS en appuyant sur la touche F2 pendant que le syst me effectue l autotest de l allumage POST L cran du menu principal du BIOS appara t S lectionnez Boot Initialisation L cran Boot Settings Param tres d initialisation s affiche FIGURE B 4 cran Boot Settings Param tres d initialisation du BIOS Main Advanced kkkkkkkkkkkkkkkkkkkk Boot Settings kkkkkkkkkkkkkkkkkk Boot Settings Co Boot Device Prio Hard Disk Drives Removable Drives CD DVD Drives ESNE SE SE SE SEE E E E E PCIPnP Boot Security Chipset Exit kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk
63. 2 pendant que le syst me effectue l autotest de l allumage POST L cran du menu principal du BIOS appara t Affichez le journal d v nements du BIOS 159 a Sur l cran du menu principal du BIOS s lectionnez Advanced Avanc L cran Advanced Settings Param tres avanc s s affiche FIGURE 6 1 cran principal du menu Advanced Settings Param tres avanc s du BIOS Main Advanced PCIPnP Boot Security Chipset Exit kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk Advanced Settings Options for CPU k kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk xk WARNING Setting wrong values in below sections kd may cause system to malfunction x x CPU Configuration IDE Configuration SuperIiO Configuration ACPI Configuration Event Log Configuration Hyper Transport Configuration IPMI 2 0 Configuration MPS Configuration k okk Select Screen PCI express Configuration AMD PowerNow Configuration k kk Select Item Remote Access Configuration Enter Go to Sub Screen USB Configuration F1 General Help F10 Save and Exit ESC Exit d k kkkkkkkkk kkkkkkkkkkkk kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk kkkkkkkkkkkkkkkkkkkkkkS b Sur l cran Advanced Settings Param tres avanc s s lectionnez Event Log Configuration Configuration du journal d v nements L cran Event
64. 3 Erreurs de parit gestion 65 187 Erreurs non corrigibles gestion 61 183 201 Erreurs syst me gestion 67 189 F Figure du panneau arri re 54 176 Fonctions de changement des conditions options et op randes 93 Formats de num ro de capteur 29 146 G Gestion des erreurs corrigible 63 185 erreurs de mat riel 70 193 erreurs de parit 65 187 erreurs non corrigibles 61 183 erreurs syst me 67 189 modules DIMM 7 117 processeurs incompatibles 69 191 H Horodatages dans le journal SEL du processeur de service ILOM 82 130 l ID de capteur pour les DEL 31 148 IG du PS ILOM affichage de l inventaire de composants 83 131 affichage du journal d v nements du PS 79 127 connexion s rie 125 horodatages 130 Informations sur la visite de maintenance collecte 3 105 Inspection externe 5 107 interne 5 110 Inspection externe 5 107 Inspection interne 5 110 Instructions de d pannage g n rales 3 105 Instructions pour le d pannage 3 105 Instructions sur la s curit xi Intelligent Platform Management Interface voir IPMI Interface graphique du processeur de service ILOM affichage des capteurs 85 132 connexion s rie 78 horodatages 82 informations g n rales 77 Inventaire de composants affichage l aide de l IG du PS ILOM 83 131 affichage avec IPMitool 29 147 Inventaire des FRU affichage l aide de l IG du PS ILOM 83 131 Inventaire des unit s rem
65. 32 Volts pl t core 34h ok 3 1 40 degrees C pl v 1v5 35h ok 3 1 1 55 Volts pl v 2v5core 36h ok 3 1 2 64 Volts pl v 1v25core 37h ok 3 1 1 32 Volts ft0 fmO f0 speed 43h ok 29 0 6000 RPM ft0 fml f0 speed 44h ok 29 1 6000 RPM ft0 fm2 f0 speed 45h ok 29 2 6000 RPM ftl fmO0 f0 speed 46h ok 29 3 6000 RPM ftl fml f0 speed 47h ok 29 4 6000 RPM ftl fm2 f0 speed 48h ok 29 5 6000 RPM Vous pouvez aussi g n rer une liste de tous les capteurs d une entit sp cifique Utilisez la sortie de liste pour d terminer l entit que vous voulez voir puis utilisez la commande sdr entity afin d obtenir une liste de tous les capteurs de cette entit Cette commande accepte un ID d entit et un argument d instance d entit facultatif Si une instance d entit n est pas sp cifi e toutes les instances de cette entit s afficheront L ID d entit est donn e dans le quatri me champ de la sortie de gauche droite Par exemple dans la sortie indiqu e dans l exemple pr c dent tous les ventilateurs sont des entit s 29 Le dernier ventilateur list 29 5 est une entit 29 avec l instance 5 ftl fm2 f0 speed 48h ok 29 5 6000 RPM Par exemple pour voir tous les capteurs de ventilateur tapez la commande suivante avec l argument d entit 29 ipmitool I lanplus H lt IPADDR gt U root P changeme sdr entity 29
66. 41 163 SunVTS 15 153 154 Sun Fire X4500 Bouton d alimentation 112 M bouton d alimentation 6 111 Mappage entre les p riph riques logiques et SunVTS physiques 89 CD de diagnostic amor able 16 154 Modules DIMM documentation 16 154 configurations prises en charge 12 116 journaux 17 156 DEL de panne 9 120 pr sentation 15 153 154 gestion des erreurs 7 117 isolation des erreurs 12 122 U r gles de population 12 115 Utilisateur anonyme IPMItool 21 139 Mot de passe par d faut modification avec Utilitaire hd 89 IPM Itool 22 139 Mot de passe modification avec IPMItool 22 139 P Panneau avant emplacement des DEL 53 107 174 Pannes module DIMM 9 120 PERR 65 187 POST modification des options 42 164 points de contr le des codes 47 168 pr sentation 40 162 redirection de la sortie de la console 41 163 tableau des codes 44 166 Probl mes d alimentation d pannage 4 106 Proc dure d arr t 5 110 Proc dure de mise hors tension 5 110 Processeur de service d Integrated Lights Out Manager voir Interface graphique du processeur de service ILOM Processeurs incompatibles erreur 69 191 Processeurs incompatibles gestion d erreur 69 191 R Recherche de noms de capteurs 29 146 Redirection de la sortie de la console 41 163 R f rentiel des donn es des capteurs voir SDR R gles de population pour les modules DIMM 12 115 S Scripts IPMItool 34 152 SERR
67. 88 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Aug 5 05 15 00 d mpk12 53 159 kernel Dazed and confused but trying to continue Aug 5 05 15 00 d mpk12 53 159 kernel Do you have a strange power saving mode enabled Aug 5 05 15 00 d mpk12 53 159 kernel Uhhuh NMI received for unknown reason 3d on CPU 0 Aug 5 05 15 00 d mpk12 53 159 kernel Dazed and confused but trying to continue Aug 5 05 15 00 d mpk12 53 159 kernel Do you have a strange power saving mode enabled Aug 5 05 15 00 d mpk12 53 159 kernel Dazed and confused but trying to continue Aug 5 05 15 00 d mpk12 53 159 kernel Do you have a strange power saving mode enabled Erreurs syst me SERR Cette section r pertorie quelques faits et consid rations sur la fa on dont le serveur g re les erreurs syst me SERR m La gestion d erreur syst me se fait via le m canisme HyperTransport Synch Flood Error sur 8111 et 8131 m Les v nements suivants se produisent lors du test POST du BIOS a POST consigne toutes les erreurs syst me pr c dentes en bas de l cran Reportez vous la FIGURE H 5 pour voir un exemple Annexe H Gestion des erreurs 189 FIGURE H 5 cran POST erreur syst me pr c dente r pertori e American Dz Sun Megatrends 4 j www ami com microsystems BMC Firmware Revision 1 00 hecking NUR Initializing USB Controllers Done Press F2 to run Setup CTRL E on Remote Keyboard Press F12 to boo
68. Alerte du panneau arri re fp power led Alimentation du panneau avant fp locate led Localisation du panneau avant fp alert led Alerte du panneau avant io hddO led chec du disque dur 0 io hdd1 led chec du disque dur 1 io hdd2 led chec du disque dur 2 io hdd3 led chec du disque dur 3 io f0 led chec du ventilateur d E S po led chec de la CPU 0 p0 d0 led chec de la CPU 0 et du module DIMM 0 p0 d1 led chec de la CPU 0 et du module DIMM 1 p0 d2 led chec de la CPU 0 et du module DIMM 2 p0 d3 led chec de la CPU 0 et du module DIMM 3 pied chec de la CPU 1 Chapitre 4 Utilisation d IPMitool pour afficher les informations syst me 149 TABLEAU 4 2 ID de capteur de DEL Suite ID de capteur de DEL Description p1 d0 led chec de la CPU 1 et du module DIMM 0 pi d1 led chec de la CPU 1 et du module DIMM 1 pi d2 led chec de la CPU 1 et du module DIMM 2 pi d3 led chec de la CPU 1 et du module DIMM 3 ft0 fmO led chec du plateau du ventilateur 0 et du module 0 ft0 fm1 led chec du plateau du ventilateur 0 et du module 1 ft0 fm2 led chec du plateau du ventilateur 0 et du module 2 ft1 fm0 led chec du plateau du ventilateur 1 et du module 0 ft1 fm1 led chec du plateau du ventilateur 1 et du module 1 ft1 fm2 led chec du plateau du ventilateur 1 et du module 2 Modes des DEL Pour sp cifier le mode dans lequel vous voulez placer les DEL vous devez fou
69. Dans l onglet System Information Informations syst me s lectionnez Components Composants La page Replaceable Component Information Informations sur les composants rempla ables s affiche Reportez vous la FIGURE E 2 Annexe E Utilisation de l interface graphique du processeur de service ILOM pour afficher les informations syst me 83 FIGURE E 2 Page Replaceable Component Information Informations sur les composants rempla ables ABOUT User root Administrator Server SUNSP0003BA84D7B6 Sun Integrated Lights Out Manager A ava Sun Microsystems Inc System Information System Monitoring Configuration User Management Remote Control Maintenance Versions Session Time Out Components Replaceable Component Information View component part numbers serial numbers and manufacturing information Select a device DON Chassis Information Type Part Number Serial Number Board Information Manufacturer Product Name Serial Number Part Number Product Information Manufacturer Name Product Name Serial Number Part Number Rack Mount Chassis 541 0250 01 0060HS1 0503AM0387 BENCHMARK ELECTRONICS ASY MOTHERBRD GALAXY1 2 0060HSV 0503000313 500 6974 01 SUN MICROSYSTEMS GALAXY 1 0503AMF 040 602 2813 01 3 Choisissez un composant dans la liste d roulante Les informations sur le composant s lectionn s affichent 4 Si le probl me du serveur n est pas vid
70. EL est allum e Ces capteurs ont le suffixe fail et ils sont utilis s pour communiquer les v nements au journal SEL Chaque DEL contient un descripteur et un capteur de lecture de statut qui sont li s c est dire que si vous utilisez le capteur 1ea pour allumer une DEL sp cifique alors le changement de statut est repr sent dans le capteur fail associ De m me pour certaines d entre elles un v nement est g n r dans le journal SEL Pour les DEL qui clignotent au lieu de rester fixes lors d une panne les v nements ne sont pas g n r s parce qu un v nement serait affich chaque flashage de la DEL dans le cycle de clignotement 148 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Le TABLEAU 4 2 r pertorie les ID de capteur de DEL dans ces serveurs Reportez vous la section Identification des DEL de statut et de panne page 173 pour voir des sch mas sur l emplacement des DEL TABLEAU 4 2 ID de capteur de DEL ID de capteur de DEL Description sys power led sys locate led sys alert led Alimentation du syst me avant arri re Localisation du syst me avant arri re Alerte du syst me avant arri re sys psfail led chec de l alimentation syst me sys tempfail led Surchauffe du syst me sys fanfail led chec du ventilateur syst me bp power led Alimentation du panneau arri re bp locate led Localisation du panneau arri re bp alert led
71. Faible ou lev irr cup rable m Faible lev CR Faible ou lev critique m Faible lev NC Faible ou lev non critique Chapitre 3 Utilisation de l interface graphique du processeur de service ILOM pour afficher les informations syst me FIGURE 3 4 Page des lectures de capteur avec seuils affich s CENTS Ki Jav Sun Microsystems Inc User Management Remote Control Maintenance Sensor Readings Event Logs Locator Indicator Sensor Readings View readings for temperature voltage or fan sensors Select a sensor type category ai Sensors Sensor Readings 77 sensors Reading A a HighNC A High CT A Predictive Failure sys tempfail Deasserted Predictive Failure sys fanfail 1 0 Deasserted Normal mbt_amb 24 degrees C 18 degrees C 20 degrees C 22 degrees C 35 degrees C 40 degrees Normal mb v_bat 3 232 Volts 2 192 Volts 2 496 Volts 2 688 Volts 3 392 Volts 3 6 Volts Normal mhbv_ 3v3sthy 3 217 Volts 2 595 Volts 2 785 Volts 2 992 Volts 3 598 Volts 3 788 Volts Unknown mb v_ 3v3 Not Available 2 595 2 785 2 992 3 598 3 788 Unknown mbv_ 5v Not Available 3 484 3 978 4 498 5 486 5 98 _mhy 12 Not Available 8 a4f ga 4 4 10 af _12978 Hide Thresholds 6 Cliquez sur le bouton Hide Thresholds Masquer les seuils pour revenir aux lectures du capteur Les lectures du capteur sont affich es de nouveau sans les seuils 7 Si le probl me du serveur n est pas vident apr s a
72. H Gestion des erreurs 193 TABLEAUH 1 R capitulatif de la gestion des erreurs de mat riel Suite Erreur Description Consign e journal DMI ou SEL du processeur Gestion de service Fatale chec de l autotest de l allumage du BIOS Erreur ECC DRAM monobit Le BIOS du serveur choue l autotest de allumage Lorsque ECC est activ dans la configuration du BIOS la CPU d tecte et corrige une erreur monobit dans l interface du module DIMM L autotest de l allumage du BIOS contient des erreurs fatales et non fatales Le BIOS d tecte certaines erreurs signal es lors de l autotest de l allumage du BIOS sous forme de codes POST dans l angle inf rieur droit de l cran de la console s rie et sur l cran vid o Certains codes POST sont transf r s au processeur de service pour consignation Les codes POST ne sont pas envoy s en ordre s quentiel et certains sont r p t s car certains codes POST sont mis par le code dans les ROM d extension BIOS de la carte d extension En cas d chec au d but de l autotest de l allumage par exemple lorsque le BSP ne fonctionne pas correctement le BIOS s arr te sans consignation Pour certaines autres erreurs du POST qui se produisent apr s l initialisation de la m moire et du processeur de service le BIOS consigne un message dans le journal SEL du processeur de service La CPU corrige l erreur dans le Journal SEL Fonctionnement
73. IMM indiquent une panne jusqu ce que le syst me soit mis sous tension La DEL de batterie indique une panne jusqu ce que le processeur de service soit d marr Lorsqu une erreur non corrigible est d tect e par le BIOS les DEL de module DIMM s allument galement Pour plus d informations sur les indicateurs de panne de CPU et le remplacement des CPU reportez vous au Sun Fire X4500 Server Service Manual Manuel d entretien du serveur Sun Fire X4500 819 4359 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 FIGURE 1 3 Emplacement des DEL de module de CPU et des boutons CPU 0 sous le dissipateur de chaleur CPU 1 sous le dissipateur de chaleur 100 DIMM 3120 DEL de panne de DIMM o o o g o o o o 2I dl DEL de panne de CPU 0 ToO DEL de panne de batterie DEL de panne de CPU 1 o o o20000000 DIMM 0 2 13 DEL de panne de module DIMM 11 Inspection initiale du serveur Chapitre 1 R gles de population DIMM Les r gles de population DIMM du serveur Sun Fire X4500 sont les suivantes a Chaque CPU peut prendre en charge jusqu quatre modules DIMM a Les emplacements DIMM sont coupl s et les modules DIMM doivent tre install s par paires 0 et 1 2 et 3 Reportez vous
74. IOS 0004 V rification de l octet de diagnostic CMOS pour d terminer si l alimentation de la batterie fonctionne correctement et si la somme de contr le CMOS est correcte Si la somme de contr le est incorrecte mise jour de CMOS avec les valeurs par d faut de la mise sous tension 00c2 Configuration du processeur d initialisation pour POST Cela inclut le calcul de fr quence le chargement du microcode BSP et l application de la valeur demand e par l utilisateur pour la question de configuration de signalisation d erreur GART 00c3 Application au BSP des corrections des errata 78 amp 110 00c6 R activation du cache pour le processeur d initialisation et application dans le BSP des corrections des errata 106 107 69 et 63 si n cessaire 00c7 HT d finit les valeurs finales de fr quences et de largeurs de liaisons 000a Initialisation du contr leur de clavier compatible 8042 000c D tection de la pr sence d un clavier dans le port KBC 000e Test et initialisation de diff rents p riph riques d entr e D routement du vecteur INTO9h pour que le gestionnaire POST INTO9h obtienne le contr le pour IRQ1 Annexe B Journaux d v nements et codes POST 45 TABLEAU B 1 Codes POST Suite Code POST Description 8600 Pr paration de la CPU pour initialisation du syst me d exploitation par copie de tout le contexte du BSP vers tous les processeurs d applications pr sents REMARQUE les AP restent dans l
75. Inc Gestion des erreurs corrigibles Cette section r pertorie quelques faits et consid rations sur la fa on dont le serveur g re les erreurs corrigibles a Lors de l autotest de l allumage du BIOS m Le BIOS interroge les registres MCK a Le BIOS consigne dans DMI a Le BIOS consigne dans le journal SEL du processeur de service via le BMC m La fonction est d sactiv e au d marrage du syst me d exploitation par d faut ma Solaris fournit le diagnostic automatis et auto r tablissement pour les sous syst mes de la CPU et de la m moire m La FIGURE D 2 montre un exemple d cran de journal DMI de la page de configuration du BIOS Annexe D Gestion des erreurs 63 FIGURE D 2 cran de journal DMI erreur corrigible BIOS SETUP UTILITY Uiewu Event Loc Pair 0 SPD address 0A0h 042h m Si pendant une tape du test de m moire le BIOS se retrouve incapable de lire ou d crire vers le module DIMM il entreprend les actions suivantes a Le BIOS d sactive le module DIMM comme indiqu par le message de m moire diminu e dans la FIGURE D 3 m Le BIOS consigne un enregistrement SEL Le BIOS consigne un v nement dans DMI 64 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 FIGURE D 3 cran de journal DMI erreur corrigible m moire diminu e 29 j 1 DIMM Pair 0 SPD addres C Memory Error C opyrig Gestion des erreurs de parit PERR Cette se
76. Logging Details D tails de la journalisation d v nements du menu Advanced Avanc s affiche FIGURE 6 2 cran des d tails de la journalisation d v nements du menu Advanced Avanc Advanced kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk Event Logging details View all unread events k KEKEKE AAA ARE KR RAR A RER EE EKEKEKEKEKKKKKKKKKKEEEEEX On the Event Log View Event Log Mark all events as read b Clear Event Log E x kd K kR Select Screen ARE Select Item k Enter Go to Sub Screen z FI General Help F10 Save and Exit ESC Exit kkkkkkkkkkk kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkS 160 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 c Sur l cran Event Logging Details D tails de la journalisation d v nements s lectionnez View Event Log Afficher journal d v nements Tous les v nements non lus s affichent 4 Affichez le journal SEL System Event Log du BMC a Sur l cran du menu principal du BIOS s lectionnez Advanced Avanc L cran Advanced Settings Param tres avanc s s affiche Reportez vous la section FIGURE 6 1 b Sur l cran Advanced Settings Param tres avanc s s lectionnez IPMI 2 0 Configuration Configuration IPMI 2 0 L cran IPMI 2 0 Configuration Configuration IPMI 2 0
77. M d fectueux est sup rieur l espace d extraction de m moire basse de 1 Mo du BIOS un d marrage correct se produit ipmitool gt sel list 100 08 26 2005 05 04 04 OEM 0xfb 200 08 26 2005 05 04 09 Memory Memory Device Disabled CPU 0 DIMM 0 m Notez les consid rations suivantes pour cette r vision a L erreur de m moire ECC non corrigible n est pas consign e m Les erreurs ECC multibits sont consign es en tant que Memory Device Disabled Au premier red marrage le BIOS consigne une erreur HyperTransport dans le journal DMI a Le BIOS d sactive le module DIMM a Le BIOS envoie les enregistrements SEL au BMC a Le BIOS red marre nouveau Le BIOS ignore le module DIMM d fectueux lors du test de m moire POST suivant a Le BIOS indique la m moire disponible en excluant la paire de modules DIMM d fectueuse La FIGURE D 1 montre un exemple d cran de journal DMI de la page de configuration du BIOS 62 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 FIGURE D 1 cran de journal DMI erreur non corrigible BIOS SETUP UTILITY Advanced Event Logging details View all unread events a on the Event Log Mark all events as read Clear Event Log Uieu Event Log 09 12 05 11 51 05 A Hyper Transport sync flood error occurred on last boot Enter Go to Sub Screen F1 General Help F10 Save and Exit ESC Exit v02 53 C Copyright 1985 2002 American Megatrends
78. O prsnt 0x12 Entity ID 10 0 Sensor Type Discrete Entity Presence States Asserted Availability State Device Present Dans l exemple ci dessus cet v nement indique que Alimentation lectrique N 0 est d tect e et pr sente Effacement du journal SEL avec IPMItool Pour effacer le journal SEL tapez la commande sel clear ipmitool I lanplus H lt IPADDR gt U root P changeme sel clear Clearing SEL Please allow a few seconds to erase Utilisation du cache du r f rentiel des donn es des capteurs SDR Lorsque vous utilisez le processeur de service ILOM certaines op rations peuvent tre longues ex cuter et la quantit de donn es transf r es peut tre importante De mani re g n rale l ex cution de la commande sdr el1ist n cessite tout le SDR pour tre lue partir du processeur de service De la m me fa on la commande sel elist doit lire le SDR et le journal SEL partir du processeur de service pour renvoyer des v nements et afficher des informations utiles Pour acc l rer ces op rations il est possible d effectuer une mise en cache pr alable des donn es statiques dans le SDR et de les renvoyer dans IPMltool Cela peut avoir un effet spectaculaire sur le temps d ex cution de certaines commandes Afin de g n rer un cache SDR pour une utilisation ult rieure tapez la commande sdr dump Par exemple ipmitool I lanplus H lt IPADDR gt U root P changeme sdr dump galaxy sdr D
79. POST 40 Fonctionnement du test POST BIOS de la m moire 40 Redirection de la sortie de la console 41 Modification des options du POST 42 Codes POST 44 Points de contr le des codes POST 47 DEL de statut 51 DEL de statut externes 51 Fonctions contr les et indicateurs ext rieurs 52 Panneau avant 52 Panneau arri re 54 DEL de statut internes 56 DEL du disque et du plateau de ventilateur 58 DEL de carte CPU 59 Gestion des erreurs 61 Gestion des erreurs non corrigibles 61 Gestion des erreurs corrigibles 63 Gestion des erreurs de parit PERR 65 Gestion des erreurs syst me SERR 67 Gestion des processeurs incompatibles 69 R capitulatif de la gestion des erreurs de mat riel 70 Sommaire v E Utilisation de l interface graphique du processeur de service ILOM pour afficher les informations syst me 77 Cr ation d une connexion s rie vers le processeur de service 78 Affichage des journaux d v nements du processeur de service ILOM 79 Interpr tation des horodatages du journal des v nements 82 Affichage des informations sur les composants rempla ables 83 Affichage des lectures du capteur de temp rature de tension et de ventilateur 85 v Pour afficher les lectures du capteur 85 F Utilitairehd 89 Pr sentation de l utilitaire hd 89 Utilisation de l utilitaire hd 91 Mappage avec l utilitaire hd 91 Options et param tres de la commande hd 92 Page de manuel hd 92 Param tres des options 93 Exemple d utilis
80. Qe SUN microsystems Guide de diagnostic des serveurs Sun Fire X4500 X4540 Sun Microsystems Inc www sun com R f 820 6004 10 Juillet 2008 R vision A Merci d envoyer vos commentaires concernant ce document l adresse suivante http www sun com hwdocs feedback Copyright 2008 Sun Microsystems Inc 4150 Network Circle Santa Clara Californie 95054 tats Unis Tous droits r serv s Cette distribution peut inclure des l ments d velopp s par des tiers Sun Sun Microsystems le logo Sun Java Netra Solaris Sun Ray et le serveur de sauvagarde Sun Fire X4540 sont des marques de fabrique ou des marques d pos es de Sun Microsystems Inc et de ses filiales aux tats Unis et dans d autres pays Ce produit est soumis la l gislation am ricaine sur le contr le des exportations et peut tre soumis la r glementation en vigueur dans d autres pays dans le domaine des exportations et importations Les utilisations finales ou utilisateurs finaux pour des armes nucl aires des missiles des armes biologiques et chimiques ou du nucl aire maritime directement ou indirectement sont strictement interdites Les exportations ou r exportations vers les pays sous embargo am ricain ou vers des entit s figurant sur les listes d exclusion d exportation am ricaines y compris mais de mani re non exhaustive la liste de personnes qui font objet d un ordre de ne pas participer d une fa on directe ou ind
81. Solaris comme format 1M et cfgadm 1M La sortie hd peut galement vous aider identifier les disques qui n ont pas t num r s et les emplacements La FIGURE F 1 montre l organisation des disques du serveur Sun Fire X4500 FIGURE F 1 Organisation des disques et du plateau de ventilateur 90 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Utilisation de l utilitaire hd Pour utiliser l utilitaire hd le package hd doit tre install Ce package est pr install dans opt SUNWhd hd bin hd Pour conna tre les commandes suppl mentaires de hd reportez vous aux pages de manuel suivantes format 1M cfgadm 1M devfsadm 1M et fdisk 1M Mappage avec l utilitaire hd Vous pouvez utiliser la sortie du mappage des disques de l utilitaire hd pour effectuer une analyse distance L utilitaire analyse et affiche tous les p riph riques de stockage disponibles dans le syst me avec leurs noms logiques le num ro de s rie le fournisseur le mod le et les temp ratures de disque Exemple de sortie de l utilitaire hd EXEMPLE DE CODE F 1 Exemple de mappage des disques durs de l utilitaire hd Sun Fire X4500 Server 36 37 38 39 40 41 42 43 44 45 c t3 c t7 C562 GC5 7 c8t3 c8t7 c7t3 c7t7 cit3 cit7 pt p g tt Apg pt F4 pe p az 24 25 26 27 28 29 30 31 32 33 c t2 c t cSEt2 C566 c8t2 C86 c7t2 c7t6 cit2 cit6 pe pE NE pt y4
82. X4500 X4540 Juillet 2008 Collecte des informations sur la visite de maintenance Utilisez les instructions g n rales suivantes lorsque vous commencez le d pannage 1 Rassemblez des informations sur la visite de maintenance initiale en consultant des documents relatifs aux appels de service ou aupr s du personnel sur site au sujet des l ments suivants m les v nements qui se sont produits avant la panne a si l un des mat riels ou logiciels a t modifi ou install a si le serveur a t install ou d plac r cemment a la dur e d exposition des sympt mes sur le serveur a la dur e ou la fr quence du probl me Fournissez des informations sur les param tres du serveur existants avant les modifications Enregistrez la version du BIOS la version du logiciel et les num ros de s rie du serveur Consultez les notes de produit pour voir les sujets li s aux mat riels et logiciels du serveur R glez les param tres de serveur existants pour corriger le probl me Si possible proc dez un changement la fois pour isoler les probl mes potentiels Utilisez cette m thode pour maintenir un environnement contr l et r duire le d pannage Notez les modifications effectu es et leurs r sultats Incluez tous les erreurs ou les messages fournis titre d information V rifiez les conflits de p riph rique potentiel avant d ajouter un nouveau p riph rique V rifie
83. X4540 Juillet 2008 Les cinq champs des lignes de sortie de gauche droite sont 1 L ID du capteur IPMI 16 caract res maximum 2 Le num ro du capteur IPMI 3 Le statut du capteur indiquant les seuils qui ont t d pass s 4 L ID et l instance de l entit 5 La lecture de capteur Par exemple fp t_amb oah ok 12 0 22 degrees C Lecture de capteurs sp cifiques Bien que la sortie par d faut soit une longue liste de capteurs il est possible d affiner la sortie pour ne voir que les capteurs sp cifiques La commande sar list peut utiliser un argument facultatif pour limiter la sortie des capteurs d un type particulier Le TABLEAU 4 1 d crit les arguments de capteur disponibles TABLEAU 4 1 Arguments de capteur IPMItool Argument Description Capteurs all Tous les enregistrements Tous les capteurs de capteur full Enregistrements de Capteurs de temp rature de tension et de capteur complets ventilateur compact Enregistrements de Digital Discrete num rique discret capteurs capteur compacts de panne et de pr sence event Enregistrements des Capteurs utilis s uniquement pour une v nements uniquement correspondance avec les enregistrements SEL mcloc Enregistrements de Capteurs du contr leur de gestion localisateur MC generic Enregistrements de P riph riques g n riques DEL localisateur g n rique fru Enregistrements de P riph riques FRU localisateur FRU Par exemple pour n
84. acements de module DIMM Le serveur poss de une DEL de statut interne pour la carte CPU Les DEL de panne de module DIMM et de CPU sur la carte CPU fournissent davantage d indications sur le composant qui pr sente une erreur Chapitre 1 Inspection initiale du serveur 9 10 Ces DEL peuvent tre allum es pendant une minute maximum par un condensateur sur la carte CPU m me apr s le retrait de la carte CPU du serveur Pour allumer les DEL de panne partir du condensateur appuyez sur le petit bouton sur la carte CPU tiquet e Press to see fault Appuyer pour afficher l erreur Reportez vous la FIGURE 1 3 pour conna tre l emplacement des DEL et des boutons Les leviers d jecteur de module DIMM contiennent des DEL qui peuvent indiquer un module DIMM pr sentant une erreur m La DEL de panne de module DIMM est teinte le module DIMM fonctionne correctement a La DEL de panne de module DIMM est allum e orange le module DIMM pr sente une erreur et doit tre remplac m La DEL de panne de CPU peut indiquer une CPU pr sentant une erreur sur la CPU 0 ou la CPU 1 a La DEL de panne de CPU est teinte la CPU fonctionne correctement a La DEL de panne de CPU est allum e orange la CPU pr sente une erreur et doit tre remplac e a La DEL de panne de la batterie est allum e orange la batterie pr sente une erreur et doit tre remplac e Remarque Les DEL de panne de CPU et de module D
85. affiche la sortie de la ROM en option Keep Current Conserver ne supprime pas le logo Sun La sortie de la ROM en option ne s affiche pas Boot Num Lock Verr Num l initialisation cette option est activ e par d faut le verrouillage num rique du clavier est activ lors de l initialisation Si vous la d sactivez le verrouillage num rique du clavier n est pas activ lors de l initialisation a Wait for F1 if Error Attendre F1 en cas d erreur cette option est d sactiv e par d faut Lorsque cette option est activ e le syst me s interrompt en cas d erreur au cours du test POST Le test reprend lorsque vous appuyez sur la touche F1 m Interrupt 19 Capture Interrompre la capture 19 cette option est r serv e pour une utilisation future Ne pas modifier m Default Boot Order Ordre d initialisation par d faut les lettres entre crochets repr sentent les p riph riques de d marrage Pour voir les lettres d finies positionnez votre curseur sur le champ et lisez la d finition droite de l cran Codes POST Le TABLEAU B 1 contient des descriptions de chaque code POST dans l ordre dans lequel ils sont g n r s Ces codes POST sont constitu s de quatre chiffres deux chiffres correspondant la sortie du port d E S principal 80 et deux chiffres correspondant la sortie du port d E S secondaire 81 Dans les codes POST du TABLEAU B 1 les deux premiers chiffres correspondent au port
86. age or fan sensors Select a sensor type category ai Sensors Sensor Readings 77 sensors Reading A High NC a High CT a Predictive Failure sys tempfail Deasserted Predictive Failure sys fanfail 1 0 Deasserted Normal mbt_amb 24 degrees C 18 degrees C 20 degrees C 22 degrees C 35 degrees C 40 degrees C Normal mb v_bat 3 232 Volts 2 192 Volts 2 496 Volts 2 688 Volts 3 392 Volts 3 6 Volts Normal mb v_ 3v3stby 3 217 Volts 2 595 Volts 2 785 Volts 2 992 Volts 3 598 Volts 3 788 Volts Unknown mbv _ 3v3 Not Available 2 595 2 785 2 992 3 598 3 788 Unknown mb v_ 5v Not Available 3 484 3 978 4 498 5 486 5 98 nknnwn mhy 12v Not Available 894r 9954 10967 12 978 d cr Refresh Hide Thresholds 6 Cliquez sur le bouton Hide Thresholds Masquer les seuils pour revenir aux lectures du capteur Les lectures du capteur sont affich es de nouveau sans les seuils 7 Si le probl me du serveur n est pas vident apr s avoir consult les informations sur les lectures du capteur passez la section Ex cution de tests de diagnostic l aide de SunVTS page 154 88 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 ANNEXE F Utilitaire hd Cette annexe contient des informations sur les rubriques suivantes m Pr sentation de l utilitaire hd page 89 m Utilisation de l utilitaire hd page 91 m Options et param tres de la commande hd page 92 Pr sentation de l u
87. age pour tous les disques e lt cXtY gt R pertorie les donn es SMART pour un disque donn R pertorie les num ros de contr leur HBA et les n uds PCI du serveur Sun Fire X4500 si Exemple d utilisation de l utilitaire hd La commande suivante d marre l utilitaire en mode de couleur et r capitule tous les p riph riques de stockage du syst me TABLEAU F 2 hd c s Voici un exemple de sortie r pertoriant tous les p riph riques de stockage EXEMPLE DE CODE F 3 R capitulatif de l utilitaire hd platform Sun Fire X4500 Server Device Serial Vendor Model Revision Temperature cot0d0s2 K41BTA4C7M6PS HITACHI HDS7225SBSUN250G V440 None cot4d0s2 K41BT4C7N4HS HITACHI HDS7225SBSUN250G V440 None c1it0d0s2 K41BTA4C7MTSS HITACHI HDS7225SBSUN250G V440 None cit4ad0s2 K41BTACY7NXHS HITACHI HDS7225SBSUN250G V440 None c2t0d0s2 AMI Virtual CDROM 1 00 None c3t0d0s2 AMI Virtual Floppy 1 00 None cat0d0s2 TEAC DV W516GA C452 None c5t0d0s2 K41BT4C7NVYS HITACHI HDS7225SBSUN250G V440 None c5t4d0s2 K41BT4C7MP2S HITACHI HDS7225SBSUN250G V440 None c t0d0s2 K41BT4C7P2BS HITACHI HDS7225SBSUN250G V440 None c t4ad0s2 K41BT4C7NG1S HITACHI HDS7225SBSUN250G V440 None c7t0d0s2 K41BT4C7N54S HITACHI HDS7225SBSUN250G V440 None c7t4d0s2 K41BTACYNVES HITACHI HDS7225SBSUN250G V440 None c8t0d0s2 K41BTA4C7MKRS HITACHI HDS7225SBSUN250G V440 None c8t4d0s2 K41BTA4C7N49S HITACHI HDS7225SBSUN250G V440 None
88. alisation de Int 13 et pr paration de la d tection IPL 78 Initialisation des unit s IPL contr l es par le BIOS et des ROM en option 7A Initialisation des ROM en option restantes 7C G n ration et criture du contenu de ESCD dans la m moire NVRam 84 Consignation des erreurs d tect es lors du test POST 85 Affiche des erreurs l intention de l utilisateur et demande celui ci de r pondre 87 Ex cution du programme de configuration du BIOS si n cessaire demand e 8C Une fois l initialisation de toutes les unit s termin e programmation des param tres s lectionnables par l utilisateur associ s NB SB tels que les param tres de synchronisation les r gions ne pouvant pas tre mises en cache et la possibilit de mise en m moire vive fant me et ex cution des op rations de programmation NB SB PCIX OEM n cessaires la fin du test POST L effacement en arri re plan de la m moire DRAM et des caches de niveau 1 et 2 est configur en fonction des questions de configuration Obtention des limites d effacement DRAM de chaque n ud 8D Cr ation des tables ACPI si ACPI est pris en charge 8E Programmation des param tres des p riph riques Activation d sactivation de NMI selon s lection 90 Initialisation la fin du POST de l interruption de gestion de syst me AO V rification du mot de passe d initialisation si d fini Al Nettoyage n cessaire avant initialisation du syst me d exploitation An
89. ans le journal SEL du processeur de service via le BMC m La fonction est d sactiv e au d marrage du syst me d exploitation par d faut ma Solaris fournit le diagnostic automatis et auto r tablissement pour les sous syst mes de la CPU et de la m moire m La FIGURE H 2 montre un exemple d cran de journal DMI de la page de configuration du BIOS Annexe H Gestion des erreurs 185 FIGURE H 2 cran de journal DMI erreur corrigible BIOS SETUP UTILITY 09 12 05 12 4 Single Bit ECC Memory Error m Si pendant une tape du test de m moire le BIOS se retrouve incapable de lire ou d crire vers le module DIMM il entreprend les actions suivantes a Le BIOS d sactive le module DIMM comme indiqu par le message de m moire diminu e dans la FIGURE H 3 m Le BIOS consigne un enregistrement SEL Le BIOS consigne un v nement dans DMI 186 Guide de diagnostic des serveurs Sun Fire X4500 X4540 e Juillet 2008 FIGURE H 3 cran de journal DMI erreur corrigible m moire diminu e 3 54 1 DIMM Pair 0 SPD addres C Memory Error Megatre ds In Erreurs de parit PERR Cette section r pertorie quelques faits et consid rations sur la fa on dont le serveur g re les erreurs de parit PERR m La gestion des erreurs de parit est effectu e via des interruptions non masquables NMI m Lors de l autotest de l allumage du BIOS la NMI est consign e dans le DMI et dans le journal SEL du p
90. ant 15 secondes Allum Une op ration de maintenance est requise Fixe L alimentation est activ e Clignotant L alimentation de secours est activ e mais l alimentation principale est d sactiv e teint L alimentation est d sactiv e Pour mettre sous tension l alimentation principale pour tous les composants du serveur Allum Erreur li e au disque dur ou au ventilateur Allum Erreur li e la source d alimentation ou au contr leur syst me maintenance requise Allum Lorsque le syst me est en surchauffe Annexe G Identification des DEL de statut et de panne 175 Fonctions du panneau arri re La FIGURE G 3 montre toutes les fonctions du panneau arri re et le TABLE 6 3 les d crit FIGURE G 3 Panneau arri re du serveur Sun Fire X4540 4 5 6 7 8 8 10 11 12 13 14 TABLE 6 3 Fonctions du panneau arri re Nom Description 1 Connecteurs V rifiez que les DEL PS sont vertes Chaque source d alimentation CA d alimentation poss de son propre connecteur CA avec un clip pour maintenir le c ble d alimentation 2 Masse du ch ssis Branchez les rubans de mise la terre ici 3 0 PCI e 1 PCI e Emplacements des trois cartes PCI e 2 PCI e 176 Guide de diagnostic des serveurs Sun Fire X4500 X4540 e Juillet 2008 TABLE6 3 Fonctions du panneau arri re Suite Nom Description 4 Bouton DEL de Blanc Les op rateurs peuvent al
91. ant une p riode de 24 heures a DEL de panne de la carte m re sur la carte mezzanine allum e une panne s est produite sur la carte m re Cette DEL est pr sente parce que vous ne pouvez pas voir les DEL de carte m re lorsque la carte mezzanine est pr sente Remarque La DEL de panne de la carte m re fonctionne ind pendamment du bouton Press to See Fault Appuyer pour afficher l erreur et n utilise pas l lectricit stock e Reportez vous la FIGURE 2 1 pour conna tre les emplacements des modules DIMM et des DEL sur la carte m re Chapitre 2 D pannage des probl mes de module DIMM 121 FIGURE 2 1 Modules DIMM et DEL sur la carte m re CPU 1 sous le CPU 0 sous le dissipateur de chaleur e Jill Modules DIMM 0 2 1 3 dissipateur de chaleur Modules DIMM 3 1 20 LL DOOOOOOO DEL de panne de DEL de panne DEL de panne DEL de panne DEL de panne de module DIMM de CPU 1 de batterie de CPU 0 module DIMM Isolation et correction des erreurs ECC de module DIMM Si vos fichiers journaux communiquent une erreur ECC ou un probl me avec un module DIMM effectuez les tapes ci dessous jusqu ce que vous ayez isol l erreur Dans cet exemple le fichier journal communique une erreur avec le module DIMM situ dans la CPUO emplacement 7 Les DEL de panne de la CPUD emplacements 6 et 7 sont allum es 122 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Pour isoler et corri
92. ar ipmitool I lanplus H lt IPADDR gt U root P changeme sel clear Clearing SEL Please allow a few seconds to erase Utilisation du cache du r f rentiel des donn es des capteurs SDR Lorsque vous utilisez le processeur de service ILOM certaines op rations peuvent tre longues ex cuter et la quantit de donn es transf r es peut tre importante De mani re g n rale l ex cution de la commande sdr elist n cessite tout le SDR Chapitre 4 Utilisation d IPMitool pour afficher les informations syst me 145 pour tre lue partir du processeur de service De la m me fa on la commande sel elist doit lire le SDR et le journal SEL partir du processeur de service pour renvoyer des v nements et afficher des informations utiles Pour acc l rer ces op rations il est possible d effectuer une mise en cache pr alable des donn es statiques dans le SDR et de les renvoyer dans IPMltool Cela peut avoir un effet spectaculaire sur le temps d ex cution de certaines commandes Afin de g n rer un cache SDR pour une utilisation ult rieure tapez la commande sdr dump Par exemple ipmitool I lanplus H lt IPADDR gt U root P changeme sdr dump galaxy sdr Dumping Sensor Data Repository to galaxy sdr Une fois le fichier cache g n r il peut tre fourni lors d ex cutions futures d IPMltool avec l option s Par exemple ipmitool I lanplus H lt IPADDR gt U root P changeme S galaxy sdr sel elist
93. ard Management Controller BMC Les conditions qui d clenchent l mission d une demande d arr t par le BMC sont a Une condition de surchauffe pendant plus d une seconde Plusieurs pannes du ventilateur ou m Une erreur Les erreurs qui d clenchent un arr t sont a Toutes les sources d alimentation ont chou ou ont t retir es a Une source d alimentation n a plus t sp cifi e pendant plus de 100 millisecondes Le circuit permutable chaud a chou Une condition de surchauffe s est produite 106 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Remarque Une source d alimentation qui n a plus t sp cifi e provoque une r initialisation mais seules les sources d alimentation qui ne sont plus sp cifi es pendant plus de 100 ms provoquent un arr t Inspection externe du serveur Des contr les mal d finis et des cordons mal branch s ou desserr s sont des causes communes de probl mes avec des composants mat riels Pour effectuer une inspection visuelle du syst me externe 1 Examinez les DEL du panneau avant pour voir si des composants ne fonctionnent pas correctement La FIGURE 1 2 indique les contr les et les indicateurs du panneau avant Le TABLEAU 1 1 d crit les contr les et les indicateurs FIGURE 1 2 DEL du panneau avant du serveur Sun Fire X4540 1 2 3 4 5 6 7 Chapitre 1 Inspection initiale du serveur 107 108 TABLEAU 1
94. ation de l interface graphique du processeur de service ILOM pour afficher les informations syst me Interpr tation des horodatages du journal des v nements Les horodatages du journal des v nements syst me sont li s aux param tres de l horloge du processeur de service Si les param tres de l horloge sont modifi s les horodatages refl tent ces modifications Lorsque le processeur de service red marre l horloge du processeur de service est d finie sur Thu Jan 1 00 00 00 UTC 1970 Le red marrage du processeur de service se produit dans les cas suivants Un cycle complet de mise hors sous tension du syst me ne commande IPMI par exemple me reset cold U Une commande de l interface de ligne de commande CLI par exemple reset SP U ne op ration de l interface graphique Web ILOM effectu e partir de l onglet Maintenance et de la s lection de l option Reset SP R initialiser le processeur de service Une mise niveau du microprogramme du processeur de service Apr s un red marrage du processeur de service l horloge de ce dernier est modifi e par les l ments suivants Lors du d marrage de l h te Le BIOS de l h te r gle sans condition l heure du processeur de service sur celle indiqu e par l horloge temps r el de l h te Les op rations suivantes permettent de r gler l horloge temps r el de l h te m Lorsque la CMOS de l h te est effac e suite au changement de batterie de l horlog
95. ation de l utilitaire hd 96 Partie II Guide de diagnostic du serveur Sun Fire X4540 3 Inspection initiale du serveur 103 Organigramme sur le d pannage lors des visites de maintenance 103 Collecte des informations sur la visite de maintenance 105 D pannage des probl mes d alimentation 106 Inspection externe du serveur 107 Inspection interne du serveur 110 4 D pannage des probl mes de module DIMM 115 R gles de population DIMM 115 Configurations de modules DIMM prises en charge 116 vi Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Strat gie de remplacement des modules DIMM 116 Gestion des erreurs de module DIMM par le syst me 117 Erreurs de module DIMM non corrigibles 117 Erreurs de module DIMM corrigibles 119 Messages d erreur de module DIMM du BIOS 120 DEL de panne de module DIMM 120 Isolation et correction des erreurs ECC de module DIMM 122 Utilisation de l interface graphique du processeur de service ILOM pour afficher les informations syst me 125 Connexion du processeur de service un port s rie 125 Affichage des journaux d v nements du processeur de service ILOM 127 Interpr tation des horodatages du journal des v nements 130 Affichage des informations sur les composants rempla ables 131 Affichage des lectures du capteur de temp rature de tension et de ventilateur 132 Pour afficher les lectures du capteur 133 Utilisation d IPMItool pour afficher les informations syst me 137
96. ation du logiciel de diagnostic SunVTS 15 Ex cution de tests de diagnostic l aide de SunVTS 15 Documentation SunVTS 16 Diagnostic des probl mes de serveur l aide du CD de diagnostic amor able 16 Configuration requise 16 Utilisation du CD de diagnostic amor able 17 Utilisation d IPMItool pour afficher les informations syst me 19 propos d IPMI 20 propos d IPMItool 20 Page de manuel d IPMItool 20 Connexion au serveur avec IPMltool 21 Activation de l utilisateur anonyme 21 Modification du mot de passe par d faut 22 Configuration d une cl SSH 22 Utilisation d IPMItool pour lire les capteurs 23 Lecture du statut des capteurs 23 Lecture de tous les capteurs 23 Lecture de capteurs sp cifiques 24 Utilisation d IPMltool pour afficher le journal SEL System Event Log du processeur de service ILOM 26 Affichage du journal SEL avec IPMltool 26 Effacement du journal SEL avec IPMltool 28 Utilisation du cache du r f rentiel des donn es des capteurs SDR 28 Num ros et noms de capteurs dans les v nements SEL 29 Affichage des informations sur les composants avec IPMltool 29 Affichage et r glage des DEL de statut 30 ID de capteur de DEL 31 Modes des DEL 33 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Groupes de capteur de DEL 33 Utilisation de scripts IPMItool pour les tests 34 Journaux d v nements et codes POST 37 Affichage des journaux d v nements 37 Autotest de l allumage
97. ations d IPMI sont chang es sur des BMC Baseboard Management Controller qui sont situ s sur des composants mat riels compatibles avec IPMI L utilisation de l intelligence mat rielle de bas niveau au lieu du syst me d exploitation a deux avantages principaux tout d abord cette configuration permet une gestion de serveur hors bande et deuxi mement le syst me d exploitation n est pas charg du transport des donn es de statut du syst me Votre processeur de service Sun Fire X4500 est compatible avec IPMI v2 0 Vous pouvez acc der la fonctionnalit IPMI via la ligne de commande de l utilitaire IPMItool intrabande ou hors bande En outre vous pouvez g n rer un d routement IPMI depuis l interface Web ou g rer les fonctions IPMI du serveur depuis n importe quelle solution de gestion externe qui est compatible avec IPMI v1 5 ou v2 0 Pour plus d informations sur IPMI v2 0 visitez le site suivant http www intel com design servers ipmi spec htmH spec2 propos d IPMItool IPMItool est inclus sur le CD Tools and Drivers Outils et pilotes du serveur Sun Fire X4500 705 1438 IPMItool est une interface de ligne de commande simple utile pour g rer des p riph riques compatibles IPMI Cet utilitaire vous permet d effectuer des fonctions IPMI avec un pilote de p riph rique de noyau ou sur une interface LAN IPMltool vous permet de g rer les composants mat riels du syst me de surveiller l int grit du syst
98. aux d v nements 159 propos de l autotest de l allumage POST 162 Pr sentation du test POST BIOS de la m moire 162 Redirection de la sortie de la console 163 Modification des options du POST 164 viii Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Codes POST 166 Points de contr le des codes POST 168 Identification des DEL de statut et de panne 173 Fonctions du panneau avant 174 Fonctions du panneau arri re 176 DEL de statut internes 178 DEL du disque et du plateau de ventilateur 178 DEL de carte CPU 180 Gestion des erreurs 183 Erreurs non corrigibles 183 Erreurs corrigibles 185 Erreurs de parit PERR 187 Erreurs syst me SERR 189 Gestion des processeurs incompatibles 191 R capitulatif de la gestion des erreurs de mat riel 193 Index 201 Sommaire ix Xx Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Pr face Le Guide de diagnostic du serveur Sun Fire X4500 X4540 contient des informations et des proc dures sur le d pannage et le diagnostic des probl mes avec les serveurs Sun Fire X4500 X4540 Avant de lire ce document Il est important que vous revoyiez les instructions sur la s curit dans le Sun Fire X4500 Server Safety and Compliance Guide Guide de s curit et de conformit du serveur Sun Fire X4500 819 4776 Documentation associ e Pour une description de la documentation sur les serveurs Sun Fire X4500 X4540 reportez v
99. b ypass to print SunFireX4500 map d iagnose syslog file w pci drive path m adjacent cross front2back diagonal Mapping pairs h elp a fdisk partition type q list SunFireX4500 with index in seQuential list g list drive slot number in seQuential list with temperature 1 List SunFireX4500 available disk in physical orders r List SMART data for all disks in drive slot number R List SMART data s indivdual id in landscape view for all disks e lt cXtY gt List SMART data for specified disk j List SunFireX4500 HBA controller numbers and pci nodes 92 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Param tres des options Utilisez la commande hd pour d terminer le statut d un disque dur en mappant l emplacement du disque l aide des param tres illustr s dans le TABLEAU F 1 Les options suivantes sont prises en charge pour les fonctions illustr es TABLEAUF 1 Options hd Option Description Affiche le statut en couleur Il existe trois lignes de statut pour chaque p riph rique e emplacement physique qui correspond l tiquette du ch ssis e emplacement logique qui correspond au nom du p riph rique de stockage Solaris e statut d ex cution du disque cXtY La syntaxe suivante est utilis e e Fl che pointant vers le haut d signe le p riph rique e Vert p riph rique
100. bp panneau arri re fp panneau avant mb carte m re io carte d E S p0 processeur 0 p1 processeur 1 ft0 plateau de ventilateur 0 ftl plateau de ventilateur 1 pdb carte de distribution de courant ps0 alimentation lectrique 0 ps1 alimentation lectrique 1 Reading Lecture Indique les mesures de rpm de temp rature et de tension 4 Cliquez sur le bouton Refresh Actualiser pour mettre jour les lectures des capteurs 5 Cliquez sur le bouton Show Thresholds Afficher les seuils pour afficher les param tres qui d clenchent des alertes Le tableau de lecture des capteurs est mis jour Reportez vous l exemple de la FIGURE E 4 Par exemple si une temp rature syst me atteint 30 C le processeur de service envoie une alerte Les seuils du capteur comprennent les l ments suivants m Faible lev NR Faible ou lev irr cup rable m Faible lev CR Faible ou lev critique m Faible lev NC Faible ou lev non critique Annexe E Utilisation de l interface graphique du processeur de service ILOM pour afficher les informations syst me 87 FIGURE E 4 Page des lectures de capteur avec seuils affich s _REFRESH LOG OUT Administrator Integrated Lights Out Manager System Information System Monitoring Configuration User Management Maintenance Sensor Readings Event Logs Locator Indicator Sensor Readings View readings fortemperature volt
101. c des serveurs Sun Fire X4500 X4540 Juillet 2008 m Si vous avez r ussi vous connecter au processeur de service continuez avec les proc dures suivantes ma Affichage des journaux d v nements du processeur de service ILOM page 79 Affichage des informations sur les composants rempla ables page 83 Affichage des lectures du capteur de temp rature de tension et de ventilateur page 85 Affichage des journaux d v nements du processeur de service ILOM Les v nements sont des r ponses des actions Le journal des v nements syst me SEL IPMI fournit des informations de statut sur le mat riel et Le logiciel du serveur Sun Fire X4500 au logiciel ILOM qui affiche les v nements dans l interface graphique Web ILOM Pour afficher les journaux d v nements 1 Connectez vous au processeur de service en tant qu administrateur ou op rateur pour atteindre l interface graphique Web ILOM a Tapez l adresse IP du processeur de service du serveur dans votre navigateur Web L cran Sun Integrated Lights Out Manager Login connexion Sun Integrated Lights Out Manager s affiche b Tapez vos nom d utilisateur et mot de passe La premi re fois que vous tentez d acc der au processeur de service ILOM vous tes invit taper le nom d utilisateur et le mot de passe par d faut Les nom d utilisateur et mot de passe par d faut sont Nom d utilisateur par d faut root Mot de passe par d
102. cipal du BIOS s affiche acc dez au menu d amor age du BIOS Les crans du BIOS contiennent des instructions de navigation dans le BIOS Dans le menu d amor age du BIOS s lectionnez Boot Device Priority Priorit du p riph rique d amor age L cran correspondant appara t S lectionnez le lecteur de DVD ROM utiliser en tant que p riph rique d amor age principal Enregistrez puis fermez les crans du BIOS Red marrez le serveur Lorsque le serveur red marre partir du CD ins r dans le lecteur de DVD ROM le syst me d exploitation Solaris est amorc puis le logiciel Sun VTS d marre et ouvre sa premi re fen tre de l interface graphique Dans l interface graphique de Sun VTS appuyez sur Entr e ou cliquez sur le bouton Start D marrer lorsque vous tes invit d marrer les tests La suite de tests est ex cut e jusqu ce qu une erreur soit d tect e ou que le test soit termin Remarque L amor age du CD dure environ neuf minutes 9 Lorsque le logiciel Sun VTS a termin le test consultez les fichiers journaux g n r s pendant le test SunVTS permet d acc der quatre fichiers journaux diff rents a Le journal d erreur de test SunVTS contient les messages d erreur de test SunVTS horodat s Le nom du chemin du fichier journal est var opt SUNWvts logs sunvts err Ce fichier n est cr que lorsqu une erreur de test SunVTS se produit Chapi
103. condes pour initialiser un mode de test qui allume toutes les autres DEL l int rieur et l ext rieur du ch ssis pendant 15 secondes 4 V rifiez que tous les composants sont bien serr s ou install s 5 V rifiez que tous les connecteurs de c ble l int rieur du syst me sont correctement fix s leurs connecteurs appropri s 6 V rifiez que tous les composants usine sont recommand s et pris en charge Pour obtenir une liste des cartes PCI et des modules DIMM pris en charge reportez vous au Sun Fire X4540 Server Service Manual Manuel d entretien du serveur Sun Fire X4540 819 4359 7 V rifiez que les modules DIMM install s sont conformes aux r gles de population et aux configurations des modules DIMM comme d crit dans le Chapitre 2 D pannage des probl mes de module DIMM page 115 112 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 8 9 10 Replacez les capots des composants Pour restaurer le mode d alimentation principale sur le serveur tous les composants sont sous tension utilisez un stylo bille ou un stylet non conducteur pour appuyer et rel cher le bouton d alimentation sur le panneau avant du serveur Reportez vous la FIGURE 1 4 Lorsque l alimentation principale alimente l ensemble du serveur la DEL d alimentation OK situ e c t du bouton d alimentation s allume en continu Si le probl me avec le serveur n est pas vident vous p
104. ctez des p riph riques USB Branchez un cran Ins rez des p riph riques pour cartes Compact Flash Annexe G Identification des DEL de statut et de panne 177 178 DEL de statut internes Le serveur Sun Fire X4540 poss de des DEL de carte de statut internes pour la carte CPU les emplacements de CPU et de module DIMM sur la carte CPU Le syst me comporte des DEL internes sur les disques les plateaux de ventilateur et les emplacements PCI Consultez les figures et les tableaux suivants pour en savoir plus sur les DEL qui sont visibles l int rieur du serveur m La FIGURE G 4 et la FIGURE G 5 montrent les DEL du disque et du plateau de ventilateur m La FIGURE G 6 et le TABLEAU G 2 d crivent l emplacement des DEL et des boutons internes DEL du disque et du plateau de ventilateur La FIGURE G 4 indique l emplacement du disque et des plateaux de ventilateur La FIGURE G 5 propose un gros plan du disque et des plateaux de ventilateur et indique les symboles qui identifient les DEL Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 FIGURE G 4 Disques et plateaux de ventilateur Annexe G Identification des DEL de statut et de panne 179 FIGURE G 5 DEL du disque et du plateau de ventilateur Ready to Remove Fault Service action service action allowed required ok ox DEL de carte CPU La carte CPU contient trois types de DEL les DEL de panne de module DIMM
105. ction r pertorie quelques faits et consid rations sur la fa on dont le serveur g re les erreurs de parit PERR m La gestion des erreurs de parit est effectu e via des interruptions non masquables NMI m Lors de l autotest de l allumage du BIOS la NMI est consign e dans le DMI et dans le journal SEL du processeur de service Reportez vous l exemple de commande et de sortie suivant root d mpk12 53 238 root ipmitool H 129 146 53 95 U root P changeme I lan sel list v SEL Record ID 0100 Record Type 00 Timestamp 01 10 2002 20 16 16 Generator ID 0001 EvM Revision 04 Sensor Type Critical Interrupt Sensor Number 00 Event Type Sensor specific Discrete Annexe D Gestion des erreurs 65 Event Direction Assertion Event Event Data 04f f00 Description PCI PERR m La FIGURE D 4 repr sente un exemple d cran de journal DMI de la page de configuration du BIOS avec une erreur de parit FIGURE D 4 cran de journal DMI erreur de parit PCI BIOS SETUP UTILITY Vieu Event Log Vieu Event Lo 09 12 05 14 27 47 m Le BIOS affiche les messages suivants et se bloque lors de l autotest de l allumage ou le DOS m NMI EVENT a System Halted due to Fatal NMI m Le d routement NMI Linux saisit l interruption et consigne la s quence suivante Aug 5 05 15 00 d mpk12 53 159 kernel Uhhuh NMI received for unknown reason 2d on CPU 0 Aug 5 05 15 00 d mpk12 53 159 kernel Uhh
106. de l allumage du BIOS la DEL s allume en continu Le processeur de service contr le la r initialisation du syst me le syst me ne quitte pas la r initialisation Non consign e Fatale Non consign e Fatale Annexe D Gestion des erreurs 71 TABLEAU D 1 R capitulatif de la gestion des erreurs de mat riel Suite Erreur Description Gestion Consign e journal DMI ou SEL du processeur de service Fatale Le BIOS du serveur choue l autotest de l allumage chec de l autotest de l allumage du BIOS Erreur ECC Lorsque ECC est DRAM monobit activ dans la configuration du BIOS la CPU d tecte et corrige une erreur monobit dans l interface du module DIMM L autotest de l allumage du BIOS contient des erreurs fatales et non fatales Le BIOS d tecte certaines erreurs signal es lors de l autotest de l allumage du BIOS sous forme de codes POST dans l angle inf rieur droit de l cran de la console s rie et sur l cran vid o Certains codes POST sont transf r s au processeur de service pour consignation Les codes POST ne sont pas envoy s en ordre s quentiel et certains sont r p t s car certains codes POST sont mis par le code dans les ROM d extension BIOS de la carte d extension En cas d chec au d but de l autotest de l allumage par exemple lorsque le BSP ne fonctionne pas correctement le BIOS s arr te sans consignation Pour certaines autres err
107. de la gestion des erreurs de mat riel page 70 Gestion des erreurs non corrigibles Cette section explique comment le serveur g re les erreurs non corrigibles Remarque La fonction ChipKill du BIOS doit tre d sactiv e si vous testez des d faillances de bits multiples dans une m moire DRAM ChipKill corrige les erreurs de DRAM 4 bits Le BIOS consigne l erreur dans le journal des v nements syst me SEL du processeur de service l aide du contr leur BMC Board Management Controller Le journal SEL du processeur de service est mis jour avec l adresse de banque sp cifique de la paire de modules DIMM d faillante Le syst me red marre Le BIOS consigne l erreur dans l interface DMI 61 Remarque Si l erreur se situe dans la m moire basse de 1 Mo le BIOS se bloque apr s le red marrage Par cons quent aucun journal DMI n est enregistr m Voici un exemple d erreur consign e par le journal SEL via IPMI 2 0 a Lorsque la m moire basse est erron e le BIOS se bloque lors du test de m moire basse de pr d marrage car le BIOS ne peut pas s auto d compresser dans la m moire DRAM d faillante et ex cuter les l ments suivants ipmitool gt sel list 100 08 26 2005 11 36 09 OEM 0xfb 200 08 26 2005 11 36 12 System Firmware Error No usable system memory 300 08 26 2005 11 36 12 Memory Memory Device Disabled CPU 0 DIMM 0 a Lorsque le module DIM
108. du logiciel Erreur ECC La CPU d tecte La m thode sync flood est utilis e Journal SEL Fatale DRAM non une erreur de pour emp cher les donn es erron es du processeur corrigible module DIMM d tre propag es via les liens de service multibit non HyperTransport Le syst me corrigible red marre le BIOS r cup re les informations du registre d erreur machine mappe ces informations vers le module DIMM lorsque CHIPKILL est d sactiv ou la paire de module lorsque CHIPKILL est activ d faillant et les consigne dans le processeur de service Le BIOS arr te la CPU Configuration Des modules Le BIOS affiche un message d erreur Journal DMI Fatale de modules DIMM non pris consigne une erreur et arr te le Journal SEL DIMM non prise en charge sont syst me du processeur en charge utilis s ou des de service modules DIMM pris en charge ne sont pas charg s correctement Annexe H Gestion des erreurs 195 TABLEAUH 1 R capitulatif de la gestion des erreurs de mat riel Suite Consign e journal DMI ou SEL du processeur Erreur Description Gestion de service Fatale chec du lien Erreur CRC ou de Un Sync floods se produit sur les Journal DMI Fatale HyperTransport lien sur l un des HyperTransport la machine se Journal SEL liens r initialise et les informations du processeur HyperTransport d erreur sont conserv es apr s la de service r initialisation Le BIOS consigne A Hyper Transport sync flood error
109. dule DIMM et effectue une r initialisation 0x03 fait r f rence au num ro de la r initialisation Le BIOS a d sactiv tous les modules DIMM d fectueux dans l espace de m moire syst me et les a consign s Chaque module DIMM d une paire est consign car les informations sur les erreurs de mat riel non corrigibles ne donnent pas plus d indications au BIOS que la d tection d une paire d fectueuse Erreurs de module DIMM corrigibles Si un module DIMM pr sente 24 erreurs corrigibles ou plus en l espace de 24 heures il est consid r comme d fectueux et doit tre remplac Pour l instant les erreurs corrigibles ne sont pas consign es dans les journaux des v nements syst me du serveur Elles sont consign es ou g r es dans les syst mes d exploitation pris en charge de la mani re suivante m Windows Server a Une info bulle de message d erreur machine s affiche dans la barre des t ches b L utilisateur doit ouvrir manuellement l Observateur d v nements pour voir les erreurs Voici le chemin d acc s l Observateur d v nements D marrer gt Outils d administration Observateur d v nements c L utilisateur peut alors consulter les erreurs individuelles par heure pour voir les d tails de l erreur m Solaris Solaris FMA consigne et parfois met hors service la m moire indiquant des erreurs ECC Error Correction Code code de correction d erreur Consultez la documentation de v
110. e voir POST B BIOS codes POST 44 166 journaux d v nements 37 159 modification des options du POST 42 164 points de contr le des codes POST 47 168 pr sentation de POST 40 162 redirection de la sortie de la console pour l autotest de l allumage 41 163 Bouton NMI 56 r initialisation 56 Bouton de r initialisation 56 Bouton NMI 56 C Cache SDR utilisation avec IPMItool 28 145 Capteurs affichage l aide de l interface graphique du processeur de service ILOM 85 132 affichage avec IPMitool 23 140 CD de diagnostic amor able 16 154 Cl SSH configuration avec IPMltool 22 140 Collecte des informations sur la visite de maintenance 3 105 Commentaires et suggestions xiii Configurations des modules DIMM 12 116 Connexion s rie au processeur de service ILOM 78 125 Correspondance entre les num ros de capteurs et les noms de capteurs 29 146 D DEL affichage du statut avec IPMltool 30 148 emplacement sur le panneau avant 53 107 174 175 externe 51 groupes de capteur 33 151 ID de capteur 31 148 interne 56 178 modes 33 150 r glage du statut avec IPMItool 30 148 DEL externes 51 DEL internes 56 178 D pannage instructions 3 105 organigramme 2 104 Documentation associ e xi E Emplacement des DEL sur le panneau avant 53 175 Emplacement du bouton d alimentation 6 111 112 Erreurs corrigibles gestion 63 185 Erreurs de mat riel gestion 70 19
111. e Int 13 et pr paration de la d tection IPL 78 Initialisation des unit s IPL contr l es par le BIOS et des ROM en option 7A Initialisation des ROM en option restantes 7C G n ration et criture du contenu de ESCD dans la m moire NVRam 84 Consignation des erreurs d tect es lors du test POST 85 Affiche des erreurs l intention de l utilisateur et demande celui ci de r pondre 87 Ex cution du programme de configuration du BIOS si n cessaire demand e 8C Une fois l initialisation de toutes les unit s termin e programmation des param tres s lectionnables par l utilisateur associ s NB SB tels que les param tres de synchronisation les r gions ne pouvant pas tre mises en cache et la possibilit de mise en m moire vive fant me et ex cution des op rations de programmation NB SB PCIX OEM n cessaires la fin du test POST L effacement en arri re plan de la m moire DRAM et des caches de niveau 1 et 2 est configur en fonction des questions de configuration Obtention des limites d effacement DRAM de chaque n ud 8D Cr ation des tables ACPI si ACPI est pris en charge 8E Programmation des param tres des p riph riques Activation d sactivation de NMI selon s lection 90 Initialisation la fin du POST de l interruption de gestion de syst me AO V rification du mot de passe d initialisation si d fini Al Nettoyage n cessaire avant initialisation du syst me d exploitation A2 Pr paration
112. e comme suit ipmitool I lanplus H lt IPADDR gt U root P changeme exec leds fan on isc Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 CHAPITRE 5 Utilisation du logiciel de diagnostic SunVTS Ce chapitre contient des informations sur le logiciel de diagnostic SunVTS Ce chapitre aborde les sujets suivants m propos du logiciel de diagnostic SunVTS page 153 m Ex cution de tests de diagnostic l aide de SunVTS page 154 propos du logiciel de diagnostic Sun VTS Les serveurs Sun Fire X4540 sont livr s avec un CD de diagnostic amor able qui contient le logiciel SunVTS Validation Test Suite SunVTS fournit un outil de diagnostic complet qui teste et valide le mat riel Sun en v rifiant la connectivit et la fonctionnalit de la plupart des p riph riques et contr leurs mat riels sur les plates formes Sun Le logiciel Sun VTS peut tre adapt avec des instances de test modifiables et des fonctions d affinit de processeur Les plates formes x86 prennent en charge les tests suivants La prise en charge x86 actuelle concerne le syst me d exploitation 32 bits uniquement Test CD DVD cddvdtest Test CPU cputest Test des lecteurs de disque et de disquette disktest Tampon de traduction de donn es dtlbtest Test d unit de calcul en virgule flottante fputest Test du mat riel r seau nettest Test de loopback Ethernet netlbtest Test de la m m
113. e correctement et si la somme de contr le CMOS est correcte V rification manuelle de la somme de contr le CMOS par lecture de la zone de stockage Si la somme de contr le CMOS est incorrecte mise jour CMOS avec les valeurs par d faut de la mise sous tension et effacement des mots de passe Initialisation du registre de statut A Initialisation des variables de donn es bas es sur les questions de configuration CMOS Initialisation des deux PIC compatibles 8259 dans le syst me 05 Initialisation du mat riel de contr le des interruptions PIC g n ralement et du tableau des vecteurs d interruption 06 Test L E sur le registre comptable CH 2 Initialisation de CH 0 comme minuteur syst me Installation du gestionnaire POSTINT1Ch Activation d IRQ 0 dans PIC pour interruption du minuteur syst me D routement du vecteur INT1Ch vers POSTINTIChHandlerBlock CO D but anticip de l initialisation CPU D sactivation du cache Initialisation APIC local C1 Configuration des informations du processeur d initialisation C2 Configuration du processeur d initialisation pour POST Cela inclut le calcul de fr quence le chargement du microcode BSP et l application de la valeur demand e par l utilisateur pour la question de configuration de signalisation d erreur GART C3 Application au BSP des corrections des errata 78 amp 110 C5 num ration et configuration des processeurs d applications Inclut le chargement du microcode
114. e de de service permet de d tecter ventilateur individuel s allument une panne du ventilateur Pannes du La lecture Les DEL de panne du ventilateur Journal SEL Fatale ventilateur des signaux avant de demande d op ration de du processeur tachym triques maintenance et du module de de service permet de d tecter ventilateur individuel s allument une panne du ventilateur Panne de Lorsque l un des Les DEL de demande d op ration Journal SEL Non fatale l alimentation signaux CA CC de maintenance et de panne de du processeur lectrique PS_VIN_GOOD ou l alimentation lectrique s allument de service PS_PWR_OK est d sactiv Annexe D Gestion des erreurs 75 TABLEAU D 1 R capitulatif de la gestion des erreurs de mat riel Suite Consign e journal DMI ou SEL du processeur Erreur Description Gestion de service Fatale Panne du Tout signal La DEL de demande d op ration de Journal SEL Fatale convertisseur POWER_GOOD est maintenance s allume le syst me passe du processeur CC CC d sactiv des en mode d alimentation de secours et de service convertisseurs la DEL d alimentation clignote pour CC CC indiquer le mode de secours Seuil de tension Le processeur de La DEL de demande d op ration de Journal SEL Fatale sup rieure service surveille les maintenance et la DEL de panne de du processeur inf rieure tensions et d tecte l alimentation clignotent de service celles qui sont sup rieures ou inf rieures
115. e et du module de de service permet de ventilateur individuel s allument d tecter une panne du ventilateur Pannes du La lecture des Les DEL de panne du ventilateur Journal SEL Fatale ventilateur signaux avant de demande d op ration de du processeur tachym triques maintenance et du module de de service permet de ventilateur individuel s allument d tecter une panne du ventilateur Panne de Lorsque l un des Les DEL de demande d op ration de Journal SEL Non fatale l alimentation signaux CA CC maintenance et de panne de du processeur lectrique PS_VIN_GOOD l alimentation lectrique s allument de service ou PS_PWR_OK est d sactiv Panne du Tout signal La DEL de demande d op ration de Journal SEL Fatale convertisseur POWER_GOOD maintenance s allume le syst me du processeur CC CC est d sactiv des passe en mode d alimentation de de service convertisseurs secours et la DEL d alimentation CC CC clignote pour indiquer le mode de secours 198 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 TABLEAUH 1 R capitulatif de la gestion des erreurs de mat riel Suite Erreur Description Gestion Consign e journal DMI ou SEL du processeur de service Fatale Seuil de tension sup rieure inf rieure Temp rature lev e Surchauffe du processeur Panne du p riph rique de d marrage Le processeur de service surveille les tensions et d tecte celles qui sont sup rieu
116. e nom de capteur se trouve dans la premi re colonne et le num ro de capteur correspondant dans la deuxi me Pour obtenir une explication d taill e de tous les capteurs class s par nom reportez vous au Suppl ment relatif Integrated Lights Out Manager Affichage des informations sur les composants avec IPMItool Vous pouvez afficher des informations sur les composants mat riels du syst me Le logiciel fait r f rence ces composants en tant que p riph riques d unit s rempla ables sur site FRU Annexe A Utilisation d IPMitool pour afficher les informations syst me 29 Pour lire les informations d inventaire des FRU sur ces serveurs vous devez d abord avoir programm les ROM des FRU Une fois cette programmation effectu e vous pouvez voir une liste compl te des donn es de FRU disponibles en utilisant la commande fru print comme indiqu dans l exemple suivant seuls deux p riph riques de FRU sont indiqu s dans l exemple mais vous pouvez afficher tous les p riph riques ipmitool I lanplus H lt IPADDR gt U root P changeme fru print FRU Device Description Builtin FRU Device ID 0 Board Mfg BENCHMARK ELECTRONICS Board Product ASSY SERV PROCESSOR X4X00 Board Serial O0060HSV 0523000195 Board Part Number 501 6979 02 Board Extra 000 000 00 Board Extra HUNTSVILLE AL USA Board Extra b302 Board Extra 06 Board Extra GRASP Product Manufacturer SUN MICROSYSTEMS Product Name
117. e ou un stylet pour appuyer et rel cher le bouton d alimentation sur le panneau avant du serveur Reportez vous la FIGURE 1 4 Lorsque l alimentation principale alimente l ensemble du serveur la DEL d alimentation OXK situ e c t du bouton d alimentation s allume en continu 2 Ouvrez l utilitaire de configuration du BIOS en appuyant sur la touche F2 pendant que le syst me effectue l autotest de l allumage POST L cran du menu principal du BIOS appara t 37 3 Affichez le journal d v nements du BIOS a Sur l cran du menu principal du BIOS s lectionnez Advanced Avanc L cran Advanced Settings Param tres avanc s s affiche FIGURE B 1 cran principal du menu Advanced Settings Param tres avanc s du BIOS Main Advanced PCIPnP Boot Security Chipset Exit kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk Advanced Settings Options for CPU k kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk WARNING Setting wrong values in below sections may cause system to malfunction k CPU Configuration IDE Configuration SuperIO Configuration ACPI Configuration Event Log Configuration Hyper Transport Configuration IPMI 2 0 Configuration MPS Configuration k kk Select Screen PCI express Configuration AMD PowerNow Configuration k okk Select Item Remote Access Configurat
118. e temps r el de l h te ou l insertion du cavalier d effacement de la CMOS sur le contr leur syst me L horloge temps r el de l h te commence le Jan 1 00 01 00 2002 Lorsque le syst me d exploitation de l h te d finit l horloge temps r el de l h te Le BIOS ne prend en compte les fuseaux horaires Solaris et Linux respectent les fuseaux horaires et r glent l horloge du syst me sur le format UTC Par cons quent une fois que le syst me d exploitation r gle l horloge temps r el l heure d finie par le BIOS est le temps universel a Lorsque l utilisateur d finit l horloge temps r el l aide de l cran de configuration du BIOS h te En permanence via NTP si NTP est activ sur le processeur de service Le NTP par cavalier est activ pour r cup rer rapidement d une mise jour erron e provenant du BIOS ou de l utilisateur Les serveurs NTP fournissent le temps universel Donc si NTP est activ sur le processeur de service son horloge sera au format UTC Via l interface de ligne de commande l interface Web d ILOM et IPMI 130 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Affichage des informations sur les composants rempla ables Selon le composant s lectionn les informations relatives au fabricant au nom du composant au num ro de s rie et au num ro de r f rence peuvent s afficher 1 Connectez vous au processeur de service en tant qu administrateur ou op rateu
119. e voir que les capteurs de temp rature de tension et de ventilateur vous pouvez utiliser la commande suivante avec l argument fu11 Chapitre 4 Utilisation d IPMitool pour afficher les informations syst me 141 142 ipmitool I lanplus H lt IPADDR gt U root P changeme sdr elist full fp t_amb oAh ok 12 0 22 degrees C ps t_amb 11h ok 10 0 21 degrees C ps0 f0 speed 15h ok 10 0 11000 RPM ps1l f0 speed 19h ok 10 1 0 RPM mb t_amb 1Ah ok 7 0 25 degrees C mb v bat 1Bh ok 7 0 3 18 Volts mb v 3v3stby 1Ch ok 7 0 3 17 Volts mb v 3v3 1Dh ok 7 0 3 34 Volts mb v 5v 1Eh ok 7 0 5 04 Volts mb v 12v 1Fh ok 7 0 12 22 Volts mb v 12v 20h ok 7 0 12 20 Volts mb v 2v5core 21h ok 7 0 2 54 Volts mb v 1v8core 22h ok 7 0 1 83 Volts mb v 1v2core 23h ok 7 0 1 21 Volts io t _amb 24h ok 15 0 21 degrees C p0 t core 2Bh ok 3 0 44 degrees C po0 v 1v5 2Ch ok 3 0 1 56 Volts p0 v 2v5core 2Dh ok 3 0 2 64 Volts p0 v 1v25core 2Eh ok 3 0 1 32 Volts pl t core 34h ok 3 1 40 degrees C pl v 1v5 35h ok 3 1 1 55 Volts pl v 2v5core 36h ok 3 1 2 64 Volts pl v 1v25core 37h ok 3 1 1 32 Volts ft0 fmO0 f0 speed 43h ok 29 0 6000 RPM ft0 fml f0 speed 44h ok 29 1 6000 RPM ftO0 fm2 f0 speed 45h ok 29 2 6000 RPM ft1 fm0 f0 speed 46h ok 29 3 6000 RPM ftl fml f0 speed 47h ok 29 4 6000 RPM ftl fm2 f0 s
120. ec le serveur n est pas vident passez la section Using the ILOM Service Processor GUI to View System Information page 49 ou la section Using IPMItool to View System Information page 61 Annexe B Journaux d v nements et codes POST 39 40 Autotest de l allumage POST Le BIOS du syst me fournit un autotest de l allumage rudimentaire Les p riph riques de base n cessaires au bon fonctionnement du serveur sont v rifi s la m moire est test e le contr leur de disque Marvell 885X6081 et les disques connect s sont v rifi s et num r s et les deux contr leurs Intel Dual Gigabit Ethernet sont initialis s L avancement de l autotest est indiqu par des codes POST Ces codes s affichent dans l angle inf rieur droit de l cran VGA du syst me lorsque le test est suffisamment avanc pour initialiser l cran Toutefois les codes s affichent au cours du test et disparaissent trop rapidement de l cran pour tre lus Une autre m thode d affichage des codes POST consiste rediriger la sortie de la console vers un port s rie reportez vous la section Redirection de la sortie de la console page 41 Fonctionnement du test POST BIOS de la m moire Le test POST BIOS de la m moire est effectu de la mani re suivante 1 Le premier m gaoctet de la m moire DRAM est test par le BIOS avant la copie du code BIOS de la m moire ROM vers la m moire DRAM 2 Apr s la sortie de la
121. ed on sunoem led set ft0 fml led on sunoem led set ft0 fm2 led on sunoem led set ft1l fm0 led on sunoem led set ftl fml led on sunoem led set ftl fm2 led on 34 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Si ce fichier de script tait nomm leds_fan_on isc vous l utiliseriez dans une commande comme suit ipmitool I lanplus H lt IPADDR gt U root P changeme exec leds fan on isc Annexe A Utilisation d IPMitool pour afficher les informations syst me 35 36 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 ANNEXE B Journaux d v nements et codes POST Cette annexe contient des informations sur le journal d v nements du BIOS le journal SEL System Event Log du BMC l autotest de l allumage POST et la redirection de la console Pour plus d informations sur le journal d v nements et les codes POST du BIOS reportez vous au Sun Fire X4500 Server Service Manual Manuel d entretien du serveur Sun Fire X4500 819 4359 Cette annexe comprend les sections suivantes m Affichage des journaux d v nements page 37 a Autotest de l allumage POST page 40 m Codes POST page 44 Affichage des journaux d v nements Utilisez cette proc dure pour afficher le journal d v nements du BIOS et le journal SEL System Event Log du BMC 1 Pour activer le mode d alimentation principale tous les composants sont sous tension utilisez un stylo bill
122. elect a sensor type category All Sensors 7 Sensor Readings 77 sensors Status Name Reading State Asserted sys id State Asserted sys intsw Predictive Failure Deasserted sys psfail Predictive Failure Deasserted sys tempfail Predictive Failure Deasserted sys fanfail Normal mb t_ amb 24 degrees C Normal mb v_bat 3 232 Volts Normal mb v_ 3v3sthy 3 217 Volts Unknown mb v_ 3v3 Not Available Unknown mbv_ 5v Not Available _Show Thresholds 3 S lectionnez le type de lectures de capteur que vous voulez afficher dans le menu d roulant Vous pouvez s lectionner All Sensors Tous les capteurs Temperature Sensors Capteurs de temp rature Voltage Sensors Capteurs de tension ou Fan Sensors Capteurs de ventilateur 86 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Les lectures du capteur s affichent Le TABLEAU E 2 d crit les champs des lectures du capteur TABLEAU E 2 Champs des lectures du capteur Champ Description Status Statut Indique le statut du capteur State Asserted tat activ State Deasserted tat d sactiv Predictive Failure Panne pr dictive Device Inserted P riph rique ins r Device Present P riph rique pr sent Device Removed P riph rique retir Device Absent P riph rique absent Unknown Inconnu ou Normal Name Nom Indique le nom du capteur Les noms correspondent aux composants suivants sys syst me ou ch ssis
123. eneral Help F10 Save and Exit ESC Exit x x x kkkkkkkkkkkkkkkkkkkkkk kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkS 4 Sur l cran Boot Settings Configuration s lectionnez les options que vous pouvez activer ou d sactiver m Quick Boot Initialisation rapide cette option est d sactiv e par d faut Si vous l activez le BIOS ignore certains tests lors de l initialisation tels que le test tendu de la m moire Cela permet d acc l rer l initialisation du syst me m System Configuration Display Affichage de la configuration du syst me cette option est d sactiv e par d faut Si vous l activez l cran System Configuration Configuration du syst me s affiche avant le d but de linitialisation m Quiet Boot Initialisation silencieuse cette option est d sactiv e par d faut Si vous l activez le logo Sun Microsystems s affiche la place des codes POST m Language Langue cette option est r serv e pour une utilisation future Ne pas modifier Annexe B Journaux d v nements et codes POST 43 a Add On ROM Display Mode Mode d affichage de ROM d extension cette option est d finie sur Force BIOS Forcer le BIOS par d faut Elle n est appliqu e que si vous avez activ l option Quiet Boot elle permet d afficher ou non la sortie de la ROM en option Les deux valeurs de cette option sont les suivantes a Force BIOS Forcer le BIOS supprime le logo Sun et
124. ent apr s avoir consult les informations sur les composants rempla ables passez la section Ex cution de tests de diagnostic l aide de SunVTS page 154 84 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Affichage des lectures du capteur de temp rature de tension et de ventilateur Cette section d crit comment afficher les lectures du capteur de temp rature de tension et de ventilateur du serveur Sun Fire X4500 Six capteurs de temp rature sont surveill s Ils g n rent tous des v nements IPMI consign s dans le journal SEL lorsqu un seuil sup rieur est d pass Trois de ces lectures de capteur sont utilis es pour ajuster les vitesses du ventilateur et effectuer d autres actions telles que l allumage des DEL et la mise hors tension du ch ssis Ces capteurs et leurs seuils respectifs sont les suivants a Temp rature ambiante du panneau avant fp t_amb a Valeur sup rieure non critique 30 degr s C Valeur sup rieure critique 35 degr s C Valeur sup rieure irr cup rable 40 degr s C a Temp ratures die des CPU 0 p0 t_core et CPU 1 pl t_core a Valeur sup rieure non critique 55 degr s C a Valeur sup rieure critique 65 degr s C a Valeur sup rieure irr cup rable 75 degr s C Il existe trois autres capteurs de temp rature a Temp rature ambiante de la carte d E S io t_amb a Temp rature ambiante du contr leur syst me mb t_amb a Temp rature a
125. ent dans l tat CLI HLT 8613 Initialisation des registres PM et PM PCI au d but du test POST Initialisation d un pont multi h te si le syst me le prend en charge D finition des options ECC avant l effacement de la m moire Activation des lignes d horloge PCI X dans le 8131 0024 D compression et initialisation de n importe quels modules BIOS de plate forme 862a Initialisation de la ROM BBS 002a DIM Device Initialization Manager g n rique D sactivation de toutes les unit s 042a Unit s ISA PnP D sactivation de toutes les unit s 052a Unit s PCI D sactivation de toutes les unit s 122a Unit s ISA Initialisation des unit s statiques 152a Unit s PCI Initialisation des unit s statiques 252a Unit s PCI Initialisation des unit s de sortie Chapitre 6 Affichage des journaux d v nements et des codes POST 167 TABLEAU 6 1 Codes POST Suite Code POST Description 202c Initialisation de diff rentes unit s D tection et initialisation de l adaptateur vid o install dans le syst me ayant des ROM en option 002e Initialisation de toutes les unit s de sortie 0033 Initialisation du module d initialisation silencieuse Configuration de la fen tre pour affichage des informations texte 0037 Affichage d un message de connexion des informations CPU du message de touche de configuration et des informations OEM 4538 Unit s PCI Initialisation des unit s IPL 5538 Unit s PCT Initial
126. es champs des lectures du capteur TABLEAU 3 2 Champs des lectures du capteur Champ Description Status Statut Indique le statut du capteur State Asserted tat activ State Deasserted tat d sactiv Predictive Failure Panne pr dictive Device Inserted P riph rique ins r Device Present P riph rique pr sent Device Removed P riph rique retir Device Absent P riph rique absent Unknown Inconnu ou Normal Name Nom Indique le nom du capteur Les noms correspondent aux composants suivants e sys syst me ou ch ssis e bp panneau arri re e fp panneau avant e mb carte m re e io carte d E S e p0 processeur 0 e pl processeur 1 e ft0 plateau de ventilateur 0 e ftl plateau de ventilateur 1 e pdb carte de distribution de courant e ps0 alimentation lectrique 0 e ps1 alimentation lectrique 1 Reading Lecture Indique les mesures de rpm de temp rature et de tension 4 Cliquez sur le bouton Refresh Actualiser pour mettre jour les lectures des capteurs 5 Cliquez sur le bouton Show Thresholds Afficher les seuils pour afficher les param tres qui d clenchent des alertes Le tableau de lecture des capteurs est mis jour Reportez vous l exemple de la FIGURE 3 4 Par exemple si une temp rature syst me atteint 30 C le processeur de service envoie une alerte Les seuils du capteur comprennent les l ments suivants m Faible lev NR
127. es durs du syst me contiennent des composants extr mement sensibles l lectricit statique Remarque Pour r cup rer des informations sur la panne consultez le journal SEL du processeur de service Reportez vous au Guide de l utilisateur de Sun Integrated Lights Out Manager 5 Retirez les modules DIMM de leurs emplacements dans la CPU Reportez vous au manuel d entretien de votre serveur pour plus de d tails 6 Examinez visuellement les modules DIMM la recherche de dommages physiques de poussi re ou de toute autre contamination sur le connecteur ou les circuits Chapitre 2 D pannage des probl mes de module DIMM 123 7 Examinez visuellement l emplacement de module DIMM la recherche de dommages physiques Regardez si l emplacement contient du plastique fendu ou cass 8 D poussi rez les modules DIMM nettoyez les contacts et r installez les Attention Utilisez uniquement de l air comprim pour d poussi rer les modules DIMM 9 S il n y a pas de dommages vidents remplacez les modules DIMM d faillants Pour les erreurs non corrigibles si les DEL indiquent une panne dans la paire remplacez les deux modules DIMM Assurez vous qu ils sont bien ins r s et que les loquets d jecteur sont fix s 10 Rebranchez les cordons d alimentation CA sur le serveur 11 Mettez le serveur sous tension et ex cutez de nouveau le test de diagnostic 12 V rifiez le fichier journal S
128. es informations sur les composants rempla ables page 131 a Affichage des lectures du capteur de temp rature de tension et de ventilateur page 132 a Si vous n avez pas pu vous connecter au processeur de service il peut y avoir un probl me avec la carte GRASP Graphics Redirect and Service Processor Remplacez cette carte puis r p tez l tape 1 l tape 4 Reportez vous au Sun Fire X4540 Server Service Manual Manuel d entretien du serveur Sun Fire X4500 819 4359 pour obtenir des instructions 126 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Affichage des journaux d v nements du processeur de service ILOM Les v nements sont des r ponses des actions Le journal des v nements syst me SEL IPMI fournit des informations de statut sur le mat riel et Le logiciel du serveur Sun Fire X4540 au logiciel ILOM qui affiche les v nements dans l interface graphique Web ILOM m Si certains des journaux ou des crans d informations indiquent une erreur de module DIMM reportez vous aux sections Messages d erreur de module DIMM du BIOS page 120 et Isolation et correction des erreurs ECC de module DIMM page 122 m Si le probl me du serveur n est pas vident apr s avoir consult les journaux et les informations du processeur de service ILOM passez la section Ex cution de tests de diagnostic l aide de SunVTS page 154 Pour afficher les journaux d v
129. et d marre POST BIOS du contenu du incorrecte CMOS a chou 74 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 TABLEAU D 1 R capitulatif de la gestion des erreurs de mat riel Suite Consign e journal DMI ou SEL du processeur Erreur Description Gestion de service Fatale Configuration Le BIOS prend en Le BIOS affiche un message d erreur Journal DMI Fatale de CPU non charge la fr quence consigne l erreur et arr te le syst me prise en charge et les instructions non concordantes dans la configuration de la CPU mais certaines CPU peuvent ne pas tre prises en charge Erreur La CPU d tecte La CPU corrige l erreur dans le Journal DMI Fonctionnement corrigible plusieurs erreurs mat riel Le mat riel ne g n re aucune Journal SEL normal corrigibles dans interruption ou v rification machine du processeur les registres L interrogation est d clench e toutes de service MCi_STATUS les demi secondes par les interruptions du minuteur SMI et est effectu e par le gestionnaire SMI du BIOS Le gestionnaire SMI consigne un message dans le journal SEL du processeur de service s il est disponible sinon le SMI consigne un message dans DMI L interrogation du BIOS peut tre d sactiv e via l interface SMI du logiciel Panne du La lecture Les DEL de panne du ventilateur Journal SEL Non fatale ventilateur des signaux avant de demande d op ration du processeur tachym triques de maintenance et du modul
130. eurs du POST qui se produisent apr s l initialisation de la m moire et du processeur de service le BIOS consigne un message dans le journal SEL du processeur de service La CPU corrige l erreur dans le mat riel Le mat riel ne g n re aucune interruption ou v rification machine L interrogation est d clench e toutes les demi secondes par les interruptions du minuteur SMI et est effectu e par le gestionnaire SMI du BIOS Le gestionnaire SMI du BIOS commence consigner chaque erreur d tect e et arr te la consignation lorsque la limite pour une m me erreur est atteinte L interrogation du BIOS peut tre d sactiv e via l interface du logiciel Journal SEL Fonctionnement du processeur normal de service 72 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 TABLEAU D 1 R capitulatif de la gestion des erreurs de mat riel Suite Consign e journal DMI ou SEL du processeur Erreur Description Gestion de service Fatale Erreur DRAM Avec CHIP KILL La CPU corrige l erreur dans le Journal SEL Fonctionnement 4 bits activ dans la mat riel Le mat riel ne g n re aucune du processeur normal configuration du interruption ou v rification machine de service BIOS la CPU d tecte L interrogation est d clench e toutes et corrige l erreur de les demi secondes par les interruptions m moire DRAM 4 du minuteur SMI et est effectu e par le bits dans l interface gestionnaire SMI du BIOS du
131. ez l ID utilisateur de l utilisateur du processeur de service distant souhait avec la commande de liste d utilisateurs suivante ipmitool I lanplus H lt IPADDR gt U root P changeme user list Puis fournissez l ID utilisateur et l emplacement de la cl publique RSA ou DSA utiliser avec la commande ipmitool sunoem sshkey Par exemple ipmitool I lanplus H lt IPADDR gt U root P changeme sunoem sshkey set 2 id rsa pub Setting SSH key for user id 2 done Vous pouvez galement effacer la cl d un utilisateur particulier par exemple ipmitool I lanplus H lt IPADDR gt U root P changeme sunoem sshkey del 2 Deleted SSH key for user id 2 Utilisation d IPMItool pour lire les capteurs Pour plus d informations sur les commandes IPMI 2 0 prises en charge et le nommage de capteur pour ce serveur reportez vous au Guide d administration de Integrated Lights Out Manager 819 1160 Lecture du statut des capteurs Il existe plusieurs fa ons de lire le statut des capteurs une pr sentation g n rale qui liste tous les capteurs ou une interrogation de capteurs sp cifiques qui renvoie des informations d taill es les concernant Lecture de tous les capteurs Pour obtenir une liste de tous les capteurs dans ces serveurs et leur statut utilisez la commande sdr list sans arguments Cela renvoie un tableau avec tous les capteurs du syst me et leur statut 140 Guide de diagnostic des serveurs Sun Fire X4500
132. ez sur la touche ENTREE du terminal pour tablir une connexion entre ce terminal et le processeur de service ILOM du serveur Remarque Si vous vous connectez au port s rie du processeur de service avant sa mise sous tension ou pendant sa s quence de mise sous tension des messages d initialisation s affichent Le processeur de service affiche une invite de connexion apr s quelques secondes Par exemple SUNSP0003BA84D777 login La premi re cha ne dans l invite est le nom d h te par d faut du processeur de service ILOM Le nom d h te est compos du pr fixe SUNSP et de l adresse MAC unique du processeur de service ILOM 3 Connectez vous au processeur de service La premi re fois que vous tentez d acc der au processeur de service ILOM vous tes invit taper le nom d utilisateur et le mot de passe par d faut Tapez les nom d utilisateur et mot de passe par d faut Nom d utilisateur par d faut root Mot de passe par d faut changeme Apr s vous tre connect au processeur de service l invite de commande par d faut s affiche gt 4 Pour d marrer la console s rie tapez les commandes suivantes cd SP console start 5 V rifiez que vous tes connect au processeur de service m Si vous avez r ussi vous connecter au processeur de service continuez avec les proc dures suivantes Affichage des journaux d v nements du processeur de service ILOM page 127 Affichage d
133. figuration PCI activation de SMBus 8111 00d1 BAT du contr leur de clavier activation depuis PM conomie d nergie CPUID dans CMOS vide 00d2 D sactivation du cache redimensionnement complet de la m moire et v rification de l activation du mode Flat 00d3 D tections de m moire et redimensionnement du bloc d initialisation cache d sactiv et APIC IO activ 01d4 Test de la m moire de base 512 Ko Ajustement des strat gies et mise en cache des premiers 8 Mo 01d5 Copie du bloc d initialisation de la m moire ROM vers la m moire RAM inf rieure Le BIOS s ex cute maintenant en dehors de la m moire RAM 01d6 S quence de touches et v rification de la m thode sp cifique de l OEM pour d terminer si la r cup ration du BIOS est forc e Si le code suivant est E0 la r cup ration du BIOS s ex cute Test de la somme de contr le du BIOS principal 01d7 Restauration de CPUID transfert du module d interface d ex cution du bloc d initialisation vers la RAM d termine si l ex cution flash s rie est n cessaire 166 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 TABLEAU 6 1 Codes POST Suite Code POST Description 01d8 D compression du module d ex cution dans la m moire RAM Stockage des informations CPUID en m moire 01d9 Copie du BIOS principal dans la m moire Olda Prise de contr le du POST BIOS 0004 V rification de l octet de diagnostic CMOS pour d terminer si l ali
134. ge de touche de configuration et des informations OEM 38 Initialisation de diff rentes unit s via DIM 39 Initialisation de DMAC 1 et de DMAC Z 3A Initialisation de la date heure RTC 48 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 TABLEAU B 2 Points de contr le des codes POST Suite Code POST Description 3B Test de la m moire totale install e dans le syst me V rification des touches SUPPR ou CHAP pour limiter le test de la m moire Affichage de la m moire totale du syst me 3C Test de lecture criture RAM d sormais termin programmation des trous de m moire ou gestion des ajustements n cessaires pour la taille RAM en fonction de NB V rifie si le module HT a d tect une erreur dans le bloc d initialisation et de la compatibilit CPU pour l environnement MP 40 D tection des diff rentes unit s ports parall les ports s rie et coprocesseurs dans la CPU etc install es correctement dans le syst me et mise jour de BDA EBDA etc 50 Programmation du trou de m moire ou de toute mise en uvre n cessitant un ajustement en taille de RAM syst me si n cessaire 52 Mise jour de la taille de la m moire CMOS partir de la m moire d tect e dans le test de m moire Allocation de m moire pour la zone Extended BIOS Data Area partir de la m moire de base 60 Initialisation du statut NUM LOCK et programmation de la vitesse de r p tition du clavier 75 Initi
135. ger les erreurs ECC de module DIMM 1 Si vous ne l avez pas d j fait passez le serveur en mode d alimentation de secours et retirez le capot 2 Examinez les modules DIMM install s pour vous assurer qu ils sont conformes aux R gles de population DIMM page 115 3 Appuyez sur le bouton PRESS TO SEE FAULT et examinez les DEL de panne du module DIMM Reportez vous la FIGURE 2 1 Une DEL qui clignote identifie un composant en panne a Pour les erreurs corrigibles les DEL identifient correctement le module DIMM dans lequel les erreurs ont t d tect es m Pour les erreurs non corrigibles les deux DEL de la paire clignotent s il y a un probl me avec l un des modules DIMM de la paire Remarque Si votre serveur est quip d une carte mezzanine elle masque les modules DIMM et les DEL de la carte m re Cependant la DEL de panne de la carte m re s allume pour indiquer qu il y a un probl me sur la carte m re uniquement lorsque l alimentation est toujours connect e Si la DEL de panne de la carte m re sur la carte mezzanine s allume retirez la carte mezzanine comme d crit dans le manuel d entretien de votre serveur et examinez les DEL de la carte m re 4 D branchez les cordons d alimentation CA du serveur Attention Avant de manipuler les composants fixez un bracelet antistatique la masse du ch ssis toute surface m tallique non peinte Les cartes de circuit imprim et les disqu
136. h rique cXtY avec un r capitulatif TABLEAU F 5 hd c s a platform Sun Fire X4500 Annexe F Utilitaire ha 97 Voici un exemple de sortie r pertoriant la partition fdisk pour chaque nom de p riph rique extY TABLEAU F 6 Sortie de l utilitaire hd d une liste de partition fdisk Device Serial Vendor Model Revision Temperature Type cOt4d0p0 K41BTAC7NXHS HITACHI HDS7225SBSUN250G V440 None Solaris2 c5t0d0p0 K41BTACGOPEE HITACHI HDS7225SBSUN250G V440 None Solaris2 c5t4d0p0 K41BT4C7MULS HITACHI HDS7225SBSUN250G V440 None Solaris2 c t4d0p0 K41BTACB6JSE HITACHI HDS7225SBSUN250G V440 None None c4t0d0p0 K41BTACEMKHE HITACHI HDS7225SBSUN250G V440 None OtherOS c7t0d0p0 K41BTAC7NVYS HITACHI HDS7225SBSUN250G V440 None Solaris2 c 6t0d0p0 K41BTACEEONE HITACHI HDS7225SBSUN250G V440 None Solaris2 cOtOd0pO K41BTACE447E HITACHI HDS7225SBSUN250G V440 None OtherOS c7t4d0p0 K41BTACE87AE HITACHI HDS7225SBSUN250G V440 None OtherOS c4t4d0p0 K41BT4C838MS HITACHI HDS7225SBSUN250G V440 None LinuxNative Solaris LinuxNative c1t0d0p0 VNO3ZAGIWYWD HITACHI HDS7250SASUN500G K2AO None LFS NTFS c1it4d0p0 K41BTAC7N4HS HITACHI HDS7225SBSUN250G V440 None None cSt1d0p0 VNO3ZAGAVSUD HITACHI HDS7250SASUN500G K2AO None None SunFireX4500 Rear 36 37 38 39 40 A1 42 43 44 45 46 47 e563 CSE7 CAES CAE7 C7C23 C7E7 CGE3 eGE7 Cle CiE7 c0t3 COE7 24 252 26
137. he de configuration et des informations OEM 38 Initialisation de diff rentes unit s via DIM 39 Initialisation de DMAC 1 et de DMAC 2 3A Initialisation de la date heure RTC 3B Test de la m moire totale install e dans le syst me V rification des touches SUPPR ou CHAP pour limiter le test de la m moire Affichage de la m moire totale du syst me 3C Test de lecture criture RAM d sormais termin programmation des trous de m moire ou gestion des ajustements n cessaires pour la taille RAM en fonction de NB V rifie si le module HT a d tect une erreur dans le bloc d initialisation et de la compatibilit CPU pour l environnement MP 170 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 TABLEAU 6 2 Points de contr le des codes POST Suite Code POST Description 40 D tection des diff rentes unit s ports parall les ports s rie et coprocesseurs dans la CPU etc install es correctement dans le syst me et mise jour de BDA EBDA etc 50 Programmation du trou de m moire ou de toute mise en uvre n cessitant un ajustement en taille de RAM syst me si n cessaire 52 Mise jour de la taille de la m moire CMOS partir de la m moire d tect e dans le test de m moire Allocation de m moire pour la zone Extended BIOS Data Area partir de la m moire de base 60 Initialisation du statut NUM LOCK et programmation de la vitesse de r p tition du clavier 75 Initialisation d
138. i les tests identifient la m me erreur le probl me vient de la CPU et pas des modules DIMM 124 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 CHAPITRE 3 Utilisation de l interface graphique du processeur de service ILOM pour afficher les informations syst me Ce chapitre contient des informations sur l utilisation de l interface du processeur de service ILOM Integrated Lights Out Manager pour afficher des informations de surveillance et de maintenance relatives votre serveur Ce chapitre aborde les sections suivantes m Connexion du processeur de service un port s rie page 125 m Affichage des journaux d v nements du processeur de service ILOM page 127 m Affichage des informations sur les composants rempla ables page 131 m Affichage des lectures du capteur de temp rature de tension et de ventilateur page 132 Pour plus d informations sur l utilisation de l interface graphique du processeur de service ILOM pour effectuer les op rations de maintenance du serveur configurer des alertes par exemple reportez vous au Guide de l utilisateur de Sun Integrated Lights Out Manager et son suppl ment 1 Connexion du processeur de service un port s rie Pour effectuer une connexion s rie au processeur de service Connectez un c ble s rie du port de gestion s rie RJ 45 se trouvant sur le panneau arri re du serveur un terminal 125 2 Appuy
139. iagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 R capitulatif de la gestion des erreurs de mat riel Le TABLEAU H 1 r capitule les erreurs de mat riel les plus fr quentes que vous pouvez rencontrer avec ces serveurs TABLEAUH 1 R capitulatif de la gestion des erreurs de mat riel Erreur Description Gestion Consign e journal DMI ou SEL du processeur de service Fatale Panne du processeur de service Panne du processeur de service Le processeur de service ne d marre pas lors de la mise sous tension du syst me Le processeur de service d marre mais choue l autotest de l allumage Le processeur de service contr le la r initialisation du syst me le syst me peut alors tre mis sous tension mais il ne quitte pas la r initialisation e Lors de la mise sous tension le chargeur de d marrage du processeur de service allume la DEL d alimentation Lors du d marrage du processeur de service du d marrage de Linux et du contr le de validit du processeur de service la DEL d alimentation clignote e La DEL s teint lors du d marrage du code de gestion pile IPMI du processeur de service e la sortie de l autotest de l allumage du BIOS la DEL s allume en continu Le processeur de service contr le la r initialisation du syst me le syst me ne quitte pas la r initialisation Non Fatale consign e Non Fatale consign e Annexe
140. indiquer un dysfonctionnement des composants Pour conna tre l emplacement des DEL et avoir une description de leur comportement reportez vous la section DEL de statut internes page 178 Remarque Vous pouvez maintenir le bouton de recherche enfonc sur le panneau arri re ou avant du serveur pendant 5 secondes pour initialiser un mode de test qui allume toutes les autres DEL l int rieur et l ext rieur du ch ssis pendant 15 secondes 4 V rifiez que tous les composants sont bien serr s ou install s 5 V rifiez que tous les connecteurs de c ble l int rieur du syst me sont correctement fix s leurs connecteurs appropri s 6 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 10 V rifiez que tous les composants usine sont recommand s et pris en charge Pour obtenir une liste des cartes PCI et des modules DIMM pris en charge reportez vous au Sun Fire X4500 Server Service Manual Manuel d entretien du serveur Sun Fire X4500 819 4359 V rifiez que les modules DIMM install s sont conformes aux r gles de population et aux configurations des modules DIMM comme d crit dans la section D pannage des probl mes de module DIMM page 7 Replacez les capots des composants Pour restaurer le mode d alimentation principale sur le serveur tous les composants sont sous tension utilisez un stylo bille ou un stylet pour appuyer et rel cher le bouton d alime
141. ion Enter Go to Sub Screen USB Configuration F1 General Help kd F10 Save and Exit ESC Exit Le k kkkkkkkkkkkkkkkkkkkk kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk kkkkkkkkkkkkkkkkkkkkkkKS b Sur l cran Advanced Settings Param tres avanc s s lectionnez Event Log Configuration Configuration du journal d v nements L cran Event Logging Details D tails de la journalisation d v nements du menu Advanced Avanc s affiche FIGURE B 2 cran des d tails de la journalisation d v nements du menu Advanced Avanc Advanced kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk Event Logging details View all unread events k KEKEKE AAA AR KR RAR AR EEE REKEKEKKKKKKKEKEKKKKEEEEEX On the Event Log View Event Log Mark all events as read id Clear Event Log w Lo Select Screen xx Select Item Le Enter Go to Sub Screen FFT General Help F10 Save and Exit ESC Exit kkkkkkkkkkk kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk kkkkkkkkkkkkkkkkkkkkS 38 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 c Sur l cran Event Logging Details D tails de la journalisation d v nements s lectionnez View Event Log Afficher journal d v nements Tous les v nements non lus s affichent 4 Affichez le journal SEL System Event Log du BMC a S
142. ion de maintenance est requise 3 CPU Voir la FIGURE G 6 Les DEL sont actives uniquement lorsque le bouton Rappeler est enfonc Panne de module Orange Clignote pour indiquer que le syst me a trouv une DIMM panne sur le module DIMM Red marrez le syst me pour supprimer la panne Panne de CPU Orange Clignote pour indiquer que le syst me a trouv une panne sur une CPU Red marrez le syst me pour supprimer la panne Panne de batterie Orange Clignote pour indiquer que le syst me a trouv une panne sur la batterie D marrez le processeur de service pour supprimer la panne 182 Guide de diagnostic des serveurs Sun Fire X4500 X4540 e Juillet 2008 ANNEXE H Gestion des erreurs Cette annexe contient des informations sur la fa on dont les serveurs traitent et consignent les erreurs Elle contient les sections suivantes Erreurs non corrigibles page 183 Erreurs corrigibles page 185 Erreurs de parit PERR page 187 Erreurs syst me SERR page 189 Gestion des processeurs incompatibles page 191 R capitulatif de la gestion des erreurs de mat riel page 193 Erreurs non corrigibles Cette section r pertorie quelques faits et consid rations sur la fa on dont le serveur traite les erreurs non corrigibles Remarque La fonction ChipKill du BIOS doit tre d sactiv e si vous testez des d faillances de bits multiples dans une m moire DRAM ChipKill corrige les er
143. ique d crit l emplacement du capteur dans le syst me Il poss de le suffixe Lea et est le nom contenu dans les commandes led set et led get Vous pouvez obtenir une liste de tous ces capteurs en ex cutant la commande sdr list generic a Un capteur de panne Digital Discrete surveille le statut de la broche de DEL et il est activ lorsque la DEL est allum e Ces capteurs ont le suffixe fail et ils sont utilis s pour communiquer les v nements au journal SEL Chaque DEL contient un descripteur et un capteur de lecture de statut qui sont li s c est dire que si vous utilisez le capteur 1e4 pour allumer une DEL sp cifique alors le changement de statut est repr sent dans le capteur fail associ De m me pour certaines d entre elles un v nement est g n r dans le journal SEL Pour les DEL qui clignotent au lieu de rester fixes lors d une panne les v nements ne sont pas g n r s parce qu un v nement serait affich chaque flashage de la DEL dans le cycle de clignotement Le TABLEAU A 2 r pertorie les ID de capteur de DEL dans ces serveurs Reportez vous la section Identification des DEL de statut et de panne page 173 pour voir des sch mas sur l emplacement des DEL TABLEAU A 2 ID de capteur de DEL ID de capteur de DEL Description sys power led Alimentation du syst me avant arri re sys locate led Localisation du syst me avant arri re sys alert led Alerte du syst me avant
144. irecte aux exportations des produits ou des services qui sont r gis par la l gislation am ricaine sur le contr le des exportations et la liste de ressortissants sp cifiquement d sign s sont rigoureusement interdites L utilisation de pi ces d tach es ou d unit s centrales de remplacement est limit e aux r parations ou l change standard d unit s centrales pour les produits export s conform ment la l gislation am ricaine en mati re d exportation Sauf autorisation par les autorit s des tats Unis l utilisation d unit s centrales pour proc der des mises jour de produits est rigoureusement interdite es Veuillez Qa m es eo recycler Adobe PostScript Sommaire Pr face xi Partiel Guide de diagnostic du serveur Sun Fire X4500 1 Inspection initiale du serveur 1 Organigramme sur le d pannage lors des visites de maintenance 1 Collecte des informations sur la visite de maintenance 3 Inspection du syst me 3 D pannage des probl mes d alimentation 4 Inspection externe du serveur 5 Inspection interne du serveur 5 D pannage des probl mes de module DIMM 7 Gestion des erreurs de modules DIMM par le syst me 7 Erreurs de module DIMM non corrigibles 8 Erreurs de module DIMM corrigibles 8 Messages d erreur de module DIMM du BIOS 9 DEL de panne de module DIMM 9 R gles de population DIMM 12 Configurations de modules DIMM prises en charge 12 Isolation et correction des erreurs ECC de module DIMM 12 Utilis
145. isation des unit s g n rales 8600 Pr paration de la CPU pour initialisation du syst me d exploitation par copie de tout le contexte du BSP vers tous les processeurs d applications pr sents REMARQUE les AP restent dans l tat CLI HLT Points de contr le des codes POST Les points de contr le des codes POST correspondent au groupe de points de contr le le plus important au cours de la pr initialisation du BIOS Le TABLEAU 6 2 d crit le type de points de contr le qui peuvent tre g n r s lors de la phase POST du BIOS Ces points de contr le deux chiffres correspondent la sortie du port 80 le port d E S principal 168 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 TABLEAU 6 2 Points de contr le des codes POST Code POST Description 03 04 05 06 CO C1 C2 C3 C5 C6 C7 OA 0B OC D sactivation de NMI de la parit de la vid o EGA et des contr leurs DMA ce stade seuls les acc s ROM se font vers GPNV Si la taille BB est gale 64 Ko ROM Decode doit tre activ en dessous de FFFF0000h USB doit pouvoir fonctionner dans le segment E000 HT doit programmer l initialisation NB et l initialisation OEM et peut les programmer si n cessaire au d but du POST BIOS ce qui revient remplacer les valeurs par d faut des variables du noyau V rification de l octet de diagnostic CMOS pour d terminer si l alimentation de la batterie fonc
146. kkkkkkk kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkS Chapitre 6 Affichage des journaux d v nements et des codes POST 165 4 Sur l cran Boot Settings Configuration vous pouvez activer ou d sactiver plusieurs options Quick Boot Initialisation rapide cette option est d sactiv e par d faut Si vous l activez le BIOS ignore certains tests lors de l initialisation tels que le test tendu de la m moire Cela permet d acc l rer l initialisation du syst me System Configuration Display Affichage de la configuration du syst me cette option est d sactiv e par d faut Si vous l activez l cran System Configuration Configuration du syst me s affiche avant le d but de l initialisation Quiet Boot Initialisation silencieuse cette option est d sactiv e par d faut Si vous l activez le logo Sun Microsystems s affiche la place des codes POST Codes POST Le TABLEAU 6 1 contient des descriptions de chaque code POST dans l ordre dans lequel ils sont g n r s Ces codes POST sont constitu s de quatre chiffres deux chiffres correspondant la sortie du port d E S principal 80 et deux chiffres correspondant la sortie du port d E S secondaire 81 Dans les codes POST du TABLEAU 6 1 les deux premiers chiffres correspondent au port 81 et les deux derniers au port 80 TABLEAU 6 1 Codes POST Code POST Description 00d0 Sortie de POR initialisation de l espace de con
147. kkkkkkkkkkkkkkkkk Configure Settings EEEEEEEEEEEEEE EEEE EEEE EEEE EEEE during System Boot nfiguration rity CNE SE SE SE E E E E E E 42 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 F10 Save and Exit ESC Exit L Select Screen ETS Select Item Enter Go to Sub Screen F1 General Help i E H e k ke e He Ae e Ae ke e H e e He e ARR e ARR e H e ke ke RER ke k k k k k ke k k k k ke k k k k k ke k k k k k k k k k k k k k k k k k k k k k k k k k k G 3 S lectionnez Boot Settings Configuration Configuration des param tres d initialisation L cran Boot Settings Configuration s affiche FIGURE B 5 cran de configuration des param tres d initialisation du menu Boot Initialisation du BIOS Boot kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk Boot Settings Configuration Allows BIOS to skip k kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk certain tests while Quick Boot Disabled booting This will System Configuration Display Disabled decrease the time Quiet Boot Disabled needed to boot the Language English system AddOn ROM Display Mode Force BIOS Bootup Num Lock On Wait For F1 If Error Disabled Interrupt 19 Capture Disabled x E e Select Screen KORN Select Item Le 4 Change Option EEI G
148. la FIGURE 1 3 a Les modules DIMM des CPU dot es d une seule paire de modules DIMM doivent tre install s dans les emplacements DIMM blancs de ces CPU 0 et 1 Reportez vous la FIGURE 1 3 m Seuls les modules DIMM enregistr s PC3200 ECC sont pris en charge m Chaque paire de modules DIMM doit tre identique m me fabricant taille et vitesse Configurations de modules DIMM prises en charge Le TABLEAU 1 1 r pertorie les configurations de modules DIMM prises en charge pour le serveur Sun Fire X4500 TABLEAU 1 1 Configurations de modules DIMM prises en charge Emplacement 3 Emplacement 2 Emplacement 1 Emplacement 0 M moire totale par CPU 0 2 Go 0 2 Go 4 Go 2 Go 2 Go 2 Go 2 Go 8 Go Isolation et correction des erreurs ECC de module DIMM Si vos fichiers journaux communiquent une erreur ECC ou un probl me avec un module DIMM effectuez les tapes ci dessous jusqu ce que vous ayez isol l erreur Dans cet exemple le fichier journal communique une erreur avec le module DIMM dans la CPUO emplacement 1 Les DEL de panne sur la CPUO emplacements 1 et 3 sont allum es Pour isoler et corriger les erreurs ECC de module DIMM 12 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Si vous ne l avez pas d j fait passez le serveur en mode d alimentation de secours et retirez le capot du contr leur syst me Reportez vous au Sun Fire X4500 Server Service Manual Manuel d e
149. lacement des modules DIMM Conservez des copies des fichiers journaux indiquant les erreurs de m moire envoyer Sun pour v rification avant d appeler Sun 116 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Gestion des erreurs de module DIMM par le syst me Cette section d crit le comportement du syst me pour les deux types d erreurs de module DIMM les erreurs non corrigibles et les erreurs corrigibles Cette section d crit galement les messages d erreur du module DIMM du BIOS Erreurs de module DIMM non corrigibles Dans tous les syst mes d exploitation le comportement est le m me pour les erreurs non corrigibles 1 Lorsqu une erreur non corrigible se produit le contr leur de m moire provoque un red marrage imm diat du syst me 2 Lors du red marrage le BIOS v rifie les registres d erreur machine et d termine si le red marrage pr c dent a t caus par une erreur non corrigible puis il communique ce message lors de l autotest de l allumage apr s l tape memtest A Hypertransport Sync Flood occurred on last boot 3 Le BIOS communique cet v nement dans le journal SEL System Event Log du processeur de service comme indiqu dans l exemple de sortie d IPMltool ci dessous ipmitool H 8 Oo o maa 10 12 13 14 15 16 09 25 2007 03 22 03 Processor 0x04 Presence detected Asserted 09 25 2007 03 22 03 OEM 0x12 Asserted
150. les DEL de panne de CPU et les DEL de panne de batterie 180 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Les DEL de CPU sont actives uniquement lorsque le bouton Rappeler est enfonc Elles clignotent pour indiquer une panne sinon elles restent teintes Remarque Les DEL de CPU et de module DIMM indiquent une panne jusqu ce que le syst me soit mis sous tension La DEL de batterie indique une panne jusqu ce que le processeur de service soit d marr Les DEL internes apparaissent dans la FIGURE G 6 et sont r pertori es dans le TABLEAU G 2 FIGURE G 6 Emplacement des DEL de module de CPU et des boutons CPU 1 sous le CPU 0 sous le Modules DIMM 0 2 13 dissipateur de chaleur dissipateur de chaleur Modules DIMM 3 1 20 Il DEL de panne de DEL de panne DEL de panne DEL de panne DEL de panne de module DIMM de CPU 1 de batterie de CPU 1 module DIMM Annexe G Identification des DEL de statut et de panne 181 Le TABLEAU G 2 r pertorie les DEL internes TABLEAU G 2 DEL internes Nom Couleur Fonction 1 Disques Voir la FIGURE G 5 Statut Vert Clignotant les donn es sont transf r es l unit est OK Erreur Orange Erreur une op ration de maintenance est requise Retrait autoris Bleu L unit est pr te tre retir e Op ration de maintenance autoris e 2 Plateaux de ventilateur Voir la FIGURE G 5 Statut Vert L unit est OK Erreur Orange Erreur une op rat
151. lidation Test Suite fournit un outil de diagnostic complet qui teste et valide le mat riel Sun en v rifiant la connectivit et la fonctionnalit de la plupart des p riph riques et contr leurs mat riels sur les plates formes Sun Le logiciel SunVTS peut tre adapt avec des instances de test modifiables et des fonctions d affinit de processeur Les plates formes x86 prennent en charge les tests suivants La prise en charge x86 actuelle concerne le syst me d exploitation 32 bits uniquement Test CD DVD cddvdtest Test CPU cputest Test des lecteurs de disque et de disquette disktest Tampon de traduction de donn es dtlbtest Test d unit de calcul en virgule flottante fputest Test du mat riel r seau nettest 15 Test de loopback Ethernet netlbtest Test de la m moire physique pmemtest Test du port s rie serialtest Test du syst me systest Test du bus s rie universel usbtest Test de la m moire virtuelle vmemtest Le logiciel Sun VTS offre une interface graphique sophistiqu e qui permet de configurer les tests et de surveiller leur statut L interface utilisateur peut tre ex cut e sur un syst me pour afficher les tests Sun VTS d un autre syst me sur le r seau Le logiciel SunVTS fournit galement une interface en mode TTY pour les situations dans lesquelles l ex cution d une interface graphique n est pas possible Documentation Sun VTS Pour obtenir la documentation SunVTS la plu
152. logiciel du syst me qu il fait r f rence un groupe de DEL plut t qu une seule DEL physique Le TABLEAU A 4 d crit les groupes de capteur de DEL Annexe A Utilisation d IPMlitool pour afficher les informations syst me 33 TABLEAU A 4 Groupes de capteur de DEL Nom de groupe Capteurs dans le groupe sys power led bp power led fp power led sys locate led bp locate led fp locate led sys alert led bp alert led fp alert led Par exemple pour d finir la fois les DEL d alimentation OK du panneau avant et arri re sur une vitesse de clignotement d alimentation de secours vous pouvez taper la commande suivante ipmitool I lanplus H lt IPADDR gt U root P changeme sunoem led set sys power led standby Set LED fp power led to STANDBY Set LED bp power led to STANDBY Vous pouvez d sactiver la DEL d alimentation OK du panneau arri re mais laisser celle du panneau avant clignoter en tapant la commande suivante ipmitool I lanplus H lt IPADDR gt U root P changeme sunoem led set bp power led off Set LED bp power led to OFF Utilisation de scripts IPMItool pour les tests Pour effectuer des tests il est souvent utile de modifier le statut de toutes les DEL ou au moins de plusieurs en une fois Pour cela vous pouvez cr er un script IPMItool et l ex cuter avec la commande exec L exemple suivant indique un script pour activer toutes les DEL du module du ventilateur sunoem led set ft0 fm0 l
153. lumer cette DEL distance 10 11 12 13 14 recherche DEL de panne DEL OK Boutons de service SVC SC DEL de statut du contr leur syst me SER MGT NET MGT S 10 100 1000 Connecteurs USB Connecteur vid o Carte Compact Flash CF pour pouvoir rep rer le serveur dans une salle de serveur bond e Appuyez pour mettre hors tension Orange Lorsqu elle est allum e une op ration de maintenance est requise Fixe L alimentation est activ e teint L alimentation est d sactiv e Verte Op ration de maintenance autoris e Lorsqu elle est allum e une op ration de maintenance est requise Clignotant L alimentation de secours est activ e mais l alimentation principale est d sactiv e SP r initialise le processeur de service NMI vidage d interruption non masquable Envoie une NMI la CPU Utilis e uniquement pour le d bogage H te r initialise l adaptateur de bus h te N utilisez pas ces boutons sauf si le personnel de maintenance de Sun vous le demande Pour cela ins rez un stylet ou un trombone d pli dans le trou Bleu Pr t tre retir 48 Orange Erreur une op ration de maintenance est requise Verte Op rationnel aucune action requise Port de gestion s rie connexion s rie au processeur de service Port NET Management et du processeur de service Les ports GigabitEthernet connectent le serveur Ethernet Conne
154. m moire DRAM le BIOS ex cute un test de m moire simple criture lecture de chaque emplacement sous la forme 55aa55aa Remarque Ce test de m moire n est effectu que si Quick Boot n est pas activ sur l cran Boot Settings Configuration Configuration des param tres d initialisation Si Quick Boot est activ le BIOS ne teste pas la m moire Reportez vous la section Modification des options du POST page 42 pour plus d informations Remarque tant donn que le serveur Sun Fire X4500 peut contenir jusqu 32 Go de m moire le test de m moire peut prendre plusieurs minutes Vous pouvez annuler l autotest de l allumage tout moment en appuyant sur n importe quelle touche 3 Le BIOS interroge les contr leurs de m moire pour identifier les erreurs de m moire corrigibles et non corrigibles puis il les consigne dans le processeur de service Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Redirection de la sortie de la console Utilisez les instructions suivantes pour acc der au processeur de service et rediriger la sortie de la console en vue de lire les codes POST du BIOS Pour rediriger la sortie de la console 1 Initialisez l utilitaire de configuration du BIOS en appuyant sur la touche F2 pendant que le syst me effectue l autotest de l allumage POST L cran du menu principal du BIOS appara t S lectionnez l onglet du menu Advanced Avanc
155. mbiante de la carte de distribution de courant pdb t_amb V Pour afficher les lectures du capteur 1 Connectez vous au processeur de service en tant qu administrateur ou op rateur pour atteindre l interface graphique Web ILOM a Tapez l adresse IP du processeur de service du serveur dans votre navigateur Web L cran Sun Integrated Lights Out Manager Login connexion Sun Integrated Lights Out Manager s affiche Annexe E Utilisation de l interface graphique du processeur de service ILOM pour afficher les informations syst me 85 b Tapez vos nom d utilisateur et mot de passe La premi re fois que vous tentez d acc der au processeur de service ILOM vous tes invit taper le nom d utilisateur et le mot de passe par d faut Les nom d utilisateur et mot de passe par d faut sont Nom d utilisateur par d faut root Mot de passe par d faut changeme 2 Dans l onglet System Monitoring Surveillance du syst me choisissez Sensor Readings Lecture des capteurs La page de lecture des capteurs s affiche Reportez vous la FIGURE E 5 FIGURE E 3 Page Sensor Readings Lecture des capteurs REFRESH LOG OUT dministrator Sery 0097 Integrated Lights Out Manager System Information System Monitoring Configuration User Management Remote Control Maintenance Sensor Readings Event Logs Locator Indicator Sensor Readings View readings for temperature voltage or fan sensors S
156. me et de surveiller et de g rer des environnements syst me ind pendants du syst me d exploitation Rep rez IPMitool et sa documentation associ e sur le CD Tools and Drivers Outils et pilotes du serveur Sun Fire X4500 ou t l chargez cet outil l adresse suivante http ipmitool sourceforge net Page de manuel d IPMltool Une fois le package IPMltool install vous pouvez acc der des informations d taill es sur l utilisation et la syntaxe des commandes sur la page du manuel qui est install Dans une ligne de commande tapez la commande suivante man ipmitool 20 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Connexion au serveur avec IPMItool Pour une connexion sur une interface distante vous devez fournir un nom d utilisateur et un mot de passe L utilisateur par d faut avec un acc s administrateur est root avec le mot de passe changeme Vous devez utiliser les param tres U et P pour passer le nom d utilisateur et le mot de passe sur la ligne de commande comme indiqu dans l exemple suivant ipmitool I lanplus H lt IPADDR gt U root P changeme chassis status Remarque Si vous rencontrez des probl mes avec la syntaxe de la commande sur votre syst me d exploitation vous pouvez utiliser la commande et le param tre ipmitool h pour d terminer les param tres qui peuvent tre pass s avec la commande ipmitool sur votre syst me d exploitation Vous pouvez aussi v
157. mentation de la batterie fonctionne correctement et si la somme de contr le CMOS est correcte Si la somme de contr le est incorrecte mise jour de CMOS avec les valeurs par d faut de la mise sous tension 00c2 Configuration du processeur d initialisation pour POST Cela inclut le calcul de fr quence le chargement du microcode BSP et l application de la valeur demand e par l utilisateur pour la question de configuration de signalisation d erreur GART 00c3 Application au BSP des corrections des errata 78 amp 110 00c6 R activation du cache pour le processeur d initialisation et application dans le BSP des corrections des errata 106 107 69 et 63 si n cessaire 00c7 HT d finit les valeurs finales de fr quences et de largeurs de liaisons 000a Initialisation du contr leur de clavier compatible 8042 000c D tection de la pr sence d un clavier dans le port KBC 000e Test et initialisation de diff rents p riph riques d entr e D routement du vecteur INTO9h pour que le gestionnaire POST INTO9h obtienne le contr le pour IRQ1 8600 Pr paration de la CPU pour initialisation du syst me d exploitation par copie de tout le contexte du BSP vers tous les processeurs d applications pr sents REMARQUE les AP restent dans l tat CLI HLT de00 Pr paration de la CPU pour initialisation du syst me d exploitation par copie de tout le contexte du BSP vers tous les processeurs d applications pr sents REMARQUE les AP rest
158. module DIMM Le gestionnaire SMI du BIOS commence consigner chaque erreur d tect e et arr te la consignation lorsque la limite pour une m me erreur est atteinte L interrogation du BIOS peut tre d sactiv e via l interface du logiciel Erreur ECC La CPU d tecte une La m thode sync flood est utilis e Journal SEL Fatale DRAM non erreur de module pour emp cher les donn es erron es du processeur corrigible DIMM multibit non d tre propag es via les liens de service corrigible HyperTransport Le syst me red marre le BIOS r cup re les informations du registre d erreur machine mappe ces informations vers le module DIMM lorsque CHIPKILL est d sactiv ou la paire de module lorsque CHIPKILL est activ d faillant et les consigne dans le processeur de service Le BIOS arr te la CPU Configuration Des modules DIMM Le BIOS affiche un message d erreur Journal DMI Fatale de modules non pris en charge consigne une erreur et arr te le Journal SEL DIMM non sont utilis s ou des syst me du processeur prise en charge modules DIMM pris de service en charge ne sont pas charg s correctement Annexe D Gestion des erreurs 73 TABLEAU D 1 R capitulatif de la gestion des erreurs de mat riel Suite Consign e journal DMI ou SEL du processeur Erreur Description Gestion de service Fatale chec du lien Erreur CRC ou de Un Sync floods se produit sur les Journal DMI Fatale HyperTransport lien s
159. n CA du panneau arri re du serveur pour mettre le serveur compl tement hors tension Lorsque vous utilisez le bouton d alimentation pour entrer en mode d alimentation de secours l alimentation alimente toujours la carte GRASP Graphics Redirect and Service Processor et les ventilateurs d alimentation lectrique indiqu s lorsque la DEL d alimentation OK clignote FIGURE 1 4 Panneau avant du serveur Sun Fire X4540 bouton OA ON OO ow ox O 1 d alimentation DEL d alimentation OK 2 Retirez les capots des composants y compris le capot du disque dur le capot du contr leur syst me et le capot du ventilateur si n cessaire La FIGURE 1 5 indique les composants internes du serveur Pour plus d informations sur le retrait des capots des composants reportez vous au Sun Fire X4540 Server Service Manual Manuel d entretien du serveur Sun Fire X4540 819 4359 Chapitre 1 Inspection initiale du serveur 111 FIGURE 1 5 Composants internes du serveur Sun Fire X4540 o Trung 3 Examinez les DEL de statut internes qui peuvent indiquer un dysfonctionnement des composants Pour conna tre l emplacement et avoir une description des DEL reportez vous aux sections DEL de statut internes page 178 et DEL de panne de module DIMM page 120 Remarque Vous pouvez maintenir le bouton de recherche enfonc sur le panneau arri re ou avant du serveur pendant 5 se
160. n Fire X4540 103 FIGURE 1 1 Organigramme de d pannage Pour effectuer cette t che R unissez des informations sur la visite de maintenance initiale y Le serveur est sous tension Non Recherchez les probl mes de mise sous tension Effectuez une inspection visuelle externe Effectuez une inspection visuelle interne Examinez les modules DIMM Affichez les journaux d v nements du BIOS Affichez les messages de l autotest de l allumage du BIOS Affichez les journaux du processeur de service et les informations sur le capteur Ex cutez un diagnostic SunVTS Reportez vous ces sections Collecte des informations sur la visite de maintenance page 105 D pannage des probl mes d alimentation page 106 Inspection externe du serveur page 107 Identification des DEL de statut et de panne page 173 Inspection interne du serveur page 110 D pannage des probl mes de module DIMM page 115 Affichage des journaux d v nements page 159 Affichage des journaux d v nements page 159 Using the ILOM Service Processor GUI to View System Information page 49 OU Using IPMitool to View System Information page 61 Utilisation du CD de diagnostic amor able page 154 104 Guide de diagnostic des serveurs Sun Fire
161. n est d sactiv e Bouton Gris Permet de mettre sous tension l alimentation d alimentation du principale pour tous les composants du serveur syst me DEL de panne Orange Allum Erreur li e au disque dur ou au ventilateur avant DEL de panne Orange Allum Erreur li e la source d alimentation ou au arri re contr leur syst me maintenance requise DEL de surchauffe Orange Allum Lorsque le syst me est en surchauffe Annexe C DEL de statut 53 Panneau arri re Le TABLEAU C 2 indique les fonctions du panneau arri re Le TABLEAU C 2 r pertorie et d crit chaque fonction FIGURE C 3 Panneau arri re du serveur Sun Fire X4500 SYSTEM CONTROLLER SC KUUEL SES C ROC TOP 54 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 TABLEAU C 2 Fonctions du panneau arri re du serveur Sun Fire X4500 Nom Description 1 Connecteurs Chaque source d alimentation poss de son propre d alimentation CA connecteur CA avec un clip pour maintenir le c ble d alimentation 2 Masse du ch ssis Branchez les rubans de mise la terre ici 3 Support de montage de la Utilisez cette plaque de montage pour s curiser le plaque du module de module de fixation des c bles comme d crit dans le fixation des c bles Sun Fire X4500 Server Getting Started Guide Guide de d marrage rapide du serveur Sun Fire X4500 819 4341 4 PCIX 0 et PCIX 1 Emplaceme
162. ne et de pr sence event Enregistrements des Capteurs utilis s uniquement pour une v nements uniquement correspondance avec les enregistrements SEL mcloc Enregistrements de Capteurs du contr leur de gestion localisateur MC generic Enregistrements de P riph riques g n riques DEL localisateur g n rique fru Enregistrements de P riph riques FRU localisateur FRU Par exemple pour ne voir que les capteurs de temp rature de tension et de ventilateur tapez la commande suivante avec l argument full ipmitool I lanplus H lt IPADDR gt fp t_amb oAh ok ps t_amb 11h ok ps0 f0 speed 15h ok ps1l f0 speed 19h ok mb t_amb 1Ah ok mb v bat 1Bh ok mb v_ 3v3stby 1Ch ok mb v 3v3 1Dh ok mb v 5v 1Eh ok mb v 12v 1Fh ok mb v 12v 20h ok mb v 2v5core 21h ok mb v 1vBcore 22h ok mb v 1v2core 23h ok io t_amb 24h ok p0 t core 2Bh ok po0 v 1v5 2Ch ok U root P changeme sdr elist full 12 0 22 degrees C 10 0 21 degrees C 10 0 11000 RPM 10 1 O RPM 7 0 25 degrees C 7 0 3 18 Volts 7 0 3 17 Volts 70 3 34 Volts 7 0 5 04 Volts 7 0 12 22 Volts 7 0 12 20 Volts 7 0 2 54 Volts 7 0 1 83 Volts 7 0 1 21 Volts 15 0 21 degrees C Bi 44 degrees C 3 1 56 Volts Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 p0 v 2v5core 2Dh ok 3 0 2 64 Volts p0 v 1v25core 2Eh ok 3 0 1
163. nements 1 Connectez vous au processeur de service en tant qu administrateur ou op rateur pour atteindre l interface graphique Web ILOM a Tapez l adresse IP du processeur de service du serveur dans votre navigateur Web L cran Sun Integrated Lights Out Manager Login connexion Sun Integrated Lights Out Manager s affiche b Tapez vos nom d utilisateur et mot de passe La premi re fois que vous tentez d acc der au processeur de service ILOM vous tes invit taper le nom d utilisateur et le mot de passe par d faut Les nom d utilisateur et mot de passe par d faut sont Nom d utilisateur par d faut root Mot de passe par d faut changeme 2 Dans l onglet System Monitoring Surveillance du syst me choisissez Event Logs Journaux des v nements La page System Event Logs Journaux des v nements syst me s affiche Reportez vous la FIGURE 3 1 pour voir un exemple Chapitre 3 Utilisation de l interface graphique du processeur de service ILOM pour afficher les informations syst me FIGURE 3 1 Page System Event Logs Journaux des v nements syst me REFRESH LOG OUT Jav Sun Microsystems Ine System Information System Monitoring Configuration User Management Remote Control Maintenance Sensor Readings Event Logs Locator Indicator System Event Logs View sensor specific BIOS generated or system management software event logs Select an event log category
164. nexe B Journaux d v nements et codes POST 49 TABLEAU B 2 Points de contr le des codes POST Suite Code POST Description A2 Pr paration de l image d ex cution des diff rents modules BIOS Remplissage de la zone libre dans le segment F000h avec OFFh Initialisation de la table de routage IRQ Microsoft Pr paration du module de langue d ex cution D sactivation de l affichage de la configuration du syst me si n cessaire A4 Initialisation du module de langue d ex cution A7 Affichage de l cran de configuration du syst me s il est activ Initialisation des CPU avant le d marrage ce qui inclut la programmation des MTRR A8 Pr paration de la CPU pour l initialisation du syst me d exploitation y compris des valeurs finales MTRR A9 Attente de l entr e des informations utilisateur dans l cran de configuration si n cessaire AA D sinstallation des vecteurs POST INT1Ch et INTO9h Annulation de l initialisation du module ADM AB Pr paration de BBS pour l initialisation Int 19 AC Programmation des chipsets NB SB n cessaires la fin du test POST juste avant l attribution du contr le au code d initialisation du syst me d exploitation Programmation de la mise en cache du BIOS syst me m moire vive fant me 0F0000h Portage pour traiter les programmations OEM la fin du test POST Copie des donn es OEM de POST_DSEG vers RUN_CSEG B1 Enregistrement du contexte syst me pour ACPI 00 Pr para
165. ns 51 Fonctions contr les et indicateurs ext rieurs Cette section indique et d crit les fonctions les contr les et les indicateurs sur les panneaux avant et arri re du serveur Sun Fire X4500 Panneau avant La FIGURE C 1 indique le panneau avant La FIGURE C 2 propose un gros plan des contr les et des indicateurs Le TABLEAU C 1 r pertorie et d crit les contr les et les indicateurs Bouton de recherche DEL d alimentation OK lt 94 Pa ore ommo 4 Ports USB 2 52 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 FIGURE C 2 1 2 3 DEL du panneau avant du serveur Sun Fire X4500 Contr les et indicateurs du panneau avant du serveur Sun Fire X4500 4 5 6 7 QA o OQA or ORRO TABLEAU C 1 Contr les et indicateurs du panneau avant Nom Couleur Description Bouton DEL de Blanc Les op rateurs peuvent allumer cette DEL distance recherche pour pouvoir rep rer le serveur dans une salle de serveur bond e Appuyez pour mettre hors tension Une pression sur le bouton DEL de recherche pendant cinq secondes ALLUME tous les indicateurs pendant 15 secondes Erreur syst me Blanc Allum Une op ration de maintenance est requise Alimentation Vert Fixe L alimentation est activ e Fonctionnement Clignotant L alimentation de secours est activ e mais l alimentation principale est d sactiv e teint L alimentatio
166. nsigne l erreur dans DMI et POST BIOS contr le du d marre incorrecte contenu du CMOS a chou Configuration Le BIOS prend en Le BIOS affiche un message d erreur Journal DMI Fatale de CPU non charge la consigne l erreur et arr te le syst me prise en charge fr quence et les instructions non concordantes dans la configuration de la CPU mais certaines CPU peuvent ne pas tre prises en charge Annexe H Gestion des erreurs 197 TABLEAUH 1 R capitulatif de la gestion des erreurs de mat riel Suite Consign e journal DMI ou SEL du processeur Erreur Description Gestion de service Fatale Erreur corrigible La CPU d tecte La CPU corrige l erreur dans le Journal DMI Fonctionnement plusieurs erreurs mat riel Le mat riel ne g n re Journal SEL normal corrigibles dans aucune interruption ou v rification du processeur les registres machine L interrogation est de service MCi_STATUS d clench e toutes les demi secondes par les interruptions du minuteur SMI et est effectu e par le gestionnaire SMI du BIOS Le gestionnaire SMI consigne un message dans le journal SEL du processeur de service s il est disponible sinon le SMI consigne un message dans DMI L interrogation du BIOS peut tre d sactiv e via l interface SMI du logiciel Panne du La lecture des Les DEL de panne du ventilateur Journal SEL Non fatale ventilateur signaux avant de demande d op ration de du processeur tachym triques maintenanc
167. nstall s dans les emplacements DIMM blancs en dehors de cette CPU 6 et 7 Reportez vous la FIGURE 2 1 Seuls les modules DIMM DDR2 800 Mhz 667 Mhz et 533 Mhz sont pris en charge Chaque paire de modules DIMM doit tre identique m me fabricant taille et vitesse 115 Configurations de modules DIMM prises en charge Le TABLEAU 2 1 r pertorie les configurations de modules DIMM prises en charge pour le serveur Sun Fire X4540 TABLEAU 2 1 Configurations de modules DIMM prises en charge Emplacement 3 Emplacement 2 Emplacement 1 Emplacement 0 M moire totale par CPU 0 2 Go 0 2 Go 4 Go 2 Go 2 Go 2 Go 2 Go 8 Go 4 Go 4 Go 4 Go 4 Go 16 Go Strat gie de remplacement des modules DIMM Remplacez un module DIMM lorsque l un des v nements suivants se produit m Le test de m moire du module DIMM choue dans le BIOS en raison d erreurs de m moire non corrigibles a Les erreurs de m moire non corrigibles se produisent et des recherches permettent d indiquer que les erreurs proviennent de la m moire En outre un module DIMM doit tre remplac chaque fois que plus de 24 erreurs corrigibles se produisent en l espace de 24 heures partir d un seul module et qu aucun autre module n indique davantage d erreurs corrigibles m Si plusieurs modules DIMM comportent des erreurs corrigibles ces derni res peuvent avoir d autres causes possibles qu un technicien Sun qualifi doit examiner avant le remp
168. nt les donn es corrig es dans la RAM CHIPKILL fournit une d tection correction d erreur 4 bits de m moire de type x4 Activation des lignes d horloge PCI X dans le 8131 20 R affectation de toutes les CPU une seule adresse SMBASE Le BSP est d fini pour que son point d entr e corresponde A000 0 Si moins de 5 connecteurs CPU sont pr sents sur la carte les points d entr e sont s par s par des octets 8000h Si plus de 4 connecteurs CPU sont pr sents les points d entr e sont s par s par des octets 200h Le module CPU est charg de la r affectation de la CPU l adresse appropri e REMARQUE les AP restent dans l tat INIT 24 D compression et initialisation de n importe quel module BIOS de plate forme 30 Initialisation de l interruption de gestion de syst me 2A Initialisation de diff rentes unit s via DIM 2C Initialisation de diff rentes unit s D tection et initialisation de l adaptateur vid o install dans le syst me ayant des ROM en option 2E Initialisation de toutes les unit s de sortie 31 Allocation de m moire pour le module ADM et d compression du module Attribution du contr le au module ADM pour l initialisation Initialisation des modules de langue et de police ADM Activation du module ADM 33 Initialisation du module d initialisation silencieuse Configuration de la fen tre pour affichage des informations texte 37 Affichage d un message de connexion des informations CPU du messa
169. ntation sur le panneau avant du serveur Reportez vous la FIGURE 1 2 Lorsque l alimentation principale alimente l ensemble du serveur la DEL d alimentation OK situ e c t du bouton d alimentation s allume en continu Si le probl me avec le serveur n est pas vident vous pouvez essayer d afficher les messages de l autotest de l allumage POST et les journaux d v nements du BIOS lors du d marrage du syst me Passez la section Viewing Event Logs page 23 D pannage des probl mes de module DIMM Utilisez cette section pour d panner des probl mes avec des modules de m moire ou modules DIMM Remarque Pour obtenir des informations sur la strat gie de remplacement des modules DIMM de Sun pour les serveurs x64 contactez votre repr sentant de Sun Gestion des erreurs de modules DIMM par le syst me Cette section d crit le comportement du syst me pour les deux types d erreurs de module DIMM les erreurs non corrigibles et les erreurs corrigibles elle d crit galement les messages d erreur de module DIMM du BIOS Chapitre 1 Inspection initiale du serveur 7 Erreurs de module DIMM non corrigibles Pour tous les syst mes d exploitation le comportement est le m me pour les erreurs non corrigibles 1 Lorsqu une erreur non corrigible se produit le contr leur de m moire provoque un red marrage imm diat du syst me Lors du red marrage le BIOS v rifie les registre
170. ntretien du serveur Sun Fire X4500 819 4359 Examinez les modules DIMM install s pour vous assurer qu ils sont conformes aux R gles de population DIMM page 12 et aux Configurations de modules DIMM prises en charge page 12 Examinez les DEL de panne sur les jecteurs d emplacement de module DIMM et les DEL de panne de CPU sur la carte CPU Reportez vous la FIGURE 1 3 Si l une de ces DEL est allum e elle peut indiquer le composant pr sentant l erreur D branchez les cordons d alimentation CA du serveur Attention Avant de manipuler les composants fixez un bracelet antistatique la masse du ch ssis toute surface m tallique non peinte Les cartes de circuit imprim et les disques durs du syst me contiennent des composants extr mement sensibles l lectricit statique 10 Remplacez la CPU qui pr sente le probl me Reportez vous au Sun Fire X4500 Server Service Manual Manuel d entretien du serveur Sun Fire X4500 819 4359 Retirez les modules DIMM de la carte CPU Reportez vous au Sun Fire X4500 Server Service Manual Manuel d entretien du serveur Sun Fire X4500 819 4359 Examinez visuellement les modules DIMM la recherche de dommages physiques de poussi re ou de toute autre contamination sur le connecteur ou les circuits Examinez visuellement l emplacement de module DIMM la recherche de dommages physiques Regardez si l emplacement contient du plastique fendu
171. nts des cartes PCIX 5 NET MGT S Port NET Management et du processeur de service 6 Connecteur vid o Branchez un cran 7 SER MGT Port de gestion s rie connexion s rie au processeur de service 8 Bouton DEL de recherche Blanc Les op rateurs peuvent allumer cette DEL distance pour pouvoir rep rer le serveur dans une salle de serveur bond e Appuyez pour mettre hors tension 9 DEL de panne Orange Lorsqu elle est allum e une op ration de maintenance est requise Fixe L alimentation est activ e teint L alimentation est d sactiv e 10 DEL OK Verte Op ration de maintenance autoris e Lorsqu elle est allum e une op ration de maintenance est requise Clignotant L alimentation de secours est activ e mais l alimentation principale est d sactiv e 11 Connecteurs USB Connectez des p riph riques USB Annexe C DEL de statut 55 TABLEAU C 2 Fonctions du panneau arri re du serveur Sun Fire X4500 Suite Nom Description 12 13 14 Ports Ethernet 10 100 1000 Gigabit DEL de statut du contr leur syst me Boutons NMI et de r initialisation Connectez le serveur Ethernet Bleu Pr t tre retir Orange Erreur une op ration de maintenance est requise Verte Op rationnel aucune action requise N utilisez pas ces boutons sauf si le personnel de maintenance de Sun vous le demande Pour cela ins rez un stylet ou un trombone d pli dans le trou
172. num r e p riph rique pr sent et accessible e Rouge p riph rique non num r ou aucun disque dans l emplacement physique e p riph rique non accessible absent vide ou qui ne fonctionne pas e les p riph riques sous le contr leur ne sont pas num r s Le contr leur n est pas num r tant que les emplacements ne contiennent aucun disque e Jaune le p riph rique est associ des messages d avertissement Disponible en mode diagnostic le p riph rique est associ des messages d avertissement g n r s par le sous syst me de stockage Bleu emplacement du disque d initialisation b l emplacement du disque est amor able si un syst me d exploitation est install sur le disque 8 Fournit une liste de tous les p riph riques de stockage ainsi que leur type et leur nombre Si le syst me n est pas un serveur Sun Fire X4500 et que le sous syst me prend en charge la fonction il liste les p riph riques de stockage avec leurs noms logiques les num ros de s rie le fournisseur le mod le et les temp ratures de disque p Identifie le type de plate forme x64 en fonction des contr leurs h tes de stockage x64 Annexe F Utilitaire ha 93 TABLEAU F 1 Options hd Suite Option Description b Affiche le type de mappage de plate forme du serveur Sun Fire X4500 x64 quel que soit le type de plate forme en mode de contournement no option Teste le syst
173. ocesseur de service et les informations sur le capteur Ex cutez un diagnostic SunVTS Reportez vous ces sections Collecte des informations sur la visite de maintenance page 3 Inspection initiale du serveur page 1 Inspection externe du serveur page 5 Inspection interne du serveur page 5 D pannage des probl mes de module DIMM page 7 Affichage des journaux d v nements page 37 propos de l autotest de l allumage POST page 162 Utilisation de l interface graphique du processeur de service ILOM pour afficher les informations syst me page 77 Utilisation d IPMItool pour afficher les informations syst me page 19 Diagnostic des probl mes de serveur l aide du CD de diagnostic amor able page 16 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Collecte des informations sur la visite de maintenance La premi re tape pour d terminer la cause du probl me avec le serveur consiste rassembler le plus d informations possible aupr s du personnel sur site ou en consultant des documents relatifs aux appels de service Utilisez les instructions g n rales suivantes lorsque vous commencez le d pannage Pour rassembler des informations sur la visite de maintenance 1 Rassemblez des informations au sujet des l ments suivants les v nements qui se sont produits avant la panne si l un des mat
174. odules DIMM de la paire et installez les dans des emplacements coupl s sur la deuxi me carte CPU qui n indiquait pas de probl me de module DIMM l aide des num ros d emplacement de lexemple installez les deux modules DIMM de la CPUO emplacements 1 et 3 dans la CPU1 emplacements 1 et 3 ou la CPU1 emplacements 0 et 2 Rebranchez les cordons d alimentation CA sur le serveur Mettez le serveur sous tension et ex cutez de nouveau le test de diagnostic V rifiez le fichier journal m Si l erreur appara t maintenant sous la CPU qui g re les emplacements DIMM que vous venez d installer le probl me concerne les modules DIMM Retournez les deux modules DIMM la paire au Support Center pour les remplacer m Si l erreur concerne toujours la CPU d origine cela signifie qu elle pr sente un probl me 14 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 CHAPITRE 2 Utilisation du logiciel de diagnostic SunVTS Ce chapitre contient des informations sur les outils du logiciel de diagnostic de Sun Ce chapitre aborde les sujets suivants a Ex cution de tests de diagnostic l aide de SunVTS page 15 m Diagnostic des probl mes de serveur l aide du CD de diagnostic amor able page 16 Ex cution de tests de diagnostic l aide de Sun VTS Les serveurs Sun Fire X4500 sont livr s avec un CD de diagnostic amor able qui contient le logiciel SunVTSTM SunVTS Sun Va
175. oire physique pmemtest 153 Test du port s rie serialtest Test du syst me systest Test du bus s rie universel usbtest Test de la m moire virtuelle vmemtest Acc s Sun VTS Le logiciel Sun VTS offre une interface graphique qui permet de configurer les tests et de surveiller leur statut L interface utilisateur peut tre ex cut e sur un syst me pour afficher les tests SunVTS d un autre syst me sur le r seau Le logiciel SunVTS fournit galement une interface en mode TTY pour les situations dans lesquelles l ex cution d une interface graphique n est pas possible Documentation Sun VTS Pour obtenir la documentation SunVTS la plus jour visitez le site http www sun com oem products vts Ex cution de tests de diagnostic l aide de Sun VTS Utilisation du CD de diagnostic amor able Utilisez le CD de diagnostic amor able pour diagnostiquer des probl mes de serveur Ce CD est con u pour que le serveur d marre partir du CD Ce CD d marre le syst me d exploitation Solaris et lance le logiciel SunVTS Les tests de diagnostic s ex cutent et crivent la sortie dans des fichiers journaux que le technicien de maintenance peut utiliser pour d terminer le probl me li au serveur Le logiciel SunVTS 7 0 ou version ult rieure est pr install sur les serveurs Sun Fire X4540 Le serveur est galement livr avec le CD de diagnostic amor able du serveur Sun Fire X4540 num ro de r f
176. ontr les et indicateurs du panneau avant du serveur Sun Fire X4540 page 175 et le TABLEAU G 1 Contr les et indicateurs du panneau avant page 175 m La FIGURE G 3 Panneau arri re du serveur Sun Fire X4540 page 176 et le TABLE 6 3 Fonctions du panneau arri re page 176 173 Fonctions du panneau avant La FIGURE G 1 montre le panneau avant La FIGURE G 2 d taille les contr les et les indicateurs Le TABLEAU G 1 d crit les contr les et les indicateurs FIGURE G 1 Fonctions du panneau avant du serveur Sun Fire X4540 Bouton de recherche DEL d alimentation OK L OA L Onr ommo 4 Ports USB 2 174 Guide de diagnostic des serveurs Sun Fire X4500 X4540 e Juillet 2008 FIGURE G 2 Contr les et indicateurs du panneau avant du serveur Sun Fire X4540 1 2 3 4 5 6 7 ex OA o or ORRO TABLEAU G 1 Contr les et indicateurs du panneau avant Nom Couleur Description 1 Bouton DEL de Blanc recherche 2 Erreur syst me Blanc 3 Alimentation Vert Fonctionnement 4 Bouton Gris d alimentation du syst me 5 DEL de panne Orange avant 6 DEL de panne Orange arri re 7 DEL de surchauffe Orange Les op rateurs peuvent allumer cette DEL distance pour pouvoir rep rer le serveur dans une salle de serveur bond e Appuyez pour mettre hors tension Une pression sur le bouton DEL de recherche pendant cinq secondes allume tous les indicateurs pend
177. ory Uncorrectable ECC Asserted CPU 0 DIMM 0 23 09 25 2007 03 22 16 Memory Uncorrectable ECC Asserted CPU 1 DIMM 1 24 09 25 2007 03 22 16 Memory Memory Device Disabled Asserted CPU 2 DIMM 0 25 09 25 2007 03 22 16 Memory Memory Device Disabled Asserted CPU 2 DIMM 1 Les lignes de l affichage indiquent d abord les num ros des v nements format hexad cimal suivis d une description de l v nement Le TABLEAU 2 2 d crit le contenu de l affichage TABLEAU 2 2 Lignes de la sortie IPMI v nement format hexad cimal Description 8 Une erreur non corrigible a provoqu un Hypertransport sync flood qui a provoqu la r initialisation chaud du syst me 0x02 fait r f rence au num ro de r initialisation conserv depuis la derni re mise hors tension 9 Le BIOS a d tect et initialis 4 processeurs dans le syst me a Le BIOS a d tect un Sync Flood et caus cette r initialisation b Le BIOS a d tect une erreur de mat riel et caus le Sync Flood 118 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 TABLEAU 2 2 Lignes de la sortie IPMI Suite v nement format hexad cimal Description c le 1f 21 25 Le BIOS a r cup r et consign des informations sur une erreur de mat riel y compris les registres d erreur machine v nements 14 18 de tous les processeurs Lorsque le BIOS d tecte une erreur non corrigible il localise le mo
178. otre syst me d exploitation Solaris pour plus de d tails Utilisez la commande fmdump eV pour afficher les erreurs ECC Chapitre 2 D pannage des probl mes de module DIMM 119 m Linux L utilitaire HERD peut tre utilis pour g rer les erreurs de module DIMM sous Linux Reportez vous au x64 Servers Utilities Reference Manual Manuel de r f rence des utilitaires des serveurs x64 pour plus d informations a Si HERD est install il copie les messages de dev mcelog vers var log messages a Si HERD n est pas install un programme nomm mcelog copie les messages depuis dev mcelog to var log mcelog Le CD de diagnostic amor able d crit dans la section Utilisation du logiciel de diagnostic SunVTS capture et consigne les erreurs corrigibles Messages d erreur de module DIMM du BIOS Le BIOS affiche et consigne les messages d erreur de module DIMM suivants NODE n Memory Configuration Mismatch Les conditions suivantes provoquent ce message d erreur Les modules DIMM ne sont pas coupl s ex cution en mode 64 bits au lieu de 128 bits a La vitesse des modules DIMM n est pas la m me a Les modules DIMM ne prennent pas en charge les erreurs ECC Les modules DIMM ne sont pas enregistr s a Le MCT s est arr t cause d erreurs dans le module DIMM a Le type de module de DIMM tampon ne correspond pas a La g n ration de module DIMM I ou II ne correspond pas a Le CL T de module DIMM ne corres
179. ous la fiche Emplacement de la documentation fournie avec votre syst me et disponible sur le site de documentation du produit Consultez les URL suivantes http docs sun com app docs prod sf x4500 hic http docs sun com app docs prod sf x4540 hic Des versions traduites d une partie de ces documents sont disponibles sur les sites Web susmentionn s en fran ais chinois simplifi et japonais Veuillez noter que la documentation anglaise est r vis e plus fr quemment Par cons quent elle est peut tre plus jour que la documentation traduite xi Pour de la documentation sur le mat riel Sun sur Solaris et sur d autres logiciels consultez l URL suivante http docs sun com Conventions typographiques Police de caract res Signification Exemples AaBbCc123 Noms de commandes de fichiers Modifiez votre fichier login et de r pertoires informations Utilisez 1s a pour afficher la liste de affich es l cran tous les fichiers Vous avez du courrier AaBbCc123 Ce que vous tapez est mis en su vidence par rapport aux Mot de passe informations affich es l cran AaBbCc123 Titres de manuels nouveaux Consultez le chapitre 6 du User s Guide termes mots souligner Remplacement de variables de ligne de commande par des noms ou des valeurs r els Guide de l utilisateur Elles sont appel es des options de classe Vous devez tre superutilisateur pour pouvoir effectuer cette op
180. ous reporter la page du manuel d IPMltool en tapant man ipmitool Remarque Dans les exemples de commande de cette annexe le nom d utilisateur par d faut root et le mot de passe par d faut changeme sont indiqu s Vous devez taper le nom d utilisateur et le mot de passe qui ont t d finis sur le serveur Activation de l utilisateur anonyme Afin d activer l utilisateur Anonyme NULL vous pouvez modifier le niveau de privil ge de ce compte La modification du niveau de privil ge vous permet de vous connecter sans fournir d option utilisateur U sur la ligne de commande Le mot de passe par d faut de cet utilisateur est anonymous Pour activer l utilisateur anonyme tapez les commandes suivantes ipmitool I lanplus H lt IPADDR gt U root P changeme channel setaccess 1 1 privilege 4 ipmitool I lanplus H lt IPADDR gt P anonymous user list Annexe A Utilisation d IPMitool pour afficher les informations syst me 21 22 Modification du mot de passe par d faut Vous pouvez galement modifier les mots de passe par d faut d un ID utilisateur particulier D abord obtenez une liste d utilisateurs et recherchez l ID de l utilisateur que vous voulez modifier Fournissez lui un nouveau mot de passe comme indiqu dans la s quence de commande suivante ipmitool I lanplus H lt IPADDR gt U root P changeme user list ID NameCallin Link Auth IPMI Msg Channel Priv Limit 1 false false true NO ACCESS 2
181. ouvez essayer d afficher les messages de l autotest de l allumage POST et les journaux d v nements du BIOS lors du d marrage du syst me Passez la section Viewing Event Logs page 23 Chapitre 1 Inspection initiale du serveur 113 114 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 CHAPITRE 2 D pannage des probl mes de module DIMM Ce chapitre d crit comment d tecter et corriger les probl mes de modules DIMM Dual Inline Memory Modules du serveur Sun Fire X4540 Il comprend les sections suivantes R gles de population DIMM page 115 Configurations de modules DIMM prises en charge page 116 Strat gie de remplacement des modules DIMM page 116 Gestion des erreurs de module DIMM par le syst me page 117 Isolation et correction des erreurs ECC de module DIMM page 122 R gles de population DIMM Les r gles de population DIMM du serveur sont les suivantes Chaque CPU peut prendre en charge un maximum de huit modules DIMM Les emplacements DIMM sont coupl s et les modules DIMM doivent tre install s par paires 0 1 2 3 4 5 et 6 7 Reportez vous la FIGURE 2 1 Les sockets de m moire sont noirs ou blancs pour indiquer les emplacements coupl s par couleurs correspondantes Les modules DIMM sont install s de l ext rieur loin de la CPU vers l int rieur Les modules DIMM des CPU dot es d une seule paire de modules DIMM doivent tre i
182. p power led fp power led sys locate led bp locate led fp locate led sys alert led bp alert led fp alert led Par exemple pour d finir la fois les DEL d alimentation OK du panneau avant et arri re sur une vitesse de clignotement d alimentation de secours vous pouvez taper la commande suivante ipmitool I lanplus H lt IPADDR gt U root P changeme sunoem led set sys power led standby Set LED fp power led to STANDBY Set LED bp power led to STANDBY Vous pouvez d sactiver la DEL d alimentation OK du panneau arri re mais laisser celle du panneau avant clignoter en tapant la commande suivante ipmitool I lanplus H lt IPADDR gt U root P changeme sunoem led set bp power led off Set LED bp power led to OFF Chapitre 4 Utilisation d IPMitool pour afficher les informations syst me 151 152 Utilisation de scripts IPMItool pour les tests Pour effectuer des tests il est souvent utile de modifier le statut de toutes les DEL ou au moins de plusieurs en une fois Pour cela vous pouvez cr er un script IPMItool et l ex cuter avec la commande exec L exemple suivant indique un script pour activer toutes les DEL du module du ventilateur sunoem led set ft0 fm0 led on sunoem led set ft0 fml led on sunoem led set ft0 fm2 led on sunoem led set ftl fm0 led on sunoem led set ftl fml led on sunoem led set ftl fm2 led on Si ce fichier de script s appelait 1eds_fan_on isc vous l utiliseriez dans une command
183. par exemple me reset cold U Une commande de l interface de ligne de commande CLI par exemple reset SP U ne op ration de l interface graphique Web ILOM effectu e partir de l onglet Maintenance et de la s lection de l option Reset SP R initialiser le processeur de service Une mise niveau du microprogramme du processeur de service Apr s un red marrage du processeur de service l horloge de ce dernier est modifi e par les l ments suivants Lors du d marrage de l h te Le BIOS de l h te r gle sans condition l heure du processeur de service sur celle indiqu e par l horloge temps r el de l h te Les op rations suivantes permettent de r gler l horloge temps r el de l h te m Lorsque la CMOS de l h te est effac e suite au changement de batterie de l horloge temps r el de l h te ou l insertion du cavalier d effacement de la CMOS sur le contr leur syst me L horloge temps r el de l h te commence le Jan 1 00 01 00 2002 Lorsque le syst me d exploitation de l h te d finit l horloge temps r el de l h te Le BIOS ne prend en compte les fuseaux horaires Solaris et Linux respectent les fuseaux horaires et r glent l horloge du syst me sur le format UTC Par cons quent une fois que le syst me d exploitation r gle l horloge temps r el l heure d finie par le BIOS est le temps universel a Lorsque l utilisateur d finit l horloge temps r el l aide de l cran de configuration
184. pcillab 11ab l c5 devices pci 2 0 pci1022 7458 7 pcillab 11ab l c6 devices pci 2 0 pci1022 7458 8 pcillab 11ab l c7 Uu amp amp N H 100 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 PARTIE IT Guide de diagnostic du serveur Sun Fire X4540 Cette partie contient le Guide de diagnostic du serveur Sun Fire X4540 et les chapitres suivants Inspection initiale du serveur page 1 103 D pannage des probl mes de module DIMM page 2 115 Utilisation de l interface graphique du processeur de service ILOM pour afficher les informations syst me page 3 125 Utilisation d IPMitool pour afficher les informations syst me page 4 137 Utilisation du logiciel de diagnostic Sun VTS page 5 153 Affichage des journaux d v nements et des codes POST page 6 159 Identification des DEL de statut et de panne page G 173 Gestion des erreurs page H 183 CHAPITRE 1 Inspection initiale du serveur Ce chapitre aborde les sujets suivants Organigramme sur le d pannage lors des visites de maintenance page 103 Collecte des informations sur la visite de maintenance page 105 D pannage des probl mes d alimentation page 106 Inspection externe du serveur page 107 Inspection interne du serveur page 110 Organigramme sur le d pannage lors des visites de maintenance L organigramme suivant vous aide d panner le serveur Su
185. peed 48h ok 29 5 6000 RPM Vous pouvez aussi g n rer une liste de tous les capteurs d une entit sp cifique Utilisez la sortie de liste pour d terminer l entit que vous voulez voir puis utilisez la commande sar entity afin d obtenir une liste de tous les capteurs de cette entit Cette commande accepte un ID d entit et un argument d instance d entit facultatif Si une instance d entit n est pas sp cifi e toutes les instances de cette entit s afficheront L ID d entit est donn e dans le quatri me champ de la sortie de gauche droite Par exemple dans la sortie indiqu e dans l exemple pr c dent tous les ventilateurs sont des entit s 29 Le dernier ventilateur list 29 5 est une entit 29 avec l instance 5 ft1 fm2 f0 speed 48h ok 29 5 6000 RPM Par exemple pour voir tous les capteurs de ventilateur vous pouvez utiliser la commande suivante qui utilise l argument d entit 29 ipmitool I lanplus H lt IPADDR gt U root P changeme sdr entity 29 ft0 fmO fail 3Dh ok 29 0 Predictive Failure Deasserted ft0 fmO0 led 00h ns 29 0 Generic Device 20h 19h 0 fto0 fml fail 3Eh ok 29 1 Predictive Failure Deasserted ft0 fml led 00h ns 29 1 Generic Device 20h 19h 1 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 fto fm2 fail 3Fh ok 29 2 Predictive Failure Deasserted ft0 fm2 1led 00h ns 29 2 Generic Device 20h 19h 2
186. ph rique cxtY comme l utilisent la plupart des applications Fournit une aide D crit le type de partition fdisk 1m Cette option scanne les disques pour les partitions fdisk qui sont reconnues par le syst me d exploitation Solaris x64 Comme la plate forme x64 ex cute aussi Linux et Windows certains des disques peuvent contenir des partitions fdisk non Solaris Par exemple des syst mes avec des syst mes d exploitation double initialisation Cette option est r serv e exclusivement au serveur Sun Fire X4500 Elle fournit la liste des num ros d emplacement physique du disque dur des noms logiques et du statut pr sent ou absent du serveur Sun Fire X4500 Cette option est pratique pour les environnements de scripts Par exemple certaines applications peuvent inclure hd q en mode non interactif pour v rifier si un disque en particulier dans un emplacement physique donn est accessible avant de configurer RAID R pertorie les disques accessibles du Sun Fire X4500 en s quence Cette option n inclut pas le num ro d emplacement physique R pertorie les num ros d emplacement amor able du Sun Fire X4500 les noms de disque logique Solaris et le statut pr sent ou absent R pertorie les donn es SMART pour tous les disques dans un num ro d emplacement de disque Annexe F Utilitaire ha 95 TABLEAU F 1 Options hd Suite Option Description R R pertorie l ID individuel des donn es SMART dans une vue pays
187. pla ables sur site affichage avec IPMitool 29 147 IPMI informations g n rales 20 137 IPMItool activation de l utilisateur anonyme 21 139 affichage de l inventaire de composants 29 147 affichage du journal SEL du processeur de service 26 143 affichage du statut des capteurs 23 140 affichage du statut des DEL 30 148 configuration d une cl SSH 22 140 connexion au serveur 21 138 effacement du journal SEL du processeur de service 28 145 emplacement du package 20 138 groupes de capteur de DEL 33 151 ID de capteur de DEL 31 148 informations g n rales 20 138 modes des DEL 33 150 modification du mot de passe par d faut 22 139 page de manuel 20 138 r glage du statut des DEL 30 148 utilisation de scripts pour les tests 34 152 utilisation du cache SDR 28 145 Isolation des erreurs ECC de module DIMM 12 122 J Journal d v nements du PS affichage l aide de l IG du PS ILOM 79 127 Journal d v nements syst me du processeur de service voir Journal SEL du processeur de service Journal SEL du processeur de service affichage avec IPMItool 26 143 effacement avec IPMItool 28 145 horodatages 82 130 num ros et noms de capteurs 29 146 utilisation du cache SDR 28 145 Journaux d v nements BIOS 37 159 L Logiciel de diagnostic 202 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 CD de diagnostic amor able 16 154 Sortie de la console redirection
188. pond pas a Les banques sur un module DIMM deux c t s ne correspondent pas a L organisation des modules DIMM ne correspond pas 128 bits Des informations Trc ou Trfc sont manquantes sur la SPD DEL de panne de module DIMM Lorsque vous appuyez sur le bouton Press to See Fault Appuyer pour afficher l erreur sur la carte m re ou la carte mezzanine les DEL situ es pr s des modules DIMM clignotent pour indiquer que le syst me a d tect 24 erreurs corrigibles ou plus pendant une p riode de 24 heures dans ce module DIMM 120 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Remarque Les DEL de panne du module DIMM et de la carte m re fonctionnent avec l lectricit stock e pendant une minute au maximum lors de la mise sous tension du syst me m me apr s que l alimentation soit d connect e et que le carte m re ou la carte mezzanine soit retir e du syst me L lectricit stock e dure environ une demi heure Remarque L indication de panne s teint lorsque l alimentation est d connect e Pour r cup rer des informations sur la panne consultez le journal SEL du processeur de service Reportez vous au Guide de l utilisateur de Sun Integrated Lights Out Manager a DEL de panne de module DIMM teinte le module fonctionne correctement a DEL de panne de module DIMM clignotante orange au moins un des modules DIMM de cette paire a signal 24 erreurs corrigibles pend
189. principal du BIOS appara t 2 S lectionnez l onglet du menu Advanced Avanc L cran Advanced Settings Param tres avanc s s affiche 3 S lectionnez ipmi 2 0 configuration configuration ipmi 2 0 L cran correspondant s affiche 4 S lectionnez l option de menu lan configuration configuration lan L cran correspondant s affiche 5 D terminez l adresse IP du serveur a S lectionnez l option IP Assignment Affectation d adresse IP que vous voulez utiliser DHCP ou Static Statique a Si vous choisissez DHCP l adresse IP du serveur est extraite du serveur DHCP de votre r seau et s affiche au format suivant Current IP address in BMC XXX XXX XXX XXX a Si vous choisissez Static pour affecter l adresse IP manuellement proc dez comme suit Chapitre 6 Affichage des journaux d v nements et des codes POST 163 b Tapez l adresse IP dans le champ IP Address Adresse IP Vous pouvez galement entrer le masque de sous r seau et les param tres par d faut de la passerelle dans leurs champs respectifs c S lectionnez Commit Valider et appuyez sur Retour pour valider les modifications d S lectionnez Refresh Actualiser et appuyez sur Return Retour pour voir les nouveaux param tres dans le champ Current IP address in BMC Adresse IP actuelle dans le BMC 6 D marrez un navigateur Web et tapez l adresse IP du processeur de service dans la zone d adresse du navigateur 7 Lorsque vou
190. r pertorie quelques faits et consid rations sur la fa on dont le serveur g re les processeurs incompatibles m Le BIOS effectue un autotest de l allumage complet m Le BIOS affiche un rapport de toutes les CPU incompatibles comme indiqu dans l exemple suivant Annexe H Gestion des erreurs 191 192 AMIBIOS C 2006 American Megatrends Inc BIOS Build Version OABNF010 Date 04 04 08 18 56 20 Core 08 00 14 CPU Quad Core AMD Opteron tm Processor 2356 Speed 2 30 GHz Count 8 Node0 DCTO 667 MHz DCTI 667 MHz Nodel DCTO 667 MHz DCT1 667 MHZ Sun Fire X4540 2 AMD North Bridges Rev B3 NVMM ROM Version 4 081 40 BMC Firmware Revision 2 0 2 3 CPLD Revision 2 0 SP IP Address 010 006 143 054 Initializing USB Controllers Done Press F2 to run Setup CTRL E on Remote Keyboard Press F8 for BBS POPUP CTRL P on Remote Keyboard Press F12 to boot from the network CTRL N on Remote Keyboard System Memory 64 0 GB USB Device s 2 Keyboards 2 Mice 1 Hub Auto detecting USB Mass Storage Devices 00 USB mass storage devices found and configured 0085 BMC Responding Press lt ESC gt to continue 6 Aucun v nement SEL ni DMI n est enregistr Le syst me se met en mode d arr t et affiche le message suivant xX X 4 x Warning Bad Mix of Processors kkxxx Multiple core processors cannot be installed with single core processors Fatal Error System Halted Guide de d
191. r pour atteindre l interface graphique Web ILOM a Tapez l adresse IP du processeur de service du serveur dans votre navigateur Web L cran Sun Integrated Lights Out Manager Login connexion Sun Integrated Lights Out Manager s affiche b Tapez vos nom d utilisateur et mot de passe La premi re fois que vous tentez d acc der au processeur de service ILOM vous tes invit taper le nom d utilisateur et le mot de passe par d faut Tapez les nom d utilisateur et mot de passe par d faut Nom d utilisateur par d faut root Mot de passe par d faut changeme 2 Dans l onglet System Information Informations syst me s lectionnez Components Composants La page Replaceable Component Information Informations sur les composants rempla ables s affiche Reportez vous la FIGURE 3 2 Chapitre 3 Utilisation de l interface graphique du processeur de service ILOM pour afficher les informations syst me FIGURE 3 2 Page Replaceable Component Information Informations sur les composants rempla ables ABOUT REFRESH LoG OUT User root Administrator Server SUNSP0003BA8407B6 Sun Integrated Lights Out Manager Java Sun Microsystems Inc System Information li EPEE CEE User Management Remote Control Maintenance Versions Session Time Out Components Replaceable Component Information View component part numbers serial numbers and manufacturing information Select
192. r Sun Fire X4540 ENCLOSURE STATUS AC ID a t TABLEAU 1 2 Fonctions du panneau arri re Nom Description 1 Connecteurs V rifiez que les DEL PS sont vertes Chaque source d alimentation CA d alimentation poss de son propre connecteur CA avec un clip pour maintenir le c ble d alimentation 2 Bouton DEL de Blanc Les op rateurs peuvent allumer cette DEL distance recherche pour pouvoir rep rer le serveur dans une salle de serveur bond e Appuyez pour mettre hors tension Chapitre 1 Inspection initiale du serveur 109 TABLEAU 1 2 Fonctions du panneau arri re Suite Nom Description 3 DEL de panne Orange Lorsqu elle est allum e une op ration de maintenance est requise Fixe L alimentation est activ e teint L alimentation est d sactiv e 4 DEL OK Verte Op ration de maintenance autoris e Lorsqu elle est allum e une op ration de maintenance est requise Clignotant L alimentation de secours est activ e mais l alimentation principale est d sactiv e 5 DEL de statut du Bleu Pr t tre retir contr leur syst me Orange Erreur une op ration de maintenance est requise Verte Op rationnel aucune action requise Pour en savoir plus sur l emplacement DEL et en obtenir une description reportez vous la section Identification des DEL de statut et de panne page 173 3 V rifiez que rien dans l environnement du serveur
193. r le serveur Activation de l utilisateur anonyme Afin d activer l utilisateur Anonyme NULL vous pouvez modifier le niveau de privil ge de ce compte Cela vous permettra de vous connecter sans fournir d option utilisateur U sur la ligne de commande Le mot de passe par d faut de cet utilisateur est anonymous Pour activer l utilisateur anonyme tapez les commandes suivantes ipmitool I lanplus H lt IPADDR gt U root P changeme channel setaccess 1 1 privilege 4 ipmitool I lanplus H lt IPADDR gt P anonymous user list Modification du mot de passe par d faut Vous pouvez galement modifier les mots de passe par d faut d un ID utilisateur particulier D abord obtenez une liste d utilisateurs et recherchez l ID de l utilisateur que vous voulez modifier Fournissez lui un nouveau mot de passe comme indiqu dans la s quence de commande suivante ipmitool I lanplus H lt IPADDR gt U root P changeme user list ID NameCallin Link Auth IPMI Msg Channel Priv Limit 1 false false true NO ACCESS 2 root false false true ADMINISTRATOR ipmitool I lanplus H lt IPADDR gt U root P changeme user set password 2 newpass ipmitool I lanplus H lt IPADDR gt U root P newpass chassis status Chapitre 4 Utilisation d IPMitool pour afficher les informations syst me 139 Configuration d une cl SSH Vous pouvez utiliser IPMltool pour configurer une cl SSH pour un utilisateur shell distant Pour cela d termin
194. res ou inf rieures un seuil donn Le processeur de service surveille les temp ratures de la CPU et du syst me et d tecte toute temp rature sup rieure un seuil donn La CPU met le signal THERMTRIP_L lorsqu elle d tecte une condition de surchauffe Le BIOS ne peut pas d marrer depuis un p riph rique de la liste des p riph riques de d marrage La DEL de demande d op ration de maintenance et la DEL de panne de l alimentation clignotent La DEL de demande d op ration de maintenance et la DEL de surchauffe du syst me clignotent Le contr leur syst me est mis hors tension au del du niveau critique sp cifi Le CPLD met la CPU hors tension La DEL de demande d op ration de maintenance et la DEL de surchauffe du syst me clignotent Le BIOS passe au p riph rique de d marrage suivant dans la liste Si tous les p riph riques de la liste chouent un message d erreur s affiche r essayez depuis le d but de la liste Le processeur de service peut contr ler ou modifier l ordre de d marrage Journal SEL du processeur de service Journal SEL du processeur de service Journal SEL du processeur de service Journal DMI Fatale Fatale Fatale Non fatale Annexe H Gestion des erreurs 199 200 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Index A Arr t d urgence 5 110 Arr t progressif 5 110 Autotest de l allumag
195. reurs de DRAM 4 bits Le BIOS consigne l erreur dans le journal des v nements syst me SEL du processeur de service l aide du contr leur BMC Board Management Controller Le journal SEL du processeur de service est mis jour avec l adresse de banque sp cifique de la paire de modules DIMM d faillante Le syst me red marre Le BIOS consigne l erreur dans les journaux d v nements du processeur et DMI 183 Remarque Si l erreur se situe dans la m moire basse de 1 Mo le BIOS se bloque apr s le red marrage Par cons quent aucun journal DMI n est enregistr m Voici un exemple d erreur consign e par le journal SEL via IPMI 2 0 a Lorsque la m moire basse est erron e le BIOS se bloque lors du test de m moire basse de pr d marrage car le BIOS ne peut pas s auto d compresser dans la m moire DRAM d faillante et ex cuter les l ments suivants ipmitool gt sel list 100 08 26 2005 11 36 09 OEM 0xfb 200 08 26 2005 11 36 12 System Firmware Error No usable system memory 300 08 26 2005 11 36 12 Memory Memory Device Disabled CPU 0 DIMM 0 a Lorsque le module DIMM d fectueux est sup rieur l espace d extraction de m moire basse de 1 Mo du BIOS un d marrage correct se produit ipmitool gt sel list 100 08 26 2005 05 04 04 OEM 0xfb 200 08 26 2005 05 04 09 Memory Memory Device Disabled CPU 0 DIMM 0 m Notez les consid rations
196. riels ou logiciels a t modifi ou install si le serveur a t install ou d plac r cemment la dur e d exposition des sympt mes sur le serveur la dur e ou la fr quence du probl me 2 Fournissez des informations sur les param tres du serveur avant les modifications Si possible proc dez un changement la fois pour isoler les probl mes potentiels De cette fa on vous pouvez maintenir un environnement contr l et r duire le d pannage 3 Notez les r sultats de toutes les modifications effectu es Incluez tous les erreurs ou les messages fournis titre d information 4 V rifiez les conflits de p riph rique potentiel avant d ajouter un nouveau p riph rique 5 V rifiez les d pendances de version sp cialement avec les logiciels tiers Inspection du syst me Des contr les mal d finis et des cordons mal branch s ou desserr s sont des causes communes de probl mes avec des composants mat riels Les proc dures suivantes sont utilis es m D pannage des probl mes d alimentation page 4 m Inspection externe du serveur page 5 m Inspection interne du serveur page 5 Chapitre 1 Inspection initiale du serveur 3 Si le serveur peut tre mis sous tension passez la section D pannage des probl mes d alimentation page 4 et rendez vous directement la section Inspection externe du serveur page 5 D pannage des probl mes d alimentation Si le serve
197. rnir les modes du TABLEAU 4 3 dans les commandes led set TABLEAU 4 3 Modes des DEL Mode Description OFF teint DEL teinte ON Allum DEL fixe STANDBY 100 ms allum e 2900 ms teinte Clignotant SLOW Lent Vitesse du clignotement 1 Hz FAST Rapide Vitesse du clignotement 4 Hz 150 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Groupes de capteur de DEL Comme chaque DEL a son propre capteur et peut tre contr l e ind pendamment les capteurs peuvent se chevaucher En particulier il existe des DEL distinctes d finies pour les DEL d alimentation de localisation et d alerte sur les panneaux avant et arri re Il est pr f rable que ces capteurs soient li s pour que les DEL des panneaux avant et arri re puissent tre contr l es en m me temps Ceci est possible via l utilisation des enregistrements d association d entit s Il s agit des enregistrements du SDR qui contiennent une liste des entit s consid r es comme faisant partie d un groupe Pour chaque enregistrement d association d entit nous d finissons galement un autre enregistrement de localisateur de p riph rique g n rique pour indiquer au logiciel du syst me qu il fait r f rence un groupe de DEL plut t qu une seule DEL physique Le TABLEAU 4 4 d crit les groupes de capteur de DEL TABLEAU 4 4 Groupes de capteur de DEL Nom de groupe Capteurs dans le groupe sys power led b
198. rocesseur de service Reportez vous l exemple de commande et de sortie suivant root d mpk12 53 238 root ipmitool H 129 146 53 95 U root P changeme I lan sel list v SEL Record ID 0100 Record Type 00 Timestamp 01 10 2002 20 16 16 Generator ID 0001 EvM Revision 04 Sensor Type Critical Interrupt Sensor Number 00 Event Type Sensor specific Discrete Annexe H Gestion des erreurs 187 Event Direction Assertion Event Event Data 04f f00 Description PCI PERR m La FIGURE H 4 repr sente un exemple d cran de journal DMI de la page de configuration du BIOS avec une erreur de parit FIGURE H 4 cran de journal DMI erreur de parit PCI BIOS SETUP UTILITY View Event Log Vieu Event Lo 09 12 05 14 27 47 m Le BIOS affiche les messages suivants et se bloque lors de l autotest de l allumage ou le DOS m NMI EVENT a System Halted due to Fatal NMI m Le d routement NMI Linux saisit l interruption et consigne la s quence suivante Aug 5 05 15 00 d mpk12 53 159 kernel Uhhuh NMI received for unknown reason 2d on CPU 0 Aug 5 05 15 00 d mpk12 53 159 kernel Uhhuh NMI received for unknown reason 2d on CPU 1 Aug 5 05 15 00 d mpk12 53 159 kernel Dazed and confused but trying to continue Aug 5 05 15 00 d mpk12 53 159 kernel Do you have a strange power saving mode enabled Aug 5 05 15 00 d mpk12 53 159 kernel Uhhuh NMI received for unknown reason 3d on CPU 1 1
199. s jour visitez le site http docs sun com app docs co11 1140 2 Diagnostic des probl mes de serveur l aide du CD de diagnostic amor able Le logiciel SunVTS 6 2 ou version ult rieure est pr install sur les serveurs Sun Fire X4500 Le serveur est galement livr avec le CD de diagnostic amor able du serveur Sun Fire X4500 705 1439 Ce CD est con u pour que le serveur d marre partir du CD Ce CD d marre le syst me d exploitation Solaris et lance le logiciel Sun VTS Les tests de diagnostic s ex cutent et crivent la sortie dans des fichiers journaux que le technicien de maintenance peut utiliser pour d terminer le probl me li au serveur Configuration requise Pour utiliser le CD de diagnostic amor able du serveur Sun Fire X4500 vous devez disposer d un clavier d une souris et d un cran raccord s au serveur sur lequel vous effectuez les diagnostics 16 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Utilisation du CD de diagnostic amor able Pour utiliser le CD de diagnostic amor able du serveur Sun Fire X4500 pour effectuer des diagnostics 1 Une fois le serveur sous tension ins rez le CD de diagnostic amor able du serveur Sun Fire X4500 705 1439 dans le lecteur de DVD ROM Red marrez le serveur en appuyant sur F2 au d but du red marrage afin de pouvoir modifier le param tre BIOS de priorit du p riph rique d amor age Lorsque le menu prin
200. s DEL sont actives uniquement lorsque le bouton Rappeler est enfonc Panne de module Orange Clignote pour indiquer que le syst me a trouv une DIMM panne sur le module DIMM Red marrez le syst me pour supprimer la panne Panne de CPU Orange Clignote pour indiquer que le syst me a trouv une panne sur une CPU Red marrez le syst me pour supprimer la panne Panne de batterie Orange Clignote pour indiquer que le syst me a trouv une panne sur la batterie D marrez le processeur de service pour supprimer la panne Annexe C DEL de statut 57 DEL du disque et du plateau de ventilateur La FIGURE C 4 indique l emplacement des DEL internes La FIGURE C 5 propose un gros plan du disque et des plateaux de ventilateur y compris les symboles qui identifient les DEL FIGURE C 4 DEL du disque et du plateau de ventilateur 58 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 FIGURE C 5 DEL du disque et du plateau de ventilateur Ready to Remove Fault Service action A Service action allowed required ox DEL de carte CPU La carte CPU contient trois types de DEL Elles sont r pertori es dans le TABLEAU C 3 et apparaissent dans la FIGURE C 6 Annexe C DEL de statut 59 marr Remarque Les DEL de CPU et de module DIMM indiquent une panne jusqu ce que le syst me soit mis sous tension La DEL de batterie indique une panne jusqu ce que le processeur de service
201. s de v rification de l ordinateur du contr leur de m moire NorthBridge et d termine si le red marrage pr c dent a t caus par une erreur non corrigible puis il communique ce message lors de l autotest de l allumage apr s l tape memtest A Hypertransport Sync Flood occurred on last boot La m moire communique cet v nement dans le journal SEL System Event Log du processeur de service comme indiqu dans la sortie d IPMItool cit e en exemple ci dessous ipmitool H 10 6 77 249 U root P changeme I lanplus sel list f000 02 16 2006 03 32 38 OEM 0x12 f100 OEM record e0 00000000040f0c0200200000a2 f200 OEM record e0 01000000040000000000000000 f300 02 16 2006 03 32 50 Memory Uncorrectable ECC CPU 1 DIMM 0 f400 02 16 2006 03 32 50 Memory Memory Device Disabled CPU 1 DIMM 0 500 02 16 2006 03 32 55 System Firmware Progress Motherboard initialization f600 02 16 2006 03 32 55 System Firmware Progress Video initialization 700 02 16 2006 03 33 01 System Firmware Progress USB resource configuration Erreurs de module DIMM corrigibles ce stade les erreurs corrigibles ne sont pas consign es dans les journaux SEL System Event Log du serveur Remarque Lors de l ex cution de Solaris 10 l architecture de gestion des anomalies g re les erreurs corrigibles de la m moire en fournissant une surveillance et un diagnostic des erreurs Guide de
202. s serveurs Sun Fire X4500 X4540 Juillet 2008 Remarque Lorsque vous utilisez cette commande un enregistrement d v nement affiche un num ro de capteur mais il n affiche pas le nom du capteur pour l v nement Par exemple la ligne 100 de l exemple de sortie ci dessus le num ro de capteur 0x16 est affich Pour plus d informations sur la fa on d tablir une correspondance entre des noms de capteur et diff rents formats de num ro de capteur qui peuvent s afficher reportez vous la section Num ros et noms de capteurs dans les v nements SEL page 29 m Pour afficher le journal SEL du processeur de service ILOM avec une sortie d v nement d taill e tapez la commande sel elist au lieu de la commande sel list La commande sel elist renvoie des enregistrements d v nements avec des enregistrements des donn es des capteurs pour produire une sortie d v nement descriptive L ex cution est plus longue car la lecture se fait partir du journal SEL et du r f rentiel des donn es statiques SDR Pour augmenter la vitesse g n rez un cache SDR avant d utiliser la commande sel elist Reportez vous la section Utilisation du cache du r f rentiel des donn es des capteurs SDR page 28 Par exemple ipmitool I lanplus H lt IPADDR gt U root P changeme sel elist first 3 100 Pre Init Time stamp Temperature fp t amb Upper Non critical going high Reading 31 gt Threshold 30 degrees C
203. s suivants a Temp rature ambiante du panneau avant fp t_amb a Valeur sup rieure non critique 30 degr s C a Valeur sup rieure critique 35 degr s C a Valeur sup rieure irr cup rable 40 degr s C a Temp ratures die des CPU 0 p0 t_core et CPU 1 pl t_core a Valeur sup rieure non critique 55 degr s C a Valeur sup rieure critique 65 degr s C a Valeur sup rieure irr cup rable 75 degr s C Il existe trois autres capteurs de temp rature a Temp rature ambiante de la carte d E S io t_amb a Temp rature ambiante du contr leur syst me mb t_amb a Temp rature ambiante de la carte de distribution de courant pdb t_amb Pour afficher les lectures du capteur 1 Connectez vous au processeur de service en tant qu administrateur ou op rateur pour atteindre l interface graphique Web ILOM a Tapez l adresse IP du processeur de service du serveur dans votre navigateur Web L cran Sun Integrated Lights Out Manager Login connexion Sun Integrated Lights Out Manager s affiche b Tapez vos nom d utilisateur et mot de passe La premi re fois que vous tentez d acc der au processeur de service ILOM vous tes invit taper le nom d utilisateur et le mot de passe par d faut Tapez les nom d utilisateur et mot de passe par d faut Nom d utilisateur par d faut root Mot de passe par d faut changeme 2 Dans l onglet System Monitoring Surveillance du syst me choisissez Sensor Readings
204. s y tes invit tapez un nom d utilisateur et un mot de passe comme suit m User Name root m mot de passe changeme L cran principal de l interface graphique Sun Integrated Lights Out Manager s affiche 8 Cliquez sur l onglet Remote Control Contr le distance 9 Cliquez sur l onglet Redirection 10 D finissez la profondeur de couleurs de la console de redirection sur 6 ou 8 bits 11 Cliquez sur le bouton Start Redirection D marrer la redirection 12 Lorsque vous y tes invit tapez un nom d utilisateur et un mot de passe comme suit m User Name root m mot de passe changeme L cran en cours du POST s affiche Modification des options du POST Ces instructions sont facultatives mais vous pouvez les utiliser pour modifier les op rations ex cut es par le serveur au cours du test POST Pour modifier les options du POST 1 Initialisez l utilitaire de configuration du BIOS en appuyant sur la touche F2 pendant que le syst me effectue l autotest de l allumage POST L cran du menu principal du BIOS appara t 164 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 2 S lectionnez Boot Initialisation L cran Boot Settings Param tres d initialisation s affiche FIGURE 6 4 cran Boot Settings Param tres d initialisation du BIOS Main Advanced PCIPnP Boot Security Chipset Exit kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk
205. spondance entre des noms de capteur et diff rents formats de num ro de capteur qui peuvent s afficher reportez vous la section Num ros et noms de capteurs dans les v nements SEL page 146 m Affichez le journal SEL du processeur de service ILOM avec une sortie d v nement d taill e en utilisant la commande sel elist au lieu de la commande sel list La commande sel elist renvoie des enregistrements d v nements avec des enregistrements des donn es des capteurs pour produire une sortie d v nement descriptive L ex cution est plus longue car la lecture se fait partir du journal SEL et du r f rentiel des donn es statiques SDR Pour augmenter la vitesse g n rez un cache SDR avant d utiliser la commande sel elist Reportez vous la section Utilisation du cache du r f rentiel des donn es des capteurs SDR page 145 Par exemple ipmitool I lanplus H lt IPADDR gt U root P changeme sel elist first 3 100 Pre Init Time stamp Temperature fp t amb Upper Non critical going high Reading 31 gt Threshold 30 degrees C 200 Pre Init Time stamp Power Supply psl pwrok State Deasserted 300 Pre Init Time stamp Entity Presence psl prsnt Device Present Certains qualificateurs sont disponibles pour affiner et limiter la sortie du journal SEL Si vous ne voulez voir que les premiers enregistrements NUM ajoutez ce mot comme qualificateur la commande Si vous voulez voir les derniers enregi
206. spondent aux composants suivants sys syst me ou ch ssis e p0 processeur 0 e p1 processeur 1 e io carte d E S e ps alimentation lectrique e fp panneau avant e ft plateau de ventilateur e mb carte m re Type de capteur de l v nement sp cifi Description de l v nement 4 Pour effacer le journal des v nements cliquez sur le bouton Clear Event Log Effacer le journal des v nements Une bo te de dialogue de confirmation s affiche 5 Cliquez sur OK pour effacer toutes les entr es du journal 6 Si le probl me du serveur n est pas vident apr s avoir consult les journaux et les informations du processeur de service ILOM passez la section Ex cution de tests de diagnostic l aide de SunVTS page 154 Annexe E Utilisation de l interface graphique du processeur de service ILOM pour afficher les informations syst me 81 82 Interpr tation des horodatages du journal des v nements Les horodatages du journal des v nements syst me sont li s aux param tres de l horloge du processeur de service Si les param tres de l horloge sont modifi s les horodatages refl tent ces modifications Lorsque le processeur de service red marre l horloge du processeur de service est d finie sur Thu Jan 1 00 00 00 UTC 1970 Le red marrage du processeur de service se produit dans les cas suivants Un cycle complet de mise hors sous tension du syst me ne commande IPMI
207. strements NUM utilisez ce qualificateur Par exemple pour voir les trois derniers enregistrements dans le journal SEL tapez la commande suivante 144 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 ipmitool I lanplus H lt IPADDR gt U root P changeme sel elist last 3 800 Pre Init Time stamp Entity Presence psl prsnt Device Absent 900 Pre Init Time stamp Phys Security sys intsw Gen Chassis intrusion a00 Pre Init Time stamp Entity Presence ps0 prsnt Device Present Si vous voulez obtenir plus d informations d taill es sur un v nement particulier vous pouvez utiliser la commande se1 get ID dans laquelle vous pr cisez un ID d enregistrement de journal SEL Par exemple ipmitool I lanplus H lt IPADDR gt U root P changeme sel get 0x0a00 SEL Record ID 0a00 Record Type 02 Timestamp 07 06 1970 01 53 58 Generator ID 0020 EvM Revision 04 Sensor Type Entity Presence Sensor Number 12 Event Type Generic Discrete Event Direction Assertion Event Event Data RAW O1ffff Description Device Present Sensor ID psO prsnt 0x12 Entity ID 10 0 Sensor Type Discrete Entity Presence States Asserted Availability State Device Present Dans l exemple ci dessus cet v nement particulier d crit que Alimentation lectrique N 0 est d tect e et pr sente Effacement du journal SEL avec IPMItool Pour effacer le journal SEL tapez la commande sel cle
208. suivantes pour cette r vision a L erreur de m moire ECC non corrigible n est pas consign e m Les erreurs ECC multibits sont consign es en tant que Memory Device Disabled Au premier red marrage le BIOS consigne une erreur HyperTransport dans le journal DMI a Le BIOS d sactive le module DIMM a Le BIOS envoie les enregistrements SEL au BMC a Le BIOS red marre nouveau Le BIOS ignore le module DIMM d fectueux lors du test de m moire POST suivant a Le BIOS indique la m moire disponible en excluant la paire de modules DIMM d fectueuse La FIGURE H 1 repr sente un exemple d cran de journal DMI de la page de configuration du BIOS 184 Guide de diagnostic des serveurs Sun Fire X4500 X4540 e Juillet 2008 FIGURE H 1 cran de journal DMI erreur non corrigible BIOS SETUP UTILITY Advanced Event Logging details View all unread events a on the Event Log Mark all events as read Clear Event Log Uieu Event Log 09 12 05 11 51 05 A Hyper Transport sync flood error occurred on last boot Enter Go to Sub Screen F1 General Help F10 Save and Exit ESC Exit v02 53 C Copyright 1985 2002 American Megatrends Inc Erreurs corrigibles Cette section r pertorie quelques faits et consid rations sur la fa on dont le serveur g re les erreurs corrigibles a Lors de l autotest de l allumage du BIOS m Le BIOS interroge les registres MCK a Le BIOS consigne dans DMI a Le BIOS consigne d
209. syst me pr c dentes en bas de l cran Reportez vous la FIGURE D 5 pour voir un exemple Annexe D Gestion des erreurs 67 FIGURE D 5 cran POST erreur syst me pr c dente r pertori e American PAYI www ami com Megatrends N microsystems BMC Firmware Revision 1 00 hecking NUR Initializing USB Controllers Done Press F2 to run Setup CTRL E on Remote Keyboard Press F12 to boot from the network CTRL N on Remote Keyboard JSB Device s 3 Keyboards 3 Mice 2 Storage Devices Auto Detecting Pri Master ATAPI CDROM Pri Master DU 28SL 1 04 Ultra DMA Mode 2 uto detect ing USB Mass Storage Devices Device 01 AMI Virtual CDROM Device 02 AMI Virtual Floppy 2 USB mass storage devices found and configured 0085 BMC Responding A Hyper Transport sync flood error occurred on last boot PCI System Error m Les erreurs SERR et HyperTransport Synch Flood sont consign es dans le DMI et dans le journal SEL du processeur de service Reportez vous l exemple de sortie suivant SEL Record ID 0a00 Record Type 00 Timestamp 08 10 2005 06 05 32 Generator ID 0001 EvM Revision 04 Sensor Type Critical Interrupt Sensor Number 00 Event Type Sensor specific Discrete Event Direction Assertion Event Event Data OSFFEE Description PCI SERR m La FIGURE D 6 repr sente un exemple d cran de journal DMI de la page de configuration du BIOS avec une erreur syst me 68 Guide de diagnostic des
210. t from the network CTRL N on Remote Keyboard JSB Device s 3 Keyboards 3 Mice 2 Storage Devices Auto Detecting Pri Master ATAPI CDROM Pri Master DU 28SL 1 04 Ultra DMA Mode 2 uto detect ing USB Mass Storage Devices Device 01 AMI Virtual CDROM Device 02 AMI Virtual Floppy 2 USB mass storage devices found and configured 0085 BMC Responding A Hyper Transport sync flood error occurred on last boot PCI System Error m Les erreurs SERR et HyperTransport Synch Flood sont consign es dans le DMI et dans le journal SEL du processeur de service Reportez vous l exemple de sortie suivant SEL Record ID 0a00 Record Type 00 Timestamp 08 10 2005 06 05 32 Generator ID 0001 EvM Revision 04 Sensor Type Critical Interrupt Sensor Number 00 Event Type Sensor specific Discrete Event Direction Assertion Event Event Data OSFFEE Description PCI SERR m La FIGURE H 6 repr sente un exemple d cran de journal DMI de la page de configuration du BIOS avec une erreur syst me 190 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 FIGURE H 6 cran de journal DMI erreur syst me r pertori e BIOS SETUP UTILITY View Event Log eue Jieu Event Log 09 12 05 14 23 47 A Hyper Transpor sync flood error occurred c last boot 09 12 05 14 23 36 PCI System Error 53 C Copyright 1985 002 finer ica Megatrends Inc Gestion des processeurs incompatibles Cette section
211. test par le BIOS avant la copie du code BIOS de la m moire ROM vers la m moire DRAM 2 Apr s la sortie de la m moire DRAM le BIOS ex cute un test de m moire simple criture lecture de chaque emplacement sous la forme 55aa55aa 162 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Remarque Ce test de m moire n est effectu que si Quick Boot n est pas activ sur l cran Boot Settings Configuration Configuration des param tres d initialisation Si Quick Boot est activ le BIOS ne teste pas la m moire Reportez vous la section Modification des options du POST page 164 pour plus d informations Remarque tant donn que le serveur Sun Fire X4540 peut contenir jusqu 64 Go de m moire le test de m moire peut prendre plusieurs minutes Vous pouvez annuler l autotest de l allumage tout moment en appuyant sur n importe quelle touche 3 Le BIOS interroge les contr leurs de m moire pour identifier les erreurs de m moire corrigibles et non corrigibles puis il les consigne dans le processeur de service Redirection de la sortie de la console Utilisez les instructions suivantes pour acc der au processeur de service et rediriger la sortie de la console en vue de lire les codes POST du BIOS 1 Initialisez l utilitaire de configuration du BIOS en appuyant sur la touche F2 pendant que le syst me effectue l autotest de l allumage POST L cran du menu
212. tilitaire hd Le serveur Sun Fire X4500 prend en charge 48 disques SATA internes Une carte physique de ces disques est situ e sur l tiquette du ch ssis du serveur Sun Fire X4500 L utilitaire hd est inclus dans le package SUNWhd et est pr install sur votre serveur L utilitaire hd est un utilitaire de disque dur pour les syst mes x64 comme le serveur Sun Fire X4500 Il sert d finir le mappage entre les p riph riques logiques et physiques du serveur Sun Fire X4500 Il est recommand d avoir une bonne connaissance de ce mappage pour administrer le syst me g rer les disques durs et d panner le serveur La sortie de l utilitaire hd permet d identifier visuellement tous les disques en fonction de la topologie physique des disques du serveur Sun Fire X4500 en fournissant une carte d identification des disques durs cod e en couleur La sortie de l utilitaire vous donne une carte d identification physique tel tel des disques du serveur Sun Fire X4500 L utilitaire hd comprend les fonctions suivantes a il analyse et affiche tous les p riph riques de stockage disponibles sur le syst me a il fournit une carte d identification des disques durs cod e en couleur a il effectue une analyse distance 89 Cet utilitaire comporte un mode de couleur ex cutable qui vous aide distinguer le statut d un disque dur C est un outil compl mentaire aux programmes d administration de configuration et de maintenance de disque
213. tion de serveur hors bande Le syst me d exploitation n est pas charg du transport des donn es de statut du syst me 137 Votre processeur de service Sun Fire X4540 est compatible avec IPMI v2 0 Vous pouvez acc der la fonctionnalit IPMI via la ligne de commande de l utilitaire IPMItool intrabande ou hors bande En outre vous pouvez g n rer un d routement IPMI depuis l interface Web ou g rer les fonctions IPMI du serveur depuis n importe quelle solution de gestion externe qui est compatible avec IPMI v1 5 ou v2 0 Pour plus d informations sur les sp cifications de IPMI v2 0 allez sur le site http www intel com design servers ipmi spec htm spec2 propos d IPMItool IPMItool est une interface de ligne de commande simple utilis e pour g rer des p riph riques compatibles IPMI Cet utilitaire vous permet d effectuer des fonctions IPMI avec un pilote de p riph rique de noyau ou sur une interface LAN IPMitool vous permet de g rer les composants mat riels du syst me de surveiller l int grit du syst me et de surveiller et de g rer des environnements syst me ind pendants du syst me d exploitation IPMItool est inclus sur le CD Tools and Drivers Outils et pilotes du serveur Sun Fire X4540 705 1438 Rep rez IPMltool et sa documentation associ e sur le CD Tools and Drivers du serveur Sun Fire X4540 ou t l chargez cet outil l adresse suivante http ipmitool sourceforge net Page de manuel d
214. tion de la CPU pour initialisation du syst me d exploitation par copie de tout le contexte du BSP vers tous les processeurs d applications pr sents REMARQUE les AP restent dans l tat CLI HLT 61 70 Erreur OEM POST Cette plage est r serv e aux fabricants de chipsets et de syst mes L erreur associ e cette valeur peut varier en fonction de la plate forme 50 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 ANNEXE C DEL de statut Cette annexe contient des informations sur l emplacement et le comportement des DEL de statut et de panne du serveur Cette annexe d crit les DEL externes qui se trouvent l ext rieur du serveur et les DEL internes qui ne sont visibles que lorsque les capots des composants le capot du disque dur le capot du contr leur de syst me et le capot du ventilateur sont retir s Cette annexe comprend les l ments suivants DEL de statut externes page 51 Fonctions contr les et indicateurs ext rieurs page 52 DEL de statut internes page 56 DEL de statut externes Consultez les figures et les tableaux suivants pour en savoir plus sur les DEL qui sont visibles l ext rieur du serveur La FIGURE C 1 d crit le panneau avant La FIGURE C 2 et le TABLEAU C 1 d crivent les DEL du panneau avant et les DEL de contr le Le TABLEAU C 2 et le TABLEAU C 2 d crivent le panneau arri re La FIGURE C 6 d crit l emplacement des DEL et des bouto
215. tionne correctement et si la somme de contr le CMOS est correcte V rification manuelle de la somme de contr le CMOS par lecture de la zone de stockage Si la somme de contr le CMOS est incorrecte mise jour CMOS avec les valeurs par d faut de la mise sous tension et effacement des mots de passe Initialisation du registre de statut A Initialisation des variables de donn es bas es sur les questions de configuration CMOS Initialisation des deux PIC compatibles 8259 dans le syst me Initialisation du mat riel de contr le des interruptions PIC g n ralement et du tableau des vecteurs d interruption Test L E sur le registre comptable CH 2 Initialisation de CH 0 comme minuteur syst me Installation du gestionnaire POSTINT1Ch Activation d IRQ 0 dans PIC pour interruption du minuteur syst me D routement du vecteur INT1Ch vers POSTINTIChHandlerBlock D but anticip de l initialisation CPU D sactivation du cache Initialisation APIC local Configuration des informations du processeur d initialisation Configuration du processeur d initialisation pour POST Cela inclut le calcul de fr quence le chargement du microcode BSP et l application de la valeur demand e par l utilisateur pour la question de configuration de signalisation d erreur GART Application au BSP des corrections des errata 78 amp 110 num ration et configuration des processeurs d applications Inclut le chargement du microcode et les corrections
216. touche ENTR E du terminal pour tablir une connexion entre ce terminal et le processeur de service ILOM Remarque Si vous vous connectez au port s rie du processeur de service avant sa mise sous tension ou pendant sa s quence de mise sous tension des messages d initialisation s affichent Le processeur de service affiche ventuellement une invite de connexion Par exemple SUNSP0003BA84D777 login La premi re cha ne de l invite est le nom d h te par d faut du processeur de service ILOM Il est compos du pr fixe SUNSP et de l adresse MAC unique du processeur de service ILOM L adresse MAC de chaque processeur de service ILOM est unique 3 Connectez vous au processeur de service et tapez le nom d utilisateur par d faut root et le mot de passe par d faut changeme Une fois que vous tes connect au processeur de service il affiche l invite de commande par d faut gt 4 Pour lancer la console s rie tapez les commandes suivantes cd SP console start 5 V rifiez que vous tes connect au processeur de service a Si vous n avez pas pu vous connecter au processeur de service il peut y avoir un probl me avec la carte GRASP Graphics Redirect and Service Processor Remplacez cette carte puis r p tez l tape 1 l tape 4 Reportez vous au Sun Fire X4500 Server Service Manual Manuel d entretien du serveur Sun Fire X4500 819 4359 pour obtenir des instructions Guide de diagnosti
217. tre 2 Utilisation du logiciel de diagnostic SunVTS 17 m Le journal d erreur de noyau SunVTS contient les erreurs de sonde et de noyau SunVTS horodat es Les erreurs de noyau SunVTS sont li es l ex cution de SunVTS et non aux tests des p riph riques Le nom du chemin du fichier journal est var opt SUNWvts logs vtsk err Ce fichier n est cr que lorsque SunVTS signale une erreur de noyau SunVTS m Le journal d informations SunVTS contient les messages d informations g n r s lorsque vous lancez et arr tez les sessions de test SunVTS Le nom du chemin du fichier journal est var opt SUNWvts logs sunvts info Ce fichier n est cr que lorsqu une session de test SunVTS est ex cut e a Le journal de message du syst me Solaris est un journal de tous les v nements Solaris g n raux consign s par syslogd Le nom du chemin du fichier journal est var adm messages a Cliquez sur le bouton Log Journal La fen tre Log file Fichier journal s affiche b Dans cette fen tre s lectionnez le fichier journal que vous voulez afficher Le contenu du fichier journal s lectionn s affiche dans la fen tre c Les trois boutons du bas vous permettent d effectuer les op rations suivantes a Imprimer le fichier journal une bo te de dialogue vous permet de sp cifier les options et le nom de l imprimante a Supprimer le fichier journal le fichier ouvert reste affich mais vous ne pourrez plus l afficher une fois ferm
218. tt SpE App Fr Fe 12 13 14 15 16 17 18 19 20 21 COL C Ot5 CHEL C565 COEL CES C7EL C7ES CLEL CLES Mt pE Spt SFF tt SFe Spp Ne x rg 0 l 2 3 4 5 6 LE 8 9 c6t0 c6t4 CSEO c5t4 c8t0 c8t4 c7t0 c7t4 citO cita D p tt p FER Tpk FRE FRE ge pg Sun Fire X4500 Server Front 46 47 cOt3 cOt7 tt pt 34 35 cOt2 cOt6 22 23 otl cOt5 Spt Pa 10 ils coto cOt4a npt Spt Annexe F Utilitaire ha 91 Options et param tres de la commande hd L utilitaire hd fait la distinction entre les contr leurs les emplacements et les p riph riques de stockage qui sont physiquement pr sents dans le syst me et visibles par Solaris La commande hd fournit les informations de configuration et de statut sur les disques durs du serveur Sun Fire X4500 l aide d options et de param tres sp cifiques de la commande Ces options et param tres peuvent tre combin s pour afficher les informations de votre choix Certaines des options disponibles comprennent l affichage du mode de couleur c du r capitulatif s du diagnostic d l identification du type de plate forme p et l obtention de messages d aide sur la configuration et le statut h L EXEMPLE DE CODE F 2 montre une liste compl te des commandes de l utilitaire hd Page de manuel hd EXEMPLE DE CODE F 2 Exemple de page de manuel de l utilitaire hd c olor mode s ummary pilatform
219. uh NMI received for unknown reason 2d on CPU 1 Aug 5 05 15 00 d mpk12 53 159 kernel Dazed and confused but trying to continue 66 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 Aug 5 05 15 00 d mpk12 53 159 kernel power saving mode enabled Aug 5 05 15 00 d mpk12 53 159 kernel for unknown reason 3d on CPU 1 Aug 5 05 15 00 d mpk12 53 159 kernel but trying to continue Aug 5 05 15 00 d mpk12 53 159 kernel power saving mode enabled Aug 5 05 15 00 d mpk12 53 159 kernel for unknown reason 3d on CPU 0 Aug 5 05 15 00 d mpk12 53 159 kernel but trying to conti nue Aug 5 05 15 00 d mpk12 53 159 kernel power saving mode e Aug 5 05 15 00 d mpk12 53 159 kernel but trying to conti nabled nue Aug 5 05 15 00 d mpk12 53 159 kernel power saving mode e nabled Do you Uhhuh Dazed Do you Uhhuh Dazed Do you Dazed Do you have a strange NMI received and confused have a strange NMI received and confused have a strange and confused have a strange Gestion des erreurs syst me SERR Cette section r pertorie quelques faits et consid rations sur la fa on dont le serveur g re les erreurs syst me SERR a La gestion d erreur syst me se fait via le m canisme HyperTransport Synch Flood Error sur 8111 et 8131 m Les v nements suivants se produisent lors du test POST du BIOS a POST consigne toutes les erreurs
220. umping Sensor Data Repository to galaxy sdr Une fois le fichier cache g n r il peut tre fourni lors d ex cutions futures d IPMltool avec l option s Par exemple ipmitool I lanplus H lt IPADDR gt U root P changeme S galaxy sdr sel elist 28 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 100 Pre Init Time stamp Entity Presence psl prsnt Device Absent 200 Pre Init Time stamp Entity Presence io f0 prsnt Device Absent 300 Pre Init Time stamp Power Supply ps0 vinok State Asserted Num ros et noms de capteurs dans les v nements SEL En fonction de la commande IPMI que vous utilisez le num ro de capteur affich pour un v nement peut appara tre dans des formats l g rement diff rents Consultez les exemples suivants a Le num ro du capteur ps1 prsnt alimentation lectrique 1 pr sente peut appara tre au format 1Fh ou Ox1F m 38h est quivalent 0x38 m 4Bh est quivalent 0x4B La sortie de certaines commandes peut ne pas afficher le nom du capteur avec le num ro de capteur correspondant Pour voir tous les noms de capteurs dans le serveur et les num ros de capteurs correspondants vous pouvez utiliser la commande suivante ipmitool H 129 144 82 21 U root P changeme sdr elist sys id 00h ok 23 0 State Asserted sys intsw oih ok 23 0 sys psfail 02h ok 23 0 Predictive Failure Asserted Dans l exemple de sortie ci dessus l
221. ur l cran du menu principal du BIOS s lectionnez Advanced Avanc L cran Advanced Settings Param tres avanc s s affiche Reportez vous la FIGURE B 1 b Sur l cran Advanced Settings Param tres avanc s s lectionnez IPMI 2 0 Configuration Configuration IPMI 2 0 L cran IPMI 2 0 Configuration Configuration IPMI 2 0 du menu Advanced Avanc s affiche FIGURE B 3 cran de configuration IPMI 2 0 du menu Advanced Avanc du BIOS Advanced kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk IPMI 2 0 Configuration View all events in the k kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkx BMC Event Log Status Of BMC Working x View BMC System Event Log It will take up to Reload BMC System Event Log 60 Seconds approx Clear BMC System Event Log to read all LAN Configuration BMC SEL records PEF Configuration BMC Watch Dog Timer Action Disabled koek Select Screen kk Select Item Enter Go to Sub Screen F1 General Help F10 Save and Exit ESC Exit kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkS c Sur l cran IPMI 2 0 Configuration Configuration IPMI 2 0 s lectionnez View BMC System Event Log Afficher journal SEL du BMO Le journal se g n re en 60 secondes environ puis il s affiche l cran 5 Si le probl me av
222. ur l un des liens HyperTransport la machine se Journal SEL HyperTransport r initialise et les informations d erreur du processeur sont conserv es apr s la r initialisation de service Le BIOS consigne A Hyper Transport sync flood error occurred on last boot press F1 to continue Une erreur Hyper Transport sync flood s est produite lors du dernier d marrage appuyez sur F1 pour continuer PCI SERR Erreur syst me ou de Un Sync floods se produit sur les Journal DMI Fatale PERR parit sur un bus PCI HyperTransport la machine se Journal SEL r initialise et les informations d erreur du processeur sont conserv es apr s la r initialisation de service Le BIOS consigne A Hyper Transport sync flood error occurred on last boot press F1 to continue Une erreur Hyper Transport sync flood s est produite lors du dernier d marrage appuyez sur F1 pour continuer Erreur de Le BIOS ne trouve Le BIOS affiche un message d erreur Journal DMI Non fatale microcode lors pas ou ne peut pas consigne l erreur dans DMI et d marre de l autotest de charger la mise allumage du jour du microcode BIOS CPU dans la CPU Ce message est susceptible d appara tre lorsqu une nouvelle CPU est install e sur un contr leur syst me avec un BIOS ancien Dans ce cas le BIOS doit tre mis jour Somme de La v rification de la Le BIOS affiche un message d erreur Journal DMI Non fatale contr le CMOS somme de contr le consigne l erreur dans DMI
223. ur ne se met pas sous tension 1 V rifiez que les cordons d alimentation CA sont correctement fix s aux sources d alimentation du serveur et aux sources de courant alternatif Utilisez les serre c bles pour vous assurer que les cordons d alimentation CA sont fix s aux sources d alimentation du serveur 2 V rifiez que les capots des composants sont correctement install s capot d acc s au disque dur capot du contr leur de syst me et capot d acc s au ventilateur Un commutateur d intrusion sur le contr leur de syst me teint le serveur lorsque le capot d acc s au disque dur est retir 3 Recherchez les conditions suivantes qui peuvent d clencher une s quence d arr t automatique Une s quence de mise hors tension est provoqu e par une demande du Board Management Controller BMC ou d une erreur Les conditions qui d clenchent l mission d une demande d arr t par le BMC sont a Une condition de surchauffe pendant plus d une seconde a Plusieurs pannes du ventilateur Les erreurs qui d clenchent un arr t sont a Toutes les sources d alimentation ont chou ou ont t retir es a Une source d alimentation n a plus t sp cifi e pendant plus de 100 millisecondes Le circuit permutable chaud a chou a Une condition de surchauffe s est produite Remarque Une source d alimentation qui n a plus t sp cifi e provoque une r initialisation mais seules les sources
224. us les capteurs une interrogation de capteurs sp cifiques qui renvoie des informations d taill es les concernant Lecture de tous les capteurs Pour afficher une liste de tous les capteurs dans les serveurs et leur statut utilisez la commande sdr list sans arguments Cette commande renvoie un tableau avec tous les capteurs du serveur et leur statut Les cinq champs des lignes de sortie de gauche droite sont 1 L ID du capteur IPMI 16 caract res maximum Le num ro du capteur IPMI Le statut du capteur indiquant les seuils qui ont t d pass s L ID et l instance de l entit JL 2 E La lecture de capteur Par exemple fp t_amb oah ok 12 0 22 degrees C Annexe A Utilisation d IPMitool pour afficher les informations syst me 23 Lecture de capteurs sp cifiques Vous pouvez affiner la sortie pour ne voir que des capteurs sp cifiques en param trant la commande sdr list avec un argument facultatif pour limiter la sortie des capteurs d un type particulier La sortie par d faut est une longue liste de capteurs Le TABLEAU A 1 d crit les arguments de capteur disponibles TABLEAU A 1 Arguments de capteur IPMltool Argument Description Capteurs all Tous les enregistrements Tous les capteurs de capteur full Enregistrements de Capteurs de temp rature de tension et de capteur complets ventilateur compact Enregistrements de Digital Discrete num rique discret capteurs capteur compacts de pan
225. voir consult les informations sur les lectures du capteur passez la section Ex cution de tests de diagnostic l aide de SunVTS page 154 136 Guide de diagnostic des serveurs Sun Fire X4500 X4540 Juillet 2008 CHAPITRE 4 Utilisation d IPMItool pour afficher les informations syst me Ce chapitre contient des informations sur l utilisation de l Intelligent Platform Management Interface IPMI pour afficher des informations de surveillance et de maintenance relatives votre serveur Ce chapitre aborde les sections suivantes propos d IPMI page 137 propos d IPMltool page 138 m Connexion au serveur avec IPMltool page 138 m Utilisation d IPMltool pour lire les capteurs page 140 m Utilisation d IPMltool pour afficher le journal SEL System Event Log du processeur de service ILOM page 143 m Affichage des informations sur les composants avec IPMitool page 147 m Affichage et r glage des DEL de statut page 148 propos d IPMI IPMI est une interface de gestion de mat riel ouverte et standard qui permet aux syst mes embarqu s de communiquer Les informations d IPMI sont chang es sur des BMC Baseboard Management Controller qui sont situ s sur des composants mat riels compatibles avec IPMI L utilisation de l intelligence mat rielle de bas niveau au lieu du syst me d exploitation a deux avantages principaux cette configuration permet une ges
226. z les d pendances de version sp cialement avec les logiciels tiers Si le probl me n est pas vident passez la section suivante D pannage des probl mes d alimentation page 106 Chapitre 1 Inspection initiale du serveur 105 D pannage des probl mes d alimentation Effectuez l une des op rations suivantes Si le serveur peut tre mis sous tension passez la section suivante Inspection externe du serveur page 107 Si le serveur ne peut pas tre mis sous tension effectuez la proc dure suivante V rifiez que les cordons d alimentation CA sont correctement fix s aux sources d alimentation du serveur et aux sources de courant alternatif Utilisez les serre c bles pour vous assurer que les cordons d alimentation CA sont fix s aux sources d alimentation du serveur La FIGURE 1 3 montre les cordons d alimentation CA sur le panneau arri re V rifiez que les capots du serveur y compris le capot d acc s au disque dur le capot du contr leur de syst me et le capot d acc s au ventilateur sont correctement install s Reportez vous aux tiquettes sur les capots Un commutateur d intrusion sur le contr leur de syst me teint le serveur lorsque le capot d acc s au disque dur est retir Recherchez les conditions qui peuvent d clencher une s quence d arr t automatique Une s quence de mise hors tension est provoqu e par une demande de l un des l ments suivants a Le Bo

Download Pdf Manuals

image

Related Search

Related Contents

  

Copyright © All rights reserved.
DMCA: DMCA_mwitty#outlook.com.