Home
Guide de diagnostic des serveurs Sun Fire X4140, X4240 et X4440
Contents
1. Chapitre 3 D pannage des probl mes DIMM 13 Les lignes de l affichage indiquent d abord le num ro des v nements format hexad cimal suivi d une description de l v nement Le TABLEAU 3 1 d crit le contenu de l affichage TABLEAU 3 1 Lignes de la sortie IPMI v nement format hexad cimal Description 8 Une erreur non corrigible a provoqu un Hypertransport sync flood qui a provoqu la r initialisation chaud du syst me 0x02 se r f re au num ro de r initialisation mis jour depuis la derni re mise hors tension du syst me 9 Le BIOS a d tect et initialis 4 processeurs dans le syst me a Le BIOS a d tect un Sync Flood caus par cette r initialisation b Le BIOS a d tect une erreur de mat riel caus e par le Sync Flood cale Le BIOS a extrait et consign des informations sur l erreur de mat riel y compris les registres d erreurs machine v nements 14 18 de tous les processeurs 1f Lorsque le BIOS d tecte qu une erreur non corrigible s est produite il localise le module DIMM et effectue une r initialisation 0x03 correspond au num ro de la r initialisation 21 25 Le BIOS a mis les modules DIMM d fectueux hors service dans l espace de m moire syst me et les a consign s Chaque module DIMM d une paire est consign car les informations sur l erreur de mat riel non corrigible ne donnent pas plus d indications au BIOS que la d tection
2. a Aucun v nement SEL ni DMI n est enregistr m Le syst me se met en mode d arr t et affiche le message suivant kee Warning Bad Mix of Processors xkxxxxxx Multiple core processors cannot be installed with single core processors Fatal Error System Halted Annexe E Traitement des erreurs 89 Synth se du traitement des erreurs de mat riel Le TABLEAU E 1 r capitule les erreurs de mat riel les plus fr quentes que vous pouvez rencontrer avec ces serveurs TABLEAU E 1 Synth se du traitement des erreurs de mat riel Erreur Description Consign e journal DMI ou journal SEL du processeur Traitement de service Fatale D faillance du processeur de service D faillance du processeur de service Le processeur de service ne s initialise pas lorsque le syst me est aliment Le processeur de service est r initialis mais l autotest la mise sous tension choue Le processeur de service contr le la Non consign e Fatale r initialisation du syst me le syst me peut tre mis sous tension mais il ne quitte pas la phase de r initialisation e Lors de la mise sous tension le chargeur de d marrage du processeur de service allume la diode d alimentation Pendant la r initialisation du processeur de service le d marrage de Linux et la v rification de la sant du processeur de service la diode d alimentation clignote e L
3. 38 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Diodes du disque dur FIGURE B 3 Diodes du disque dur L gende de la figure 1 Diode Ready to remove retrait autoris bleue action de maintenance n cessaire 2 Diode d erreur orange action de maintenance n cessaire 3 Diode d tat verte clignote lorsque des donn es sont transf r es Diodes d tat internes Le serveur comprend des diodes d tat internes sur la carte m re et sur la carte mezzanine Pour conna tre l emplacement des diodes sur la carte m re reportez vous la FIGURE B 4 Pour conna tre l emplacement des diodes sur la carte mezzanine reportez vous la FIGURE B 5 m Les diodes d erreur des DIMM indiquent un probl me sur le module DIMM correspondant Elles se situent pr s des leviers d jection des modules DIMM Lorsque vous appuyez sur le bouton Press to See Fault Appuyer pour afficher l erreur s il existe un probl me de DIMM la diode d erreur du module DIMM correspondant clignote Reportez vous la section Diodes d erreur des DIMM page 16 pour plus d informations m Les diodes d erreur des CPU indiquent un probl me sur la CPU correspondante En cas de probl me li une CPU la diode d erreur correspondante clignote lorsque vous appuyez sur le bouton Press to See Fault Appuyer pour afficher l erreur Annexe B Diodes d tat 39 Remarque Les diodes d erreur des DI
4. Advanced KKK KKK KKK KKK KKK KK KKK KKK KKK KKK KK KKK KK KKK KKK KKK KKK KEKE KKK KK KKK KKK KKK KKK KEK KEK KKK KKKE Event Logging details View all unread events KKK KK KKK KEKE KKK KKK KKK KKK KKK KKK KKK KKK KEK KKK KKK KKKKKKKKEK OK on the Event Log View Event Log ark all events as read Clear Event Log x Select Screen x ORR Select Item Enter Go to Sub Screen F1 General Help F10 Save and Exit ESC Exit KEKE KKK K KKK KKK KEK KEK KEKE KEK KKK KEKE K KKK KKK KKK RK KKK KKK KKK KEK KEK KKK KKK KKK KEK KK KKKEKKEKEKKEKEKEK v02 61 C Copyright 1985 2006 American Megatrends Inc c Dans l cran Event Logging Details D tails de la consignation d v nements s lectionnez View Event Log Afficher journal des v nements Tous les v nements non lus s affichent 4 Affichez le journal des v nements syst me du BMC a Dans l cran du menu principal du BIOS s lectionnez Advanced Avanc L cran Advanced Settings Param tres avanc s s affiche Reportez vous la FIGURE A 1 Annexe Journaux des v nements et codes d autotest la mise sous tension POST 23 b Dans l cran Advanced Settings Param tres avanc s s lectionnez IPMI 2 0 Configuration Configuration IPMI 2 0 L cran IPMI 2 0 Configuration du menu Advanced s affiche
5. a Entrez l adresse IP du processeur de service dans votre navigateur Web L cran Sun Integrated Lights Out Manager Login Connexion ILOM s affiche b Saisissez votre nom d utilisateur et votre mot de passe Lorsque vous tentez d acc der pour la premi re fois au processeur de service ILOM vous tes invit taper le nom utilisateur et le mot de passe par d faut Ce nom d utilisateur et le mot de passe par d faut sont les suivants Nom d utilisateur par d faut root Mot de passe par d faut changeme Annexe C Utilisation de l interface utilisateur graphique du processeur de service ILOM pour afficher les informations syst me 51 2 Dans l onglet System Monitoring Surveillance du syst me choisissez Sensor Readings Valeurs des capteurs La page Sensor Readings Valeurs des capteurs s affiche Reportez vous la FIGURE C 3 FIGURE C 3 Page Sensor Readings Valeurs de capteurs dministrator roo 3P me SU 00144F8D2DB7 Sun Integrated Lights Out Manager System Monitoring i Sensor Readings Indicators Event Logs Sensor Readings View readings for system sensors Click on a sensor name for more information including threshold values Sensor Readings Name Type Reading SYS MB POPRSNT Entity Presence Present ISYS MB PO T_CORE Temperature 16 000 degrees C ISYS MB POM_VDDCORE Voltage 1 140 Volts ISYS MBIPOM_ 1V8 Voltage 1 836 Volts ISYS MBIPOMV_ 0V9 Voltage 0 912 Vol
6. 40 D tection des diff rentes unit s ports parall les ports s rie et coprocesseurs dans la CPU etc install es correctement dans le syst me et mise jour de BDA EBDA etc 50 Programmation du trou de m moire ou de toute mise en uvre n cessitant un ajustement en taille de RAM syst me si n cessaire 52 Mise jour de la taille de la m moire CMOS partir de la m moire d tect e dans le test de m moire Allocation de m moire pour la zone Extended BIOS Data Area partir de la m moire de base 60 Initialisation de l tat NUM LOCK et programmation de la vitesse de r p tition du clavier 75 Initialisation de Int 13 et pr paration de la d tection IPL 78 Initialisation des unit s IPL contr l es par le BIOS et des ROM en option 7A Initialisation des ROM en option restantes 7C G n ration et criture du contenu de ESCD dans la m moire NVRam 84 Consignation des erreurs d tect es lors du test POST 85 Affiche des erreurs l intention de l utilisateur et demande celui ci de r pondre 87 Ex cution du programme de configuration du BIOS si n cessaire demand e 8C Une fois l initialisation de toutes les unit s termin e programmation des param tres s lectionnables par l utilisateur associ s NB SB tels que les param tres de synchronisation les r gions ne pouvant pas tre mises en cache et la possibilit de mise en m moire vive fant me et ex cution des op rations de programmation OEM NB S
7. si une erreur de test SunVTS se produit Chapitre 2 Utilisation du logiciel de diagnostic SunVTS 9 m Le journal d erreurs de noyau SunVTS contient les erreurs de sondage et de noyau SunVTS horodat es Les erreurs de noyau SunVTS sont li es l ex cution de SunVTS et non aux p riph riques test s Ce fichier journal se situe l emplacement var opt SUNWvts logs vtsk err Ce fichier est uniquement cr si une erreur de noyau SunVTS se produit m Le journal d informations SunVTS contient les messages d information g n r s chaque fois que vous lancez et arr tez les sessions de test SunVTS Ce fichier journal se situe l emplacement var opt SUNWvts logs sunvts info Ce fichier est uniquement cr lorsqu une session de test SunVTS est ex cut e m Le journal de messages du syst me Solaris est un fichier journal de tous les v nements Solaris g n raux consign s par syslogd Ce fichier journal se situe l emplacement var adm messages a Cliquez sur le bouton Log Journal La fen tre Log file Fichier journal s affiche b Dans cette fen tre s lectionnez le fichier journal que vous voulez consulter Le contenu du fichier journal s lectionn s affiche dans la fen tre c Les trois boutons du bas vous permettent d effectuer les op rations suivantes a Imprimer le fichier journal une bo te de dialogue vous permet d indiquer les options et le nom de l imprimante a Supprimer le fichier journal le f
8. Remarque tant donn que le serveur peut contenir jusqu 64 Mo de m moire 128 Mo pour le serveur X4440 le test de m moire peut prendre plusieurs minutes Vous pouvez annuler l autotest la mise sous tension tout moment en appuyant sur une touche quelconque 3 Le BIOS interroge les contr leurs de m moire pour identifier les erreurs qui peuvent tre corrig es et celles qui ne peuvent pas l tre puis il consigne les erreurs dans le processeur de service Annexe Journaux des v nements et codes d autotest la mise sous tension POST 25 Redirection de la sortie de la console Proc dez comme suit pour acc der au processeur de service et rediriger la sortie de la console en vue de lire les codes POST du BIOS 1 Initialisez l utilitaire de configuration du BIOS en appuyant sur la touche F2 pendant que le syst me effectue le test la mise sous tension POST L cran du menu principal du BIOS s affiche S lectionnez l onglet Advanced Avanc L cran Advanced Settings Param tres avanc s s affiche S lectionnez IPMI 2 0 Configuration Configuration IPMI 2 0 L cran IPMI 2 0 Configuration s affiche S lectionnez LAN Configuration Configuration du LAN L cran LAN Configuration indique l adresse IP du processeur de service Pour configurer l adresse IP du processeur de service facultatif a S lectionnez l option IP Assignment Affectation d adresse IP utiliser DHCP ou
9. a L autotest la mise sous tension POST indique les erreurs syst me pr c dentes au bas de l cran Reportez vous la FIGURE E 4 pour voir un exemple FIGURE E 4 cran de journal POST erreur syst me pr c dente i SS American AYA microsystems www ami com MC Firmware Revision 1 00 hecking NURAM Initializing USB Controllers Done Press F2 to run Setup CTRL E on Remote Keyboard Press F12 to boot from the network CTRL N on Remote Keyboard ISB Device s 3 Keyboards 3 Mice 2 Storage Devices Auto Detecting Pri Master ATAPI CDROM Pri Master DU 28SL 1 04 Ultra DMA Mode 2 uto detecting USB Mass Storage Devices Device 01 AMI Virtual CDROM Device 02 AMI Virtual Floppy J2 USB mass storage devices found and configured 0085 BMC Responding 1 Hyper Transport sync flood error occurred on last boot PCI System Error Annexe E Traitement des erreurs 87 a Les erreurs SERR et Hypertransport Sync Flood sont consign es dans le journal DMI et dans le journal SEL du processeur de service Reportez vous a l exemple de sortie suivant SEL Record ID 0a00 Record Type 00 Timestamp 08 10 2005 06 05 32 Generator ID 0001 EvM Revision 04 Sensor Type Critical Interrupt Sensor Number 00 Event Type Sensor specific Discrete Event Direction Assertion Event Event Data OSLEEL Description PCI SERR m La FIGUREE 5 montre un exemple d cran de journal DMI de la page d
10. 2006 American Megatrends Inc 28 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 3 S lectionnez Boot Settings Configuration Configuration des param tres d initialisation L cran Boot Settings Configuration s affiche x Boot KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KK KKKKKEKE LES Boot Settings Configuration KREKKKKKKKE KKK KKK KKK KEKE KKK KEK KKK KKK KKK KKK KE KKKEKKKKKKKKK OK certain tests while Quick Boot Disabled Quiet Boot Disabled AddOn ROM Display Mode Force BIOS Bootup Num Lock On Wait For F1l If Error Disabled Interrupt 19 Capture Enabled ie Allows BIOS to skip booting This will decrease the tim needed to boot the system Select Screen ak Select Item pH Change Option F1 General Help F10 Save and Exit ESC Exit kkkxkxkxkxkxkkkxkxkxkxkkkxkxkxkkkkxkxkkkkkkxkkkkxkxkxkkkkkkxkkkkkkxkkkkkkkkkkkxkkkkkkkkkkkxkkkkkkkxkxk k k v02 61 C Copyright 1985 2006 American Megatrends Inc Annexe A Journaux des v nements et codes d autotest la mise sous tension POST 29 4 L cran Boot Settings Configuration contient des options que vous pouvez activer ou d sactiver Quick Boot Initialisation rapide cette option est d sactiv e par d faut Si vous l activez le BIO
11. 38 39 Documentation connexe x E Emplacement du bouton d alimentation 5 Emplacements ports et diodes illustration 38 39 Erreurs corrigibles gestion 82 Erreurs de parit traitement 85 Erreurs non corrigibles gestion 79 Erreurs syst me gestion 87 Erreurs DIMM 16 Externe Inspection 3 Externes Diodes 37 G G n ral Instructions de d pannage 2 Gestion des erreurs Erreurs de parit 85 Index 1 H Horodatages dans le journal SEL du processeur de service ILOM 48 l Illustration des ports emplacements et diodes 38 39 ILOM interface graphique Affichage de l inventaire des composants 49 Affichage des capteurs 51 Affichage du journal des v nements du processeur de service 45 Connexion s rie 44 Horodatages 48 Informations g n rales 43 Inspection externe 3 Inspection interne 4 Instructions de d pannage 2 Instructions de s curit ix Integrated Lights Out Manager Service Processor voir ILOM interface graphique Interne Inspection 4 Inventaire des composants Affichage l aide de l interface du processeur de service ILOM 49 Inventaire des unit s rempla ables sur site Affichage l aide de l interface du processeur de service ILOM 49 Isolation des erreurs ECC DIMM 18 J Journal des v nements du processeur de service Affichage l aide de l interface du processeur de service ILOM 45 Journal SEL du processeur de service Horodatages 48 Journaux des v nements BIO
12. Advanced KKK KKK KKK KKK KKK KK KKK KKK KK KKK KKK KKK KKK KKK KKK KK KKK KKK KKK KEK KK KEK KEK KEK KKK KKK KK KKKKEKE IPMI 2 0 Configuration View all events in the KKK KKK KK KEK KKK KKK KK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKKKKK OK BMC Event Log Status Of BMC Working View BMC System Event Log Tt will take up to Reload BMC System Event Log 60 Seconds approx Clear BMC System Event Log to read all LAN Configuration BMC SEL records PEF Configuration BMC Watch Dog Timer Action Disabled K Select Screen HER Select Item j Enter Go to Sub Screen F1 General Help Le F10 Save and Exit i ESC Exit KEKE KEK KKK KKK KKK KKK KKK KEKE KKK KKK KEK KKK KKK KEK KKK KEKE KKK KEKE KKK KKK KKK KEK KKK KE KKK KKEKEKEK v02 61 C Copyright 1985 2006 American Megatrends Inc 24 c Dans l cran IPMI 2 0 Configuration s lectionnez View BMC System Event Log Afficher journal des v nements syst me du BMC Au bout d environ 60 secondes le journal s affiche l cran 5 Si le probl me de serveur n est pas vident passez la section Utilisation de l interface utilisateur graphique du processeur de service ILOM pour afficher les informations syst me page 43 ou Affichage des journaux des v nements du processeur de service ILOM page 45 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Test a la mise sous tens
13. Description Consign e journal DMI ou journal SEL du processeur de service Traitement Fatale chec de liaison HyperTransport PCI SERR PERR Erreur de microcode POST BIOS Erreur CRC ou de liaison li e 4 une liaison Hypertransport Erreur systeme ou de parit sur un bus PCI Le BIOS n a pas d tect ni charg la mise a jour du microcode CPU dans la CPU Ce message est susceptible d appara tre lorsqu une nouvelle CPU est install e sur une carte m re avec un BIOS ancien Dans ce cas vous devez mettre jour le BIOS Un Sync Flood se produit sur les Fatale liaisons HyperTransport l ordinateur s auto r initialise et les informations d erreur sont conserv es apr s l initialisation Journal DMI Journal SEL du processeur de service Le BIOS affiche le message A Hyper Transport sync flood error occurred on last boot press F1 to continue Une erreur de type HyperTransport Sync Flood s est produite lors de la derni re initialisation appuyez sur F1 pour continuer Journal DMI Fatale Journal SEL du processeur de service Un Sync Flood se produit sur les liaisons HyperTransport l ordinateur s auto r initialise et les informations d erreur sont conserv es apr s l initialisation Le BIOS affiche le message A Hyper Transport sync flood error occurred on last boot press F1 to continue Une erreur de type HyperTransport Sync Flood s est produite lors de la derni re ini
14. ILOM Integrated Lights Out Manager pour afficher des informations de surveillance et de maintenance relatives votre serveur m tablissement d une connexion s rie au processeur de service page 44 m Affichage des journaux des v nements du processeur de service ILOM page 45 m Affichage des informations sur les composants rempla ables page 49 m Affichage des capteurs page 51 Pour plus d informations sur l utilisation de l interface graphique du processeur de service ILOM pour effectuer les op rations de maintenance du serveur par exemple pour configurer les alertes reportez vous au manuel Integrated Lights Out Manager Administration Guide Guide d administration de Integrated Lights Out Manager m Si l un des journaux ou crans d informations indique une erreur DIMM reportez vous au Chapitre 3 m Si le probl me de serveur n est pas vident apr s avoir consult les journaux et les crans d informations du processeur de service ILOM reportez vous la section Ex cution de tests de diagnostic l aide de SunVTS page 7 43 44 Etablissement d une connexion s rie au processeur de service Pour tablir une connexion s rie au processeur de service 1 Connectez un cable s rie entre le port de gestion s rie RJ 45 du serveur et un terminal 2 Appuyez sur la touche Entr e du terminal pour tablir une connexion entre le terminal et le processeur de service ILOM Remar
15. INT1Ch vers POSTINT1ChHandlerBlock D but anticip de l initialisation CPU D sactivation du cache Initialisation APIC local Configuration des informations du processeur d initialisation Configuration du processeur d initialisation pour POST Cela inclut le calcul de fr quence le chargement du microcode BSP et l application de la valeur demand e par l utilisateur pour la question de configuration de signalisation d erreur GART Application au BSP des corrections des errata 78 amp 110 num ration et configuration des processeurs d applications Inclut le chargement du microcode et les corrections des errata 78 110 106 107 69 et 63 R activation du cache pour le processeur d initialisation et application dans le BSP des corrections des errata 106 107 69 et 63 si n cessaire En cas de modification d instructions CPU mixtes les erreurs sont recherch es et consign es et une fr quence appropri e pour toutes les CPU est recherch e et appliqu e REMARQUE les AP restent dans l tat CLI HLT Annexe Journaux des v nements et codes d autotest la mise sous tension POST 33 TABLEAU A 2 Points de contr le des codes POST suite Code POST Description C7 HT d finit les valeurs finales de fr quences et de largeurs de liaisons Cette routine est appel e apr s le calcul de la fr quence CPU pour viter les erreurs de programmation OA Initialisation du contr leur de clavier compatible
16. Le BIOS indique la m moire disponible en excluant la paire de DIMM d faillante 80 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 La FIGURE E 1 montre un exemple d cran de journal DMI de la page de configuration du BIOS FIGURE E 1 cran de journal DMI erreur non corrigible BIOS SETUP UTILITY Advanced Event Logging details View all unread events ee _ on the Event Log Mark all events as read Clear Event Log View Event Log 09 12 05 11 51 05 A Hyper Transport sync flood error occurred on last boot Enter Go to Sub Screen Fi General Help F10 Save and Exit ESC Exit v02 53 C Copyright 1985 2002 American Megatrends Inc Annexe E Traitement des erreurs 81 82 Traitement des erreurs corrigibles Cette section contient quelques faits et consid rations sur la fa on dont le serveur traite les erreurs corrigibles Lors de l autotest la mise sous tension du BIOS a Le BIOS interroge les registres MCK Le BIOS consigne les erreurs dans le journal DMI a Le BIOS consigne les erreurs dans le journal SEL du processeur de service l aide du BMC La fonction est d sactiv e la r initialisation du syst me d exploitation par d faut m Les versions de Linux suivantes indiquent un syndrome ECC et des erreurs de remplissage de m moire dans var 1og si le rep re de noyau mce est indiqu la r initialisation ou si mce est activ lors de la compilation ou de
17. Static Statique ii iii Si vous choisissez DHCP l adresse IP du serveur est extraite du serveur DHCP de votre r seau et s affiche dans le format suivant Current IP address in BMC XXX XXX XXX XXX Si vous choisissez Static pour affecter l adresse IP manuellement proc dez comme suit Entrez l adresse IP dans le champ IP Address Adresse IP Vous pouvez galement entrer le masque de sous r seau et les param tres par d faut de la passerelle dans leurs champs respectifs S lectionnez Commit Valider et appuyez sur Entr e pour valider les modifications S lectionnez Refresh Actualiser et appuyez sur Entr e pour voir les nouveaux param tres dans le champ Current IP address in BMC Adresse IP actuelle dans le contr leur BMC 26 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 10 11 12 D marrez un navigateur Web et tapez l adresse IP du processeur de service dans la zone d adresse du navigateur Lorsque vous y tes invit tapez un nom d utilisateur et un mot de passe comme suit m User Name root m Password changeme L cran principal de l interface Sun Integrated Lights Out s affiche Cliquez sur l onglet Remote Control Contr le distance Cliquez sur l onglet Redirection D finissez la palette de couleurs 6 ou 8 bits de la console de redirection Cliquez sur le bouton Start Redirection D marrer la redirection Lorsque vous y tes invit tapez
18. X4140 X4240 et X4440 Juin 2008 FIGURE 1 1 Panneau avant du serveur X4140 Bouton diode de rep rage e een Bouton d alimentation FIGURE 1 2 Panneau avant du serveur X4440 Bouton diode de rep rage FE Bouton d alimentation 2 Retirez le capot du serveur Pour plus d instructions sur le retrait du capot du serveur reportez vous au manuel d entretien de votre serveur 3 Inspectez les diodes d tat internes Celles ci peuvent indiquer un mauvais fonctionnement des composants Pour conna tre l emplacement des diodes et leur comportement reportez vous la section Diodes d tat internes page 39 Remarque Le serveur doit tre en mode d alimentation de secours pour que vous puissiez voir les diodes internes Maintenez le bouton de rep rage du panneau arri re enfonc pendant cinq secondes pour activer le mode de test qui allume toutes les autres diodes l int rieur et l ext rieur du ch ssis pendant 15 secondes 4 V rifiez que tous les composants sont fermement et correctement ins r s 5 V rifiez que tous les connecteurs des c bles l int rieur du syst me sont fermement et correctement reli s aux connecteurs appropri s Chapitre 1 Inspection initiale du serveur 5 6 10 V rifiez que tous les composants install s en option sont compatibles et pris en charge Pour obtenir une liste des cartes PCI et des modules DIMM pris en charge reportez vou
19. aires des missiles des armes biologiques et chimiques ou du nucl aire maritime directement ou indirectement sont strictement interdites Les exportations ou r exportations vers les pays sous embargo am ricain ou vers des entit s figurant sur les listes d exclusion d exportation am ricaines y compris mais de mani re non exhaustive la liste de personnes qui font l objet d un ordre de ne pas participer d une fa on directe ou indirecte aux exportations des produits ou des services qui sont r gis par la l gislation am ricaine sur le contr le des exportations et la liste de ressortissants sp cifiquement d sign s sont rigoureusement interdites L utilisation de pi ces d tach es ou d unit s centrales de remplacement est limit e aux r parations ou l change standard d unit s centrales pour les produits export s conform ment la l gislation am ricaine en mati re d exportation Sauf autorisation par les autorit s des tats Unis l utilisation d unit s centrales pour proc der des mises jour de produits est rigoureusement interdite Copyright 2008 Sun Microsystems Inc 4150 Network Circle Santa Clara California 95054 U S A All rights reserved Unpublished rights reserved under the Copyright Laws of the United States THIS PRODUCT CONTAINS CONFIDENTIAL INFORMATION AND TRADE SECRETS OF SUN MICROSYSTEMS INC USE DISCLOSURE OR REPRODUCTION IS PROHIBITED WITHOUT THE PRIOR EXPRESS WRITTEN PERMISSION O
20. ambiante est pass e d une sup rieure valeur non critique 4 une valeur normale non critique Action aucune Valeur Confirmation Oui La temp rature ambiante est sup rieure au sup rieure seuil critique critique Action la diode de surchauffe la diode de d faillance de la CPU X et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La temp rature ambiante est pass e d une sup rieure valeur critique une valeur non critique critique 64 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Pour tous les capteurs pX t_core Seuil Indication Ev nement Description Action la diode de surchauffe la diode de d faillance de la CPU X et la diode d alerte du syst me sont teintes Valeur Confirmation Oui La temp rature ambiante est sup rieure au sup rieure seuil irr cup rable irr cup rable Action la diode de surchauffe la diode de d faillance de la CPU X et la diode d alerte du syst me sont allum es et l alimentation syst me est mise hors tension Valeur Infirmation Oui La temp rature ambiante est pass e d une sup rieure valeur irr cup rable une valeur critique irr cup rable Action la diode de surchauffe et la diode d alerte du syst me sont allum es et la diode de d faillance de la CPU X est teinte Autres capteurs de temp rature Ces capteurs de temp rature sont surveill s et affectent l tat des diodes du panneau avant mais
21. ambiante est pass e d une valeur non critique une valeur normale Action aucune La temp rature ambiante est sup rieure au seuil critique Action la diode de surchauffe et la diode d alerte du syst me sont allum es La temp rature ambiante est pass e d une valeur critique une valeur non critique Action la diode de surchauffe et la diode d alerte du syst me sont teintes La temp rature ambiante est sup rieure au seuil irr cup rable Action la diode de surchauffe et la diode d alerte du syst me sont allum es et l alimentation syst me est mise hors tension La temp rature ambiante est pass e d une valeur irr cup rable une valeur critique Action la diode de surchauffe et la diode d alerte du syst me sont allum es Annexe D Liste de capteurs p0 t_ core Ce capteur surveille la temp rature de la CPU 0 pl t_ core Ce capteur surveille la temp rature de la CPU 1 p2 t_ core Ce capteur surveille la temp rature de la CPU 2 Ce capteur est uniquement disponible dans le serveur Sun Fire X4440 p3 t_core Ce capteur surveille la temp rature de la CPU 3 Ce capteur est uniquement disponible dans le serveur Sun Fire X4440 Pour tous les capteurs pX t_core Seuil Indication Ev nement Description Valeur Confirmation Oui La temp rature ambiante est sup rieure au sup rieure seuil non critique non critique Action aucune Valeur Infirmation Oui La temp rature
22. amp SUN microsystems Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Sun Microsystems Inc www sun com R f 820 5229 10 Juin 2008 R vision A Merci d envoyer vos commentaires concernant ce document l adresse http www sun com hwdocs feedback Copyright 2008 Sun Microsystems Inc 4150 Network Circle Santa Clara California 95054 Etats Unis Tous droits r serv s Non publi droits r serv s selon la l gislation des Etats Unis sur le droit d auteur CE PRODUIT CONTIENT DES INFORMATIONS CONFIDENTIELLES ET DES SECRETS COMMERCIAUX DE SUN MICROSYSTEMS INC SON UTILISATION SA DIVULGATION ET SA REPRODUCTION SONT INTERDITES SANS L AUTORISATION EXPRESSE ECRITE ET PREALABLE DE SUN MICROSYSTEMS INC Cette distribution peut inclure des l ments d velopp s par des tiers Sun Sun Microsystems le logo Sun Java Solaris Sun Fire 4140 Sun Fire 4240 et Sun Fire 4440 sont des marques commerciales ou des marques d pos es de Sun Microsystems Inc aux Etats Unis et dans d autres pays AMD Opteron et Opteron sont des marques d pos es de Advanced Micro Devices Inc Intel est une marque d pos e de Intel Corporation Ce produit est soumis la l gislation am ricaine sur le contr le des exportations et peut tre soumis la r glementation en vigueur dans d autres pays dans le domaine des exportations et importations Les utilisations finales ou utilisateurs finaux pour des armes nucl
23. d autotest la mise sous tension POST 31 TABLEAU A 1 Codes POST suite Code POST Description 000a Initialisation du contr leur de clavier compatible 8042 000c D tection de la pr sence d un clavier dans le port KBC 000e Test et initialisation de diff rents p riph riques d entr e D routement du vecteur INTO9h pour que le gestionnaire POST INTO9h obtienne le contr le pour IRQ1 8600 Pr paration de la CPU pour initialisation du syst me d exploitation par copie de tout le contexte du BSP vers tous les processeurs d applications pr sents REMARQUE les AP restent dans l tat CLI HLT de00 Pr paration de la CPU pour initialisation du syst me d exploitation par copie de tout le contexte du BSP vers tous les processeurs d applications pr sents REMARQUE les AP restent dans l tat CLI HLT 8613 Initialisation des registres PM et PM PCI au d but du test POST Initialisation d un pont multi h te si le syst me le prend en charge D finition des options ECC avant l effacement de la m moire Activation des lignes d horloge PCI X dans le 8131 0024 D compression et initialisation de n importe quels modules BIOS de plate forme 862a Initialisation de la ROM BBS 002a DIM Device Initialization Manager g n rique D sactivation de toutes les unit s 042a Unit s ISA PnP D sactivation de toutes les unit s 052a Unit s PCI D sactivation de toutes les unit s 122a Unit ISA Initialisation des unit s statiq
24. d une paire d fectueuse Erreurs DIMM corrigibles Si un module DIMM g n re 24 erreurs corrigibles ou plus en l espace de 24 heures il est consid r comme d fectueux et doit tre remplac Pour l instant les erreurs corrigibles ne sont pas consign es dans les journaux des v nements du serveur Elles sont consign es ou trait es dans le syst me d exploitation pris en charge comme suit m Windows Server a Une info bulle de message d erreur machine s affiche dans la barre des t ches b L utilisateur doit ouvrir manuellement l Observateur d v nements pour voir les erreurs Pour acc der l Observateur d v nements suivez le chemin d acc s suivant D marrer gt Outils d administration gt Observateur d v nements 14 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 c L utilisateur peut alors consulter les d tails des erreurs individuelles par heure m Solaris Solaris FMA consigne et parfois met hors service des modules de m moire indiquant des erreurs ECC Erreur Correction Code code correcteurs d erreurs corrigibles Pour plus d informations reportez vous la documentation du syst me d exploitation Solaris Entrez la commande fmdump eV pour voir les erreurs ECC a Linux L utilitaire HERD peut tre utilis pour g rer les erreurs de DIMM dans Linux Pour plus d informations reportez vous au manuel x64 Servers Utilities Reference Manual manue
25. est confirm Annexe D Liste de capteurs 77 ANNEXE E Traitement des erreurs Cette annexe d crit la fa on dont les serveurs traitent et consignent les erreurs Reportez vous aux sections suivantes Traitement des erreurs non corrigibles page 79 Traitement des erreurs corrigibles page 82 Traitement des erreurs de parit PERR page 85 Traitement des erreurs syst me SERR page 87 Traitement des processeurs non concordants page 89 Synth se du traitement des erreurs de mat riel page 90 Traitement des erreurs non corrigibles Cette section contient quelques faits et consid rations sur la fa on dont le serveur traite les erreurs non corrigibles Remarque La fonction ChipKill du BIOS doit tre d sactiv e si vous testez des d faillances de bits multiples dans une m moire DRAM ChipKill corrige les erreurs de DRAM quatre bits Le BIOS consigne l erreur dans le journal des v nements syst me SEL du processeur de service l aide du contr leur BMC Board Management Controller Le journal SEL du processeur de service est mis jour avec l adresse de banque de la paire de DIMM d faillante Le syst me est r initialis Le BIOS consigne l erreur dans l interface DMI 79 Remarque Si l erreur se situe dans la m moire basse de 1 Mo le BIOS se bloque apr s la r initialisation et aucun journal DMI n est enregistr m Un exemple d e
26. fichier tapez rm nom fichier Les param tres de votre navigateur peuvent tre diff rents Sites Web tiers Sun d cline toute responsabilit quant la disponibilit des sites Web de tiers mentionn s dans le pr sent document Sun n exerce ni cautionnement ni responsabilit quant au contenu aux publicit s aux produits ou tout autre l ment disponible sur ou par l interm diaire des sites ou ressources cit s Sun d cline toute responsabilit quant aux dommages ou pertes r els ou suppos s r sultant de ou li s l utilisation du contenu des biens et des services disponibles sur ou par l interm diaire des sites ou ressources cit s Pr face xi Vos commentaires nous sont utiles Sun s efforce d am liorer sa documentation aussi vos commentaires et suggestions sont les bienvenus Vous pouvez nous faire part de vos commentaires sur le site http www sun com hwdocs feedback Veuillez mentionner le titre et le num ro de r f rence du document dans vos commentaires Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 num ro de r f rence 820 5229 10 xii Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 CHAPITRE 1 Inspection initiale du serveur Ce chapitre aborde les sujets suivants m Diagramme de d pannage page 1 m Collecte des informations de maintenance page 2 m Inspection du syst me page 3 Diagram
27. galement fournie pour les cas o il n est pas possible d ex cuter l interface utilisateur graphique Documentation Sun VTS Pour obtenir les toutes derni res informations sur le logiciel SunVTS visitez le site http docs sun com app docs prod test validate Analyse des probl mes du serveur l aide du CD de diagnostic initialisable Le logiciel SunVTS 6 4 ou version ult rieure est pr install sur votre serveur Le serveur est galement livr avec le CD de diagnostic initialisable Ce CD est con u pour que le serveur d marre partir du CD Ce CD initialise et lance le logiciel SunVTS Les tests de diagnostic s ex cutent et crivent la sortie dans des fichiers journaux dont le technicien de maintenance peut se servir pour d terminer les probl mes li s au serveur Conditions requises a Pour utiliser le CD de diagnostic initialisable vous devez disposer d un clavier d une souris et d un cran raccord s au serveur sur lequel vous ex cutez les diagnostics ou disponibles via une connexion KVM distante Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Utilisation du CD de diagnostic initialisable Pour utiliser le CD de diagnostic pour r aliser des diagnostics 1 2 Une fois le serveur sous tension ins rez le CD dans l unit de DVD ROM R initialisez le serveur et appuyez sur F2 pour effectuer l initialisation de fa on pouvoir modifier le param tre BIOS de priorit du p
28. ils ne sont pas utilis s en entr e pour l algorithme de contr le des ventilateurs ni pour mettre le syst me hors tension s ils sont irr cup rables mb t_ core Ce capteur surveille la temp rature ambiante du syst me l aide d une puce ADM1026 situ e sur la carte m re mezz t_ core Ce capteur surveille la temp rature ambiante du syst me l aide d une puce ADM1026 situ e sur la carte mezzanine Annexe D Liste de capteurs 65 Capteurs de tension de la carte m re Tous les capteurs de tension de la carte m re sont configur s pour g n rer les m mes v nements et les erreurs sont trait es de la m me mani re mb v_bat Ce capteur surveille la batterie RTC 3 V sur la carte m re mb v_ 3v3stby Ce capteur surveille l entr e de secours 3 3 V qui alimente le processeur de service et les autres p riph riques de secours mb v_ 3v3 Ce capteur surveille l entr e principale 3 3 V qui est active lorsque l alimentation est sous tension mb v_ 5v Ce capteur surveille l entr e principale 5 V qui est active lorsque l alimentation est sous tension mb v_ 12v Ce capteur surveille l entr e principale 12 V qui est active lorsque l alimentation est sous tension mb v_ 1v5 Ce capteur surveille l entr e 1 5 V qui est active lorsque l alimentation est sous tension 66 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 mb v_ 1v2ht Ce capteur surveille l entr e 1 2 Vht
29. indique que le disque dur X n est pas pr sent P riph rique pr sent Oui Cet tat indique que le disque dur X est pr sent hddX fail Ce capteur indique les pannes de disque dur m X est 0 7 pour les serveurs Sun Fire X4140 et X4440 a X est 0 15 pour le serveur Sun Fire X4240 Etat v nement Description chec pr vu infirm Non Cet tat indique une d faillance du lecteur de disque dur X chec pr vu confirm Oui Cet tat indique une d faillance du lecteur de disque dur X Ce capteur est confirm en r ponse un signal de d faillance du contr leur AMI SAS La diode orange de l unit X et la diode d alerte du syst me sont allum es lorsque l tat est confirm 76 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 hddX ok2rm Ce capteur discret configurable affiche l tat OK to remove Retrait autoris m X est 0 7 pour les serveurs Sun Fire X4140 et X4440 a X est 0 15 pour le serveur Sun Fire X4240 Valeur Ev nement Description 0x80 tat confirm Hot Spare Oui Vous pouvez retirer le lecteur de Secours disque dur X 0x00 Non Vous ne pouvez pas retirer le lecteur de disque dur X Cette valeur de capteur est d termin e par des entit s externes telles qu une application de surveillance de disque ex cut e sur le syst me d exploitation h te En cons quence la diode bleue de l unit X est allum e lorsque l tat Hot Spare Secours
30. indique que le module Y de la carte de ventilateurs X est absent P riph rique pr sent Oui Cet tat indique que le module Y de la carte de ventilateurs X est pr sent Capteurs de vitesse des ventilateurs Tous les capteurs de vitesse de ventilateur sont configur s pour g n rer les m mes v nements et les erreurs sont trait es de la m me mani re fbX fmY fZ speed Ce capteur surveille la vitesse du ventilateur Z dans le module de ventilation Y sur la carte de ventilateurs X Seuil Indication v nement Description Valeur Confirmation Oui La vitesse du ventilateur est inf rieure au seuil inf rieure inf rieur irr cup rable irr cup rable Action la diode de d faillance du ventilateur la diode de d faillance du module Y de la carte de ventilateurs X et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La vitesse du ventilateur est pass e d une inf rieure valeur inf rieure irr cup rable une valeur irr cup rable normale Action la diode de d faillance du ventilateur la diode de d faillance du module Y de la carte de ventilateurs X et la diode d alerte du syst me sont teintes Annexe D Liste de capteurs 75 Capteurs d E S hddX prsnt Ce capteur surveille la pr sence d un disque dur m X est 0 7 pour les serveurs Sun Fire X4140 et X4440 a X est 0 15 pour le serveur Sun Fire X4240 tat v nement Description P riph rique absent Oui Cet tat
31. la m me erreur le probl me est li a la CPU et non aux modules DIMM 20 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 ANNEXE A Journaux des v nements et codes d autotest la mise sous tension POST Cette annexe contient des informations sur le journal des v nements du BIOS le journal des v nements syst me du BMC l autotest la mise sous tension POST et la redirection de la console Il comprend les sections suivantes m Affichage des journaux des v nements page 21 m Test la mise sous tension POST Power On Self Test page 25 Affichage des journaux des v nements Utilisez cette proc dure pour afficher le journal des v nements du BIOS et le journal des v nements syst me du BMC 1 Pour passer en mode d alimentation principale avec tous les composants sous tension si n cessaire utilisez un stylo bille ou un stylet pour enfoncer et rel cher le bouton d alimentation du panneau avant du serveur Reportez vous la FIGURE 1 1 Lorsque l alimentation principale alimente l ensemble du serveur la diode d alimentation OK situ e c t du bouton d alimentation s allume en continu 2 Lancez l utilitaire de configuration du BIOS en appuyant sur la touche F2 lors de l autotest la mise sous tension POST L cran du menu principal du BIOS s affiche 21 3 Affichez le journal des v nements du BIOS a Dans l cran du menu
32. lectricit statique Remarque Pour r cup rer des informations sur l erreur consultez le journal SEL du processeur de service comme d crit dans le document Sun Integrated Lights Out Manager 2 0 User s Guide Guide de l utilisateur de Sun Integrated Lights Out Manager 2 0 5 Retirez les modules DIMM de leur emplacement dans la CPU Pour plus d informations reportez vous au manuel d entretien de votre serveur 6 Inspectez les modules DIMM pour v rifier la pr sence de dommages de poussi re ou de tout autre contaminant sur le connecteur ou les circuits 7 Inspectez les emplacements DIMM pour v rifier qu ils ne sont pas endommag s V rifiez que les emplacements DIMM ne contiennent pas de plastique f l ou cass 8 D poussi rez les DIMM nettoyez les contacts et r installez les DIMM Chapitre 3 D pannage des probl mes DIMM 19 Attention Utilisez uniquement de l air comprim pour d poussi rer les DIMM 9 En l absence de dommages vidents remplacez les DIMM d faillants Pour les erreurs non corrigibles si les diodes indiquent une erreur li e a la paire remplacez les deux modules DIMM Assurez vous que les DIMM sont correctement ins r s avec les loquets d jection ferm s 10 Reconnectez les cordons d alimentation lectrique au serveur 11 Mettez le serveur sous tension et ex cutez de nouveau le test de diagnostic 12 Consultez le fichier journal Si les tests indiquent
33. pr sence de ventilateurs 75 fbX fmY prsnt 75 Capteurs de vitesse des ventilateurs 75 fbX fmYfZ speed 75 Capteurs d E S 76 hddX prsnt 76 hddX fail 76 hddX ok2rm 77 Traitement des erreurs 79 Traitement des erreurs non corrigibles 79 Traitement des erreurs corrigibles 82 Traitement des erreurs de parit PERR 85 Traitement des erreurs syst me SERR 87 Traitement des processeurs non concordants 89 Synth se du traitement des erreurs de mat riel 90 Index 1 Sommaire vii viii Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Pr face Le Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 contient des informations et des proc dures sur l utilisation des outils disponibles pour diagnostiquer les probl mes li s aux serveurs Avant de lire ce manuel Il est important de consulter les instructions de s curit du document Sun Fire X4140 X4240 and X4440 Safety and Compliance Guide Guide de conformit et de s curit Sun Fire X4140 X4240 et X4440 x Documentation associ e Pour une description de la documentation consacr e aux serveurs Sun Fire X4140 X4240 et X4440 reportez vous a la fiche Emplacement de la documentation sur les serveurs Sun Fire X4140 X4240 et X4440 fournie avec votre serveur Cette documentation est galement disponible a l adresse http docs sun com Des versions traduites d une partie de ces documents sont disponibles sur le site Web htt
34. principal du BIOS s lectionnez Advanced Avanc L cran Advanced Settings Param tres avanc s s affiche Main Advanced PCIPnP Boot Security Chipset Exit KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKK KKKKKE Advanced Settings Configure CPU KK KKK KKK KKK KKK KKK KKK KKK KKK KEK KEK KKK KKK KEK KKK KEK KKK KKKKKK OK WARNING Setting wrong values in below sections may cause system to malfunction K 7 CPU Configuration IDE Configuration Hyper Transport Configuration ACPI Configuration Event Log Configuration IPMI 2 0 Configuration MPS Configuration PCI Express Configuration x Select Screen Remote Access Configuration xx Select Item USB Configuration Enter Go to Sub Screen F1 General Help F10 Save and Exit ESC Exit KKEKKKKK KKK KKK KKK KKK KKK KKK KKK KKK KEK KEK KEK KKK KKK KKK KKK KKK KEK KKK KKK KKK KEK KKK KKKKEKKKEKKK v02 61 C Copyright 1985 2006 American Megatrends Inc 22 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 b Dans l cran Advanced Settings Param tres avanc s s lectionnez Event Log Configuration Configuration du journal des v nements L cran Event Logging Details D tails de la consignation d v nements du menu Advanced s affiche
35. qui est active lorsque l alimentation est sous tension mb v_ 1 4 Ce capteur surveille l entr e 1 4 V qui est active lorsque l alimentation est sous tension Seuil Indication v nement Description Valeur Confirmation Oui La tension est inf rieure au seuil non critique inf rieure non critique Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La tension est pass e d une valeur inf rieure inf rieurenon non critique une valeur normale critique Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont teintes Valeur Confirmation Oui La tension est inf rieure au seuil critique inf rieure inf rieur critique Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La tension est pass e d une valeur inf rieure inf rieure critique une valeur inf rieure non critique critique Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Valeur Confirmation Oui La tension est inf rieure au seuil inf rieure irr cup rable irr cup rable Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La tension est pass e d une valeur inf rieure inf rieure critique une valeur inf rieure irr cup rable irr cup rable Annexe D
36. riph rique de d marrage Dans l cran du menu principal du BIOS qui s affiche acc dez au menu Boot Initialisation Des instructions de navigation sont fournies dans les crans du BIOS Dans le menu Boot du BIOS s lectionnez Boot Device Priority Priorit du p riph rique d initialisation L cran Boot Device Priority s affiche S lectionnez le lecteur DVD ROM utiliser comme p riph rique d initialisation principal Enregistrez puis fermez les crans du BIOS Red marrez le serveur Lorsque le serveur red marre partir du CD ins r dans le lecteur de DVD ROM le syst me d exploitation Solaris est initialis et le logiciel SunVTS s ouvre sur la premi re fen tre de l interface utilisateur graphique Dans l interface de Sun VTS appuyez sur Entr e ou cliquez sur le bouton Start D marrer lorsque vous tes invit d marrer les tests La suite de tests est ex cut e jusqu ce qu une erreur soit d tect e ou que le test soit termin Remarque L initialisation du CD dure environ neuf minutes 9 Lorsque le logiciel SunVTS a termin le test vous pouvez consulter les fichiers journaux g n r s pendant le test SunVTS permet d acc der quatre fichiers journaux diff rents m Le journal d erreurs de test SunVTS contient les messages d erreur du test SunVTS horodat s Ce fichier journal se situe l emplacement var opt SUNWvts logs sunvts err Ce fichier est uniquement cr
37. sont souvent l origine des probl mes li s aux composants mat riels D pannage des probl mes d alimentation Si le serveur se met sous tension passez directement la section Inspection externe du serveur page 3 Si le serveur ne se met pas sous tension v rifiez les l ments suivants V rifiez que les cordons d alimentation lectrique sont correctement reli s aux alimentations lectriques du serveur et aux sources de courant alternatif V rifiez que le capot principal est bien en place La carte m re comprend un interrupteur d intrusion qui met automatiquement le serveur en mode d alimentation de secours lorsque le capot est retir Inspection externe du serveur Pour effectuer une inspection visuelle du syst me externe 1 Inspectez les diodes d tat externes qui indiquent un mauvais fonctionnement des composants Pour conna tre l emplacement des diodes et leur comportement reportez vous la section Diode d tat externes page 37 V rifiez que rien ne bloque la circulation de l air dans le serveur ou ne cr e un contact qui pourrait provoquer un court circuit Si le probl me n est pas vident passez la section suivante Inspection interne du serveur page 4 Chapitre 1 Inspection initiale du serveur 3 4 Inspection interne du serveur Pour effectuer une inspection visuelle du syst me interne 1 Choisissez une m thode permettant de faire passer le serveur du mode
38. suivants Lors de l initialisation de l h te le BIOS de l h te r gle inconditionnellement les date et heure du processeur de service conform ment aux indications de l horloge temps r el de l h te Cette derni re est d finie par les op rations suivantes a Lorsque la CMOS de l h te est effac e suite au remplacement de la pile de l horloge temps r el de l h te ou de l insertion du cavalier d effacement de la CMOS sur la carte m re L horloge en temps r el de l h te d marre Jan 1 00 01 00 2002 Lorsque le syst me d exploitation de l h te d finit l horloge en temps r el de l h te Le BIOS ne tient pas compte des fuseaux horaires Les logiciels Solaris et Linux respectent les fuseaux horaires et r glent l horloge du syst me en fonction de l heure UTC En cons quence apr s que le syst me d exploitation a r gl l horloge temps r el les date et heure d finies par le BIOS sont au format UTC a Lorsque l utilisateur d finit l horloge temps r el dans l cran de configuration du BIOS de l h te m En permanence via NTP si NTP est activ sur le processeur de service Le NTP par cavalier est activ pour r cup rer rapidement d une mise jour erron e provenant du BIOS ou de l utilisateur Les serveurs NTP fournissent l heure UTC universelle Par cons quent si NTP est activ sur le processeur de service l horloge du processeur de service est au format UTC a Via l interface de ligne de commande l inte
39. toutes les entr es du journal 6 Si le probl me de serveur n est pas vident apr s avoir consult les journaux et les crans d informations du processeur de service ILOM reportez vous la section Ex cution de tests de diagnostic l aide de SunVTS page 7 Annexe C Utilisation de l interface utilisateur graphique du processeur de service ILOM pour afficher les informations syst me 47 48 Interpr tation des horodatages du journal des v nements Les horodatages du journal des v nements syst me sont li s aux param tres de l horloge du processeur de service Si les param tres de l horloge sont modifi s ces modifications sont refl t es dans les horodatages Lorsque le processeur de service red marre son horloge indique Thu Jan 1 00 00 00 UTC 1970 Le red marrage du processeur de service intervient dans les cas suivants G n cycle complet de mise sous tension et hors tension d branchement branchement du syst me a ne commande IPMI par exemple mc reset cold U a Une commande saisie dans l interface de ligne de commande CLI par exemple reset SP U ne op ration effectu e a partir de l interface graphique Web ILOM par exemple la s lection de l option Res SP R initialiser le processeur de service dans l onglet Maintenance m Une mise niveau du microprogramme du processeur de service Une fois le processeur de service red marr son horloge est modifi e par les v nements
40. 8042 0B D tection de la pr sence d une souris PS 2 OC D tection de la pr sence d un clavier dans le port KBC OE Test et initialisation de diff rents p riph riques d entr e Mise jour des variables du noyau D routement du vecteur INTO9h pour que le gestionnaire POST INTO9h obtienne le contr le pour IRQ1 D compression de tous les modules de langue de logo BIOS et de logo Silent 13 Initialisation des registres PM et PM PCI au d but du test POST initialisation d un pont multi h te si le syst me le prend en charge D finition des options ECC avant l effacement de la m moire REDIRECTION crit imm diatement les donn es corrig es dans la RAM CHIPKILL fournit une d tection correction d erreur 4 bits de m moire de type x4 Activation des lignes d horloge PCI X dans le 8131 20 R affectation de toutes les CPU une seule adresse SMBASE Le BSP est d fini pour que son point d entr e corresponde A000 0 Si moins de 5 connecteurs CPU sont pr sents sur la carte les points d entr e CPU sont s par s par des octets 8000h Si plus de 4 connecteurs de CPU sont pr sents les points d entr e sont s par s par des octets 200h Le module CPU est charg de la r affectation de la CPU l adresse appropri e REMARQUE les AP restent dans l tat INIT 24 D compression et initialisation de n importe quel module BIOS de plate forme 30 Initialisation de l interruption de gestion de syst me 2A Initialisation de diff rent
41. B PCIX OEM n cessaires la fin du test POST L effacement en arri re plan de la m moire DRAM et des caches de niveau 1 et 2 est configur en fonction des questions de configuration Obtention des limites d effacement DRAM de chaque noeud 8D Cr ation des tables ACPI si ACPI est pris en charge 8E Programmation des param tres des p riph riques Activation d sactivation de NMI selon s lection 90 Initialisation la fin du POST de l interruption de gestion de syst me AO V rification du mot de passe d initialisation si d fini Al Nettoyage n cessaire avant initialisation du syst me d exploitation Annexe Journaux des v nements et codes d autotest la mise sous tension POST 35 TABLEAU A 2 Points de contr le des codes POST suite Code POST Description A2 Pr paration de l image d ex cution des diff rents modules BIOS Remplissage de la zone libre dans le segment F000h avec OFFh Initialisation de la table de routage IRQ Microsoft Pr paration du module de langue d ex cution D sactivation de l affichage de la configuration du syst me si n cessaire A4 Initialisation du module de langue d ex cution A7 Affichage de l cran de configuration du syst me s il est activ Initialisation des CPU avant le d marrage ce qui inclut la programmation des MTRR A8 Pr paration de la CPU pour l initialisation du syst me d exploitation y compris des valeurs finales MTRR A9 Attente de l entr e des infor
42. F SUN MICROSYSTEMS INC This distribution may include materials developed by third parties Sun Sun Microsystems the Sun logo Java Solaris Sun Fire 4140 Sun Fire 4240 and Sun Fire 4440 are trademarks or registered trademarks of Sun Microsystems Inc in the U S and other countries AMD Opteron and Opteron are trademarks of Advanced Micro Devices Inc Intel is a registered trademark of Intel Corporation This product is covered and controlled by U S Export Control laws and may be subject to the export or import laws in other countries Nuclear missile chemical biological weapons or nuclear maritime end uses or end users whether direct or indirect are strictly prohibited Export or reexport to countries subject to U S embargo or to entities identified on U S export exclusion lists including but not limited to the denied persons and specially designated nationals lists is strictly prohibited Use of any spare or replacement CPUs is limited to repair or one for one replacement of CPUs in products exported in compliance with U S export laws Use of CPUs as product upgrades unless authorized by the U S Government is strictly prohibited Ory Recyclage Ka i 8 recommand Adobe PostScript Sommaire Pr face ix Inspection initiale du serveur 1 Diagramme de d pannage 1 Collecte des informations de maintenance 2 Inspection du syst me 3 D pannage des probl mes d alimentation 3 Inspection externe du serveur 3 Inspect
43. Liste de capteurs 67 68 Seuil Indication v nement Description Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Valeur Confirmation Oui La tension est sup rieure au seuil sup rieur sup rieure non critique non critique Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La tension est pass e d une valeur sup rieure sup rieure non critique une valeur normale non critique Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont teintes Valeur Confirmation Oui La tension est sup rieure au seuil sup rieur sup rieure critique critique Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La tension est pass e d une valeur sup rieure sup rieure critique une valeur sup rieure non critique critique Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Valeur Confirmation Oui La tension est sup rieure au seuil sup rieur sup rieure irr cup rable irr cup rable Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La tension est pass e d une valeur sup rieure sup rieure irr cup rable une valeur sup rieure critique irr cup rable Action la diode de d fa
44. Logs Event Log Displays every event in the SP including IPMI Audit and FMA events Click the Clear Log button to delete all current log entries Event Log Event ID Class Type Severity Date Time Description 162 Audit Log minor Wed Nov 28 root Open Session object session type value www success 09 39 10 2007 161 Audit Log minor Wed Nov 28 root Open Session object sessionitype value shell success 09 23 06 2007 160 IPMI Log critical Wed Nov 28 ID 81 pre init timestamp Entity Presence hdd prsnt Device Absent 09 21 01 2007 159 IPMI Log critical Wed Nov 28 ID 80 pre init timestamp Entity Presence hdd2 prsnt Device Absent 09 20 57 2007 re lt i gt 3 S lectionnez dans la liste d roulante une cat gorie d v nements afficher dans le journal Les types d v nements disponibles sont m Les v nements sp cifiques aux capteurs Ces v nements sont li s un capteur sp cifique pour un composant par exemple un capteur de ventilateur ou d alimentation lectrique m Les v nements g n r s par le BIOS Ces v nements sont li s des messages d erreur g n r s dans le BIOS m Les v nements du logiciel de gestion du syst me Ces v nements sont li s des v nements se produisant dans le logiciel ILOM 46 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Apr s que vous avez s lectionn une cat gorie d
45. MM et de la carte m re peuvent fonctionner avec l lectricit stock e pendant jusqu une minute lorsque le syst me est mis hors tension m me lorsque l alimentation est d connect e et que la carte m re ou mezzanine est retir e du syst me L lectricit stock e a une autonomie d environ une demi heure m La diode d erreur de la carte m re situ e sur la carte mezzanine indique un probl me li la carte m re Remarque La carte mezzanine lorsqu elle est pr sente cache une partie de la carte m re y compris les diodes La diode d erreur de la carte m re indique que l une ou plusieurs des diodes de la carte m re est active FIGURE B 4 Modules DIMM et diodes situ s sur la carte m re Ventilateurs CPU 1 an D faillance de la CPU1 Bouton Press to see fault 40 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 FIGURE B 5 Modules DIMM et diodes situ s sur la carte mezzanine Ventilateurs ae CPU2 CPU3 4 5 6 7 oo D faillance asi la CPU3 Le Bouton Press to see fault Bae de la carte m re Annexe B Diodes d tat 41 42 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 ANNEXE C Utilisation de l interface utilisateur graphique du processeur de service ILOM pour afficher les informations syst me Cette annexe contient des informations sur l utilisation de l interface graphique du processeur de service SP
46. MM par le syst me Cette section d crit le comportement du syst me lors de la d tection des deux types d erreurs DIMM erreurs non corrigibles et erreurs corrigibles Elle contient galement une description des messages d erreurs DIMM du BIOS Erreurs DIMM non corrigibles Le comportement est le m me pour toutes les erreurs non corrigibles sur tous les syst mes d exploitation 1 Lorsqu une erreur non corrigible se produit le contr leur de m moire provoque une r initialisation imm diate du syst me 2 Durant cette r initialisation le BIOS v rifie les registres d erreurs machine et d termine que la r initialisation pr c dente tait due une erreur non corrigible puis consigne le message suivant dans l autotest la mise sous tension POST apr s le test memtest A Hypertransport Sync Flood occurred on last boot 12 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 3 Le BIOS consigne cet v nement dans le fichier journal des v nements syst me SEL du processeur de service comme indiqu dans l exemple de sortie de l outil IPMItool ci dessous ipmitool H 10 6 77 249 U root P changeme I lanplus sel list 8 Oo moana 10 11 22 23 24 25 09 25 2007 03 22 03 System Boot Initiated 0x02 Initiated by warm reset Asserted 09 25 2007 03 22 03 Processor 0x04 Presence detected Asserted 09 25 2007 03 22 03 OEM 0x12 Assert
47. S 21 L Logiciel de diagnostic CD de diagnostic initialisable 8 SunVTS 7 M Mat riel traitement des erreurs 90 Mise hors tension proc dure 4 Index 2 N Non concordance des processeurs erreur 89 P PERR 85 Ports emplacements et diodes illustration 38 39 POST Modification des options 28 Points de contr le des codes 33 Pr sentation 25 Redirection de la sortie de la console 26 Tableau de codes POST 31 Probl mes d alimentation d pannage 3 Processeur de service journal des v nements syst me voir Journal SEL du processeur de service Processeurs non concordants traitement des erreurs 89 R Rassemblement des informations de maintenance 2 Redirection de la sortie de la console 26 R gles de population des DIMM 11 S SERR 87 Sites Web tiers xi Sortie de la console redirection 26 SunVTS CD de diagnostic initialisable 8 Documentation 8 Journaux 9 Pr sentation 7 T Traitement des erreurs Corrigibles 82 DIMM 12 Erreurs de mat riel 90 Erreurs non corrigibles 79 Erreurs syst me 87 Processeurs non concordants 89 V Visite de maintenance rassemblement des informations 2 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008
48. S ignore certains tests lors de l initialisation tels que le test tendu de la m moire Cela permet d acc l rer l initialisation du syst me Quiet Boot Initialisation silencieuse cette option est d sactiv e par d faut Si vous activez cette option le logo Sun Microsystems s affiche la place des codes POST a Add On ROM Display Mode Mode d affichage de ROM d extension cette option est d finie sur Force BIOS Forcer le BIOS par d faut Elle n est appliqu e que si vous avez activ l option Quiet Boot elle permet d afficher ou non la sortie de la ROM en option Les deux valeurs de cette option sont les suivantes a Force BIOS Forcer le BIOS supprime le logo Sun et affiche la sortie de la ROM en option a Keep Current Conserver ne supprime pas le logo Sun La sortie de la ROM en option ne s affiche pas Boot Num Lock Verr Num l initialisation cette option est activ e par d faut le verrouillage num rique du clavier est activ lors de l initialisation Si vous la d sactivez le verrouillage num rique du clavier n est pas activ lors de l initialisation a Wait for F1 if Error Attendre F1 en cas d erreur cette option est d sactiv e par d faut Lorsque que cette option est activ e le syst me s interrompt en cas d erreur au cours du test POST Le test reprend lorsque vous appuyez sur la touche F1 Interrupt 19 Capture Interrompre la capture 19 cette option est r serv e un
49. a CPU 2 Sun Fire X4440 uniquement p2 prsnt Ce capteur indique la pr sence de la CPU 2 Etat Ev nement Description Echec pr vu infirm Oui Cet tat indique que la CPU 2 est absente Echec pr vu confirm Oui Cet tat indique que la CPU 2 est pr sente 58 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 p2 prochot Lorsqu il est confirm ce capteur indique que la CPU 2 a atteint une temp rature de fonctionnement maximale et que l tranglement thermique est activ dans le processeur Etat v nement Description Confirm Oui Cet tat indique que le signal prochot Processor Hot de la CPU 2 est confirm Infirm Oui Cet tat indique que le signal prochot Processor Hot de la CPU 2 est infirm Capteurs discrets de la CPU 3 Sun Fire X4440 uniquement p3 prsnt Ce capteur indique la pr sence de la CPU 3 Etat v nement Description chec pr vu infirm Oui Cet tat indique que la CPU 3 est absente chec pr vu confirm Oui Cet tat indique que la CPU 3 est pr sente p3 prochot Lorsqu il est confirm ce capteur indique que la CPU 3 a atteint une temp rature de fonctionnement maximale et que l tranglement thermique est activ dans le processeur tat v nement Description Confirm Oui Cet tat indique que le signal prochot Processor Hot de la CPU 3 est confirm Infirm Oui Cet tat indique que le signal prochot P
50. a diode s teint lorsque le code de gestion du processeur de service pile IPMI est d marr e la sortie de l autotest la mise sous tension du BIOS la diode s affiche en continu Le processeur de service contr le la Non consign e Fatale r initialisation du syst me le syst me ne quitte pas la phase de r initialisation 90 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 TABLEAU E 1 Synth se du traitement des erreurs de mat riel suite Erreur Description Traitement Consign e journal DMI ou journal SEL du processeur de service Fatale Echec de l autotest a la mise sous tension du BIOS Erreur ECC DRAM monobit L autotest a la mise sous tension du BIOS du serveur choue Lorsque ECC est activ dans la configuration du BIOS la CPU d tecte et corrige une erreur monobit dans l interface DIMM Des erreurs fatales et des erreurs non fatales se produisent durant l autotest la mise sous tension POST Le BIOS d tecte certaines erreurs signal es durant l autotest sous forme de codes POST dans l angle inf rieur droit de l cran de la console s rie et sur l cran vid o Certains codes POST sont transmis au processeur de service pour consignation Les codes POST ne sont pas envoy s dans l ordre s quentiel et certains sont r p t s car certains codes sont mis par le code dans les ROM d extension BIOS de la carte d extension D
51. ans le cas d un chec au d but de l autotest la mise sous tension par exemple lorsque le BSP ne fonctionne pas correctement le BIOS s arr te sans consigner les erreurs Pour certaines autres erreurs du POST qui se produisent apr s l initialisation de la m moire et du processeur de service le BIOS consigne un message dans le journal SEL du processeur de service La CPU corrige l erreur dans le mat riel Aucune interruption d erreur machine n est g n r e par le mat riel L interrogation est d clench e toutes les demi secondes par les interruptions du minuteur SMI et est effectu e par le gestionnaire SMI du BIOS Le gestionnaire SMI du BIOS commence consigner chaque erreur d tect e et arr te la consignation lorsque la limite est atteinte pour une m me erreur L interrogation du BIOS peut tre d sactiv e via l interface du logiciel Journal SEL du Fonctionnement processeur de normal service Annexe E Traitement des erreurs 91 TABLEAU E 1 Synth se du traitement des erreurs de mat riel suite Consign e journal DMI ou journal SEL du processeur Erreur Description Traitement de service Fatale Erreur DRAM Avec CHIP KILL La CPU corrige l erreur dans le Journal SEL du Fonctionnement 4 bits activ dans la mat riel Aucune interruption d erreur processeur de normal configuration du machine n est g n r e par le mat riel service BIOS la CPU L interrogation est d clench e toutes d tecte
52. ations sur les composants rempla ables REFRESH Loc OUT dministrator root SP Hostname Integrated Lights Out Manager i System Information Versions Session Time Out Components Identification Information 1 mi Component Management View component information from this page To view further details click on a Component Name Component Management Status Component Name Type 15YS Host System iSYS MB Motherboard ISYS MB PO Host Processor SYS MBIPO DO DIMM iSYS MBIPOID1 DIMM ISYS MBIPOD2 DIMM ISYS MBIPOID3 DIMM ISYS MBIPOID4 DIMM frove morning Miah 3 S lectionnez un composant dans la liste d roulante Les informations portant sur le composant s lectionn s affichent 4 Si le probl me de serveur n est pas vident apr s avoir consult les informations sur les composants rempla ables reportez vous la section Ex cution de tests de diagnostic l aide de SunVTS page 7 50 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Affichage des capteurs Cette section explique comment afficher les valeurs des capteurs de temp rature de tension et des ventilateurs du serveur Pour obtenir une liste compl te des capteurs reportez vous l Annexe D Pour afficher les valeurs des capteurs 1 Connectez vous au processeur de service en tant qu administrateur ou op rateur pour acc der l interface graphique Web ILOM
53. consid rations sur la fa on dont le serveur traite les erreurs de parit m Le traitement des erreurs de parit est effectu l aide d interruptions NMI m Durant l autotest la mise sous tension l interruption NMI est consign e dans le journal DMI et dans le journal SEL du processeur de service Reportez vous a l exemple de commande et de sortie suivant root d mpk12 53 238 root ipmitool H 129 146 53 95 U root P changeme I lan sel list v SEL Record ID 0100 Record Type 00 Timestamp 01 10 2002 20 16 16 Generator ID 0001 EvM Revision 04 Sensor Type Critical Interrupt Sensor Number 00 Event Type Sensor specific Discrete Event Direction Assertion Event Event Data o4ff00 Description PCI PERR m La FIGURE E 3 montre un exemple d cran de journal DMI de la page de configuration du BIOS avec une erreur de parit FIGURE E 3 cran de journal DMI erreur de parit PCI BIOS SETUP UTILITY View 09 12 05 14 PCI Parity Annexe E Traitement des erreurs 85 a Le BIOS affiche les messages suivants et se bloque durant l autotest la mise sous tension ou le DOS me NMI EVENT System Halted due to Fatal NMI m Le d routement NMI Linux r pond l interruption et consigne la s quence suivante Aug 5 05 15 00 d mpk12 53 159 kernel Uhhuh NMI received for unknown reason 2d on CPU 0 Aug 5 05 15 00 d mpk12 53 159 kernel Uhhuh NMI received
54. d alimentation principale au mode Veille Voir la FIGURE 1 1 et la FIGURE 1 2 a Arr t progressif utilisez un stylo bille ou un stylet pour appuyer sur le bouton d alimentation du panneau avant et le rel cher Cette op ration permet d arr ter correctement un syst me d exploitation ACPI Advanced Configuration and Power Interface Les serveurs qui n utilisent pas un syst me d exploitation ACPI s arr tent en basculant imm diatement en mode d alimentation de secours a Arr t d urgence l aide d un stylo bille ou d un stylet appuyez sur le bouton d alimentation lectrique et maintenez le enfonc pendant quatre secondes pour couper l alimentation lectrique et passer en mode Veille Attention Un arr t d urgence peut corrompre les fichiers ouverts Utilisez l arr t d urgence seulement en cas de n cessit Lorsque l alimentation lectrique est coup e la diode d alimentation OK situ e l avant du panneau clignote pour indiquer que le serveur fonctionne en mode Veille Attention Lorsque vous utilisez le bouton d alimentation pour passer en mode d alimentation de secours le processeur de service et les ventilateurs des alimentations lectriques sont toujours aliment s Dans ce cas la diode d alimentation OK clignote Pour mettre compl tement hors tension le serveur vous devez d connecter les cordons d alimentation lectrique l arri re du serveur Guide de diagnostic des serveurs Sun Fire
55. dication Ev nement Description Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont teintes Valeur Confirmation Oui La tension est inf rieure au seuil critique inf rieure inf rieur critique Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La tension est pass e d une valeur inf rieure inf rieure critique une valeur inf rieure non critique critique Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Valeur Confirmation Oui La tension est inf rieure au seuil inf rieure irr cup rable irr cup rable Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La tension est pass e d une valeur inf rieure inf rieure critique une valeur inf rieure irr cup rable irr cup rable Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Valeur Confirmation Oui La tension est sup rieure au seuil sup rieur sup rieure non critique non critique Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La tension est pass e d une valeur sup rieure sup rieure non critique une valeur non critique normale Action la diode de d faillance de l alimentation et la diode d alerte du
56. e configuration du BIOS avec une erreur syst me FIGUREE 5 cran de journal DMI indiquant une erreur BIOS SETUP UTILITY r Advanced View Event Log View Event Log 09 12 05 14 23 47 A Hyper Transpor sync flood error occurred on last boot 09 12 05 14 23 36 system Error 53 Copyrigh 1985 2002 America Megatre ds Inc 88 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Traitement des processeurs non concordants Cette section contient quelques faits et consid rations sur la fa on dont le serveur traite les non concordances de processeurs m Le BIOS effectue un autotest la mise sous tension complet m Le BIOS consigne les CPU non concordantes comme indiqu dans l exemple suivant AMIBIOS C 2003 American Megatrends Inc BIOS Date 08 10 05 14 51 11 Ver 08 00 10 CPU AMD Opteron tm Processor 254 Speed 2 4 GHz Count 3 CPU Revision CPUO E4 CPUL E6 Microcode Revision CPUO 0 CPU1 0 DRAM Clocking CPUO 400 MHz CPU1 Core0 1 400 MHz Sun Fire Server 1 AMD North Bridge Rev E4 1 AMD North Bridge Rev E6 1 AMD 8111 I O Hub Rev C2 2 AMD 8131 PCI X Controllers Rev B2 System Serial Number 0505AMF028 BMC Firmware Revision 1 00 Checking NVRAM Initializing USB Controllers Done Press F2 to run Setup CTRL E on Remote Keyboard Press F12 to boot from the network CTRL N on Remote Keyboard Press F8 for BBS POPUP CTRL P on Remote Keyboard
57. ed 09 25 2007 03 22 03 System Event 0x12 Undetermined system hardware failure Asserted OEM record e0 00000002000000000029000002 OEM record e0 00000004000000000000b00006 OEM record e0 00000048000000000011110322 OEM record e0 00000058000000000000030000 OEM record e0 000100440000000000fefff000 OEM record e0 00010048000000000000ff3efa OEM record e0 10ab0000000010000006040012 OEM record e0 10ab0000001111002011110020 OEM record e0 0018304c00f200002000020c0f OEM record e0 0019304cC00f200004000020c0f OEM record e0 001a304c00f45aa10015080a13 OEM record e0 001a3054000000000320004880 OEM record e0 001b304c00f200001000020c0f OEM record e0 80000002000000000029000002 OEM record e0 80000004000000000000b00006 OEM record e0 80000048000000000011110322 OEM record e0 80000058000000000000030000 OEM record e0 800100440000000000feff 000 OEM record e0 80010048000000000000ff3efa 25 09 07 03 22 06 System Boot Initiated 0x03 Initiated by warm reset Asserted 25 09 07 03 22 06 Processor 0x04 Presence detected Asserted 25 09 07 03 22 15 System Firmware Progress 0x01 Memory initialization Asserted 25 09 07 03 22 16 Memory Uncorrectable ECC Asserted CPU 2 DIMM 0 25 09 07 03 22 16 Memory Uncorrectable ECC Asserted CPU 2 DIMM 1 25 09 07 03 22 16 Memory Memory Device Disabled Asserted CPU 2 DIMM 0 25 09 07 03 22 16 Memory Memory Device Disabled Asserted CPU 2 DIMM 1
58. elui ci est disponible sinon le SMI consigne un message dans le journal DMI L interrogation du BIOS peut tre d sactiv e via l interface SMI du logiciel D faillance de Une d faillance Les diodes de d faillance du Journal SEL du Non fatale ventilateur de ventilateur a ventilateur avant de demande processeur de t d tect e lors d op ration de maintenance et du service de la lecture des module de ventilateur individuel signaux s allument tachym triques 94 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 TABLEAU E 1 Synth se du traitement des erreurs de mat riel suite Consign e journal DMI ou journal SEL du processeur Erreur Description Traitement de service Fatale D faillances de Une d faillance Les diodes de d faillance du Journal SEL du Fatale ventilateurs de ventilateur a ventilateur avant de demande processeur de t d tect e lors d op ration de maintenance et du service de la lecture des module de ventilateur individuel signaux s allument tachym triques D faillance L un des signaux Les diodes de demande d op ration de Journal SEL du Neon fatale d alimentation AC DC maintenance et de d faillance de processeur de lectrique PS_VIN_GOOD l alimentation lectrique s allument service ou PS_PWR_OK est infirm s D faillance de Tout signal La diode de demande d op ration de Journal SEL du Fatale convertisseur POWER GOOD maintenance s allume le syst me pas
59. enfonc Capteurs discrets de la CPU 0 p0 prsnt Ce capteur indique la pr sence de la CPU 0 tat v nement Description chec pr vu infirm Oui Cet tat indique que la CPU 0 est absente chec pr vu confirm Oui Cet tat indique que la CPU 0 est pr sente p0 prochot Lorsqu il est confirm ce capteur indique que la CPU 0 a atteint une temp rature de fonctionnement maximale et que l tranglement thermique est activ dans le processeur tat v nement Description Confirm Oui Cet tat indique que le signal prochot Processor Hot de la CPU 0 est confirm Infirm Oui Cet tat indique que le signal prochot Processor Hot de la CPU 0 est infirm Annexe D Liste de capteurs 57 Capteurs discrets de la CPU 1 pl prsnt Ce capteur indique la pr sence de la CPU 1 Etat v nement Description chec pr vu infirm Oui Cet tat indique que la CPU 1 est absente chec pr vu confirm Oui Cet tat indique que la CPU 1 est pr sente pl prochot Lorsqu il est confirm ce capteur indique que la CPU 1 a atteint une temp rature de fonctionnement maximale et que l tranglement thermique est activ dans le processeur tat v nement Description Confirm Oui Cet tat indique que le signal prochot Processor Hot de la CPU 1 est confirm Infirm Oui Cet tat indique que le signal prochot Processor Hot de la CPU 1 est infirm Capteurs discrets de l
60. es unit s via DIM 2C Initialisation de diff rentes unit s D tection et initialisation de l adaptateur vid o install dans le syst me ayant des ROM en option 2E Initialisation de toutes les unit s de sortie 31 Allocation de m moire pour le module ADM et d compression du module Attribution du contr le au module ADM pour l initialisation Initialisation des modules de langues et de polices ADM Activation du module ADM 33 Initialisation du module d initialisation silencieuse Configuration de la fen tre pour affichage des informations texte 37 Affichage d un message de connexion des informations CPU du message de touche de configuration et des informations OEM 38 Initialisation de diff rentes unit s via DIM 39 Initialisation de DMAC 1 et de DMAC 2 3A Initialisation de la date heure RTC 34 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 TABLEAU A 2 Points de contr le des codes POST suite Code POST Description 3B Test de la m moire totale install e dans le syst me V rification des touches SUPPR ou ECHAP pour limiter le test de la m moire Affichage de la m moire totale du syst me 3C Test de lecture criture RAM d sormais termin programmation des trous de m moire ou gestion des ajustements n cessaires pour la taille RAM en fonction de NB V rifie si le module HT a d tect une erreur dans le bloc d initialisation et de la compatibilit CPU pour l environnement MP
61. et corrige les demi secondes par les interruptions une erreur de du minuteur SMI et est effectu e par le m moire DRAM gestionnaire SMI du BIOS 4 bits dans Le gestionnaire SMI du BIOS l interface DIMM commence consigner chaque erreur d tect e et arr te la consignation lorsque la limite est atteinte pour une m me erreur L interrogation du BIOS peut tre d sactiv e via l interface du logiciel Erreur ECC La CPU d tecte La m thode Sync Flood est utilis e Journal SEL du Fatale DRAM non une erreur de pour emp cher les donn es erron es processeur de corrigible DIMM multibit d tre propag es via les liaisons service non corrigible Hypertransport Le syst me est r initialis le BIOS r cup re les informations du registre d erreurs machine met en correspondance ces informations avec le module DIMM lorsque CHIPKILL est d sactiv ou la paire de DIMM lorsque CHIPKILL est activ et les consigne dans le processeur de service Le BIOS arr te la CPU Configuration Des modules Le BIOS affiche un message d erreur Journal DMI Fatale DIMM non DIMM non pris consigne une erreur et arr te le Journal SEL du prise en charge en charge sont utilis s ou des modules DIMM pris en charge ne sont pas charg s correctement syst me processeur de service 92 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 TABLEAU E 1 Synth se du traitement des erreurs de mat riel suite Erreur
62. eur surveille la tension VDD de la CPU X pX v_ 1v8 Ce capteur surveille la tension 1 8 V de la CPU X pX v_ 0v9 Ce capteur surveille la tension 0 9 V de la CPU X pX v_vddnb Ce capteur surveille la tension North Bridge Seuils de tous les capteurs de tension de la CPU Seuil Indication v nement Description Valeur Confirmation Oui La tension de la CPU X est inf rieure au seuil inf rieure non non critique inf rieur critique Action la diode de d faillance de l alimentation la diode de d faillance de la CPU X et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La tension de la CPU X est pass e d une inf rieure non valeur inf rieure non critique une valeur critique normale 72 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Seuils de tous les capteurs de tension de la CPU Seuil Indication v nement Description Action la diode de d faillance de l alimentation la diode de d faillance de la CPU X et la diode d alerte du syst me sont teintes Valeur Confirmation Oui La tension de la CPU X est inf rieure au seuil inf rieure critique inf rieur critique Action la diode de d faillance de l alimentation la diode de d faillance de la CPU X et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La tension de la CPU X est pass e d une inf rieure valeur inf rieure critique une valeur critique inf rieure no
63. for unknown reason 2d on CPU 1 Aug 5 05 15 00 d mpk12 53 159 kernel Dazed and confused but trying to continue Aug 5 05 15 00 d mpk12 53 159 kernel Do you have a strange power saving mode enabled Aug 5 05 15 00 d mpk12 53 159 kernel Uhhuh NMI received for unknown reason 3d on CPU 1 Aug 5 05 15 00 d mpk12 53 159 kernel Dazed and confused but trying to continue Aug 5 05 15 00 d mpk12 53 159 kernel Do you have a strange power saving mode enabled Aug 5 05 15 00 d mpk12 53 159 kernel Uhhuh NMI received for unknown reason 3d Ori CPUN Os Aug 5 05 15 00 d mpk12 53 159 kernel Dazed and confused but trying to continue Aug 5 05 15 00 d mpk12 53 159 kernel Do you have a strange power saving mode enabled Aug 5 05 15 00 d mpk12 53 159 kernel Dazed and confused but trying to continue Aug 5 05 15 00 d mpk12 53 159 kernel Do you have a strange power saving mode enabled Remarque Le syst me Linux est r initialis mais n informe pas le BIOS de cet incident 86 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Traitement des erreurs systeme SERR Cette section contient quelques faits et consid rations sur la fa on dont le serveur traite les erreurs syst me Le traitement des erreurs syst me utilise le m canisme HyperTransport Sync Flood sur 8111 et 8131 m Les v nements suivants se produisent durant l autotest la mise sous tension POST du BIOS
64. ge 8 Collecte des informations de maintenance La premi re tape pour d terminer la cause d un probl me li au serveur consiste rassembler les informations provenant des appels de service ou du personnel sur site Observez les instructions g n rales suivantes avant de commencer le d pannage Pour rassembler les informations de service 1 Rassemblez des informations sur les l ments suivants Ev nements qui se sont produits avant la panne Toute modification ou installation de mat riel ou de logiciel Installation ou d placement r cent du serveur D lai depuis lequel le serveur indique des probl mes Dur e ou fr quence du probl me 2 Documentez les param tres du serveur avant d effectuer des changements Si possible effectuez une modification la fois de fa on isoler les probl mes potentiels Cela permet de maintenir un environnement contr l et de r duire l tendue du d pannage 3 Notez les r sultats de tous les changements que vous effectuez Incluez toutes les erreurs et messages d information 4 V rifiez la pr sence de conflits potentiels entre les p riph riques avant d ajouter un nouveau p riph rique 5 V rifiez les d pendances de versions en particulier avec les logiciels tiers 2 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Inspection du systeme Une mauvaise configuration des contr les ou des c bles desserr s ou mal connect s
65. ichier ouvert reste affich mais vous ne pourrez plus l afficher une fois ferm Fermer la fen tre de fichier journal la fen tre est ferm e Remarque Pour enregistrer les fichiers lorsque vous utilisez le CD de diagnostic initialisable le serveur d marre partir du CD Par cons quent les fichiers journaux des tests ne se trouvent pas sur le lecteur de disque dur du serveur et sont supprim s lorsque vous mettez le serveur hors tension Pour conserver les fichiers journaux vous devez les enregistrer sur un p riph rique de stockage amovible ou les transf rer via FTP sur un autre syst me 10 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 CHAPITRE 3 D pannage des problemes DIMM Ce chapitre d crit comment d tecter et corriger les probl mes li s aux modules DIMM Dual Inline Memory Modules du serveur Il comprend les sections suivantes R gles de population DIMM page 11 Remplacement des modules DIMM page 12 Traitement des erreurs DIMM par le syst me page 12 Isolation et correction des erreurs de DIMM corrigibles page 18 R gles de population DIMM Les r gles de population DIMM du serveur sont les suivantes Chaque CPU peut prendre en charge jusqu huit modules DIMM Les emplacements DIMM sont coupl s et les modules DIMM doivent tre install s par paires 0 1 2 3 4 5 et 6 7 Voir la FIGURE 3 1 et la FIGURE 3 2 Les connecte
66. iffres et aux tableaux suivants pour plus d informations sur les diodes externes du serveur m La FIGURE B 1 d crit les diodes du panneau avant m La FIGURE B 2 d crit les diodes du panneau arri re m La FIGURE B 3 d crit les diodes du disque dur m La FIGURE B 4 et la FIGURE B 5 d crivent l emplacement des diodes internes 37 Diodes du panneau avant FIGURE B 1 Diodes du panneau avant serveur X4140 illustr A om L gende de la figure 1 Diode du localisateur bouton du 4 Diode arri re PS orange erreur d alimentation lectrique localisateur blanche 2 Diode de demande d intervention orange 5 Diode de surchauffe du syst me orange 3 Diode d alimentation OK verte 6 Diode de ventilateur sup rieur orange action de maintenance n cessaire sur le s ventilateur s Diodes du panneau arri re FIGURE B 2 Diodes du panneau arri re serveur X4140 illustr L gende de la figure 1 Diodes d alimentation lectrique 3 Diode de demande d intervention Alimentation OK verte 4 Diode d alimentation OK D faillance de l alimentation orange 5 Diodes du port Ethernet Alimentation secteur OK verte C t gauche la couleur verte indique une activit de liaison 2 Bouton de diode du localisateur C t droit La couleur verte indique une activit de liaison La couleur orange indique que la liaison s effectue une vitesse inf rieure la vitesse maximale
67. illance de l alimentation et la diode d alerte du syst me sont allum es Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Capteurs de tension de la carte Mezzanine Sun Fire X4440 uniquement Tous les capteurs de tension de la carte mezzanine sont configur s pour g n rer les m mes v nements et les erreurs sont trait es de la m me mani re mezz v_ 3v3stby Ce capteur surveille l entr e de secours 3 3 V de la carte mezzanine mezz v_ 3v3 Ce capteur surveille l entr e principale 3 3 V de la carte mezzanine qui est active lorsque l alimentation est sous tension mezz v_ 12v Ce capteur surveille l entr e principale 12 V de la carte mezzanine qui est active lorsque l alimentation est sous tension mezz v_ 1v2ht Ce capteur surveille l entr e 1 2 Vht de la carte mezzanine qui est active lorsque l alimentation est sous tension Seuils de tous les capteurs de tension de la carte mezzanine Seuil Indication Ev nement Description Valeur Confirmation Oui La tension est inf rieure au seuil non inf rieure critique non critique Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La tension est pass e d une valeur inf rieure inf rieure non critique une valeur normale non critique Annexe D Liste de capteurs 69 70 Seuils de tous les capteurs de tension de la carte mezzanine Seuil In
68. ion POST Power On Self Test Le BIOS du syst me fournit un test a la mise sous tension rudimentaire Les l ments de base n cessaires au fonctionnement du syst me sont v rifi s la m moire est test e le contr leur de disques et les disques connect s sont v rifi s et num r s et les deux contr leurs Intel Dual Gigabit Ethernet sont initialis s L avancement du test est indiqu par des codes POST Ces codes s affichent dans l angle inf rieur droit de l cran VGA du syst me lorsque le test est suffisamment avanc pour initialiser l cran Toutefois les codes s affichent au cours du test et disparaissent trop rapidement de l cran pour tre lus Une autre m thode d affichage des codes POST consiste rediriger la sortie de la console vers un port s rie voir la section Redirection de la sortie de la console page 26 Fonctionnement du test POST BIOS de la m moire Le test POST BIOS de la m moire est effectu de la mani re suivante 1 Le premier m gaoctet de la m moire DRAM est test par le BIOS avant la copie du code BIOS de la m moire ROM vers la m moire DRAM 2 Apr s la sortie de la m moire DRAM le BIOS ex cute un test de m moire simple criture lecture de chaque emplacement sous la forme 55aa55aa Remarque Si vous activez Quick Boot le BIOS ne teste pas la m moire Pour plus d informations reportez vous la section Modification des options du POST page 28
69. ion interne du serveur 4 Utilisation du logiciel de diagnostic Sun VTS 7 Ex cution de tests de diagnostic l aide de SunVTS 7 Documentation SunVTS 8 Analyse des probl mes du serveur l aide du CD de diagnostic initialisable 8 Conditions requises 8 Utilisation du CD de diagnostic initialisable 9 3 D pannage des probl mes DIMM 11 R gles de population DIMM 11 Remplacement des modules DIMM 12 Traitement des erreurs DIMM par le syst me 12 Erreurs DIMM non corrigibles 12 Erreurs DIMM corrigibles 14 Messages d erreur des DIMM du BIOS 15 Diodes d erreur des DIMM 16 Isolation et correction des erreurs de DIMM corrigibles 18 A Journaux des v nements et codes d autotest ala mise sous tension POST 21 Affichage des journaux des v nements 21 Test la mise sous tension POST Power On Self Test 25 Fonctionnement du test POST BIOS de la m moire 25 Redirection de la sortie de la console 26 Modification des options du POST 28 Codes POST 31 Points de contr le des codes POST 33 B Diodes d tat 37 Diode d tat externes 37 Diodes du panneau avant 38 Diodes du panneau arri re 38 Diodes du disque dur 39 Diodes d tat internes 39 iv Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Utilisation de l interface utilisateur graphique du processeur de service ILOM pour afficher les informations syst me 43 Etablissement d une connexion s rie au processeur de service 44 Affichage des jour
70. l de r f rence des utilitaires des serveurs x64 a Si HERD est install il copie les messages de dev mcelog vers var log messages a Si HERD n est pas install un programme appel mcelog copie les messages depuis dev mcelog to var log mcelog Le CD de diagnostic initialisable d crit dans le Chapitre 2 capture et consigne galement les erreurs corrigibles Messages d erreur des DIMM du BIOS Le BIOS affiche et consigne les messages d erreur des DIMM suivants NODE n Memory Configuration Mismatch Ce message d erreur est provoqu par les conditions suivantes a Les modules DIMM ne sont pas coupl s ex cution en mode 64 bits au lieu de 128 bits a Les vitesses des modules DIMM ne sont pas les m mes Les modules DIMM ne prennent pas en charge les erreurs ECC Les modules DIMM ne sont pas enregistr s a Le MCT s est arr t en raison d erreurs dans les modules DIMM a Le type de module DIMM tampon ne correspond pas a Les g n rations des modules DIMM g n ration I ou II ne sont pas les m mes a Les CL T des DIMM ne sont pas les m mes a Les banques d un module DIMM double face ne correspondent pas a Les organisations des DIMM ne sont pas les m mes 128 bits a La m moire SPD n a pas d informations Tre ou Trfc Chapitre 3 D pannage des probl mes DIMM 15 16 Diodes d erreur des DIMM Lorsque vous appuyez sur le bouton Press to See Fault Appuyer pour afficher l erreur sur la ca
71. l installation du noyau a RH3 Updated noyau unique RH4 Updatel a SLES9 SP1 m Le noyau Linux x86 64 kernel mce c r p te un rapport toutes les 30 secondes jusqu ce qu une autre erreur soit d tect e et qu un indicateur 8131 soit r initialis m Solaris prend en charge le diagnostic automatis et autocorrection pour la CPU et les sous syst mes de m moire Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 m La FIGURE E 2 montre un exemple d cran de journal DMI de la page de configuration du BIOS FIGURE E 2 cran de journal DMI erreur corrigible BIOS SETUP UTILITY View Event Log a PUE as 09 12 05 12 33 16 CC on Node 1 DIMM Pair 0 09 12 05 12 33 16 Single Bit ECC Memori Annexe E Traitement des erreurs 83 a Si au cours d une tape du test de m moire le BIOS est incapable de lire crire dans le module DIMM il proc de de la fa on suivante a Le BIOS d sactive le module DIMM comme d crit dans le message indiquant une diminution de la m moire de l EXEMPLE E 1 a Le BIOS consigne un enregistrement SEL a Le BIOS consigne un v nement dans le journal DMI EXEMPLE E 1 cran de journal DMI erreur corrigible diminution de m moire C Copyr igh 2002 American Megatrends I 84 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Traitement des erreurs de parit PERR Cette section contient quelques faits et
72. mations utilisateur dans l cran de configuration si n cessaire AA D sinstallation des vecteurs POST INT1Ch et INTO9h Annulation de l initialisation du module ADM AB Pr paration de BBS pour l initialisation Int 19 AC Programmation des chipsets NB SB n cessaires la fin du test POST juste avant l attribution du contr le au code d initialisation du syst me d exploitation Programmation de la mise en cache du BIOS syst me m moire vive fant me OF0000h Portage pour traiter les programmations OEM la fin du test POST Copie des donn es OEM de POST_DSEG vers RUN_CSEG B1 Enregistrement du contexte syst me pour ACPI 00 Pr paration de la CPU pour initialisation du syst me d exploitation par copie de tout le contexte du BSP vers tous les processeurs d applications pr sents REMARQUE les AP restent dans l tat CLI HLT 61 70 Erreur OEM POST Cette plage est r serv e aux fabricants de chipsets et de syst mes L erreur associ e cette valeur peut varier en fonction de la plate forme 36 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 ANNEXE Diodes d tat Cette annexe contient des informations sur l emplacement et le comportement des diodes du serveur Elle d crit les diodes situ es sur la partie externe du serveur ainsi que les diodes internes qui sont uniquement visibles lorsque vous retirez le capot principal du serveur Diode d tat externes Reportez vous aux ch
73. me de d pannage Utilisez le diagramme suivant pour savoir quelles sections consulter dans ce guide pour d panner le serveur TABLEAU 1 1 Diagramme de d pannage Pour effectuer cette tache Reportez vous cette section Collecte des informations de Collecte des informations de maintenance page 2 maintenance initiales Examen des probl mes de mise sous D pannage des probl mes d alimentation page 3 tension Inspection visuelle de l ext rieur et de Inspection externe du serveur page 3 l int rieur Inspection interne du serveur page 4 Chapitre 3 Consultation des journaux des Affichage des journaux des v nements page 21 v nements du BIOS et des messages Test la mise sous tension POST Power On Self de l autotest la mise sous tension Test page 25 POST TABLEAU 1 1 Diagramme de d pannage suite Pour effectuer cette tache Reportez vous a cette section Consultation des journaux du Utilisation de l interface utilisateur graphique du processeur de service et des processeur de service ILOM pour afficher les informations des capteurs informations syst me page 43 ou consultation des journaux du Utilisation de IPMItool pour afficher les processeur de service et des informations syst me page 55 informations des capteurs Ex cution des diagnostics SunVTS Analyse des probl mes du serveur a l aide du CD de diagnostic initialisable pa
74. n critique Action la diode de d faillance de l alimentation la diode de d faillance de la CPU X et la diode d alerte du syst me sont allum es Valeur Confirmation Oui La tension de la CPU X est inf rieure au seuil inf rieure irr cup rable inf rieur irr cup rable Action la diode de d faillance de l alimentation la diode de d faillance de la CPU X et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La tension de la CPU X est pass e d une inf rieure valeur inf rieure irr cup rable une valeur irr cup rable inf rieure critique Action la diode de d faillance de l alimentation la diode de d faillance de la CPU X et la diode d alerte du syst me sont allum es Valeur Confirmation Oui La tension de la CPU X est sup rieure au sup rieure seuil sup rieur non critique non critique Action la diode de d faillance de l alimentation la diode de d faillance de la CPU X et la diode d alerte du syst me sont allum es Annexe D Liste de capteurs 73 Seuils de tous les capteurs de tension de la CPU Seuil Indication v nement Description Valeur Infirmation Oui La tension de la CPU X est pass e d une sup rieure valeur sup rieure non critique une valeur non critique normale Action la diode de d faillance de l alimentation la diode de d faillance de la CPU X et la diode d alerte du syst me sont teintes Valeur Confirmation Oui La tension de la CPU X est sup rieure a
75. n de la m thode sp cifique de l OEM pour d terminer si la r cup ration du BIOS est forc e Si le code suivant est EO la r cup ration du BIOS s ex cute Test de la somme de contr le du BIOS principal 01d7 Restauration de CPUID transfert du module d interface d ex cution du bloc d initialisation vers la RAM d termine si l ex cution flash s rie est n cessaire 01d8 D compression du module d ex cution dans la m moire RAM Stockage des informations CPUID en m moire 01d9 Copie du BIOS principal dans la m moire Olda Prise de contr le du POST BIOS 0004 V rification de l octet de diagnostic CMOS pour d terminer si l alimentation de la batterie fonctionne correctement et si la somme de contr le CMOS est correcte Si la somme de contr le est incorrecte mise jour de CMOS avec les valeurs par d faut la mise sous tension 00c2 Configuration du processeur d initialisation pour POST Cela inclut le calcul de fr quence le chargement du microcode BSP et l application de la valeur demand e par l utilisateur pour la question de configuration de signalisation d erreur GART 00c3 Application au BSP des corrections des errata 78 amp 110 00c6 R activation du cache pour le processeur d initialisation et application dans le BSP des corrections des errata 106 107 69 et 63 si n cessaire 00c7 HT d finit les valeurs finales de fr quences et de largeurs de liaisons Annexe Journaux des v nements et codes
76. naux des v nements du processeur de service ILOM 45 Interpr tation des horodatages du journal des v nements 48 Affichage des informations sur les composants rempla ables 49 Affichage des capteurs 51 Liste de capteurs 55 Capteurs du syst me 55 sys intsw 55 sys acpi 56 sys nmi 56 sys power btn 56 sys reset btn 56 sys locate btn 57 Capteurs discrets de la CPU 0 57 pO prsnt 57 p0 prochot 57 Capteurs discrets de la CPU1 58 pl prsnt 58 pl prochot 58 Capteurs discrets de la CPU 2 Sun Fire X4440 uniquement 58 p2 prsnt 58 p2 prochot 59 Capteurs discrets de la CPU 3 Sun Fire X4440 uniquement 59 p3 prsnt 59 p3 prochot 59 Sommaire v Capteurs d alimentation lectrique 60 ps0 prsnt 60 ps0 vinok 60 ps0 pwrok 61 psl prsnt 61 psl vinok 62 psl pwrok 62 Capteurs de temp rature de contr le des ventilateurs 63 sys t_ amb 63 p0 t core 64 plt core 64 p2 t_core 64 p3 t_core 64 Autres capteurs de temp rature 65 mb t_core 65 mezz t_core 65 Capteurs de tension de la carte m re 66 mb v_bat 66 mb v_ 3v3stby 66 mb v_ 3v3 66 mb v_ 5v 66 mb v_ 12v 66 mb v_ 1v5 66 mb v_ 1v2ht 67 mb v_ 1 4 67 vi Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Capteurs de tension de la carte Mezzanine Sun Fire X4440 uniquement 69 mezz v_ 3v3stby 69 mezz v_ 3v3 69 mezz v_ 12vV 69 mezz v_ lv2ht 69 Capteurs de tension de la CPU 72 pX v_vddcore 72 pX v_ 1v8 72 pX v_ 0v9 72 pX v_vddnb 72 Capteurs de
77. nd pendamment du bouton Press to See Fault et n utilise pas l lectricit stock e Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Reportez vous a la FIGURE 3 1 pour connaitre l emplacement des modules DIMM et des diodes sur la carte m re Reportez vous a la FIGURE 3 2 pour connaitre l emplacement des modules DIMM et des diodes sur la carte mezzanine FIGURE 3 1 Modules DIMM et diodes de la carte m re Ventilateurs 3 4 5 6 7 ano D faillance de la CPU Bouton Press to see fault Chapitre 3 D pannage des probl mes DIMM 17 Ventilateurs 3 210 FIGURE 3 2 Modules DIMM et diodes de la carte mezzanine 4 012 3 ll LES D faillance de la CPU2 a5 an D faillance de la CPU3 Le Bouton Press to see fault m m Erreur de la carte m re Isolation et correction des erreurs de DIMM corrigibles Si vos fichiers journaux indiquent une erreur corrigible ou un probl me li un module DIMM suivez les tapes ci dessous pour isoler l erreur Dans cet exemple le fichier journal consigne une erreur li e la carte DIMM situ e dans la CPUO emplacement 7 Les diodes d erreur de la CPU 0 emplacements 6 et 7 sont allum es Pour isoler et corriger les erreurs de DIMM corrigibles 1 Si vous ne l avez pas encore fait mettez votre serveur en mode d alimentation de secours et retirez le capot 2 Inspectez les DIMM install s pour vous assurer qu ils
78. ne peut Le BIOS passe au p riph rique de Journal DMI Non fatale p riph rique de d marrage pas red marrer depuis un p riph rique de la liste de p riph riques de d marrage d marrage suivant de la liste Si tous les p riph riques de la liste sont d faillants un message d erreur est affich et le BIOS retente de d marrer depuis le premier p riph rique de la liste Le processeur de contr le peut contr ler modifier l ordre de d marrage 96 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Index A Arr t d urgence 4 Arr t progressif 4 Arr t proc dure 4 Autotest a la mise sous tension voir POST B BIOS Codes POST 31 Journaux des v nements 21 Modification des options d autotest la mise sous tension 28 Points de contr les des codes POST 33 Pr sentation de l autotest la mise sous tension POST 25 Redirection de la sortie de la console pour l autotest la mise sous tension 26 Bouton d alimentation 5 C Capteurs Affichage l aide de l interface du processeur de service ILOM 51 CD de diagnostic initialisable 8 Commentaires et suggestions xii Connexion s rie au processeur de service ILOM 44 Conventions typographiques xi D D pannage instructions g n rales 2 DIMM Diodes d erreur 16 Gestion des erreurs 12 Isolation des erreurs 18 R gles de population 11 Diodes Externes 37 Diodes ports et emplacements illustration
79. nt et que l alimentation syst me fonctionne tat v nement Description tat infirm Oui L alimentation 0 est hors tension tat confirm Oui L alimentation 0 est sous tension Dans l tat infirm la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es psl prsnt Ce capteur indique si l alimentation lectrique 1 est pr sente Dans les syst mes ayant deux alimentations lectriques la configuration de l alimentation est redondante si bien que lorsque l alimentation 1 est retir e les diodes d tat d alimentation sont allum es tat v nement Description P riph rique absent Oui L alimentation 1 est absente P riph rique pr sent Oui L alimentation 1 est pr sente Lorsque le p riph rique est absent la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Annexe D Liste de capteurs 61 62 psi vinok Ce capteur indique si l alimentation lectrique 1 est reli e une source de courant alternatif Ce capteur est uniquement surveill lorsque PS1 est pr sent tat v nement Description tat infirm Oui L alimentation lectrique 1 n est reli e aucune source de courant alternatif tat confirm Oui L alimentation lectrique 1 est reli e une source de courant alternatif Dans l tat infirm la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es psi pwr
80. ok Ce capteur indique si l alimentation lectrique 1 est activ e et alimente le syst me Ce capteur est uniquement surveill lorsque PS1 est pr sent et que l alimentation syst me fonctionne tat v nement Description tat infirm Oui L alimentation 1 est hors tension tat confirm Oui L alimentation 1 est sous tension Dans l tat infirm la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Capteurs de temp rature de contr le des ventilateurs Les capteurs de temp rature de cette cat gorie sont utilis s en entr e pour l algorithme de contr le de ventilateur Ils servent galement mettre le syst me hors tension s ils sont irr cup rables Leur tat affecte aussi celui des diodes du panneau avant sys t_amb Ce capteur surveille la temp rature ambiante du syst me l aide d une puce LM75 Seuil Valeur sup rieure non critique Valeur sup rieure non critique Valeur sup rieure critique Valeur sup rieure critique Valeur sup rieure irr cup rable Valeur sup rieure irr cup rable Indication Confirmation Infirmation Confirmation Infirmation Confirmation Infirmation v nement Oui Oui Oui Oui Oui Oui Description La temp rature ambiante est sup rieure au seuil non critique Action aucune La temp rature
81. on 03 04 05 06 CO C1 C2 C3 C5 C6 D sactivation de NMI de la parit de la vid o EGA et des contr leurs DMA ce stade seuls les acc s ROM se font vers GPNV Si la taille BB est gale 64 Ko ROM Decode doit tre activ en dessous de FFFF0000h USB doit pouvoir fonctionner dans le segment E000 HT doit programmer l initialisation NB et l initialisation OEM et peut les programmer si n cessaire au d but du POST ce qui revient remplacer les valeurs par d faut des variables du noyau V rification de l octet de diagnostic CMOS pour d terminer si l alimentation de la batterie fonctionne correctement et si la somme de contr le CMOS est correcte V rification manuelle de la somme de contr le CMOS par lecture de la zone de stockage Si la somme de contr le CMOS est incorrecte mise jour CMOS avec les valeurs par d faut la mise sous tension et effacement des mots de passe Initialisation du registre d tats A Initialisation des variables de donn es bas es sur les questions de configuration CMOS Initialisation des deux PIC compatibles 8259 dans le syst me Initialisation du mat riel de contr le des interruptions PCI g n ralement et du tableau des vecteurs d interruption Test L E sur le registre comptable CH 2 Initialisation de CH 0 comme minuteur syst me Installation du gestionnaire POSTINT1Ch Activation d IRQ 0 dans PIC pour interruption du minuteur syst me D routement du vecteur
82. p docs sun com Choisissez une langue dans la liste d roulante de documents relatifs aux serveurs Sun Fire X4140 X4240 et X4440 a l aide du lien de Product category Cat gorie de produit Des versions traduites de la documentation relative aux serveurs Sun Fire X4140 X4240 et X4440 sont disponibles en chinois simplifi chinois traditionnel fran ais japonais et cor en Veuillez noter que la documentation anglaise est r vis e plus fr quemment Par cons quent elle est peut tre plus jour que la documentation traduite Pour toute la documentation Sun rendez vous sur l URL suivante http docs sun com Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Conventions typographiques Police de caract res Signification Exemples AaBbCc123 Noms de commandes de fichiers Modifiez le fichier login et de r pertoires informations Utilisez 1s a pour afficher la liste de affich es l cran tous les fichiers Vous avez du courrier AaBbCc123 Ce que vous tapez est mis en su vidence par rapport aux Password informations affich es l cran AaBbCc123 Titres de manuels nouveaux Consultez le chapitre 6 du Guide de termes mots souligner Remplacement de variables de ligne de commande par des noms ou des valeurs r els l utilisateur Elles sont appel es des options de classe Vous devez tre superutilisateur pour pouvoir effectuer cette op ration Pour supprimer un
83. que Si vous vous connectez au port s rie du processeur de service avant de l avoir mis sous tension ou pendant sa s quence de mise sous tension des messages d initialisation apparaissent Le processeur de service affiche ensuite une invite de connexion Par exemple SUNSP0003BA84D777 login La premi re cha ne dans l invite est le nom de l h te par d faut pour le processeur de service ILOM Ce nom est compos du pr fixe SUNSP et de l adresse MAC du processeur de service ILOM L adresse MAC de chaque processeur de service ILOM est unique 3 Connectez vous au processeur de service et tapez le nom d utilisateur par d faut root et le mot de passe par d faut changeme Une fois que vous tes connect le processeur de service affiche l invite de commande par d faut gt 4 Pour d marrer la console s rie tapez cd SP console start Pour quitter le mode de console et revenir au processeur de service tapez Echap Maj 9 m Effectuez les proc dures suivantes Affichage des journaux des v nements du processeur de service ILOM page 45 a Affichage des informations sur les composants rempla ables page 49 a Affichage des capteurs page 51 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Affichage des journaux des v nements du processeur de service ILOM Les v nements sont des notifications qui se produisent en r ponse des actions Le jou
84. rface graphique Web ILOM et l interface IPMI Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Affichage des informations sur les composants remplacables Selon le composant que vous s lectionnez des informations portant sur le fabricant le nom du composant son num ro de s rie et de r f rence peuvent s afficher Pour afficher des informations sur les composants remplacables 1 Connectez vous au processeur de service en tant qu administrateur ou op rateur pour acc der l interface graphique Web ILOM a Entrez l adresse IP du processeur de service dans votre navigateur Web L cran Sun Integrated Lights Out Manager Login Connexion ILOM s affiche b Saisissez votre nom d utilisateur et votre mot de passe Lorsque vous tentez d acc der pour la premi re fois au processeur de service ILOM vous tes invit taper le nom utilisateur et le mot de passe par d faut Ce nom d utilisateur et le mot de passe par d faut sont les suivants Nom d utilisateur par d faut root Mot de passe par d faut changeme Annexe C Utilisation de l interface utilisateur graphique du processeur de service ILOM pour afficher les informations syst me 49 2 Dans l onglet System Information Informations syst me choisissez Components Composants La page Replaceable Component Information Informations sur les composants remplacables s affiche Reportez vous la FIGURE C 2 FIGURE C 2 Page d inform
85. rnal des v nements syst me SEL IPMI fournit des informations sur l tat du mat riel et des logiciels du serveur Sun au logiciel ILOM qui affiche les v nements dans l interface graphique Web Pour afficher les journaux des v nements 1 Connectez vous au processeur de service en tant qu administrateur ou op rateur pour acc der l interface graphique Web ILOM a Entrez l adresse IP du processeur de service dans votre navigateur Web L cran Sun Integrated Lights Out Manager Login Connexion ILOM s affiche b Saisissez votre nom d utilisateur et votre mot de passe Lorsque vous tentez d acc der pour la premi re fois au processeur de service ILOM vous tes invit taper le nom utilisateur et le mot de passe par d faut Ce nom d utilisateur et le mot de passe par d faut sont les suivants Nom d utilisateur par d faut root Mot de passe par d faut changeme Annexe C Utilisation de l interface utilisateur graphique du processeur de service ILOM pour afficher les informations syst me 45 2 Dans l onglet System Monitoring Surveillance du syst me choisissez Event Logs Journaux des v nements La page System Event Logs Journaux des v nements syst me s affiche Reportez vous la FIGURE C 1 pour voir un exemple de page d informations FIGURE C 1 Page de journal des v nements syst me REFRESH Loc OUT 1 Information System Monitoring Sensor Readings Indicators Event
86. rocessor Hot de la CPU 3 est infirm Annexe D Liste de capteurs 59 Capteurs d alimentation lectrique ps0 prsnt Ce capteur indique si l alimentation lectrique 0 est pr sente Dans les syst mes ayant deux alimentations lectriques la configuration de l alimentation est redondante si bien que lorsque l alimentation 0 est retir e les diodes d tat d alimentation sont allum es tat v nement Description P riph rique absent Oui L alimentation 0 est absente P riph rique pr sent Oui L alimentation 0 est pr sente Lorsque le p riph rique est absent la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es ps0 vinok Ce capteur indique si l alimentation lectrique 0 est reli e une source de courant alternatif Ce capteur est uniquement surveill lorsque PS0 est pr sent tat v nement Description tat infirm Oui L alimentation lectrique 0 n est reli e aucune source de courant alternatif tat confirm Oui L alimentation lectrique 0 est reli e une source de courant alternatif Dans l tat infirm la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es 60 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 ps0 pwrok Ce capteur indique si l alimentation lectrique 0 est activ e et alimente le syst me Ce capteur est uniquement surveill lorsque PSO est pr se
87. rreur consign e par le journal SEL l aide de IPMI 2 0 est donn ci dessous a Lorsque la m moire basse est erron e le BIOS se bloque lors du test de m moire basse de pr initialisation car il ne peut pas s auto d compresser dans la DRAM d faillante et ex cuter les l ments suivants ipmitool gt sel list 100 08 26 2005 11 36 09 OEM 0xfb 200 08 26 2005 11 36 12 System Firmware Error No usable system memory 300 08 26 2005 11 36 12 Memory Memory Device Disabled CPU 0 DIMM 0 a Lorsque le module DIMM d faillant est sup rieur l espace d extraction de m moire basse de 1 Mo du BIOS une r initialisation correcte se produit ipmitool gt sel list 100 26 08 05 05 04 04 OEM 0xfb 200 26 08 05 05 04 09 Memory Memory Device Disabled CPU 0 DIMM 0 m Notez les consid rations suivantes pour cette r vision a Les erreurs de m moire ECC non corrigibles ne sont pas consign es a Les erreurs ECC multibits sont consign es avec un message indiquant que le p riph rique de m moir st d sactiv Lors de la premi re r initialisation le BIOS consigne une erreur d HyperTransport dans le journal DMI Le BIOS d sactive le module DIMM a Le BIOS envoie les enregistrements du journal SEL au BMC a Le BIOS est r initialis a Le BIOS ignore le module DIMM d fectueux lors du test de m moire de l autotest la mise sous tension suivant a
88. rte m re ou la carte mezzanine les diodes situ es pr s des modules DIMM clignotent pour indiquer que le syst me a d tect 24 erreurs corrigibles ou plus dans ce module DIMM pendant une p riode de 24 heures Remarque Les diodes d erreur des DIMM et de la carte m re peuvent fonctionner avec l lectricit stock e pendant jusqu une minute lorsque le syst me est mis hors tension m me lorsque l alimentation lectrique est d connect e et que la carte m re ou mezzanine est retir e du syst me L lectricit stock e a une autonomie d environ une demi heure Remarque Lorsque l alimentation est d connect e la diode d erreur s teint Pour r cup rer des informations sur l erreur consultez le journal SEL du processeur de service comme d crit dans le document Sun Integrated Lights Out Manager 2 0 User s Guide Guide de l utilisateur de Sun Integrated Lights Out Manager 2 0 m Diode d erreur des DIMM teinte le module DIMM fonctionne correctement m Diode d erreur des DIMM clignotante orange au moins l un des modules DIMM de cette paire a signal 24 erreurs corrigibles pendant une p riode de 24 heures a Diode d erreur de la carte m re sur la carte mezzanine allum e une erreur s est produite sur la carte m re Cette diode est pr sente car les diodes de la carte m re sont masqu es lorsqu une carte mezzanine est install e Remarque La diode d erreur de la carte m re fonctionne i
89. s au manuel d entretien de votre serveur V rifiez que les modules DIMM install s sont conformes aux r gles de population et aux configurations des DIMM comme d crit dans la section R gles de population DIMM page 11 Replacez le capot du serveur Pour remettre le serveur en mode d alimentation principale avec tous les composants sous tension utilisez un stylo a bille ou un stylet pour maintenir le bouton d alimentation du panneau avant enfonc Voir la FIGURE 1 1 et la FIGURE 1 2 Lorsque l alimentation principale alimente l ensemble du serveur la diode d alimentation OK situ e c t du bouton d alimentation s allume en continu Si le probl me li au serveur n est pas vident consultez les messages de l autotest la mise sous tension et les journaux des v nements du BIOS au d marrage du syst me pour obtenir plus d informations Poursuivez en vous reportant la section Affichage des journaux des v nements page 21 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 CHAPITRE 2 Utilisation du logiciel de diagnostic SunVTS Ce chapitre contient des informations sur le logiciel de diagnostic SunVTS Ex cution de tests de diagnostic a l aide de SunVTS Les serveurs sont livr s avec un CD de diagnostic initialisable qui contient le logiciel Sun Validation Test Suite SunVTS SunVTS est un outil de diagnostic complet qui permet de tester et de valider le ma
90. se processeur de continu est infirm en mode d alimentation de secours etla service continu depuis les diode d alimentation clignote pour convertisseurs indiquer le mode de secours continu continu Tension Le processeur de Les diodes de demande d op ration de Journal SEL du Fatale sup rieure inf service surveille maintenance et de d faillance de processeur de rieure la les tensions du l alimentation lectrique clignotent service limite syst me et d tecte une tension sup rieure ou inf rieure un seuil donn Annexe E Traitement des erreurs 95 TABLEAU E 1 Synth se du traitement des erreurs de mat riel suite Consign e journal DMI ou journal SEL du processeur Erreur Description Traitement de service Fatale Temp rature Le processeur de Les diodes de demande d op ration de Journal SEL du Fatale lev e service surveille maintenance et de surchauffe du processeur de les temp ratures syst me clignotent La carte m re est service de la CPU et du mise hors tension au del du niveau syst me et critique sp cifi d tecte des temp ratures sup rieures un seuil donn Surchauffe du La CPU Le CPLD met la CPU hors tension Les Journal SEL du Fatale processeur d clenche le diodes de demande d op ration de processeur de signal maintenance et de surchauffe du service THERMTRIP_L syst me clignotent lors de la d tection d une condition de surchauffe D faillance de Le BIOS
91. sion dans le ch ssis D s que le capot du ch ssis correspondant l emplacement de la CPU est ouvert le capteur consigne un v nement tat v nement Description Intrusion Oui Cet tat indique que le commutateur d intrusion dans g n rale dans le ch ssis a t activ le ch ssis Non Cet tat indique que le commutateur d intrusion dans le ch ssis est inactif et n est pas enclench 55 sys acpi Ce capteur indique l tat de l alimentation ACPI du syst me tat v nement Description S0 G0 en tat de Oui L alimentation du syst me est fonctionnement activ e S0 S5 G2 hors tension Oui L alimentation du syst me est d sactiv e S5 sys nmi Ce capteur surveille le bouton NMI arri re tat v nement Description Interrupteur Oui Bouton vidage NMI enfonc NMI Diag sys power btn Ce capteur surveille le bouton d alimentation du syst me tat v nement Description Bouton d alimentation Oui Bouton d alimentation enfonc enfonc sys reset btn Ce capteur surveille le bouton de r initialisation arri re tat v nement Description Bouton de Oui Bouton de r initialisation r initialisation enfonc enfonc 56 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 sys locate btn Ce capteur surveille le bouton de rep rage du syst me Etat Ev nement Description Confirm Oui Bouton de rep rage
92. sont conformes aux r gles d crites dans R gles de population DIMM page 11 18 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 3 Appuyez sur le bouton PRESS TO SEE FAULT et inspectez les diodes d erreur de DIMM Voir la FIGURE 3 1 et la FIGURE 3 2 Une diode qui clignote indique un composant d fectueux m Pour les erreurs corrigibles les diodes identifient le module DIMM sur lequel des erreurs ont t d tect es Pour les erreurs non corrigibles les deux diodes de la paire de DIMM clignotent s il existe un probl me li a l un des deux modules DIMM de la paire Remarque Si votre serveur est quip d une carte mezzanine celle ci masque les DIMM et les diodes de la carte m re Cependant les diodes d erreur de la carte m re s allument pour indiquer qu il existe un probl me sur la carte m re seulement si l alimentation lectrique est toujours connect e Si la diode d erreur de la carte m re sur la carte mezzanine s allume retirez la carte mezzanine comme d crit dans le manuel d entretien de votre serveur et inspectez les diodes de la carte m re 4 D branchez les cordons d alimentation lectrique du serveur Attention Avant de manipuler les composants reliez un bracelet antistatique la masse du ch ssis toute surface m tallique peinte Les cartes de circuits imprim s et les disques durs du syst me contiennent des composants extr mement sensibles l
93. syst me sont teintes Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Seuils de tous les capteurs de tension de la carte mezzanine Seuil Indication Ev nement Description Valeur Confirmation Oui La tension est sup rieure au seuil sup rieur sup rieure critique critique Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La tension est pass e d une valeur sup rieure sup rieure critique une valeur sup rieure critique non critique Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Valeur Confirmation Oui La tension est sup rieure au seuil sup rieur sup rieure irr cup rable irr cup rable Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La tension est pass e d une valeur sup rieure sup rieure irr cup rable une valeur irr cup rable sup rieure critique Action la diode de d faillance de l alimentation et la diode d alerte du syst me sont allum es Annexe D Liste de capteurs 71 Capteurs de tension de la CPU Tous les capteurs de tension de la CPU sont configur s pour g n rer les m mes v nements et les erreurs sont trait es de la m me mani re X est 0 3 sur le serveur Sun Fire X4440 et 0 1 sur les serveurs Sun Fire X4140 et X4240 pX v_vddcore Ce capt
94. t riel Sun en v rifiant la connectivit et les fonctionnalit s de la plupart des contr leurs et des p riph riques sur des plates formes Sun Le logiciel SunVTS peut tre personnalis avec des instances de test modifiables et des fonctions d affinit de processeur Les tests suivants sont pris en charge sur les plates formes x86 Test CD DVD cddvdtest Test CPU cputest Test cryptographique cryptotest Test des lecteurs de disque et de disquette disktest Test du rechargement TLB dtlbtest Test de la carte HBA Emulex emixtest Test des unit s en virgule flottante fputest Test des cartes InfiniBand Host Channel Adapter ibhcatest Test du cache de donn es de niveau 1 I1dcachetest m Test de la SRAM de niveau 2 12sramtest m Test en boucle Ethernet netlbtest m Test du mat riel r seau nettest m Test de la m moire physique pmemtest a Test de l adaptateur de bus h te HBA QLogic qlctest m Test de la RAM ramtest a Test du port s rie serialtest m Test syst me systest m Test du lecteur de bande tapetest m Test USB Universal Serial Board usbtest m Test de la m moire virtuelle vmemtest Le logiciel SunVTS offre une interface utilisateur graphique sophistiqu e pour configurer les tests et surveiller leur tat d avancement Cette interface peut tre ex cut e sur un syst me pour afficher les tests SunVTS d un autre syst me situ sur le r seau Une interface en mode TTY est
95. tialisation appuyez sur F1 pour continuer Le BIOS affiche un message d erreur Non fatale consigne l erreur dans le journal DMI et lance une initialisation Journal DMI Annexe E Traitement des erreurs 93 TABLEAU E 1 Synth se du traitement des erreurs de mat riel suite Consign e journal DMI ou journal SEL du processeur Erreur Description Traitement de service Fatale Somme de La v rification de Le BIOS affiche un message d erreur Journal DMI Non fatale contr le CMOS la somme de consigne l erreur dans le journal DMI et POST BIOS contr le du lance une initialisation incorrecte contenu du CMOS a chou Configuration Le BIOS prend en Le BIOS affiche un message d erreur Journal DMI Fatale de CPU non charge les consigne l erreur et arr te le syst me prise en charge fr quences et instructions non concordantes dans la configuration CPU mais certaines CPU peuvent ne pas tre prises en charge Erreur La CPU d tecte La CPU corrige l erreur dans le Journal DMI Fonctionnement corrigible plusieurs erreurs mat riel Aucune interruption d erreur Journal SEL du normal corrigibles dans machine n est g n r e par le mat riel processeur de les registres L interrogation est d clench e toutes service MCi_STATUS les demi secondes par les interruptions du minuteur SMI et est effectu e par le gestionnaire SMI du BIOS Le gestionnaire SMI consigne un message dans le journal SEL du processeur de service si c
96. ts ISYS MB PO PROCHOT Entity Fault State Deasserted ISYSIMBIPTIPRSNT Entity Presence Present ISYSIMB P1 T_CORE Temperature 16 000 degrees C a IOYVOIMDODA At VON AOC m Voltaren A AANNalte 52 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 3 Cliquez sur le bouton Refresh Rafraichir pour actualiser les valeurs des capteurs 4 Cliquez sur un capteur pour afficher ses seuils Les propri t s et les valeurs du capteur s affichent Reportez vous l exemple de la FIGURE C 4 FIGURE C 4 Page de d tails d un capteur https 10 6 143 113 Mozilla Firefox Sun Integrated Lights Out Manager View all ofthe properties and values for a sensor SYS MB PO PRSNT Property Value type Entity Presence class Discrete Sensor value Present Done 10 6 143 113 amp 5 Si le probl me de serveur n est pas vident apr s avoir consult les informations sur les valeurs des capteurs reportez vous la section Ex cution de tests de diagnostic l aide de SunVTS page 7 Annexe C Utilisation de l interface utilisateur graphique du processeur de service ILOM pour afficher les informations syst me 53 ANNEXE D Liste de capteurs Cette annexe d crit les capteurs des serveurs Sun Fire X4140 X4240 et X4440 Les instructions relatives l affichage des capteurs sont fournies l Annexe C Capteurs du syst me sys intsw Ce capteur indique l tat du commutateur d intru
97. u sup rieure seuil sup rieur critique critique Action la diode de d faillance de l alimentation la diode de d faillance de la CPU X et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La tension de la CPU X est pass e d une sup rieure valeur sup rieure critique une valeur critique sup rieure non critique Action la diode de d faillance de l alimentation la diode de d faillance de la CPU X et la diode d alerte du syst me sont allum es Valeur Confirmation Oui La tension de la CPU X est sup rieure au sup rieure seuil sup rieur irr cup rable irr cup rable Action la diode de d faillance de l alimentation la diode de d faillance de la CPU X et la diode d alerte du syst me sont allum es Valeur Infirmation Oui La tension de la CPU X est pass e d une sup rieure valeur sup rieure irr cup rable une valeur irr cup rable sup rieure critique Action la diode de d faillance de l alimentation la diode de d faillance de la CPU X et la diode d alerte du syst me sont allum es 74 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Capteurs de pr sence de ventilateurs Le chassis comprend des capteurs qui indiquent la pr sence physique d un module de ventilateur individuel fbX fmY prsnt Ce capteur indique la pr sence du module de ventilateur Y sur la carte de ventilateurs X Etat v nement Description P riph rique absent Oui Cet tat
98. ues 152a Unit s PCI Initialisation des unit s statiques 252a Unit s PCI Initialisation des unit s de sortie 202c Initialisation de diff rentes unit s D tection et initialisation de l adaptateur vid o install dans le syst me ayant des ROM en option 002e Initialisation de toutes les unit s de sortie 0033 Initialisation du module d initialisation silencieuse Configuration de la fen tre pour affichage des informations texte 0037 Affichage d un message de connexion des informations CPU du message de touche de configuration et des informations OEM 4538 Unit s PCI Initialisation des unit s IPL 5538 Unit s PCI Initialisation des unit s g n rales 8600 Pr paration de la CPU pour initialisation du syst me d exploitation par copie de tout le contexte du BSP vers tous les processeurs d applications pr sents REMARQUE les AP restent dans l tat CLI HLT 32 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Points de contr le des codes POST Les points de contr le des codes POST correspondent au groupe de points de contr le le plus important au cours de la pr initialisation du BIOS Le TABLEAU A 2 d crit les types de points de contr le qui peuvent tre g n r s lors de la phase POST du BIOS Ces points de contr le deux chiffres correspondent la sortie du port 80 le port d E S principal TABLEAU A 2 Points de contr le des codes POST Code POST Descripti
99. un nom d utilisateur et un mot de passe comme suit m User Name root Password changeme L cran en cours du POST s affiche Annexe Journaux des v nements et codes d autotest la mise sous tension POST 27 Modification des options du POST Ces instructions sont facultatives mais vous pouvez les utiliser pour modifier les op rations ex cut es par le serveur au cours du test POST Pour modifier les options du POST 1 Initialisez l utilitaire de configuration du BIOS en appuyant sur la touche F2 pendant que le syst me effectue le test la mise sous tension POST L cran du menu principal du BIOS s affiche 2 S lectionnez Boot Initialisation L cran Boot Settings Param tres d initialisation s affiche Main Advanced PCIPnP Boot Security Chipset Exit kkkxkxkxkxkxkkkxkxkxkxkkkkkxkkkkxkxkkkkkkxkkkkxkkxkkkkxkkkkkkkkkkkkkxkkkkkkxkkkkkxkkkkkkxkkkkkkkxkxk Boot Settings Configure Settings x kkxkxkxkxkxkkxkxkxkkkkxkxkkkkxkxkxkkkxkxkxkkkkkkxkkkkxkxkxkkkxkxkxkkkkkkkk OK during System Boot Boot Settings Configuration bs x Boot Device Priority Hard Disk Drives X CD DVD Drives x x i RTE Select Screen 7 Fees Select Item Enter Go to Sub Screen EI General Help F10 Save and Exit i ESC Exit x kkkxkxkxkxkxkkkxkxkxkkkkxkxkkkkkxkxkkkkkkkkkkxkkxkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkxkkkkkkkxkxk v02 61 C Copyright 1985
100. urs de m moire sont noirs ou blancs pour indiquer les emplacements associ s Les modules DIMM sont install s de l ext rieur extr mit la plus loign e de la CPU vers l int rieur Les modules DIMM des CPU dot es d une seule paire de modules DIMM doivent tre install s dans les emplacements DIMM externes blancs de la CPU 6 et 7 Voir la FIGURE 3 1 et la FIGURE 3 2 Seuls les modules DIMM DDR2 800 Mhz 667 Mhz et 533 Mhz sont pris en charge Chaque paire de modules DIMM doit tre identique m mes fabricant taille et vitesse 11 Remplacement des modules DIMM Le remplacement d un module DIMM est requis lorsque l un des v nements suivants se produit m Le test de m moire du module DIMM choue dans le BIOS en raison d une erreur de m moire non corrigible m Des erreurs non corrigibles provenant de la m moire se produisent En outre vous devez remplacer un module DIMM chaque fois que plus de 24 erreurs corrigibles se produisent en l espace de 24 heures sur ce module et qu aucun autre module DIMM n indique des erreurs corrigibles m Si plusieurs DIMM indiquent des erreurs corrigibles ces erreurs peuvent avoir d autres causes possibles qui doivent tre examin es par un technicien Sun qualifi avant que vous ne remplaciez les modules DIMM Conservez des copies des fichiers journaux indiquant les erreurs de m moire pour les envoyer Sun avant d appeler le service technique Traitement des erreurs DI
101. usage futur Ne la changez pas a Default Boot Order Ordre d initialisation par d faut les lettres entre crochets repr sentent les p riph riques de d marrage Pour voir les lettres d finies positionnez votre curseur sur le champ et lisez la d finition droite de l cran 30 Guide de diagnostic des serveurs Sun Fire X4140 X4240 et X4440 Juin 2008 Codes POST Le TABLEAU A 1 contient des descriptions de chaque code POST dans l ordre dans lequel ils sont g n r s Ces codes POST sont constitu s de quatre chiffres deux chiffres correspondant la sortie du port d E S principal 80 et deux chiffres correspondant la sortie du port d E S 81 Dans les codes POST du TABLEAU A 1 les deux premiers ports correspondent au port 81 et les deux derniers au port 80 TABLEAU A 1 Codes POST Code POST Description 00d0 Sortie de POR initialisation de l espace de configuration PCI activation de SMBus 8111 00d2 D sactivation du cache redimensionnement complet de la m moire et v rification de l activation du mode Flat 00d3 D tections de m moire et redimensionnement du bloc d initialisation cache d sactiv et APIC IO activ 01d4 Test de la m moire de base 512 Ko Ajustement des strat gies et mise en cache des premiers 8Mo 01d5 Copie du bloc d initialisation de la m moire ROM vers la m moire RAM inf rieure Le BIOS s ex cute maintenant en dehors de la m moire RAM 01d6 S quence de touches et v rificatio
102. v nements le tableau Event Log Journal des v nements est actualis avec les v nements sp cifi s Les champs du journal des v nements sont d crits dans le TABLEAU C 1 TABLEAU C 1 Champs du journal des v nements Champ Description Event ID ID d v nement Time Stamp Horodatage Sensor Name Nom du capteur Sensor Type Type de capteur Description Num ro de l v nement dans l ordre partir de 1 Date et heure de l v nement Si le serveur NTP Network Time Protocol est activ pour d finir les date et heure du processeur de service l horloge de ce dernier utilisera le temps UTC Temps Universel Coordonn Pour plus d informations sur les horodatages reportez vous la section Interpr tation des horodatages du journal des v nements page 48 Nom du composant pour lequel un v nement a t enregistr Les abr viations des noms de capteurs correspondent aux composants suivants sys syst me ou ch ssis e p0 processeur 0 e pl processeur 1 e io carte d E S e ps alimentation lectrique e fp panneau avant e ft compartiment des ventilateurs e mb carte m re Le type de capteur pour l v nement sp cifi Description de l v nement 4 Pour effacer le journal des v nements cliquez sur le bouton Clear Event Log Effacer le journal des v nements Une bo te de dialogue de confirmation s affiche 5 Cliquez sur OK pour effacer
Download Pdf Manuals
Related Search
Related Contents
NGW 190H Service Manual Kodak K223LA HIDROLAVADORA ESTIMADO CLIENTE ÍNDICE Einbau- und Bedienungsanleitung Modi-Gurtkastenuhr NEC NP3151W User's Manual Tripp Lite SmartOnline 120V 3kVA 2.4kW On-Line Double-Conversion UPS, Extended Run, SNMP, Webcard, 3U Rack/Tower, USB, DB9 Serial SparVision 200 Tutorial La Crosse Technology WS-1613-IT User's Manual Copyright © All rights reserved.
Failed to retrieve file