▼
Scroll to page 2
of
14
Guide de prévention des erreurs Août 2003 (première édition) Référence 335894-051 HP CONFIDENTIAL Writer: Ted Weiman File Name: 335894-51fr.doc Codename: Part Number: 335894-051 Last Saved On: 8/25/03 10:08 AM © 2003 Hewlett-Packard Development Company, L.P. Hewlett-Packard Company décline toute responsabilité en cas d'erreurs ou d'omissions de nature technique ou rédactionnelle dans le présent document. Les informations contenues dans ce document sont fournies "en l'état" sans garantie d'aucune sorte et elles peuvent être modifiées sans préavis. Les garanties relatives aux produits HP sont décrites dans le document sur la limitation de garantie qui accompagne ces produits. Aucun élément du présent document ne peut être interprété comme apportant une garantie supplémentaire. Guide de prévention des erreurs Août 2003 (première édition) Référence : 335894-051 HP CONFIDENTIAL Writer: Ted Weiman File Name: 335894-51fr.doc Codename: Part Number: 335894-051 Last Saved On: 8/25/03 10:08 AM Table des matières Résumé ............................................................................................................................... 5 Public visé .......................................................................................................................... 5 Préparation aux changements ............................................................................................. 5 Réduction des conséquences des changements .................................................................. 6 Contrôle de version .......................................................................................................6 Conception du serveur ..................................................................................................6 Mises à jour logicielles .................................................................................................6 Utilisation d'une méthodologie........................................................................................... 7 Inspection visuelle du serveur ............................................................................................ 9 Identification des problèmes d'alimentation dus à des phénomènes naturels................... 10 Prévention des problèmes de supervision de l'alimentation ............................................. 10 Alimentation requise...................................................................................................11 Considérations sur la consommation ..........................................................................11 Considérations sur les blocs d'alimentation ................................................................11 Considérations sur la redondance d'alimentation........................................................11 Protection des unités amovibles ....................................................................................... 12 Prévention des détériorations dues à l'électricité statique ................................................ 13 Protection des câbles ........................................................................................................ 13 Prévention des erreurs d'unités de sauvegarde sur cartouche ........................................... 13 HP StorageWorks L&TT (Library and Tape Tools)...................................................13 Nettoyage des unités ...................................................................................................14 Unités DAT.................................................................................................................14 Unités LTO, SDLT et DLT.........................................................................................14 Unités AIT ..................................................................................................................14 Guide de prévention des erreurs HP CONFIDENTIAL Writer: Ted Weiman File Name: 335894-51fr.doc Codename: Part Number: 335894-051 Last Saved On: 8/25/03 10:08 AM 3 Résumé Ce manuel donne des informations vous permettant d'éviter les problèmes éventuels. Même si la plupart des conseils fournis relèvent du bon sens, ces tâches de prévention sont trop importantes pour être négligées. Public visé Ce manuel est destiné au personnel qui installe, administre et répare les serveurs. Vous êtes censé être qualifié dans la maintenance des équipements informatiques, et formé à la manipulation de systèmes capables de produire des niveaux d'énergie dangereux. Préparation aux changements La plupart des problèmes résultent de changements apportés au serveur. Lorsque vous devez apporter des changements au serveur, suivez les recommandations cidessous : • Faites des sauvegardes fréquentes de votre système. Assurez-vous qu'elles ne sont pas altérées avant de procéder à des modifications. Si le système contient des données importantes, ayez au moins deux sauvegardes correctes et complètes du système d'exploitation et des données, une copie du logiciel de sauvegarde, et une unité de sauvegarde sur cartouche fonctionnelle qui puisse lire la sauvegarde. Deux sauvegardes permettent d'assurer une récupération intégrale des données en cas de problème avec la première cartouche ou durant la première tentative de restauration. • Documentez bien les paramètres système. Si vous envisagez de modifier la configuration du système, effectuez d'abord un enregistrement des paramètres actuels à l'aide de l'utilitaire Survey. • Consultez les ressources HP, la documentation de votre logiciel et celle des produits tiers pour plus d'informations sur les problèmes potentiels. Les sites Web constituent une excellente source d'informations. • Si possible, effectuez une seule modification à la fois. Cela permet de limiter les variables et de contrôler l'environnement. Guide de prévention des erreurs HP CONFIDENTIAL Writer: Ted Weiman File Name: 335894-51fr.doc Codename: Part Number: 335894-051 Last Saved On: 8/25/03 10:08 AM 5 • Enregistrez les résultats après application de chaque modification, en pensant à inclure tous les messages d'erreur et toutes les informations supplémentaires collectées. • Assurez-vous de disposer de suffisamment de temps pour effectuer ces modifications. • Avant d'ajouter un périphérique, assurez-vous qu'aucun conflit potentiel ne peut se produire. • Si votre serveur dispose d'un passage de câbles fixe ou d'un autre système de routage des câbles, l'utilisation de ce dernier permet de prévenir les mauvais câblages et les dommages pouvant résulter d'une déconnexion inappropriée. Réduction des conséquences des changements Contrôle de version Gardez trace des nouvelles versions des logiciels système grâce à la fonction de contrôle de version de Insight Manager 7. Cette fonction vous permet de déterminer aisément les mises à jour disponibles pour le BIOS, les drivers et les agents. Conception du serveur Définissez la configuration de votre serveur afin de réduire les conséquences d'une immobilisation. Par exemple, sur les serveurs haut de gamme, des fonctions de haute disponibilité telle que la mémoire RAID hot-plug et les connecteurs PCI hot-plug réduisent significativement la durée d'immobilisation en cas de mises à niveau de la mémoire ou des cartes PCI. Partout où cela est possible, répartissez la charge de travail entre différents ordinateurs, plutôt que de l'attribuer à un seul. Si possible, regroupez les utilisateurs sur les différents serveurs de votre réseau. Prévoyez le taux d'utilisation des serveurs et répartissez-les en fonction de ce taux. Mises à jour logicielles Restez informé des dernières mises à jour logicielles de votre système d'exploitation et des applications, et appliquez-les lorsque nécessaire. 6 Guide de prévention des erreurs HP CONFIDENTIAL Writer: Ted Weiman File Name: 335894-51fr.doc Codename: Part Number: 335894-051 Last Saved On: 8/25/03 10:08 AM Utilisation d'une méthodologie L'application d'une série de procédures lorsque vous utilisez votre serveur peut faciliter la prévention et la résolution des problèmes. • Utilisez des conventions de noms uniformes pour les serveurs, par exemple pour les noms indiquant les emplacements des serveurs. Ainsi, vous vous rappellerez plus facilement des détails souvent négligés qui peuvent être déterminants pour résoudre un problème. • Utilisez des ID ou des noms uniques pour vos périphériques. Si vous établissez une liste, vous pouvez réduire le risque de relier plusieurs composants à la même ressource. Recherchez les conflits éventuels à l'aide de l'utilitaire de configuration du serveur. • Habituez-vous à utiliser les outils, ressources et logiciels HP, ainsi que les ressources de produits tiers pour faire face aux problèmes potentiels. Vous pouvez souvent éviter des problèmes en notant ceux des autres. • Établissez un plan de sauvegarde fiable. Planifiez des sauvegardes en fonction des besoins du serveur. Si vos données changent souvent, de fréquentes sauvegardes sont nécessaires. Conservez une bibliothèque de sauvegardes en fonction de vos besoins de restauration. Testez régulièrement les sauvegardes afin de vous assurer que les données sont correctement stockées. • Prévoyez un plan d'actions avant que le serveur ne tombe en panne, en tenant compte des différents composants matériels. • Vérifiez périodiquement l'espace libre sur votre disque dur. Il est recommandé d'avoir toujours au moins 15% d'espace libre par disque. • Contrôlez la présence de virus chaque semaine. Utilisez les derniers anti-virus disponibles pour vous assurer que vos données ne sont pas altérées. • Conservez un historique des données. Vous ne pourrez pas constater que l'utilisation du processeur a augmenté de 50 % si vous ne connaissez pas la valeur initiale. En cas de problème, vous pouvez utiliser ces données pour comparer les situations avant et après l'apparition du problème. Par exemple, les taux d'utilisation concernant les utilisateurs, les bus, et l'alimentation. Guide de prévention des erreurs HP CONFIDENTIAL Writer: Ted Weiman File Name: 335894-51fr.doc Codename: Part Number: 335894-051 Last Saved On: 8/25/03 10:08 AM 7 8 • Effectuez régulièrement une analyse de tendance afin de savoir à quoi vous attendre à différents moments. Par exemple, si le taux d'utilisation du processeur augmente toujours de 50% à certaines heures, vous saurez que cette augmentation est normale pour le serveur dont vous assurez le suivi. • Créez un cahier de résolution des problèmes. En cas de problème, tenez un journal des actions effectuées pour le résoudre. Cela vous aidera à le corriger plus rapidement s'il se reproduit. Vous pouvez également stocker la documentation et les disquettes des utilitaires de configuration, Survey et ADU (Array Diagnostic Utility) avec le cahier de résolution des problèmes. Vous gagnerez ainsi un temps précieux et serez plus efficace, particulièrement en cas de remplacement de pièces. • Tenez à jour une carte de topologie du réseau dans un endroit accessible. Elle vous sera utile en cas de problèmes réseau. • Si votre serveur est équipé d'une unité de sauvegarde sur cartouche, ayez un programme de nettoyage bien défini. • Si votre serveur est équipé d'une unité de sauvegarde sur cartouche, n'oubliez pas que le positionnement de l'étiquette de la cartouche est important. Si celle-ci est placée sur la surface exposée de la cartouche, elle ne risque pas de tomber ou de se coincer à l'intérieur de l'unité. • Envisagez de stocker sur site certaines pièces de rechange. Les pièces de rechange comprennent les contrôleurs SCSI, les blocs d'alimentation redondants hot-plug, les ventilateurs hot-plug, les unités hot-plug, les câbles SCSI, les adaptateurs réseau, les modules PPM et éventuellement ceux d'E/S, de support, de processeur et de mémoire, si votre serveur est modulaire. • Renouvelez les stocks au fur et à mesure que les pièces sont utilisées. • Ne nettoyez pas les connecteurs des cartes avec des produits abrasifs qui supprimeraient le revêtement doré, car cela entraînerait l'apparition d'électricité statique et de dépôt de résidus. Si vous devez nettoyer les connecteurs, appliquez de l'alcool isopropylique ou une solution de nettoyage spéciale à l'aide d'un coton-tige. Guide de prévention des erreurs HP CONFIDENTIAL Writer: Ted Weiman File Name: 335894-51fr.doc Codename: Part Number: 335894-051 Last Saved On: 8/25/03 10:08 AM Inspection visuelle du serveur Vous devez régulièrement contrôler les éléments suivants de votre serveur. Une inspection visuelle permet d'éviter de nombreux problèmes. • Assurez-vous que les systèmes et les racks ne sont pas fixés trop près des parois et qu'il y a suffisamment d'espace pour permettre la circulation de l'air. • Éloignez du système les accessoires magnétisés tels que les tournevis aimantés et les téléphones avec sonneries électromagnétiques. • Assurez-vous que le serveur n'est pas branché sur la même ligne électrique que du matériel haute tension, par exemple des imprimantes laser, des climatiseurs, des photocopieurs, ainsi que des machines à café et des prises multiples non reliées à la terre. • Vérifiez régulièrement les prises secteur avec terre pour vous assurer qu'elles sont en parfait état. • Enlevez le cache du système, utilisez une bombe d'air comprimé pour enlever la poussière, resserrez les connecteurs desserrés, remettez en place les cartes et contrôlez l'usure des câbles. Éloignez les câbles des sources de chaleur et laissezleur le plus de jeu possible. ATTENTION : pour éviter les problèmes éventuels, lisez toujours les avertissements et mises en garde de la documentation utilisateur spécifique à votre serveur avant de supprimer, remplacer, remettre en place ou modifier des composants du système. • Vérifiez qu'une circulation d'air appropriée est assurée et déplacez tout ce qui est susceptible d'obturer les ventilateurs. • Vérifiez qu'il n'y a pas de poussière sur les pièces externes du serveur, tels que les ventilateurs. • Contrôlez votre serveur après les coupures d'alimentation provoquées par des phénomènes naturels. Reportez-vous à la section "Identification des problèmes d'alimentation dus à des phénomènes naturels" dans ce manuel. Guide de prévention des erreurs HP CONFIDENTIAL Writer: Ted Weiman File Name: 335894-51fr.doc Codename: Part Number: 335894-051 Last Saved On: 8/25/03 10:08 AM 9 Identification des problèmes d'alimentation dus à des phénomènes naturels Certains problèmes d'alimentation sont dus à des phénomènes naturels tels que foudre, chaleur excessive, glace, pluie et tempêtes. La foudre peut entraîner des pointes et des surtensions (une pointe est une impulsion rapide de haute tension non souhaitée sur une ligne électrique, qui ne dure généralement qu'une fraction de seconde, tandis qu'une surtension est une augmentation soudaine de la tension électrique, de courte durée). Une chaleur anormale due à une utilisation accrue des climatiseurs peut surcharger les grilles et générer des baisses ou des irrégularités de tension, ou encore des pannes d'alimentation (les baisses de tension sont des réductions de tension prévues par les compagnies d'électricité lorsque leur système de génération et de distribution est trop sollicité). Les tempêtes peuvent provoquer une panne générale due à la chute de poteaux électriques. Les problèmes d'alimentation se présentent sous diverses formes : surtensions et pointes d'alimentation, pointes haute tension, interruptions transitoires, baisses de tension et coupures d'alimentation totales. Après chaque problème d'alimentation, vous devez contrôler le serveur pour détecter d'éventuelles détériorations : perte de données, fichiers altérés et dégâts matériels. Le problème, en cas de variation d'alimentation, est que les dégâts ne sont pas toujours immédiatement visibles ; vous pouvez les découvrir longtemps après. Un système de régulation tel qu'un onduleur est fortement conseillé car il minimise l'effet des variations et coupures d'alimentation. Prévention des problèmes de supervision de l'alimentation Lors de la détermination des conditions requises pour l'alimentation de votre serveur, prenez en compte les facteurs décrits dans cette section. 10 Guide de prévention des erreurs HP CONFIDENTIAL Writer: Ted Weiman File Name: 335894-51fr.doc Codename: Part Number: 335894-051 Last Saved On: 8/25/03 10:08 AM Alimentation requise Assurez-vous de respecter l'alimentation requise décrite dans la documentation utilisateur spécifique à votre serveur. En outre, l'installation du matériel doit être faite en conformité avec les règles définies par EDF en matière d'installation informatique, et réalisée par des électriciens agréés. Pour connaître la consommation de charge des options, consultez l'étiquette apposée sur le produit ou la documentation utilisateur fournie avec l'option. Considérations sur la consommation Avant de configurer votre serveur, vous devez évaluer la consommation requise et déterminer le nombre approprié de blocs d'alimentation pour vous assurer que le serveur dispose d'une puissance suffisante. Outre la détermination du nombre minimum de blocs d'alimentation requis, vous devez également définir si la redondance de l'alimentation secteur est nécessaire, si applicable à votre serveur. Pour plus d'informations sur les caractéristiques d'alimentation spécifiques à votre serveur, reportez-vous à sa documentation. Pour obtenir une capacité plus précise et une évaluation de la marge d'alimentation, utilisez le calculateur d'alimentation fourni sur le site Web de ActiveAnswers à l'adresse suivante : http://activeanswers.compaq.com/aaconfigurator Considérations sur les blocs d'alimentation Après avoir déterminé la quantité d'alimentation appropriée pour votre serveur, installez les blocs d'alimentation nécessaires pour le niveau de redondance souhaité. Considérations sur la redondance d'alimentation Si elle est disponible pour votre serveur, la redondance d'alimentation protège votre serveur des pannes dues à l'une des raisons suivantes : • Panne d'alimentation dans l'un des deux circuits CA alimentant le serveur • Déconnexion accidentelle de l'un des cordons alimentant le serveur • Panne d'un bloc d'alimentation Guide de prévention des erreurs HP CONFIDENTIAL Writer: Ted Weiman File Name: 335894-51.doc Codename: Part Number: 335894-051 Last Saved On: 9/23/03 9:44 AM 11 IMPORTANT : la redondance d'alimentation décrite dans cette section ne correspond pas à la protection fournie par un onduleur. En cas de panne sérieuse affectant chaque cordon alimentant le serveur, ce dernier s'arrête. Pour une protection complète, HP recommande l'installation d'un onduleur approprié. Reportez-vous à la documentation spécifique à votre serveur pour déterminer la redondance d'alimentation requise. Protection des unités amovibles Les unités amovibles sont des composants fragiles qu'il faut manipuler avec soin. Pour éviter de détériorer l'ordinateur ou l'unité amovible, ou encore de perdre des informations, observez les précautions suivantes : 12 • Avant de retirer une unité de disquette, un lecteur de CD-ROM ou de DVD, assurez-vous qu'aucun support ne s'y trouve. Assurez-vous que le chargeur de CD-ROM ou de DVD est fermé. • Avant de manipuler une unité, déchargez-vous de toute électricité statique. Lorsque vous manipulez une unité, évitez de toucher le connecteur. • Manipulez les unités sur une surface de travail dont le revêtement anti-choc a au moins 2,5 cm d'épaisseur. • Ne laissez pas tomber les unités, de quelque hauteur et sur quelque surface que ce soit. • Tenez les disques durs à l'écart des sources vecteurs de champs magnétiques, tels que moniteurs ou haut-parleurs. • N'exposez pas une unité à des températures excessives et évitez tout contact avec des liquides. Guide de prévention des erreurs HP CONFIDENTIAL Writer: Ted Weiman File Name: 335894-51fr.doc Codename: Part Number: 335894-051 Last Saved On: 8/25/03 10:08 AM Prévention des détériorations dues à l'électricité statique De nombreux composants électroniques sont sensibles à l'électricité statique. La conception et la structure des circuits déterminent le degré de sensibilité. Les réseaux construits sur plusieurs circuits intégrés procurent une certaine protection, mais dans de nombreux cas, les décharges sont suffisamment puissantes pour altérer les caractéristiques du circuit ou faire fondre des jonctions en silicium. Une décharge soudaine d'électricité statique au contact de vos doigts ou de tout autre élément conducteur peut détruire les matériels sensibles à l'électricité statique ou les micro-circuits. Souvent l'étincelle n'est pas ressentie ni même entendue, mais les dégâts sont bien réels. Un matériel électronique exposé à l'électricité statique peut également ne pas être affecté et continuer à fonctionner parfaitement. Il peut également fonctionner normalement pendant un certain temps, puis les couches internes se dégradent, ce qui réduit sa durée de vie. Protection des câbles Manipulez les câbles avec grand soin pour éviter toute détérioration. Appliquez uniquement la pression requise pour le retrait ou l'insertion des câbles. Si possible, manipulez les câbles au niveau du connecteur. Dans tous les cas, évitez de les tordre ou de les déchirer. Assurez-vous qu'ils sont placés de telle sorte qu'ils ne pourront être entraînés ou arrachés lors du retrait ou du remplacement de pièces. Prévention des erreurs d'unités de sauvegarde sur cartouche HP StorageWorks L&TT (Library and Tape Tools) Utilisez HP StorageWorks L&TT (Library and Tape Tools) pour mettre à jour le microprogramme de l'unité, ainsi que pour gérer et diagnostiquer ses problèmes. Pour plus d'informations, consultez le site Web : http://h18006.www1.hp.com/products/storageworks/ltt/index.html Guide de prévention des erreurs HP CONFIDENTIAL Writer: Ted Weiman File Name: 335894-51fr.doc Codename: Part Number: 335894-051 Last Saved On: 8/25/03 10:08 AM 13 Nettoyage des unités Unités DAT Nettoyez régulièrement les têtes de l'unité à l'aide d'une cartouche de nettoyage afin d'assurer l'intégrité des données de sauvegarde. Pour des performances optimales et pour éviter toute perte de données, HP vous recommande d'intégrer un cycle de nettoyage dans votre routine de sauvegarde. En règle générale, nettoyez les têtes toutes les cinq cartouches. Faites-le également si le signal "de maintenance" (voyant orange clignotant) apparaît sur une unité ou si le message "Clean Me" s'affiche sur un autoloader (chargeur automatique). Reportezvous à la documentation du périphérique pour plus d'informations. Nettoyage des cartouches N'utilisez que des cartouches de nettoyage HP pour nettoyer les têtes. N'utilisez pas de coton-tige ni aucun autre moyen. La cartouche de nettoyage utilise une bande spéciale. Elle ne peut être employée que 50 fois (sauf indication contraire sur la boîte). Lorsque la cartouche est épuisée, remplacez-la. Unités LTO, SDLT et DLT Utilisez la cartouche de nettoyage si cette opération est requise par le logiciel de sauvegarde ou si le voyant "Cleaning" est allumé. Reportez-vous à la documentation du périphérique pour plus d'informations. Unités AIT L'unité de sauvegarde sur cartouche comporte un rouleau de nettoyage intégré, qui évite et répare la contamination des têtes. Cette fonction minimise les dépôts sur les têtes de lecture/écriture, ce qui réduit le nombre de cycles nécessaires avec une cassette de nettoyage. Cependant, HP vous recommande de prévoir un nettoyage de routine toutes les 100 heures d'utilisation afin de garder l'unité en bon état de marche. Un nettoyage est également requis lorsque le voyant "Status" de l'unité émet des flashs longs entrecoupés de courtes pauses. Reportez-vous à la documentation du périphérique pour plus d'informations. 14 Guide de prévention des erreurs HP CONFIDENTIAL Writer: Ted Weiman File Name: 335894-51fr.doc Codename: Part Number: 335894-051 Last Saved On: 8/25/03 10:08 AM