M 6.92 Notfallvorsorge bei Routern und Switches

Verantwortlich für Initiierung: IT-Sicherheitsbeauftragter, Leiter IT

Verantwortlich für Umsetzung: Administrator

Fehlerbehandlung bei Routern und Switches

In jedem IT-Betrieb treten Störungen auf, die von sporadisch auftretenden Fehlverhalten von Komponenten bis zum klar abzugrenzenden Ausfall eines Geräts und dadurch verursachten Netzausfällen reichen können. Grundlage eines sicheren Betriebs ist die Vorbereitung auf Störungssituationen. Hierzu gehören Ausfälle oder Beeinträchtigungen von Hardware und Software beispielsweise auf Grund von Defekten oder Kompromittierungen.

Um in derartigen Situationen effektiv und schnell reagieren zu können, müssen Diagnose und Fehlerbehebung bereits im Vorfeld geplant und vorbereitet werden. Für typische Ausfallszenarien und als Ergebnis von bereits aufgetretenen Störungen sollten Handlungsanweisungen erstellt werden. Kochbuchartige Dokumentationen aller notwendigen Kommandos, ihrer Anwendung mit den zu erwartenden Ausgaben sind in Situationen, die schnelles Handeln erfordern, besonders hilfreich. Hierzu gehören neben Diagnose und Fehlerbehandlung auch die im normalen Betrieb notwendigen Administrationstätigkeiten. Letztere können typischerweise bereits in der vom Hersteller gelieferten Dokumentation enthalten sein. Für die tägliche Praxis ist es allerdings sinnvoll, eine Gesamtdokumentation in Form eines Betriebshandbuchs zu erstellen.

Zu den Voraussetzungen für den Erfolg der Diagnosearbeiten gehört auch eine geeignete Protokollierung während des Betriebs (siehe auch M 4.205 Protokollierung bei Routern und Switches). Weiterhin sollten für die Fehlerbehandlung geeignete Werkzeuge genutzt werden. Dazu existieren sowohl frei verfügbare als auch kommerzielle Programme, oft auch vom Hersteller der Geräte. Die Verwendung geeigneter Werkzeuge ist umso wichtiger, da mit den Systemkommandos nicht immer alle Konfigurationseinstellungen angezeigt werden. Teilweise werden lediglich die von den Standardeinstellungen abweichenden Daten erfasst.

Die Vorgehensweise bei der Fehlerbehandlung lässt sich in die Bereiche Administration, Performancemessung und Diagnose unterteilen. Nachfolgend werden die jeweils zu berücksichtigenden Aspekte dargestellt:

Administration

In einem Betriebshandbuch sollten alle notwendigen Kommandos zu Administration und Konfiguration dokumentiert werden.

Folgende Bereiche sind zu berücksichtigen:

Performance

Folgende Aspekte sollten für Aussagen über die Performance berücksichtigt werden:

Diagnose

Für die Diagnose sollten alle notwendigen Kommandos und die zu erwartenden Ausgaben zur Anzeige der Zustände des Gesamtsystems, der Interfaces und ihrer Konfiguration dokumentiert sein. Viele Kommandos ermöglichen zudem einen Debug-Modus zu Ausgabe umfangreicher Statusinformationen.

Unter anderem sind folgende Informationen für die Fehlerdiagnose relevant:

Als weiterführende Maßnahmen sollte M 2.215 Fehlerbehandlung betrachtet werden.

Notfallvorsorge zur Steigerung der Verfügbarkeit

Durch eine Planung des Vorgehens bei Störungen kann die Zeit zur Wiederherstellung minimiert und unter Umständen eine Lösung überhaupt erst ermöglicht werden. Die Planungen sind mit der übergreifenden Störungs- und Notfallvorsorge abzustimmen und sollten sich am allgemeinen Notfallvorsorgekonzept orientieren (siehe Baustein B 1.3 Notfallmanagement). Hier werden generelle Vorgaben für Notfalldokumente im gesamten IT-Betrieb formuliert. Diese legen idealerweise einheitliche und verbindliche Anforderungen bez. Aufbau, Inhalt und Form fest.

Folgende Fragestellungen sind für die Notfallvorsorge relevant:

Die Dokumentation sollte keinesfalls ausschließlich elektronisch vorliegen. Handlungsanweisungen sollten mindestens auch in Papierform existieren. Gegebenenfalls können Konfigurationsdateien auch auf CD-ROMs oder anderen Datenträgern gesondert hinterlegt werden.

Die für die Notfallvorsorge notwendigen Vorgehensbeschreibungen sind möglichst sorgfältig zu erstellen und regelmäßig zu erproben. Eventuell müssen variierende Vorgehensweisen bei unterschiedlichen Gerätetypen und Betriebssystemen berücksichtigt werden.

Die wahrscheinlich wichtigste Maßnahme zur Steigerung der Verfügbarkeit ist die Vorhaltung von Ersatzteilen, um bei Hardware-Defekten die Ausfallzeiten zu minimieren. Alternativ oder auch als Ergänzung hierzu können Wartungsverträge mit dem Hersteller abgeschlossen werden, die durch garantierte Reaktions- oder sogar Reparaturzeiten die Verfügbarkeit sicherstellen. Hierdurch lassen sich Kosten für die Lagerhaltung reduzieren oder eine noch höhere Hardwareverfügbarkeit erreichen. Im Rahmen eines solchen Vertrages kann auch die Versorgung mit Software-Updates geregelt werden.

Prüffragen: