M 2.362 Auswahl eines geeigneten Speichersystems

Verantwortlich für Initiierung: Behörden-/Unternehmensleitung, IT-Sicherheitsbeauftragter

Verantwortlich für Umsetzung: IT-Sicherheitsbeauftragter, Leiter IT

Um zu einer fundierten Entscheidung über die im jeweiligen Anwendungsfall angemessene Speichertechnik zu kommen, sind die technischen Grundlagen der NAS- und SAN-Technologien detailliert zu beleuchten und deren Auswirkungen auf den möglichen Einsatz in der Institution zu prüfen. Die Entscheidungsgrundlagen müssen dabei dokumentiert werden.

Network Attached Storage

NAS-Systeme sind spezielle Server, die Speicherplatz als einsatzbereites Dateisystem zur Verfügung stellen. Als Dateisystem werden hierfür meistens Windows (SMB/ CIFS ) oder Unix (NFS) zur Auswahl gestellt. NAS-Systeme sind sehr einfach in eine bestehende Netz-Infrastruktur zu integrieren. Sie können wie Clients oder Server an das Netz der Institution angeschlossen werden. Entsprechend sind NAS-Systeme oft als "Appliance" ausgeführt. Sie werden betriebsfertig ausgeliefert und können nach einigen elementaren Eingaben z. B. der Netzeinstellungen in Betrieb genommen werden. Basissoftware eines NAS-Systems ist üblicherweise eine für diesen Einsatzfall minimierte und optimierte Version eines Standard-Betriebssystems (häufig Unix oder Linux, gegebenenfalls auch Windows).

Diese einfache Anbindung ist gleichzeitig ein Nachteil von NAS, da die Network Attached Storage-Systeme über Ethernet Technik mit den Servern beziehungsweise mit den Clients verbunden sind. Die darunter liegenden TCP/IP-Protokolle haben einen relativ geringen Durchsatz und verwenden dabei einen relativ großen Protokoll-Overhead. So sind sie im Grunde nicht für den schnellen Zugriff auf Massenspeicher ausgelegt. Der Einsatz von NAS-Systemen kann eine hohe Belastung des LANs zur Folge haben. In vielen Anwendungsfällen ist jedoch festzustellen, dass eine Gigabit-Ethernet- Anbindung im Realbetrieb hinreichend schnell ist und durch eine geeignete Architektur des LANs Engpässe de facto nicht zu beobachten sind.

Durch die Verwendung von Standardnetzen und Standardprotokollen besitzen NAS-Systeme die gleichen Schwachstellen, die auch Unix oder Windows Server betreffen.

Weniger geeignet sind Standard-NAS-Lösungen als Speichersysteme für Anwendungen, die nicht dateiorientiert sind. Darunter fallen alle größeren Datenbanken und zum Beispiel auch Microsoft Exchange-Server. Wenn eine solche Anwendung auf einem NAS-System betrieben werden soll, ist zu überprüfen, ob Produkte am Markt verfügbar sind, die spezifisch für den Betrieb des Produktes und das Einsatzszenario optimiert sind.

Ein NAS-System kann oft eine Reihe von Servern ersetzen. Obwohl die reinen Hardwarekosten meistens deutlich höher sind als der Ausbau der einzelnen Server mit mehr und/oder größeren Festplatten, kann es eine erhebliche Verbesserung der Verfügbarkeit bringen. Deutliche Vorteile liegen in der oft vorhandenen Möglichkeit durch Konfiguration des Geräts oder Hardwareerweiterungen im laufenden Betrieb Kapazitätsanforderungen ohne Stillstand zu erfüllen. Verbesserungen sind auch bei der Datensicherung zu erzielen. Mit direkt angeschlossenen Datensicherungsgeräten (Bandlaufwerken, "JukeBoxen" zur Archivierung) ausgestattet, kann eine Vereinfachung, Beschleunigung und Stabilisierung bei der Sicherung von Datenbeständen, die über gewachsene Serverlandschaften verteilt sind, erzielt werden.

Ein Nachteil von einfachen NAS-Systemen ist, dass ein Ausfall oft weiterreichende Folgen hat als der Ausfall eines einzelnen Servers und dass ein Ausfall nicht einfach durch ein in der Institution kurzfristig verfügbares Ersatzsystem kompensiert werden kann.

Storage Area Networks

SANs bestehen aus Plattensubsystemen, Datensicherungssystemen und einer eigenen Netz-Infrastruktur. Plattensubsysteme fassen intern eine Menge von Festplatten zusammen. Hier wird unterschieden, ob diese Zusammenfassung lediglich durch ein gemeinsames Gehäuse und gemeinsame Stromversorgung geschieht (JBOD = Just a Bunch of Disks) oder ob ein spezielles Schaltgerät, der so genannte RAID-Controller mit Hilfe der RAID-Technik (RAID = Redundant Array of Independent Discs) die physikalischen Festplatten zu virtuellen Festplatten zusammenfasst. Darüber hinaus gibt es intelligente RAID-Controller, die weitere Dienste zur Verfügung stellen können.

Durch die Zusammenfassung mehrerer physikalischer Festplatten zu virtuellen Einheiten, auch "Speichervirtualisierung durch RAID" genannt, kann durch ein geschicktes Kombinieren von physikalischen Festplatten die Ausfallsicherheit oder die Performance des Gesamtsystems oder beides erhöht werden. Der RAID-Controller zeigt nach außen nur die zusammengefassten Festplatten (virtuelle Festplatte oder logisches "Volume") und verteilt die Daten, die er auf einer solchen Festplatte schreiben soll, auf die einzelnen physikalischen Festplatten.

Diese Funktionalität kann auch im Server mit Hilfe einer speziellen Applikation, des "Volume Managers", implementiert werden, wobei dann der Server stärker belastet wird.

Es existieren verschiedene Systeme, nach denen die Datenverteilung geregelt wird, die so genannten RAID-Levels. Wenn das RAID-Level die Speicherung von redundanten Informationen unterstützt, dann bleiben die gespeicherten Informationen selbst nach dem Ausfall einer Festplatte intakt und können rekonstruiert werden. Oft können einzelne Festplatten des Plattensubsystems im laufenden Betrieb ausgetauscht werden ("hot swap").

Plattensubsysteme bieten die Möglichkeit, alle Teilkomponenten redundant auszulegen und können somit zur Erhöhung der Verfügbarkeit eingesetzt werden. Ein weiterer Vorteil ist, dass durch passende Konfigurationsmechanismen der einer Anwendung zugeordnete Speicherplatz an ihren Platzbedarf angepasst werden kann.

Ein Plattensubsystem stellt lediglich Speicher für die Anwendungen zur Verfügung. Selbst bei redundanter Speicherung der Daten ist eine zusätzliche Datensicherung notwendig, da z. B. logische Defekte beim Datenbestand durch Redundanz im Speichersystem nicht korrigiert werden können. Als Systeme zur Datensicherung sind Bandlaufwerke, optische Medien, aber auch wiederum spezielle Festplattensysteme nutzbar. Auch diese Geräte werden direkt in das Speichernetz integriert.

SANs verwenden eine eigene Netz-Hardware und eigene für den Anwendungsfall geeignete schnelle Netzprotokolle. Meistens sind Glasfaserkabel im Einsatz (Systembezeichnung: Fibre Channel, FC). Ein einfaches Storage Area Network besteht aus einem Fibre Channel Switch oder Director (größere Switche, die mit mehr Funktionalitäten ausgestattet sind, werden oft als Director bezeichnet), einem oder mehreren Plattensubsystemen und den Servern, die über so genannte Host Bus Adapter, kurz HBA, mit dem Fibre Channel Switch verbunden werden.

Fibre Channel Netze verwenden ein spezielles, an die Anforderung von Massenspeichernutzung angepasstes Protokoll, das hohe Übertragungsraten ermöglicht und deshalb für Speichersysteme sehr geeignet ist. Ebenfalls möglich ist der Einsatz von ISCSI Geräten. iSCSI "verpackt" Speicherprotokolle, also Steuerbefehle für Massenspeicher und zugehörige Daten, in IP-Pakete. iSCSI wird eingesetzt, um über eine virtuelle Ende-zu-Ende-Verbindung den Zugriff von Servern mittels iSCSI Host-Bus-Adapter auf das Speichernetz zu ermöglichen, ohne dass eigene Speichernetze betrieben werden müssen. Vorhandene Netzkomponenten (LAN-Switch) können genutzt werden, es muss keine neue oder von der vorhandenen Netztechnik verschiedene Hardware für die Verbindungen zwischen Servern und Speichergeräten eingesetzt werden. Der Begriff SAN wird im Folgenden für beide Technologien verwendet. Wenn eine Unterscheidung notwendig ist wird "Fibre Channel SAN" oder FC-SAN und entsprechend iSCSI-SAN oder IP-SAN verwendet.

Ein großer Vorteil von SANs ist ihre Desaster-Toleranz. Das Konzept des Multi-Pathing, das im SAN konsequent verfolgt wird, spielt dabei eine wesentliche Rolle: Falls es einem Server möglich ist über mehrere Host Bus Adapter und über unterschiedliche Netzverbindungen ein Plattensubsystem zu erreichen, so kann der Datentransfer zwischen beiden Systemen auf mehrere Datenwege verteilt werden. Durch den Einsatz mehrerer Host Bus Adapter in den Servern und die Präsentation der virtuellen Festplatten auf mehreren Schnittstellen eines Plattensubsystems lassen sich somit die mögliche Übertragungsgeschwindigkeit und Verfügbarkeit des Speichersystems effektiv steigern. Wenn zwei oder mehr Host Bus Adapter in einem Server genutzt werden, so wird bei Ausfall eines Adapters die Last auf den oder die verbleibenden HBA verlagert. Dieses für Betriebssystem und Anwendungen transparente "Failover" verbessert somit die Verfügbarkeit des Servers. Entsprechend kann durch eine redundante Auslegung aller Teilkomponenten eines SANs eine sehr hohe Ausfallsicherheit erreicht werden. Die Maßnahme M 2.354 Einsatz einer hochverfügbaren SAN-Konfiguration beschreibt dieses Thema ausführlicher.

So wäre es in einem kleinen Storage Area Network denkbar, dass sich an zwei möglichst weit auseinander liegenden Orten auf dem Betriebsgelände jeweils ein baugleiches Plattensubsystem befindet, jedes dieser Plattensubsysteme ist mit einem von zwei auch wieder getrennt installierten Switchen verbunden. Um eine redundante Verbindung zum SAN zu gewährleisten, verfügen die Server zumindest über zwei Host Bus Adapter, so dass jeder Host Bus Adapter mit einem der beiden SAN-Switche verbunden ist.

Somit wäre ein Ausfall einzelner Leitungen, eines Switches oder sogar eines Plattensubsystems ohne Beeinträchtigung der Gesamtsystemleistung denkbar.

Beim Design eines SANs ist es leicht möglich, Redundanzen zu schaffen, so dass ein Ausfall einzelner Komponenten wie Kommunikationsleitungen, Switches oder sogar eines Plattensubsystems keine Beeinträchtigung der Gesamtsystemleistung bewirkt.

Bei höchsten Anforderungen an die Verfügbarkeit kann dieser Ausbau so erweitert werden, dass in zwei oder mehr räumlich weit auseinander liegenden (bis zu 100 km) und technisch autarken Rechenzentren jeweils in allen Komponenten redundante SANs aufgebaut werden. So kann im Extremfall der Ausfall eines kompletten Rechenzentrums ohne Betriebsunterbrechung oder Kapazitätsverlust für die Anwender kompensiert werden.

Weitere Redundanz lässt sich durch "Cluster"-Server erreichen, die eine logische Maschine auf zwei oder mehr physische Server verteilen. Dabei wird eine Anwendung auf zwei oder mehr Servern installiert. Diese Server arbeiten mit denselben Anwendungsdaten. Falls ein Server eine Störung erleidet, übernimmt der zweite Server automatisch die Arbeit des ausgefallenen Kollegen.

Erkauft werden die positiven Eigenschaften einer SAN-Lösung durch Preis und Komplexität. Die gleiche Menge Speicher ist in der Realisierung durch ein SAN um ein Vielfaches teuerer als in der Ausführung als Direct Attached Storage.

Zudem ist auch die Planung und der Aufbau eines SANs so komplex, dass es für die Institution sehr ratsam ist, externe Unterstützung hinzuzuziehen.

Zusammenfassung

Kurz dargestellt ist NAS ein Speichersystem mit Datei-basiertem Zugriff, SAN ein Speichersystem mit Block-basiertem Zugriff. SAN setzt also "tiefer" an und bietet alle technischen Möglichkeiten, die für die Datenspeicherung angeboten werden. NAS ist eine Erweiterung der Serverlandschaft der Institution.

Kombinierte Geräte

Mittlerweile werden auch Speichersysteme angeboten, die eine Mischform zwischen NAS und SAN darstellen. Der interne Aufbau solcher Systeme erfüllt alle Kriterien eines SANs. Nach außen können sie jedoch als NAS-System betrieben werden. Durch Aufrüstung und entsprechende Konfiguration können solche Speichersysteme auch im Mischbetrieb genutzt werden. So kann sich ein Gerät sowohl für einige Anwendungen per Ethernet-Anschluss als "Filer" präsentieren, also als intelligenter Netzknoten zur Bereitstellung von Datei-Diensten, zugleich aber für andere Server als "purer Speicher" per Fibre Channel oder iSCSI dienen.

Ergänzende Kontrollfragen: