Deep Dive: SAN- und NAS-Virtualisierung

In nur wenigen Jahren hat sich die Speichervirtualisierung, auch als Blockvirtualisierung bekannt, in großen Unternehmen bewährt und diesen abgenutzten Weg von einer teuren Boutique-Lösung zu einer erschwinglichen Ware zurückgelegt. Die Speichervirtualisierung ist eine Standardfunktion in allen außer den bescheidensten Mid-Tier-Speichersystemen und lindert eine Vielzahl von Problemen bei der Speicherverwaltung für kleine und mittlere Unternehmen. Gleichzeitig bieten dedizierte Lösungen von Top-Tier-Anbietern den größten ROI für große Shops, die große SANs mit hohen Anforderungen an die Datenverfügbarkeit verwalten.

Durch die Speichervirtualisierung wird eine Abstraktionsschicht zwischen Host und physischem Speicher erstellt, die die Eigenheiten einzelner Speichergeräte maskiert. Bei der Implementierung in einem SAN wird ein einziger Verwaltungspunkt für alle Speicher auf Blockebene bereitgestellt. Vereinfacht ausgedrückt bündelt die Speichervirtualisierung physischen Speicher von mehreren heterogenen Netzwerkspeichergeräten und bietet eine Reihe von virtuellen Speichervolumes, die von Hosts verwendet werden können.

Die Speichervirtualisierung erstellt nicht nur Speicherpools, die aus physischen Festplatten aus verschiedenen Arrays bestehen, sondern bietet auch eine breite Palette von Diensten, die auf konsistente Weise bereitgestellt werden. Diese reichen von der grundlegenden Datenträgerverwaltung, einschließlich LUN-Maskierung (Logical Unit Number), Verkettung und Datenträgergruppierung und -streifen, über Thin Provisioning, automatische Datenträgererweiterung und automatisierte Datenmigration bis hin zu Datenschutz- und Notfallwiederherstellungsfunktionen, einschließlich Snapshots und Spiegelung. Kurz gesagt, Virtualisierungslösungen können als zentraler Kontrollpunkt für die Durchsetzung von Speicherverwaltungsrichtlinien und das Erreichen höherer SLAs verwendet werden.

Der vielleicht wichtigste Dienst, der durch Virtualisierung auf Blockebene ermöglicht wird, ist die unterbrechungsfreie Datenmigration. Für große Unternehmen ist das Verschieben von Daten eine nahezu konstante Tatsache. Da alte Geräte aus dem Leasing genommen und neue Geräte online geschaltet werden, ermöglicht die Speichervirtualisierung die Migration von Daten auf Blockebene von einem Gerät zu einem anderen ohne Ausfall. Speicheradministratoren können routinemäßige Wartungsarbeiten durchführen oder alternde Arrays ersetzen, ohne Anwendungen und Benutzer zu beeinträchtigen. Produktionssysteme tuckern weiter.

Durch Virtualisierung können Sie auch eine bessere Speichernutzung und eine schnellere Bereitstellung erzielen. Die mühsamen Prozesse zur Bereitstellung von LUNs und zur Erhöhung der Kapazität werden durch Virtualisierung erheblich vereinfacht - sogar automatisiert. Wenn die Bereitstellung 30 Minuten statt sechs Stunden dauert und die Kapazität fast im laufenden Betrieb neu zugewiesen werden kann, können Sie die Speicherhardware wesentlich effizienter nutzen. Einige Geschäfte haben ihre Speichernutzung mithilfe der Speichervirtualisierungstechnologie von 25 auf 50 Prozent auf über 75 Prozent erhöht.  Vier architektonische Ansätze

In einer virtualisierten SAN-Struktur gibt es vier Möglichkeiten, Speichervirtualisierungsdienste bereitzustellen: In-Band-Appliances, Out-of-Band-Appliances, ein Hybridansatz namens Split-Path-Virtualisierungsarchitektur und Controller-basierte Virtualisierung. Unabhängig von der Architektur müssen alle Speichervirtualisierungslösungen drei wesentliche Dinge tun: eine Karte der virtuellen Festplatten und des physischen Speichers sowie andere Konfigurationsmetadaten verwalten; Befehle für Konfigurationsänderungen und Speicherverwaltungsaufgaben ausführen; und natürlich Daten zwischen Hosts und Speicher übertragen. Die vier Architekturen unterscheiden sich in der Art und Weise, wie sie diese drei separaten Pfade oder Streams - die Metadaten-, Steuerungs- und Datenpfade - in der E / A-Struktur verarbeiten. Die Unterschiede wirken sich auf die Leistung und Skalierbarkeit aus.

Eine In-Band-Appliance verarbeitet die Metadaten-, Steuerungs- und Datenpfadinformationen auf einem einzigen Gerät. Mit anderen Worten, die Metadatenverwaltungs- und -steuerungsfunktionen teilen sich den Datenpfad. Dies stellt einen potenziellen Engpass in einem ausgelasteten SAN dar, da alle Hostanforderungen über einen einzigen Kontrollpunkt fließen müssen. In-Band-Appliance-Anbieter haben dieses potenzielle Problem der Skalierbarkeit behoben, indem sie ihren Produkten erweiterte Clustering- und Caching-Funktionen hinzugefügt haben. Viele dieser Anbieter können auf SAN-Bereitstellungen großer Unternehmen verweisen, die die Skalierbarkeit und Leistung ihrer Lösung demonstrieren. Beispiele für den In-Band-Ansatz sind DataCore SANsymphony, FalconStor IPStor und IBM SAN Volume Controller.

Eine Out-of-Band-Appliance entfernt die Metadatenverwaltungs- und -steuerungsvorgänge aus dem Datenpfad und verlagert diese in eine separate Rechenmaschine. Das Problem ist, dass Software-Agenten auf jedem Host installiert sein müssen. Die Aufgabe des Agenten besteht darin, die Metadaten und Steuerungsanforderungen aus dem Datenstrom zu entnehmen und zur Verarbeitung an die Out-of-Band-Appliance weiterzuleiten, sodass sich der Host ausschließlich auf die Übertragung von Daten zum und vom Speicher konzentrieren kann. Der einzige Anbieter einer Out-of-Band-Appliance ist LSI Logic, dessen StoreAge-Produkt sowohl für die Out-of-Band- als auch für die Split-Path-Nutzung angepasst werden kann.

Ein Split-Path-System nutzt die Verarbeitungsfunktionen eines intelligenten Switch auf Portebene, um die Metadaten und Steuerinformationen aus dem Datenpfad zu entfernen. Im Gegensatz zu einer Out-of-Band-Appliance, bei der die Pfade auf dem Host aufgeteilt werden, teilen Split-Path-Systeme die Daten und die Steuerpfade im Netzwerk des intelligenten Geräts auf. Split-Path-Systeme leiten die Metadaten und Steuerinformationen zur Verarbeitung an eine Out-of-Band-Compute-Engine weiter und leiten die Datenpfadinformationen an das Speichergerät weiter. Split-Path-Systeme machen daher Agenten auf Host-Ebene überflüssig.

In der Regel wird die Virtualisierungssoftware für geteilte Pfade in einem intelligenten Switch oder einer speziell entwickelten Appliance ausgeführt. Anbieter von Virtualisierungscontrollern mit geteiltem Pfad sind EMC (Invista), Incipient und LSI Logic (StoreAge SVM). 

Array-Controller waren die häufigste Schicht, auf der Virtualisierungsdienste bereitgestellt wurden. Controller haben jedoch normalerweise nur die physischen Datenträger im Speichersystem virtualisiert. Das ändert sich. Eine Variante des alten Ansatzes besteht darin, die Virtualisierungsintelligenz auf einem Controller bereitzustellen, der sowohl internen als auch externen Speicher virtualisieren kann. Wie beim In-Band-Appliance-Ansatz verarbeitet der Controller alle drei Pfade: Daten, Steuerung und Metadaten. Das Hauptbeispiel für diesen neuen Stil der Controller-basierten Virtualisierung ist die Hitachi Universal Storage Platform.

Dateivirtualisierung

So wie die Blockvirtualisierung die SAN-Verwaltung vereinfacht, beseitigt die Dateivirtualisierung einen Großteil der Komplexität und Einschränkungen, die mit NAS-Systemen von Unternehmen verbunden sind. Wir alle wissen, dass das Volumen unstrukturierter Daten explodiert und dass die IT nur wenig Einblick in oder Kontrolle über diese Daten hat. Die Dateivirtualisierung bietet eine Antwort.

Die Dateivirtualisierung abstrahiert die zugrunde liegenden Besonderheiten der physischen Dateiserver und NAS-Geräte und erstellt einen einheitlichen Namespace für diese physischen Geräte. Ein Namespace ist einfach ein ausgefallener Begriff, der sich auf die Hierarchie von Verzeichnissen und Dateien und die entsprechenden Metadaten bezieht. In der Regel wird bei einem Standarddateisystem wie NTFS ein Namespace einem einzelnen Computer oder Dateisystem zugeordnet. Durch die Zusammenführung mehrerer Dateisysteme und Geräte unter einem einzigen Namespace bietet die Dateivirtualisierung eine einzige Ansicht von Verzeichnissen und Dateien und Administratoren einen einzigen Kontrollpunkt für die Verwaltung dieser Daten.

Viele der Vorteile werden Ihnen bekannt vorkommen. Wie die Speichervirtualisierung kann die Dateivirtualisierung das unterbrechungsfreie Verschieben und Migrieren von Dateidaten von einem Gerät auf ein anderes ermöglichen. Speicheradministratoren können routinemäßige Wartungsarbeiten an NAS-Geräten durchführen und alte Geräte außer Betrieb setzen, ohne Benutzer und Anwendungen zu unterbrechen.

Die Dateivirtualisierung kann in Verbindung mit Clustering-Technologien auch die Skalierbarkeit und Leistung erheblich verbessern. Ein NAS-Cluster kann mehrere Größenordnungen schneller Durchsatz (MBps) und IOPS liefern als ein einzelnes NAS-Gerät. HPC-Anwendungen (High Performance Computing) wie seismische Verarbeitung, Video-Rendering und wissenschaftliche Forschungssimulationen stützen sich stark auf Dateivirtualisierungstechnologien, um einen skalierbaren Datenzugriff zu ermöglichen.

Drei architektonische Ansätze

Die Dateivirtualisierung steckt noch in den Kinderschuhen. Wie immer sind die Ansätze verschiedener Anbieter für verschiedene Nutzungsmodelle optimal geeignet, und keine Einheitsgröße passt für alle. Grundsätzlich gibt es auf dem heutigen Markt drei verschiedene Ansätze für die Dateivirtualisierung: Plattformintegrierte Namespaces, von Clustered Storage abgeleitete Namespaces und netzwerkresidentisierte virtualisierte Namespaces.

Plattformintegrierte Namespaces sind Erweiterungen des Host-Dateisystems. Sie bieten eine plattformspezifische Möglichkeit zum Abstrahieren von Dateibeziehungen zwischen Computern auf einer bestimmten Serverplattform. Diese Arten von Namespaces eignen sich gut für die Zusammenarbeit an mehreren Standorten, es fehlen jedoch häufig umfangreiche Dateisteuerelemente, und natürlich sind sie an ein einzelnes Dateisystem oder Betriebssystem gebunden. Beispiele hierfür sind Brocade StorageX, NFS v4 und Microsoft Distributed File System (DFS).

Clustered Storage-Systeme kombinieren Clustering und fortschrittliche Dateisystemtechnologie, um ein modular erweiterbares System zu erstellen, das immer mehr NFS- und CIFS-Anforderungen erfüllen kann. Ein natürliches Ergebnis dieser Cluster-Systeme ist ein einheitlicher, gemeinsam genutzter Namespace für alle Elemente des Clusters. Cluster-Speichersysteme eignen sich ideal für Hochleistungsanwendungen und zur Konsolidierung mehrerer Dateiserver in einem einzigen Hochverfügbarkeitssystem. Zu den Anbietern zählen Exanet, Isilon, Network Appliance (Data ONTAP GX) und HP (PolyServe).

Netzwerkresidente virtualisierte Namensräume werden von netzwerkmontierten Geräten (im Allgemeinen als Netzwerkdateimanager bezeichnet) erstellt, die sich zwischen den Clients und NAS-Geräten befinden. Diese Geräte dienen im Wesentlichen als Router oder Switches für Protokolle auf Dateiebene und präsentieren einen virtualisierten Namespace über die Dateiserver im Back-End und leiten den gesamten NFS- und CIFS-Verkehr zwischen Clients und Speicher weiter. NFM-Geräte können im Band (F5-Netzwerke) oder außerhalb des Bandes (EMC Rainfinity) bereitgestellt werden. Netzwerkresidente virtualisierte Namespaces eignen sich gut für Tiered Storage-Bereitstellungen und andere Szenarien, die eine unterbrechungsfreie Datenmigration erfordern.

Die Virtualisierung von Datei- und Blockspeichern ist möglicherweise die beste Chance der IT, die mit dem anhaltenden Daten-Tsunami verbundenen Schmerzen zu lindern. Durch die Virtualisierung von Block- und Dateispeicherumgebungen kann die IT eine größere Verwaltungswirtschaftlichkeit erzielen und zentralisierte Richtlinien und Kontrollen für heterogene Speichersysteme implementieren. Der Weg zur Einführung dieser Lösungen war lang und schwierig, aber diese Technologien erfüllen endlich unsere Anforderungen. Das Warten auf die aktuelle Anzahl von Datei- und Blockvirtualisierungslösungen lohnt sich.

Diese Geschichte "Deep Dive: SAN- und NAS-Virtualisierung " wurde ursprünglich auf .com veröffentlicht. Verfolgen Sie die neuesten Entwicklungen bei der Virtualisierung, Speicherung und Verwaltung der Datenexplosion auf .com.