Der Daten-Tsunami ist nicht aufzuhalten, und die Datenflut wird für Unternehmen immer mehr zur Herausforderung. Nach wie vor verdoppelt sich das weltweite Datenvolumen etwa alle zwei Jahre (1). Viele herkömmliche IT- und Storage-Infrastrukturen stoßen da an ihre Grenzen. Die unzureichende Speicherkapazität ist dabei nur ein Aspekt. Auf der anderen Seite erhöht sich mit dem dramatisch steigenden Datenaufkommen auch die Komplexität des Datenmanagements – gerade im Hinblick auf Big Data und die vielfach unstrukturierten Daten.
Angesichts dieser Ausgangslage mit mehreren, sich gegenseitig beeinflussenden und verstärkenden Faktoren ist ein Investment in die richtige Lösung und Technologie heute wichtiger denn je. Einen zukunftsweisenden Lösungsansatz bieten Tiered-Storage-Architekturen. Ihr zentraler Vorteil: Sie verfügen über ein automatisiertes Datenmanagement, das heißt Daten werden auf unterschiedlichen Ebenen gesichert, und zwar in Abhängigkeit von den Anforderungen hinsichtlich Kosten, Performance, Verfügbarkeit, Sicherheit oder Datenbereitstellung (Recovery Time Objective).
In Tiered-Storage-Architekturen kommen sowohl HDDs als auch neue eSSDs (Enterprise Solid State Drives) zum Einsatz. Damit können die Vorteile genutzt werden, die die beiden Technologien jeweils bieten: die SSDs mit einer hohen Geschwindigkeit beim Lesen von Daten und einem geringen Stromverbrauch sowie die HDDs mit einer hohen Speicherkapazität, geringen Kosten und einer langen Lebensdauer.
Momentan dominieren herkömmliche Festplatten (noch) den Markt, da sie bei einem niedrigeren Preis eine höhere Speicherkapazität bieten. Sie können aufgrund ihrer höheren Speicherdichte mehr Daten pro Volumeneinheit speichern als DRAM oder Flash-SSDs. Zentraler Vorteil von eSSDs ist, dass sie zumindest beim Lesen der Daten erheblich schneller als herkömmliche Festplatten arbeiten, da sie keinen Schreib-Lesekopf zum Einlesen der Daten in Position bringen müssen. Der höhere Input/Output pro Sekunde (IOPS) ist ein wesentliches Argument für die SSD-Technologie. Allerdings ist die Lebensdauer der eSSDs geringer als die von herkömmlichen Festplatten. Letztere können nämlich beliebig oft gelöscht und neu beschrieben werden. Bei Flash-Speicherzellen hingegen ist die Zahl der Lösch-Schreib-Vorgänge begrenzt. Die Zahl der Löschzyklen ist vom Hersteller abhängig. Typischerweise liegt die Lebensdauer von Speicherzellen bei Multi-Level-Cells (MLCs) bei 10.000 Zyklen und bei Single-Level-Cells (SLCs) bei 100.000 Zyklen.
Generell wird aber der Einsatz von eSSDs auch im Rechenzentrum mehr und mehr zur Regel werden, wenn die Kapazität der Solid State Drives weiter steigt und die Preise sinken. Die Abstriche, die Unternehmen bei der Kapazität machen müssen, sind heute schon gering. So bietet Toshiba beispielsweise eine SSD mit 1,6 TB an. Es handelt sich dabei um eine eSSD mit NAND-Technologie, die auf einer kosteneffizienten – im 24-Nanometer-Fertigungsverfahren produzierten – Enterprise Multi-Level Cell (eMLC) basiert. Neben einer Speicherkapazität von 1,6 TB bietet sie eine Übertragungsrate von bis zu 12 Gbit/s mit einer Dual-Port-SAS-Schnittstelle. Auch in puncto Zuverlässigkeit können die Laufwerke überzeugen: Der Schutz der gespeicherten Daten wird unter anderem durch ein hocheffizientes Error-Correction-Code (ECC)-Verfahren sichergestellt.
eSSDs werden HDDs ergänzen, aber nicht ersetzen
Würden alle HDDs in einer Storage-Infrastruktur durch SSDs ersetzt, hätte das eine dramatische Performance-Verbesserung zur Folge. Aber die Kosten einer solchen Lösung wären extrem hoch. Zudem besteht keine Notwendigkeit, eine derartige Infrastruktur aufzubauen, denn eines muss man sich immer vor Augen halten: In einem Storage-System wird nicht auf alle Daten mit derselben Frequenz zugegriffen. Daten können dabei in drei Klassen eingeteilt werden: Daten mit hohen, mittleren und geringen Zugriffswerten. Auf Basis dieser Klassifizierung ist es möglich, ein hochperformantes und gleichzeitig kosteneffizientes System aufzubauen, mit eSSDs und HDDs, die eine hohe Geschwindigkeit bieten, sowie HDDs mit hoher Speicherkapazität.
Die Vorteile eines solchen Systems sind weitreichend. Toshiba-Berechnungen am Beispiel einer 300 TB großen Storage-Architektur zeigen das deutlich. So bietet hier eine Tiered-Storage-Lösung im Vergleich zu einem herkömmlichen rein HDD-basierten Ansatz eine Performance-Verbesserung im Hinblick auf den IOPS-Wert um annähernd das 7,5-Fache. I/O-Bottlenecks können damit entscheidend beseitigt werden. Außerdem werden bei einem mehrstufigen Storage-System rund zwei Drittel weniger Laufwerke benötigt und der Energieverbrauch wird um rund 55 Prozent vermindert. Nicht zuletzt führt eine Tiered-Storage-Architektur auch zu geringeren Total Cost of Ownership (TCO).Eine zukunftssichere Tiered-Storage-Architektur besteht aus vier Ebenen.
Tier 0: hohe Geschwindigkeit
Auf Tier 0 sollten neue Enterprise Solid State Drives eingesetzt werden, die Hochverfügbarkeit und einen sehr hohen Datendurchsatz bieten. Das wichtigste Feature auf diesem Tier ist die hohe Performance, das heißt, dass User immer einen unmittelbaren Datenzugriff haben. Hier sollten sich die unternehmenskritischen Informationen befinden, auf die schnell und von einer großen Anzahl an Usern zugegriffen werden muss: zum Beispiel Datenbanken oder E-Mail-Konten. eSSDs mit einem Flashspeicher sind hier die ideale Lösung. Konkret eingesetzt werden sollten SSDs mit NAND-Flashspeicher: entweder SLCs oder MLCs. Eine SLC-Speicherzelle kann ein Bit pro Zelle speichern, eine MLC-Speicherzelle zwei oder mehr Bit pro Zelle, da sie eine größere Anzahl von Spannungsebenen (vier oder acht statt zwei wie bei der SLC) verwendet.
Tier 1: für den häufigen Datenzugriff
Tier 1 ist für die Daten geeignet, auf die häufig zugegriffen werden muss. Es empfehlen sich SAS-HDDs der High-End-Klasse mit einer Umdrehungsgeschwindigkeit von 15.000 rpm. Sie sind die ideale Kompromisslösung im Hinblick auf Energieverbrauch, Latenz- und Zugriffszeit. Im Vergleich zu SAS-HDDs mit 10.000 rpm weisen sie eine geringere Kapazität und damit höhere Kosten pro Gigabyte auf. Da auf diesem Level jedoch weniger HDDs benötigt werden, sind sie die optimalen Lösungen im Hinblick auf das Kriterium „Input/Output-Performance pro Sekunde“.
Tier 2: Performance und Kapazität
Tier 2 sollte für Anwendungen mit direktem Speicherzugriff genutzt werden, die eine hohe Kapazität erfordern. Ideal geeignet sind hier schnelle SAS-HDDs mit 10.000 rpm. Sie bieten unter allen HDD- und SSD-Lösungen die beste Ausgewogenheit zwischen Performance, Kapazität und Preis. Es handelt sich dabei in der Regel um energieeffiziente 2,5 Zoll (4,6 cm) große HDDs, die sich durch eine geringe Wärmeentwicklung und damit niedrigen Kühlungsbedarf auszeichnen.
Tier 3: für die digitale Historie
Der vierte und letzte Layer im Bereich Enterprise Storage umfasst geschäftskritische Daten, die zwar nicht täglich benötigt werden, die aber gespeichert und archiviert werden müssen. Auch wenn bei ihnen die Dauer für die Datenbereitstellung (Recovery Time Objective) unkritisch ist, sollte man auf sie relativ schnell zugreifen können. Es empfehlen sich Nearline-HDDs mit einer Umdrehungsgeschwindigkeit von 7.200 rpm und geringen Kosten pro Gigabyte. Geeignet sind sie für die Speicherung großer Datenmengen – zum Beispiel für historische Daten oder Transaktionsdaten.
Es ist ein Fakt, dass das Datenwachstum nicht aufzuhalten ist. Gefragt sind also Lösungen, mit denen Unternehmen ohne hohen Investitionsaufwand darauf reagieren können. Grundsätzlich gilt: Die Entscheidung für die am besten geeignete Storage-Lösung ist immer von der Art der Anwendung abhängig. Unternehmen sollten deshalb eine Lösungskombination aus herkömmlichen Festplatten für die mittel- bis langfristige Datenhaltung und SSDs für den schnellen Zugriff auf kritische und wichtige Daten wählen. Auf dieser Basis kann eine Tiered-Storage-Architektur realisiert werden, mit der die Herausforderungen im Hinblick auf Speicherkapazität, Energieeffizienz und Datenmanagement kostengünstig zu bewältigen sind.
1. vgl.: http://germany.emc.com/about/news/press/2012/20121211-01.htm