Server-Right-Sizing: Schluss mit Überprovisionierung

Überdimensionierte Server verbrennen still das Budget. Praxisleitfaden zum Right-Sizing der Kapazität und zum Senken verschwendeter Infrastrukturkosten.

Überprovisionierung ist der leiseste Posten in jedem Infrastrukturbudget. Niemand genehmigt ein Projekt, um Geld zu verschwenden, und doch laufen die meisten Rechenzentren mit einem Bruchteil der Kapazität, für die sie bezahlt haben: Reihen von Servern dümpeln bei einstelliger Auslastung vor sich hin, während die Rechnungen für Abschreibung, Strom und Kühlung Monat für Monat unverändert eintreffen. Right-Sizing ist die Disziplin, diese Lücke zu schließen: bereitzustellen, was Workloads tatsächlich brauchen, plus eine vernünftige Reserve, statt dessen, was jemand vor drei Jahren für möglich hielt.

Es geht nicht darum, Hardware in den roten Bereich zu treiben oder bei der Ausfallsicherheit zu sparen. Es geht darum, angstgetriebene Dimensionierung durch evidenzbasierte zu ersetzen und das Budget zurückzuholen, das die Überprovisionierung still verzehrt. Dieser Leitfaden erklärt, warum die Verschwendung entsteht, welche Kennzahlen sie wirklich offenlegen und mit welcher Methode sich Kapazität mit Zuversicht dimensionieren lässt.

Warum Überprovisionierung überhaupt entsteht

Überprovisionierung ist selten Nachlässigkeit. Sie ist das rationale Ergebnis mehrerer Zwänge, die alle in dieselbe Richtung drängen: kauf mehr.

Der erste Zwang ist die Angst, dass es knapp wird. Eine Anwendung, der in der Spitze Arbeitsspeicher oder CPU ausgeht, fällt sichtbar aus, und wer sie dimensioniert hat, bekommt die Schuld. Das Doppelte des Bedarfs zu kaufen ist eine billige Versicherung gegen diese Blaße, also tut man es standardmäßig. Der zweite ist der Aufwand der Veränderung. Im klassischen Beschaffungsmodell heißt späteres Nachrüsten Bestellung, Lieferzeit und Wartungsfenster, also legen Teams Kapazität vorab üppig aus, um nie wieder fragen zu müssen. Der dritte ist schlichtes Raten: Dimensionierungsentscheidungen fallen oft, bevor ein Workload überhaupt existiert, auf Basis von Herstellerempfehlungen oder Worst-Case-Annahmen, und niemand prüft sie erneut, sobald das echte Nutzungsmuster sichtbar wird.

Das Ergebnis ist strukturell. Untersuchungen von Unternehmensrechenzentren finden regelmäßig eine durchschnittliche Serverauslastung im Bereich von 12 bis 18 Prozent. Das bedeutet, dass die überwältigende Mehrheit der gekauften, mit Strom versorgten und gekühlten Rechenkapazität in jedem Moment nichts tut.

Die versteckten Kosten ungenutzter Kapazität

Es ist verlockend, geringe Auslastung mit den Schultern zu zucken abzutun, die Server sind ja schon gekauft, wo ist der Schaden? Der Schaden ist, dass ungenutzte Kapazität nicht kostenlos ist; sie verursacht laufende Kosten lange nach dem Kauf.

Jeder eingeschaltete Server zieht Strom, ob beschäftigt oder im Leerlauf, und ein leerlaufender Server verbraucht oft noch die Hälfte oder mehr seiner Spitzenleistung. Er belegt Rackplatz, der reale Kosten pro Einheit hat. Er erzeugt Wärme, die gekühlt werden muss, was seinen Energieabdruck grob verdoppelt. Er verbraucht eine Softwarelizenz, einen Supportvertrag, einen Platz in Ihrem Patch- und Monitoring-Aufwand und einen Anteil der Personenzeit, die nötig ist, ihn gesund zu halten. Und er schreibt planmäßig ab, ganz gleich, wie wenig er gearbeitet hat.

Multipliziert man das über eine Flotte bei 15 Prozent Auslastung, wird das Bild deutlich: Möglicherweise zahlen Sie für das Fünf- oder Sechsfache der Hardware, die Ihre Workloads wirklich brauchen, mit allen laufenden Betriebskosten, die das mit sich bringt.

Die Kennzahlen, auf die es wirklich ankommt

Right-Sizing steht und fällt mit der Messung. Dimensionierung nach Bauchgefühl hat das Problem geschaffen; Dimensionierung nach Daten löst es. Der Kniff besteht darin, die richtigen Zahlen über das richtige Zeitfenster zu betrachten.

Perzentile betrachten, nicht Durchschnitte und nicht Spitzen

Durchschnitte verbergen Spitzen, und Spitzen rechtfertigen Verschwendung. Das 95. oder 99. Perzentil der Auslastung über einen repräsentativen Zeitraum (einige Wochen, die Ihre echten Zyklen erfassen) ist die maßgebliche Größe. Sie zeigt, welches Niveau Ihr Workload unter normaler hoher Last tatsächlich erreicht, ohne den seltenen, kurzen Ausreißer, den Sie mit Burst-Reserve und nicht mit dauerhafter Kapazität abfangen sollten.

Alle vier Dimensionen messen

CPU ist die Kennzahl, die alle beobachten, doch Right-Sizing verlangt, CPU, Arbeitsspeicher, Storage-I/O und Netz gemeinsam zu betrachten. Ein Workload kann speichergebunden sein, während seine CPU leer läuft, oder an der Platten-I/O verhungern, während alles andere unauffällig aussieht. Allein nach CPU zu dimensionieren führt zu Maschinen, die zugleich beim Rechnen überdimensioniert und bei der Ressource, die sie wirklich begrenzt, unterdimensioniert sind.

Auslastung über die Zeit beobachten, nicht als Momentaufnahme

Eine einzelne Messung sagt nichts. Workloads haben tägliche, wöchentliche und saisonale Rhythmen, ein Lohnsystem, das 27 Tage ruhig und drei Tage hektisch ist, will um diesen Zyklus herum dimensioniert werden, nicht um einen beliebigen Dienstagnachmittag. Kontinuierliches Monitoring macht aus der Dimensionierung eine Entscheidung statt einer Vermutung.

Eine praktische Right-Sizing-Methode

Mit den richtigen Kennzahlen in der Hand ist die Methode geradlinig und wiederholbar. Beginnen Sie mit einer Basislinie: Instrumentieren Sie jeden Workload und erfassen Sie die Auslastung über alle vier Dimensionen mindestens einige Wochen lang. Bestimmen Sie dann die Ausreißer an beiden Enden, die Workloads unter 10 Prozent, klare Kandidaten zum Konsolidieren oder Verkleinern, und jene, die an ihre Grenzen stoßen und mehr Raum brauchen.

Dimensionieren Sie anschließend zum gemessenen 95. Perzentil zuzüglich einer bewussten, dokumentierten Reserve für Wachstum und Bursts, statt eines willkürlichen Vielfachen. Konsolidieren Sie die Verbliebenen: Workloads mit geringer Auslastung, die sich einzeln nicht verkleinern lassen, kann man per Virtualisierung oft auf gemeinsame Hosts packen und so die Auslastung der zugrundeliegenden Hardware Richtung gesunder 60 bis 70 Prozent heben. Machen Sie daraus schließlich eine Schleife, kein einmaliges Vorhaben. Workloads verändern sich, und die richtige Größe des letzten Quartals ist die Verschwendung dieses Quartals, also prüfen Sie die Daten in regelmäßigem Takt.

Wie Virtualisierung und Elastizität die Rechnung verändern

Der Grund, warum Right-Sizing heute weit erreichbarer ist als vor einem Jahrzehnt, liegt darin, dass Virtualisierung das starre Modell einer Anwendung pro Server aufbricht. Sind Workloads virtuelle Maschinen, lassen sie sich mit einer Konfigurationsänderung statt eines Beschaffungszyklus neu dimensionieren, zum Lastausgleich zwischen Hosts migrieren und zu vielen auf jeden physischen Server packen, sodass die zugrundeliegende Hardware beschäftigt bleibt.

Auch hier verliert die Angst, die zur Überprovisionierung treibt, ihren Griff. In einer gut geführten Private Cloud ist das Hinzufügen von CPU oder Arbeitsspeicher zu einer VM ein schneller, risikoarmer Vorgang statt eines mehrwöchigen Projekts. Sobald Teams darauf vertrauen, Kapazität in Minuten erweitern zu können, wenn sie sie wirklich brauchen, verschwindet der Anreiz, sie vorab zu horten, und die Dimensionierung kann endlich der Realität folgen.

Right-Sizing und die Ökonomie eigener Hardware

Right-Sizing zählt am meisten, wenn Sie Ihre Infrastruktur selbst besitzen, weil sich die Einsparungen aufsummieren. In der Public Cloud zeigt sich Überprovisionierung als aufgeblähte Monatsrechnung, die zumindest sinkt, wenn Sie Instanzen verkleinern. Bei eigener Hardware ist Überprovisionierung ein versenkter Kapitalbetrag plus laufende Kosten für Strom, Kühlung, Platz und Betrieb, die Sie über die gesamte Abschreibungsdauer tragen, ob Sie sie nutzen oder nicht.

Das schneidet in beide Richtungen. Überprovisionierung auf eigener Hardware ist besonders teuer, doch Right-Sizing auf eigener Hardware liefert auch besonders dauerhafte Einsparungen. Eine am echten Bedarf dimensionierte Flotte braucht weniger physische Server, weniger Rackplatz, weniger Strom und weniger Kühlung, und diese Reduktionen bleiben Jahr für Jahr bestehen. Die Disziplin zahlt eine wiederkehrende Dividende, keinen einmaligen Rabatt.

Es dauerhaft machen

Das Schwierigste am Right-Sizing ist nicht das erste Aufräumen, sondern das Halten der Gewinne. Kapazitätszuwachs ist unerbittlich: Neue Workloads kommen aus Gewohnheit überdimensioniert, alte werden nie außer Betrieb genommen, und die Auslastung driftet still wieder nach unten. Das Gegenmittel ist Sichtbarkeit. Kontinuierliches Monitoring der Auslastung über die gesamte Flotte, mit Dashboards, die leerlaufende und überdimensionierte Ressourcen offensichtlich machen, verwandelt Right-Sizing aus einem schmerzhaften jährlichen Audit in Routinehygiene.

Genau das ist die Philosophie, nach der clouditiv Managed Private Cloud betreibt. Unsere OpenStack-Plattform macht das Neudimensionieren einer VM zu einem schnellen Self-Service-Vorgang, sodass Kunden am echten Bedarf dimensionieren können, ohne die Beschaffungsreibung, die Verschwendung nährt, und unser integriertes Monitoring mit Prometheus und Grafana hält die Auslastung über CPU, Arbeitsspeicher, Storage und Netz jederzeit sichtbar. Wie diese Beobachtbarkeit aussieht, sehen Sie auf unserer Monitoring-Seite, wo das Ziel einfach ist: für die Kapazität zu zahlen, die Ihre Workloads nutzen, nicht für die, vor deren Knappheit Sie sich einmal gefürchtet haben.

Das Wesentliche

Überprovisionierung ist eine Steuer dafür, nach Angst statt nach Evidenz zu dimensionieren, und sie entzieht dem Budget still Mittel über leerlaufende Hardware, vergeudeten Strom und unnötigen Betriebsaufwand. Right-Sizing kehrt das um, indem es reale Auslastung an aussagekräftigen Perzentilen über alle vier Ressourcendimensionen misst, zum echten Bedarf mit vernünftiger Reserve neu dimensioniert und die Zahlen mit der Entwicklung der Workloads erneut prüft. Kombiniert mit Virtualisierung und gutem Monitoring wird aus Kapazität statt einer Vermutung eine verwaltete, fortlaufend optimierte Ressource, und es kehrt Geld zurück, das für nichts ausgegeben wurde.