Leistung und Effizienz
- 23 Minuten
Mehrere Server werden virtualisiert und auf weniger physischen Hosts konsolidiert, um die Auslastung zu erhöhen und die Energiekosten zu reduzieren. Diese Verbesserung ist hilfreich, aber die Nachfrage nach Dienstleistungen im IT-Bereich nehmen in Organisationen stetig zu. Die Anzahl der webbasierten Start-up-Unternehmen, die eine höhere proportionale Nachfrage nach IT-Ausrüstung aufweisen, wächst ebenfalls weiter.
Serverauslastung
Wir betrachten den Stromverbrauch eines inaktiven Servers (im Gegensatz zu CPUs sind nur die Festplattenlaufwerke aktiv, RAM und E/A-Geräte verbrauchen weiterhin Strom) im Vergleich zu einem maximal ausgelasteten Server (CPU-Auslastung beträgt 100 Prozent), um herauszufinden, weshalb die Serverauslastung wichtig ist.
Mit der folgenden Formel können Sie den Stromverbrauch $ P $ bei einer bestimmten Auslastung schätzen (n Prozent):
$$ P_{n} = \left( P_{max} - P_{inaktiv} \right) \times \frac{n}{100} + P_{inaktiv} $$
Durch empirische Messungen ist diese Schätzung hinsichtlich der Auslastungsraten auf fünf Prozent genau.
Wenn eine Organisation ihre monatlichen Gesamtbetriebskosten senken möchte, müssen sowohl innerhalb als auch außerhalb des Racks Änderungen vorgenommen werden. Dazu müssen Sie zunächst das Konzept der Power Usage Effectiveness (PUE) verstehen.
Power Usage Effectiveness (PUE)
Wie Sie bereits erfahren haben, benötigt ein Rechenzentrum eine beträchtliche Menge an Strom, die von Kilowatt bis hin zu mehreren Megawatt reichen kann. Die Stromkosten machen einen beträchtlichen Anteil der Betriebskosten für ein Rechenzentrum und somit auch der Gesamtbetriebskosten (TCO) aus. Da Unternehmen zunehmend webbasierte Dienste anbieten, die mithilfe eines Rechenzentrums bereitgestellt werden, spielen die Stromkosten auch eine wichtige Rolle bei den Preisen für die im Web angebotenen Dienste. Außerdem stellen Emissionen im Zusammenhang mit Rechenzentren ein fortlaufendes Problem dar. Diese wirtschaftlichen und ökologischen Faktoren haben auch den Wunsch verstärkt, die Energieeffizienz von Rechenzentren berechnen und verbessern zu können.
Der von einem Rechenzentrum benötigte Strom wird von der IT-Ausrüstung und der restlichen Ausrüstung wie den Geräten für die Stromverteilung und Kühlung verbraucht. Die Energieeffizienz eines Rechenzentrums beschreibt den Anteil der für die IT-Ausrüstung bereitgestellten Energie im Vergleich zur insgesamt für das Rechenzentrum bereitgestellten Energie. Es sind klare und standardisierte Effizienzmetriken erforderlich, um Rechenzentren über ihre Energieeffizienz zu informieren, Bereiche mit Verbesserungspotenzial aufzuzeigen und in zeitlichen Abständen Vergleiche anzustellen.
The Green Grid ist ein Konsortium, das das Konzept der Power Usage Effectiveness (PUE) und mit der Data center infrastructure efficiency (DCIE) dessen Pendant entwickelt hat. Bei der PUE handelt es sich lediglich um das Verhältnis des insgesamt für das Rechenzentrum bereitgestellten Stroms geteilt durch den von der IT-Ausrüstung verbrauchten Strom. Mit der PUE wird gemessen, wie effizient die Stromversorgung für die IT-Ausrüstung im Rechenzentrum ist.
$$ PUE = \frac{total\ data\ center\ power}{total\ IT\equipment\ power} $$
Wenn die PUE eines Rechenzentrums 3,0 beträgt, nutzen die Geräte (z. B. für Stromverteilung und Kühlung) zwei Energieeinheiten für jede für die IT-Ausrüstung bereitgestellte Einheit. Je niedriger die PUE ist, desto effizienter ist die Ausrüstung des Rechenzentrums. Der ideale PUE-Wert von 1,0 gibt eine Effizienz von 100 Prozent an, was bedeutet, dass der gesamte vom Rechenzentrum beanspruchte Strom für die IT-Ausrüstung bereitgestellt wurde.
Im Jahr 2007 hat die Forschungseinrichtung Lawrence Berkeley National Labs (LBNL) eine Energiestudie für 25 Rechenzentren durchgeführt (siehe Abbildung 20). Die beste PUE betrug 1,14, d. h. 87 Prozent der bereitgestellten Energie wurden für die IT-Ausrüstung verwendet. Der PUE-Wert von 3,0 war das schlechteste Ergebnis, und in diesem Fall wurden nur 33 Prozent für die IT-Ausrüstung verwendet.
Abbildung 20: Studie der LBNL zur PUE von 25 Rechenzentren (Lawrence Berkeley National Labs, 2007)
Die PUE ermöglicht es Unternehmen, Bereiche mit Verbesserungspotenzial zu ermitteln, diese Optimierungen vorzunehmen und den Fortschritt hinsichtlich der PUE im Laufe der Zeit zu überprüfen.
Die PUE misst einfach die effiziente Nutzung von Energie. Es ist wichtig, zu verstehen, welche Faktoren bei der Ermittlung der PUE beteiligt sind, um die Entwürfe von Rechenzentren zu verbessern. Die PUE reicht jedoch nicht als einziges Messelement aus, da die Auslastung der IT-Ausrüstung nicht berücksichtigt wird. Wenn die PUE niedrig ist, die IT-Ausrüstung aber keine sinnvolle Aufgaben leistet, fallen für das Rechenzentrum unnötige Kosten an. Bei neuartigen Ansätzen wird eine TCO-Metrik verwendet, die die Kosten für den Server berücksichtigt. Dadurch können die Energiekosten berechnet werden, die der Server bei einer bestimmten Auslastung im Laufe seiner Lebensdauer verbraucht. Dadurch besteht die Möglichkeit, in Rechenzentren anwendungsspezifische Optimierungen vorzunehmen, die wiederum zu einer effektiveren Nutzung der restlichen Ausrüstung des Rechenzentrums führt.
PDU-Verzweigungen
In einem früheren Modul wurde bereits das Konzept von Stromverteilereinheiten (Power Distribution Units, PDUs) erläutert. Außerdem haben Sie mehr über Ineffizienzen bei verschiedenen Arten von Umwandlungen erfahren. In diesem Abschnitt werden die Vorteile der Verwendung von Dreiphasenwechselstrom und einige Aspekte erläutert, die es bei der Auswahl der Größe und Anzahl von PDUs zu berücksichtigen gilt. Das Lesen dieses Abschnitts ist optional, da er bestimmte Details in Bezug auf Elektrotechnik enthält.
Die Stromverteilung kann entweder auf Rack-, Reihen- oder auf Raumebene erfolgen. Alle verfügen über eine elektrische Zuleitung und bieten eine oder mehrere Abzweigleitungen, die jeweils mit einem Trennschalter geschützt werden (Sicherungsvorrichtung, die bei Überspannung oder unterbrochenem Stromfluss ausgelöst wird). Der Unterschied bei PDUs auf Reihenebene besteht darin, dass diese in der Regel eine höhere Spannung mithilfe eines Transformators in eine geringere Ausgangsspannung umwandeln. (Transformatoren erzeugen Wärme, weshalb bei PDUs auf Reihenebene ebenfalls Kühllüfter vorhanden sind.)
Abbildung 22: PDUs auf Reihen- und Rackebene
Dreiphasenwechselstrom (oft mit dem griechischen Buchstaben phi [3Φ] angegeben) gibt an, wie Wechselstrom generiert und übertragen wird. Jede der drei Phasen entspricht jeweils einer Sinusschwingung mit einer Phasenverschiebung von 120 Grad. Die Nutzung von Dreiphasenwechselstrom ist in normalen Häusern nicht üblich, in Industriegebäuden und modernen Rechenzentren jedoch gängige Praxis. Es ist wichtig, jede Phase so gleichmäßig wie möglich zu halten. Sie sollten nicht eine Verzweigung für alle Server verwenden und diese stattdessen versetzt anordnen. Die maximal von einem Drehstromkreis verarbeitbare Leistung ist höher als jene einer einzelnen Phase (1Φ) für jede Kupferleitung (gleiche Dicke).
| Phase | Leistungsgleichung | Erforderliche Leitung | Watt und Leitung |
|---|---|---|---|
| 1Φ | $ W = V \times I $ | Hitzdraht, Neutralleiter, Schutzleiter | 1.0x |
| 3Φ | $ W = 3 \times \frac{V_{Leitung} \times I_{Leitung}}{\sqrt{3}} $ | Außenleiter 1, Außenleiter 2, Außenleiter 3, Neutralleiter, Schutzleiter | 1.8x |
Wenn $V$ = 120 Volt und $I$ = 15 Ampere betragen, dann beträgt der Wechselstrom 1.800 Watt für drei Leitungen. Wenn $V$ = 208 Volt und $I$ = 15 Ampere betragen, dann beträgt der Dreiphasenstrom 5.410 Watt für fünf Leitungen. (Denken Sie daran, dass nur die Stromstärke in Ampere die erforderliche Stärke der Kupferleitung bestimmt.)
Es ist wichtig, dass Sie die maximale Leistung von Verzweigungen ermitteln, wenn Sie die Anzahl und Größe der PDU(s) für Ihre IT-Ausrüstung auswählen. Der National Electrical Code (NEC) gibt an, dass der Netzstrom 80 Prozent der Leistung des Trennschalters (oder der Sicherung) nicht überschreitet.
| Stromstärke (Ampere) | 15 | 20 | 30 | 50 | 70 |
|---|---|---|---|---|---|
| Begrenzung auf 80 Prozent | 12 | 16 | 24 | 40 | 56 |
Ein Server verbraucht nur selten die Wattzahl, die für das Netzteil angegeben ist. Für eine Stromversorgungseinheit ist beispielsweise eine Leistung von 975 Watt angegeben, der Server beansprucht bei maximaler Kapazität aber möglicherweise nur 650 Watt. Aus diesem Grund ist es sinnvoll, für jedes neue Servermodell bei verschiedenen Lasten (inaktiv, 25, 50 75 oder 100 Prozent) eine Leistungsmessung durchzuführen, bevor es in die Produktion geht.
Beim Entwerfen eines redundanten Systems ist es üblich, mehrere unabhängige Pfade von der Stromquelle zum IT-Gerät zu haben. Denken Sie an redundante Stromsysteme (und Kühlsysteme) wie Festplattenlaufwerke in RAID-Systemen. Denken Sie daran, dass bei einem RAID-1-Mirroring (Spiegelung) der Ausfall eines Laufwerks verkraftet wird, jedoch auch die Hälfte der Kapazität verloren geht. Dies ist analog zur Redundanz $2N$, da keine einzelne Komponente (z. B. USV, Generator, PDU) mit über 50 Prozent der ursprünglichen Kapazität genutzt werden kann. Bei RAID 5 kann der Ausfall eines einzelnen Laufwerks noch immer kompensiert werden, die Auslastung der einzelnen Laufwerke ist aber höher, was beim Strom und den HVAC-Geräten die Redundanz $N+1$ ist. Die verbleibenden (funktionierenden) Einheiten müssen die Auslastung der ausgefallenen Einheit kompensieren.
Sie nutzen beispielsweise eine Last von 100 Kilowatt und wünschen redundante USVs. In einem $2N$-System haben Sie zwei USVs, die jeweils 100 Kilowatt nutzen können, der normale Lastwiderstand beträgt jeweils aber nur 50 Kilowatt. Wenn Sie stattdessen drei USV-Einheiten verwenden, können diese jeweils kleiner sein und 50 Kilowatt verarbeiten, obwohl sie einen normalen Lastwiderstand von 33 Kilowatt haben. In diesem Fall ist die Auslastung höher (66 anstelle von 50 Prozent), sodass die USVs auch effizienter ausgeführt werden.
Obwohl das Bladechassis und einige größere 4-U- und 5-U-Server über $N+1$-Stromversorgung verfügen, sind die meisten Server und Netzwerkgeräte auf eine redundante Stromversorgung mit $2N$ ausgelegt. Aus diesem Grund gibt es für die Racks in einem herkömmlichen Rechenzentrum jeweils zwei Stromzufuhren. Auf diese Weise kann eine Stromzufuhr die Versorgung übernehmen, wenn die andere ausfällt. Sie müssen jedoch vorsichtig sein, da eine Stromzufuhr bei einem Ausfall der anderen die doppelte Last verarbeiten muss. Falsche Annahmen führen häufig dazu, dass eine Abzweigleitung überladen wird, was bei normalen Bedingungen unbemerkt bleibt. Wenn ein einzelner Fehler auftritt, hat dieser einen kaskadierenden Effekt, da dann die restlichen Verzweigungen überladen und die Trennschalter ausgelöst werden. Dieser Fehler führt dazu, dass die Stromversorgung für einige oder alle Server in einem Rack ausfällt.