Werbung
Einer der wichtigsten Faktoren für moderne Rechenzentrum ist deren Effizienz. Zwar wird auch die Hardware immer schneller, allerdings bewegt sich auch die Leistungsaufnahme noch klar in höhere Regionen. Dementsprechend werden neue Rechenzentren hinsichtlich ihrer Stromversorgung größer ausgelegt. Typischerweise werden die größten Rechenzentren für 32 MW (Megawatt) ausgelegt, inzwischen aber sollen die ersten Rechenzentren gebaut werden, die auf 1 GW (Gigawatt) ausgelegt sind. Entsprechende Aussagen sind von Marvell auf dem OCP Global Summit zu hören, die von Analyst Dylan Patel auf X wiedergegeben werden.
Aber die zusätzliche elektrische Leistung in den Rechenzentren wird nicht nur für die Rechenhardware als solches benötigt, sondern auch für das Netzwerk, denn auch diese werden immer schneller und hungriger. In der vergangenen Woche veröffentlichte NVIDIA eine Datecenter-Roadmap, die auch die Netzwerk-Produkte enthielt. Dieser zufolge ist in den kommenden beiden Jahren eine Steigerung in der Netzwerkbandbreite von aktuell 400 GBit/s auf 800 GBit/s und dann ab 2025 1.600 GBit/s pro Port auszugehen.
Die immer schnelleren, aber auch immer komplexeren Netzwerke nehmen einen zunehmend großen Anteil an den Anschaffungs- und Betriebskosten moderner Rechenzentren ein. Am Beispiel eines GPU-Clusters macht Dr. Loi Nguyen, Leiter der Optical Group bei Marvell die Entwicklung deutlich:
Ein GPU-Cluster mit 1.000 GPUs verwendet etwa 5 % seiner Leistungsaufnahme für die Netzwerkverbindungen. Bei 4.000 GPUs – und solche GPU-Cluster gibt es aktuell bereits, zum Beispiel mit GPU-Beschleunigern von NVIDIA – kommt bereits auf 12 %. Für ein mögliches GPU-Cluster mit 32.000 GPUs kämen bereits 2.000 Switches und 70.000 optische Verbindungen zum Einsatz. Ein relativ großer Teil der Gesamtleistungsaufnahme von geschätzten 45 MW würde auf die Netzwerktopologie fallen.
Optische Netzwerkverbindungen können dabei einen gewissen Anteil daran leisten, dass die Effizienz im Netzwerk selbst zunimmt. Aber auch die optischen Netzwerke benötigen Strom, da auch die Transceiver immer leistungsfähiger werden. Große GPU-Cluster verwenden zudem eine extrem komplexe Netzwerktopologie, was die Anzahl der einzelnen Verbindungen in die Höhe treibt. Der zunehmende Anteil der Netzwerke an den Kosten solcher Rechennetzwerke ist eine Herausforderung, an der alle beteiligten Unternehmen arbeiten.
Auch an neuen Ethernet-Standards wird gearbeitet. Aktuell aber schrauben noch viele Hersteller an dem, was mal als Ultra Ethernet (Broadcom) oder Falcon (Google) zu einem neuen Standard werden soll.