Das größte Problem für mich sind derzeit die Management-Lösungen der verschiedenen Hersteller für ihre Server. Ich kümmere mich um Server in niedriger vierstelliger Anzahl und dann interessiert es mich nicht mehr was die IPMI Implementation des jeweiligen Herstellers kann bzw. was die einzelne Hardware an Management-Optionen bietet. Das ist zwar auch schön und gut, aber richtig interessant sind dann nur noch umfassende Lösungen für die komplette Infrastruktur. Und da wird es dann meist etwas heikel, wenn eine klassische "Hardware Bude" anfängt Software zu basteln. Ich nenne da jetzt erst mal bewusst keine Namen, aber bei den für mich relevanten Herstellern hab ich den richtig großen Wurf noch nicht erlebt.
Support ist auch so ein Thema, wenn z.B. darauf bestanden wird den Tausch eines Mainboards nur durch einen Techniker durchführen zu lassen. Da meinen die es ja sogar noch meistens gut mit dem Kunden, weil sie da für mich einen Service erbringen, der aus deren Sicht einen Mehrwert für mich bietet, tatsächlich ist es aber eher total nervig alles nötige für den Technikereinsatz abzustimmen. Durch fünfmaliges Nachfragen und/oder spezielle Vereinbarungen kriegt man es dann normalerweise hin und man bekommt auch ein Mainboard als Ersatzteil zum selbst tauschen einfach zugeschickt, aber anfänglich gibt es da immer gewisse Reibungsverluste.
Das Problem, was dem Ganzen zu Grunde liegt, ist die Ausrichtung der verschiedenen Supportabteilungen. Ein Großteil der Kunden sind sicherlich eher kleine Firmen ohne irgendwelche IT Kompetenzen und für die ist das dann eine super Sache. Es wäre mal wichtig beim Support zu hinterlegen was die größeren Kunden mit ausreichend Know How sind um solche Reibungsverluste von Anfang an zu verhindern. Oft geht das mit höherwertigen Supportverträgen einher, die für uns aber total uninteressant, weil unwirtschaftlich, sind.
Meistens lösen wir das dann anders indem wir den kaputten Server erstmal "auf eigene Kosten" mit einer Maschine ersetzen die noch im Lager steht um dann Troubleshooting und Reparatur der defekten Maschine außerhalb des Rechenzentrums durchzuführen, sofern es sich noch lohnt. Blöd ist es nur, wenn das bei einem Modell passiert von dem man (noch) nicht viele im Einsatz hat und daher auch kein Ersatz zur Verfügung steht.
Handling von Ersatzteilen gehört auch zu diesem Themenkomplex. Defekte Teile zurückzuschicken, die zum Großteil dann sowieso entsorgt werden, ist nervig für mich, ökologisch fragwürdig und so weiter. Für Datenträger kriegt man das abgestellt, wenn man den Servicelevel kauft bei dem man die defekten Datenträger behalten kann, aber alles andere muss man fleißig zurückschicken. Bei einem Hersteller gibt es dafür dann vorbereitete Rücksendeaufkleber, das geht sogar noch, bei einem anderen habe ich jetzt kürzlich aber erlebt, dass für die Retoure in den nächsten Tagen ein Kurier zur Abholung erscheint und ich das defekte Teil doch bitte bereithalten soll. Das ist bei einem Unternehmen in unserer Größe total unpraktisch, weil er nicht einfach zu mir ins Büro kommen kann, ich die Teile aber auch nicht einfach am Empfang deponieren, denn die erzählen mir was anderes, und die Warenannahme auf der Rückseite des Gebäudes fahren die Paketdienste von sich aus an, die Kuriere aber normalerweise nicht. Und wann der kommt weiß ich ja auch nicht, ich hoffe mal die melden sich mit genug Vorlauf, wobei ich das kaum glaube. Das wird eher sowas wie "Ich bin in einer Stunde da" oder später dann "Ich konnte sie nicht erreichen, ich sollte doch bei Ihnen was abholen!".
Zusammenfassen könnte man das als Forderung nach stärkerer Orientierung nach den speziellen Umständen der jeweiligen Kunden. Natürlich wollen die ihre Prozesse möglichst innerhalb eines Standards halten, aber bei Kunden die sehr viel Geld da lassen sollte man einfach mal etwas flexibler agieren.
Was die Hardware selbst angeht gibt es eigentlich nicht viel zu berichten. 19" Rackserver sind Verbrauchsmaterial. Die Zuverlässigkeit ist soweit ganz gut, auch herstellerübergreifend sowie ich das sehen kann. Wir haben halt viele Server, daher ist das aus statistischen Gründen völlig normal, dass immer mal was kaputtgeht, trotz eigentlich guter Zuverlässigkeit.
Die häufigsten Defekte sind, mit Abstand, definitiv Festplatten, gefolgt von Netzteilen und DIMMs, wobei letztere schon deutlich Rückstand haben auf Festplatten und Netzteile. Und dann kommen schon nur noch seltenere Einzelfällen, Controller und deren Caches, Netzwerkkarten/FC-Karten und so weiter. Ganz am Ende kommen dann Prozessoren und Mainboards. Im Falle der Mainboards sind da noch die Fälle gemeint, wo der Fehler auf das Board zurückzuführen ist, aber nicht auf eine der auf dem Board verlöteten Komponenten, z.B. die Hardware für IPMI oder onboard Raidcontroller/Netzwerkkarten und so weiter, die dann einen Austausch des eigentlich funktionsfähigen Mainboards erfordern. Da Netzwerkkarten und Raidcontroller immer weniger als klassische onboard-Komponenten ausgeführt, sondern modular konzipiert werden, hat das entsprechend auch abgenommen.
Richtig nervig, wobei das keine technischen Gründe sind, sind Kunden die ewig lange auf ihren uralten Servern hängen, die schon lange EOL sind, weil sie die Migration nicht hinkriegen, und Forderungen nach physikalischer Trennung, entweder durch den Kunden oder durchs Management oder durch die IT-Security-Abteilung. Das macht alles nur unnötig komplex und teuer. Aber das sind beides keine Probleme auf der Hardwareebene.
Die Frage nach der Montage von Festplatten und SSDs in die Rahmen stellt sich bei uns nicht, wir kaufen die Originalteile vom Hersteller und die kommen ja immer mit einem Rahmen. Alles andere wäre für uns nicht machbar, tausende Platten immer erst manuell in Rahmen schrauben wäre vom Aufwand her inakzeptabel und supportet wäre das dann auch nicht. Wenn ich dann ein Problem mit dem Storage des Server habe, dann muss ich den Fehler erstmal mit den originalen Teilen nachstellen und im Fall eines Defekts hab ich dann einen separaten RMA Prozess. Das wäre vom Aufwand her nicht zu leisten, zumal ich dann wieder die Einbehaltung defekter Laufwerke separat verhandeln müsste, sofern das einer der Hersteller überhaupt anbietet.