aus dem Netzwerk Insider Dezember 2021
Data Center sind das Herz jedes Unternehmensnetzwerks. Kommt es beim Umzug des Rechenzentrums zu Störungen, kann dies für das Unternehmen unter Umständen existenzgefährdend sein. Doch wie zieht man ein Rechenzentrum schadenfrei und geschützt um, ohne den laufenden Geschäftsbetrieb zu beeinträchtigen? Die Zeit, in der Server und Komponenten vom bisherigen in das neue Rechenzentrum gebracht werden müssen, ist knapp bemessen. Eine akribische Vorbereitung ist deshalb das A und O.
Hartmut Kell ist durch seine über dreißigjährige Tätigkeit bei ComConsult Profi in der Planung und Beratung von passiven Infrastrukturen von IT-Umgebungen und gibt Ihnen in diesem Interview wertvolle Hinweise aus seinen Projekten, auf was Sie beim Umzug Ihres Rechenzentrums achten sollten.
Der Umzug eines Rechenzentrums ist höchst anspruchsvoll. Deshalb sollte man ihn genau planen. Was ist dabei der wichtigste erste Schritt?
Ganz wichtig ist, dass der genaue Bestand des vorhandenen Rechenzentrums dokumentiert ist. Bei bestehenden Rechenzentren ist das leider meist nicht der Fall bzw. nur sehr ungenügend. Die IT-Infrastrukturen sind oft über viele Jahre gewachsen und schwer zu durchschauen. Da weiß Herr Müller, wo die Server stehen und Herr Schmitz weiß, wie sie verschaltet sind, dokumentiert ist aber wenig und wenn einer der beiden Kollegen nicht da ist, weiß niemand darüber Bescheid.
Es muss also eine Tabelle angelegt werden, in die der Bestand unter größter Sorgfalt eingepflegt wird. Dazu gehören unter anderem: Montageort des Objektes, wie sieht die Stromversorgung des Gerätes aus, wie sieht die aktuelle Netzwerk-Verschaltung aus und vieles mehr.
Ebenso wichtig ist es, genau zu beschreiben, wo und wie die einzelnen Komponenten am Zielort eingebaut und angeschlossen werden sollen. Da davon auszugehen ist, dass mehrere Nutzer in einem RZ diese Vorgaben koordiniert machen müssen und ein Koordinator dieses konsolidieren muss, ist das eine relativ anspruchsvolle Aufgabe.
Es muss eine detaillierte Dokumentation über den Ist-Zustand der im Rechenzentrum eingebauten Komponenten und über deren Neuaufbau am Zielort erstellt werden.
Wie wurden die Vorbereitungen beim Kunden konkret umgesetzt?
Wir wurden beauftragt, den Umzug eines Rechenzentrums einer großen Versicherung zu planen und zu koordinieren. Es gab mehrere Schränke, deren Inhalt bestehend aus Server und Switches es auszubauen und am neuen Standort wieder einzubauen und neu zu verschalten galt. In der Planungsphase haben wir zwei Listen angelegt und permanent fortgeführt. In der „Montageliste“ haben wir „mechanische“ Daten der umzuziehenden Hardware bezüglich des Ausbaustandortes und die Daten zum Einbauort im neuen Serverraum erfasst. Um nach Einbau der Komponenten diese sowohl Strom- als auch IT-seitig verschalten zu können, haben wir separat eine zweite Liste als „Patchliste“ erstellt und geführt.
Die Einrichtung eines Umzug-Koordinators, besetzt durch ComConsult, war von großem Vorteil. Er kann sich als erste Anlaufstelle mit Problemen bei Einbau und Patchung befassen und diese dann mithilfe der Listen gezielt an die Systemadministratoren adressieren – er hat den Durchblick.
Was kann bei der Planung schiefgehen?
Der Teufel steckt im Detail bzw. im Unvorhersehbaren. Ein Beispiel: Wir hatten an einem Tag geplant, dass sehr schwere Komponenten zum neuen Rechenzentrum transportiert werden mussten. Im Vorfeld hatten wir vom beauftragten Umzugsunternehmen prüfen lassen, ob der Transport logistisch möglich war. Dies war erfolgt und es schien soweit alles geregelt. Als die Komponente am Zielort angeliefert wurde und an der Rampe entladen werden sollte, gab es zur gleichen Zeit eine Anlieferung von einem großen LKW, der die Rampe blockierte und sie erst Stunden später freigeben konnte. In kürzester Zeit musste ein Notfallplan ausgearbeitet werden, mit dem die zeitlichen Verzögerungen minimiert werden konnten.
Was macht man, wenn der Terminplan nicht eingehalten werden kann?
Wir legen einen Zeitplan für den Umzug fest und planen dabei einen Spielraum für eventuelle unvorhersehbare Ereignisse ein. Zunächst hatten wir die Überlegung, dass wir die genaue Uhrzeit erfassen, wann eine Komponente ausgebaut und wann sie eingebaut wird. Wir haben jedoch schnell gemerkt, dass das nur zu Stress führt, weil sich das so genau nicht realisieren lässt. Daraufhin haben wir nach dem ersten Umzugstag mit einem gröberen Terminplan gearbeitet, der mehr Freiheiten lässt: wir haben nur das Datum festgelegt, den Tag in eine Morgen-, Mittags- und Abendschicht unterteilt und die Komponenten diesen Schichten zugeordnet.
Es muss einen Zeitplan für den Tag des Umzugs geben.
Die Maßnahmen zur Vorbereitung des Umzugs sind abgeschlossen und das IT-Equipment ist aus dem alten Rechenzentrum in ein neues umgezogen. Welche Probleme treten häufig auf?
Es kann vorkommen, dass ein Monteur eine Komponente nicht dort einbaut, wo sie laut Liste hinkommen muss. Wenn dann eine weitere Komponente eingebaut werden soll und der Platz schon besetzt ist, muss recherchiert werden, wer wo einen Fehler gemacht hat (Planung, Einbau?). In dieser Zeit stoppt der Einbau.
Wenn alle Komponenten an ihrem richtigen Platz installiert sind, kommt es zum problematischsten Teil: dem Beschalten. Die zuständigen Systemadministratoren unseres Kunden hatten dafür keine Zeit, weil sie sich um Konfiguration, Inbetriebnahme und Tests kümmern mussten. Deshalb wurde mit dieser Leistung ein Umzugsunternehmen beauftragt. Demzufolge ist eine gewissenhafte und detaillierte Erstellung und Pflege der Rangierliste von größter Bedeutung, denn der einzelne mit dem Umzug beauftragte Techniker kann keinerlei Plausibilitätsprüfung durchführen. Fehler beim Einbau und insbesondere bei der Verschaltung können zu einem erheblichen Zeitverlust und gegebenenfalls zu einer Gefährdung des abgestimmten Terminplans führen. Die Fehlersuche ähnelt dann manchmal etwas einer Detektivarbeit, sie kann vermutlich nie ausgeschlossen, doch mit gewissenhafter Pflege der Listen minimiert werden.
Das Rechenzentrum ist erfolgreich umgezogen, alle Systeme laufen. Was ist jetzt noch zu tun?
Die Erfahrung zeigt, dass trotz gründlicher Vorbereitung und ausführlicher Listen der Umzug wegen spontaner Änderungen und kurzfristiger Improvisation nicht genau so abläuft, wie man es geplant hat. Das bedeutet, dass die Listen, die in der Vorbereitungsphase erstellt wurden, nach dem Umzug nachgepflegt werden müssen. Es ist sehr verführerisch, bei einer erfolgreich umgezogenen und in Betrieb genommenen Komponente die vorher erstellte Umzugsdokumentation nicht nachzuführen (zum Beispiel einen fehlerhaften Patch-Eintrag zu korrigieren). Davon ist dringend abzuraten. In kürzester Zeit hat man eine zumindest in Teilen fehlerhafte Dokumentation und das ist – das wissen alle ITler – schlimmer als gar keine Dokumentation.
Gibt es noch einen besonderen Tipp, den jeder beim Umzug seines Rechenzentrums beachten sollte?
In unserem Team hat sich der Begriff „Drehbuch“ etabliert. Man kennt ihn ja aus der Filmbranche. Im Drehbuch werden alle technischen und organisatorischen Entscheidungen verschriftet und man kann nachlesen, wer wann genau was macht. Wir haben für unsere Projekte Drehbücher erstellt, in denen wir detailliert geschildert haben, was alle Beteiligten genau wann zu erledigen haben. Das schließt auch ein, Risiken im Drehbuch aufzuzeigen und die dazugehörenden Eskalationsprozesse zu beschreiben. Was passiert zum Beispiel, wenn Umzug und Inbetriebnahme einer betriebskritischen Komponente für Samstag geplant wurden, die Inbetriebnahme jedoch erst im Laufe des Montags erfolgreich war?
Ich kann nur empfehlen, sich mit dem Drehbuch intensiv auseinanderzusetzen.
Ein Drehbuch ist für den reibungslosen Ablauf des RZ-Umzugs ein gutes Hilfsmittel.