Ausfall Server mars vom 03.02.2012

Sehr geehrte Kunden,

am 31.01.2012 kam es gegen 17:00 Uhr zu einem Ausfall des Webhosting-Systems mars. Dieses meldete Fehler des RAID-Controllers, so dass das gesamte System heruntergefahren wurde.

Nach wenigen Minuten war „mars“ wieder erreichbar, es traten keine weiteren Fehler auf. Wir haben allerdings direkt beim Hersteller den Austausch der defekten Komponente veranlasst, um diese dann zu einem festen Termin tauschen zu können.

Heute Mittag gegen 12:08 Uhr trat der gleiche Fehler wieder auf, so dass der Server erneut heruntergefahren werden musste. Im Gegensatz zur Störung am Dienstag erkannte das Mainboard den RAID-Controller nicht mehr, der Server blieb also offline.

Durch Komplikationen beim Hersteller traf das Ersatzteil aber nicht beim Rechenzentrum ein, sondern direkt bei uns vor Ort. Ein Austausch des nun ganz defekten Controllers hätte eine Verzögerung von mehr als 3 Stunden bedeutet.

Um den Ausfall für Sie jedoch so kurz wie möglich zu halten, haben wir das Rechenzentrum beauftragt, einen Ersatz-Server in Betrieb zu nehmen. Dieser Server läuft nun mit den Festplatten von mars, bis der Austausch des Controllers durchgeführt werden konnte. Nach dem Austausch werden wir mars kurzzeitig offline nehmen, um die ursprüngliche Konfiguration wiederherzustellen.

[Update 08.02.2012, 12:44 Uhr: der Austausch des Controllers sowie der Rückbau in die „richtige“ Hardware erfolgt heute ab ca. 14:00 Uhr. Es wird zu einem Ausfall von 15-30 Minuten kommen.]

[Update 08.02.2012 15:49 Uhr: Der Controller wurde erfolgreich getauscht, mars läuft nun wieder auf der gewohnten Hardware. Leider wurde der ARP-Cache nicht aktualisiert, weshalb Kunden mit eigenen IP-Adressen (SSL-Zertifikate, Lighttpd-Hosting) einen etwas längeren Ausfall hatten.]

Da sich durch die Verwendung eines anderen Servers auch die Hardware geändert hat, ist es derzeit noch nicht möglich, Änderungen der Web-Einstellungen im Confixx vorzunehmen – hier wurde auch bereits das Zurücksetzen der Lizenz beantragt. Die Lizenz wurde zurückgesetzt, es stehen wieder alle Funktionen zur Verfügung.

Für die Störung bitten wir um Entschuldigung. Sicher werden Sie aber bemerkt haben, dass wir alles uns Mögliche unternommen haben, um den Ausfall so kurz wie möglich zu halten.

Wir hoffen daher, Ihnen auch in dieser Ausnahmesituation wieder bestätigt zu haben, dass Ihre Daten bei uns gut aufgehoben sind und wir sofort eine schnelle Lösung für Sie erreichen konnten.

Bitte beachten Sie zukünftig auch unseren Serverstatus unter:

http://serverstatus.aditsystems.de/

Diese Status-Übersicht ist direkt an unser Überwachungssystem gekoppelt, so dass Sie sich sofort direkt über eventuelle Ausfälle informieren können.

Bei Fragen oder Problemen steht Ihnen unser Support auch jederzeit zur Verfügung.

Post navigation