Am gestrigen Montag kam es nachts gegen 02:00 zu einem Komplettausfall des Servers Terra, weshalb zentrale Anwendungen wie PHPMyAdmin, die Webmail-Applikationen oder unser Monitoring-System/Serverstatus nicht verfügbar waren.
Das Problem konnte vom Rechenzentrum nicht behoben werden, weshalb wir die Störung vor Ort beseitigen mussten.
Ursache für den Ausfall war ein kaputter CPU-Lüfter, weshalb der Server sich nach Überhitzung selbst ausschaltete – nach dem Tausch der Komponente läuft das System nun wieder störungsfrei.
Als Konsequenz werden wir kritische Messwerte wie CPU-Temperatur und Umdrehungszahl der CPU-Lüfter in unser Monitoringsystem aufnehmen, um auch in diesem Fall frühzeitig benachrichtigt zu werden.