Auf dem Server Mars kam es seit gestern abend zu „unerklärlichen“ Störungen. Nach dem Hinweis eines Kunden auf „No space left on device“ war die Ursache jedoch schnell klar:
Die Partition mit den Dateien („/var/www“) war vollgelaufen, da ein Kunde das Quota deutlich überschritten hatte.
Unser Monitoringsystem ist zwar konfiguriert, den freien Festplattenspeicher zu überwachen und im Bedarfsfall auch Mitarbeiter zu benachrichtigen. Da jedoch dies eine andere Partition als die überwachte war, kam es zu keiner Auslösung eines Alarms, das Problem blieb unbemerkt.
Wir haben nun das Monitoring-System erweitert, dass alle relevanten Partitionen ebenfalls überwacht werden.
Die Unannehmlichkeiten bitten wir zu entschuldigen und verbleiben
Mit freundlichen Grüßen,
ADIT Systems