• 16.01.2022

    von Veröffentlicht: 16.01.2022 09:10
    1. Kategorien:
    2. Projekte

    Vom späten Freitagabend bis Samstagnachmittag war das Projekt wegen Hardwareproblemen außer Betrieb. Nachdem es zunächst einige Downloadfehler gab, läuft es inzwischen wieder normal.

    Server-/Datenbankabsturz / Hardwareausfall
    Es sieht so aus, als ob defekter RAM/defekte Hardware den ganzen Server zum Absturz gebracht hat, die Auszeit dauerte 15 Stunden. Ich habe die VM auf meinen alten Server umgezogen, das war stabil, aber führt nun zu einigen Linux-Fehlern, und wenn einer davon behoben wird, taucht ein anderer auf. Das Windows-Log weist immer noch auf defekte Hardware hin, es wird Zeit brauchen, vielleicht das Betriebssystem neu zu installieren, den RAM zu testen, etc.

    Ihr werdet nun viele Downloadfehler sehen, weil die Eingabedateien bereits gelöscht wurden, wenn die WU schon fertig war. Der Server scheint etwa eine Stunde nach meinem letzten Backup gestern abgestürzt zu sein.

    Ich denke darüber nach, die BOINC-VM auf dem alten Server zu belassen, keine Aktualisierungen (außer für die Firewall), weniger Betriebssystem-Abstürze, aber langsamer.

    Entschuldigung für den Ausfall.
    15.01.2022, 13:49:03 MEZ

    Originaltext:
    Zitat Zitat von https://srbase.my-firewall.org/sr5/forum_thread.php?id=1676
    Server/DB crash / Hardwarefailure
    Looks like a broken RAM / hardware crashed the hole server, the downtime was 15h. I have moved the VM to my old server, this was stable but have now some errors in Linux, if you fix something another error appears. The win log still telling me broken hardware but need to take time to maybe reinstall OS, testing RAM etc.

    You will now getting a lot of download errors because the input files were deleted while the WU was already finished. Around 1h after my last backup yesterday the server seems to be crashed.

    Iam thinking about to let the BOINC VM on the old server, no updates (except firewall), less OS crash impacts but slower.

    Apologies for the outage.
    15 Jan 2022, 12:49:03 UTC
Single Sign On provided by vBSSO