• MLC@Home: einige fehlerhafte WUs im Umlauf

    Zurzeit werden einige fehlerhafte WUs verteilt, die jeweils nach wenigen Sekunden abstürzen. An der Lösung wird gearbeitet.

    Aktuelle WU-Probleme, Lösung in Arbeit
    Dies ist eine kurze Nachricht, dass wir über die Probleme mit WUs aus den Arbeitsvorräten für CPU und TEST Bescheid wissen (der GPU-Vorrat sieht momentan gut aus). Es liegt an einem serverseitigen Problem in Verbindung mit einigen Aufräumarbeiten und Aktualisierungen, die ich im Hintergrund durchgeführt habe und die scheinbar völlig danebengegangen sind. Da zunächst alles zu funktionieren schien, habe ich das nicht sofort gemerkt, was die Probleme verschlimmert hat.

    Das ist nicht akzeptabel und ich bitte um Entschuldigung. Zwar wurde dies getestet, aber die Fehlermöglichkeit war unerwartet. Ihr vertraut darauf, dass wir die Dinge sauber am Laufen halten, und ich habe euch enttäuscht.

    In den nächsten 24 Stunden werden wir die kaputten WUs serverseitig abbrechen und möglicherweise die Dienste einige Male stoppen und wieder starten, während wir versuchen, aufzuräumen. Bitte habt Verständnis und danke für eure Geduld.

    Ich betone: Es gab keinen Datenverlust und der Fehler tritt auf den Clients schnell auf, sodass wenige bis keine Ressourcen verschwendet werden.

    Danke nochmals und wir werden es in Zukunft besser machen.
    14.10.2021, 21:18:19 MEZ

    Originaltext:
    Zitat Zitat von https://www.mlcathome.org/mlcathome/forum_thread.php?id=240
    Current WU issues, working on a fix
    A short note that we're aware of the issue with WUs coming from the CPU and TEST work queues (the GPU queue appears fine at the moment). This is due to a server-side issue related to some cleanup and upgrades I've been doing behind the scenes that appears to have gone haywire, and since it initially seemed to be working I didn't catch it immediately, leading to compounding the issues.

    This is unacceptable and I apologize. While this had been tested, this failure mode was unforeseen. You rely on us to keep things running smoothly, and I failed you.

    Over the next 24 hours we'll be sending out cancellations for the corrupted WUs, and may stop/start the service a few times while we try to clean things up. Please bear with us and thanks for your patience.

    I stress : no data was lost, and the nature of the failure is to fail-fast on the client, so there is little to no wasted computer cycles.

    Thanks again, and we'll do better in the future.
    14 Oct 2021, 20:18:19 UTC
    Ursprünglich wurde dieser Artikel in diesem Thema veröffentlicht: MLC@Home - Erstellt von: pschoefer Original-Beitrag anzeigen
Single Sign On provided by vBSSO