• 14.10.2021

    von Veröffentlicht: 15.10.2021 00:15
    1. Kategorien:
    2. Projekte

    Zurzeit werden einige fehlerhafte WUs verteilt, die jeweils nach wenigen Sekunden abstürzen. An der Lösung wird gearbeitet.

    Aktuelle WU-Probleme, Lösung in Arbeit
    Dies ist eine kurze Nachricht, dass wir über die Probleme mit WUs aus den Arbeitsvorräten für CPU und TEST Bescheid wissen (der GPU-Vorrat sieht momentan gut aus). Es liegt an einem serverseitigen Problem in Verbindung mit einigen Aufräumarbeiten und Aktualisierungen, die ich im Hintergrund durchgeführt habe und die scheinbar völlig danebengegangen sind. Da zunächst alles zu funktionieren schien, habe ich das nicht sofort gemerkt, was die Probleme verschlimmert hat.

    Das ist nicht akzeptabel und ich bitte um Entschuldigung. Zwar wurde dies getestet, aber die Fehlermöglichkeit war unerwartet. Ihr vertraut darauf, dass wir die Dinge sauber am Laufen halten, und ich habe euch enttäuscht.

    In den nächsten 24 Stunden werden wir die kaputten WUs serverseitig abbrechen und möglicherweise die Dienste einige Male stoppen und wieder starten, während wir versuchen, aufzuräumen. Bitte habt Verständnis und danke für eure Geduld.

    Ich betone: Es gab keinen Datenverlust und der Fehler tritt auf den Clients schnell auf, sodass wenige bis keine Ressourcen verschwendet werden.

    Danke nochmals und wir werden es in Zukunft besser machen.
    14.10.2021, 21:18:19 MEZ

    Originaltext:
    Zitat Zitat von https://www.mlcathome.org/mlcathome/forum_thread.php?id=240
    Current WU issues, working on a fix
    A short note that we're aware of the issue with WUs coming from the CPU and TEST work queues (the GPU queue appears fine at the moment). This is due to a server-side issue related to some cleanup and upgrades I've been doing behind the scenes that appears to have gone haywire, and since it initially seemed to be working I didn't catch it immediately, leading to compounding the issues.

    This is unacceptable and I apologize. While this had been tested, this failure mode was unforeseen. You rely on us to keep things running smoothly, and I failed you.

    Over the next 24 hours we'll be sending out cancellations for the corrupted WUs, and may stop/start the service a few times while we try to clean things up. Please bear with us and thanks for your patience.

    I stress : no data was lost, and the nature of the failure is to fail-fast on the client, so there is little to no wasted computer cycles.

    Thanks again, and we'll do better in the future.
    14 Oct 2021, 20:18:19 UTC
    von Veröffentlicht: 14.10.2021 15:00
    1. Kategorien:
    2. Projekte

    Wegen technischer Probleme, auf die das Projekt keinen direkten Einfluss hat, können vorübergehend keine neuen WUs erzeugt werden:

    Speicherproblem
    Das Speichersystem der Universität (das wir intensiv nutzen) hat große Leistungsprobleme, so dass alles sehr langsam ist. Ich habe den WU-Generator gestoppt, der aus diesem Grund nicht funktionierte. Es werden keine neuen Aufgaben generiert, bis der Assimilator in der Lage ist, die fertigen Ergebnisse an den richtigen Ort zu verschieben. Es bleibt nichts anderes übrig, als zu warten, bis das Problem gelöst ist, leider ohne Zeitangabe.
    14.10.2021, 12:35:54 MEZ

    Originaltext:
    Zitat Zitat von https://gene.disi.unitn.it/test/forum_thread.php?id=318
    Storage problem
    The University's storage system (that we heavily use) is heaving big performance issues thus everything is painfully slow. I stopped the work generator, which actually was not working because of this. No new tasks will be generated until the assimilator will be able to move the finished results to the proper place. There is nothing else to do but wait until the problem will be solved, no ETA, unfortunately.
    14 Oct 2021, 11:35:54 UTC
    von Veröffentlicht: 14.10.2021 14:50
    1. Kategorien:
    2. Projekte

    Geplante Wartung am Freitag, 15. Oktober
    Wir werden am Freitag, den 15. Oktober, ab 15:00 MESZ eine wichtige Aktualisierung des Betriebssystems auf unseren Servern installieren. Wir gehen davon aus, dass die Arbeiten etwa zwei Stunden dauern werden.

    Während dieser Zeit können Freiwillige teilweise keine neuen Arbeiten hoch- oder herunterladen, und die Webseite wird nicht zugänglich sein.

    Freiwillige müssen keine besonderen Maßnahmen ergreifen, da ihre Geräte nach Abschluss der Wartungsarbeiten automatisch wieder eine Verbindung herstellen.

    Wir danken euch für eure Geduld und eure Teilnahme.
    13.10.2021

    Originaltext:
    Zitat Zitat von https://www.worldcommunitygrid.org/about_us/article.s?articleId=741
    Planned Maintenance on Friday, October 15
    We will be applying an important operating system update to our servers on Friday, October 15, beginning at 13:00 UTC. We anticipate that the work will take approximately two hours.

    During some of this time, volunteers will not be able to upload or download new work, and the website will not be accessible.

    Volunteers will not need to take any particular action, as your devices will automatically retry their connections after the maintenance work is completed.

    We appreciate your patience and participation.
    13 Oct 2021
Single Sign On provided by vBSSO