• MilkyWay@home: Maßnahmen gegen Rechner mit hoher Fehlerquote

    Einige kürzlich vorgenommene Änderungen, um fehlerhafte Rechner auszusortieren, hatten auch Auswirkungen auf funktionstüchtige Rechner und wurden daher rückgängig gemacht:

    Änderung zur Sperrung unzuverlässiger Rechner wird rückgängig gemacht
    Hallo zusammen,

    ich werde den Wechsel auf die BOINC-eigene Option zur Benutzung zuverlässiger Rechner rückgängig machen. Sie scheint ungewollte Auswirkungen auf die Benutzbarkeit des Projektes für einige Benutzer zu haben.

    Zukünftig werden Sidd und ich die schlimmsten Verursacher fehlerhafter WUs manuell sperren.

    Ich bitte alle betroffenen zu entschuldigen, dass ihr zuletzt nicht für uns crunchen konntet.

    Jake
    05.03.2018, 21:15:32 MEZ


    Die ersten Rechner wurden von Hand gesperrt, was für den Besitzer auch in der Rechnerübersicht beim Projekt ersichtlich ist:

    Sperrung von Rechnern mit hoher Fehlerzahl
    Hallo zusammen,

    ich werde acht Rechner mit extrem hoher Fehlerzahl (über 1000 in ihrem aktuellen Verlauf) sperren. Wenn ihr einen dieser Rechner besitzt und unglücklich mit der Sperre seid, benachrichtigt mich bitte und wir können über eine Aufhebung der Sperre reden.

    Das ist eine vorübergehende Lösung, bis ich ein besser automatisiertes Sperrsystem aufgebaut habe, das gelegentliche Tests von Rechnern ermöglicht, um zu prüfen, ob die Fehler behoben wurden.

    Über den besten Weg für einen automatisierten Algorithmus kann hier diskutiert werden und ich werde versuchen, dabei mitzukommen.

    Jake

    Nachtrag:

    Ich habe eine Funktion hinzugefügt, um auf einen Blick feststellen zu können, ob einer eurer Rechner gesperrt wurde. Ein gesperrter Rechner wird auf der Seite "Computer, die zu diesem Konto gehören" in rot hervorgehoben. Diese Rechner werden für niemanden sonst rot markiert und nur ihr selbst könnt sehen, ob ihr gesperrt wurdet.
    07.03.2018, 20:55:44 MEZ


    Zugleich wird auch daran gearbeitet, die Verteilung von WUs an ungeeignete Grafikkarten als eine der häufigsten Fehlerquellen zu unterbinden:

    Tests einiger neuer Planklassen
    Hallo zusammen,

    ich werde versuchen, die GPU-Planklassen zu verändern, um die an Benutzer ohne GPUs mit doppelter Genauigkeit geschickten WUs zu vermindern. Wenn ihr auf eurer Seite irgendwelche Probleme bemerkt, lasst es mich bitte wissen.

    Danke,

    Jake
    08.03.2018, 19:06:30 MEZ


    Originaltexte:
    Zitat Zitat von https://milkyway.cs.rpi.edu/milkyway/
    Reverting Change to Remove Unreliable Hosts
    Hey Everyone,

    I am going to be reverting the change to use the built in BOINC use reliable hosts option. It seems to be having unintended consequences to the usability of the project for some users.

    In the future, Sidd and I will look into manually removing the worst offenders who are sending back erroring workunits.

    For anyone effected, I apologize if you haven't been able to crunch for us recently.

    Jake
    5 Mar 2018, 20:15:32 UTC
    Zitat Zitat von https://milkyway.cs.rpi.edu/milkyway/
    Removing Hosts With High Error Counts
    Hey Everyone,

    I am going to be issuing suspensions to 8 hosts with extremely high error counts (over 1000 in their recent history). If you own one of these hosts and are unhappy with the suspension, please message me and we can discuss removing the suspension.

    This is a temporary solution until I can implement a more automated suspension system with occasional retesting of hosts to see if they have been fixed.

    Any discussion about how to best implement an automated algorithm can go here and I will attempt to keep up.

    Jake

    Edit:

    I added a feature to determine if one of your hosts is suspended at a quick glance. Any of your suspended hosts will show up highlighted in red on the "computers on this account" page in your account information page. These hosts will not show up as red to anyone else and only you will know if you are suspended.
    7 Mar 2018, 19:55:44 UTC
    Zitat Zitat von https://milkyway.cs.rpi.edu/milkyway/
    Testing Some New Plan Classes
    Hey Everyone,

    I am going to try changing the GPU plan classes to reduce workunits sent to users without double precision gpus. If you notice any issues on your end, please let me know.

    Thanks,

    Jake
    8 Mar 2018, 18:06:30 UTC
    Ursprünglich wurde dieser Artikel in diesem Thema veröffentlicht: MilkyWay@Home - Erstellt von: Доктор Шмурге Original-Beitrag anzeigen
Single Sign On provided by vBSSO