• MilkyWay@home: Validierungsprobleme behoben

    In den letzten Tagen gab es Validierungsprobleme, hier ist eine ausführlichere Beschreibung, was dazu geführt hat:

    Neuigkeiten zu den Problemen dieser Woche
    Hallo zusammen,

    ich möchte euch allen schnelle und technischere Neuigkeiten dazu geben, was uns in der letzten Woche beschäftigt hat.

    Unser Projekt läuft nun seit mehr als 10 Jahren und wir über die Jahre buchstäblich Milliarden von WUs gecruncht. Als Ergebnis all eurer harten Arbeit und Hingabe haben wir tatsächlich genug Ergebnisse berechnet, dass uns der Platz ausgegangen ist, die IDs all dieser Ergebnisse als normale vorzeichenlose Ganzzahlwerte (der Standard-Datentyp, mit dem IDs in BOINC-Datenbanken gespeichert werden) zu speichern. Daher habe ich am Dienstagabend unsere Datenbank aktualisiert, um die IDs als einen viel größeren Datentyp zu speichern, um zu vermeiden, dass dieses Problem in der restlichen Projektlaufzeit nochmals auftritt. Ich musste daher auch schnell den BOINC-Code flicken, den wir auf dem Server ausführen, damit er mit diesem neu verfügbaren Datentyp in der Datenbank umgehen kann.

    Bei diesem Vorgang habe ich einen der Fremdschlüssel übersehen, der sich auf die Ergebnisse bezieht, speziell beim Validierungsprozess. Das hat zu einem Problem bei der Validierung von WUs in den letzten Tagen geführt. Ich hatte Probleme, dieses Problem festzustellen, da vor dem Leerlauf der WU-Warteschlange alles funktionierte, jedoch nach dem Leerlauf der WU-Warteschlange, als die neuen WUs mit großen IDs zurückgemeldet wurden, stillschweigend aufhörte, WUs zu validieren.

    Ich habe eine Lösung für das letzte Problem eingebaut und hoffe, dass ab jetzt an dieser Front Ruhe herrscht. Natürlich besteht immer die Möglichkeit, dass ich einen anderen Fehler in diesem Ablauf übersehen habe, oder ich könnte feststellen, dass ich die Validierung von in den letzten Tagen erhaltenen WUs erzwingen muss. Ich werde den Server auf jeden Fall in den nächsten Tagen genau beobachten, um sicherzustellen, dass alles funktioniert.

    Entschuldigt bitte all die Schwierigkeiten der letzten Tage und ich hoffe, dass ihr alle unsere wichtige Forschung weiterhin unterstützt.

    Jake
    21.10.2017, 19:11:25 MEZ

    Originaltext:
    Update on This Weeks Errors
    Hey Everyone,

    I just wanted to give you all a quick and more technical update on what we have been dealing with over the last week.

    Our project has been running for upwards of 10 years now and we have been crunching literally billions of workunits over those years. As a result of all of your hard work and dedication, we have actually calculated enough results that we have run out of room to store the IDs of all of these results in a normal unsigned integer value (the default data type used for storing IDs in BOINC databases). As a result, on Tuesday night, I updated our database to be able to store IDs in a much larger data type to prevent this issue from happening again during the remaining life of the project. As a result, I also had to quickly patch the BOINC code we run on the server to allow it to use this newly available data type in the database.

    During this process, I missed one of the foreign keys that refers to the results, specifically in the validation process. This led to an issue in validation of work units over the last couple days. I had trouble diagnosing this issue because before the workunit queue clear, everything was running fine however, after the workunit queue clear, when new work with large IDs was being returned, it silently failed to validate workunits.

    I have implemented a fix for this last issue and my hope is that things will be smooth sailing from here on with regards to this issue. Of course, there is always the possibility I missed another bug in this pipeline, or I might realize I need to force validation on workunits received over the last couple days. In any case, I will be watching the server pretty closely over the next couple days to make sure its running correctly.

    Sorry for all of the trouble over the last couple days and I hope you all continue to support the important research we are doing into the future.

    Jake
    21 Oct 2017, 18:11:25 UTC
    Ursprünglich wurde dieser Artikel in diesem Thema veröffentlicht: MilkyWay@Home - Erstellt von: Доктор Шмурге Original-Beitrag anzeigen
Single Sign On provided by vBSSO