MLC@Home wird vorerst abgeschaltet, vielen Dank!
MLC@Home wird abgeschaltet
Nach mehr als zwei Jahren, einigen holprigen Momenten und der gewaltigen Unterstützung durch unsere Freiwilligen, treffe ich als MLC-Admin die Entscheidung, MLC@Home als BOINC-Projekt vorerst abzuschalten.
Warum?
Wir haben mit vier vollständigen Datensätzen, die eine Datenmenge von Dutzenden Terabytes zum Auswerten umfassen, die von mir gesetzten Ziele (und mehr!) erreicht. Wir müssen uns jetzt auf das Auswerten der Ergebnisse und das Schreiben von Artikeln konzentrieren. Als Forscher muss man an einem gewissen Punkt aufhören, neue Daten zu erzeugen, und schreiben; zudem haben meine Familie, Arbeit und schulische Verpflichtungen die Zeit eingeschränkt, die mir zum Erzeugen neuer Experimente zur Verfügung steht. Das sollte offensichtlich sein, da ich in den letzten sechs Monaten weniger und weniger für die Gemeinschaft erreichbar war, wofür ich um Entschuldigung bitte. Während man stets jedes Unterfangen weitertreiben könnte, denke ich, dass wir für den Moment viel erreicht haben, und möchte das Projekt für unbestimmte Zeit auf Eis legen, bis sich etwas Neues ergibt.
Zu diesem Zeitpunkt sollten wir alles feiern, das unsere Freiwilligen gemeinsam erreicht haben! Die Gemeinschaft in den Foren und auf Discord war großartig. Wir schalten das Projekt nicht wegen irgendeines Problems ab, sondern weil wir die Ziele erreicht haben, die wir erreichen wollten. Ich bin dafür äußerst dankbar.
Der einzige bittersüße Punkt beim Abschalten des Projekts ist, dass ich MLC@Home gern über MLDS hinaus zu einer Plattform für demokratisierte Forschung zu maschinellem Lernen entwickelt hätte. Ich habe damit keine anderen Forscherinnen erreicht, sodass MLDS das einzige Projekt auf MLC@Home blieb. Daran trägt zum Teil COVID Schuld, aber auch einige andere Faktoren von der Weise, wie Forschung in einem angesagten Feld wie ML finanziert wird, bis zu meinen eigenen zeitlichen Einschränkungen. Falls andere Forscher Interesse bekunden, können wir das Projekt in der Zukunft wiederbeleben, aber im Moment kann ich es nicht rechtfertigen, das Projekt ohne klarem Weg zu bedeutsamer neuer Arbeit weiterzuführen. Das wäre gegenüber unseren Freiwilligen nicht fair.
Was passiert jetzt?
Wie versprochen werden die Datensätze weiterhin verfügbar sein (die Veröffentlichung von Datensatz [DS] 4 wird noch etwas Nachdenken und Zeit erfordern, siehe unten), und die MLC@Home-Hauptseite (https://www.mlcathome.org) sowie der Twitter-Feed werden aktiv bleiben, sodass ich Neuigkeiten zu etwaigen Fachartikeln und zum Zugriff auf DS4 teilen kann, sobald dieser verfügbar ist. Für den Moment gibt es keine Änderungen an den BOINC-Server-Anteilen der Webseite. Ich muss nachlesen, wie ich die Foren, die Projektseiten und die Statistiken ordentlich archvieren kann, sodass sie (nur mit Lesezugriff) verfügbar bleiben können, ohne ein Magnet für Spam und die (derzeit stündlichen...) Hackversuche (seufz...) zu werden. Ich werde über den nächsten Monat oder so auch die Discord-Gemeinschaft auflösen.
Ich persönlich werde meine Forschung fortsetzen und an der Veröffentlichung bedeutsamer Ergebnisse arbeiten. Ich werde auch weiterhin andere BOINC-Projekte (ich habe seit SETI@home Classic zu BOINC beigetragen) und die Idee des Volunteer Computing unterstützen. Irgendwann werde ich meine Erfahrung als Forscher beim Aufsetzen eines neuen Projekts und mit seinem Betrieb vom Start bis zum Ende aufschreiben; ich hoffe, dass das eine Hilfe für andere Projekte in den Startlöchern sein kann. Es war insgesamt eine positive Erfahrung, aber es gibt bestimmte Bereiche mit Verbesserungsbedarf.
Euch ermutige ich, weiterhin andere großartige BOINC-Projekte mit eurer Rechenzeit zu unterstützen. Die offizielle Liste gibt es hier: https://boinc.berkeley.edu/projects.php.
DS1/2/3 können jetzt heruntergeladen werden, was ist mit DS4?
DS4 ist groß, allein der dichte Anteil umfasst über 12TB. Daher wird es noch mehr Zeit brauchen, ihn zu kopieren, abzupacken, auszuwerten und hochzuladen. Ich habe vor, das nach Fertigstellung meiner Auswertung und Doktorarbeit zu tun, was innerhalb der nächsten 6 Monate sein sollte. Falls eine Forscherin gern früher Zugriff auf den Datensatz hätte, bitte ich um direkte Kontaktaufnahme und wir können eine Lösung finden.
Die ursprüngliche Idee für DS4 war, neuronale Netzwerke für jeden Datentyp mit dichten, LeCun-artigen faltenden neoronalen Netzwerken (engl. Convolutional Neural Network, CNN) und mit AlexNet-CNNs zu berechnen. Es stellte sich heraus, dass LeCun-Netzwerke so klein und leicht zu berechnen sind, dass ich 50000 davon lokal auf meinem eigenen Rechner innerhalb von ein, zwei Tagen berechnen kann, sodass ich darauf verzichtet habe, diese als BOINC-WUs zu versenden (auch weil die aktuelle Anwendung auf einigen Plattformen bei der Berechnung von LeNet5 abstürzt und es schneller ging, sie lokal zu berechnen, als das Problem zu beheben). Da fraglich ist, welchen wissenschaftlichen Mehrwert AlexNet-CNNs gegenüber LeCun-Netzwerken haben, werde ich diese wahrscheinlich aus dem Datensatz entfernen.
Danke
Auch wenn nichts mehr passiert, war MLC@Home ein großer Erfolg. Wir haben wissenschaftlich interessante und einzigartige Datensätze erzeugt, ein komplett neues Wissenschaftsfeld (Maschinelles Lernen) in die BOINC-Gemeinschaft eingeführt und demonstriert, dass Forschung zu maschinellem Lernen von einer Gruppe Freiwilliger über das Internet durchgeführt werden kann.
Es gibt einige Gruppen und Einzelpersonen, denen ich ausdrücklich dafür danken möchte, dass sie dieses Projekt zu solch einem Erfolg machten. Diese sind, unter anderen: Die BOINC-Entwickler, insbesondere Vitalii Koshura und die anderen Entwickler auf dem BOINC-Discord-Server, für ihre Hilfe bei der Entwicklung des Projekts von Anbeginn an; Marcus (Delta auf dem BOINC-Discord-Server, der auch gemeinsamt mit JRingo den BOINC-Radio-Podcast betreibt, der MLC@Home von Anbeginn an beworben und unterstütz hat) für seinen direkten Beitrag zur Hintergrund-Verarbeitungssoftware des MLC@Home-Servers; Mike von PrimeGrid für wichtige frühe Ratschläge zum Betreiben eines neuen Projekts. Ich bin mir sicher, dass ich viele andere vergesse, aber seid gewiss, dass wir als Gemeinschaft vielen für den Erfolg des Projekts zu danken haben.
Ich möchte auch den frühzeitig beim Projekt eingestiegenen Freiwilligen besonders danken, die dazu beigetragen haben, das Forum zu einem hilfreichen und einladenden Ort zu machen.
Danke auch an das CoRaL-Institut und meinen Betreuer an der Universität Maryland, Baltimore County, für die Unterstützung der Forschung und die Finanzierung des neuen Servers, nachdem wir schnell die Kapazitäten des ursprünglichen ThinkPad-Laptops von 2015 überschritten hatten.
Schließlich danke ich unseren mehr als 4200 Freiwilligen, die mit mehr als 17000 Rechnern über 12,5 Millionen WUs gecruncht haben. Ich bin wirklich überwältigt von euren Beiträgen und dem, was wir gemeinsam erreicht haben. Nichts davon wäre ohne euch möglich gewesen. Danke, dass ihr einem kleinen, unbekannten Forscher eine Chance gegeben habt, und ich ermutige euch, auch in Zukunft kleinere Projekte zu unterstützen, da deren Erfolg darüber mitbestimmt, ob BOINC weiterhin wächst und gedeiht.
Ich verabschiede mich mit einem letzten, befriedigenden Schnappschuss der Webseite:

Nochmals danke an alle,
pianoman
-- Hauptforscher und Administrator von MLC@Home:
https://www.mlcathome.org/
E-Mail: mlcathome2020@gmail.com
Twitter: @MLCHome2
02.10.2022, 18:22:59 MEZ
Originaltext:
