Ergebnis 1 bis 17 von 17
  1. Avatar von taurec
    Titel
    ist hier zu Hause

    Bewertung

    Registriert am
    30.06.2008

    Ort
    Allerorten

    Beiträge
    3.832

    Danke
    Danke gesagt 210   Danke erhalten 55

    #1

    Beitrag QuChemPedIA@home

    Wie von Roadranner schon im "Neue Projekte"-Thread angekündigt:
    QuChemPedIA@home
    Läuft derzeit bei mir auf dem i7-4790-k auf 4 Threads, Laufzeiten kann ich noch keine klare Linie erkennen, Checkpoints auch nicht.
    Gibt die Möglichkeit, MAX CPUs und MAX WUs zu begrenzen oder einzustellen, aber das funktioniert anscheinend noch nicht so toll. Gerade neuen Rechner hinzugefügt mit anderem Profil, rechnet trotzdem 1 WU nur mir 1 Thread.
    Mal beobachten. Bin da auch noch am Testen.
    Laufzeiten bisher zwischen 6800 und 40000s, Credits werden entsprechend den Laufzeiten vergeben, so wie es bei mir da so aussieht: ca. 38 Credits pro Stunde auf dem o.g. PC.

    Wir liegen derzeit auf Rang 18, Tendenz steigend
    Ciao taurec

  2. Die folgenden Benutzer haben sich bei taurec bedankt für diesen nützlichen Beitrag:

    Uwe-Bergstedt (08.11.2019)

  3. Avatar von pschoefer
    Titel
    Administrator

    Bewertung

    Registriert am
    07.07.2007

    Ort
    Osterode / Göttingen

    Beiträge
    15.164

    Danke
    Danke gesagt 148   Danke erhalten 1.639

    #2

    Standard Veröffentlichung zum Hintergrund des Projektes

    Ein Fachartikel wurde im Journal of Cheminformatics veröffentlicht und motiviert die aktuell von QuChemPedIA@home durchgeführten Berechnungen:

    Wissenschaftliche Veröffentlichung
    Hallo zusammen!

    Unser Artikel mit dem Titel "Dataset’s chemical diversity limits the generalizability of machine learning predictions" (übersetzt etwa: Die chemische Vielfalt eines Datensatzes limitiert die Verallgemeinerbarkeit der Vorhersagen maschinellen Lernens) wurde angenommen und veröffentlicht! Er ist frei zugänglich:
    https://jcheminf.biomedcentral.com/a...K395ODe941Y3_0

    Falls ihr Fragen dazu habt, kontaktiert uns gern über das Projektforum (unter dieser Nachricht).

    Grüße!
    Benoit

    Hier ist eine Nachricht von Thomas Cauchy über unsere Forschung:
    Hallo,

    ich bin der Chemiker hinter diesem Projekt. Die von Benoit Da Mota genannte Veröffentlichung wurde verfasst, als wir das BOINC-Projekt gestartet haben. Aber ich kann einige Sätze aus dem Artikel herausziehen, um zu zeigen, was wir uns dabei denken:

    "Zusammenfassung: Der Datensatz QM9 ist zum Goldstandard für Vorhersagen verschiedener chemischer Eigenschaften durch maschinelles Lernen (ML) geworden. QM9 basiert auf GDB, was eine kombinatorische Untersuchung des chemischen Parameterraums ist. Kürzlich wurden ML-Vorhersagen für Moleküle mit einer Genauigkeit veröffentlicht, die mit Berechnungen auf Basis der Dichtefunktionaltheorie vergleichbar ist. Solche ML-Modelle müssen anhand echter Daten getestet und verallgemeinert werden. In diesem Artikel wird PC9 vorgestellt, ein neuer, zu QM9 äquivalenter Datensatz (nur mit H, C, N, O und F und bis zu 9 "schweren" Atomen) des PubChemQC-Projektes. Eine statistische Untersuchung von Bindungslängen und chemischen Funktionen zeigt, dass dieser neue Datensatz eine größere chemische Vielfalt umfasst. Die Methoden Kernel Ridge Regression, Elastic Net und das neurale Netzwerk von SchNet wurden auf beide Datensätze angewandt. Die Genauigkeit der Energievorhersage ist insgesamt höher für den QM9-Datensatz. Ein mittels PC9 trainiertes Modell zeigt jedoch eine bessere Fähigkeit, die Energien des anderen Datensatzes vorherzusagen."

    Der Datensatz QM9 enthält etwa 130000 kleine Moleküle, wohingegen unser Datensatz PC9 119000 enthält (aber aus einer anderen Art von Berechnungen stammt). Das Problem ist, dass die vollständigen Ergebnisse von QM9 nicht frei verfügbar sind. Sie haben einige Ergebnisse der teuren quantenmechanischen Berechnungen extrahiert und das Protokoll weggeworfen. Wir sind nicht mit PC9 zufrieden, da sich einfach zeigen ließ, dass eine größere chemische Vielfalt benötigt wird.

    Derzeit zielt das BOINC-Projekt darauf, die interessanten Moleküle aus QM9 und PC9 dieses Mal mit gleichartigen Berechnungen neu zu berechnen. Alle Ergebnisse werden in der QuChemPedIA unter https://quchempedia.univ-angers.fr verfügbar sein, wenn diese Plattform etwas robuster ist (Anfang 2020), auf Augenhöhe mit unserem Programm zur Qualitätskontrolle.
    Wir sind noch nicht völlig zufrieden mit NWChem. Mit dem gleichen BOINC-Projekt verwenden Benoit Da Mota und ich das proprietäre Gaussian, welches effizienter ist. Aber NWChem ist quelloffen...
    Wir haben dank eurer Hilfe etwa 130000 von 200000 berechnet!
    Wir hoffen, der Gemeinschaft im Dezember vorschlagen zu können, neue Moleküle zu berechnen, die vielleicht gar nicht existieren und nicht stabil sind, um dem maschinellen Lernen zu helfen, besser zu verallgemeinern. Diese neuen Moleküle werden auch durch maschinelles Lernen erzeugt. Es würde zu lange dauern, das jetzt hier zu erklären.

    Falls ihr Fragen habt...
    Mit freundlichem Gruß,
    Thomas
    13.11.2019, 20:33:58 MEZ

    Originaltext:
    Zitat Zitat von https://quchempedia.univ-angers.fr/athome/forum_thread.php?id=36
    Scientific publication
    Hello everybody!

    Our article titled "Dataset’s chemical diversity limits the generalizability of machine learning predictions" was accepted and published ! It is an Open Access article :
    https://jcheminf.biomedcentral.com/a...K395ODe941Y3_0

    If you have any question, feel free to contact us on the forum of the project (under this message).

    Cheers !
    Benoit

    Here is a message from Thomas Cauchy about our reseach :
    Hello,

    I am the chemist of this project. The publication mentioned by Benoit Da Mota was written when we launch the boinc project. But I can extract some sentences of this article to show what we have in mind :

    "Abstract: The QM9 dataset has become the golden standard for Machine Learning (ML) predictions of various chemical properties. QM9 is based on the GDB, which is a combinatorial exploration of the chemical space. ML molecular predictions have been recently published with an accuracy on par with Density Functional Theory calculations. Such ML models need to be tested and generalized on real data. PC9, a new QM9 equivalent dataset (only H, C, N, O and F and up to 9 "heavy" atoms) of the PubChemQC project is presented in thisarticle. A statistical study of bonding distances and chemical functions shows that this new dataset encompasses more chemical diversity. Kernel Ridge Regression, Elastic Net and the Neural Network model provided by SchNet have been used on both datasets. The overall accuracy in energy prediction is higher for the QM9 subset. However, a model trained on PC9 shows a stronger ability to predict energies of the other dataset."

    The QM9 dataset has around 130k small molecules, when our PC9 has 119k (but was extracted from another type of calculations). The problem is that the full results of the QM9 are not openly available. They have extracted some results of the costly quantum mechanics calculations and trashed the log. We are not satisfied by PC9 that was a simple demonstration that more diversity is needed.

    For the moment the boinc project is aiming at recalculating the interesting molecules of QM9 and PC9 with the same level of calculation this time. All the results will be available at the quchempedia document base https://quchempedia.univ-angers.fr when this platform will be a little bit more robust (beginning 2020) in par with our quality control tool as written by my colleague.
    We are not fully happy with NWChem yet. With the same boinc project Benoit Da Mota and myself, are using Gaussian (proprietary) which is much efficient. But Nwchem is open source...
    We have calculated roughly 130 k over 200 k thanks to your help!
    For December we hope to propose to the community to calculate new molecules that maybe don't even exist and are not stable in order to help machine learning tool to generalize better. Those new molecules will be generated by a machine learning procedure. Too long to explain here right now.

    If you have any question...
    Kindly
    Thomas
    13 Nov 2019, 19:33:58 UTC
    Gruß
    Patrick

    "Zusammenkommen ist ein Beginn, Zusammenbleiben ein Fortschritt, Zusammenarbeiten ein Erfolg." [H. Ford]

  4. Avatar von XSmeagolX
    Titel
    Administrator

    Bewertung

    Registriert am
    10.11.2009

    Ort
    Hessen

    Beiträge
    6.543

    Danke
    Danke gesagt 141   Danke erhalten 980

    #3

    Standard

    Ich habe das Projekt soeben in den SG-Stats integriert.

    https://stats.seti-germany.de/teamst...id=QuChemPedIA
    Nicht alles was der Kopf denkt, muss der Mensch auch umsetzen.
    Man muss auch mal Nein zu sich selbst sagen, zur Not übe es
    ...
    ------
    Meine Homepage :: Meine Gedichte :: Meine Stats :: Meine laufenden WU's :: Statistiken rund um unser Team SETI.Germany

  5. Avatar von lugu
    Titel
    BOINC Maniac

    Bewertung

    Registriert am
    23.02.2016

    Beiträge
    828

    Danke
    Danke gesagt 25   Danke erhalten 0

    #4

    Standard

    Bei dem Papertitel dachte ich zuerst auch nur: Ach was, sag bloß!

    Aber, dass durch Methoden des maschinellen Lernens mittlerweile Ergebnisse herauskommen, die auf DFT-Niveau liegen, ist schon stark. Vielleicht überwinde ich mich doch mal und richte auf einem Rechner eine Virtuelle Box ein.
    Hauptrechner: i7-6700K @ 4.00 GHz | GeForce GTX 1060 6 GB | 16 GB DDR4 | Windows 10 | BOINC 7.14.2
    Nebenrechner: i3-7300 @ 4.00 GHz | GeForce GTX 1050 Ti | 8 GB DDR4 | Windows 10 | BOINC 7.8.3
    Nebenrechner: i3-6100 @ 3.70 GHz | Intel HD Graphics 530 | 8 GB DDR4 | Windows 10 | BOINC 7.6.33
    Statistiken | Badges

  6. Avatar von taurec
    Titel
    ist hier zu Hause

    Bewertung

    Registriert am
    30.06.2008

    Ort
    Allerorten

    Beiträge
    3.832

    Danke
    Danke gesagt 210   Danke erhalten 55

    #5

    Standard

    Inzwischen liegen wir auf #5, demnächst #4.
    Zu #3 bräuchte es dann schon einen etwas längeren Atem oder mehr Beteiligung vom Team

    Die 100k habe ich inzwischen durch, HJL folgt bald....
    Ciao taurec

  7. Avatar von JayPi
    Titel
    Gold Member

    Bewertung

    Registriert am
    08.07.2007

    Ort
    Kölle am Rhing

    Beiträge
    2.244

    Danke
    Danke gesagt 13   Danke erhalten 0

    #6

    Standard

    Angefangen habe ich auch schon, jetzt muss ich aber erst bei 2 anderen Projekten die Stände glatt ziehen, dann werde ich hier auch eine Million bereitstellen.

  8. Avatar von [SG] steini
    Titel
    SG aktiv

    Bewertung

    Registriert am
    15.12.2011

    Ort
    Berlin

    Beiträge
    548

    Danke
    Danke gesagt 57   Danke erhalten 9

    #7

    Standard

    BoincStats sagt: Account creation disabled

  9. Avatar von taurec
    Titel
    ist hier zu Hause

    Bewertung

    Registriert am
    30.06.2008

    Ort
    Allerorten

    Beiträge
    3.832

    Danke
    Danke gesagt 210   Danke erhalten 55

    #8

    Standard

    Invitation code : 3VwMu3-eTCg32

    https://quchempedia.univ-angers.fr/athome/about.php
    geht's damit?
    Ciao taurec

  10. Avatar von Urs
    Titel
    BOINC Maniac

    Bewertung

    Registriert am
    05.02.2017

    Ort
    NRW

    Beiträge
    931

    Danke
    Danke gesagt 13   Danke erhalten 22

    #9

    Standard

    Projekt grade nicht erreichbar.

    Korrektur. Anmeldung direkt auf der Projektseite geht, in den BM laden nicht.

    K2. Nu hab ichs. Die Laufzeiten scheinen ja durchauz zu schwanken?! Hab mal bei JayPi gespickt.
    Geändert von Urs (24.11.2019 um 23:27 Uhr)

  11. Avatar von Urs
    Titel
    BOINC Maniac

    Bewertung

    Registriert am
    05.02.2017

    Ort
    NRW

    Beiträge
    931

    Danke
    Danke gesagt 13   Danke erhalten 22

    #10

    Standard

    Welche Laufzeiten sind denn normal?
    Ich habe da 2 Aufgaben die laufen bereits über 2 Tage und sind bei 55%.
    Insgesamt hab ich 3 Aufgaben und nu noch ne Frage da ich keine Erffahrung mit VB habe. Im BM hat jede Aufgabe einen thread aber wenn ich die VB aufrufe steht da das nur 1 Kern freigegeben ist. Ist das so normal oder muss ich da was umstellen?
    Die anderen Projekte die gleichzeitig ohne VB laufen scheinen normale Laufzeiten zu haben.

  12. Avatar von taurec
    Titel
    ist hier zu Hause

    Bewertung

    Registriert am
    30.06.2008

    Ort
    Allerorten

    Beiträge
    3.832

    Danke
    Danke gesagt 210   Danke erhalten 55

    #11

    Standard

    Hallo Urs, meine Rechner sind jetzt sichtbar, kannst ein wenig stöbern.
    Laufzeiten total unterschiedlich, gibt WUs (t1) belegen einen Thread und (t2) belegen zwei Threads.
    So ganz komme ich noch nicht hinter das System in den Einstellungen.
    Ciao taurec

  13. Avatar von Urs
    Titel
    BOINC Maniac

    Bewertung

    Registriert am
    05.02.2017

    Ort
    NRW

    Beiträge
    931

    Danke
    Danke gesagt 13   Danke erhalten 22

    #12

    Standard

    Danke taurec! Du hast ausschliesslicch Linux laufen. Mal sehen was die VB bei mir bringt. Lass die einfach mal fertig laufen.
    Wenn die wus 5 Tage laufen und dann 100 creds bringen macht das keinen Sinn. Mal sehen.

  14. Avatar von JayPi
    Titel
    Gold Member

    Bewertung

    Registriert am
    08.07.2007

    Ort
    Kölle am Rhing

    Beiträge
    2.244

    Danke
    Danke gesagt 13   Danke erhalten 0

    #13

    Standard

    Kaum steige ich hier ein ... ist das Projekt leer

  15. Avatar von taurec
    Titel
    ist hier zu Hause

    Bewertung

    Registriert am
    30.06.2008

    Ort
    Allerorten

    Beiträge
    3.832

    Danke
    Danke gesagt 210   Danke erhalten 55

    #14

    Standard

    Es gibt wieder Arbeit

  16. Avatar von JayPi
    Titel
    Gold Member

    Bewertung

    Registriert am
    08.07.2007

    Ort
    Kölle am Rhing

    Beiträge
    2.244

    Danke
    Danke gesagt 13   Danke erhalten 0

    #15

    Standard

    Mir ist aufgefallen, dass unter Windows VirtualBox ingesetzt wird. Die RAM-Auslastung ist da mit 2GB je VM doch gewaltig und bringt meine Rechner an die (RAM-)Grenzen.
    Unter Linux sieht die Welt ganz anders aus: Hier laufen die WUs native - ohne VM. Daher kann ich jetzt unter Linux 16 WUs ohne Probleme parallel laufen lassen.

  17. Avatar von taurec
    Titel
    ist hier zu Hause

    Bewertung

    Registriert am
    30.06.2008

    Ort
    Allerorten

    Beiträge
    3.832

    Danke
    Danke gesagt 210   Danke erhalten 55

    #16

    Standard

    Ich habe hier mit Linux pro WU ca. 1,2 bis 1,6 GB benötigten RAM laut WU-Eigenschaften.

    Edit: WU 0d9..........................
    Geändert von taurec (Gestern um 21:44 Uhr)

  18. Avatar von JayPi
    Titel
    Gold Member

    Bewertung

    Registriert am
    08.07.2007

    Ort
    Kölle am Rhing

    Beiträge
    2.244

    Danke
    Danke gesagt 13   Danke erhalten 0

    #17

    Standard

    Zitat Zitat von taurec Beitrag anzeigen
    Ich habe hier mit Linux pro WU ca. 1,2 bis 1,6 GB benötigten RAM laut WU-Eigenschaften.

    Edit: WU 0d9..........................
    Auf 2 Linux-Rechner habe ich mal nachgeschaut: Mit jeweils 16 Treads werden incl. Betriebssystem keine 3 GB RAM belegt.

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •  
Single Sign On provided by vBSSO