Ergebnis 1 bis 13 von 13
  1. Avatar von bossmaniac
    Titel
    Senior Member

    Bewertung

    Registriert am
    16.06.2012

    Beiträge
    410

    Danke
    Danke gesagt 0   Danke erhalten 3

    #1

    Standard Falsche Prozessorgruppen zuodnung bei Threadripper 3990x [WIN 10] < 100% last

    Bei WCG MIP und OPC zeigt sich auf einem 3990x Threadripper eine seltsame falsche Auslastung. Scheinbar werden die Wu nicht immer dem richtigen Node unter WIndows 10 (pro) zugeordnet (siehe Bild). Wenn ich die Wu händisch umordnet auf den anderen Node (Prozessorgruppe), normalisiert sich die Auslastung.(Bis die Wu fertig sind)
    Hat jemand 'ne Idee was man da machen kann?

    Klicken Sie auf die Grafik für eine größere Ansicht 

Name:	3990x threadripper wcg load.jpg 
Hits:	28 
Größe:	53,9 KB 
ID:	7028
    Geändert von bossmaniac (04.09.2020 um 16:16 Uhr)
    To bodly crunch what no man has crunched before...
    http://stats.free-dc.org/cpidtagb.ph...heme=14&cols=3

  2. Avatar von XSmeagolX
    Titel
    Administrator

    Bewertung

    Registriert am
    10.11.2009

    Ort
    Hessen

    Beiträge
    6.616

    Danke
    Danke gesagt 141   Danke erhalten 988

    #2

    Standard

    Ich sehe bei dem von mir genutzten Threadripper ein ähnliches Problem. Da werden mir teilweise nur 50% oder weniger an CPU-Last in Boinctasks angezeigt.
    Aber ich habe dem keine sooo große Aufmerksamkeit geschenkt, da ich an der Kiste eh nicht viel machen kann. Steht nicht unter meiner Obhut und ich nehme jede CPU mit, die ich kriegen kann
    Nicht alles was der Kopf denkt, muss der Mensch auch umsetzen.
    Man muss auch mal Nein zu sich selbst sagen, zur Not übe es
    ...
    ------
    Meine Homepage :: Meine Gedichte :: Meine Stats :: Meine laufenden WU's :: Statistiken rund um unser Team SETI.Germany

  3. Avatar von bossmaniac
    Titel
    Senior Member

    Bewertung

    Registriert am
    16.06.2012

    Beiträge
    410

    Danke
    Danke gesagt 0   Danke erhalten 3

    #3

    Standard

    Einige Boinc Projekte die ich getestet habe haben das Problem nicht: Ibervictis hat das Problem nicht, Astroids auch nicht (nur das AVX die TDP aufraucht und er deswegen drosselt), Rosetta fast nicht.
    Folding@home läuft auch ohne Probleme, ich habe acht 16 CPU Slot dazu eingerichtet.
    Geändert von bossmaniac (27.08.2020 um 09:14 Uhr)
    To bodly crunch what no man has crunched before...
    http://stats.free-dc.org/cpidtagb.ph...heme=14&cols=3

  4. Avatar von walli
    Titel
    Full Member

    Bewertung

    Registriert am
    12.06.2016

    Ort
    Bochum

    Beiträge
    220

    Danke
    Danke gesagt 3   Danke erhalten 5

    #4

    Standard

    Moin bossmaniac,

    ich finde, Dein Screenshot sieht jetzt nicht so wirklich falsch aus. Wenn ich davon ausgehe, dass alle Threads, die dunkelblau sind, mit WUs versorgt werden, hast Du aktuell mehr als 100 Threads mit Arbeit belegt. Wenn Deine CPU 64 Kerne resp. 128 Threads hat, müssen ja irgendwann zwangsläufig auch beide Threads eines Kerns belegt sein. Für alle anderen Kerne sollte es meines Wissens nach performancetechnisch egal sein, ob nun Thread 0 oder Thread 1 eines Kerns ausgelastet ist, sofern auf dem Gegenstück hingegen keine Last ist. Auf diese Weise sollten schon mal die 2 "falschen" Zuordnungen bei Dir keine Rolle spielen. Vielleicht war ja, bevor ein Lastprozess auf Thread 1 gestartet wurde, noch Last auf Thread 0, die nun weg ist, so daß die Last auf Thread 1 geblieben ist... Und ob das nun sooo viel Unteschied macht, bspw. ein paar belegte Partnerthreads von den ersten beiden vollständig belegten CCX (also CCX0 und CCX1 von CCD0) auf die beiden CCX von CCD5 zu verteilen (analog bei den anderen), das wäre vermutlich auch eine Einzelfallentscheidung (also vermutlich wieder projektabhängig und was sonst halt noch auf dem Rechner läuft). Was ich mir dabei eventuell vorstellen könnte, wäre ggf. ein besserer Speicherdurchsatz, möglicherweise ausgeglichenere Temperaturen und dadurch vielleicht mehr Boost. Aber da die Fertigung der CPUs hier genauso wie deren Kühllösung ebenfalls eine Rolle spielen, bin ich wieder bei meiner Einzelfallentscheidungs-These... ;-)

    Und wenn jetzt auf einigen Partnerthreads ebenfalls Last ist (wie links unten die "37%"), irgendwo muss ja auch noch der Rest des Systems drauf laufen...

    Welches Tool nutzt Du denn zum "Umordnen" der Prozesse, Process Lasso? Falls ja, teste doch mal den "Instance Balancer"-Modus aus (https://bitsum.com/product-update/processlasso-v901/). Dieser ist ebenfalls in der freien Version verfügbar und erwähnt auch explizit Boinc... ;-) Vergiss dann aber nicht, diesem Feature ebenfalls Deinen Folding@Home-Client beizubringen.

    Ich denke, Du musst hier aber auch ein wenig mit den Einstellungen experimentieren, da die Last ja auch vom Boinc-Projekt abhängt. AVX-Arbeit bspw. möchte sicherlich keinen belegten Partnerthread.

    Es gab schon öfters Diskussionen über Core-/Thread-Affinity bei den Boinc-Entwicklern, vor allem im Hinblick auf NUMA, und ich meine, ich habe auch schon Code diesbezüglich im Client gesehen; ob der allerdings funktioniert oder überhaupt etwas macht, weiss ich gerade nicht. Das ist afaik ein Thema, was man lieber dem OS-Scheduler überlässt, und der wurde von Microsoft ja vor nicht allzu langer Zeit für die ersten Threadripper gefixt (Stichwort wieder: CCX/CCD). Da die WCG-WUs aber singlethreaded sind, sollte das jetzt in Deinem Fall kein Problem darstellen.

    Vielleicht gibt es auch neuere AMD-Treiber für Dein System, mit denen das Scheduling etwas anders/besser/wünschenswerter läuft?

    Falls ich hier etwas falsch verstanden habe oder übersehen habe, bitte nicht hauen. :-)

    Viele Grüße

    walli
    Geändert von walli (27.08.2020 um 16:24 Uhr) Grund: Typo

  5. Avatar von Handicap SG-FC
    Titel
    Freie Cruncher

    Bewertung

    Registriert am
    06.04.2012

    Ort
    Norden von Deutschland

    Beiträge
    3.025

    Danke
    Danke gesagt 20   Danke erhalten 32

    #5

    Standard

    Ich hatte hier schon mal was gepostet:https://www.seti-germany.de/forum/th...l=1#post329935

    Da wird ein wenig auf das Problem eingegangen.

  6. Avatar von walli
    Titel
    Full Member

    Bewertung

    Registriert am
    12.06.2016

    Ort
    Bochum

    Beiträge
    220

    Danke
    Danke gesagt 3   Danke erhalten 5

    #6

    Standard

    Moinsen.

    Ich hatte das bisher so verstanden, wie es hier steht:

    https://docs.microsoft.com/en-us/win...ocessor-groups
    Applications that do not call any functions that use processor affinity masks or processor numbers will operate correctly on all systems, regardless of the number of processors.
    Aber ich weiss auch nicht, wo Child-Prozesse aufhören und Threads anfangen bzw. in welchen Situationen sie gleich sind oder welche Besonderheiten bei CreateProcess*-Aufrufen mit einfließen oder was auch immer (alles vor dem Hintergrund der Microsoft-Nomenklatur und deren Implementierung), so dass Windows die Prozesse halt nicht im Round-Robin-Verfahren den PGs zuordnet.

    Ich sehe zwar, wie der Client die (Child-)Prozesse (und Threads) erstellt, aber da ich kein System mit mehr als 64 Prozessoren (Microsoft-Sprech) besitze, fehlt mir die Erfahrung. Und scheinbar war und ist mir bisher auch nicht richtig klar, in welchen Fällen eine Anwendung nun explizit über Processor-Group-Awareness verfügen muss und wann nicht.

    Neben der Microsoft-Doku finden sich hier noch weitere interessante Infos: https://bitsum.com/general/the-64-co...s-and-windows/.

    Das Einzige, was ich im Bezug auf Processor-Groups im Client-Code gefunden habe, war ein Commit von DA im Oktober letzten Jahres:
    https://github.com/BOINC/boinc/commi...c031f60821e4fa
    The goal is to get information on hosts with >64 processors,
    in preparation for possible intelligent allocation to processor groups.
    welcher dann im Februar gemergt wurde: https://github.com/BOINC/boinc/pull/3453.

    Genutzt wird das, ausser zu Informationszwecken, augenscheinlich aber bisher nicht.

    Ich bin gespannt, wie es weitergehen wird :-).

    Danke für Deinen Link im anderen Thread, der mich auch zu weiteren Nachforschungen motivierte...

    Viele Grüße

    walli

  7. Avatar von bossmaniac
    Titel
    Senior Member

    Bewertung

    Registriert am
    16.06.2012

    Beiträge
    410

    Danke
    Danke gesagt 0   Danke erhalten 3

    #7

    Standard

    @Handi Den Beitrag habe ich gesehen. Ich wollte nicht zu den Pinguinen flüchten wie Planet 3dNow.

    @Walli Deine erklärung habe ich noh nicht ganz verstanden. Ich dachte am anfang auch das diese unterschiedlihce Last was mit den Turboboost verhalten zu tun haben könnte.
    Ich werde mal noch ein paar Screenshoots machen tur Verdeutlichung. Den Lasso Link werde ich mal ausprobiern was damit möglich ist. Danke dafür.
    To bodly crunch what no man has crunched before...
    http://stats.free-dc.org/cpidtagb.ph...heme=14&cols=3

  8. Avatar von bossmaniac
    Titel
    Senior Member

    Bewertung

    Registriert am
    16.06.2012

    Beiträge
    410

    Danke
    Danke gesagt 0   Danke erhalten 3

    #8

    Standard

    Zitat Zitat von bossmaniac Beitrag anzeigen
    Folding@home läuft auch ohne Probleme, ich habe acht 16 CPU Slot dazu eingerichtet.
    Hm, muss ich zurücknehmen. Folding tut sich da auch schwer. Ist nur dank Multicore schneller händisch umsortiert.

    Mit sortieren ist gemeint das ich die laufenden Wuzen wier hier: Klicken Sie auf die Grafik für eine größere Ansicht 

Name:	tread sortieren.PNG 
Hits:	5 
Größe:	49,5 KB 
ID:	7052 nehme und neu zuordne: Klicken Sie auf die Grafik für eine größere Ansicht 

Name:	handarbeit.PNG 
Hits:	4 
Größe:	43,0 KB 
ID:	7053.

    Das Ergebis sieht dann so aus: Klicken Sie auf die Grafik für eine größere Ansicht 

Name:	umsortiert.jpg 
Hits:	13 
Größe:	53,7 KB 
ID:	7054. Im Ryzen Master so: Klicken Sie auf die Grafik für eine größere Ansicht 

Name:	wcg ryzenmaster.jpg 
Hits:	5 
Größe:	36,0 KB 
ID:	7055.

    Aber der Spass hält nicht lange. Nach ein paar Stunden sieht es wieder so aus: Klicken Sie auf die Grafik für eine größere Ansicht 

Name:	umsonst.jpg 
Hits:	9 
Größe:	52,0 KB 
ID:	7056
    To bodly crunch what no man has crunched before...
    http://stats.free-dc.org/cpidtagb.ph...heme=14&cols=3

  9. Avatar von bossmaniac
    Titel
    Senior Member

    Bewertung

    Registriert am
    16.06.2012

    Beiträge
    410

    Danke
    Danke gesagt 0   Danke erhalten 3

    #9

    Standard

    Und so im Ryzenmaster: Klicken Sie auf die Grafik für eine größere Ansicht 

Name:	umsonst ryzenmaster.jpg 
Hits:	10 
Größe:	33,8 KB 
ID:	7057
    To bodly crunch what no man has crunched before...
    http://stats.free-dc.org/cpidtagb.ph...heme=14&cols=3

  10. Avatar von bossmaniac
    Titel
    Senior Member

    Bewertung

    Registriert am
    16.06.2012

    Beiträge
    410

    Danke
    Danke gesagt 0   Danke erhalten 3

    #10

    Standard

    Zitat Zitat von bossmaniac Beitrag anzeigen
    Den Lasso Link werde ich mal ausprobiern was damit möglich ist. Danke dafür.
    Auf dem ersten Blick tut "Processor Group Extender genau das was es soll. Nur leider hält Process Lasso nicht dauerhaft durch.
    Geändert von XSmeagolX (23.09.2020 um 15:08 Uhr) Grund: Das Zitat mal richtig formatiert...
    To bodly crunch what no man has crunched before...
    http://stats.free-dc.org/cpidtagb.ph...heme=14&cols=3

  11. Avatar von Petrus
    Titel
    Senior Member

    Bewertung

    Registriert am
    22.02.2009

    Ort
    zu Hause

    Beiträge
    336

    Danke
    Danke gesagt 3   Danke erhalten 2

    #11

    Standard

    Nur mal so gefragt, hast schon mal eine feste Taktung vorgegeben und geschaut was er dann macht. Der Boosttakt wurde am Anfang sehr kritisiert, weil er so gut wie nie anliegt. Vll haben sie den Sheduler bei Windows auf SingleCore Boost bevorzugt ausgelegt?
    AMD Ryzen 3900X Linux Ubuntu
    Es gibt zwei Dinge die unendlich sind. Das Weltall und die Dummheit der Menschen. Vom erstren bin ich mir nicht ganz sicher.
    Albert Einstein

  12. Avatar von bossmaniac
    Titel
    Senior Member

    Bewertung

    Registriert am
    16.06.2012

    Beiträge
    410

    Danke
    Danke gesagt 0   Danke erhalten 3

    #12

    Standard

    Zitat Zitat von Petrus Beitrag anzeigen
    Nur mal so gefragt, hast schon mal eine feste Taktung vorgegeben und geschaut was er dann macht. Der Boosttakt wurde am Anfang sehr kritisiert, weil er so gut wie nie anliegt. Vll haben sie den Sheduler bei Windows auf SingleCore Boost bevorzugt ausgelegt?
    Nein habe ich noch nicht versucht. Die Taktung ist auch nicht mein Problem. Je nach Wu Typ unterscheidet sich der Takt. Asteroids unterschreitet bei Standard TDP von 280W sogar den Basistakt von 2,9 Ghz.
    To bodly crunch what no man has crunched before...
    http://stats.free-dc.org/cpidtagb.ph...heme=14&cols=3


  13. Titel
    Junior Member

    Bewertung

    Registriert am
    17.06.2012

    Beiträge
    74

    Danke
    Danke gesagt 4   Danke erhalten 0

    #13

    Standard

    Ist vermutlich das hier dokumentierte Problem:
    https://boinc.berkeley.edu/trac/wiki/WinMulticore

    Ich befürchte im Moment wäre die einfachste Lösung auf Linux zu wechseln

Ähnliche Themen

  1. Verwende ich die falsche Software?
    Von MatthiasKeck im Forum SETI@home
    Antworten: 2
    Letzter Beitrag: 02.06.2019, 16:14
  2. Node Interleave
    Von simbad im Forum Hardware - Probleme, Tuning, Benchmark usw.
    Antworten: 4
    Letzter Beitrag: 21.07.2012, 14:39
  3. falsche Platzierung bei BOINCstats
    Von Blacky im Forum BOINC
    Antworten: 4
    Letzter Beitrag: 02.01.2011, 14:23
  4. Office Falsche Dateiendung & Icons
    Von Trick im Forum Software - Installation, Probleme usw.
    Antworten: 21
    Letzter Beitrag: 16.02.2010, 21:46
  5. Boinc meldet falsche Appl.
    Von ikorreckt im Forum Software - Installation, Probleme usw.
    Antworten: 4
    Letzter Beitrag: 13.04.2009, 12:06

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •  
Single Sign On provided by vBSSO