• 21.07.2019

    von Veröffentlicht: 21.07.2019 08:45
    1. Kategorien:
    2. Projekte

    Am morgigen Montag, den 22. Juli, werden einige Teile der Projektinfrastruktur neu gestartet, was dazu führen wird, dass laufende WUs des Subprojekts CMS Simulation abbrechen werden. Der zuständige Administrator rät daher dazu, rechtzeitig keine neuen Aufgaben mehr herunterzuladen:

    CMS@Home-Unterbrechung am Montag, den 22. Juli
    Ich habe die folgende Nachricht aus der CERN/CMS-IT-Abteilung bekommen:

    >> als Folge der Hypervisor-Neustartserie, die von der CERN-IT hier angekündigt wurde: https://cern.service-now.com/service...o?n=OTG0051185
    >> werden die folgenden Virtuellen Maschinen, die zum CMS-Production-Openstack gehören, am Montag, den 22. Juli ab 08:30 MESZ neu gestartet:
    ...
    >> | vocms0267 | cern-geneva-b | cms-home

    worauf ich antwortete:
    > Danke Alan. Auf vocms0267 läuft das CMS@Home-Projekt. Sollte ich die Freiwilligen vor der Unterbrechung warnen oder wird das eher unsichtbar verlaufen?

    und diese Antwort erhielt:
    Laufende Aufgaben werden fehlschlagen, da sie sich nicht mit dem schedd-condor_shadow-Dienst verbinden können. Das wird die für die Teilnehmer sichtbare Auswirkung sein. Es wird auch ein kurzes Zeitfenster geben (bis ich den Software-Agenten neu gestartet habe), in welchem keine ausstehenden Aufgaben im Condor-Pool sein werden.
    Also könnte es sinnvoll sein, die Teilnehmer zu informieren.

    Meine Empfehlung ist daher, dass ihr ab Sonntagnachmittag keine neuen Aufgaben von CMS@Home zulasst, damit die laufenden Aufgaben vor dem Neustart um 08:30 MESZ fertig werden. Ich lasse euch wissen, sobald Alan mich informiert, dass vocm0267 wieder läuft.
    17.07.2019, 14:14:12 MEZ

    Originaltext:
    Zitat Zitat von https://lhcathome.cern.ch/lhcathome/forum_thread.php?id=5087
    CMS@Home disruption, Monday 22nd July
    I've had the following notice from CERN/CMS IT:

    >> following the hypervisor reboot campaign, as announced by CERN IT here: https://cern.service-now.com/service...o?n=OTG0051185
    >> the following VMs - under the CMS Production openstack project - will be rebooted on Monday July 22 (starting at 8:30am CERN time):
    ...
    >> | vocms0267 | cern-geneva-b | cms-home

    to which I replied:
    > Thanks, Alan. vocms0267 runs the CMS@Home campaign. Should I warn the volunteers of the disruption, or will it be mainly transparent?

    and received this reply:
    Running jobs will fail because they won't be able to connect to the schedd condor_shadow process. So this will be the visible impact on the users. There will be also a short time window (until I get the agent restarted) where there will be no jobs pending in the condor pool.
    So it might be worth it giving the users a heads up.

    So, my recommendation is that you set "No New Tasks" for CMS@Home sometime Sunday afternoon, to let tasks complete before the 0830 CST restart. I'll let you know as soon as Alan informs me that vocm0267 is up and running again
    17 Jul 2019, 13:14:12 UTC
Single Sign On provided by vBSSO