CINES - Centre Informatique National de l’Enseignement Supérieur

Rechercher
Fermer ce champ de recherche.

C.I.N.E.S. Centre Informatique National de l’Enseignement Supérieur

T&T#6 Comment choisir la partition d’Occigen

En 2017, la machine Occigen sera dotée de 1260 nœuds supplémentaires. Les deux tranches de la machines se présentent ainsi :

  • 2106 nœuds Haswell (HSW24) de 64 Go ou 128 Go depuis 2015
  • 1260 nœuds Broadwell (BDW28) avec 64 Go à partir de début 2017.

Lors de l’ouverture de la production début 2017, tous les utilisateurs pourront soumettre des jobs dans les deux tranches.
Dorénavant vous devrez obligatoirement orienter vos travaux vers une tranche ou une autre (en fonction de vos besoins ou de la capacité de vos codes). Pour cela vous devrez mettre à jour votre script SLURM, la comptabilité horaire sera calculée en suivant le schéma ci-dessous.

Le calcul des heures décomptées de votre allocation va dépendre des ressources de la machine que vos jobs vont utiliser (moins de 24 cœurs, 24 cœurs, ou 28 cœurs). Vous pouvez consulter votre consommation sur le site web reser.

Comme vous pouvez le voir la facturation va dépendre de l’absence ou de la présence de plusieurs paramètres :

  • –constraint=HSW24 ou  BDW28
  • –mem (cas des nœuds SHARED uniquement)
  • –nodes
  • –ntasks
  • –exclusive

Tout d’abord les paramètres obligatoires :

–constraint=HSW24 : votre job doit tourner sur un nœud à 24 cœurs (processeur Haswell)

–constraint=BDW28 (obligatoire si vous n’avez pas mis HSW24) : votre job doit tourner sur un nœud à 28 cœurs (processeur Broadwell)

–nodes : défini le nombre total de nœuds utilisés par votre job.

Ensuite les paramètres optionnels :

–mem : Défini la quantité de mémoire dans chaque nœud alloué par SLURM. La valeur par défaut dans les nœuds SHARED est 1 Go par job. La valeur par défaut dans les autres nœuds est 60 Go. Seuls les nœuds Haswell disposent de plus de 60 Go, donc le paramètre HSW24 est obligatoire avec en plus le paramètre –mem=120G.

–ntasks : le nombre total de taches MPI de votre job

–exclusive : force l’allocation d’un nœud complet pour votre job (utile uniquement lorsque –node=1 et –ntask<24).