~ubuntu-branches/ubuntu/precise/slurm-llnl/precise

« back to all changes in this revision

Viewing changes to doc/html/multi_cluster.shtml

  • Committer: Bazaar Package Importer
  • Author(s): Gennaro Oliva
  • Date: 2011-04-08 11:21:17 UTC
  • mfrom: (3.3.16 sid)
  • Revision ID: james.westby@ubuntu.com-20110408112117-nfnyq9dtm55hqoaw
Tags: 2.2.4-1
* New upstream releases 
* Cleaning spare file and directories, not belonging to the sources
  generated by the building process and not removed by distclean.
  Added debian/clean with spare files and rm -rf inside debian/rules
  for directories.
* Added new packages libslurm-perl, libslurmdb-perl, slurm-llnl-torque
  (Closes: #575822) thanks to Julien Blache

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
<!--#include virtual="header.txt"-->
 
2
 
 
3
<h1>Multi-Cluster Operation</h1>
 
4
 
 
5
<p>A cluster is comprised of all the nodes managed by a single slurmctld
 
6
daemon.  SLURM version 2.2 offers the ability to target commands to other
 
7
clusters instead of, or in addition to, the local cluster on which the
 
8
command is invoked.  When this behavior is enabled, users can submit
 
9
jobs to one or many clusters and receive status from those remote
 
10
clusters.</p>
 
11
 
 
12
<p>For example:</p>
 
13
 
 
14
<PRE>
 
15
juser@dawn> squeue -M dawn,dusk
 
16
CLUSTER: dawn
 
17
JOBID PARTITION   NAME   USER  ST   TIME NODES BP_LIST(REASON)
 
18
76897    pdebug  myJob  juser   R   4:10   128 dawn001[8-15]
 
19
76898    pdebug  myJob  juser   R   4:10   128 dawn001[16-23]
 
20
16899    pdebug  myJob  juser   R   4:10   128 dawn001[24-31]
 
21
 
 
22
CLUSTER: dusk
 
23
JOBID PARTITION   NAME   USER  ST   TIME NODES BP_LIST(REASON)
 
24
11950    pdebug   aJob  juser   R   4:20   128 dusk000[0-15]
 
25
11949    pdebug   aJob  juser   R   5:01   128 dusk000[48-63]
 
26
11946    pdebug   aJob  juser   R   6:35   128 dusk000[32-47]
 
27
11945    pdebug   aJob  juser   R   6:36   128 dusk000[16-31]
 
28
</PRE>
 
29
 
 
30
<p>The following SLURM client commands now offer the "-M, --clusters="
 
31
option which provides the ability to communicate to and from a comma
 
32
separated list of clusters:
 
33
<ol><b>sacct, sbatch, scancel, scontrol, sinfo, smap, sprio, squeue,
 
34
sshare,</b> and <b>sstrigger</b></ol>
 
35
 
 
36
<b>salloc, srun,</b> and <b>sstat</b> are cluster specific commands
 
37
and do not offer the "-M, --clusters=" option.</p>
 
38
 
 
39
<p>When <b>sbatch</b> is invoked with a cluster list, SLURM will
 
40
immediately submit the job to the cluster that offers the earliest
 
41
start time subject its queue of pending and running jobs.  SLURM will
 
42
make no subsequent effort to migrate the job to a different cluster
 
43
(from the list) whose resources become available when running jobs
 
44
finish before their scheduled end times.</p>
 
45
 
 
46
<h2>Multi-Cluster Configuration</h2>
 
47
<p>The multi-cluster functionality requires the use of the slurmDBD.
 
48
The AccountingStorageType in the slurm.conf file must be set to the
 
49
accounting_storage/slurmdbd plugin and the MUNGE or authentication
 
50
keys must be installed to allow each cluster to communicate with the
 
51
slurmDBD.  Note that MUNGE can be configured to use different keys for
 
52
communications within a cluster and across clusters if desired.
 
53
See <a href="accounting.html">accounting</a> for details.</p>
 
54
 
 
55
<p>Once configured, SLURM commands specifying the "-M, --clusters="
 
56
option will become active for all of the clusters listed by the
 
57
<b>"sacctmgr show clusters"</b> command.</p>
 
58
 
 
59
<p style="text-align:center;">Last modified 14 February 2011</p>
 
60
 
 
61
<!--#include virtual="footer.txt"-->