在Ubuntu 16.04上模拟SLURM

我想在Ubuntu

16.04上模拟SLURM。我不需要认真的资源管理,我只想测试一些简单的例子。我无法以通常的方式安装SLURM,我想知道是否还有其他选项。我尝试过的其他方法:

  • 一个docker形象。不幸的是,docker pull agaveapi/slurm; docker run agaveapi/slurm给我错误:

/usr/lib/python2.6/site-

packages/supervisor/options.py:295:UserWarning:Supervisord以root身份运行,并且正在默认位置(包括其当前工作目录)中搜索其配置文件;您可能需要指定一个“

-c”参数,该参数指定配置文件的绝对路径以提高安全性。’Supervisord以root身份运行并且正在搜索‘2017-10-29 15:27:45,436

CRIT Supervisor以root身份运行(配置文件中没有用户)2017-10-29 15:27:45,437 INFO以pid 1

2017开始受监管-10-29 15:27:46,439生成的INFO:带有pid 9的’slurmd‘2017-10-29 15:27:46,441

INFO生成的:’sshd’与pid 10 2017-10-29 15:27:46,443 INFO生成的:带有pid

11的’munge‘2017-10-29 15:27:46,443信息生成::带有pid 12的’slurmctld‘2017-10-29

15:27:46,452 INFO退出:

  • 本指南通过Vagrant启动SLURM VM。我尝试过,但是复制munge密钥超时。

sudo scp /etc/munge/munge.key vagrant @ server:/ home / vagrant /

ssh:连接到主机服务器端口22:连接超时失去连接

回答:

所以…我们这里有一个现有群集,但是它运行的是较旧的Ubuntu版本,无法与运行17.04的我的工作站配合良好。

因此,在我的工作站上,我只是确保安装了slurmctld(后端)并slurmd安装了一个小工具slurm.conf

ControlMachine=mybox

# ...

NodeName=DEFAULT CPUs=4 RealMemory=4000 TmpDisk=50000 State=UNKNOWN

NodeName=mybox CPUs=4 RealMemory=16000

之后我重新启动slurmcltd然后slurmd。现在一切都很好:

root@mybox:/etc/slurm-llnl$ sinfo

PARTITION AVAIL TIMELIMIT NODES STATE NODELIST

demo up infinite 1 idle mybox

root@mybox:/etc/slurm-llnl$

这是一个简并的设置,我们真正的设置包含开发和生产机器以及适当的分区的混合。但这应该回答您的“可以后端真正成为客户”的问题。另外,我的机器并不是真正被调用,mybox但在任何情况下都与该问题无关。

使用Ubuntu 17.04,所有库存都可以munge进行通信(无论如何都是默认的)。

编辑 :智慧:

me@mybox:~$ COLUMNS=90 dpkg -l '*slurm*' | grep ^ii

ii slurm-client 16.05.9-1ubun amd64 SLURM client side commands

ii slurm-wlm-basic- 16.05.9-1ubun amd64 SLURM basic plugins

ii slurmctld 16.05.9-1ubun amd64 SLURM central management daemon

ii slurmd 16.05.9-1ubun amd64 SLURM compute node daemon

me@mybox:~$

以上是 在Ubuntu 16.04上模拟SLURM 的全部内容, 来源链接: utcz.com/qa/420519.html

回到顶部