在Ubuntu 16.04上模拟SLURM
我想在Ubuntu
16.04上模拟SLURM。我不需要认真的资源管理,我只想测试一些简单的例子。我无法以通常的方式安装SLURM,我想知道是否还有其他选项。我尝试过的其他方法:
- 一个docker形象。不幸的是,
docker pull agaveapi/slurm; docker run agaveapi/slurm
给我错误:
/usr/lib/python2.6/site-
packages/supervisor/options.py:295:UserWarning:Supervisord以root身份运行,并且正在默认位置(包括其当前工作目录)中搜索其配置文件;您可能需要指定一个“
-c”参数,该参数指定配置文件的绝对路径以提高安全性。’Supervisord以root身份运行并且正在搜索‘2017-10-29 15:27:45,436
CRIT Supervisor以root身份运行(配置文件中没有用户)2017-10-29 15:27:45,437 INFO以pid 1
2017开始受监管-10-29 15:27:46,439生成的INFO:带有pid 9的’slurmd‘2017-10-29 15:27:46,441
INFO生成的:’sshd’与pid 10 2017-10-29 15:27:46,443 INFO生成的:带有pid
11的’munge‘2017-10-29 15:27:46,443信息生成::带有pid 12的’slurmctld‘2017-10-29
15:27:46,452 INFO退出:
- 本指南通过Vagrant启动SLURM VM。我尝试过,但是复制
munge
密钥超时。
sudo scp /etc/munge/munge.key vagrant @ server:/ home / vagrant /
ssh:连接到主机服务器端口22:连接超时失去连接
回答:
所以…我们这里有一个现有群集,但是它运行的是较旧的Ubuntu版本,无法与运行17.04的我的工作站配合良好。
因此,在我的工作站上,我只是确保安装了slurmctld
(后端)并slurmd
安装了一个小工具slurm.conf
,
ControlMachine=mybox# ...
NodeName=DEFAULT CPUs=4 RealMemory=4000 TmpDisk=50000 State=UNKNOWN
NodeName=mybox CPUs=4 RealMemory=16000
之后我重新启动slurmcltd
然后slurmd
。现在一切都很好:
root@mybox:/etc/slurm-llnl$ sinfoPARTITION AVAIL TIMELIMIT NODES STATE NODELIST
demo up infinite 1 idle mybox
root@mybox:/etc/slurm-llnl$
这是一个简并的设置,我们真正的设置包含开发和生产机器以及适当的分区的混合。但这应该回答您的“可以后端真正成为客户”的问题。另外,我的机器并不是真正被调用,mybox
但在任何情况下都与该问题无关。
使用Ubuntu 17.04,所有库存都可以munge
进行通信(无论如何都是默认的)。
编辑 :智慧:
me@mybox:~$ COLUMNS=90 dpkg -l '*slurm*' | grep ^iiii slurm-client 16.05.9-1ubun amd64 SLURM client side commands
ii slurm-wlm-basic- 16.05.9-1ubun amd64 SLURM basic plugins
ii slurmctld 16.05.9-1ubun amd64 SLURM central management daemon
ii slurmd 16.05.9-1ubun amd64 SLURM compute node daemon
me@mybox:~$
以上是 在Ubuntu 16.04上模拟SLURM 的全部内容, 来源链接: utcz.com/qa/420519.html