这篇文章主要介绍“Linux下如何部署Ray集群”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Linux下如何部署Ray集群”文章能帮助大家解决问题。

Ray是UC Berkeley RISE Lab新推出的高性能分布式执行框架,它使用了和传统分布式计算系统不一样的架构和对分布式计算的抽象方式,具有比Spark更优异的计算性能。Ray是一个基于Python的分布式执行引擎。相同的代码可以在单个机器上运行以实现高效的多处理,并且可以在群集上用于大量的计算。

Anaconda

为了方便,我们最好利用 Anaconda构建来一个独立的python运行环境。(当然你也可以直接使用系统内python运行环境,那么你可以跳过此步骤)

#下载安装脚本$wgethttps://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh#添加执行权限$chmodu+xMiniconda3-latest-Linux-x86_64.sh#运行安装脚本$./Miniconda3-latest-Linux-x86_64.sh安装python

为ray准备一个python环境,以python3.8.8示例:

#创建一个名为ray,版本为3.8.8的python环境$condacreate--nameraypython=3.8.8#激活名为ray的python环境$condaactivateray

安装完之后,最好重新登录一下,或者执行一下source ~/.bashrc使得环境变量生效

安装ray

安装ray(版本为1.7.0),这里为了加快速度指定了阿里的镜像源:

$pipinstall-ihttps://mirrors.aliyun.com/pypi/simple--trusted-hostmirrors.aliyun.com-U'ray[default]'==1.7.0启动head节点

192.168.100.1上启动Head节点:

$raystart--head--dashboard-host='0.0.0.0'--dashboard-port=8265

正常会看到如下输出:

LocalnodeIP:192.168.100.12021-11-0218:33:11,977INFOservices.py:1250--ViewtheRaydashboardathttp://192.168.100.1:8265--------------------Rayruntimestarted.--------------------NextstepsToconnecttothisRayruntimefromanothernode,runraystart--address='192.168.100.1:6379'--redis-password='5241590000000000'...

输出信息包含了2个关键信息,需要别注意:

View the Ray dashboard at http://192.168.100.1:8265:web服务的地址
ray start --address='192.168.100.1:6379' --redis-password='524159000':head的地址和密码
启动worker节点

192.168.100.2上,按照上面的步骤将python和ray安装好,注意它们的版本必须保持一致。 (另外,Worker不是必须的,因为Head节点本身就具有worker角色)

#连接指定的Head地址$raystart--address='192.168.100.1:6379'--redis-password='5241590000000000'Dashboad

访问dashboard:http://192.168.100.1:8265

关于“Linux下如何部署Ray集群”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注亿速云行业资讯频道,小编每天都会为大家更新不同的知识点。