华为 A800-9000 服务器 离线安装MindX DL

MindX DL(昇腾深度学习组件)是支持 Atlas 800 训练服务器、Atlas 800 推理服务器的深度学习组件参考设计,提供昇腾 AI 处理器资源管理和监控、昇腾 AI 处理器优化调度、分布式训练集合通信配置生成等基础功能,快速使能合作伙伴进行深度学习平台开发。

图片

操作系统使用的是Ubuntu-1804,CPU是华为自研ARM架构。

图片

一、安装前准备

  1. 配置apt网络源

2.配置kubernetes网络源

3.创建目录并下载基础包

4.下载docker镜像并导出保存

注* 其中部分镜像是需要在华为hub里面进行获取权限后进行下载

https://support.huaweicloud.com/usermanual-mindxdl202/atlasmindx_03_0047.html

5.完成后的目录

注* 其中yamls文件在下方链接中下载

https://gitee.com/ascend/mindxdl-deploy/tree/20201230-V20.2.0/

6.配置免密登陆

7.配置安装ansible

注* 参数说明,请根据实际写入:

二、一键安装

三、安装后进行验证

1.docker信息查看

2. kubectl的pod信息查看

注* 再此信息中可以看到CPU和加速卡的信息

图片

**详情可以查看华为官方文档: **

https://support.huaweicloud.com/mindxdl201/

图片

关于

https://www.oiox.cn/

https://www.oiox.cn/index.php/start-page.html

CSDN、GitHub、51CTO、知乎、开源中国、思否、掘金、简书、华为云、阿里云、腾讯云、哔哩哔哩、今日头条、新浪微博、个人博客

全网可搜《小陈运维》

文章主要发布于微信公众号

最后更新于