华为人工智能atlasA800-9000物理服务器离线安装及CANN安装和MindSpore安装和Tensorflow安装

目录

华为人工智能atlas A800-9000 物理服务器全程离线安装驱动以及CANN安装部署和MindSpore安装部署和Tensorflow安装部署

A800-9000 物理服务器安装驱动

使用镜像配置本地apt源

创建普通用户并设置密码

安装驱动以及固件

验证是否安装成功

CANN开发环境部署安装

安装环境以及依赖

安装完成后查看版本

安装Python3.7.5

使用Python3.7.5环境安装pip依赖包

安装开发套件包

CANN训练环境部署安装

说明

安装训练软件包

安装MindSpore

安装whl包

配置环境变量

测试是否可行

安装mindinsight

安装whl包

配置环境变量

启动及使用

安装Tensorflow

编译hdf5

配置环境变量及软连接

安装whl包

安装Pytorch

华为人工智能atlas A800-9000 物理服务器全程离线安装驱动以及CANN安装部署和MindSpore安装部署和Tensorflow安装部署

背景

Atlas 800 训练服务器(型号:9000)是基于华为鲲鹏920+昇腾910处理器的AI训练服务器,具有最强算力密度、超高能效与高速网络带宽等特点。该服务器广泛应用于深度学习模型开发和训练,适用于智慧城市、智慧医疗、天文探索、石油勘探等需要大算力的行业领域。

链接:

CANN (Compute Architecture for Neural Networks)

是华为公司针对AI场景推出的异构计算架构,通过提供多层次的编程接口,支持用户快速构建基于昇腾平台的AI应用和业务。

链接:

图片

MindSpore,新一代AI开源计算框架。

创新编程范式,AI科学家和工程师更易使用,便于开放式创新;该计算框架可满足终端、边缘计算、云全场景需求,能更好保护数据隐私;可开源,形成广阔应用生态。

链接:

图片

TensorFlow最初由谷歌大脑团队开发,用于Google的研究和生产,于2015年11月9日在Apache 2.0开源许可证下发布。

链接:

图片

A800-9000****物理服务器安装驱动

使用镜像配置本地apt源

创建普通用户并设置密码

安装驱动以及固件

*注意:安装完成后需要重启服务器

验证是否安装成功

图片

CANN****开发环境部署安装

安装环境以及依赖

安装完成后查看版本

安装Python3.7.5

使用Python3.7.5环境安装pip依赖包

*注意:以上pip包的安装必须以该顺序依次进行安装

安装开发套件包

出现install success后表示安装成功。

CANN****训练环境部署安装

说明

训练环境的Python3.7.5和环境以及依赖,和开发环境下的安装方式一样,可参考《CANN开发环境部署安装》文档进行安装。在已经搭建好的开发环境中,进行安装训练环境仅需安装一下训练软件包和实用工具包即可。

安装训练软件包

出现install success后表示安装成功。

安装MindSpore

安装whl包

安装Ascend 910 AI处理器配套软件包提供的whl包,whl包随配套软件包发布,升级配套软件包之后需要重新安装。

*注意:安装时必须以此顺序进行安装

配置环境变量

测试是否可行

Python代码内容:

出现此结果即是安装部署完成

安装mindinsight

安装whl包

*注意:安装必须以此顺序进安装

配置环境变量

在配置文件中配置如下变量

启动及使用

出现该消息后,说明可视化已经启动成功,若需要外机访问的话,需要进行反向代理到0.0.0.0上面即可,比如frp工具即可实现该操作

在训练完成的Python代码目录下,使以下命令即可启动并展示该目录下的训练数据,debugger的参数可使用false或者true

使用如下命令即可启动训练

安装Tensorflow

编译hdf5

配置环境变量及软连接

安装whl包

注意:必须依次安装

安装Pytorch

该文章所配套的软件包关注微信回复 ai 即可获取所需要的所有软件包

关于

https://www.oiox.cn/

https://www.oiox.cn/index.php/start-page.html

CSDN、GitHub、51CTO、知乎、开源中国、思否、掘金、简书、华为云、阿里云、腾讯云、哔哩哔哩、今日头条、新浪微博、个人博客

全网可搜《小陈运维》

文章主要发布于微信公众号

最后更新于