华为人工智能atlasA800-9000物理服务器离线安装及CANN安装和MindSpore安装和Tensorflow安装
目录
华为人工智能atlas A800-9000 物理服务器全程离线安装驱动以及CANN安装部署和MindSpore安装部署和Tensorflow安装部署
A800-9000 物理服务器安装驱动
使用镜像配置本地apt源
创建普通用户并设置密码
安装驱动以及固件
验证是否安装成功
CANN开发环境部署安装
安装环境以及依赖
安装完成后查看版本
安装Python3.7.5
使用Python3.7.5环境安装pip依赖包
安装开发套件包
CANN训练环境部署安装
说明
安装训练软件包
安装MindSpore
安装whl包
配置环境变量
测试是否可行
安装mindinsight
安装whl包
配置环境变量
启动及使用
安装Tensorflow
编译hdf5
配置环境变量及软连接
安装whl包
安装Pytorch
华为人工智能atlas A800-9000 物理服务器全程离线安装驱动以及CANN安装部署和MindSpore安装部署和Tensorflow安装部署
背景
Atlas 800 训练服务器(型号:9000)是基于华为鲲鹏920+昇腾910处理器的AI训练服务器,具有最强算力密度、超高能效与高速网络带宽等特点。该服务器广泛应用于深度学习模型开发和训练,适用于智慧城市、智慧医疗、天文探索、石油勘探等需要大算力的行业领域。
链接:
CANN (Compute Architecture for Neural Networks)
是华为公司针对AI场景推出的异构计算架构,通过提供多层次的编程接口,支持用户快速构建基于昇腾平台的AI应用和业务。
链接:
MindSpore,新一代AI开源计算框架。
创新编程范式,AI科学家和工程师更易使用,便于开放式创新;该计算框架可满足终端、边缘计算、云全场景需求,能更好保护数据隐私;可开源,形成广阔应用生态。
链接:
TensorFlow最初由谷歌大脑团队开发,用于Google的研究和生产,于2015年11月9日在Apache 2.0开源许可证下发布。
链接:
A800-9000****物理服务器安装驱动
使用镜像配置本地apt源
创建普通用户并设置密码
安装驱动以及固件
*注意:安装完成后需要重启服务器
验证是否安装成功
CANN****开发环境部署安装
安装环境以及依赖
安装完成后查看版本
安装Python3.7.5
使用Python3.7.5环境安装pip依赖包
*注意:以上pip包的安装必须以该顺序依次进行安装
安装开发套件包
出现install success后表示安装成功。
CANN****训练环境部署安装
说明
训练环境的Python3.7.5和环境以及依赖,和开发环境下的安装方式一样,可参考《CANN开发环境部署安装》文档进行安装。在已经搭建好的开发环境中,进行安装训练环境仅需安装一下训练软件包和实用工具包即可。
安装训练软件包
出现install success后表示安装成功。
安装MindSpore
安装whl包
安装Ascend 910 AI处理器配套软件包提供的whl包,whl包随配套软件包发布,升级配套软件包之后需要重新安装。
*注意:安装时必须以此顺序进行安装
配置环境变量
测试是否可行
Python代码内容:
出现此结果即是安装部署完成
安装mindinsight
安装whl包
*注意:安装必须以此顺序进安装
配置环境变量
在配置文件中配置如下变量
启动及使用
出现该消息后,说明可视化已经启动成功,若需要外机访问的话,需要进行反向代理到0.0.0.0上面即可,比如frp工具即可实现该操作
在训练完成的Python代码目录下,使以下命令即可启动并展示该目录下的训练数据,debugger的参数可使用false或者true
使用如下命令即可启动训练
安装Tensorflow
编译hdf5
配置环境变量及软连接
安装whl包
注意:必须依次安装
安装Pytorch
该文章所配套的软件包关注微信回复 ai 即可获取所需要的所有软件包
关于
https://www.oiox.cn/
https://www.oiox.cn/index.php/start-page.html
CSDN、GitHub、51CTO、知乎、开源中国、思否、掘金、简书、华为云、阿里云、腾讯云、哔哩哔哩、今日头条、新浪微博、个人博客
全网可搜《小陈运维》
文章主要发布于微信公众号
最后更新于