昇腾 910B 多机环境 DeepSeek-V3/R1 671B 满血版部署指南
本文档将详细阐述基于物理机服务的 Deepseek-R1-671b 多机部署方案,基于 4 台 8 卡昇腾 910B GPU 物理机和 2 台 8 卡昇腾 910B GPU 物理机进行最佳实践,内容涵盖环境准备、服务启动与故障处理三个方面。
注意:4 台昇腾 910B 物理机服务器可以部署 DeepSeek-R1/V3 671B 版本,2 台昇腾 910B 物理机服务器可以部署 DeepSeek-R1/V3 671B W8A8 量化版本。
1. 准备工作
1.1 软硬件需求概览
- BF16版本部署:4台配备昇腾910B GPU的服务器
- W8A8量化版本部署:2台配备昇腾910B GPU的服务器
- 每台服务器推荐配置:
- CPU: 64核以上(实际测试环境:192核)
- 内存: 512GB以上(实际测试环境:2048GB)
- 存储: 2TB以上SSD存储(实际测试环境:4x3.2TB)
- 网络: 100Gbps RDMA网络互联(实际测试环境:25G网络)
软件要求:
组件 | 版本要求 | 备注 |
---|---|---|
MindIE | ≥2.0.T3 | 官网下载 |
Python 环境 | 3.11 | 镜像预置 |
MindStudio | Msit: br_noncom_MindStudio_8.0.0_POC_20251231分支 | |
HDK | 24.1.0 | |
CANN | ≥8.0.T63 | |
昇腾驱动 | ≥24.1.rc2 | 所有节点确认驱动版本一致 |
昇腾固件 | ≥7.5.0.1.129 | 所有节点确认固件版本一致 |