诚信为本,市场在变,诚信永远不变...

算力型

  • AI训练平台
  • AI训练平台
  • AI训练平台
AI训练平台 AI训练平台 AI训练平台

AI训练平台

  • 型号:ZMC-25Q2-AIC-500
  • CPU:AMD EPYC 7452(32核64线程,2.35GHz~3.35GHz)
  • 內存:DDR4-3200 8通道RDIMM
  • 存儲:DDR4-3200 8通道RDIMM 512GB(16×32GB)
  • 主板:超微H11DSi-NT(双路AMD SP3)
  • 机箱:4U机架式(宽×深×高:482×900×175mm)
  • 价格:¥72500

1. 基础配置




型号:ZMC-25Q2-AIC-500


机箱规格:4U机架式(宽×深×高:482×900×175mm)


重量:净重38kg(满配≤55kg)


2. 核心硬件




处理器:




型号:AMD EPYC 7452(32核64线程,2.35GHz~3.35GHz)


缓存:128MB L3


TDP:180W


PCIe通道:128条PCIe 4.0


内存:




容量:512GB(16×32GB)


类型:DDR4-3200 8通道RDIMM


最大扩展:32插槽,支持4TB


GPU加速器:




型号:4×NVIDIA A100 80GB SXM4


CUDA核心:6,912(每卡)


显存:80GB HBM2e(2TB/s带宽)


互联:NVLink 3.0(900GB/s双向带宽)


存储系统:




高速缓存层:2×3.2TB Intel Optane P5800X(随机读6M IOPS)


数据层:8×7.68TB Solidigm D5-P5430 QLC SSD(读6.8GB/s)


3. 网络与互联




节点互联:


8×200Gb/s NVIDIA Quantum-2 InfiniBand


延迟:<0.5μs(GPUDirect RDMA)


管理网络:


双口100GbE OCP网卡(带BMC管理)


4. 散热与电源




散热设计:


直接液冷(DLC)散热模块


冗余风扇(N+2配置)


电源:


2400W 2+2冗余钛金电源(96%转换效率)


输入电压:200-240V三相交流


5. 性能指标




AI训练性能:


ResNet-50:2,300 images/sec(FP32精度)


BERT-Large:1.2 samples/sec(FP16精度)


GPT-3 175B:支持8节点扩展训练


认证:


✓ NVIDIA DGX SuperPOD兼容


✓ MLPerf Training v2.1基准测试套件


6. 软件栈




预装环境:


NGC容器:PyTorch 2.1/TensorFlow 2.12


集群管理:Kubernetes + Kubeflow


优化工具:


✓ 自动混合精度(AMP)


✓ 梯度压缩(1/8稀疏率)


7. 应用场景




核心场景:


✓ 大语言模型训练(LLaMA/GPT)


✓ 3D医学影像分析


✓ 自动驾驶感知模型开发


典型部署:


▶ 国家级AI实验室(16节点集群)


▶ 全球TOP3云服务商AIaaS平台


8. 服务支持




保修:5年高级支持(含液冷系统维护)


专业服务:


✓ 模型并行策略优化


✓ 分布式训练故障诊断