欢迎光临散文网会员登陆 & 注册

UltraLAB最新更新2023年人工智能训练与推理工作站、服务器、集群硬件

2023-04-27 16:02 作者:J20-A 0人读过 | 我要投稿

基于GPU计算应用越来越火爆，ChatGPT、蛋白质折叠、电磁仿真、分子动力模拟等等，一个好的算法，改变了应用，CPU、GPU也在不断的升级换代，计算架构也在提升，

本期的硬件配置特点：

1）新架构： a1. 新增RTX6000Ada-最大9块，性能超过8块A100 80GB，

a2. intel 4代Xeon超频处理器+最大6块GPU

2）新机型：科研型（GA320i) 、高性能-GX650M(9块RTX6000 Ada卡)、极致超频GT430M(6块卡)

3）热门应用： ChatGPT、人工智能、仿真计算、蛋白质折叠、冷冻电镜、图像处理等

4）AI开发框架：支持PyTorch、TensorFlow、Keras，Caffe、Theano、MXNet、MatLAB

5）系统：独有的Windows、Linux、虚拟系统、集群系统，科研应用和使用率大幅提升

6）环境：A1）静音级办公环境, A2）多机GPU集群

目录

1 高性价比--深度学习科研超频工作站配置方案

2 深度学习高性能工作站配置方案

3 地球最强大--深度学习超算工作站配置方案

4 市场唯一配备A100高速AI便携工作站配置方案

5 具备超频能力--深度学习超算服务器配置方案

6 支持A100+水冷---人工智能超级工作站配置方案

7 2022年最强大的深度学习多机集群配置方案

（一）深度学习科研超值型硬件配置方案

计算架构：intel第13代超频处理器(8核5.8GHz)+RTX4090/RTX6000Ada+DDR5 5600

计算特点：RTX6000Ada，性能超RTX4090/超A100，超2块RTX3090Ti

(二)深度学习高性能工作站硬件配置方案

---超DGX Station A100、最大6块GPU+静音

架构1（AMD）：AMD霄龙7003(768MB缓存)+6块RTX4090（全速）

架构2（Intel）：Xeon W-34xxX/24xxX3代(最大40核)+4块RTX 4090（全速）

(三) 地球最强GPU超算平台--人工智能工作站配置推荐

---市场唯一支持9块RTX6000Ada(820Tflops)+静音级性能超8块A100 80GB（616Tflops）

计算架构：CPU最大80核，8/10块全速PCIe 4.0 16X，双/三槽GPU卡通吃，最大300T高速存储

（四）支持A100+水冷---人工智能推理超级工作站硬件配置推荐

---逻辑推理超算平台，支持8块A100+水冷静音级

完美计算架构：双xeon3代(最大80核)，最大6块全速PCIe 4.0 16X全速 A100+海量存储(最大300T)

性能出众: FP16算力（8块RTX6000Ada）728Tflops,可以代替A100

(五)GPU超算服务器配置推荐-机房专用型

硬件架构：配备PCIe 4.0插槽，高频处理器+工业级水冷散热，+最大8块RTX30系列

机器特点：极致性能深度学习集群、云计算平台

（七）最强大的深度学习多机集群配置推荐

相关机型：

（1）GPU计算服务器（计算节点）

机型：UltraLAB GX650M（2021年上市的最新机型）

技术特点：采用intel第3代Xeon可扩展处理器、配备nvidia RTX 40系列GPU计算卡，网口配备56G IB网口，硬盘采用SSD，保证硬件配置计算更强、io带宽更高、整机性能全方位优化，保证多用户多任务神经元完美计算能力。

（2）存储服务器（存储节点）

相关机型：UltraLAB N630A（8盘位）、N630B（16盘位）

技术特点：

CPU 采用intel Xeon第2代可扩展处理器

高速缓存盘：配备M2.SSD确保数据处理的高速读写(读写3G/s以上)及超低io延迟、

配备并行存储：数据备份安全可靠、最大容量到112TB（8盘位）/240TB（16盘位）

网口:配备双56G光口，

另外，整机性能全方位优化支持远程操作、远程管理，系统管理员和使用者直接在办公室甚至异地进行操作。

方案1 CX650深度学习集群配置推荐

计算节点3个

GPU卡：18块RTX4090（相当于36块RTX3090Ti）

集群FP32单精度浮点算力：1486Tflops 配置方案

方案1 CX650深度学习集群配置推荐

计算节点3个

GPU卡：18块RTX4090（相当于36块RTX3090Ti）

集群FP32单精度浮点算力：1486Tflops

配置方案

方案2 CX650深度学习集群配置推荐

计算节点4个

GPU卡：24块RTX4090（相当于48块RTX3090Ti）

集群单精度fP32浮点算力：1982Tflops

配置方案：

标签：

UltraLAB最新更新2023年人工智能训练与推理工作站、服务器、集群硬件的评论 (共条)