欢迎光临散文网 会员登陆 & 注册

思腾合力深度学习实验室解决方案

2022-07-06 10:46 作者:轩翼AA  | 我要投稿

未来绝大多数企业将部署人工智能产业链,国家和企业都需要大量的人才补充,而我们的高校和职校目前还没有建立完整的教育课程和实践环境,并且 GPU 资源相对集中,个人无法承受,校级 GPU 平台资源浪费、管理困难。



本方案思腾合力提供从底层基础设施,GPU 算力资源到上层统一管理调度平台的整体解决方案,管理调度平台采用思腾合力 SCM 人工智能云平台软件,为 B/S 架构,配置一定数量的终端,学生可以在教室通过 Web 访问后端的集群计算资源,并在 Web 界面上开展深度学习相关的模型训练、调优等任务。



针对 GPU 资源紧缺的团队,方案可提供强大的平台管理系统,对 GPU 资源进行统一管理,提高 GPU 资源利用率,让每位学生或老师可用到 GPU 资源;平台集成 Tensorflow、Caffe 等众多的计算框架,CUDNN 等 SDK;同时具备多级用户功能:多层组织架构,多种用户模式,资源配额最大化利用。


案例:中科院自动化所智能决策算力平台建设


本次需要强大算力支持强化学习以满足兵棋智能推演,基本算法是所谓的策略网络,用来训练模仿人类行为,看过数百万计的对局后,目标学会提取特征、原则和经验法则。


人机对抗首页 (ia.ac.cn)


解决方案

4节点DGX A100

200G IB组网

千兆以太网管理

AI SDK

NGC


客户收益

DGX A100 发挥出了最新 A100 GPU 的全部潜力,采用了最新的NVLINK3.0,而且单台设备中有 6 个 NVSWITCH,使得 8 块卡实现全互联,卡与卡之间带宽高达 600GB/s,相比其他基于 GPU 的系统,DGX A100 对于主流的 AI 框架做了优化,并且依托于最新的 Tensorcore,单台可实现 5P 的 AI 算力。


案例:武汉纺织大学人工智能实验室建设


随着学校对教学、科研的不断深入,广大师生对网络、计算资源等的需求也在逐步提升。已有的基础资源环境已经逐步显现瓶颈效应,学校发展更新的信息化系统建设发展的要求,需要不断增加计算资源,扩展存储容量,以及统一资源协调、管理,运行维护的平台。


SCM人工智能云平台(点击图片了解更多)


解决方案

3节点思腾合力IW4203-4G计算服务器(V100)

1节点管理服务器

1节点思腾24盘位高性能存储

计算网络:100G IB组网

云平台软件:SCM人工智能云平台


客户收益

集群资源由传统物理形态转变为虚拟资源后,调配更加灵活。管理员为每个应用系统、每个平台用户灵活分配资源配额,并且可以随时根据实际使用情况进行调整。云平台提供的弹性功能保证应用系统能够根据实际的负载情况自动调整资源占用量,提高资源利用率,简化 IT 运维。


案例:青海大学深度学习计算平台建设



本项目需要 GPU 算力来针对深度神经网络模型的教学研究,需要大量的并行的重复计算,来提高计算速度,及通过扩大问题求解规模,解决大型而复杂的计算问题。


解决方案

2节点思腾合力IW4211-8Gs计算服务器(V100跟P100 SXM)

1节点管理服务器

1节点思腾24盘位高性能存储

计算网络:100G IB组网

云平台软件:SCM人工智能云平台


客户收益

用户通过使用 SCM 人工智能云平台集成的 Tensorflow 框架进行深度神经网络模型的研究,实现资源的划分,用户层级划分,有总管理员,组管理员和普通用户,每个用户可以使用特定的资源进行模型训练,调试优化,简化流程,提高教学和科研效率。


思腾合力专注人工智能领域,拥有自主品牌 AI 服务器及通用 X86 服务器,为 NVIDIA 精英级别的合作伙伴,公司扎根高性能计算领域多年,已经打造出了一套完全自主的软硬件结合的产品生态。能提供深度学习,GPU 高性能计算、虚拟化、分布式储存、集群管理等产品和整体解决方案,致力于成为行业领先的人工智能基础架构解决方案商。


目前,思腾拥有完善的研发、生产、制造基地,已形成以天津为生产基地、以北京为营销及研发中心、以南京、深圳、成都、武汉、西安、包头覆盖全国主要区域的营销和售后服务机构,为更高效地服务客户提供了有力保障。


思腾合力深度学习实验室解决方案的评论 (共 条)

分享到微博请遵守国家法律