日前,联想万全异构智算平台正式上线发售。联想万全异构智算平台面向通用计算、科学计算与AI算力等多个领域,通过创新技术显著提升算力效率。
当前,“大模型+大算力+大数据”已成为新一代人工智能发展的基石。然而,智能计算的投入成本和技术门槛高于通用计算,因此广大用户急需一个全新的计算开发与管理平台。
顺势而为,抢先布局。联想基础设施业务群精心打造了联想万全异构智算平台,它集成了五大创新技术:算力匹配魔方、GPU内核态虚拟化、联想集合通信算法库、AI高效断点续训技术以及AI与HPC集群超级调度器,为用户提供了一个高质量、高标准的异构智算解决方案。
联想万全异构智算平台
正式开售
该平台能高度自动化地完成AI全流程开发,提供高可用算力,并持续突破计算效率瓶颈。用户不仅可以自动完成AI计算并发布模型或推理服务,还能手动深入调整计算过程,包括选择工具和模型、调整算力配置以及对任务进行定制化监控。它不仅能助力用户实现AI全流程开发的高度自动化,降低业务TCO(全周期使用成本),加速应用部署,还能管控异构,实现智算的无边界。
具体而言,联想万全异构智算平台具有以下核心产品特性:
算力匹配魔方
首先,算力匹配魔方可智能匹配用户算力需求
基于海量硬件评测和AI算子算法集成工作
联想构建了算力魔方知识库
标识了AI场景、算法与集群配置的匹配关系
用户只需输入场景和数据
算力魔方即可自动加载最优算法并调度最佳集群配置
GPU内核态虚拟化
其次,GPU内核态虚拟化技术可逼近GPU算力极限
联想研究院开发的虚拟化算法
可将GPU算力损耗降至极低水平
大幅提升GPU利用率
联想集合通信算法库
此外,联想集合通信算法库能提升网络通信效率
它可实时感知多种网络拓扑
并通过先进算法优化数据传输路径
以千卡规模集群为例
采用该算法库可使网络通信效率提升超10%
且集群规模越大效果越显著
AI高效断点续训技术
同时,AI高效断点续训技术可减少AI训练中断时间
通过特征采样和AI模型预测训练故障
该平台能在断点前优化备份
将断点续训恢复时间缩减至分钟级
大幅提高训练效率并节约算力费用
AI与HPC集群超级调度器
最后,AI与HPC集群超级调度器
可满足混合集群资源共享需求
它可切换AI和HPC调度模式
实现跨集群全局动态管理和调度算力资源
一小时内自动完成跨集群资源调度和共享
总而言之,联想万全异构智算平台是AI 2.0时代,联想中国基础设施战略框架的核心,它是AI 2.0时代大模型训练和推理的基础设施底座。作为“一横五纵”战略框架的核心,联想万全异构智算平台与服务器、存储、数据网络、软件及超融合以及边缘基础设施产品和方案,共同构成联想AI导向基础设施的完整体系。这一体系将为企业智能化转型提供坚实可靠的智算底座,助力各行业实现智能化升级。