近日,紫光股份旗下新华三集团完成了下一代分布式存储Polaris X20000在Llama3.1-70B和DeepSeek-671B等主流大模型训推任务场景下的数据存储性能实测,凭借其高带宽低延迟的数据访问能力,相较于传统高性能分布式存储,实现了综合训推效率的大幅跃升,再次证明了Polaris X20000在高强度AI负载下的高性能与高可靠性。
本次测试以Polaris X20000作为底层高性能数据平台,以灵犀使能平台(LinSeer Hub)承载大模型训练与推理框架,模拟在真实智算业务场景下,从TB级模型加载到百GB级Checkpoint写入,再到高并发推理的完整链路。实测结果表明,相较于传统高性能分布式存储,在Llama3.1-70B训练中,模型加载时间缩短36%,Checkpoint保存/加载性能提升超50%;在DeepSeek-671B推理中,模型加载效率提升近43%,并显著优化了Token生成速率与响应时延。
存储——决定智算效率的隐形核心
随着大模型、多模态和智能体技术的迅速发展,AI智算已成为推动产业智能化升级的核心引擎。在这一过程中,存储系统的重要性不容忽视。
智算中心的效率不仅取决于GPU算力的峰值,更取决于数据能否以足够快、足够稳的方式抵达GPU。无论是TB级的模型加载,还是PB级的数据集训练,抑或是高并发的推理请求,存储系统都直接决定了GPU是否能“满负荷”运转。存储若成为瓶颈,算力优势便会被严重削弱,资源浪费、效率下降,最终拖慢整个AI应用落地的节奏。
Polaris X20000正是面向这一挑战而生,它不仅以高带宽、低延迟和极致并发性能保障GPU集群的充分释放,更作为底层核心数据平台,为智算系统提供稳定可靠的支撑。通过这种上下协同,X20000将存储效能转化为智算整体效能,使灵犀智算在大模型训练与推理等关键环节拥有更高效率和更优体验。
Polaris大幅提升智算应用数据效能
为了进一步验证Polaris X20000在真实负载场景下的性能表现,新华三基于Spine-Leaf无损网络和RoCE高速互联,构建了存储、计算一体化的实验环境。计算侧部署8台H3C UniServer R5500 G6服务器,每台配置8张H20-SXM5 GPU,整体组成高性能训练集群;存储侧则采用3节点Polaris X20828,均配备高性能NVMe SSD与100/200G高速网卡。测试涵盖模型加载、Checkpoint写入、推理延迟等全链路环节,既模拟了实际AI业务负载,又验证了在训练、推理及可靠性场景下的综合表现。
在测试设计中,新华三选取了Llama3.1-70B 和DeepSeek-671B两个极具代表性的大模型负载,通过灵犀使能平台(LinSeer Hub)承载大模型训练与推理框架,搭建起完整的“存储—算力—应用”三层典型智算架构。
从测试结果来看,Polaris X20000在模型训练与推理两个关键环节,性能均实现了大幅的提升,在业内已处于领先水平。对于大模型企业、政府智算中心及运营商而言,这意味着在同等算力投入下,可以显著降低训练耗时、提升推理效率,从而获得更高的业务回报率。
在有限组网条件下,Polaris X20000在Llama3.1-70B大模型训练中,相比业界主流分布式文件系统实现了36%的加载时间缩减,显著提升了GPU的利用效率;在Checkpoint写入方面也实现了翻倍提升。由于训练过程中需要定期保存Checkpoint,以便在出现异常时能够快速加载并断点续训,实测数据显示,X20000在Checkpoint保存与加载环节的性能提升超过50%,大幅提高了GPU利用率,保障了长时间训练任务的连续性与高效性。
在DeepSeek-671B大模型推理中,42GB模型文件加载效率相比上一代智算存储提升近43%,充分证明了其在小IO顺序读场景下的极致能力;而在单机与双机推理场景下,Polaris X20000均支持更高并发与更低延迟,token生成速率和响应时延显著优于对比平台,尤其在大规模输入token条件下依然保持稳定表现。
此外,Polaris X20000在稳定性测试中同样表现出色。无论是存储节点故障、网络链路中断,还是计算节点重启,系统都能够依靠其系统级、节点级、I/O级的多重可靠性机制实现快速自愈,保证业务连续性。测试结果表明,在发生底层故障时,上层业务几乎无感知,真正做到了从节点到集群的全链路稳健,为大规模智算任务的长期稳定运行提供了坚实保障。
作为新华三“算力×联接”理念的重要一环,Polaris X20000不仅是一次性能的飞跃,更是对未来智算发展的积极布局。新华三将继续深耕分布式存储领域,持续推动存储架构创新和智能化管理,帮助客户在AI与智算时代实现更高效、更可靠、更绿色的算力利用。未来,新华三将以Polaris系列为核心,携手产业伙伴,共同加速AI应用的普及与落地,助力百行百业迈向智能化的新时代。
成都强川科技有限公司,专注企业IT服务需求,产品可按需定制。主营:华三服务器、H3C服务器、,以专业的IT解决方案和优质的服务体验赢得企业信赖。QQ:2851150694;服务热线:028-85024766 18215624006(微信同号)
H3C 是中国一家 IT 设备供应商,包括 HPE 服务器、存储和相关技术服务。它由 HPE 持有 49% 的股份,其余由总部位于中国的 IT 服务公司 Unisplendour Corporation 持有,此前 HPE 在 2015 年以约 23 亿美元的价格出售了它的控股权。
2022年5月20日,紫光股份旗下新华三集团打造的ICT全栈式商城——新华三商城正式上线并取得规模应用一周年,为客户和合作伙伴提供全方位数字化和信息化服务,助力百行百业的数字化转型之路更加简单高效。
具有算力强、可靠性高、灵活扩展性强、易管理,易部署等优点,可广泛应用于虚拟化、云计算、高性能计算,人工智能等场景。
全新一代H3C UniServer R4900 G5通过多达32个NVMe SSD1的支持,以及M.2 SSD形态的引入,进一步增强了面向现代数据中心的扩展能力和配置灵活性。
可广泛应用于互联网、云计算、IDC(Internet Data Center,互联网数据中心)、企业市场、运营商等场景,R4950 G5具有低功耗、高可靠、灵活扩展性强、易管理,易部署等优点。
H3C UniServer R4700 G5,新华三集团自主研发的全新一代高性能1U2路机架式服务器,以卓越的性能和完美的可扩展性满足市场的需求。
H3C UniServer R4900 G3,通用型2U双路机架式服务器,面向不同业务负载平衡性能、扩展力及安全可靠等特性,显著提升数据中心生产力。
新华三H3C UniServer R4700 G3,高性能1U2路机架式服务器,满足数据中心对性能、能效和密度之间平衡的严苛要求,是高密度工作负载的理想选择。
新华三H3C UniServer R2900 G3,可满足轻量级业务部署需求的入门级2U双路机架服务器,凭借灵活弹性的配置保护企业IT投资
新华三H3C UniServer R2700 G3,入门级1U2路机架式服务器,满足成长型客户对主机性能以及经济性合理平衡的要求。
具有计算性能高、存储容量大、扩展性强和可靠性高等特点,在HDM、iFIST、FIST服务器管理系统的加持下,具有易于管理和便于部署的优点。
具有计算性能高、存储容量大、扩展性强和可靠性高等特点,在HDM、iFIST、FIST服务器管理系统的加持下,具有易于管理和便于部署的优点。
H3C UniServer R6700 G3,4P2U机架服务器,采用高密度架构设计,提供4路高性能计算能力,在2U机箱内实现高度的可伸缩性和可靠性。
该产品具有卓越性能、重塑架构、扩展性强和可靠性高等特点,可应用于深度学习模型训练、深度学习推理、高性能计算、数据分析等多种应用场景
该产品具有计算性能高、存储容量大、扩展性强和可靠性高等特点,易于管理和部署,可应用于深度学习模型训练、深度学习推理、高性能计算、数据分析等多种应用场景。
H3C UniServer R5500 G5支持全新的多实例GPU特性,可将单颗GPU最多分割成7个GPU实例,每个GPU实例可运行不同应用,极大提升了GPU的资源利用率。
H3C UniServer R5300 G3是面向人工智能和高性能计算领域自主研发的全新一代GPU服务器,可以加速深度学习模型建造,以极快速度分析数据并导出有价值信息。