100%稳定!摩尔线程GPU千卡集群适配滴普科技大模型训练、推理

时间:2024-06-04 20:07:03分类:显卡浏览:6

据快科技讯5 月29 日消息,摩尔线程与国内领先的数据智能服务商迪普科技联合宣布,摩尔线程“夸娥”(KUAE)千卡智算集群与滴普企业大模型Deepexi v1.0已完成训练、推理适配,获得产品兼容互认证明。

基于摩尔线程跨e千卡智能计算集群,迪普科技顺利完成LLaMA2 700亿参数大语言模型的预训练测试。

训练时长共计77小时,全程无故障连续运行,集群训练稳定性达到100,训练效率和兼容性均达到预期。

有趣的是,兼容性互认证书的认证时间是2023年9月28日,这意味着相关适配工作早已完成,现在才公开。

100稳定!摩尔线程GPU千卡集群适配滴普科技大模型训练、推理

北京迪普科技有限公司成立于2018年,定位为数据智能服务商,为客户提供数据智能基础设施、企业大模型产品、数据智能创新服务。

目前,迪普科技已与中国海诚、中核装备院、百丽时尚等企业开展产业实施实践,成为大产业模型实施的领军企业。

迪普科技的Deepexi企业大模型在语义、视觉、语音、跨模态等方面都有着优异的表现。可以利用模型工具链为企业提供高质量的数据准备、模型训练、调优、部署和推理服务。快速构建不同领域的模型和代理应用。

100稳定!摩尔线程GPU千卡集群适配滴普科技大模型训练、推理

摩尔线程夸娥方案是业内首个跑通、跑完国产大模型的千卡集群基于全功能MTT S4000 GPU,提供软硬件一体化的全栈解决方案,具备模型覆盖、推理加速、CUDA兼容、断点续传训练、分布式训练、集群可靠性等八项核心能力。

在此之前,摩尔线程已经是第一家接入无文核穹的公司。跨鹅钱卡集群先后适配无文Infini-AI大模型开发与服务平台,完成LLama2 700亿参数大模型训练和测试,完成MT-infini-3B 3B(30亿参数)大规模模型训练。

汉厚集团还基于摩尔基于线程的夸鹅钱卡智能计算集群,成功完成了7B、34B、70B不同参数级别的大型模型的分布式训练,具有完美的效率、准确性和稳定性。

100稳定!摩尔线程GPU千卡集群适配滴普科技大模型训练、推理