微云公司官方网站-微云企业服务

产品服务

飞腾+L20推理一体机

国内首次实现国产CPU服务器和NVIDIA GPU的结合

飞腾5000C+L20国产机头解决方案，满足对国产化有要求的“体制内”客户合规需求。

强劲算力

Ø 2颗飞腾S5000C处理器，128个物理核心。

Ø 内存容量高达1T,支持16-RDIMMDDR5-4800内存。

Ø 支持最高400Gb网络高速互联，为GPU计算集群提供高密度、高性能节点平台。

极致扩展

Ø 最多扩展18个PCle5.0标准插槽，整机通信带宽翻倍。

Ø 4U空间可容纳12个双宽GPU卡加速卡，提供强大的训练应用性能。

Ø 最多支持50个2.5寸SAS/SATA硬盘或24个3.5寸SAS/SATA硬盘，最高支持12个NVMeSSD，提供丰富的存储扩展能力。

优化设计

Ø CPU和GPU解耦合设计，CPU和GPU独立演进，支持不同形态加速卡灵活配置。

Ø 支持5种CPU-GPU拓扑结构，灵活匹配客户不同场景，智能调配资源。

L20产品特性分析

L20能够更加轻量化（低功耗、开箱即用）提供高算效的算力支撑，并且具有多样化功能、广泛应用场景以及高性价比特性

ü L20 基于Ada架构，搭配48GB GDDR6显存，显存带宽为448GB/s，具备非常优化的性价比，不仅满足小参数规模的大模型预训练，大参数规模的大模型二次调优和推理，同时也完整保留了L40s的超级图像处理能力

ü L20能够面向大模型预训练、微调以及推理等场景，提供高算效、开箱即用的算力支撑

ü 在图像处理方面，L20保留了L40s的光线追踪核心和DisplayPort输出以及支持AV1的NVENC / NVDEC等功能

ü 部署L20的功耗较低，仅为SXM5 系统功耗的三分之一

案例1—DeepSeek-R1/V3 671B 满血版

4台8卡L20服务器（总计32GPU）在客户端私有化部署DeepSeek-R1-671B模型，提供更高的性能和处理能力适合企业级应用或需要处理超大规模数据任务，最终实测最大并发数16个；最大吞吐量660tokens/s。

案例2—某科研方案：DeepSeek-R1-蒸馏版 70B

单台4卡L20服务器即可实现在客户端私有化部署DeepSeek-R1-蒸馏版70B，最大并发数100个，最大吞吐量1910 tokens/秒。客户反响好。