在2025人工智能计算大会上,浪潮信息宣布,基于元脑SD200超节点AI服务器,DeepSeek R1大模型token生成速度仅需8.9毫秒,创造国内大模型最快token生成速度。最新发布的元脑HC1000超扩展AI服务器,实现每百万token成本首次击破1元。

随着Scaling Law持续推动模型能力跃升,以DeepSeek为代表的开源模型极大降低了创新门槛,加速智能体产业化的到来。智能体产业化的核心三要素是能力、速度和成本。其中,模型能力决定了智能体的应用上限,交互速度决定了智能体的商业价值,token成本决定了智能体的盈利能力。
浪潮信息对AI计算架构的持续创新,旨在解决智能体产业化面临的交互速度和token成本两大瓶颈,为多智能体协同与复杂任务推理的规模化落地,提供高速度、低成本的算力基础设施。
仅需8.9毫秒!元脑SD200引领token生成速度率先进入“10毫秒时代”
浪潮信息最新公布,基于元脑SD200超节点AI服务器运行DeepSeek R1大模型,单token生成速度低至8.9毫秒,带动国内AI服务器token生成速度率先进入“10毫秒时代”。
元脑SD200基于创新研发的多主机低延迟内存语义通信架构,在单机内实现了64路本土AI芯片的高速统一互连,单机可承载4万亿参数单体模型,或部署多个万亿参数模型组成的智能体应用,实现多模型协同执行复杂任务。
为实现极低的通信延迟,元脑SD200采用精简高效的三层协议栈,原生支持多种内存语义操作,避免冗余数据拷贝,将基础通信延迟降至百纳秒级,硬件化链路层重传与分布式预防式流控进一步适配高吞吐、低延迟的 AI 推理场景。
元脑HC1000,推理成本首次击破1元/每百万token
浪潮信息发布元脑HC1000超扩展AI服务器,基于全新开发的全对称DirectCom极速架构,无损超扩展设计聚合海量本土AI芯片、支持极大推理吞吐量,推理成本首次击破1元/每百万token,为智能体突破token成本瓶颈提供极致性能的创新算力系统。
元脑HC1000通过全面优化降本和软硬协同增效,创新16卡计算模组设计、单卡“计算-显存-互连”均衡设计,大幅降低单卡成本和每卡系统分摊成本。同时,全对称的系统拓扑设计支持超大规模无损扩展。据测算,元脑HC1000通过算网深度协同、全域无损技术,实现推理性能相比传统RoCE提升1.75倍,单卡模型算力利用率最高提升5.7倍。
未来,智能体带来的推理算力需求将呈现出指数级的爆发式增长。浪潮信息方面透露,将通过软硬件协同设计与深度优化,持续推动AI计算架构的创新与突破,不断实现token生成“提速降本”,积极促进大模型、智能体等人工智能技术与实体经济的深度融合,让人工智能成为千行百业的生产力和创新力。
浪潮服务器 浪潮机架式服务器 浪潮代理商 浪潮总代理 四川浪潮服务器代理商 成都浪潮服务器经销商 咨询电话:18380340551
NP3020G7是新一代入门级单路塔式服务器,专为远程办公环境、邮件以及打印服务等整体解决方案提供可靠的硬件基础
提供丰富的存储矩阵,最大程度满足扩展性及网络均衡性需求,同时在1U机型首次导入风冷、冷板液冷、浸没液冷多维散热方案,满足更多高密数据中心低PUE诉求。
2U双路存储优化服务器,采用创新三层存储架构,在高存储密度、超强算力、高网络带宽、智能管理等方面得到大幅提高,适用于大数据、CDN、超融合、分布式存储等业务场景。
在计算性能、存储性能及可扩展性方面均实现极致设计;支持前、后IO维护等多元部署方式,打破传统数据中心运维瓶颈;融合诸多业界先进技术,导入液冷、EVAC等高效散热模式
4U双路存储优化服务器,兼顾高存储容量、强大计算性能和极致IO扩展能力,非常适用于温/冷数据存储、视频存储、大数据 存储、云存储池搭建等应用场景。
是一款高端四路机架式服务器。产品以强劲的计算性能,模块化的灵活设计,卓越的扩展性,更优的可靠性和安全特性,为客户数据密集型关键业务而优化
NF5280R6保持一贯的高品质、高可靠的表现,该产品以强劲的计算性能及灵活百变的配置变换满足不同复杂工作负载
搭配高效算力及极致扩展实现整机性能最佳平衡,满足轻量化负载需求,适配云计算、虚拟化等主流计算场景,同时满足高密数据中心部署。
该产品具备多核心、高主频、大缓存、高扩展性的特性,使单处理器性能得到最大发挥,2U空间实现存储、扩展最大化设计
满足客户对高计算性能、大内存容量的要求,同时对密度及存储有一定要求的客户提供了很好的解决方案,适用于对服务器有高密要求的虚拟化、数据库、SAP HANA等应用场景。
具备多核心、高主频、大缓存的特性,1U高密空间提供极致计算性能,均衡网络及扩展特性,节省机房空间,适用于分布式全闪、裸金属云服务、视频编解码、网络游戏/数据处理等应用场景。
是具备卓越多元算力性能、极致弹性架构扩展的全新一代人工智能服务器,4U空间内部署8颗最高性能GPU,可根据应用场景实现拓扑切换
NF5688G7是基于浪潮信息全新一代AI超融合架构平台,面向超大规模数据中心的强劲性能、极致扩展人工智能服务器
具有高性能、高扩展性、高能效、多元兼容、生态开放等特点,适用于大模型训练、自然语言处理、语音识别、图像处理、推荐等典型的AI应用场景。
在降低机柜空间、能耗和部署成本的同时,还能提供灵活的存储方案,十分适用于容器、虚拟化以及其它计算密集型应用场景。