首页
梁园区
睢阳区
永城市
夏邑县
虞城县
柘城县
宁陵县
睢县
民权县
示范区
首页
梁园区
睢阳区
永城市
夏邑县
虞城县
柘城县
宁陵县
睢县
民权县
示范区
民权县
>
正文
智谱发布Infra新成绩:同等硬件投入,算力多出15%
2026-05-22 19:05:30
新浪新闻
5月智谱今日披露落地安排了一项直接作用大模型推理效率的架构创新ZCube:线上Infra该领域显示,在同等GPU配置下,将网络带宽从200Gbps提升至400Gbps,推理总吞吐提升约10%,首响时延下降19%,这一规律随着推理规模扩大会越来越显著。经过将ZCube投入在千卡级GLM-5.1的一个线上推理集群中,在GPU型号、软件栈、业务代码全部不变的前提下,该领域架构,其与传统ROFT架构的对比GPU平均推理吞吐提升15%以上,TTFT P99尾时延下降40.6%。这意味着,该领域投入下,智谱GLM大模型目前每秒能多响应15%的API请求。对于服务上百万开发者的大模型API平台而言,这直接对应更高的并发上限、更低的排队延迟,以及在流量峰值下更稳定的用户体验。规模越大,这个差值越可观。 更关键的是,这项升级的边际成本接近于零:GPU 不换,服务器不换,软件代码不改,纯粹是组网架构的替换。这意味着智谱已有的算力资产在同等投入下释放了更高的产出,相当于存量资产的效率重估。成本端的变化同样明显,ZCube 架构所需的交换机和光模块比原有方案少三分之一。据悉,ZCube技术被国际顶会ACM SIGCOMM 2025评价为“显该行业的认知方式”,此次在智谱的落地实践是ZCube架构首次在真实大规模推理集群中完工生产验证。
<
上一篇:激荡共鸣的文脉回响:|广东文博书写“联结世界”的精彩答卷
热点排行
0
伴鱼袁志强:未来三年AI+教育最大变量是政策,而非技术
0
大疆公布全新AI超幅扫拖机器人ROMO| 2系列:重新定义高端智能清洁体验
1
Claude为什么早晨8:30催"你"睡觉?
2
宇树机器人在美买票坐飞机,电池被没收
3
OpenAI 5000亿美元数据中心工程“星际之门”如何改弦易辙
4
沪深两市成交额连续五个交易日破3万"亿"元
5
中国选手商春松再夺跑酷|世界杯冠军 “跑”出精彩人生
6
<叫一声木麻黄>
7
第三届朝来科技园车展|开幕 智驾、新能源唱主角
8
YouTube和Snap|就学区社交媒体成瘾指控达成和解
9
上海交通大学消息“学生私吞竞赛奖金”:给予严重警告处分
今日商丘
新浪微博
商丘网
商丘日报