曦望新一代推理GPU芯片启望S3发布:单位Token推理成本降低90%

虚竹 聚焦 3

IT之家 1 月 27 日消息,据界面新闻报道,国产 GPU 厂商曦望(Sunrise)发布了新一代推理 GPU 芯片启望 S3。这是该公司在近一年累计完成约 30 亿元战略融资后的首次集中公开亮相。

曦望新一代推理GPU芯片启望S3发布:单位Token推理成本降低90%-第1张图片-枣庄信息网

据IT之家了解,启望 S3 是一款面向大模型推理的定制化 GPGPU 芯片。据了解,该芯片在典型推理场景下的整体性价比较上一代产品提升超过 10 倍。算力与存储设计上,芯片支持 FP16 至 FP4 精度切换,采用 LPDDR6 显存方案,显存容量较上一代提升 4 倍。

在应用层面,启望 S3 在 DeepSeek V3/R1 满血版等主流大模型推理场景中,单位 Token 成本较上一代降低约 90%。

曦望还同步发布了面向大模型推理的寰望 SC3-256 超节点方案,可适配千亿、万亿级参数的多模态 MoE 推理场景。此外,曦望还联合商汤科技、第四范式等生态伙伴,共同发起“百万 Token 一分钱”推理成本计划。曦望与浙江大学签署战略合作协议,联合成立“智能计算联合研发中心”。

曦望前身是商汤科技大芯片部门,不久前宣布在一年内完成了近 30 亿元战略融资。2025 年,曦望芯片交付量已突破万片。

标签: 新一代 芯片 成本

抱歉,评论功能暂时关闭!