广告
您当前的位置: 首页 >  排行 > 内容

每秒110万个token!微软MSFT.US和英伟达NVDA.US联手刷

时间:2026-02-12 15:54  来源:证券之星  作者:许一诺   阅读量:6246   

联手刷新AI推理纪录)

智通财经APP获悉,微软宣布,其Azure ND GB300v6虚拟机在Meta的Llama270B模型上实现了每秒推理速度达110万token的行业新纪录。据悉,Azure ND GB300虚拟机采用英伟达(NVDA.US)的Blackwell Ultra GPU,具体为NVIDIA GB300NVL72系统,配置72个NVIDIA Blackwell Ultra GPU和36个NVIDIA Grace CPU,采用单机架构设计。这款虚拟机专为推理工作负载优化,具有50%的GPU内存提升和16%的热设计功率(TDP)提高。

微软首席执行官萨提亚?纳德拉在社交媒体上表示:“这一成就是我们与英伟达长期合作和在生产规模运行人工智能方面专业知识的结晶。”

资料显示,为了验证性能提升,微软在一个NVIDIA GB300NVL72域下的18台ND GB300v6虚拟机上运行了Llama270B模型,使用NVIDIA TensorRT-LLM作为推理引擎。微软表示:“一个NVL72机架的Azure ND GB300v6实现了总计110万个token/秒的推理速度。” 这一新记录超越了微软之前在NVIDIA GB200NVL72机架上实现的86.5万个token/秒的成绩。

对此,Signal65的实验室副总裁拉斯?费洛斯指出:“这一里程碑不仅突破了每秒百万token的障碍,还在一个能够满足现代企业动态使用和数据治理需求的平台上实现。” 他补充称,Azure ND GB300相较于上一代NVIDIA GB200在推理性能上提升了27%,而仅增加了17%的功率规格。

声明:免责声明:此文内容为本网站转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。

推荐阅读
  • 突发!停牌!“世界毯王”,筹划控制权变更! 2026-02-12 15:00
  • 两家A股上市公司的真爱集团,正在筹划重要事项。 11月4日,真爱美家收到控股股东真爱集团
  • 春节放假方案公布,9天假期带动机票搜索量走高 2026-02-12 14:14
  • 今天,国务院办公厅发布关于2026年部分节假日安排的通知。2026年春节假期将从2026年
  • 在哈拉湖畔回应自然之约:奇瑞威麟皮卡获授德令哈生态 2026-02-12 14:09
  • 近日,在青海省德令哈市团结峰巍峨守护下的哈拉湖畔,一场意义深远的授牌仪式于苍茫天地间举行。
    广告