英伟达的解法,是在软件层面上将所需的两种能力“分而治之”,高强度的数学运算放在Vera Rubin上,对延迟极度敏感的token生成环节则交给Groq,这一解决方案将高价值交互应用的性能足足提升了35倍。
英伟达公司今日在圣何塞举行的GPU技术大会上宣布推出Dynamo 1.0,这是一个开源平台,英伟达将其定位为大规模AI部署的重要软件层,旨在推动新兴人工智能工厂趋势的发展。 这一发布旨在解决企业AI领域最棘手的问题之一:如何大规模高效运行日益复杂的生成式 ...
在人工智能浪潮席卷全球的当下,英伟达早已不是一家单纯的显卡公司。凭借对AI计算趋势的精准预判和 relentless 的技术迭代,这家芯片巨头正将自己重新定义为“AI基础设施的定义者”,其商业版图正从单一芯片销售向“算力工厂”和“Token经济运营商”全面跃迁。
在本周的 GPU 技术大会 (GTC) 上,Nvidia 的 Blackwell Ultra 以及即将推出的 Vera 和 Rubin CPU 和 GPU 成为了讨论的焦点。但是这次年度开发者盛会最重要的公告之一可能并非芯片,而是一个名为 Dynamo 的软件框架,它旨在解决大规模 AI 推理的挑战。 在 GTC 舞台上宣布的 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果