动态摘要
据知情人士透露,英伟达(NVIDIA)正计划推出一款专为高性能AI推理设计的全新处理器系统,旨在提升AI模型响应用户提问的速度与效率。该产品预计将在下个月举办的 GTC 2024 开发者大会上正式亮相。
核心亮点
- 定制化合作:英伟达正在设计一套全新的推理计算系统,OpenAI 已达成协议成为该系列处理器的主要客户之一。
- 技术整合:新平台预计将整合由 AI 芯片初创公司 Groq 设计的相关技术,以强化实时推理能力。
- 行业竞争:随着谷歌、亚马逊相继自研芯片,英伟达此举旨在巩固其在推理计算领域的领导地位。
行业背景
推理计算(Inference)是 AI 模型处理用户请求并生成答案的关键环节。随着大模型应用普及,推理市场的竞争热度已逐渐超越单纯的模型训练环节。
标签:#英伟达 #OpenAI #AI芯片 #推理计算 #GTC2024