模型概览
Sarvam AI 正式宣布开源其自主研发的 Sarvam 30B 和 Sarvam 105B 推理模型。这两款模型均采用全流程自主训练,涵盖了从预训练、有监督微调(SFT)到强化学习(RLH)的完整阶段。
核心亮点
- 高性能推理能力:Sarvam 105B 在数学推理、编程逻辑及智能体(Agent)任务中表现优异,具备全球竞争力。
- 实时部署优化:Sarvam 30B 专门针对实时应用场景进行了性能优化,在实际对话交互中响应迅速。
- 本土化优势:在印度语言基准测试中,这两款模型均取得了最先进(SOTA)的结果,性能甚至超越了参数量更大的通用模型。
- 全本土训练:模型训练完全在印度境内完成,由 IndiaAI 项目提供核心计算资源支持。
技术资源
—
标签:#SarvamAI #开源模型 #大语言模型 #推理模型 #人工智能