据 Hugging Face 页面最新显示,阿里通义千问新一代基座模型 Qwen 3.5 相关的代码已提交并入 Transformers 库,这预示着该模型发布在即。
本次曝光的核心亮点:
- 技术架构升级:Qwen 3.5 将采用全新的混合注意力机制,并具备原生视觉理解能力。
- 开源阵容预测:
- 至少包含 2B 规模的密集模型 (Dense)。
- 35B-A3B 规模的混合专家模型 (MoE)。
行业动态:
此前亦有消息指出,包括 DeepSeek v4 和 Qwen 3.5 在内的多款国产大模型均计划于近期集中发布,值得开发者密切关注。