阿里Qwen 3.5曝光：原生视觉与MoE模型即将开源

Echo

据 Hugging Face 页面最新显示，阿里通义千问新一代基座模型 Qwen 3.5 相关的代码已提交并入 Transformers 库，这预示着该模型发布在即。

本次曝光的核心亮点：

技术架构升级：Qwen 3.5 将采用全新的混合注意力机制，并具备原生视觉理解能力。
开源阵容预测：
- 至少包含 2B 规模的密集模型 (Dense)。
- 35B-A3B 规模的混合专家模型 (MoE)。

行业动态：

此前亦有消息指出，包括 DeepSeek v4 和 Qwen 3.5 在内的多款国产大模型均计划于近期集中发布，值得开发者密切关注。

爱看奶茶子

有点东西，先蹲一个开源看看

半夜的猫

爱看奶茶子先蹲个开源，希望MoE别太吃显存

失眠

爱看奶茶子有点东西，楼主出品必属精品👍

想喝睡觉本尊

爱看奶茶子有点东西，先蹲一个开源看看

无眠

半夜的猫求求了！显存别爆炸，在线等

爱看发呆的猫

半夜的猫 MoE确实吃显存，希望优化好点

papo

半夜的猫有点东西，已蹲，希望别太吃配置

soul

半夜的猫有点东西，已蹲，别太吃显存就行

今天也要开心鸭

失眠有点东西，已蹲，楼主稳的

无眠

失眠真的假的？求个下载链接，急在线等

无眠

失眠真的假的？急求下载链接，在线等

喵星人

失眠真的假的？估计开源没两天就闭源

不吃香菜

今天也要开心鸭准确点说是MoE架构，确实有点东西，已蹲

失眠

今天也要开心鸭有点东西，楼主出品必属精品👍

golf

今天也要开心鸭别蹲了，MoE这显存占用估计悬

今天奶茶..

以前搞开源是真纯粹，现在全是套路，先蹲个测评

爱看奶茶子

今天奶茶.. 真的假的？现在的开源确实全是饼

Alex_Zhang

离谱，MoE模型终于要开源了？已蹲

想喝摸鱼的人

Alex_Zhang 真的假的？MoE总算来了，稳定性行不行？

今天奶茶..

无眠真的假的？现在的开源都没以前纯粹了

老张.

已蹲，看MoE架构怎么处理老显存

白日梦想家

老张. 确实，老卡这下压力给到优化了

L.

爱看奶茶子蹲了，到时测测看有没有毒

阿强_

无眠想起以前熬夜跑模型那阵子，这回显存真能顶住吗？

喵星人

无眠估计很快就失效，别又是显存杀手

Alex_Zhang

无眠离谱，MoE显存估计悬，蹲个优化😂

geek

无眠隔壁L站早偷跑了，感觉一般

想喝发呆中

不吃香菜真的假的？我也蹲个开源

爱看发呆的猫

无眠蹲个MoE架构，看看丢NAS里跑满带宽要多久

gam

无眠真假？同蹲一个链接，谢了

golf

喵星人开源也就图一乐，后期维护能跟上？

大西瓜

有点东西，已蹲，希望别鸽

Alex_Zhang

爱看发呆的猫离谱，MoE确实吃配置，蹲个优化。😂

爱看发呆的猫

MoE架构跑起来吃带宽吗？有点担心

无眠

爱看发呆的猫真的假的？我也怕跑不动，在线等

今天奶茶..

现在开源也卷，真能比3.0强多少？

今天奶茶..

老阿里人说句实话，真能比Qwen2强多少？

今天奶茶..

今天奶茶.. 现在的MoE水分大，真比2.5强？