
开yun体育网 作家|江宇 剪辑|冰倩 智东西3月20日报谈,本日,阿里千问最新旗舰模子预览版Qwen3.5-Max-Preview崇拜亮相,并登上公共大模子评测平台LMArena。在最新榜单中,该模子拿下1464分,插足第一梯队,同期带动阿里千问置身公共大模子践诺室前五、国内第一。 在强调模子基础才调对比的without style control评测条款下,其举座性能以1470分的收成,强势插足公共前哨,名次公共第六、国内第一。 从Arena Expert内行榜单来看,该模子位列第十,分数

开yun体育网
作家|江宇
剪辑|冰倩
智东西3月20日报谈,本日,阿里千问最新旗舰模子预览版Qwen3.5-Max-Preview崇拜亮相,并登上公共大模子评测平台LMArena。在最新榜单中,该模子拿下1464分,插足第一梯队,同期带动阿里千问置身公共大模子践诺室前五、国内第一。

在强调模子基础才调对比的without style control评测条款下,其举座性能以1470分的收成,强势插足公共前哨,名次公共第六、国内第一。

从Arena Expert内行榜单来看,该模子位列第十,分数为1498,排在GPT-5.4、Claude Opus 4.5系列、Claude Sonnet 4.6以及Gemini 3 pro等模子之后,但依然进步GPT-5.2-chat-latest、Claude Sonnet 4.5(thinking版块)以及Gemini 3 Flash等模子,与头部模子酿成贴身竞争。

从分项才调领会来看,Qwen3.5-Max-Preview在数学和文本任务上均插足前哨。其数学才调插足公共前五,内行级文本才调插足前十。
从与前代模子Qwen3-Max与Qwen2.5-Max的对比数据来看,这一版块的提高在多个高频文本与推理场景中。
Qwen3.5-Max-Preview在创意写稿任务上提高57分,数学才调提高49分,文娱、体育与媒体类任务提高48分,举座文本才调提高45分,同期在写稿、文体与讲话干系任务中相同提高45分。举座才调呈现出较为平衡的提高。

从Qwen3-Max的参数边界揣测,Qwen3.5-Max很可能是阿里现时参数边界最大的模子,且或者率仍为闭源旗舰模子。
本年以来,阿里已连接开源发布Qwen3.5系列模子,遮掩从0.8B到397B不同边界,共8款不同尺寸,有较完好的开源梯度。其中,Qwen3.5-Plus收受约3970亿总参数、170亿激活参数的结构,在同尺寸模子中领会较为隆起。
结语:第一轮收成落地,Qwen3.5-Max恭候郑再版考证
模子层的打破正成为阿里AI转型的第一张王牌。
Qwen3.5-Max-Preview依然先给出了第一轮收成单开yun体育网,但这一版块仍处于预览阶段。接下来,跟着郑再版块发布,其才调领会和领略性是否进一步提高,是这款旗舰模子真确要恢复的问题。