阿里上线 Qwen3.6-Max-Preview 预览版:智能体编程能力大幅提升

阿里发布 Qwen3.6-Max-Preview 预览版,旗舰模型聚焦智能体编程与世界知识能力的迭代。

核心提升

相比 Qwen3.6-Plus,预览版在智能体编程方面取得显著提升:SciCode +10.8、SkillsBench +9.9、NL2Repo +5.0、Terminal-Bench 2.0 +3.8。在六项编程基准上登顶首位:SWE-bench Pro、Terminal-Bench 2.0、SkillsBench、QwenClawBench、QwenWebBench 和 SciCode。

评测对比

世界知识与指令遵循

世界知识同步增强,SuperGPQA +2.3,QwenChineseBench +5.3。指令遵循也更优,ToolcallFormatIFBench +2.8。在 Artificial Analysis 更新的大模型榜单中,Qwen3.6-Max-Preview 性能超过 GLM5.1、MiniMax-M2.7 等模型,登顶最佳国产模型。

Artificial Analysis 排行榜

API 接入

Qwen3.6-Max-Preview 已接入 Qwen Studio 及阿里云百炼 API(模型名称:qwen3.6-max-preview),支持 preserve_thinking 功能(保留所有前序轮次的思维内容,推荐用于智能体任务),全面兼容 OpenAI 规范的 chat completions 和 responses API,以及 Anthropic 的 API 接口。作为预览版,模型仍在积极迭代中。

来源:千问大模型公众号

相关推荐