阿里千问发布 Qwen3.6-Plus,编程能力接近 Claude Opus 4.5

4 月 2 日,阿里千问发布新一代大语言模型 Qwen3.6-Plus。这是千问 3.6 系列的首款模型,编程能力接近 Claude Opus 4.5,在 SWE-bench 等权威评测中超越了参数量 2-3 倍的 GLM-5 和 Kimi-K2.5。

1775113058533336243-5f89da684f7f4942

编程能力全面跃升

千问 3.6 在 SWE-bench 系列真实编程任务、Terminal-Bench2.0 终端编程测试、NL2Repo 长程编程任务,以及 Claw-Eval、QwenClawBench 等 Agent 能力评测中,表现可匹敌 Claude Opus 4.5。

在实测场景中,千问 3.6 能自主拆解任务、规划路径、测试修改直至任务完成。前端网页开发、仓库级复杂任务等场景下,表现出工程级别的代码修复和终端操作能力。

这种能力让"代理式编程"(Agentic Coding)从概念走向可用——普通人用一句话就能调动模型完成过去需要专业程序员数小时乃至数天才能完成的复杂编程任务。

原生多模态与智能体能力

千问 3.6 基于原生多模态数据训练,具备更敏锐的感知和推理能力。支持 100 万 token 上下文窗口,并针对 OpenClaw、Qwen Code、Claude Code、Kilo Code、Cline、OpenCode 等主流 Agent 框架做了优化。

多模态能力打开了视觉智能体编程的新空间:模型可以基于界面截图、设计稿或自然语言描述,完成前端页面生成、代码补全和交互修改,打通了"看懂界面→生成代码→调用工具修改"的完整链路。

定价与可用性

Qwen3.6-Plus 已上架阿里云百炼,每百万 token 输入最低 2 元。同时已登陆悟空、千问 APP 等阿里 AI 应用平台。开发者和个人用户均可直接体验。

后续规划

千问 3.6 系列后续还将开源其他尺寸模型,性能更强的旗舰模型 Qwen3.6-Max 也将于近期发布。

来源:Qwen 官方博客、腾讯新闻

相关推荐