开云2026世界杯中国官网 阿里通义千问3.7发布 置身环球前十五 国产模子排行第一
发布日期:2026-05-21 15:55 点击次数:84

【CNMO科技音信】5月20日,阿里云峰会负责开幕,阿里巴巴集团副总裁、阿里云智能CTO、阿里巴阿谀伙东说念主周靖东说念主在会上文书,通义千问Qwen3.7系列大模子负责发布。旗舰版Qwen3.7-Max以"万能智能体基座"为定位,在编程、推理、用具调用等才智上杀青了教训式升级,并在多项环球巨擘评测中刷新了国产模子的排行记录。

千问
从空洞排行来看,Qwen3.7-Max在Arena AI环球大模子文本总榜中位列第13位,超越了Gemini 3 Flash和GPT-5.5等海外模子,成为榜单前15名中惟一的国产模子。细分规模相同发达亮眼:数学才智环球第7,编程才智环球第10,群众级控制与软件及IT规模均位列第9。视觉方面,开云2026世界杯中国官网Qwen3.7-Plus预览版在视觉总榜排行第16,鞭策阿里履行室视觉才智跃升至环球第5。在学问和逻辑推理等主流评测中,Qwen3.7全面源流Kimi K2.6、智谱GLM5.1、DeepSeek V4 Pro、opus4.6-Max等国内及海外最新模子,稳居国内第一。
用具调用和编程才智是本次升级的重头戏。Qwen3.7的编程智能体支柱复杂工程开辟开云2026世界杯中国官网,在TerminalBench 2.0测试中得分69.7,超越DS-V4-ProMax的67.9分;在SWE-Pro得分60.6、SciCode得分53.5等编程基准中相同源流。更值得形势的是,在一项捏续35小时、卓绝1000次用具调用的长周期履行中,Qwen3.7保捏了融会的推理才智,杀青了端到端任务闭环。办公自动化方面,SpreadsheetBench-V1得分87.0,处于行业顶尖水平。