阿里推出全新推理模子:仅1/21参数媲美DeepSeek
发布时间:2025-03-06 10:21
快科技3月6日新闻,阿里Qwen团队正式宣布他们最新的研讨结果——QwQ-32B年夜言语模子。这是一款领有320亿参数的模子,其机能可与具有6710亿参数(此中370亿被激活)的DeepSeek-R1媲美。QwQ-32B在仅有DeepSeek-R1约1/21参数目的情形下,用强化进修实现了机能上的逾越。别的,阿里还在推理模子中集成了与Agent相干的才能,使其可能在应用东西的同时停止批评性思考,并依据情况反应调剂推理进程。QwQ-32B 在一系列基准测试中停止了评价,测试了数学推理、编程才能跟通用才能。此中,在测试数学才能的AIME24评测集上,以及评价代码才能的LiveCodeBeBET9登录官方入口nch中,千问QwQ-32B表示与DeepSeek-R1相称,远胜于o1-mini及雷同尺寸的R1 蒸馏模子。同时,在由Meta首席迷信家杨破昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵守才能IFEval评测欧洲杯买足球软件排行榜前十名推荐集、由加十大滚球体育平台州年夜学伯克利分校等提出的评价正确挪用函数或东西方面的BFCL测试中,千问QwQ-32B的得分均超出了DeepSeek- R1。现在,QwQ-32B已在Hugging Face跟ModelScope开源,各人也可经由过程Qwen Chat直接停止休会!【本文停止】如需转载请务必注明出处:快科技义务编纂:随心