[TechWeb] 4月13日,LMARENA更新了最新的Open Meta Source Mockup Llama-4-Maverick的排名,从前第二名到第32位!它还证实了先前对开发人员的调查,即Meta为Llama 4 Big Model提供了Lmarena的“特殊版本”的排名。 4月6日,梅塔(Meta)发布了最新的大型Llama 4,其中包含三个版本的Scout,Maverick和Beamemoth。其中,Llama-4-Maverick在Lmarena发行的Chatbot Arena LLM中排名第二,仅次于Gemini 2.5 Pro。但是,随着开发人员使用Llama 4模型资源的开放版本,Llama 4声誉拒绝了急剧下降。一些开发人员发现,Meta在LMARENA中提供的Llama 4版本与提交给Komunity的开放资源版本不同,因此要求Meta欺骗排名。 4月8日,聊天机器人竞技场正式发表了一篇文章,证实了上面的问题,称公众是元的给予的em“特殊版本”,并考虑更新排名。根据聊天机器人竞技场的官方新闻,梅塔(Meta)首次提交了Llama-4-Maverick-03-26-实验LMARENA是CATH优化的实验版本,该版本第二次排名。修改模型是相同的Llama-4-Maverick-17b-128e-Instruct,它是对激活参数和128 MOE专家的17B模型的很好调整。 Currently, the open resource version of the same Llama-4-Maverick-17B-128e-Instruct rank 32th in LMARENA, less than Gemini 2.5 Pro (1), GPT4O (2), DeepSeek-V3-0324 (5), DeepSeek-R1 (7), QWEN2.5-MAMX (11), and even Nvidia's's LLAMA-3.3-纽马特朗 - 苏珀-49b-v1(17)基于上一代的Llama 3.3。