1月29日,星期三
01-29 11:15
阿里云发布新模型 Qwen2.5-Max

蛇年第一天,最先开卷的是阿里云。通义千问刚刚发布了新的模型 Qwen2.5-Max,是一个超大规模的 MoE 模型,预训练数据就超 20 万亿Tokens。

在多项主流评测中,Qwen2.5-Max 全面超越了目前最大的开源稠密模型 Llama-3.1-405B 以及 MoE 模型 DeepSeek V3,性能与 GPT-4o 和 Claude-3.5-Sonnet 不分伯仲 ​……

[展开]
加载更多