3月06日,星期四
03-06 11:18
阿里开源推理模型 QwQ-32B

阿里开源最强推理模型 QwQ-32B,看齐 DeepSeek-R1,科学推理接近研究生水平。

阿里开源 QwQ-32B,再一次证明强化学习是属于未来的技术路线。@APPSO

QwQ-32B 拥有 320 亿个参数的模型,其性能可与拥有 6710 亿个参数的 DeepSeek-R1 相媲美。除了是阿里送出的开源力作,这一成果也凸显了 RL 的有效性 ​……

[展开]
加载更多