5月04日,星期六
2024-05-04 06:00
面壁开源新模型推理性能超 Llama3-70B

近日,面壁智能低调发布了领先的开源大模型「Eurux-8x22B」。

据官方介绍,该模型激活参数仅 39B,支持 64k 上下文,相比 Llama3 速度更快、可处理更长文本。

Eurux-8x22B 由 Mixtral-8x22B 对齐而来,在 UltraInteract 大规模、高质量对齐数据集上训练而成 ​……

[展开]
加载更多