2月24日,星期一
02-24 12:16
DeepSeek 发布高效 MLA 解码内核

就在刚刚,DeepSeek 第一天的开源项目 FlashMLA 正式发布。

DeepSeek 官方在 X 平台发文称:

「很荣幸能分享 FlashMLA —— 我们专为 Hopper GPU 优化的高效 MLA 解码内核,不仅支持变长序列处理,现在已经投入生产使用。
✅ 支持 BF16
✅ 分页 KV 缓存(块大小 64)
⚡ 在 H800 上实现 3000 GB/s 的 ​……

[展开]
加载更多