1月13日,星期二
12 小时前
DeepSeek 发布全新记忆架构

梁文锋署名新论文曝光:DeepSeek V4 或引入全新记忆架构

今日凌晨,DeepSeek 开源全新架构模块「Engram」,并同步发布技术论文,署名作者中再次出现梁文锋。#DeepSeek发布梁文锋署名论文#

据悉,Engram 模块通过引入可扩展的查找式记忆结构,为大模型提供了区别于传统 Transformer 与 MoE 的全新稀……全文: http://m.weibo.cn/1642720480/5254697684305976 ​……

[展开]
加载更多