梁文锋署名DeepSeek新论文发布,直指大模型“记忆”短板
发布时间:2026-01-13 13:35:24
中国文化网
(资料图)
新京报贝壳财经讯(记者罗亦丹)1月12日晚间,DeepSeek发布了一篇新论文,主题为《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》(直译为基于可扩展查找的条件记忆:大语言模型稀疏性的新维度),梁文锋再度出现在了作者名单最后。这篇论文为北京大学和DeepSeek共同完成。
新京报贝壳财经记者浏览发现,这篇论文的核心直指当前大语言模型存在的记忆力“短板”,提出了“条件记忆”这一概念。
为了实现“条件记忆”,DeepSeek提出的解决方案是一个名为Engram(直译为:记忆痕迹)的模块,它将语言建模任务拆解为“静态模式检索”与“动态组合推理”两大分支:前者负责实体、固定短语等确定性知识的快速调取,后者则交由Transformer架构专注完成复杂逻辑运算。
论文最后表示,“我们将条件记忆视为下一代稀疏模型不可或缺的建模原语。”
当前,有不少声音猜测DeepSeek的下一代模型将于春节前发布,复现2025年春节期间盛况。这一背景下,此篇论文或为模型的“庐山真面目”提供了方向。
编辑 杨娟娟
校对 杨利
编辑:
来源:贝壳财经
下一篇:最后一页
上一篇:国内期货主力合约涨跌不一 碳酸锂涨超8%
延伸阅读
a04-正文-广告01
- 梁文锋署名DeepSeek新论文发布,直指...
- 动物疫苗公司上市龙头是什么?名单请...
- 国内期货主力合约涨跌不一 碳酸锂涨超8%
- 孩童噎食急需就医 的哥连闯4个红灯送达
- 焦点观察:生意社:2026年1月12日中...
- 每日速递:珍宝岛:截至2026年1月10日...
- 今日快看!恒为科技:公司不涉及AI应...
- 今日热闻!国家金融监督管理总局保定...
- 聚焦:广州银行肇庆分行被罚135万元...
- 1100元现金遗失之后:一场跨越警银的...
- 【播资讯】博彦科技成交额创2025年7...
- 2026年1月12日金昌市金川天然农产品...
- 苏州稻香村成立食品工业公司 注册资...
- 快报:生意社:1月12日新疆蓝山屯河BD...
- 每日时讯!青岛崂山旅游集团成功获评A...
- 鸡蛋:现货上涨时点将至,盘面多头思...
- PTA概念股一览_A股PTA概念股名单详解...
- 仙坛股份:2025年12月份销售情况简报...
- 微速讯:华特气体:股东拟减持不超过...
- “国控杯”广西县超桂西赛区首轮:宾...
- 今日视点:聚丙烯上市公司十强(2025...
- 视频丨广西上林龙山自然保护区国家一...
- 2026年1月10日青海西宁仁杰粮油批发...
- 厦金大桥(厦门段)项目各项施工进展...
- 锋龙股份: 股票交易异常波动暨风险...
- AIGC算力层题材龙头有哪些?(2026/1...
- 旧金山联储行长戴利:美联储正处于“...
- 今日热门!江波龙:公司将持续深化与...
- 【财经分析】生猪期货五周年:熨平周...
- 盐城建军路拾贝丨城西影剧院∶从未散...



