近日,腾讯云正式开源 TencentDB Agent Memory ,代号"龙虾"的记忆引擎以MIT协议全面开放,为Agent长任务场景提供短期记忆压缩与长期个性化记忆双重能力。据官方数据,多任务连续Session实验中Token消耗最高降低 61% ,任务成功率同步提升超 51% 。
值得注意的是,此次开源并非"全盘托出"——TencentDB Agent Memory的 长期记忆功能已于2026年4月面向所有用户免费开放 ,本月开源的核心聚焦于短期记忆压缩这一技术难题。
为什么短期记忆压缩比长期记忆更难?因为长期记忆解决的是"跨会话不忘事",而短期记忆要解决的是"单次长任务里不被撑爆"。当Agent执行一个涉及几十步工具调用的复杂任务时,每一步产生的搜索结果、代码片段、中间文件都会涌入上下文窗口,Token消耗线性增长,模型注意力持续衰减——这正是当前主流Agent架构的最大瓶颈。
TencentDB Agent Memory给出的答案是两项关键技术的组合拳:
第一招:上下文卸载(Context Offloading)。 把完整的工具调用结果、原始对话内容全部搬到外部存储,上下文里只保留高密度摘要与索引指针。需要追溯时,按编号即可一键恢复原文——原文不丢、结构可查、Token不再线性增长。
第二招:Mermaid任务画布。 用一张结构化流程图替代冗长的文字进度汇报。节点之间的箭头就是因果关系,done/doing/todo三个词替代长篇状态描述,Agent随时能看到"自己在哪、走到了哪、接下来该干什么"。
更精妙的是,系统内置 三级分层压缩策略 :上下文占比达60%时自动触发"温和压缩"(摘要替换原文),达80%时触发"激进压缩"(清理旧任务消息),突破95%则紧急压缩至60%以下——全程异步执行,不阻塞主对话流程。
在长期记忆层面,腾讯云数据库团队自研了 L0至L3四层渐进式记忆系统 :L0原始对话层全量保存;L1原子记忆层自动提取事实、偏好与约束;L2场景归纳层按任务聚合;L3用户画像层持续蒸馏长期画像。信息沿"提取—聚合—蒸馏"管道逐层进化,让Agent不再因换了一次会话就忘掉你是谁。
实测数据令人信服:在PersonaMem权威评测集(20个模拟画像、6462条上下文、589道推理题)中,接入Agent Memory后总准确率从 47.85%飙升至76.10% ,事实召回率从29.63%提升至79.07%。
项目已在GitHub开源(github.com/Tencent/TencentDB-Agent-Memory),采用MIT协议,支持OpenClaw一行命令安装与 Hermes Gateway Docker一键部署 ,内置腾讯云DeepSeek-V3.2默认配置。目前已在编程、调研、文档分析、工作流编排四类长链路任务中完成生产环境验证。
正如腾讯云团队所言:"记忆不是让AI记住所有事,而是让人不必重复所有事。"当Token不再是长任务的瓶颈,AI智能体才真正具备了从"能聊"到"能干"的跨越能力。
全部0条评论
快来发表一下你的评论吧 !