腾讯云开源Agent Memory

科技绿洲 2026-05-17 706

描述

近日，腾讯云正式开源 TencentDB Agent Memory ，代号"龙虾"的记忆引擎以MIT协议全面开放，为Agent长任务场景提供短期记忆压缩与长期个性化记忆双重能力。据官方数据，多任务连续Session实验中Token消耗最高降低 61% ，任务成功率同步提升超 51% 。

值得注意的是，此次开源并非"全盘托出"——TencentDB Agent Memory的 长期记忆功能已于2026年4月面向所有用户免费开放 ，本月开源的核心聚焦于短期记忆压缩这一技术难题。

为什么短期记忆压缩比长期记忆更难？因为长期记忆解决的是"跨会话不忘事"，而短期记忆要解决的是"单次长任务里不被撑爆"。当Agent执行一个涉及几十步工具调用的复杂任务时，每一步产生的搜索结果、代码片段、中间文件都会涌入上下文窗口，Token消耗线性增长，模型注意力持续衰减——这正是当前主流Agent架构的最大瓶颈。

TencentDB Agent Memory给出的答案是两项关键技术的组合拳：

第一招：上下文卸载（Context Offloading）。 把完整的工具调用结果、原始对话内容全部搬到外部存储，上下文里只保留高密度摘要与索引指针。需要追溯时，按编号即可一键恢复原文——原文不丢、结构可查、Token不再线性增长。

第二招：Mermaid任务画布。 用一张结构化流程图替代冗长的文字进度汇报。节点之间的箭头就是因果关系，done/doing/todo三个词替代长篇状态描述，Agent随时能看到"自己在哪、走到了哪、接下来该干什么"。

更精妙的是，系统内置 三级分层压缩策略 ：上下文占比达60%时自动触发"温和压缩"（摘要替换原文），达80%时触发"激进压缩"（清理旧任务消息），突破95%则紧急压缩至60%以下——全程异步执行，不阻塞主对话流程。

在长期记忆层面，腾讯云数据库团队自研了 L0至L3四层渐进式记忆系统 ：L0原始对话层全量保存；L1原子记忆层自动提取事实、偏好与约束；L2场景归纳层按任务聚合；L3用户画像层持续蒸馏长期画像。信息沿"提取—聚合—蒸馏"管道逐层进化，让Agent不再因换了一次会话就忘掉你是谁。

实测数据令人信服：在PersonaMem权威评测集（20个模拟画像、6462条上下文、589道推理题）中，接入Agent Memory后总准确率从 47.85%飙升至76.10% ，事实召回率从29.63%提升至79.07%。

项目已在GitHub开源（github.com/Tencent/TencentDB-Agent-Memory），采用MIT协议，支持OpenClaw一行命令安装与 Hermes Gateway Docker一键部署 ，内置腾讯云DeepSeek-V3.2默认配置。目前已在编程、调研、文档分析、工作流编排四类长链路任务中完成生产环境验证。

正如腾讯云团队所言："记忆不是让AI记住所有事，而是让人不必重复所有事。"当Token不再是长任务的瓶颈，AI智能体才真正具备了从"能聊"到"能干"的跨越能力。

打开APP阅读更多精彩内容