# AI的记忆问题解决了!最强记忆基准99%的准确率 Source: https://view.inews.qq.com/a/20260327A026E200?devid=2EE6E65B-1392-4043-B637-324DCFD0A1DE&qimei=2fba71fa46984923ea1fb74700001501a202&uid=100145992529 --- 问AI · ASMR技术如何革新AI记忆处理方式? 专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! AI的记忆能力正在迎来一次重大的飞跃。 Supermemory团队近期公布了一项研究成果,他们构建的一个实验性AI智能体流程,在LongMemEval基准测试中达到了接近99%的准确率。 团队表示这是智能体记忆前沿的新突破。智能体的记忆问题也许完全解决了(Agent memory might be completely solved now)。 这项技术摆脱了传统向量数据库和嵌入的限制,以一种全新的方式处理海量、复杂和随时间变化的信息。 未来高度个性化AI智能体即将到来。 ### AI记忆的新突破 长期记忆是AI发展的关键挑战之一。要让AI真正理解和运用信息,特别是处理那些跨越多个对话会话、包含矛盾信息、并随时间推移而更新的事实,需要一种超越传统方法的记忆系统。 LongMemEval基准测试正是为模拟这种真实世界的复杂性而设计的,它包含了超过115,000个token的对话历史,以及需要时间推理的问题。 大多数现有的记忆系统在面对这些挑战时,往往败在信息检索的准确性上,即使能够检索到信息,如果包含大量噪音,大型语言模型(LLM)也难以有效利用。 一个核心的难题在于,如何准确地提取必要信息,并判断一个已检索到的事实是否已被更新的事实所取代。 Supermemory团队的解决方案,名为ASMR(Agentic Search and Memory Retrieval),彻底改变了信息处理的思路。 这项技术不仅易于实现,更关键的是,它完全不需要向量数据库或嵌入,所有操作都可以在内存中完成,这为将其集成到各种系统中,甚至包括机器人,打开了方便之门。 ### 多智能体并行协作的机制 ASMR的核心在于其创新的数据摄取和检索管道。 该图片可能由AI生成 与传统的按块分割和嵌入用户会话不同,ASMR部署了一个由三个并行读取(观察)智能体组成的智能体编排器。 这些智能体基于Gemini 2.0 Flash模型,能够并发读取原始对话记录,并针对个人信息、偏好、事件、时间数据、更新内容以及助手信息这六个维度进行目标化知识提取。 提取出的结构化信息随后以原生格式存储,并与它们的来源会话进行映射。 当用户提出问题时,ASMR不依赖于查询向量数据库。 取而代之的是,它部署了三个并行搜索智能体,每个智能体都有特定的搜索侧重。 第一个智能体负责搜索直接事实和明确陈述;第二个智能体则关注相关的上下文、社交线索和潜在的含义;第三个智能体则致力于重构时间线和关系图谱。 编排器会汇总所有搜索智能体的发现,提取逐字会话摘录以进行详细验证,从而实现基于实际认知理解而非仅仅关键词或数学相似度的智能检索。 为了应对LongMemEval测试中多样化的提问类型,ASMR设计了两种不同的智能体回答流程。 第一种是“8-变体合集”。 在此流程中,检索到的上下文被路由到8个高度专业化的提示变体中进行并行处理。每个变体独立评估上下文并生成答案。只要其中8个不同的推理路径之一能够成功得出正确答案,该问题就被标记为正确。这种并行多重判断的方法,使得整体准确率达到了令人瞩目的98.60%。 第二种是“12-变体决策森林”。 在这个流程中,12个高度专业化的智能体(基于GPT-4o-mini)独立回答问题。随后,一个聚合器(Aggregator)LLM充当最终的裁判。聚合器通过多数投票、领域信任度和冲突解决机制,综合12个答案,得出一个单一的、权威性的结论。这一共识模型也实现了高达97.20%的准确率。 ### 关键洞察与未来展望 构建一个在生产级基准测试中达到近99%准确率的系统,为Supermemory团队带来了几个重要的工程洞察。 智能体检索优于向量搜索。 抛弃向量嵌入,转向主动搜索智能体,是实现突破的关键。智能体通过主动搜索上下文,有效避免了传统RAG在处理时间变化和信息更新时遇到的“语义相似性陷阱”。 并行处理至关重要。 将数据摄取和信息检索工作负载分配给多个专用智能体(3个读取,3个搜索),极大地提高了信息提取的速度和精度。同时,每个智能体都有其专门的侧重点,这有助于防止信息冲突。 专精化胜过泛化。 将上下文路由到专门的智能体(如“反驳者”或“细节提取者”)进行处理,其效果远远优于使用单个通用提示。 尽管这是一个实验性的沙盒环境,而非Supermemory的核心生产引擎,但团队计划将完整的代码开源,以供AI社区学习和构建。 他们正在积极探索将这些纯智能体检索技术应用于核心生产环境。 预计4月初,Supermemory将公开发布并开源这一新智能体记忆系统的所有细节。 AI的记忆问题,或许真的已经找到了解决之道? Supermemory这篇文章引起了不小的轰动。 许多网友表示太烧Token了吧、3并行摄入 + 12判断 = 慢+贵。 研究员表示,开源的3B中国模型技术上也是可以的。 ASMR真的解决了记忆问题吗? 网友们表示还有三大挑战: 如此多LLM调用的延迟挑战;规模到百万Token时仍需验证;数据质量(上游应该存储什么数据)仍是天花板。 参考资料: https://x.com/DhravyaShah/status/2035517012647272689 https://github.com/supermemoryai/supermemory