跳到主要内容

TokenJuice 压缩

个人 AI 助手会读取邮件、日历、网页、代码、会议转录和长期笔记。原始工具输出通常很长,直接塞进模型上下文既贵又慢,也容易稀释真正重要的信息。TokenJuice 的目标是在进入模型前压缩冗余信息,让大规模个人数据检索更可控。

它解决的问题

压缩不是简单截断。理想状态下,系统应保留实体、时间、决策、待办、来源和异常,同时丢掉重复格式、噪声字段和低价值内容。这样模型拿到的是更接近“任务相关上下文”的材料。

它在流程里的位置

TokenJuice 位于工具结果进入模型之前。典型流程是:工具或集成返回原始结果,TokenJuice 识别输出类型并匹配规则,然后把压缩后的内容交给模型或记忆构建流程。这样可以在昂贵模型参与前先去掉明显噪声。

工具调用结果

TokenJuice:分类、匹配规则、压缩

模型上下文 / Memory Tree 摘要流程

规则层级

上游文档描述了三类规则来源:内置规则、用户规则和项目规则。内置规则覆盖常见命令和工具输出;用户规则适合个人全局偏好;项目规则适合放在仓库内,让团队共享同一套压缩约定。

这种设计的重点是可覆盖。不同项目对“噪声”和“关键信号”的判断不同,压缩规则不能只追求更短,还要保留能够解释结论的证据。

和 Memory Tree 的关系

Memory Tree 需要长期吸收邮件、网页、聊天、代码和会议资料。如果每次同步都把原始内容完整交给模型,成本和延迟都会快速膨胀。TokenJuice 先控制输入体积和信噪比,后续摘要和记忆树才更容易保持可维护。

但压缩也会带来风险。日期、联系人、金额、权限、错误堆栈和会议结论如果被误删,最终记忆会变得干净但不可靠。因此调试压缩时,要同时看 token 下降和事实保真。

实践建议

用户不必一开始调压缩参数。更重要的是观察结果是否漏掉关键事实,特别是会议结论、联系人、金额、日期和权限相关内容。如果压缩后的答案经常缺证据,应回到原始资料或缩小任务范围。

开发者可以把同一段工具输出保存为样本,对比压缩前后的关键事实是否保留。如果你为团队项目维护规则,应把规则放在项目级目录并在代码评审里讨论,避免某个本地规则只在一个人的机器上生效。

延伸阅读