TokenJuice 压缩

个人 AI 助手会读取邮件、日历、网页、代码、会议转录和长期笔记。原始工具输出通常很长，直接塞进模型上下文既贵又慢，也容易稀释真正重要的信息。TokenJuice 的目标是在进入模型前压缩冗余信息，让大规模个人数据检索更可控。

它解决的问题

压缩不是简单截断。理想状态下，系统应保留实体、时间、决策、待办、来源和异常，同时丢掉重复格式、噪声字段和低价值内容。这样模型拿到的是更接近“任务相关上下文”的材料。

TokenJuice 位于工具结果进入模型之前。典型流程是：工具或集成返回原始结果，TokenJuice 识别输出类型并匹配规则，然后把压缩后的内容交给模型或记忆构建流程。这样可以在昂贵模型参与前先去掉明显噪声。

工具调用结果
  ↓
TokenJuice：分类、匹配规则、压缩
  ↓
模型上下文 / Memory Tree 摘要流程

上游文档描述了三类规则来源：内置规则、用户规则和项目规则。内置规则覆盖常见命令和工具输出；用户规则适合个人全局偏好；项目规则适合放在仓库内，让团队共享同一套压缩约定。

这种设计的重点是可覆盖。不同项目对“噪声”和“关键信号”的判断不同，压缩规则不能只追求更短，还要保留能够解释结论的证据。

Memory Tree 需要长期吸收邮件、网页、聊天、代码和会议资料。如果每次同步都把原始内容完整交给模型，成本和延迟都会快速膨胀。TokenJuice 先控制输入体积和信噪比，后续摘要和记忆树才更容易保持可维护。

但压缩也会带来风险。日期、联系人、金额、权限、错误堆栈和会议结论如果被误删，最终记忆会变得干净但不可靠。因此调试压缩时，要同时看 token 下降和事实保真。

用户不必一开始调压缩参数。更重要的是观察结果是否漏掉关键事实，特别是会议结论、联系人、金额、日期和权限相关内容。如果压缩后的答案经常缺证据，应回到原始资料或缩小任务范围。

开发者可以把同一段工具输出保存为样本，对比压缩前后的关键事实是否保留。如果你为团队项目维护规则，应把规则放在项目级目录并在代码评审里讨论，避免某个本地规则只在一个人的机器上生效。