token优化 – YOHO AI

📌 项目简介

headroom —— AI 智能体的上下文压缩层

headroom 是一个专为 AI 智能体设计的上下文压缩工具，在工具输出、日志、文件和 RAG 片段到达 LLM 之前对其进行压缩，可实现 60-95% 的 Token 减少，同时保证输出答案的准确性。

项目支持以代码库、零代码代理、MCP 服务器三种形态接入，兼容 Claude Code、Codex、Cursor、Aider、Copilot CLI 等主流 AI 编程助手，本周在 GitHub 新增近 15,000 Stars，是 2026 年 6 月最热门的 AI 开源项目之一。

43.4K+

GitHub Stars

3,010+

Forks

60-95%

Token 节省率

14.9K

本周新增 Stars

3 种

接入形态

10+

兼容智能体

🛠️ 安装要求和过程

环境要求

Python：3.10 及以上版本（推荐 3.13）
Node.js：18+（如使用 TypeScript 版本）
可选：Docker、Apple GPU（MPS 加速）、Rust（SSL 拦截场景）

快速安装

# Python 全量安装（推荐）
pip install “headroom-ai[all]”

# Node.js / TypeScript 安装
npm install headroom-ai

# Docker 镜像
docker pull ghcr.io/chopratejas/headroom:latest

# pipx 安装（隔离环境，推荐）
pipx install –python python3.13 “headroom-ai[all]”

可选功能插件

headroom 支持按需安装额外功能模块：

# 代理模式（零代码接入）
pip install “headroom-ai[proxy]”

# MCP 工具（接入 AI 智能体）
pip install “headroom-ai[mcp]”

# Kompress 模型（智能压缩）
pip install “headroom-ai[ml]”

# 代码压缩
pip install “headroom-ai[code]”

# 跨智能体记忆
pip install “headroom-ai[memory]”

# 图像压缩
pip install “headroom-ai[image]”

🌟 核心功能

1. 三形态接入，零代码也能用

headroom 提供三种接入方式，无论你是开发者还是普通用户都能快速上手：

代码库：Python/TypeScript 直接调用 compress(messages)，两行代码接入
零代码代理：运行 headroom proxy --port 8787，无需修改原有代码，所有兼容 OpenAI API 的客户端均可接入
MCP 服务器：支持 headroom_compress、headroom_retrieve、headroom_stats 三个 MCP 工具，一键安装到 Claude Code 等智能体

2. 智能压缩算法，60-95% Token 节省

headroom 自动识别内容类型，匹配最优压缩算法：

JSON 数据 → SmartCrusher（智能结构压缩）
代码文件 → CodeCompressor（语法感知压缩）
自然语言 → Kompress-base 模型（AI 压缩模型）
电子表格 → SmartCrusher（CSV/XLSX 节省 37-48%）
图像 → 专用图像压缩（40-90% 压缩率）

3. 可逆压缩（CCR），不丢失任何信息

headroom 的 Context-Compressed Retrieval (CCR) 机制将原始内容本地缓存，模型需要时可通过 headroom_retrieve 按需获取完整内容。压缩只是”摘要”，详细信息随时可取回。

4. 输出 Token 缩减，让 AI 少说废话

除了压缩输入，headroom 还能减少模型的冗余输出：

自动去除客套话、重复代码、常规步骤的深度思考
简洁度引导：自动在系统提示末尾追加简洁要求，不破坏提示缓存
算力路由：常规工具调用步骤降低模型思考等级，新问题/错误保留完整算力
支持 headroom learn --verbosity --apply 自动学习最优简洁度

5. 跨智能体共享记忆，自动学习优化

headroom 支持多智能体共享上下文存储，自动去重。更强大的是 headroom learn 功能：自动挖掘失败会话，将修正规则写入 CLAUDE.md / AGENTS.md，让智能体越用越聪明。

📊 压缩效果实测

场景	压缩前 Token	压缩后 Token	节省率
代码搜索（100 条结果）	17,765	1,408	92%
SRE 故障排查	65,694	5,118	92%
GitHub 问题分类	54,174	14,761	73%
代码库探索	78,502	41,254	47%
SQuAD v2（问答）	—	—	19%
BFCL（工具调用）	—	—	32%

基准测试显示，在 GSM8K 数学推理任务中，headroom 压缩后的准确率与基线完全一致（0.870）；在 TruthfulQA 事实性问答中，压缩后准确率甚至提升了 3%（0.530 → 0.560）。压缩不影响答案质量，某些场景下甚至有所提升。

🚀 典型使用场景

场景一：封装现有 AI 编程助手（30 秒上手）

如果你正在使用 Claude Code、Cursor 或 Aider，只需一条命令即可让 headroom 开始节省 Token：

# 封装 Claude Code（自动配置，无需手动操作）
headroom wrap claude

# 封装 Cursor（生成配置后粘贴一次即可）
headroom wrap cursor

# 封装 Aider（自动启动代理并打开工具）
headroom wrap aider

# 查看压缩效果
headroom perf

封装后，所有工具输出、文件内容、RAG 片段在送入 LLM 之前都会被自动压缩，你无需修改任何代码或配置。

场景二：作为 MCP 工具接入 AI 智能体

headroom 原生支持 MCP 协议，可作为工具被 AI 智能体直接调用：

# 安装到 Claude Code / OpenClaw 等支持 MCP 的智能体
headroom mcp install

# MCP 工具列表：
# – headroom_compress : 压缩上下文
# – headroom_retrieve : 取回原始内容（CCR）
# – headroom_stats : 查看压缩统计

对于 AI Agent 开发者，headroom 提供了一个开箱即用的 Token 优化方案，无需自己实现压缩算法。

场景三：在 Python/TypeScript 应用中直接调用

对于开发者，headroom 提供了简洁的 API，两行代码即可接入：

# Python
from headroom import compress
compressed = compress(messages, model=“gpt-4o”)

# TypeScript
import { compress } from “headroom-ai”;
const compressed = await compress(messages, { model });

# 接入 Anthropic SDK
from headroom import withHeadroom
client = withHeadroom(Anthropic())

# 接入 LangChain
from headroom import HeadroomChatModel
llm = HeadroomChatModel(your_llm)

headroom 还支持 Vercel AI SDK、LiteLLM、Agno 等主流框架，覆盖几乎所有 LLM 应用开发场景。

🤖 兼容智能体列表

Claude Code

✅ 完全支持

Codex

✅ 完全支持

Cursor

✅ 完全支持

Aider

✅ 完全支持

Copilot CLI

✅ 完全支持

OpenClaw

✅ 插件支持

OpenAI API

✅ 代理接入

Ollama

✅ 代理接入

💡 推荐理由

📥 下载地址

GitHub 仓库
PyPI 包
npm 包
官方文档
Kompress 模型
Discord 社区

本文由 WorkBuddy AI 自动生成 · 数据来源：GitHub API · 项目许可：Apache 2.0

标签： token优化

headroom：AI智能体上下文压缩层，减少60-95% Token消耗，本周GitHub新增近1.5万Stars

⚡ headroom：AI 智能体的上下文压缩层，减少 60-95% Token 消耗

📌 项目简介

headroom —— AI 智能体的上下文压缩层

🛠️ 安装要求和过程

环境要求

快速安装

可选功能插件

🌟 核心功能

1. 三形态接入，零代码也能用

2. 智能压缩算法，60-95% Token 节省

3. 可逆压缩（CCR），不丢失任何信息

4. 输出 Token 缩减，让 AI 少说废话

5. 跨智能体共享记忆，自动学习优化

📊 压缩效果实测

🚀 典型使用场景

场景一：封装现有 AI 编程助手（30 秒上手）

场景二：作为 MCP 工具接入 AI 智能体

场景三：在 Python/TypeScript 应用中直接调用

🤖 兼容智能体列表

💡 推荐理由

为什么你应该关注 headroom？

📥 下载地址