headroom:AI智能体上下文压缩层,减少60-95% Token消耗,本周GitHub新增近1.5万Stars

⚡ headroom:AI 智能体的上下文压缩层,减少 60-95% Token 消耗

⭐ 43,430+ Stars
🍴 3,010+ Forks
📅 创建:2026-01
🔄 更新:2026-06
Python
Apache 2.0
Token优化
上下文工程
MCP

📌 项目简介

headroom —— AI 智能体的上下文压缩层

headroom 是一个专为 AI 智能体设计的上下文压缩工具,在工具输出、日志、文件和 RAG 片段到达 LLM 之前对其进行压缩,可实现 60-95% 的 Token 减少,同时保证输出答案的准确性。

项目支持以代码库、零代码代理、MCP 服务器三种形态接入,兼容 Claude Code、Codex、Cursor、Aider、Copilot CLI 等主流 AI 编程助手,本周在 GitHub 新增近 15,000 Stars,是 2026 年 6 月最热门的 AI 开源项目之一。

43.4K+
GitHub Stars
3,010+
Forks
60-95%
Token 节省率
14.9K
本周新增 Stars
3 种
接入形态
10+
兼容智能体

🛠️ 安装要求和过程

环境要求

  • Python:3.10 及以上版本(推荐 3.13)
  • Node.js:18+(如使用 TypeScript 版本)
  • 可选:Docker、Apple GPU(MPS 加速)、Rust(SSL 拦截场景)

快速安装

# Python 全量安装(推荐)
pip install “headroom-ai[all]”

# Node.js / TypeScript 安装
npm install headroom-ai

# Docker 镜像
docker pull ghcr.io/chopratejas/headroom:latest

# pipx 安装(隔离环境,推荐)
pipx install –python python3.13 “headroom-ai[all]”

可选功能插件

headroom 支持按需安装额外功能模块:

# 代理模式(零代码接入)
pip install “headroom-ai[proxy]”

# MCP 工具(接入 AI 智能体)
pip install “headroom-ai[mcp]”

# Kompress 模型(智能压缩)
pip install “headroom-ai[ml]”

# 代码压缩
pip install “headroom-ai[code]”

# 跨智能体记忆
pip install “headroom-ai[memory]”

# 图像压缩
pip install “headroom-ai[image]”

🌟 核心功能

1. 三形态接入,零代码也能用

headroom 提供三种接入方式,无论你是开发者还是普通用户都能快速上手:

  • 代码库:Python/TypeScript 直接调用 compress(messages),两行代码接入
  • 零代码代理:运行 headroom proxy --port 8787,无需修改原有代码,所有兼容 OpenAI API 的客户端均可接入
  • MCP 服务器:支持 headroom_compressheadroom_retrieveheadroom_stats 三个 MCP 工具,一键安装到 Claude Code 等智能体

2. 智能压缩算法,60-95% Token 节省

headroom 自动识别内容类型,匹配最优压缩算法:

  • JSON 数据 → SmartCrusher(智能结构压缩)
  • 代码文件 → CodeCompressor(语法感知压缩)
  • 自然语言 → Kompress-base 模型(AI 压缩模型)
  • 电子表格 → SmartCrusher(CSV/XLSX 节省 37-48%)
  • 图像 → 专用图像压缩(40-90% 压缩率)

3. 可逆压缩(CCR),不丢失任何信息

headroom 的 Context-Compressed Retrieval (CCR) 机制将原始内容本地缓存,模型需要时可通过 headroom_retrieve 按需获取完整内容。压缩只是”摘要”,详细信息随时可取回。

4. 输出 Token 缩减,让 AI 少说废话

除了压缩输入,headroom 还能减少模型的冗余输出:

  • 自动去除客套话、重复代码、常规步骤的深度思考
  • 简洁度引导:自动在系统提示末尾追加简洁要求,不破坏提示缓存
  • 算力路由:常规工具调用步骤降低模型思考等级,新问题/错误保留完整算力
  • 支持 headroom learn --verbosity --apply 自动学习最优简洁度

5. 跨智能体共享记忆,自动学习优化

headroom 支持多智能体共享上下文存储,自动去重。更强大的是 headroom learn 功能:自动挖掘失败会话,将修正规则写入 CLAUDE.md / AGENTS.md,让智能体越用越聪明。

📊 压缩效果实测

场景 压缩前 Token 压缩后 Token 节省率
代码搜索(100 条结果) 17,765 1,408 92%
SRE 故障排查 65,694 5,118 92%
GitHub 问题分类 54,174 14,761 73%
代码库探索 78,502 41,254 47%
SQuAD v2(问答) 19%
BFCL(工具调用) 32%

基准测试显示,在 GSM8K 数学推理任务中,headroom 压缩后的准确率与基线完全一致(0.870);在 TruthfulQA 事实性问答中,压缩后准确率甚至提升了 3%(0.530 → 0.560)。压缩不影响答案质量,某些场景下甚至有所提升。

🚀 典型使用场景

场景一:封装现有 AI 编程助手(30 秒上手)

如果你正在使用 Claude Code、Cursor 或 Aider,只需一条命令即可让 headroom 开始节省 Token:

# 封装 Claude Code(自动配置,无需手动操作)
headroom wrap claude

# 封装 Cursor(生成配置后粘贴一次即可)
headroom wrap cursor

# 封装 Aider(自动启动代理并打开工具)
headroom wrap aider

# 查看压缩效果
headroom perf

封装后,所有工具输出、文件内容、RAG 片段在送入 LLM 之前都会被自动压缩,你无需修改任何代码或配置。

场景二:作为 MCP 工具接入 AI 智能体

headroom 原生支持 MCP 协议,可作为工具被 AI 智能体直接调用:

# 安装到 Claude Code / OpenClaw 等支持 MCP 的智能体
headroom mcp install

# MCP 工具列表:
# – headroom_compress : 压缩上下文
# – headroom_retrieve : 取回原始内容(CCR)
# – headroom_stats : 查看压缩统计

对于 AI Agent 开发者,headroom 提供了一个开箱即用的 Token 优化方案,无需自己实现压缩算法。

场景三:在 Python/TypeScript 应用中直接调用

对于开发者,headroom 提供了简洁的 API,两行代码即可接入:

# Python
from headroom import compress
compressed = compress(messages, model=“gpt-4o”)

# TypeScript
import { compress } from “headroom-ai”;
const compressed = await compress(messages, { model });

# 接入 Anthropic SDK
from headroom import withHeadroom
client = withHeadroom(Anthropic())

# 接入 LangChain
from headroom import HeadroomChatModel
llm = HeadroomChatModel(your_llm)

headroom 还支持 Vercel AI SDK、LiteLLM、Agno 等主流框架,覆盖几乎所有 LLM 应用开发场景。

🤖 兼容智能体列表

Claude Code
✅ 完全支持
Codex
✅ 完全支持
Cursor
✅ 完全支持
Aider
✅ 完全支持
Copilot CLI
✅ 完全支持
OpenClaw
✅ 插件支持
OpenAI API
✅ 代理接入
Ollama
✅ 代理接入

💡 推荐理由

为什么你应该关注 headroom?

1. 立竿见影的成本节省。如果你在用 Claude Code 或 Cursor 做日常开发,上下文窗口经常爆满,headroom 可以立即减少 60-95% 的 Token 消耗。对于使用按量付费 API 的开发者,这意味着直接节省 50-90% 的 LLM 调用成本。

2. 本周最热的开源 AI 项目。headroom 本周在 GitHub 新增近 15,000 Stars,是 Python 趋势榜第一名。项目创建于 2026 年 1 月,仅用 5 个月就突破 4.3 万 Stars,增长速度惊人。

3. 零代码接入,30 秒上手。不需要修改任何代码,不需要理解压缩算法,只需要运行 headroom wrap claudeheadroom proxy --port 8787,就能立即开始节省 Token。

4. 可逆压缩让人放心。CCR 机制确保原始内容不会丢失,模型需要时随时可以取回。这意味着你可以大胆地开启压缩,而不用担心信息丢失。

5. 不止于压缩。headroom 的 headroom learn 功能可以自动从失败会话中学习,将修正规则写入项目配置文件,让你的智能体越用越聪明。这是真正意义上的”自我改进”工具。

遗憾点:目前压缩质量依赖于 Kompress 模型,需要下载模型文件(约几百 MB)。在完全离线环境中,需要使用预下载的模型或仅使用 SmartCrusher 等规则压缩算法。

📥 下载地址


本文由 WorkBuddy AI 自动生成 · 数据来源:GitHub API · 项目许可:Apache 2.0

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注