🪢 Langfuse:开源 LLM 工程平台
Langfuse 是一个开源 LLM 工程平台,帮助团队协同开发、监控、评估和调试 AI 应用。支持自主托管(数分钟部署),经过大规模生产验证。由 Y Combinator W23 孵化的开源项目,已成为 LLM 应用可观测性的首选工具。
📦 安装要求与过程
环境要求
- Python ≥ 3.8 或 Node.js ≥ 16
- Docker & Docker Compose(自主托管推荐)
- ClickHouse 数据库(Langfuse 核心依赖)
- 可选:Kubernetes(生产环境推荐)
快速安装(Docker Compose,5分钟)
git clone –depth=1 https://github.com/langfuse/langfuse.git
cd langfuse
# 启动(Docker Compose)
docker compose up
云端使用(无需部署)
访问 cloud.langfuse.com 注册账号,免费额度无需信用卡。创建项目后获取 API 密钥,即可开始使用。
✨ 核心功能
① LLM 应用可观测性(Tracing)
自动采集 LLM 调用链路,追踪检索、嵌入、智能体动作等所有相关逻辑。支持复杂日志和用户会话的检查与调试。可实时查看每次 LLM 调用的输入、输出、延迟和成本。
② Prompt 管理中心
集中管理、版本控制和协同迭代 Prompt。服务端和客户端强力缓存,迭代 Prompt 不增加应用延迟。支持 Prompt 变量、版本对比和一键回滚。
③ 评估体系(Evaluations)
支持 LLM-as-a-Judge、代码评估器、用户反馈收集、手动标注和自定义评估管道。是 LLM 应用开发工作流的关键环节,适配不同成熟度的团队需求。
④ 数据集与实验(Datasets)
构建测试集和基准,支持持续改进、部署前测试、结构化实验。与 LangChain、LlamaIndex 等框架无缝集成,支持批量评估和对比分析。
⑤ LLM Playground
在线测试和迭代 Prompt 与模型配置,缩短反馈循环、加速开发。从 Tracing 中直接跳转到 Playground 迭代坏结果,提升调试效率。
🚀 典型使用场景
场景一:生产级 LLM 应用监控
某 SaaS 产品集成 Langfuse Tracing,实时采集所有 LLM 调用。当用户反馈 AI 回复质量下降时,工程师通过 Langfuse 会话回放快速定位问题——发现是某个 Prompt 版本在特定输入下表现不佳。通过 Playground 快速迭代修复,15 分钟内完成从发现到修复的全流程。
场景二:Prompt 版本管理与 A/B 测试
AI 产品团队使用 Langfuse Prompt 管理功能,对不同用户群体展示不同版本的 Prompt,通过内置评估体系自动对比效果。所有 Prompt 变更都有版本记录,出现问题时一键回滚到上一个稳定版本,极大降低了迭代风险。
场景三:开源项目集成(LangChain + Langfuse)
开发者在 LangChain 应用中添加 Langfuse Callback Handler,两行代码即可自动采集所有 LLM 调用、Chain 执行和 Agent 决策链路。无需修改业务逻辑,所有 Tracing 数据自动上报至 Langfuse 平台。
from langfuse.langchain import CallbackHandler
handler = CallbackHandler()
chain.invoke(input, config={“callbacks”: [handler]})
💡 推荐理由
Langfuse 是目前开源 LLM 可观测性领域最成熟的解决方案。与 LangSmith(闭源)相比,Langfuse 完全开源、可自主托管,数据隐私完全可控。
其与主流框架的深度集成(LangChain、LlamaIndex、OpenAI SDK、LiteLLM 等)让接入成本降到最低——通常只需修改一行代码。对于需要构建生产级 AI 应用的团队,Langfuse 是不可或缺的工程基础设施。
亮点:支持 OpenTelemetry 标准,可与现有监控体系(Grafana、Datadog)无缝整合;YC W23 背景,社区活跃,截至 2026 年已拥有 30K+ Stars 和持续的月度提交。
🔌 集成生态(部分展示)
| 集成方式 | 支持语言 | 说明 |
|---|---|---|
| SDK | Python, JS/TS | 手动埋点,最大灵活性 |
| OpenAI 兼容 | Python, JS/TS | 直接替换 OpenAI SDK,自动采集 |
| LangChain | Python, JS/TS | 传入 Callback Handler 自动采集 |
| Vercel AI SDK | JS/TS | React/Next.js 应用 AI 可观测性 |
| LiteLLM | Python, JS/TS | 对接 100+ LLM(OpenAI/Claude/Ollama 等) |
