标签: Google Research

  • TimesFM:Google Research 开源时间序列基础预测模型,25.9K Stars 让时序预测变得简单

    TimesFM:Google Research 开源时间序列基础预测模型,25.9K Stars 让时序预测变得简单

    TimesFM:Google Research 开源时间序列基础预测模型,25.9K Stars 让时序预测变得简单

    Google Research Logo
    Google Research 官方博客

    项目简介

    TimesFM(Time Series Foundation Model)是由 Google Research 开发的预训练时间序列基础模型,专门用于时间序列预测任务。不同于传统需要针对每个数据集单独训练的预测模型,TimesFM 作为一个基础模型,经过大规模预训练后可以直接对未见过的时序数据进行零样本(Zero-shot)预测,就像大语言模型(LLM)处理文本一样革命性地简化了时序预测流程。

    该项目已在 Google 多款产品中落地:BigQuery ML(企业级 SQL 时序预测)、Google Sheets(表格预测功能)、Vertex AI Model Garden(Docker 化部署端点),是学术界与工业界共同认可的时序预测新范式。

    安装要求和过程

    环境要求

    • Python:3.9 及以上版本
    • 后端选择:PyTorch 或 Flax/JAX(二选一)
    • 硬件支持:CPU、GPU、TPU、Apple Silicon(M系列芯片)全平台兼容
    • 磁盘空间:模型约 200M 参数,下载后约 800MB

    快速安装步骤

    # 方式一:通过 PyPI 安装(推荐)
    # 安装 PyTorch 版本
    pip install timesfm[torch]
    
    # 安装 Flax 版本(推理速度更快)
    pip install timesfm[flax]
    
    # 需要协变量支持时(引入额外特征辅助预测)
    pip install timesfm[xreg]
    
    # 方式二:本地源码安装
    git clone https://github.com/google-research/timesfm.git
    cd timesfm
    pip install -e .[torch]  # 或 [flax] / [xreg]

    核心功能

    • ⚡ 长上下文时序预测:TimesFM 2.5 支持最长 16K 的时序上下文输入(2.0 版本仅 2048),可输出最长 1K 的预测 Horizon,适配绝大多数工业场景。
    • 📊 概率预测输出:除点预测外,还支持通过可选的 30M 分位数头输出 10%-90% 共 10 个分位数的连续概率预测,让预测结果包含不确定性信息,对风险敏感场景(金融、供应链)尤为重要。
    • 🔀 多后端支持:同时支持 PyTorch 和 Flax 两大深度学习框架后端,用户可按硬件环境自由选择;Flax 版本在 TPU 上推理速度显著提升。
    • 📈 协变量支持(XReg):通过 XReg 模块可引入额外协变量特征(如节假日标记、促销信息等),有效提升复杂业务场景的预测精度,是 2.5 版本重新引入的重要特性。
    • 🎯 灵活预测配置:支持输入归一化、翻转不变性、正数推断、分位数交叉修正等多种预测配置,用户可根据数据特性精细化调整,获得更可靠的预测结果。

    典型使用场景

    • 📦 企业需求预测:零售企业可利用 TimesFM 对商品销量进行多步预测,输入历史销售数据(支持 16K 长度),输出未来 1K 个时间点的销量预测及置信区间,辅助库存决策和供应链优化。相比传统 ARIMA/Prophet 方法,TimesFM 无需手动特征工程,且对新型商品的冷启动预测表现优异。
    • 📊 业务指标异常预警:运维团队可将服务器 CPU 使用率、API 响应延迟、用户活跃度等关键指标输入 TimesFM,预测未来趋势并提前发现异常苗头。结合分位数预测输出的不确定性区间,可以在指标偏离正常范围之前发出预警,实现从”被动响应”到”主动预防”的转变。
    • 💹 金融时间序列分析:量化分析师可使用 TimesFM 对股票价格、汇率、期货价格等金融时间序列进行建模预测。TimesFM 的零样本预测能力使其可以快速适配不同金融产品,而概率预测输出则为风险评估提供了量化依据。Google Research 在预训练数据中包含了 Wikimedia Pageviews 和 Google Trends 数据,使模型对网络流行趋势类时序具有更好的理解。

    推荐理由

    作为 Google Research 的官方开源项目,TimesFM 代表了时间序列预测从”传统统计方法”向”基础模型范式”的重大转变。我推荐它的理由有以下几点:

    首先,真正的零样本预测能力。传统预测方法(ARIMA、ETS、Prophet)需要针对每个时间序列单独拟合模型,数据量不足时效果很差。TimesFM 在包含千亿级时序数据点的预训练语料上训练,习得了时序数据的通用模式,面对全新数据集时无需微调即可预测,大大降低了使用门槛。

    其次,工业级可用性。TimesFM 已在 Google 自家的 BigQuery ML 和 Google Sheets 中作为生产功能提供服务,经过大规模真实场景验证。2.5 版本将参数量从 500M 压缩到 200M,在保持预测精度的同时大幅提升了推理效率,体现了 Google Research 对实用性的高度重视。

    最后,与 LLM 生态的完美类比。TimesFM 之于时间序列,犹如 GPT/BERT 之于自然语言。对于已经熟悉 LLM 应用的开发者,TimesFM 提供了一条将”基础模型革命”延伸到数值预测任务的清晰路径。随着 AI Agent 对工具调用和外部数据感知的需求日益增长,像 TimesFM 这样的专业基础模型将成为 Agent 工具链的重要一环。

    下载地址

    许可证:Apache-2.0(可自由用于商业和个人项目)