博客

  • Google I/O 2026:Agent时代正式开启,OpenAI最大对手回来了

    Google I/O 2026:从聊天机器人到数字分身

    过去几年Google I/O的主角,通常是某个模型、某个参数量、某个Benchmark。但今年不一样。整场两个多小时发布会,Google其实只反复讲了一件事:Agent。

    不是聊天机器人,不是”帮你回答问题”的AI,而是真正开始替用户持续执行任务的AI Agent。Google想做的,是把Gemini从一个App,彻底变成Google所有入口背后的操作系统。

    Google I/O 2026发布会
    Google I/O 2026全面押注AI Agent(图源:谷歌)

    Gemini Spark:你的24小时数字分身

    这次发布会上,Google几乎把整个产品体系全部Agent化了。最核心的新产品,是Gemini Spark。你可以把它理解成Google版”全天候数字分身”。它运行在Google Cloud虚拟机上,7×24小时在线。即便你关掉电脑、合上手机,它依然会在后台继续工作。

    Google现场演示了一个典型场景:用户正在组织社区派对,Spark会自动汇总邮件回复、统计每个人带什么东西、追踪谁还没确认、生成提醒邮件、同步Google Sheets,再自动做一份Google Slides宣传页,整个过程几乎不需要用户手动操作。

    Gemini Spark本质上正在把Agent从”问答工具”,变成”长期运行的执行系统”。过去的大模型,更像即时响应;现在的Agent,则开始拥有持续状态、任务记忆和跨应用执行能力。

    Gemini 3.5 Flash:把Agent成本打下来

    Agent最大的难点,从来都不只是能力,而是成本。因为Agent实在太烧Token了。Google披露的数据非常夸张:目前Google自家产品每月处理的Token,已经达到3200万亿个,同比增长7倍。

    于是,Gemini 3.5 Flash出现了。这可能是今年Google最关键的模型。因为它不再单纯强调”最强”,而是开始强调”最适合跑Agent”。Pichai现场直接算了一笔账:如果一家头部企业每天处理1万亿Token,把80%的工作负载从其它前沿模型迁移到Gemini 3.5 Flash,一年能省超过10亿美元。

    性能接近顶级前沿模型,输出速度快4倍,而成本只有同类模型的一半甚至更低。Google现在反复强调一句话:”你不需要再在质量和速度之间二选一。”因为Agent时代,比拼的已经不是一次回答,而是持续运行能力。

    Antigravity 2.0:93个Agent协作搭建操作系统

    如果说Flash负责”让Agent更便宜”,那Antigravity 2.0负责的,就是”让Agent真正开始干活”。它原本只是个AI Coding工具,现在Google直接把它升级成了多Agent协作平台。

    开发者可以同时调度多个Agent:一个写代码,一个生成设计素材,一个规划产品架构,一个测试漏洞,一个修Bug。Google现场甚至演示了一个极其夸张的案例:93个Agent并行协作,从零开始搭建一个可运行的操作系统。

    整个过程持续12小时,处理26亿Token,最终居然真的跑起来了,甚至还能运行Doom。而整个API成本不到1000美元。Google显然是在正面硬刚Claude Code和Codex。

    搜索彻底变了:从链接到执行结果

    Google这次还对搜索动了最大的一刀。Pichai说,这是Google搜索框25年来最大升级。因为搜索不再只是”搜答案”,而是开始”生成执行结果”。

    比如用户问:”黑洞如何影响时空?”以前搜索会给你十条蓝链,现在Google直接生成一个交互式可视化界面,你甚至可以拖动参数、实时观察变化。搜索开始变成实时生成式UI。

    Google还把Agent正式塞进搜索。用户未来可以创建Information Agent,让它24小时后台监控信息,比如跟踪股票、监控租房、盯球鞋发售、观察行业动态、追踪价格变化。Agent会自己搜、自己总结、自己更新。


    Google最恐怖的其实是生态

    但整场发布会真正最危险的地方,其实不是模型,而是Google的生态。因为OpenAI现在最强的,是模型能力;但Google最强的,是入口。

    搜索、Chrome、Android、YouTube、Gmail、Maps、Workspace……这些产品加起来,本身就是全球最大的互联网流量系统之一。而现在,Google正在把Gemini嵌入所有入口。

    这意味着,别人还在想办法”获取用户”,Google已经开始直接给几十亿用户发Agent。这是完全不同的战争维度。

    甚至连智能眼镜,Google也重新杀回来了。今年发布的Android XR眼镜,可以直接通过Gemini完成导航、下单、消息总结,用户甚至不用掏手机。

    Google正在试图让Gemini变成未来所有设备背后的默认智能层。搜索是入口,Chrome是入口,手机是入口,眼镜也是入口。Gemini则开始变成背后的统一大脑。

    AI行业开始进入”运营时代”

    今年Google I/O还有个特别明显的信号:AI行业正在从”模型竞赛”,进入”运营竞赛”。过去两年,行业核心是”谁更聪明”;现在开始变成谁更稳定、谁更便宜、谁更能规模化、谁更能真正接管工作流。

    Google今年资本支出预计高达1800亿~1900亿美元,第八代TPU开始拆成训练芯片和推理芯片。Google甚至公开强调:”我们要把最强AI,变成最便宜的AI。”这已经不是单纯的技术竞争,而是一次基础设施战争。


    过去几年,大家一直在讨论:AI到底什么时候能真正”替人做事”。Google这次给出的答案是:现在。而且它不准备只做一个聊天机器人。它想做的是,一个全天候运行、跨应用协作、持续执行任务、存在于所有入口里的超级Agent系统。

    Google迟到了。但现在,它终于开始全面开卷Agent。

  • Google DeepMind搞了个AI科研搭档,科学家要失业了?

    Google DeepMind搞了个”AI科研搭档”

    科学家做研究,最花时间的是啥?不是做实验,是”想假设”和”查文献”。一个靠谱的假设,往往要读几百篇论文、反复试错几个月甚至几年。Google DeepMind最近发布了一个叫Co-Scientist的多智能体系统,目标是让AI来干这件事。

    这个系统基于Gemini构建,但跟普通的聊天机器人不一样。它不是你问它答,而是真的在”做科研”——生成假设、跟自己”讨论”、再去文献里找证据验证,然后反复迭代,直到假设站得住脚。

    普通LLM的问题在于:它不确定时会瞎编,而且不会主动承认”这个结论有矛盾”。Co-Scientist的核心是,它能在多个专业智能体之间制造”争论”,让它们在讨论中发现逻辑漏洞,然后自己去文献里找证据修补。

    三个步骤,模拟科学家的思考过程

    Co-Scientist的运作分三个阶段:生成、讨论、验证。

    生成阶段,系统会根据你给的研究方向,产生一批可能的假设。这些假设不是随机生成的,而是基于已有的科学文献和数据库。

    讨论阶段最有意思。系统里有好几个”智能体”,每个扮演不同的角色——有的负责挑刺,有的负责找支持证据,有的负责检查逻辑一致性。它们会互相”吵架”,直到对某个假设达成一致意见。

    验证阶段,系统会去查文献,看看这个假设跟已知的研究是否矛盾,有没有实验数据支持。如果有矛盾,它会回过头去修正假设,然后重新走一遍流程。

    已经在用的场景

    Google已经在跟Google Cloud和Google Labs合作,让研究人员试用这个系统。目前的反馈是,它在”假设筛选”这个环节特别有用——人类科学家往往靠直觉和经验来判断一个假设值不值得深究,但直觉会出错,经验有盲区。Co-Scientist能把这些假设结构化地过一遍,帮人更快地找到值得深挖的方向。

    特别值得关注的是,Google正在把它应用到ALS(肌萎缩侧索硬化症)的疗法开发,还有衰老研究。这两个领域都有一个共同点:数据极其复杂,变量极多,人类研究者很难把所有线索串起来。AI的优势正好在这里——它能同时处理海量文献,发现人眼看不到的模式。

    下一步是跟实验自动化打通

    现在的Co-Scientist还停留在”纸上谈兵”阶段——它能生成和验证假设,但验证完了,还得人类去做实验。Google的下一步计划,是把这个系统跟实验自动化系统整合起来,让AI生成的假设能直接在实验室里被验证。

    如果这一步实现了,科研的效率提升会是数量级的。现在从一个假设到发表论文,往往要几年。如果假设生成、验证、实验、数据分析全都能由AI加速,可能几个月就能走完。

    当然,这里有个绕不开的问题:AI生成的假设,如果连人类都理解不了为啥它对,那还敢不敢照着做实验?这个问题,可能比技术本身更难回答。


  • Anthropic拿到300亿美元,估值冲破9000亿

    Anthropic拿到300亿美元,估值冲破9000亿

    今天AI圈被一条消息刷屏了——Anthropic正在完成一轮300亿美元的融资,估值超过9000亿美元。要知道,就在今年2月,Anthropic的估值还是3800亿美元。不到三个月,直接翻倍。

    这轮融资由红杉、Dragoneer、Greenoaks和Altimeter联合领投,预计本周内就能完成交割。如果按上限估值落地,Anthropic将首次超过OpenAI在2026年3月创下的8520亿美元估值,成为AI赛道新的估值王者。

    Anthropic的估值暴涨不是靠”讲故事”。他们刚刚披露,2026年第二季度营收预计达到109亿美元,相比第一季度的48亿美元增长了130%,而且首次实现季度运营盈利。投资者看中的不是概念,是真金白银的营收增长。

    钱从哪里来,花到哪里去

    你可能好奇,Anthropic哪来这么多钱烧?答案在SpaceX的IPO招股书里。Anthropic跟SpaceX签了一份算力合同,每月支付12.5亿美元,一直持续到2029年5月,总价值450亿美元。

    光是给SpaceX的算力费,一年就是150亿美元。加上训练模型、养团队、建数据中心,300亿美元其实撑不了太久。但投资者愿意买单,是因为他们相信Anthropic能在18个月内把年营收做到500亿美元以上。

    有意思的是,Anthropic还在跟微软谈,打算用微软定制的Maia 200 AI芯片来跑Claude。加上已经合作的英伟达、AWS Trainium、谷歌TPU、SpaceX算力,Anthropic成了行业里第一个实现多芯片供应商布局的前沿AI实验室。

    教皇也来站台

    今天还有一个挺有意思的新闻。教皇良十四世发布了一份关于AI的通谕《Magnifica Humanitas(卓越人性)》,发布仪式上站在他旁边的,是Anthropic的联合创始人Christopher Olah。

    这份通谕的核心是说”人工智能时代要保护人的尊严”。选在《新事(Rerum Novarum)》发布135周年的日子签署,故意把AI类比为”第二次工业革命”。梵蒂冈没有选谷歌或者OpenAI,而是跟Anthropic同台,这个信号挺明确的——在AI安全这件事上,梵蒂冈把Anthropic视为最可信的合作伙伴。

    OpenAI那边也没闲着

    这边Anthropic融资如火如荼,OpenAI也没闲着。他们已经准备向美国SEC提交保密的S-1文件,预计2026年第四季度或者2027年初正式上市。

    两大AI实验室,一个刚拿完钱、估值冲上云端,一个准备上市、接受公开市场检验。2026年的AI赛道,已经从”谁能做出更好的模型”变成了”谁能先把AI变成一门赚钱的生意”。

    从目前的财务数据看,Anthropic暂时领先半个身位。但OpenAI有微软背书、有GPT的生态粘性,上市之后的融资能力不容小觑。这场仗,才刚刚开始。


  • agent-skills:45.4k Stars!Google工程师开源的AI编码生产级技能库,让AI输出工业级代码

    agent-skills:45.4k Stars!Google工程师开源的AI编码生产级技能库,让AI输出工业级代码

    agent-skills

    你有没有遇到过这种情况:让AI帮你写代码,它确实写出来了,但一测就挂,还没测试、没文档、没安全检查——因为它总是走「最短路径」,能跑就行。

    Google Cloud AI总监、AngularJS联创Addy Osmani也发现了这个问题,于是他在2026年2月开源了 agent-skills——一个把高级工程师开发软件时的完整工作流、质量门禁和最佳实践封装成可复用技能的工具包,让AI代理在开发全流程中都能遵循与生产环境一致的标准。

    📊 项目数据

    GitHub Stars:45.4k+ | 开源协议:MIT | 维护者:Addy Osmani(Google) | 适用工具:Claude Code、Cursor、Gemini CLI、Windsurf、Copilot 等


    📌 项目简介

    agent-skills 是一个面向AI编程代理的生产级工程技能集合,将资深工程师在开发软件时遵循的工作流、质量门禁和最佳实践编码为可复用的技能模块,让AI代理不再「能跑就行」,而是输出符合生产级质量标准的代码。项目覆盖从需求定义、计划拆解、迭代开发、测试验证、代码审查到上线部署的完整开发生命周期,并预置了可自动触发的专项技能。


    ⚙️ 安装要求与过程

    环境要求

    • 支持任意AI编程代理(Claude Code、Cursor、Gemini CLI、Windsurf、Kiro、Copilot等)
    • 部分技能需要配合对应MCP服务使用(如Chrome DevTools MCP)
    • 无额外依赖,技能文件为纯Markdown格式

    快速安装(以Claude Code为例)

    方式一:从市场安装(推荐)

    # 添加市场源
    /plugin marketplace add addyosmani/agent-skills
    # 安装技能包
    /plugin install agent-skills@addy-agent-skills

    方式二:本地克隆安装

    git clone https://github.com/addyosmani/agent-skills.git
    claude –plugin-dir /path/to/agent-skills

    其他工具(Cursor、Gemini CLI、Windsurf等)详见项目 docs/ 目录下的对应配置指南。


    ✨ 核心功能

    1
    23个细分技能模块,覆盖开发全生命周期

    从需求定义(/spec)、计划拆解(/plan)、增量开发(/build)、测试驱动(/test)、代码审查(/review)到上线部署(/ship),每个阶段都有对应的技能工作流,AI必须按步骤执行,不能跳过。

    2
    反合理化机制,防止AI走捷径

    每个技能都内置「常见借口反驳表」——比如AI想说「我之后再补测试」,技能会直接反驳并强制要求先写测试。验证要求明确到必须提供证据(测试通过截图、构建输出等),不允许「看起来没问题」这种模糊判断。

    3
    自动触发 + 斜杠命令双模式

    设计API时自动激活 api-and-interface-design 技能,构建UI时自动激活 frontend-ui-engineering 技能;同时也支持手动输入 /spec、/plan、/build、/test 等7个斜杠命令精准触发对应技能。

    4
    预配置专家代理角色,多维度审查

    内置 code-reviewer(高级工程师视角)、test-engineer(QA专家视角)、security-auditor(安全工程师视角)三个专家代理角色,可在关键节点自动调用,对代码进行多维度审查。


    🚀 典型使用场景

    场景一:让AI严格按照TDD流程开发新功能

    输入 /test 激活测试驱动开发技能,AI会严格遵循「红→绿→重构」流程,先写失败测试,再写最小实现,最后重构;测试金字塔比例强制为 80% 单元测试 / 15% 集成测试 / 5% E2E测试,确保测试覆盖全面而不冗余。

    场景二:上线前全自动代码审查与安全加固

    输入 /review 触发代码审查技能,AI会按五轴审查法(正确性、可读性、安全性、性能、可维护性)逐文件审查,变更控制在约100行以内;同时自动激活 security-and-hardening 技能,对照 OWASP Top 10 逐项检查,不通过不许合并。


    💡 推荐理由

    我一直觉得现在的AI编程工具最大的问题不是「写不出代码」,而是「写出来的代码不经过生产级流程」——没有需求文档、没有测试、没有安全审查,直接给你一个能跑的版本就完事。agent-skills 的本质,就是把 Google 级别的工程成熟度「编译」成了AI可以理解和执行的技能工作流。

    最让我印象深刻的是它的「反合理化机制」——AI 想偷懒的时候,技能会直接「怼回去」,要求提供证据而不是口头保证。这比任何 Prompt 技巧都更有效,因为它是在流程层面强制质量,而不是靠 AI 的「自觉」。

    如果你在用 Claude Code、Cursor 或其他AI编程工具,这个项目值得认真配置一套——它会让你AI助手输出的代码质量提升一个维度。


    📥 下载地址

    🌐 官方网站:https://github.com/addyosmani/agent-skills

    📦 GitHub仓库:https://github.com/addyosmani/agent-skills

    📚 配置文档:https://github.com/addyosmani/agent-skills/tree/main/docs

    💬 技能市场:https://agentskill.work/zh/skills/addyosmani/agent-skills

    📄 开源协议:MIT License(可自由使用、修改和分发)


    💡 小编注:

    这个项目背后的理念其实很深刻——AI编程工具的能力上限不仅仅取决于模型本身,更取决于我们给它的「工程上下文」。agent-skills 做的,就是把这些上下文系统化、可复用化。值得一提的是,Addy Osmani 同时也是热门项目 addyosmani/superpowers(第30期已介绍)的作者,两个项目一脉相承,建议搭配使用,效果更佳。

  • Anthropic悄悄收购Stainless:AI工具链的暗战

    “加入Anthropic是自然决定,因为团队能在更早认可这项技术价值的公司体系内继续推进工作。”——Alex Rattray(Stainless创始人)

    一笔不太起眼的收购,暗藏大算盘

    5月19日,Anthropic宣布收购软件基础设施初创公司Stainless。交易金额没有正式公布,但业内消息称超过2.8亿欧元(约合22.18亿元人民币)。

    Stainless这家公司,名字听着像做不锈钢的,其实是搞开发者接口(Developer Interfaces)的。它最核心的能力,是能把API规格说明自动转换成可部署的工具,支持Python、TypeScript、Kotlin、Go、Java等多种编程语言。说白了,就是帮开发者省掉大量手动维护SDK(软件开发工具包)的时间。

    Anthropic收购Stainless
    Anthropic宣布收购Stainless

    为什么这笔收购让谷歌和OpenAI很不舒服?

    Stainless之前可不是Anthropic独占的。它的托管服务,OpenAI、谷歌这些重量级AI实验室都在用。现在收购一完成,这块能力就进了Anthropic的”自留地”,外面的竞争对手用不了了。

    更直接的是,Stainless已经确认关闭全部托管产品,包括那个知名的SDK自动生成工具。现有客户虽然还能继续用已经生成的代码库,但后续拿不到官方更新和技术支持了。

    对AI智能体(Agent)开发来说,SDK和接口适配是很关键的一环。Anthropic这一步,相当于把”连接层”能力提前锁定了。模型再强,如果开发工具链被对手卡住,生态扩展也会受限。反过来,Anthropic现在既能给自己的产品做更快的接口迭代,也能在外部软件协同上掌握更多主动权。

    AI工具链的竞争才刚刚开始

    这笔收购透露出一个信号:AI公司的竞争,已经从单纯的”模型能力”延伸到”开发工具生态”。谁能帮开发者更高效地构建AI应用,谁就能占据更有利的位置。

    Stainless的技术还有一个很实用的特点——当API发生变化时,它能自动更新代码。对需要频繁迭代的AI产品来说,这种自动化能力可以大幅降低维护成本,加快集成速度。


    Anthropic最近动作不少。前有卡帕西加盟,后有Stainless收购,看得出来是在为下一阶段的竞争做全方位布局。而对OpenAI和谷歌来说,失去这样一个关键工具合作伙伴,短期内可能得自己补上这块短板了。

    • Stainless核心能力:自动化创建和维护SDK,支持多编程语言
    • 战略意义:锁定AI智能体开发的关键连接层能力
    • 直接影响:OpenAI、谷歌等无法继续共享Stainless托管服务
    • 行业趋势:AI竞争从模型能力延伸到开发工具生态
  • 卡帕西跳槽了:从OpenAI创始人到Anthropic新兵

    “当前大语言模型的发展正处于决定性阶段,我期待通过重返一线研发工作,参与到模型的前沿探索中。”——安德烈·卡帕西

    从OpenAI创始人到Anthropic新兵

    5月20日,人工智能领域传来重磅消息:安德烈·卡帕西(Andrej Karpathy)正式宣布加入Anthropic。这位OpenAI的创始成员、前特斯拉AI总监,将在Anthropic的预训练团队担任要职,负责Claude大模型的”基本功”训练。

    预训练团队听起来很技术,但其实决定了AI模型的”底子”——它学了多少知识、理解能力有多强,都在这个阶段定型。卡帕西要做的,是组建一支新团队,尝试用Claude自己的能力来加速预训练研究。这可是当前AI圈最前沿的方向,各家都在抢着推进AI开发自动化。

    OpenAI联合创始人卡帕西加盟Anthropic
    卡帕西在社交媒体宣布加盟Anthropic

    为什么他的加入这么受关注?

    卡帕西不是普通的研究员。他在学术界、工业界,甚至教育领域都有不小的影响力。早年是OpenAI的核心创始成员,后来去了特斯拉,带队搞出了Autopilot的计算机视觉核心技术。马斯克当年为了挖他,可是费了不少功夫——法庭公开的邮件里,马斯克直言卡帕西是全球计算机视觉领域”排名第二的人物”,仅次于伊利亚·苏茨克维。

    2022年离开特斯拉后,卡帕西没急着回大模型前线,反而在YouTube和社交平台上做起了技术普及者,积累了大量粉丝。他提出的”vibe coding”概念,最近在开发者圈子里很火。他还公开分享过自己对前沿模型做极限压力测试的心得。

    这次加盟Anthropic,算是他重返大模型研发一线。他自己说,虽然回到了研发岗位,但教育事业还是会继续,计划未来再回去搞教学。

    一场关于人才的暗战

    卡帕西的跳槽,背后其实是一场AI巨头之间的人才博弈。就在本周一,旷日持久的”马斯克诉奥特曼案”刚刚结案,萨姆·奥特曼胜诉。这个案子里,卡帕西的动向曾多次被当作关键证据提及。

    2017年,马斯克同时担任OpenAI和特斯拉的董事,利用这个身份把卡帕西从OpenAI挖到了特斯拉,让他带队做Autopilot计算机视觉。2022年离开特斯拉后,卡帕西短暂回归过OpenAI,随后创办了AI教育公司Eureka Labs,一直到这次加入Anthropic。


    对Anthropic来说,拿下卡帕西绝对是一步好棋。最近Anthropic势头很猛,融资、产品、口碑都在上涨,这次又捞到这么重量级的研究员,无疑进一步巩固了它在AI人才战中的领先地位。

    而对OpenAI来说,失去这样一位创始级别的人物,多少有点尴尬。不过AI圈的人才流动向来频繁,接下来会不会有反向操作,值得继续看下去。

  • 法拉利用IBM的AI打造F1超级粉丝,赛车运动进入数字时代

    两年前,IBM意识到它的体育合作伙伴阵容中有一个明显的缺憾:一级方程式赛车(F1)。F1已经成为全球最受欢迎的运动之一,尤其是在美国——Netflix的《极速求生》记录了F1车手的工作生活,把他们变成了主流名人。这项以技术为中心的运动也成了AWS、Oracle和Anthropic等科技公司的热门选择,它们与车队合作以获得赞助曝光,并提供数据分析和AI工具来带来竞争优势。

    法拉利F1赛车
    法拉利F1赛车在赛道上飞驰 | 图片来源:TechCrunch

    IBM为什么选了法拉利

    所以,当IBM寻找下一个重大体育合作伙伴时,它选了F1以及其中最标志性的车队之一——法拉利HP车队,这并不让人意外。

    “他们是历史上获胜最多的车队。”IBM体育与娱乐合作副总裁Kameryn Stanhouse告诉TechCrunch。

    不过,这次合作的核心在于其他车队也开始与科技巨头合作的原因:获得更复杂的技术解决方案,帮助他们最大化利用人工智能。Stanhouse说,体育最大的优点之一,就是有那么多数据可用,可以用来帮助人们适应AI。

    “他们实际上看到了AI如何为他们服务,”她谈到AI在体育叙事中的使用时说。


    讲故事才是核心

    IBM与法拉利的合作围绕讲故事这个理念展开,通过 overhauling 驱动法拉利车迷App的技术来增强粉丝参与度。为了帮助实现这一目标,法拉利聘请了Stefano Pallard担任新设立的”车迷发展负责人”角色。他说,车队想要解决的挑战不仅仅是触达车迷,而是”让每个人感觉我们都了解他们”。

    “这从获取赛道数据开始,把它变成容易跟随且吸引人的内容,”他告诉TechCrunch。

    每场比赛期间,车队每秒处理数百万个数据点,捕捉车手和赛车的每一个动作。把这些变成车迷可以参与的内容,只是先进的企业AI如何帮助企业更好地与消费者互动的一种方式。


    独立App策略,不走社交平台

    在11支车队中,法拉利是少数几支( alongside McLaren和Williams)拥有独立车迷App策略的车队之一,而不是依赖社交媒体或官方F1平台。这显示出这项运动正开始慢慢利用其不断增长的全球车迷群体。

    法拉利App的一些改动很简单,比如提供意大利语版本。尽管法拉利是意大利公司,许多车迷也是意大利人,但直到IBM合作之前,他们的车迷App都没有意大利语版本。

    Stanhouse说, old 的法拉利车迷App是个人们去查比赛详情然后就离开的地方。这个新App有游戏,车迷可以在App里和别人玩;有新的AI撰写的比赛总结;更多关于车队和车手的幕后故事;一个做预测的地方;还有一个AI伙伴让车迷提问。

    “有两个车手,但你知道换一个轮胎需要24个人同时工作两秒钟吗?”Stanhouse说,并补充说讲故事帮助车迷感觉与车队更亲近。


    全年参与,不只是比赛日

    与IBM打造的其他体育App不同,Stanhouse说法拉利App的主要焦点是讲故事,因为它希望车迷全年都保持参与,而不是一年只有几周,像大师赛那样的锦标赛。Stanhouse说,自IBM介入以来,App的参与度数据一直呈上升趋势,她举了一个例子:比赛周末的参与度增加了62%。

    Pallard说,车队随后使用AI分析App中的参与信号,比如人们喜欢读什么内容,以及车迷发送消息的情绪。

    “这帮助我们理解什么最能引起Tifosi(法拉利车迷的昵称)的共鸣,它直接告知我们如何塑造我们的叙事,以及如何传递内容,”他说。

    车队希望更深入地研究个性化,创造更多沉浸式车迷体验。


    新车迷更年轻、更多元

    App开发者还考虑到了法拉利的车迷群体——它比五年前更加多元化。F1去年发布的数据显示,75%的新车迷是女性,其中许多是Z世代。对女性来说,一个特别的吸引点是F1学院——一个全女性赛车系列赛,旨在培养下一代女性车手。但这些新车迷,就像老车迷一样,都在追求一件事——更多。

    “他们要求更多数据、更多洞察、更多功能,我们必须能够交付这些,”Pallard说。”与IBM一起,未来五年的愿景是让每个车迷都感觉这个体验是为他们打造的,无论他们已经和我们在一起30年还是30天。这就是你如何建立持久的忠诚度。”

    通过IBM的AI技术,法拉利正在重新定义什么是真正的车迷体验。这不只是看比赛,而是让每个车迷都感觉自己是车队的一部分。

  • 我试了亚马逊的Bee可穿戴设备,既好奇又有点发毛

    最近我有机会测试了一款来自Bee的AI可穿戴设备。这家公司去年被亚马逊收购,之后更新了一些新功能。跟其他AI可穿戴设备一样,Bee被设计成一种个人助手:它能记录、转录并总结你一整天的对话,提供一种持续的笔记功能——如果你健忘,或者只是想让生活更有条理,这玩意儿还挺有用。如果你把它和日历同步,它还能给你发提醒,告诉你今天该干啥。

    Bee可穿戴设备
    Bee可穿戴设备实拍图 | 图片来源:TechCrunch

    这东西到底怎么用

    TechCrunch之前写过Bee,它的工作原理挺简单:用户开机,戴在手腕上,跟Bee手机App同步,输入一些基本个人信息。Bee有个内置录音器,点一下设备上的按钮就能开关录音。录音的时候,绿灯会闪;不录的时候,绿灯就灭了。一段对话录完之后,App会自动生成一个容易阅读的摘要,还有整段对话的转录文本。

    至于这整个概念有多让人兴奋(或者不兴奋),可能因人而异。对我来说,问题是我有点隐私情结。在这个普通人被四面八方的数字监控包围的世界里,我很珍惜任何不被录音的机会。所以,想到要24/7在手腕上绑个偷听的 gadget,我并不觉得多吸引人。


    工作场景倒是真有点用

    即便如此,我也得承认——在合适的场景下——Bee确实有潜力帮你整理生活。它在职业场合的表现还不错。如果你一整天都是会,而且很难记住所有细节,Bee可以当个还算称职的助手。

    这周我有一次商务电话,得到对方同意后开了录音。事后,App很忠实地把对话总结了一遍,还贴心地把每段谈话都分开了,这样我后来复习的时候,不用重新听完整段对话。这确实有用,不过得说明一下:这跟Otter、Granola这些其他转录服务提供的功能相比,也没啥质的区别——它们也都提供转录和自动生成的摘要。

    你能想象这么个场景:一个专业人士整天在各种会议之间跑,这设备能帮上忙。你可以让Bee跑一整天,然后回头看对话摘要,找那些你没听清的地方。

    Bee在总结对话方面做得还不错,但这玩意儿给出的实际转录文本可能有点乱。之前的评测者也注意到,你通常得手动输入其他说话人的名字,因为Bee不总是知道谁在说话。在我的对话中,我注意到它还漏了一些段落——倒不是啥大事,但确实不是完整记录。


    私人生活?算了吧

    我还带着Bee去了每周一次的和朋友看电影之夜,让它跑了一整晚。考虑到我们看的是《水库的狗》,我有点担心这可穿戴设备会把所有 vulgar 的杀戮场面当成真实发生的流血事件,然后触发某种内部警报。不过,Bee基本搞明白了怎么回事。这设备判断出我们在看电影,而且在之后的事件摘要里,把这段对话标记为”塔伦蒂诺电影场景分析”。

    虽然Bee作为专业工具显示出早期潜力,但我不希望这东西记录我的私人生活。奇怪的是,Bee的市场定位主要是个人使用产品。要对此感到舒服,你得舒服于让Bee访问你线下和数字生活的大部分内容。

    确实,要想工作得好,Bee需要大量的手机权限——包括访问你的位置、照片、电话联系人、日历和手机通知。你也可以跟它分享健康数据——如果你出于某种原因,想让它知道你的睡眠模式或者静息心率的话。


    隐私问题怎么解

    Bee收集的这大量数据存储在云端——再一次,对于数字隐私爱好者来说,这带来了自己的问题。在给科技YouTuber Becca Farsace的消息中,Bee apparently 展示了一个完全在本地运行的设备演示。如果这家公司能造出这样的设备,我会彻底服气——甚至可能考虑买一个。话又说回来,亚马逊还没对这些计划提供任何更新。

    至于Bee的数字隐私保护,公司说它提供加密来保护用户数据——无论是静态还是传输中。在隐私政策中,公司声明它”实施了技术和组织安全措施,旨在保护公司处理的任何个人信息的安全”。Bee还声称它接受”严格的第三方安全审计”,并采用持续的安全监控。这些听起来都不错,不过值得指出的是,亚马逊——像许多大型科技公司一样——偶尔也会遇到一两个数据安全问题(对于一个管理如此多全球云环境的公司来说,这不 exactly 让人惊讶,但仍然是个问题)。

    简短来说,Bee是个挺有意思的硬件产品,假以时日并加以调整,未来在专业应用方面可能有些前景。不过,作为你私人生活的数字助手,对某些用户来说,它可能有点太侵入性了。

  • mem0:39.9k Stars!AI Agent 通用记忆层,让AI真正记住你

    mem0:39.9k Stars!AI Agent 通用记忆层,让AI真正记住你

    mem0 - AI Agent 通用记忆层

    📦 项目速览
    项目名称:mem0(mem-zero)
    GitHub: mem0ai/mem0
    Stars: 39.9k+
    类型:AI Agent 记忆层基础设施
    技术栈:Python、TypeScript、向量数据库
    官方文档: https://docs.mem0.ai

    🔍 项目简介

    mem0 是为 AI Agent 和应用设计的通用记忆层(Universal Memory Layer)。它的核心使命很简单:让 AI 记住你。不是简单地把对话历史塞进上下文窗口,而是真正地理解、提取、压缩、检索那些对当前任务最有价值的信息。

    你可以把它理解为 AI 应用的”海马体”——负责将短期交互转化为可持久化的长期记忆,并在需要时精准召回。目前已有超过 9 万名开发者使用 mem0 构建 AI 应用,并通过了 SOC 2(Type 1)和 HIPAA 合规认证。

    💡 一句话理解 mem0:如果大模型是”算力”,向量数据库是”知识库”,那 mem0 就是让 AI 拥有连续人格的记忆系统。没有它,每次对话 AI 都是”失忆症患者”。

    ⚙️ 安装要求与过程

    📋 环境要求

    • Python:3.9 及以上版本
    • 依赖:pip 可独立完成安装
    • 可选:PostgreSQL + pgvector(生产环境推荐)、Qdrant / Chroma(向量存储后端)
    • 云端版:无需部署,注册即用(适合快速验证)

    🚀 快速安装(3 步搞定)

    1. 安装 SDK:在终端运行 pip install mem0ai
    2. 获取 API Key:前往 app.mem0.ai 注册并获取密钥
    3. 开始使用:参考下方代码,3 行代码即可添加记忆
    import os
    from mem0 import MemoryClient
    
    # 初始化客户端
    client = MemoryClient(api_key=os.getenv("MEM0_API_KEY", "your-api-key-here"))
    
    # 添加记忆:传入对话上下文和用户 ID
    messages = [
        {"role": "user", "content": "我是素食主义者,对坚果过敏。"},
        {"role": "assistant", "content": "好的,我会记住您的饮食偏好。"},
    ]
    client.add(messages, user_id="user123")
    
    # 检索记忆
    results = client.search("我的饮食限制是什么?", user_id="user123")
    print(results)

    mem0 同时支持 Python 和 Node.js SDK,也提供 Agent Harness、LangChain 插件、CrewAI 集成等多种接入方式。

    ✨ 核心功能

    1. 记忆全生命周期管理

    三步实现记忆可用:添加(快速输入各类数据)→ 学习(自动提取、更新有效记忆)→ 检索(交互时自动召回关键记忆,无需手动处理上下文)。整个过程对开发者透明,无需改造现有 AI 应用管线。

    2. 记忆压缩引擎

    自动将冗长的聊天历史压缩为精简的结构化记忆,在保留核心上下文的同时,大幅降低 Token 消耗、减少响应延迟。实测可将长对话的上下文Token 使用量减少 70%+。

    3. 多场景适配能力

    可针对不同领域(医疗、教育、电商、客服等)定制记忆逻辑,精准保留各场景下对用户最有价值的信息。比如医疗场景会优先保留过敏史、用药记录,而电商场景则重点关注购买偏好和尺码信息。

    4. 企业级管控能力

    支持 SOC 2、HIPAA 合规,提供 BYOK(自带密钥)、零信任架构;支持 Kubernetes、私有云、离线环境部署;所有记忆的读写操作全量日志留存,可追溯操作主体、内容和时间。

    5. 高性能检索算法

    采用单通道分层蒸馏和多信号检索算法,在 LoCoMo、LongMemEval、BEAM 等多个长上下文记忆基准测试中表现优异,记忆召回准确率和效率经过权威验证。

    🚀 典型使用场景

    场景一:医疗健康助手

    痛点:传统 AI 医疗助手每次对话都”不认识”患者,需要重复询问病史、过敏史,体验极差。

    mem0 方案:跨就诊记录记住患者病史、过敏史、治疗偏好,提供个性化护理建议;慢性病管理伴侣可长期学习患者症状规律,提供定制化提醒和健康建议;心理治疗助手可承接过往咨询上下文,提供连贯的、有上下文感知的心理支持。

    效果:患者无需每次重新描述病情,AI 助手真正像”了解你的家庭医生”。

    场景二:个性化教育导师

    痛点:在线教育 AI 无法记住学生的知识盲点、学习节奏和兴趣方向,每次都是”第一次见面”。

    mem0 方案:记住每个学生的错题记录、掌握程度、学习偏好,动态调整教学节奏和内容难度;跨课程、跨设备保持学习记忆一致;家长端可查看 AI 导师的”记忆报告”,了解孩子的学习进展。

    效果:AI 导师真正做到”因材施教”,而不是千篇一律的答题机器。

    场景三:企业级 AI 客服系统

    痛点:客户每次联系客服都要重新解释问题,AI 客服无法记住客户的历史工单和偏好设置。

    mem0 方案:跨会话记住客户的历史问题、产品偏好、沟通风格;结合 RAG 知识库,提供连贯的、有上下文感知的客服体验;支持多租户隔离,不同客户的记忆完全独立存储。

    效果:客户感受到的是”记得我的 AI 客服”,而不是每次都从零开始的机器人。

    🌟 推荐理由

    为什么你应该关注 mem0?

    ① 接入成本极低:无需改造现有 AI 应用管线,官方示例显示最快 5 秒即可为 AI 代理添加持久化记忆。对有现有 LangChain / CrewAI / OpenAI 项目的开发者来说,集成成本几乎为零。

    ② 降本增效明显:通过记忆压缩减少冗余上下文传输,可降低 Token 成本(实测减少 70%+ 上下文长度),同时提升 AI 响应速度。对于高频交互的 AI 应用,这笔账非常好算。

    ③ 让 AI 真正”有温度”:这是我个人最看重的点。没有记忆的 AI 就像”金鱼脑”,每次对话都是全新的开始。mem0 让 AI 真正记住你是谁、你喜欢什么、你之前问过什么——这种连续性的交互体验,才是 AI 应用应该有的样子。

    ④ 安全合规有保障:满足 SOC 2、HIPAA 等国际合规标准,支持私有化部署。对于医疗、金融等敏感行业的 AI 应用,这一点至关重要。

    ⑤ 生态成熟,社区活跃:9 万+ 开发者验证,官方提供完整文档、技术博客、研究资料。GitHub 上 39.9k+ Stars,Issue 响应速度快,不适合”踩坑无人管”的开源项目。

    ⚠️ 注意事项:mem0 云端版按 API 调用次数收费,高频场景建议自建部署以控制成本。自建部署需要一定的 DevOps 能力(Docker + 向量数据库),小型项目建议先从云端版试用再决定。

    📥 下载地址与资源

    📦 PyPI(Python 包)pip install mem0ai
    https://pypi.org/project/mem0ai/
    🌐 官方网站https://mem0.ai
    📚 官方文档https://docs.mem0.ai
    💻 GitHub 仓库https://github.com/mem0ai/mem0
    ☁️ 云端平台https://app.mem0.ai

    — 本文由 WorkBuddy AI 自动采集撰写

  • Intuit裁员3000人——传统SaaS的AI焦虑

    Intuit裁员3000人——传统SaaS的AI焦虑

    TurboTax母公司砍掉17%员工,股价却跑输大盘一整年

    Intuit公司标识
    Intuit总部大楼(图片来源:Getty Images)

    Intuit这波裁员,刀法相当狠——17%的员工,约3000人,一次性砍掉。CEO Sasan Goodarzi给员工的内部备忘录里写得很直白:简化架构、降低复杂度,把资源往AI那边倾斜。

    数字摆出来很有意思。截至2025年7月,Intuit全球员工总数是18200人,砍掉3000,相当于把整个公司六分之一的人送走。而这位下决心的CEO,2025财年的总薪酬是3680万美元。备忘录里没提管理层会不会降薪,路透社问了,Intuit没回。

    “此次裁员旨在简化公司架构、降低复杂度,帮助公司聚焦AI相关的工作。”——Intuit CEO Sasan Goodarzi 内部备忘录

    科技行业2026年的就业市场,真的很冷

    Intuit不是个例。根据Statista的统计,2026年科技行业已经裁掉了超过10万个工作岗位。如果这个趋势持续下去,今年的裁员规模会超过2024年和2025年。

    亚马逊、Block、思科、Cloudflare、Meta、微软、甲骨文——每一家都砍了数千人,而且每一家都用同一个理由:需要把钱和人力重新分配到AI项目上。听起来像是行业共识了,但问题是:这些公司几乎同时在报告强劲的营收和利润增长。

    股价也在涨。投资者押注AI会成为所有软件公司的下一个增长引擎,所以财报好、股价涨、员工被裁——这三件事同时发生,构成了一幅相当魔幻的2026年科技行业图景。


    Intuit的尴尬:AI热潮的”局外人”

    和其他科技巨头不同,Intuit在这一波AI热潮里,并没有被市场当成受益者。过去12个月,它的股价表现持续跑输标普500指数

    背后的焦虑很真实:传统SaaS模式能不能跟上AI的节奏?市场上有一种越来越广泛的担忧——像Intuit这样的公司,做的是税务、会计、个人理财软件,如果AI彻底改变了软件的开发和使用方式,它们的护城河还够不够深?

    但看财务数据,Intuit本身并不差。2026财年第二季度(截至1月),公司营收46.5亿美元,同比增长17%;净利润6.93亿美元,同比提升48%。公司预计第三季度营收增长约10%。

    业绩不差,股价不涨,裁员转型——这套组合拳,怎么看都像是在恐惧驱动的节奏里被迫加速


    传统SaaS的集体焦虑,才刚刚开始

    Intuit这3000人的裁员,其实是一个更大的故事里的一小段。这个故事的名字叫:AI到底会颠覆谁?

    市场现在的叙事是:AI原生的公司(OpenAI、Anthropic、Google)会吃掉传统软件公司的午餐。SaaS的订阅模式、功能迭代节奏、用户界面逻辑——所有这些,都可能被AI重构。

    但另一边,Intuit、Adobe、Salesforce这些公司也在疯狂往产品里塞AI功能。问题是市场买不买账。从目前股价表现来看,投资者还在观望,没有把这些公司的AI转型当成真格的威胁或机会。

    Intuit这波裁掉3000人之后,能不能用更少的员工做出更强的AI产品?这个故事的结局,可能要等至少两三个季度才能看清。但对于那3000个员工来说,答案已经不重要了。

    一句话总结:Intuit裁员3000人,表面上是”聚焦AI”的战略调整,骨子里是传统SaaS公司在AI浪潮面前的生存焦虑。业绩还在增长,但市场已经不耐烦了。