博客

  • Runway不想跟OpenAI、Google挤语言模型赛道,它压注的是“世界模型”






    Runway不想跟OpenAI、Google挤语言模型赛道,它押注的是”世界模型”

    如果你关注AI视频生成,应该听过Runway这个名字。这家2018年成立的公司最新估值53亿美元,二季度新增4000万美元年度经常性收入,总融资8.6亿美元。

    但Runway的野心不止是做视频生成工具。他们想做的事,用联合创始人Anastasis Germanidis的话说,是构建”世界模型”——一种能让AI真正理解现实世界运作方式的基础模型。

    Runway三位联合创始人
    Runway三位联合创始人(来源:TechCrunch)

    三个纽约大学相遇的创始人

    故事起点是2016年,三位联合创始人在纽约大学ITP(交互通信项目)相识:

    • Anastasis Germanidis(希腊人),联合创始人兼联合CEO,11岁在雅典爱上编程,后来在纽约大学Tisch艺术学院学神经科学和电影
    • Cristóbal Valenzuela(智利圣地亚哥人),联合创始人兼联合CEO,本科读经济学,做过电影和软件
    • Alejandro Matamala Ortiz(智利圣地亚哥人),首席创新官,学广告出身,之前运营设计公司

    他们最初的使命是:”能不能用AI让每个人都成为电影制作人?”2023年2月发布第一个视频生成模型后,这个问题变成了:”能不能让每个人都成为优秀的电影制作人?”

    再后来,他们发现视频生成模型其实能理解世界的运作方式,于是使命再次扩展——Runway开始押注”世界模型”。


    为什么是视频,而不是语言?

    这是Runway最反共识的赌注。

    现在几乎所有主流AI实验室都在押注语言模型——用整个互联网的文本数据(留言板、社交媒体、教科书)训练模型,提炼人类已有知识。但Germanidis认为,要超越现有知识的边界,需要利用”偏见更少的数据”。

    “我们基本上受制于自己对现实的理解。”Germanidis说。

    Runway的策略是:通过视频生成摸到世界模型的边,然后再扩展到其他领域。他们已经在这么做——2025年12月发布了第一个世界模型,计划2026年再发一个,而且已经组建了机器人部门。

    钱和资源够不够?

    这是最现实的挑战。训练基础模型需要巨大的算力集群,而Runway的竞争对手是:

    • OpenAI:融资约1750亿美元,Sora视频平台已关闭(日耗约100万美元)
    • Google:母公司市值4.86万亿美元,Veo模型直接竞争
    • World Labs(李飞飞创办):融资12.9亿美元,目标同样是世界模型
    • Luma AI:融资9亿美元,方向相似

    Runway总融资8.6亿美元,在这个数字面前显得有点单薄。Workera CEO Katanforoosh的直接问题是:”没有集群,你怎么建立基础模型?我认为没有人能做到这一点。”

    “规则只是他们发明的规则。这就是我们在Runway做事的驱动力。他们说硅谷在这里,所以创业公司就得在这里。为什么?那些只是编造出来的规则。把它们全部清除,重新开始。”——Cristóbal Valenzuela


    世界模型能干什么?

    Germanidis认为世界模型是”科学基础设施”,应用场景远超视频生成:

    • 机器人技术:让机器人理解物理世界
    • 药物发现:模拟分子interactions
    • 气候建模:更准确的气候预测
    • 终极目标:生物世界模型,用于抗衰老研究

    “如果我们能建造比人类科学家更好的科学家,我们就能加速对宇宙的理解,加速解决问题的方式。”——Anastasis Germanidis

    现在做到哪一步了?

    Runway的核心产品是Gen-4.5(最新视频生成模型)。客户包括Lionsgate(狮门影业)、AMC Networks,他们参与的作品包括《瞬息全宇宙》(Everything Everywhere All At Once)。

    但视频生成只是路径,不是终点。Runway相信视频生成是通往世界模型的道路——这是一条跟OpenAI、Google、Anthropic都不同的技术路线。

    如果Runway赌对了,结果会影响从好莱坞到药物发现的无数领域。如果赌错了,他们很可能被资源更雄厚的竞争对手超越。


  • OpenAI悄悄上线个人财务管理功能:ChatGPT能连你的银行账户了






    OpenAI悄悄上线个人财务管理功能:ChatGPT能连你的银行账户了

    昨天(5月15日)OpenAI给ChatGPT Pro用户推送了一个新功能——个人财务管理工具。美国地区的Pro订阅用户现在可以把自己的银行账户、投资账户接进来,让ChatGPT帮你分析花钱情况、做财务规划。

    背后是谁在做事?

    OpenAI这次找了Plaid合作,这家公司专门做金融数据连接,支持超过12000家金融机构。也就是说,只要你用的是Schwab、Fidelity、Chase、Robinhood、American Express、Capital One这些机构的账户,都能接进去。

    有意思的是,OpenAI在一个月前(今年4月)刚收购了一个叫Hiro的个人金融创业公司。Hiro背后有Ribbit、General Catalyst这些大牌投资机构撑腰。OpenAI说Hiro团队在金融领域的专业度对这次产品发布帮助很大,但没明说这个功能是不是完全由他们打造。

    ChatGPT个人财务管理功能截图
    ChatGPT个人财务管理功能界面截图(来源:TechCrunch)

    怎么用?

    用法挺简单。你可以在侧边栏找到”Finances”选项,点”Get started”;或者直接在对话里打字:”@Finances, connect my accounts”。接着ChatGPT会引导你通过Plaid连接账户。

    连上之后,你会看到一个仪表盘,显示你的投资组合表现、消费情况、订阅服务、即将到期的付款等等。

    OpenAI说他们还在对接Intuit(TurboTax、QuickBooks的母公司),接上之后能做更复杂的分析——比如你卖了一笔股票对税务有什么影响,或者你申请某张信用卡的通过概率有多大。

    为什么现在做这个?

    数据很直接:OpenAI说每个月有超过2亿用户向ChatGPT询问财务问题。人们已经在这么用了,OpenAI只是顺势推出了专门工具。

    而且GPT-5.5模型在上下文推理上更强了,处理财务这种需要精确推理的问题更适合。OpenAI还和金融专家一起搞了一套评测标准,专门用来提升模型在个人财务问题上的表现。

    你可以问它:”我感觉最近花得多了,有什么变化吗?”或者”帮我做个计划,未来5年在我这边攒够买房的钱。”模型会根据你的实际账户数据给出建议。

    隐私怎么算?

    这是大家最担心的部分。OpenAI说你可以随时去”Settings > Apps > Finances”里断开某些账户的连接。断开之后,同步的数据会在30天内从ChatGPT里删除。你也可以在Finances页面查看和删除金融记忆。


    大公司都在往垂直领域走

    其实现在的AI公司都在做类似的事。通用聊天机器人天生会被问到健康、金融、个人生活这些敏感话题,公司们意识到需要专门的产品来承接这些场景。

    OpenAI和Anthropic都推出了健康相关工具。本月早些时候,Perplexity也基于它的Computer agent推出了金融研究产品。

    谁能用到?

    目前只有美国地区的ChatGPT Pro用户能在网页端和iOS上用上这个功能。OpenAI说会根据Pro用户的反馈来改进产品,之后再开放给Plus用户。


  • Firecrawl:120k Stars!让AI轻松抓取任意网页的利器

    Firecrawl - Web数据API for AI

    你有没有遇到过这种情况:想用AI分析某个网站的内容,结果发现爬虫根本抓不到数据,要么是JavaScript渲染的SPA页面,要么就是被反爬虫拦住了?

    我之前做竞品调研的时候,就经常被这个问题困扰。传统爬虫要么需要配置代理,要么需要手动处理各种反爬机制,光是数据清洗就占了大半天时间。

    直到我发现了 Firecrawl —— 这是一个专门为AI时代打造的网页数据抓取工具,它可以轻松把任何网站转换成LLM-ready的格式。


    🚀 项目简介

    Firecrawl 是一款开源的 Web 数据抓取 API,能够将任何网站转换为干净的 Markdown 或结构化数据,特别适合 AI Agent 和 LLM 应用使用。项目已获得 120k+ GitHub Stars,被 Apple、Shopify、Canva、Replit 等知名企业信赖使用。


    ⚙️ 安装要求和过程

    📋 环境要求

    • Python 3.8+ / Node.js 18+ / Go / Rust / Java
    • Docker(可选,用于本地部署)
    • API Key(可从 firecrawl.dev 免费获取)

    🚀 快速安装

    通过 pip 安装 Python SDK:

    pip install firecrawl-py

    或者使用 npm:

    npm install firecrawl-py

    Docker 本地部署:

    docker pull mendableai/firecrawl
    docker run -p 3002:3002 mendableai/firecrawl

    💡 核心功能

    • 🔍 智能搜索:输入关键词,直接返回包含完整内容的搜索结果,无需二次抓取
    • 📄 专业抓取:将任意网页转换为干净的 Markdown、JSON 或 HTML,自动处理 JavaScript 渲染
    • 🗺️ 站点映射:生成网站结构地图,快速了解站点架构
    • 🔗 智能爬取:从起始 URL 自动追踪链接,爬取整个站点,支持深度限制
    • 💬 页面交互:支持点击、滚动、输入、截图等操作,可与页面动态交互

    📦 典型使用场景

    🔬 场景1:AI 研究助手

    让 AI 代理自动搜索和抓取最新论文、新闻、行业报告,汇总成结构化的研究报告。

    📊 场景2:竞品情报监控

    自动监控竞品官网、定价页面、产品更新,抓取关键信息用于市场分析和决策支持。

    🤖 场景3:RAG 应用数据源

    为 RAG(检索增强生成)应用提供实时、准确的网页数据源,提升 AI 回答的质量。


    ⭐ 推荐理由

    说实话,用了 Firecrawl 之后,我做竞品调研的效率至少提升了三倍。以前需要花半天时间手动抓取和清洗的数据,现在几行代码就能搞定。

    最让我惊喜的是它的 JavaScript 渲染能力 —— 以前那些用 React/Vue 写的 SPA 页面,传统爬虫根本拿它没办法,现在只要一个 API 调用就能搞定。而且输出格式非常干净,几乎不需要额外清洗。

    配合 MCP 服务器使用效果更佳,可以直接在 Cursor、Claude 这些 AI 工具里调用 Firecrawl,真正实现”让 AI 替你上网搜资料”。


    📧 下载地址

  • 谷歌发布Googlebook AI笔记本:Magic Pointer登场,2026秋季正式上市

    谷歌在5月12日悄悄投下了一颗炸弹——Googlebook,一个从零开始围绕Gemini Intelligence设计的笔记本品类,2026年秋季正式上市。宏碁、华硕、戴尔、惠普、联想全部进场,各种尺寸和形态都会有。

    这不是Chromebook的升级版,而是一次底层换代。Chromebook走了15年,在学校和办公场景扎下了根,但它的时代正在被AI重新定义。谷歌没有直接说”Chromebook死了”,只说现有设备会继续得到支持,很多Chromebook也有资格升级到新的Googlebook体验——至于怎么升、升完长啥样,现在还没说清楚。

    Googlebook笔记本宣传图
    Googlebook官方宣传图 | 图源:Google / TechCrunch

    Magic Pointer:光标变成AI助手

    Googlebook最让人眼前一亮的功能叫Magic Pointer。传统光标只能点选和拖动,Magic Pointer内置了Gemini,晃一晃光标,它就能识别屏幕上可交互的元素,然后给你推情境化的操作建议。

    举个例子:光标指向邮件里的日期,它会建议你直接创建日历会议;选中两张图——比如你家的客厅照片和一张新沙发的图——它能把沙发”摆”进客厅里让你预览效果。谷歌的产品总监说,这个设计理念是”内置但不打扰”,AI在后台等着,你晃光标它才出来。

    这不是在光标旁边加个AI按钮,而是让”指”这个动作本身变聪明。区别在于:前者是工具,后者是直觉。

    手机App直接跑在笔记本上

    Googlebook和Android手机的深度联动也是重点。你不用在笔记本上装Android模拟器,手机App直接就能在Googlebook上运行。想做Duolingo每日打卡,手边没有手机?直接在笔记本上点开就行。

    文件也能跨设备无缝访问。手机里存的图、下载的PDF,在Googlebook的文件浏览器里直接就能看到、搜到、插到你的文档里。这个体验和苹果生态的接力(Handoff)有点像,但谷歌的打法是打通Android和这个新的笔记本操作系统。

    Create your Widget:说一句话生成桌面组件

    还有一个挺有意思的功能叫”Create your Widget”。你用自然语言跟Gemini描述你想要什么,它就能给你生成一个自定义桌面组件。更实用的是,Gemini能抓网页信息,也能连上你的Gmail和谷歌日历,把这些数据揉在一个个性化仪表盘里。

    比如你在筹划一次柏林的家庭聚会,这个组件能自动汇总你的航班和酒店信息,推附近的餐厅预订选项,还能加个倒计时。听起来就是把Google Now的野心重新用AI做一遍,但这次是嵌在桌面里的。


    这不只是换了个笔记本,是换了个平台

    谷歌做这件事的真正意图不是卖几台笔记本,而是把ChromeOS慢慢退场,换上这个基于Android、AI从底层就内置的新系统。硬件厂商已经全部就位,这是一次平台级的押注,直接对标微软从2024年开始推的Copilot+ PC。

    微软那边Copilot+ PC打的是”本地运行AI模型”这张牌,谷歌这边Googlebook打的是”Gemini深度集成+Android生态联动”。两边的方向其实差不多:让AI从”一个App”变成”操作系统的一部分”。

    2026年秋季正式上市后,你会看到Acer、Asus、Dell、HP、Lenovo各家都会出自己的Googlebook产品。价格和具体配置目前还没公布,但按照谷歌的打法,入门款应该会走量,高端款去和MacBook Pro、Surface竞争。

    ChromeOS用了15年才走到今天,Googlebook能不能在AI时代走通这条路,秋季见了分晓。

  • Claude AI找回丢失11年的比特币钱包:3.5万亿次尝试后,5个BTC失而复得

    有个国外小伙把自己给坑了——大学时候手欠改了比特币钱包密码,改完就忘了,而且改密码那会儿还”high”着。这一忘就是11年,钱包里锁着5个BTC,按现在的价格大概是40万美元。

    他不是没努力过。开源工具btcrecover跑了无数次暴力破解,能试的密码组合都试了,就是打不开那个加密钱包文件。真正的痛点在这:早期的比特币钱包和现在不一样,那时候助记词生成的是HD密钥树,但钱包经常混用非HD密钥和导入密钥,这些密钥没法通过助记词恢复,只能靠钱包文件本身加密码才能解锁。

    转机出现在几周前,他在大学旧笔记本里翻到了当年记下的助记词。把助记词导入后,恢复出来的地址和他电脑里某个钱包文件对上了——就是那个存着5个BTC的文件,但它依然是加密的,密码还是不对。

    比特币钱包示意图
    丢了11年的比特币钱包,被Claude帮忙找回来了 | 图源:Getty Images

    绝望之下,他把整个大学时期的电脑文件一股脑全丢给了Claude。然后事情开始变得离谱——Claude在数据包里翻出了一份2019年12月的旧钱包备份,这个备份是在他改密码之前做的。更关键的是,Claude发现btcrecover在组合共享密钥和密码的时候有个bug,导致之前的所有破解尝试全部白费。

    修好那个bug,换上改密码之前的旧备份,Claude带着btcrecover跑完,私钥解出来了。5个BTC,失而复得。

    3.5万亿次尝试,AI找到了人类遗漏的bug

    按照用户在X上的说法,整个破解过程累计尝试了约3.5万亿个密码组合。Claude没有直接”猜”出密码,它的真正价值是帮人类找到了那个被忽略的关键问题——工具本身的bug。这件事做完,用户直接在X上发了疯,说要给自己的孩子取名叫Dario(Anthropic CEO的名字)。

    类似的事件之前也有过。2024年有研究人员花了至少半年时间,破解了一个忘记20位密码的比特币钱包,里面约有160万美元的BTC。但那次是纯人工+脚本硬跑,这次Claude的介入方式不太一样——它不是暴力算力的比拼,而是帮人看见了盲点。


    当然,不是所有人都有这样的运气。英国有个哥们儿丢了8000个BTC(现在值约78亿美元),硬盘被扔进了垃圾填埋场,2025年法院还判了他败诉,彻底没戏。所以这篇不是鼓励大家指望AI来救场,而是想说:AI现在能帮你看见你漏掉的东西,但前提是你得先把”所有东西”都给它看。

  • Meta收购ARI机器人AI团队:具身智能的抢人大战开始了

    Meta砸钱买下一个20人的机器人AI团队,这步棋下得挺准

    5月1日,Meta悄悄宣布了一笔收购——把人形机器人AI初创公司Assured Robot Intelligence(简称ARI)整个团队拿了过来。具体价格没披露,但按AI研究领域种子阶段收购的惯例来估算,大概在5000万到1.5亿美元之间。ARI整个公司才成立约12个月,约20个人,全在加州圣地亚哥。

    这个时机选得相当精准。就在收购前一个月,Amazon刚把Fauna Robotics收入囊中——而Fauna的联合创始人Lerrel Pinto,恰好也是ARI的联合创始人。人才圈的窗口正在关闭,Meta抢在ARI开A轮之前把它拿下了,估值还没被市场炒到天上去。

    “人形机器人正在从硬件竞赛转向智能捕获。Meta收购ARI是最清晰的信号——大科技公司已经从围观这个赛道,转向直接买入场券。”

    ARI到底在做什么

    ARI对外声称在做”机器人的前沿AI”,但产品宣传很少,真正有价值的信息在它的创始人背景里。两位联合创始人都是学术圈的人:

    • Xiaolong Wang——UC San Diego教授,研究方向是视觉运动控制和机器人灵巧操作,论文发表在CVPR、NeurIPS、ICLR这些顶会上
    • Lerrel Pinto——同为UC San Diego出身,联合创立了Fauna Robotics(被Amazon收购),在机器人学习领域有扎实的积累

    ARI的核心方向是给人形机器人做基础模型,特别强调在非预设环境下的全身控制和灵巧操作——这恰恰是现在大部分人形机器人最薄弱的地方。它们能走个直线、挥个手,但要让机器人像人一样在动态环境里做复杂操作,模型还差得很远。

    值得注意的是,ARI强调”自学习”——模型通过物理交互来改进,而不是只靠离线数据集训练。这直接针对当前VLA(视觉-语言-动作)模型架构的一个已知局限:泛化能力不足。


    为什么是ARI,不是别的公司

    其实市面上做机器人智能层的初创公司不止ARI一家。Physical Intelligence(PI)融了6亿美元以上,Skild AI估值140亿美元——但这些公司要么太大太贵,要么已经走上独立发展的轨迹,买起来不划算。

    ARI的巧妙之处在于:它足够小,可以干净地吸收进Meta的组织架构;它的人才足够顶尖,直接补充Meta Superintelligence Labs的短板;它的估值还没被炒高,收购成本低。

    Meta在2025年成立了Reality Labs内部的机器人工作室,编制齐全,但缺的就是基础模型研究人才。ARI填的不是一块模糊的野心,而是一个精确的缺口。

    大厂抢人大战才刚开始

    把视野拉宽一点,这场收购其实是整个行业的一个缩影。Amazon在2025-2026年间连续拿下Fauna、Rivr,还投资了Agility;Tesla在全栈自研路线上上越走越深;NVIDIA坐在平台层,给所有人提供芯片和仿真工具,稳稳抽取margin。

    Meta的策略和Amazon形成鲜明对比:Amazon是”广撒网”——连续收购,布局 warehouse、配送、家庭三大场景,但没有一个统一的平台叙事;Meta是”精准打击”——先在内部定义好机器人智能的路线图,再去买最匹配的人才来填空。

    这两种路径哪个更有效,接下来两三年会见分晓。但至少从目前来看,Meta这步棋下得挺准——在种子阶段的机器人智能公司变成”不得不买”的独立巨头之前,先把人拿到手。

  • OpenAI推出Daybreak:用AI找漏洞、验补丁,三层模型架构首次曝光

    OpenAI悄悄上线Daybreak,用AI把漏洞发现和补丁验证打包搞定

    OpenAI这周干了件挺有意思的事——推出一个叫Daybreak的新项目,专门帮企业用AI找漏洞、验证补丁。说白了,就是让AI扮演”超级安全研究员”的角色,在代码里翻箱倒柜找安全隐患,顺带告诉你补丁好不好使。

    这个东西的核心逻辑其实不复杂:把OpenAI现有的前沿模型能力、Codex Security这个代码智能体工具、再加上一堆安全合作伙伴的生态整合在一起。防御方可以在日常开发流程里直接用上安全代码审查、威胁建模、补丁验证、依赖风险分析、检测和修复建议——软件从写出来的那一刻就变得更结实。

    OpenAI的原话是这么说的:”Daybreak把OpenAI模型的智能、Codex作为智能体框架的可扩展性、以及我们在安全飞轮上的合作伙伴整合在一起,让全世界变得更安全。”

    三层模型架构,分工明确

    Daybreak不是拿一个通用模型硬上,而是搞了三层架构,各有各的用处:

    • GPT-5.5:标准版,带通用护栏,适合一般用途
    • GPT-5.5 + Trusted Access for Cyber:经过验证的防御性工作,在授权环境中使用
    • GPT-5.5-Cyber:高权限模型,用于红队演练、渗透测试和受控验证

    这三层设计其实很聪明——不同安全级别的任务用不同”火力”的模型,既保证能力够用,又不至于让高权限模型被滥用。OpenAI这次还拉上了一堆巨头一起玩:Akamai、Cisco、Cloudflare、CrowdStrike、Fortinet、Oracle、Palo Alto Networks、Zscaler,都在Trusted Access for Cyber框架下接入这些能力。

    AI找漏洞太快,补丁跟不上了

    这里有个真实的矛盾:AI工具把发现漏洞的时间压缩到了以前根本不敢想的程度,但补丁的开发和验证流程还停留在”人类节奏”上。结果就是——漏洞被发现的速度远超补丁发布的速度。

    HackerOne今年3月干脆暂停了互联网漏洞赏金计划,理由就是AI辅助研究导致新漏洞报告量暴增,开源维护者们根本处理不过来。这还带来一个副作用叫”分流疲劳”——维护者要在一大堆漏洞报告里翻找,其中有些报告看着像模像样,其实是AI模型编出来的幻觉。


    安全研究员Himanshu Anand上周写了篇文章,标题很犀利:”90天披露政策已死”。他的论点是:当10个互不相干的研究员在6周内找到同一个bug,而AI可以在30分钟内把补丁差异变成可用漏洞利用代码,那个90天窗口期到底在保护什么?答案是:什么也保护不了。

    Daybreak目前还是限量访问状态,OpenAI建议有需求的组织申请漏洞扫描或联系销售团队。这个克制挺明智的——这种能力的扩散速度如果失控,后果可能比漏洞本身还麻烦。

  • 微软与OpenAI终止独家云协议——AI版图重新划分

    2026年4月27日,微软和OpenAI悄无声息地改写了过去几年的AI版图。双方 restructured 了合作关系——Azure不再是OpenAI的独家云供应商,同时去掉了与AGI(通用人工智能)相关的条款。这件事的意义,比表面上看起来要大得多。

    独家协议为什么说不续就不续了?

    其实不难理解。OpenAI想要更大的基础设施选择权,而微软也不想被绑定在一个越来越贵的合作协议上。去掉AGI条款更是关键——之前的说法是,一旦OpenAI实现AGI,某些合作协议会自动失效,现在这条被拿掉了,双方的绑定关系变得更加”务实”。

    Azure仍将是OpenAI的”主要”云伙伴,但不再是”独家”。这给了OpenAI和其他云厂商(比如Google Cloud、AWS)合作的空间,也意味着微软在AI基础设施上的垄断地位被打破了。

    AI阵营正在重新划分

    这件发生的同一时间段,另一个信号同样值得关注:Google计划向Anthropic投资最高400亿美元。也就是说,微软-OpenAI这对老搭档的关系在松动,而Google-Anthropic这对”反OpenAI阵营”却在加深绑定。

    站在OpenAI的角度,摆脱Azure独家限制之后,可以更加灵活地选择基础设施伙伴,这对训练和部署下一代模型至关重要。站在微软的角度,Azure依然是OpenAI的优先选择,但不再有排他性保护,这也意味着微软需要在AI服务上靠实力竞争,而不是靠合同。


    这对普通开发者和企业意味着什么

    短期内可能感受不明显,但中长期来看,OpenAI的API和模型部署会有更多基础设施选项,成本和延迟都有可能优化。而对整个行业来说,AI基础设施的”阵营化”正在减弱,更加市场化的竞争对所有人都有好处。

  • AI五月风暴:模型军备竞赛、Agent落地与电力危机

    四月刚过,AI圈没有丝毫放缓的迹象。GPT-5.5-Cyber开始推送,Claude Mythos在约50家合作伙伴中只有受限预览,DeepSeek V4带着开源权重和低价策略强势入场——模型竞赛正在进入一个新阶段:不再比谁的模型最通用,而是比谁更专业、更便宜、更能落地。

    专业模型来了,通用模型不香了?

    GPT-5.5-Cyber的发布释放了一个清晰信号:厂商开始针对特定高价值场景推出专业模型,而不再只靠一个通用大模型打天下。网络安全、漏洞发现、防御分析——这些场景正在成为前沿AI厂商的必争之地。

    Claude Mythos的神秘感更是拉满。现在只有约50家机构能用到它,传言说它在高级推理、编码和漏洞发现上有巨大飞跃。Anthropic这种”限量供应”的打法,摆明了要把下一个阶段的AI变成门槛更高、管控更严的游戏。

    DeepSeek V4则是另一条路——它把前沿级别的性能直接拉到低价+开源的组合上。对企业来说,成本改变 adoption 曲线,成本改变哪些应用场景变得经济可行。

    Agent从概念到落地,2026是分水岭

    Gartner有个预测被反复引用:到2026年底,40%的企业应用将嵌入AI Agent,而2025年这个数字还不到5%。先不管这个预测准不准,它反映出的行业共识是真实的——Agent正在从demo走向生产环境。

    开发者社区里的讨论也在变。大家不再争论Agent有没有用,而是开始认真讨论:用什么框架?CrewAI还是LangGraph?MCP协议怎么接入?怎么防止Agent乱跑把事情搞砸?这些是非常实操的问题,说明这个品类真的在进入落地阶段。


    电力危机:6500亿美元也买不来的瓶颈

    最有意思的矛盾来了:大型科技公司今年在AI基础设施上的资本开支合计超过6500亿美元,但约一半的美国数据中心项目却因为电力基础设施短缺而被推迟或取消。钱不是问题,电才是问题。

    AI数据中心 campus 动辄需要几百兆瓦的电力容量,变电站、变压器、电网接入——这些现实世界的物理约束,比发布一个大模型要慢得多。Gartner还预测,到2027年,电力短缺将限制约40%的AI数据中心。这意味着,AI的下一个瓶颈不是芯片,不是模型,而是现实世界的部署能力。

  • Anthropic产品负责人:AI的下一站,是在你开口前就猜到你要什么

    Anthropic最近风头正劲。估值940亿美元、企业客户数超越OpenAI、ARR突破440亿美元——这家公司正在AI领域快速崛起。而它的产品负责人Cat Wu最近在Code with Claude大会上分享了一个观点,我觉得挺有意思:AI的下一件大事,是”主动性”。

    从”有问必答”到”未问先答”

    Cat Wu在采访中回顾了AI助手的演进路径:去年是”同步开发”时代,人问AI答;现在是”自动化流程”时代,比如自动回复客服工单。而下一步,AI要理解你的工作内容,主动帮你搭建自动化流程。

    “The next big thing is proactivity. Claude will understand what you work on, and just sets up some of these automations for you.” —— Cat Wu,Anthropic产品负责人

    换句话说,未来的AI不会等你提问,它会预判你的需求,在你意识到之前就把事情做好。这个画面有点像有个特别懂你的助手,总是提前一步想到你接下来要做什么。

    管好Agent,其实和管理员工差不多

    有意思的是,Cat Wu还回应了一个很多人关心的问题:AI Agent会不会取代人类工作?她的观点是:不会完全取代,但会改变工作方式。

    她说,管理AI Agent其实和管理员工很像——你得是那个领域的专家。当Agent犯错时,你得能debug,得知道是指令没说清楚还是需求描述不够具体。这是一种新技能,但本质上是管理能力的延伸。

    Cat Wu在Code with Claude大会
    Cat Wu在Anthropic年度Code with Claude大会上分享AI未来趋势

    不追竞品,只追前沿

    Cat Wu还透露了Anthropic的产品哲学:从不根据竞品动态来规划路线图。她说,如果总是盯着竞争对手,团队的执行速度永远会落后两周到一个月。Anthropic的策略是专注于技术前沿,让产品自己说话。

    这种思路从他们最近的”Glasswing”项目也能看出端倪。Glasswing是一个网络安全AI模型,可以扫描代码库查找漏洞。Anthropic没有公开发布它,而是只给了亚马逊、苹果、微软等合作伙伴早期访问权限——因为他们认为这个模型”太强大”了,不想让它落入坏人之手。

    AI的价值:把人从繁琐中解放出来

    聊到AI对工作的影响,Cat Wu举了自己的例子:她最讨厌的事情是回邮件。AI的价值不在于取代她的工作,而在于接手那些重复繁琐的部分,让她有时间去做”真正想做的事情”。

    “The idea is that everyone can get a lot more done. I think that, for everyone’s job, there’s always this percentage of it that’s really tedious.”

    这个观点挺实在的。AI的目标不是让人失业,而是提升每个人的产出效率——用更少的时间做更多有价值的事。