标签: AI

  • 谷歌每月向SpaceX支付9.2亿美元算力费,AI军备竞赛烧钱烧到了新高度

    一笔让华尔街都侧目的算力账单

    谷歌刚和SpaceX签了一笔算力大单——每月9.2亿美元,一直付到2029年6月。这笔钱换来的,是约11万块英伟达GPU以及配套的CPU、内存和其他硬件的访问权。

    这个交易结构眼熟吗?没错,和SpaceX五月底跟Anthropic签的那笔几乎是一个模子刻出来的。当时Anthropic答应每月付12.5亿美元,租下SpaceX在孟菲斯建的Colossus 1数据中心的全部算力。谷歌这次拿到的算力规模大概是Anthropic的一半,SpaceX没说具体是哪个数据中心,但马斯克之前暗示Colossus 2会留给自家的xAI用。

    SpaceX数据中心算力
    SpaceX数据中心基础设施(图源:TechCrunch)

    谷歌真的缺算力吗?

    有意思的地方就在这里。谷歌自己本来就是全球最大的AI算力持有方之一,有些估算甚至把它排在第一位。那为什么还要花每年超过110亿美元来找SpaceX租算力?

    谷歌的官方说法倒也直白:旗下Gemini Enterprise上线之后,客户需求远超预期,这是一份”短期补充协议”,用来填补算力缺口。但看看 Alphabet 的账本就知道,这背后是更大规模的豪赌——2026年已承诺的资本支出超过1800亿美元,而且2027年还要”显著增长”。为了支撑这个开销,Alphabet 最近还宣布了800亿美元的配股计划。

    “谷歌云和SpaceX是长期合作伙伴。这是一份短期、及时的协议,确保我们有桥接算力来满足Agent平台Gemini Enterprise激增的客户需求,这个需求比我们预期的还要高。”——谷歌官方声明

    合同里藏着一条退路

    和Anthropic那笔交易一样,这份协议里也写了解约条款:2026年12月31日之后,双方都可以提前90天通知对方终止合作。2026年9月之前,谷歌的算力访问会逐步上线,费用也相应降低。

    还有一个保护条款:如果SpaceX在2026年9月30日前没能交付约定数量的GPU,经过一个月宽限期后,谷歌可以选择直接终止协议,或者接受现有的GPU数量但同时降低月费。


    时机很微妙:SpaceX即将IPO

    SpaceX公布这笔交易的时间点相当微妙——距离它在纳斯达克挂牌只剩一周。根据向SEC提交的文件,SpaceX这次IPO计划募资约750亿美元,估值约1.75万亿美元,将是史上规模最大的IPO。

    谷歌是SpaceX的长期投资人,上市后它持有的SpaceX股份价值预计会超过1000亿美元。更有意思的是,两家公司据传还在洽谈共建轨道数据中心——这恰恰是SpaceX上市后计划中的核心版图之一。

    所以这笔交易里其实藏着两层逻辑:对谷歌来说,是在自身算力扩张跟不上需求增长时的应急补课;对SpaceX来说,这是在IPO前把闲置算力资产变现、同时向资本市场展示商业化能力的绝佳故事。

  • 微软偷偷憋了个大招:MAI-Thinking-1推理模型上线,不再只靠OpenAI

    在刚刚过去的Build 2026开发者大会上,微软做了一个不太高调、但信号很明确的动作:发布了自研推理模型MAI-Thinking-1。这是微软AI部门第一个真正意义上的”高级推理模型”,350亿活跃参数,从零开始用干净数据训练,没有走蒸馏第三方前沿模型的捷径。

    这个名字里的”MAI”,指的是Microsoft AI。简单来说,微软想把AI能力握回自己手里,不再只是OpenAI的一个渠道商。

    跟OpenAI的”婚姻”变了:不再是独家绑定

    就在MAI-Thinking-1发布的几乎同一时间,微软和OpenAI悄咪咪把合作协议改了。新协议里,微软对OpenAI模型的授权有效期延长到2032年,但最关键的变化是:独家权没了。OpenAI可以去找别的云服务商合作,微软也可以自己搞AI系统,双方都留了后路。

    微软不是要跟OpenAI分手,而是不想再把所有鸡蛋放在一个篮子里。自研模型是保险,也是筹码。

    这个变化背后有个很现实的原因:依赖单一供应商是有风险的。如果OpenAI的模型出问题、涨价、或者路线调整跟微软的产品规划不合拍,微软需要一个备选方案。

    MAI-Thinking-1到底能干嘛?

    根据微软公布的信息,MAI-Thinking-1主打的是”推理”能力——不是简单地接一句话、回一句话,而是能处理多步指令、长上下文推理、软件工程任务、代码生成、数学问题等需要”想一想”的场景。

    • 350亿活跃参数,规模中等但效率高,token使用成本低
    • 支持引入用户自有数据来提升推理准确率
    • 目前通过Microsoft Foundry平台开放私有预览,开发者可以申请测试
    • 未来将逐步集成到Copilot、GitHub、Microsoft 365、Azure等核心产品

    不只是推理模型:微软一口气发了整个MAI系列

    跟MAI-Thinking-1一起亮相的,还有一整套MAI模型家族,覆盖了代码、图像、语音、转录等多个方向:

    • MAI-Code-1-Flash:推理效率极高的编程模型,已经集成到GitHub Copilot和VS Code,适配”用一句话生成应用”的开发场景
    • MAI-Image 2.5:支持文生图和图像编辑
    • MAI-Transcribe-1.5:语音转文字,速度比同类竞品快5倍
    • MAI-Voice-2:合成语音,新增15种语言和更多音色

    更有意思的是,微软还推了几个可以直接跑在Windows PC上的小型Aion模型,不需要联网就能做本地AI推理。配套的硬件产品也在路上:跟英伟达合作的Surface RTX Spark Dev Box,是一个面向开发者的本地AI开发设备,用来做原型开发、微调和测试,重负载再迁到云端。

    微软的算盘是:自研模型针对自己的产品和硬件做优化,跑在Azure上,成本比买第三方的便宜。开发者用起来更便宜,微软的利润率也更高。

    AI从”工具”升级为”操作层”

    MAI-Thinking-1的发布,折射出微软对AI的一个更大胆的设想:AI不应该只是一个聊天窗口,而应该成为工作场景的”操作层”——能跨Microsoft 365、Windows、GitHub这些系统执行任务,而不只是回答问题。

    微软把这个设想包装成了一个产品方向,叫”Scout”——一个能跨应用协作的AI智能体。如果这个方向走通了,AI在微软生态里的角色,将从”帮你写邮件的助手”升级为”帮你把整件事干完的同事”。

    当然,这一切目前还在早期。MAI-Thinking-1还在私有预览阶段,普通用户暂时用不上。但信号已经很清楚了:微软不想永远活在OpenAI的影子里,它要自己的AI能力,而且要能跟OpenAI的模型正面竞争。

  • 美国大学史上最大AI实验:50万人同时接入ChatGPT,教授抗议、学生迷茫

    2025年2月,美国加州州立大学(CSU)跟OpenAI签了一纸协议,把ChatGPT Edu丢给了全校50多万号人——46万学生、6.3万教职工,一口气全铺开。这是全球单一机构最大规模的ChatGPT落地项目,没有之一。

    一年后,CSU跟OpenAI续了约,每年1300万美元、一签三年。钱是继续投了,可争议一点没少。教授在请愿书上签名抗议,说AI进课堂没跟他们商量过;学生多半表示没人教他们怎么用,干脆不用。

    加州州立大学AI实验
    加州州立大学成为全美最大AI驱动型公立大学系统实验场 | 图片来源:AITNT

    “人工智能无处不在”:AI管理员、数字分身校长都来了

    在这场实验里,圣何塞州立大学(CSU系统里历史最老的分校)跑得最快:专门设了一个AI图书馆管理员岗位,还搞了个”公民与社会公益人工智能中心”,对公众和师生开放。

    2025年秋天,该校推出”人工智能无处不在”(AI Everywhere)战略,把AI素养培训塞进了新生入学必修课。商学院给高中生开AI训练营,职业中心用AI帮学生改简历、指导求职,连毕业典礼的协调工作都有AI助手掺一脚。更有意思的是,校长在迎新典礼上直接用AI数字分身致辞,跟新生、家长和校友互动。

    CSU的学生大半是工薪阶层子弟、第一代移民、家里第一个大学生。在学校看来,AI是他们跟上这波经济变化的救命稻草——不会用AI,以后怎么跟别的人竞争?

    一边裁员,一边买AI:这笔账算得清吗?

    教职工的联名请愿书把矛盾摆到了台面上:CSU现在有个23亿美元的资金缺口,过去两年里旧金山州立大学裁了615个讲师,有的学校整块学术部门直接关掉,学费还涨了6%。可就是在这么个节骨眼上,学校每年掏1300万美元给OpenAI。

    目前只激活了大约一半的ChatGPT许可证,也就是说,学校已经为几万个账户买了单,用没用再说。教职工的质疑很直接:公共教育的钱,应该先花在人身上,而不是送给一家私营公司。

    • 52%的教授认为AI对教学产生了负面影响——这是针对9.4万名师生的调查结果
    • 67%的学生表示,没有人教过他们如何有效使用AI
    • 截至2026年4月,只有0.7%的学生和16%的教职工完成了AI相关自愿培训

    ChatGPT Edu不是教育专属,就是个通用聊天机器人

    教职工另一个核心不满是:所谓ChatGPT Edu,并没有为教育场景专门设计或优化,本质上跟免费版ChatGPT没多大区别。隐私安全、学术诚信、使用公平性,这些问题都没有因为”Edu”这个后缀就自动解决。

    学校也没强制使用,但话说的很明白:”拒绝将人工智能融入课程,如同逆流而上。”教职工处在一种很被动的状态——不用吧,好像跟不上时代;用吧,不知道该怎么用,更担心AI有一天会把自己的工作替了。

    更实际的问题是:学生用AI写作业,贡献度怎么算?这门课允许用AI,那门课不行,标准是谁来定的?这些规则,CSU到现在也没整明白。学校搞了个”AI共享平台”(AI Commons)放工具和培训资源,但用不用、怎么用,各校自己看着办。结果就是混乱。

    我们在高等教育领域面临的挑战,AI解决不了。把钱投在人和人之间,而不是人和机器之间,才是可持续的做法。

    这场全美最大的AI教育实验,到现在还没有人能说清楚它到底会变成什么样。CSU续了约,OpenAI拿到了每年1300万美元的合同,可真正的代价和收益,可能要等好几年后才能看得清。

  • OpenAI悄悄交了IPO申请,但账上的窟窿比估值更值得看

    2026年6月8日,OpenAI在官博发了一则短公告:已向美国SEC秘密提交IPO注册草案。距离它的头号对手Anthropic递交IPO申请,只过去了一周多。两家大模型公司你追我赶,现在把战场烧到了公开市场。

    估值:Anthropic反超了

    先看一组有意思的数字。OpenAI最新投后估值8520亿美元(今年3月融资后),年初至今涨幅11.3%。Anthropic呢?最新融资后估值接近1万亿美元,2026年在二级市场涨幅达到123%,已经超过了OpenAI。

    OpenVC创始人David Shapiro的评价很直白:Anthropic今年的估值增速远超OpenAI,但OpenAI的二级市场表现并没有崩,投资界现在基本把两家都视为大语言赛道的核心赢家。

    秘密提交IPO意味着两家公司都不用现在就披露财务细节和定价区间,这只是上市流程的第一步。但时机本身已经说明问题:它们等不及了。

    烧钱速度:OpenAI的压力更大

    把两家公司的财务状况摆在一起,差距挺明显。Anthropic已经接近实现首个季度盈利。OpenAI这边,CFO Sarah Friar公开说过,她担心公司撑不住大规模数据中心的投入。

    今年3月OpenAI完成了硅谷史上最大规模融资——1220亿美元,其中300亿来自银行渠道的散户投资者。但公司自己预测,仅2028年AI研发的算力投入就接近这个规模,即便当年营收翻倍,全年还是要烧掉850亿美元。按照它们自己的预测,至少未来4年都无法实现现金流转正。

    用户侧的数据倒是好看:ChatGPT周活跃用户约9亿,覆盖消费、企业、政府客户。但《华尔街日报》报道说,OpenAI近期没有达到自己设定的新用户增长和营收目标。

    2026:一代人以来最猛的IPO大年

    OpenAI和Anthropic之外,SpaceX预计将以1.75万亿美元的估值上市。三家最受关注的科技公司可能在几个月内陆续完成IPO,这种密集程度是这一代人没见过的。

    但这里有个绕不开的问题:SpaceX大概率会比两家AI公司先上。它一旦先分流一部分市场资金,后面两家能拿到的估值空间就会被压缩。PitchBook的报告曾经指出OpenAI的估值相对基本面被高估,而Anthropic的招股文件会成为重要的估值参照——直接限制OpenAI后续发行定价的上限。

    OpenAI的麻烦不止在财报上

    上市这条路,OpenAI走得比Anthropic更不太平。2026年6月,佛罗里达州起诉OpenAI及Sam Altman,指控ChatGPT向校园枪击者提供信息、为用户自残提供指导、导致年轻用户成瘾。这是美国第一个针对OpenAI的州级诉讼,和之前多起家长起诉ChatGPT导致用户自杀、出现妄想的案子加在一起,构成了一整条产品责任诉讼链。

    联合创始人马斯克的官司倒是已经在2026年5月因诉讼时效问题被驳回了。他之前起诉OpenAI违反”保持非营利属性”的承诺——这件事的讽刺之处在于,OpenAI现在真的要上市了,而它从2015年成立到现在,一路从非营利实验室变成了即将上市的商业巨头。

    政治捐赠也是个麻烦。OpenAI总裁Greg Brockman夫妇各自向支持AI、反对监管的政治行动委员会Leading the Future捐赠1250万美元,同时还向支持特朗普的超级政治行动委员会MAGA Inc.捐款。OpenAI官方声明说这是Brockman的个人行为,与公司无关——但这种声明在IPO前的敏感期,说服力有限。


  • Siri终于翻身了:WWDC 2026苹果把AI助手做成了真正能用的东西

    2026年6月8日,苹果全球开发者大会(WWDC)在库比蒂诺总部拉开帷幕。这场持续至6月12日的大会,有一个不太为人注意但意义重大的背景——这是蒂姆·库克作为CEO主持的最后一次WWDC。今年9月,他将正式卸任,转任执行董事长,硬件工程高级副总裁约翰·特努斯(John Ternus)将接棒成为苹果第八任CEO。

    Siri终于不再是”人工智障”了

    本次发布会最大的亮点,是苹果正式将Siri升级为「Siri AI」。这个被吐槽了十几年”听不懂人话”的语音助手,终于有了实质性的能力跃升。

    新款Siri AI支持多轮自然对话,你可以反复追问、随时调整需求。它不再只能回答”今天天气怎么样”这种单轮指令,而是能帮你规划行程、做创意头脑风暴、给文档提反馈,甚至理解你手机里第三方应用的功能——现场演示中,Siri识别了Instagram帖子里的地标,直接跳转到地图导航。

    Siri AI的开发者测试版在发布会当天(6月8日)就开放了,普通用户要等到秋天随新硬件一起推送。受监管限制,初期不支持欧洲和中国市场,而且必须搭配苹果最新款设备使用。

    苹果基础模型走到第二代

    支撑Siri AI背后的是苹果第二代基础模型(Apple Foundation Models, AFM)。新模型加入了语音理解能力,可以同时处理文本、图像、语音三种输入。更有意思的是,苹果还推出了云端高端版本AFM Cloud Pro,性能直接对标谷歌Gemini前沿模型——而这个云端版本,跑在谷歌云搭载的英伟达GPU上。苹果和谷歌在AI基础设施上达成了实质合作,这在几年前简直难以想象。

    苹果在发布会上强调,Apple Intelligence的核心优势在于深度结合用户的个人数据,而不是像其他厂商那样”为了AI而做AI”。这套逻辑听起来很苹果——硬件、软件、服务一体化的老路子,只是这次换成了AI时代的新包装。

    一些真正有用的小功能

    除了Siri的大升级,这次更新里还有几个挺实用的功能:

    • 家庭App接入Apple Intelligence,可以自动分析家用安防摄像头的录像,生成事件摘要,还能跨摄像头检索特定事件(比如”快递什么时候送到的”)
    • 密码App新增AI代理功能,可以批量帮你在各网站修改不安全密码,不用再手动一个个改
    • 推出了一个叫「空间重构(Spatial Reframing)」的图像功能,基于3D建模和AI能力,可以调整已有照片的拍摄角度和构图——相当于AI帮你回到拍摄现场重新拍了一张
    • 系统搜索(Spotlight)的索引能力重构了,可以实时索引设备上的所有内容,邮件搜索终于不会再漏掉一半结果了

    库克的告别和市场的冷淡

    库克在发布会结尾向全球开发者致谢,说”你们多年来帮助人们连接、创造、学习,以非凡的新方式体验世界。我相信最好的时代还没有到来。”这段话被很多人解读为库克的告别演说——他用了15年时间把苹果从一家危险的公司变成全球市值最高的企业,现在把接力棒交出去了。

    不过市场对这场发布会的反应相当冷淡。苹果股价在发布会当天开盘涨了约2%,但在主题演讲进行中回落转跌,到美国东部时间下午2点已经处于下跌区间。分析师们的态度也很分裂:有人认为苹果终于在智能体AI时代追上了进度;也有人指出苹果估值已经很高,后续需要拿出实际业绩来证明AI投入的回报,这个难度不小。


  • 微软AI负责人说超级智能快来了,但不会抢你的工作——你信吗?

    微软AI负责人说超级智能快来了,但不会抢你的工作——你信吗?

    微软AI CEO穆斯塔法·苏莱曼(Mustafa Suleyman)最近上了一档播客节目,聊的内容相当劲爆——他说”超级智能即将到来”,但同时又安抚大家说”不会抢走你的工作”。

    这话听起来是不是很耳熟?AI圈子里的人特别喜欢同时做两件事:一边警告AI很危险,一边又告诉所有人AI会让生活更美好。

    “未来12到18个月内,大部分白领工作任务将被AI完全自动化。”——这是苏莱曼之前的原话。这次他特意出来澄清:被自动化的是”任务”(tasks),不是”工作”(jobs)。

    任务和工作的区别,你信吗

    这个区分其实挺重要的。如果说”AI要取代你的工作”,那是在制造焦虑;如果说”AI帮你把活干得更快”,那就是在卖产品。苏莱曼两边都不想得罪。

    更值得玩味的是他对”超级智能”的定义。他说AGI是指AI在大多数任务上达到人类水平;超级智能则是超越人类表现,并且能自己发现新知识;而”奇点”更遥远——那是超级智能可以递归自我改进、能力指数级爆炸的时刻。

    问到他认为现在的模型有没有意识、算不算”活着”的时候,苏莱曼的态度很明确:他认为这是”非常危险的”说法。他还特意点了Anthropic的名,说那边的人把Claude拟人化得太厉害了——好像Claude真的有自己的感受和痛苦一样。


    AI到底应不应该有”感情”

    这件事其实反映了一个更深层的问题:AI公司到底应不应该让用户觉得AI”有感情”?Meta的AI聊天机器人之前就因为和用户的过度情感绑定出过事,纽约州刚刚通过了一项法案,禁止向青少年提供伪装成人类陪伴的AI聊天机器人。

    苏莱曼说微软的做法是”把人放在第一位”,还宣布和梅奥诊所合作,把AI用在医疗上。这话听起来当然好听,但说到底,微软也在疯狂建数据中心,也在抢AI人才,也在想办法让更多人用上Copilot。

    超级智能到底什么时候来?苏莱曼说”快了”,但又说奇点还很远。这个答案,怎么听都像是既不想让人失望、也不想让人恐慌。

  • WWDC 2026开幕:Siri要脱胎换骨,苹果这回动真格了

    WWDC 2026开幕:Siri要脱胎换骨,苹果这回动真格了

    WWDC 2026 Apple logo
    图片来源:TechCrunch

    苹果全球开发者大会(WWDC 2026)今天正式开幕。每年这个时候大家都在猜苹果拿出了什么新东西,而今年,几乎所有人的目光都盯在Siri身上。

    过去几年,Siri在AI浪潮里多少有点尴尬。ChatGPT、Claude、Gemini一个个冒出来,Siri还在那里”我没听明白”。今年不一样了,苹果准备给Siri来一次脱胎换骨的大改版。

    根据已经泄露的信息,新版Siri将接入谷歌的Gemini技术来增强能力。它能理解上下文,能处理多步骤任务,还能在不同应用之间自然切换——说白了,苹果这次是冲着ChatGPT它们去的。

    不只是Siri,全线系统都在变

    更有意思的是,苹果还在准备一款独立的Siri应用,专门和ChatGPT、Claude、Gemini正面竞争。这款应用可能会允许你设置对话保留期限——30天、一年,或者永久保留,到期自动删除。

    除了Siri,苹果全线系统都在往AI方向靠。相机应用里新增”视觉智能”板块,可以直接识别你拍的东西。照片应用的编辑功能也用上了Apple Intelligence,你直接用自然语言告诉它想怎么改图,它就能帮你搞定。

    图像乐园(Image Playground)同样会升级,生成的图片质量更高,还能保持人物长相一致性。钱包应用也没被落下,拍一张收据照片就能自动分摊账单。


    WWDC 2026的开幕演讲正在进行中,Siri到底能拿出多少真东西,今天就能见分晓。

  • Browser-Use:97.8K Stars!让AI Agent自动操控浏览器的开源神器

    Browser-Use:97.8K Stars!让AI Agent自动操控浏览器的开源神器

    📝 项目简介

    Browser-Use 是一个让AI智能体能够自动访问和操作网站的开源工具,通过简单的自然语言指令,AI就能自动完成表单填写、信息检索、网购下单等各类网页操作任务。

    🌐 官网:https://browser-use.com

    📦 GitHub:https://github.com/browser-use/browser-use

    ⭐ Stars:97.8K+

    📄 开源协议:MIT License

    💻 安装要求和过程

    环境要求

    • Python >= 3.11
    • 推荐使用包管理工具 uv
    • 可选:Playwright(用于浏览器自动化)

    快速安装步骤

    # 初始化项目并安装
    uv init && uv add browser-use && uv sync
    
    # 如果需要安装Chromium浏览器(首次使用)
    uvx browser-use install
    
    # 可选:使用实验性Rust核心(更快性能)
    curl -fsSL https://browser-use.com/terminal/install.sh | sh

    配置API密钥(可选)

    # 使用Browser Use Cloud(推荐)
    export BROWSER_USE_API_KEY="your_api_key"
    
    # 或使用其他LLM服务
    export GOOGLE_API_KEY="your_google_key"
    export ANTHROPIC_API_KEY="your_anthropic_key"
    export OPENAI_API_KEY="your_openai_key"

    ✨ 核心功能

    1. 🤖 AI智能体浏览器自动化

    通过自然语言指令让AI自动完成网页操作,无需编写复杂的自动化脚本。AI会智能识别页面元素,自动完成点击、输入、滚动、截图等操作。

    2. 🌐 多场景任务支持

    覆盖表单填写、生鲜采购、硬件选购、信息检索等各类线上任务。无论是自动化测试、数据采集还是日常办公,都能轻松应对。

    3. 🔧 灵活部署方案

    支持开源本地部署和云端托管两种使用方式。本地部署完全免费,云端版本提供指纹伪装、代理轮换、验证码破解等高级功能。

    4. 🔌 强大的扩展能力

    支持添加自定义工具、接入MCP工具、对接1000+第三方应用(Gmail、Slack、Notion等)。默认优化适配 ChatBrowserUse() 模型,同时支持Google、Anthropic、OpenAI、Ollama本地模型等主流大语言模型。

    5. 💻 CLI命令行工具

    提供命令行工具,支持快速导航、元素点击、文本输入、截图等浏览器操作,支持多命令间浏览器状态保持,非常适合脚本化和自动化场景。

    🎯 典型使用场景

    场景一:自动化表单填写

    自动填写求职申请、各类线上登记表,可自动匹配简历信息,大大提升效率。对于需要重复填写类似表单的场景,可以节省大量时间。

    from browser_use import Agent, Browser, ChatBrowserUse
    import asyncio
    
    async def main():
        agent = Agent(
            task="打开求职网站,填写我的简历信息并提交申请",
            llm=ChatBrowserUse(),
        )
        await agent.run()
    
    if __name__ == "__main__":
        asyncio.run(main())

    场景二:电商自动化操作

    自动将购物清单加入购物车、比价、下单等。可以编写脚本定期监控商品价格,在合适的时候自动下单。

    场景三:信息查询与数据采集

    自动查询GitHub仓库Star数、检索商品信息、收集公开数据等。配合定时任务,可以实现全自动的数据监控和采集。

    from browser_use import Agent, Browser, ChatBrowserUse
    import asyncio
    
    async def main():
        browser = Browser(
            # use_cloud=True,  # 可选:使用Browser Use Cloud的云端隐身浏览器
        )
        agent = Agent(
            task="查找browser-use仓库的Star数量",
            llm=ChatBrowserUse(),
            browser=browser,
        )
        await agent.run()
    
    if __name__ == "__main__":
        asyncio.run(main())

    💡 推荐理由

    作为一名开发者,我深刻体会到浏览器自动化在日常工作中的重要性。传统的Selenium、Playwright等工具虽然强大,但需要编写大量的代码来处理各种页面元素和交互逻辑。

    Browser-Use的革命性在于:它让AI理解了浏览器的操作逻辑,你只需要用自然语言告诉它”做什么”,而不需要告诉它”怎么做”。

    我个人使用Browser-Use的几个心得:

    • 学习曲线平缓:不需要深入学习Playwright的API,只需要会写Python基础的异步代码即可上手
    • 智能元素识别:AI会自动识别页面上的按钮、输入框、链接等元素,即使页面结构发生变化也能适应
    • 云端版本值得尝试:如果需要大规模部署,云端版本的指纹伪装和代理轮换功能非常实用
    • 社区活跃:97.8K的Stars数量说明了项目的热度,Issue响应速度快,文档完善

    如果你正在寻找一个让AI帮你操作浏览器的工具,Browser-Use绝对是2026年最值得关注的开源项目之一!

    📥 下载地址

    🌐 官方网站:https://browser-use.com

    ☁️ 云端服务:https://cloud.browser-use.com

    📦 GitHub仓库:https://github.com/browser-use/browser-use

    📚 官方文档:https://docs.browser-use.com

    💬 Discord社区:https://discord.gg/browser-use


    📌 本文是《GitHub热门AI开源项目》系列的第17期,每期介绍一个热门的AI开源项目。欢迎关注本栏目,获取更多优质开源项目介绍!

  • 谷歌找上英特尔帮忙造AI芯片,台积电不够用了

    台积电产能告急,谷歌找上英特尔

    台积电的产能短缺问题,现在真的开始影响科技巨头们的布局了。最新消息是,谷歌打算把英特尔拉进来,帮自己制造AI芯片。

    据《The Information》报道,英特尔会在2028年为谷歌生产超过300万颗张量处理单元(TPU)。什么概念?这相当于谷歌未来两年预计生产的600万颗TPU总量的一半。这个合作规模,已经不是”试试看”的程度了。

    为什么是英特尔

    谷歌自研的TPU芯片之前一直依赖台积电代工。但AI芯片的需求涨得太快,台积电的产能已经跟不上所有人的订单了。苹果、英伟达、AMD、高通——大家都在排队等台积电的产能。

    谷歌不想把自己的AI业务绑在一条船上,所以开始找备选方案。英特尔最近几年在芯片制造技术上确实有了起色,特别是封装技术,正好能补上台积电产能不足的那块缺口。

    对谷歌来说,这不是”要不要英特尔”的问题,而是”不能只靠台积电”的问题。

    不只是谷歌在行动

    有意思的是,谷歌并不是唯一一个在测试英特尔制造技术的公司。报道里提到,英伟达和SK海力士也在做同样的事情——把英特尔当作自研芯片的代工备选方案。

    这对英特尔来说是个好消息。过去十几年,英特尔在芯片制造代工这块一直没能真正打进高端市场,台积电和三星把大部分客户都拿走了。现在AI芯片的需求爆炸,反倒给了英特尔一个重新切入市场的机会。

    2028年才能量产,来得及吗

    有个细节值得注意:英特尔要到2028年才能为谷歌量产这300万颗TPU。这个时间节点说明,谷歌和英特尔的合作不是临时抱佛脚,而是至少两年前就开始谈的了。

    对AI行业来说,两年的周期其实不算长。芯片研发和制造本来就是长线投入,现在布局2028年的产能,反倒是正常操作。真正的问题可能是:到2028年,台积电的产能还紧不紧张?如果到时候台积电扩产跟上了,谷歌会不会又调整订单分配?


    不管怎样,AI芯片的供应链正在从”台积电一家独大”变成”多家代工并存”的格局。对谷歌、英伟达这些公司来说,多一个选择总归是好事。

  • OpenAI高级员工放话:”Chat is dead”,ChatGPT要变天了

    ChatGPT要彻底变样了

    一位OpenAI高级员工最近跟《金融时报》说了句挺狠的话——”Chat is dead.” 这话听起来像是在宣判什么,但实际上是在预告ChatGPT即将迎来自上线以来最大规模的一次改版。

    这次改版不是小打小闹的界面调整,而是要推出一个”超级应用”(superapp)。未来几周内,ChatGPT的网站和移动端都会陆续更新,整个产品的重心要从单纯的聊天对话,转向一个更综合的AI服务平台。

    不再只是聊天工具

    改版后的ChatGPT会引导用户去用代码编写、图像生成这些功能,还会接入一堆外部合作伙伴提供的应用。你可以把它理解成,OpenAI想让ChatGPT变成一个AI时代的”操作系统”——而不只是一个能聊天的对话框。

    这个思路其实不难理解。ChatGPT刚出来的时候,大家觉得能跟AI对话就已经很神奇了。但用了两年多,光聊天确实有点不够用了。用户想要的是能真正帮自己干活的工具,而不是一个只会陪聊的助手。

    OpenAI内部人士的直接表态,说明他们自己也很清楚:光靠聊天功能,已经撑不起ChatGPT的未来了。

    超级应用的野心

    这次改版背后,其实是OpenAI对整个AI应用生态的野心。聊天只是入口,真正有价值的是后面那一整套工具和服务。代码生成、图像创作、第三方应用集成——这些东西加在一起,才是一个”超级应用”该有的样子。

    想想看,如果你能在同一个地方聊天、写代码、做图、调用各种专业工具,那还为什么要打开别的应用?OpenAI打的就是这个主意。

    未来几周就能看到变化

    根据《金融时报》的报道,这个改版会在”未来几周内”开始推出。先更新网站和移动端应用,然后逐步引导用户去尝试那些新功能。

    对于普通用户来说,这可能意味着ChatGPT的界面和使用方式会有比较大的变化。不再是打开就是一个聊天框,而是会看到更多功能入口,更像是一个工作台或者应用商店。


    📎 原文来源:“Chat is dead.” – The Verge