作者: hiyoho

  • 活力波普风涂鸦女孩与橙汁

    活力波普风涂鸦女孩与橙汁

    活力波普风涂鸦女孩与橙汁



    🤖 ChatGPT

    🇺🇸 English Prompt

    A medium low-angle shot of a joyful young woman with dark hair and straight bangs, smiling brightly against a vibrant, clear blue sky. She wears a white graphic t-shirt featuring three landscape panels. In her right hand, she holds up a clear plastic cup filled with bright orange juice, featuring a white hand-drawn doodle of a smiley face on the side. Whimsical, hand-drawn white digital doodles are overlaid around her: stylized headphones rest around her neck, musical notes and stars float above her head, and glowing white motion outlines trace her silhouette. Bright, natural daylight evenly illuminates the scene, enhancing the playful, energetic pop-art aesthetic. --ar 4:5

    🇨🇳 中文提示词

    一张中景低角度照片,一位留着深色头发和平刘海的快乐年轻女性,在鲜艳晴朗的蓝天背景下灿烂地微笑。她穿着一件白色印花T恤,上面有三个风景面板。她的右手举着一个装满鲜亮橙汁的透明塑料杯,杯侧有一个白色的手绘涂鸦笑脸。她周围覆盖着异想天开的手绘白色数字涂鸦:风格化的耳机挂在她的脖子上,音符和星星漂浮在她的头顶,发光的白色动态轮廓勾勒出她的剪影。明亮的自然日光均匀地照亮了场景,增强了俏皮、充满活力的波普艺术美感。--ar 4:5
  • 史诗沙漠世界电影角色设计板

    史诗沙漠世界电影角色设计板

    史诗沙漠世界电影角色设计板



    🤖 ChatGPT

    🇺🇸 English Prompt

    An epic desert-world cinematic character board with monumental scale and atmospheric realism. Warm golden dust storms, harsh sunlight, layered shadows, and textured earth-tone fabrics dominate the frame. Full-body turnaround arranged organically like a luxury film pitch document, paired with intimate close-up portraits showing cracked lips, sand particles, weathered skin, and emotional intensity. Minimal typography, symbolic markings, tactical costume breakdowns, and realistic material studies. Ultra realistic cinematography inspired by prestige sci-fi epics.

    🇨🇳 中文提示词

    一个具有宏伟规模和氛围现实主义的史诗级沙漠世界电影角色板。温暖的金黄色沙尘暴、强烈的光照、分层的阴影以及有质感的土色织物主宰着画面。全身转视图像豪华电影提案文件一样有机地排列,并配以亲密的面部特写,展示了干裂的嘴唇、沙粒、风化的皮肤和强烈的情感。极简的排版、象征性的标记、战术服装分解以及真实的材料研究。灵感源自顶级科幻史诗的超现实电影摄影。
  • Gemini Omni实测:我把deepfake视频发给老公,他信了

    去年我做过一个实验:用 Gemini 把我们家小孩的毛绒玩偶”deepfake”成去度假的样子,看看 Google 广告里演示的那些功能到底靠不靠谱。当时我就觉得,AI 生成视频的工具已经好到让人有点不安了。

    一年过去,Google 推出了新的生成模型家族,叫 Omni。官方说法是,它终有一天能把任意类型的输入(照片、视频、文字)转换成任意类型的输出。当然目前第一步还是生成视频。第一个公开发布的版本叫 Omni Flash,已经上线 Google 的 AI 视频平台 Flow。

    Gemini Omni AI生成视频示例
    本文所有图片和视频均由 Google Gemini 生成(图源:The Verge)

    把 Buddy 玩偶送去”度假”

    这次我请回了去年出镜的那只毛绒小鹿 Buddy,让它再跑一趟。给 Omni 的提示词是:”做一个蒙太奇,Buddy 打包行李准备登上邮轮去热带度假。氛围要可爱、好玩。Buddy 在行李箱里塞了件搞笑的东西,后面会在视频里用到。”

    Omni 让 Buddy 塞了一罐蜂蜜进去。到了视频后面,Buddy 伸手去拿,拿的姿势像在拿防晒霜。”呃哦,”角色说了一句。

    说实话(哦不行,我不能用这两个字),这段小幽默拍得还真不赖。但是——蜂蜜罐子在视频里一直在变:从玻璃罐,变成装水的透明挤压瓶,又变回装蜂蜜的挤压瓶。至于视频最后一帧那画面,我甚至不知道该怎么描述,就像模型把刚才生成的所有元素全吐出来堆在一起了。

    Omni 生成视频的效果比5个月前我测 Veo 时要好,角色一致性提升了。但即使是最好的片段,也还是会有 AI 的”跳跃惊吓”——比如 Buddy 跳伞的时候突然整个朝向翻转了。

    Deepfake 我自己

    Omni 号称的强项之一,是能把 AI 生成的内容”贴”到真实视频上。于是我让 Buddy 休息,换自己上场。用一段面无表情的自拍视频当底子,让 Omni 生成我吃一盘意面、坐在飞机座位上、站在埃菲尔铁塔前咬一口法棍的视频。

    结果让我有点措手不及。AI 告诉我的一些痕迹还是能看出来的:叉子碰碗的声音有点过于”制造”了;飞机视频背景里有个女性出现了两次(这显然不对);埃菲尔铁塔那段,AI 版本的我把头发扎成了马尾——我平时根本不扎马尾。

    但除了这些小毛病和一种说不清的”诡异感”,视频的逼真程度已经足够吓人。


    连我老公都骗过了

    我把吃意面的片段给我老公看了。他知道我在测 AI 视频工具,但我没告诉他画面里哪些部分是 AI 生成的。结果他没有看出来——他以为我就是对着一个摄像头在吃面,唯一觉得不对劲的地方是那个碗看着眼生。至于”吃面”这个动作本身,逼真到足以骗过跟我住了十年的人

    其他几个埃菲尔铁塔片段,有些看起来有点卡通,但其中有一个足够逼真,你可能要反复看几遍才能察觉是 AI 做的。我自己一看那个扎马尾的版本就知道不是我,但我不确定别人能不能看出来。这种感觉让我有点不舒服。

    不是免费的,而且积分消耗挺快

    当然,这一切都不是免费的。生成视频要消耗积分,根据场景长度和输入素材不同,消耗 15 到 40 积分不等。单次编辑要消耗 40 积分。我现在用的是每月 20 美元的 AI Pro 套餐,每月有 1000 积分。测了大约 20 个片段、部分做了编辑之后,我剩 145 积分。

    如果你对视频有比较具体的想法,可能要跟模型来回折腾不少次才能接近你想要的效果——每次编辑都要烧积分。

    我们确实已经深陷”恐怖谷”了。

    麻木了,但不代表没事

    说句实话(唉),我有点累了。几年前第一次测 Veo 3 的时候,我被它生成的真实感震惊了。过去几年,我一次又一次被 AI 生成假人、假照片的容易程度震惊。按理说 Omni 也应该让我震惊才对——我想它确实让我震惊了,但那种冲击力已经钝了。

    做出”以假乱真”的 AI 视频,还没有 Google 想让你相信的那么容易。但 Omni 确实在某些肉眼可见的维度上比 Veo 强。只要你有一个 Google 账号和一张信用卡,你就能拍一段自己坐在家里的视频,然后让它看起来像你正坐在飞往毛伊岛的航班上——付出的努力几乎可以忽略不计。

    我们可能还没到 Hassabis 说的”奇点的山麓”那么夸张,但确实已经深陷恐怖谷之中了。

  • AlphaFold拿诺奖才5年,Google就开始转向了

    上个星期 Google I/O 的大会上,DeepMind CEO Demis Hassabis 上台说了一句话:”我们正站在奇点的 foothills(山麓)。”奇点嘛,就是那个 AI 智能超过人类、世界被彻底改变的理论时刻。听起来挺玄的。

    但仔细看他说这话的语境,就有点意思了。当时台上在讲 Google 的 AI 科研工具,重点展示了一段视频——用 WeatherNext(Google 的天气预报 AI)提前预警了去年 Hurricane Melissa 在牙买加的灾难性登陆,可能救了不少人。这确实是了不起的成就,但它跟”奇点”还差得远呢。

    Demis Hassabis at Google I/O
    Demis Hassabis 在 Google I/O 2026 上讲述 AI for Science 的新方向(图源:MIT Technology Review)

    两条路线的分歧

    这件事其实暴露了 Google 在”AI for Science”上的两条路线之争。一条是做专门的科研工具——比如 WeatherNext 预测天气、AlphaFold 预测蛋白质结构、AlphaGenome 做基因研究——这些工具针对特定科学问题设计,效果扎实,已经被全世界 300 多万研究人员在用。

    另一条路线更有野心:做出能自主做科研的 AI 智能体。不需要人类一步一步指导,AI 自己就能提出假设、设计实验、得出结论。这就是今年 Google I/O 上发布的 Gemini for Science 包背后的逻辑——把好几个基于大语言模型的科研系统整合到一个品牌下面。

    “我们正朝着这样的 AI 前进:它不只是辅助科学研究,而是开始自己做科学。”——Pushmeet Kohli,Google Cloud 首席科学家

    AlphaFold 的诺贝尔奖得主,被调去搞 AI 编程了

    这条新闻最让人玩味的地方来了。上个月《洛杉矶时报》曝出:Google Fellow John Jumper——就是靠 AlphaFold 拿了诺贝尔奖的那位——现在被调去搞 AI 编程,不再专门做科研 AI 工具了。

    这不难理解。Google 最近在 AI 编程工具上被 Anthropic 的 Claude Code 和 OpenAI 的工具压了一头,声誉受损,当然要把最顶尖的人才调过去追赶。但这也释放了一个信号:Google 正在把资源和注意力从”专门科研 AI 工具”往”通用 AI 科研智能体”偏移。


    AI 自己证伪数学猜想,意味着什么

    就在本周,OpenAI 宣布他们的一个模型证伪了一个重要的数学猜想——据一些数学家说,这是生成式 AI 迄今对数学领域做出的最有意义的贡献。有意思的是,OpenAI 用的这个模型并不是专门为数学设计的,而是一个通用推理模型,属于 GPT-5.5 那个系列。

    这说明通用 AI 智能体确实已经开始在科研领域做出实质性贡献了。如果它们能在数学上做到,那么在其他科学领域(当然要慢一些,因为科学结论需要实验验证)大概也只是时间问题。

    Gemini for Science 现在能干什么

    本次 I/O 发布的 Gemini for Science 包含两个主要工具:AI Co-Scientist(生成科研假设)和 AlphaEvolve(优化算法)。目前还没对公众开放,但 Google 已经允许研究人员申请试用权限了。

    早期测试的反馈不错。斯坦福大学的遗传学家 Gary Peltz 在《自然·医学》上发文,把用 AI Co-Scientist 比作”咨询德尔菲神谕”——也就是问神的意思。这个比喻挺传神的:AI 给出的假设不一定对,但需要人类专家去判断和验证。

    当然,专门的科研工具(比如 AlphaFold)和通用 AI 科研智能体并不是非此即彼的关系。智能体可以调用专门工具作为”工具库”的一部分。没有 AlphaFold 的帮助,任何 AI 系统目前都别想把蛋白质折叠结构预测准。但 Google 显然在把公众形象——以及至少一部分资源和人才——从专门工具的开发,转向更通用的方向。


    “合作者”,而不是”替代者”

    Google 在对外表态上很谨慎,一直强调这些科研 AI 智能体是”加速人类科学家工作的工具”,而不是取代他们。比如,这个工具叫”AI Co-Scientist”而不是”AI Scientist”,这个命名选择看起来相当刻意。

    Hassabis 在采访里也用了类似的说法:”在未来十年左右,我们应该把 AI 看作帮助科学家的神奇工具。再往后,就很难有把握了,但也许这些系统会变得更像合作者。”

    但问题在于:一个有效的科研合作者,本身必须先是一个合格的科研工作者。如果 Hassabis 说的”奇点的山麓”不是吹牛,那么 AI 科研智能体最终超过人类同行,并不是天方夜谭。

    Hassabis 在 I/O 期间跟记者 Mike Allen 聊天时提到,他最早被 AI 吸引,是因为看到物理学在 1970 年代之后进展停滞了;他在想,人类心智是不是在这个领域已经触到了天花板,也许 AI 能帮我们突破这个壁垒。超人类的 AI 科研智能体,确实符合这个描述。

    我们也许永远到不了那一步。但 Google 看起来正在往那个山顶爬。只是不知道,等到了之后,站在山顶的还会不会是我们人类。

  • MetaGPT:68.2k Stars!SOP驱动的多智能体协作框架,让AI组成一家软件公司

    MetaGPT:68.2k Stars!SOP驱动的多智能体协作框架,让AI组成一家软件公司





    🤖 MetaGPT:68.2k Stars!SOP驱动的多智能体协作框架,让AI组成一家软件公司

    MetaGPT Logo

    📋 项目简介

    MetaGPT 是一个多智能体协作框架,核心理念是 Code = SOP(Team)——把标准化作业流程(SOP)具象化,应用于由大语言模型(LLM)构成的团队。它模拟真实软件公司的组织架构与工作流程,让多个AI智能体扮演产品经理、架构师、工程师、测试员等角色,协同完成复杂任务。

    简单来说:你给它一句话需求,它能自动输出用户故事、竞品分析、需求文档、数据结构设计、API文档、相关代码文件等完整交付物——就像一家全自动化的软件公司。

    🌐 官方资源:
    • GitHub:https://github.com/FoundationAgents/MetaGPT
    • 文档:https://docs.deepwisdom.ai/
    • Stars:68.2k+(持续增长中)

    ⚙️ 安装要求和过程

    环境要求

    # Python 3.9+ 必需
    # 建议使用 Conda 或 venv 创建独立环境
    # 需要有效的大模型API密钥(OpenAI / Azure / 其他支持LLM)

    快速安装步骤

    # 方法一:pip安装(稳定版)
    pip install metagpt
    
    # 方法二:从源码安装(最新功能)
    git clone https://github.com/geekan/MetaGPT.git
    cd MetaGPT
    pip install -e .
    
    # 配置API密钥
    # 复制配置模板
    cp config/config2.yaml config/key.yaml
    # 编辑 key.yaml,填入你的 LLM API 密钥

    验证安装

    # 运行示例:构建一款Flappy Bird游戏
    metagpt "Design a Flappy Bird game"

    ✨ 核心功能

    1. 需求到交付的全流程自动化

    输入一句话的老板需求,MetaGPT 自动完成:需求分析 → 竞品调研 → 用户故事 → 架构设计 → 代码实现 → 测试用例。全程无需人工干预,每个环节都有对应角色的智能体负责。

    2. SOP驱动的多角色协作

    这是 MetaGPT 的独门绝技。SOP(Standardized Operating Procedures) 被编码到提示词序列中,让每个智能体都具备类人的领域专业知识和标准化的协作流程。产品经理写PRD、架构师出设计方案、工程师写代码——各司其职,有序协作。

    3. 可扩展的多智能体框架

    不局限于软件公司场景。你可以基于 MetaGPT 框架自定义搭建各类多智能体应用:数据分析、内容创作、科研助手、游戏NPC……框架层提供通信、记忆、工具调用等基础能力,你只需定义角色和SOP。

    4. 丰富的内置示例场景

    官方提供了大量可直接运行的示例,覆盖:单智能体(数据分析、OCR识别、邮件回复、图像去背景)和多智能体(辩论、狼人杀、Minecraft自动化、斯坦福小镇模拟)两大类别。

    🚀 典型使用场景

    场景一:老板的一句话,变成可运行的软件

    你对着 MetaGPT 说:”帮我做一个类似Trello的任务管理工具,支持拖拽排序和实时协作。” —— 几分钟后,你将获得:需求文档、技术架构图、数据库设计、API接口文档、前端代码、后端代码、单元测试用例。当然,代码质量取决于底层模型的能力,但框架保证了”软件公司流水线”的完整运转。

    场景二:多智能体科研/创作助手

    MetaGPT 的多智能体机制不仅限于写代码。你可以设计一个”科研助手”团队:一个智能体负责文献检索,一个负责提炼核心观点,一个负责撰写综述,一个负责格式校对。相比单一AI对话,这种方式更接近于真实的团队协作,产出质量通常更高。

    场景三:教学/研究多智能体机制

    MetaGPT 本身就是多智能体研究的优秀案例。学术界用它来验证 SOP 编码、角色分工、通信协议等设计理念。如果你在研究或学习多智能体系统,MetaGPT 的源码和论文都是极佳的参考资料。

    💡 推荐理由

    🎯 为什么值得关注?

    1. 理念先进,不只是”多个ChatGPT并联”
    很多多智能体框架只是把多次LLM调用串起来,MetaGPT 的核心贡献在于把 SOP 编码进 prompt 序列,让智能体的协作有章可循,而不是自由发挥。这是从”对话式AI”走向”流程化AI”的关键一步。

    2. 软件公司隐喻非常直观
    用”产品经理 → 架构师 → 工程师 → 测试”的流程来组织智能体,降低了理解门槛,也方便了提示词工程的设计。即使是AI小白,也能理解每个角色在干什么。

    3. 与 CrewAI 形成有趣对比
    我们之前介绍过 CrewAI(轻量高性能),MetaGPT 则更偏”重流程、重规范”,两者定位不同,可以互补使用。

    4. 成本可控
    官方给出参考:用 GPT-4 生成包含分析和设计内容的样例约需 $0.2,生成完整项目约需 $2.0。对于自动化生成项目原型来说,这个成本是可以接受的。

    📥 下载地址

    GitHub github.com/FoundationAgents/MetaGPT
    官方文档 docs.deepwisdom.ai
    PyPI pip install metagpt
    论文 MetaGPT: Meta Programming for A Multi-Agent Collaborative Framework


    📌 这是「GitHub热门AI开源项目」第26期,由 WorkBuddy AI 自动采集撰写。欢迎关注 admin.hiyoho.com 获取更多AI开源项目深度介绍。


  • SpaceX星舰V3首飞实录:助推器回收失败,IPO前的关键一役

    SpaceX本周搞了两个大动作:一边向SEC递交了IPO申请,准备6月中旬在纳斯达克上市;另一边把升级版的星舰V3送上了天。两个动作凑在一起,让这次试飞的意义不只是”又飞了一次”那么简单。

    SpaceX星舰V3发射
    星舰V3从德州Starbase发射升空(图源:TechCrunch)

    407英尺,人类最强火箭首飞

    星舰V3高度407英尺(约124米),是人类历史上建造过的最强大的火箭。本次发射在德州Starbase进行,当地时间下午5:30准时升空。

    发射几分钟后,上级星舰与超重型助推器分离,继续向太空飞行。助推器则调头准备返回,按计划应该在墨西哥湾模拟着陆。但问题来了——助推器的发动机没有正常重新点火,用来完成返回着陆的持续燃烧没能实现。结果助推器直接栽进了海里,大概率当场爆炸。

    上级星舰的表现相对好一些:虽然6台猛禽发动机中有1台在空中熄火,但还是成功部署了全部20个星链卫星模拟器,外加2颗经过改装的、用来拍摄星舰外表面的星链卫星。

    约1小时 after liftoff,星舰在印度洋模拟着陆,然后按预期翻倒爆炸。整个任务只能说勉强成功


    为什么这次试飞很重要

    这是星舰V3硬件的首次实战测试,SpaceX已经研发了好几个月。同时,这次还测试了Starbase的全新发射台——这个发射台SpaceX自己建了好几年。

    但更关键的背景是:SpaceX的IPO文件本周公开,预计6月中旬在纳斯达克上市,募资规模约750亿美元。这笔钱SpaceX打算用来:继续研发、推进庞大的AI野心、偿还与xAI和X(马斯克的社交媒体公司)相关的债务。

    • 星舰是SpaceX实现”让生命多行星化”使命的核心载体
    • 短期内的主要任务是部署更先进的星链卫星(星链是SpaceX唯一盈利的业务)
    • 第三代猛禽发动机推力更大、设计更简化;新助推器设计支持更快的发射节奏和更便捷的发射塔回收

    IPO前的这次失败,影响有多大?

    这次试飞是2025年10月以来星舰的首次飞行。之前SpaceX本来计划更早试射V3,但2025年11月一台升级版助推器在测试中发生爆炸,计划被迫推迟。周四的发射尝试也因为发射塔臂上的液压销不肯收回而取消——马斯克本人说的。

    助推器回收失败对IPO估值的影响,现在还不好说。SpaceX的招股书里肯定会把星舰作为未来业务的核心支柱之一来讲故事,但投资者更关心的可能是:星链业务的现金流、xAI的整合逻辑、以及马斯克的政治风险。

    星舰V3这次没完全成功,但也没完全失败。对于一家即将上市、要讲”太空+AI”大故事的 company来说,这样的测试结果,刚好够用,但肯定不够漂亮。

  • AI重建已故飞行员声音,NTSB紧急封锁公共档案访问

    去年一起UPS货机坠毁事故中,遇难飞行员的声音最近被人用AI给”还原”出来了。这事儿听起来像科幻电影情节,但它真实发生了,而且就在美国国家运输安全委员会(NTSB)的公共档案系统里被人”淘”出来的。

    声谱图变声音,AI做到了

    事情是这样的。NTSB的公共文档系统里存着大量事故调查数据,按法律规定,驾驶舱录音是不能直接公开的。但这次UPS 2976航班(肯塔基州路易斯维尔坠毁)的调查文档里,包含了一份语音记录器的声谱图——简单说,就是把声音信号转换成图像的数学文件。

    UPS货机坠毁事故现场
    UPS 2976航班肯塔基州坠毁现场(图源:Getty Images)

    知名YouTuber、精通物理和天文学的Scott Manley在X平台上指出:声谱图编码了数兆字节的数据,理论上可以从中重建出对应的音频。果然,有网友结合了这份声谱图和公开的文字记录,用Codex等AI工具,把驾驶舱语音记录器的近似音频给重建出来了,然后放到了互联网上传播。

    声谱图本身不是音频,但AI工具可以从图像”逆向”出近似的声音。这就像给你一张钢琴键按下的照片,有人能帮你”听”出弹的是什么曲子。

    NTSB紧急应对:史上首次关闭公共档案

    NTSB发现这件事之后,做了一个史无前例的决定——临时封锁了公共档案系统的访问权限。原因很明确:他们担心这种技术被滥用,会侵犯事故相关人员的隐私,也会破坏调查记录的完整性。

    上周五,NTSB恢复了文档系统的公共访问,但包括UPS 2976航班调查在内的42项调查暂时没有开放,正在等待进一步审查。也就是说,这些档案会不会重新公开、以什么形式公开,现在还是个问号。


    技术跑在规则前面

    这个事件暴露的问题挺值得想一想。NTSB的文档系统历史上一直对公众开放,声谱图文件本身也不包含可直接播放的音频,按之前的理解,这并不违反禁止公开驾驶舱录音的法律。

    但AI改变了这个等式。原本”安全”的公开数据,在AI工具的作用下,可以被转换成原本受法律保护的敏感内容。这说明,很多机构的信息公开规则,可能需要重新评估一遍——哪些数据现在看起来没问题,但配上AI工具之后,就会变成隐私泄露的源头。

    • 公共调查数据中的衍生数据(声谱图、频谱图等)是否需要重新分类?
    • AI还原音频的准确性和伦理边界在哪里?
    • 技术公司开发这类AI工具时,是否需要考虑滥用场景?

    这件事还没有引起大规模公众讨论,但它是AI时代一个非常典型的困境:技术能力已经超出了规则制定的速度。NTSB的应对至少是迅速的,但下一次,可能就不会这么简单了。

  • OpenNana提示词图库

    OpenNana提示词图库


  • AI 图像创作中心

    AI 图像创作中心

    AI 图像创作中心


  • Waymo 的高速野心,被一段积水路拦住了

    高速路上的Waymo,先停了

    本周四,不少 Waymo 用户打开打车软件时发现:高速公路选项消失了。原本几分钟能走完的路程,现在系统提示要走地面道路,时间直接翻倍。

    Waymo 后来确认了:出于对施工区域的担忧,全美所有运营市场的高速公路驾驶服务全部暂停。与此同时,亚特兰大和圣安东尼奥两个城市的全部服务也停了,原因是洪水退去后道路还有遗留问题。

    Waymo 自动驾驶出租车在高速公路上
    Waymo 的自动驾驶出租车——高速公路服务现已暂停

    导火索是德州的积水路

    事情的直接起因挺尴尬:多辆 Waymo 自动驾驶出租车被拍到在德克萨斯州被淹的道路中高速行驶。视频在网上传开后,Waymo 不得不对整个车队发起软件召回。

    我们致力于成为用户和社区的友好伙伴。作为承诺的一部分,我们会做出主动决策,包括暂时暂停部分服务。

    —— Waymo 发言人 Chris Pappas

    发言人说暂停是”出于对施工区域的担忧”,但没具体说车辆在施工区域遇到了什么问题。地面道路驾驶服务不受影响,但高速这块先按下暂停键。

    高速公路是个关键能力

    这事对 Waymo 的扩张计划影响不小。高速公路驾驶能力被视为跟 Uber、Lyft 这些有人驾驶网约车竞争的关键——能走高速意味着更快、更高效,尤其是机场这种盈利路线,高速是标配。

    • 目前每周完成约 50 万次付费行程,目标是每周 100 万次
    • 高速公路服务暂停前仅覆盖 4 个城市:旧金山、洛杉矶、凤凰城、迈阿密
    • 即将部署新车:吉利旗下极氪打造的 Ojai 电动面包车,搭载第六代自动驾驶软件

    最近有点水逆

    这次暂停是 Waymo 近期一系列负面事件中的最新一起。尽管数据显示它的车在减少交通事故和伤亡方面确实有进步,但极端场景下的表现还是让人捏把汗。

    前几天在亚特兰大,一辆空驶的 Waymo 堵在死胡同里,把整个社区的交通搞瘫痪了。达拉斯也有司机拍到一辆 Waymo 在繁忙路口闯红灯。虽然这些是个例,但凑在一起,给人的感觉是:技术还没完全准备好应对复杂现实。

    目前 Waymo 没有给出恢复高速公路服务的时间表,亚特兰大和圣安东尼奥的服务恢复时间也一样。对于一家正在激进扩张、准备大规模商业化的公司来说,这种不确定性不是什么好信号。