标签: AI

  • 让AI替你面试——Stockholm创企想让招聘反过来玩

    Fika Jobs AI面试平台
    Fika Jobs平台让候选人与AI智能体进行视频面试(图源:Fika Jobs)

    找工作这件事,从来都是候选人适应雇主的规则。简历怎么写、Cover Letter怎么改、HR的AI筛选系统要什么关键词——全是雇主说了算。斯德哥尔摩创企Fika Jobs想把这套逻辑翻过来。

    6月23日,这家公司宣布完成400万美元pre-seed轮融资,由Luminar Ventures领投,Alliance VC和《Candy Crush》联合创始人Sebastian Knutsson、Riccardo Zacconi跟投。

    让AI替你面试

    Fika做的事情简单说就是:让AI智能体当面试官,把候选人的回答自动剪成短视频片段,做成一个持续更新的视频档案。雇主不用再对着一叠叠简历筛人,而是直接去浏览一个已经经过AI面试的候选者资料池。

    创始人兄弟Jakob Dubois(CEO)和Alexander Dubois(CTO)的灵感来自他们上一次创业的经历。当时他们在招人做社交应用Gaff,有个候选人的简历平平无奇,他们差点就不聊了。结果一通电话打过去,几分钟就发现这人有着他们想要的全部特质——有韧性、有野心、沟通利索。”简历根本看不出来这些”,Jakob说。

    Fika的操作流程是这样的:求职者先关联自己的LinkedIn档案,平台的AI会根据背景生成个性化面试问题,然后候选人和AI智能体进行一场大约10分钟的视频面试。面试用的是Google的Gemini模型驱动。结束后,Fika自动把回答切成短视频片段,整理成一个动态档案。

    和竞争对手不一样的地方

    和Alex、Maki、Mercor这些同样在用AI做招聘的工具不一样的是,Fika的重心在候选人这边。大多数竞品是帮雇主更高效地筛人,Fika想做的是让候选人建好一个视频档案之后,不用每投一个岗位就重新来一遍。

    平台的商业模式是:对求职者免费,对雇主也不收预付费用。成功录用后,Fika抽候选人年薪的10%作为佣金。创始人说这比传统猎头20%到30%的收费要低。

    传统猎头的收费一般是候选人年薪的20%到30%,Fika把这个数压到了10%,而且只有在成功录用后才收费。

    视频档案的偏见风险

    当然这个模式有明显的风险。视频档案意味着雇主能在看简历之前就看到候选人的种族、年龄、性别、外貌和口音——这些在纸质简历里至少是被部分遮蔽的信息。盲目简历筛选(blind resume screening)之所以被一些公司采用,就是为了避免这种前置偏见。Fika还没公开说明打算怎么处理这个问题。

    目前平台上的等待名单上已经有超过100家公司,另有50多家公司已经测试过平台,包括Plenty Labs、SICS.ai、Kognity和Rebtel。平台本周向候选人开放早期访问,计划在秋季全面公开上线。前期聚焦瑞典市场,之后再向国际扩张。

    Fika目前团队规模还小,预计到今年年底扩展到10人左右。


    这件事最有意思的地方在于:当雇主用AI筛简历变得越来越普遍,候选人这边也开始用AI来展示自己。招聘这个双边市场,两边都在被AI重塑——只是方向还不太一样。

  • FastAPI:构建AI服务API的现代化Python框架,80K+ Stars让API开发快如闪电

    FastAPI:构建AI服务API的现代化Python框架,80K+ Stars让API开发快如闪电

    FastAPI Logo

    FastAPI — 构建API的现代化Python框架

    📌 项目简介

    FastAPI 是基于 Python 3.8+ 类型提示构建的高性能 Web 框架,专为构建 API 设计。它结合了 Starlette(Web部分)和 Pydantic(数据验证部分)的优点,让开发者能够用最少的代码快速构建生产级 API 服务。FastAPI 已成为 AI/ML 服务部署的标配框架,被 Netflix、Uber、Microsoft 等公司广泛使用。

    80K+
    GitHub Stars

    8.5K+
    Forks

    4.6K+
    贡献者

    MIT
    开源许可

    ⚙️ 安装要求和过程

    环境要求

    • Python:3.8+ (推荐 3.10+ 获得最佳性能)
    • 操作系统:Windows / macOS / Linux 全平台支持
    • 依赖项:Starlette(Web框架)、Pydantic v2(数据验证)、Uvicorn(ASGI服务器)

    快速安装

    # 安装 FastAPI 和 Uvicorn(ASGI 服务器)
    pip install fastapi uvicorn
    
    # 如果需要所有可选依赖(包括 JSON Schema 生成、OAuth2 等)
    pip install fastapi[all]
    
    # 创建第一个 API
    # main.py
    from fastapi import FastAPI
    
    app = FastAPI()
    
    @app.get("/")
    async def root():
        return {"message": "Hello World"}
    
    # 启动服务
    # uvicorn main:app --reload

    依赖说明

    依赖 用途
    Starlette Web 框架核心,处理请求路由、中间件、WebSocket等
    Pydantic v2 数据验证和序列化,基于 Python 类型提示
    Uvicorn 高性能 ASGI 服务器,用于运行 FastAPI 应用
    httpx 异步 HTTP 客户端,用于测试

    🚀 核心功能

    1. 基于类型提示的自动数据验证

    利用 Python 3.8+ 的类型提示(Type Hints)和 Pydantic,FastAPI 自动对请求参数、请求体进行数据验证,无需手动编写验证逻辑。如果验证失败,自动返回清晰的错误信息。

    from fastapi import FastAPI
    from pydantic import BaseModel
    
    class Item(BaseModel):
        name: str
        price: float
        is_offer: bool = False
    
    app = FastAPI()
    
    @app.post("/items/")
    async def create_item(item: Item):
        return {"item_name": item.name, "price": item.price}

    2. 自动生成 API 文档(OpenAPI & JSON Schema)

    FastAPI 基于 OpenAPI 标准自动生成交互式 API 文档,无需额外配置。启动服务后访问 /docs 即可看到基于 Swagger UI 的交互式文档,访问 /redoc 可看到 ReDoc 文档。

    💡 自动文档:定义好 Pydantic 模型后,FastAPI 会自动生成符合 OpenAPI 规范的 JSON Schema,并渲染为可交互的文档界面,大大降低了前后端协作成本。

    3. 异步支持(async/await)

    基于 Python 的 async/await 语法,FastAPI 原生支持异步请求处理,能够充分利用现代 Python 的异步能力,处理高并发请求时性能卓越。与 Node.js 和 Go 相当的性能表现。

    4. 依赖注入系统

    <

    FastAPI 提供了强大而直观的依赖注入(Dependency Injection)系统,可以轻松实现认证、数据库连接、权限校验等横切关注点,代码复用率高且易于测试。

    from fastapi import Depends, HTTPException
    
    async def verify_token(token: str):
        if token != "secret":
            raise HTTPException(status_code=401)
        return token
    
    @app.get("/protected")
    async def protected_route(token: str = Depends(verify_token)):
        return {"message": "Authenticated!"}

    5. 安全性内置支持

    FastAPI 内置了 HTTP 基础认证、OAuth2、JWT、API Key 等多种认证方式,并提供了完整的安全工具函数,帮助开发者轻松构建安全的 API 服务。

    💡 典型使用场景

    场景一:AI/ML 模型服务化部署

    FastAPI 是 AI/ML 模型服务化部署的首选框架。结合 PyTorch/TensorFlow/ONNX Runtime,可以快速将训练好的模型封装为 HTTP API,供其他服务调用。

    from fastapi import FastAPI
    import torch
    from transformers import pipeline
    
    app = FastAPI()
    model = pipeline("sentiment-analysis")
    
    @app.post("/predict")
    async def predict(text: str):
        result = model(text)[0]
        return {"label": result["label"], "score": result["score"]}

    案例:Hugging Face 的 Inference API、Modal、Replicate 等 AI 推理平台都使用 FastAPI 作为底层 API 框架。

    场景二:微服务架构中的 API 网关

    FastAPI 的高性能和异步特性使其非常适合作为微服务架构中的 API 网关或边缘服务,负责请求路由、认证、限流、日志等横切关注点。

    案例:Netflix 使用 FastAPI 构建部分数据管道的 API 服务;Microsoft 在 Azure 的一些内部服务中使用 FastAPI。

    场景三:实时 WebSocket 应用

    FastAPI 基于 Starlette,原生支持 WebSocket,适合构建实时通信应用,如在线聊天、实时数据推送、协同编辑等。

    from fastapi import FastAPI, WebSocket
    
    app = FastAPI()
    
    @app.websocket("/ws")
    async def websocket_endpoint(websocket: WebSocket):
        await websocket.accept()
        while True:
            data = await websocket.receive_text()
            await websocket.send_text(f"Message: {data}")

    🌟 推荐理由

    FastAPI 是我个人最喜爱的 Python Web 框架,没有之一。以下是我的使用心得:

    • 开发效率极高:类型提示 + 自动验证 + 自动文档,让我能够专注于业务逻辑,而不是花时间写样板代码和文档。
    • 学习曲线平缓:如果你熟悉 Python 类型提示,只需一个下午就能上手 FastAPI。官方文档非常详细,包含大量示例代码。
    • 性能卓越:基于 Starlette 和 Pydantic,FastAPI 的性能可以媲美 Go 和 Node.js,在 Python Web 框架中属于第一梯队。
    • AI/ML 生态友好:FastAPI 是 AI/ML 社区的首选 API 框架,与 PyTorch、TensorFlow、Hugging Face Transformers 等库无缝集成。
    • 生产就绪:内置数据验证、序列化、认证、文档等生产级特性,不需要依赖大量第三方库。

    💡 个人建议:如果你正在构建 AI 服务的 API 接口,FastAPI 是不二之选。它不仅能提升你的开发效率,还能确保服务的性能和可维护性。我几乎所有 AI 相关的后端项目都使用 FastAPI。

    📊 技术对比:FastAPI vs Flask vs Django

    特性 FastAPI Flask Django
    性能 ⭐⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐
    异步支持 原生支持 需第三方库 部分支持
    数据验证 自动(Pydantic) 需手动/Marshmallow Forms/Serializers
    API 文档 自动生成 需第三方库 DRF 支持
    学习曲线 平缓 最平缓 陡峭
    适用场景 API 服务、AI/ML 小型应用、原型 全栈 Web 应用

    📥 下载地址

    快速开始

    # 安装 FastAPI 和 Uvicorn
    pip install fastapi uvicorn
    
    # 创建 main.py
    from fastapi import FastAPI
    
    app = FastAPI()
    
    @app.get("/")
    async def root():
        return {"message": "Hello FastAPI"}
    
    # 启动开发服务器
    uvicorn main:app --reload
    
    # 浏览器访问 http://localhost:8000/docs

    🚀 同类推荐

    如果你喜欢 FastAPI,还可以关注:

    • Starlette:FastAPI 的底层 Web 框架,如果你需要更底层的控制
    • Pydantic:FastAPI 使用的数据验证库,也可独立使用
    • Uvicorn:FastAPI 推荐的 ASGI 服务器
    • Flask:轻量级 Web 框架,适合小型项目
    • Django REST Framework:如果你需要全栈 Web 框架 + API

    📌 本文定期更新,最后更新:2026年6月 | 项目GitHub:fastapi/fastapi

  • REI的Instagram广告里自行车长了两副车把,锅居然甩给了Meta的AI

    两根车把的自行车

    户外用品零售商REI Co-op最近在Instagram上投了一则广告,推广Van Rysel品牌的自行车。广告图里,一位女士站在公园里,旁边是一辆自行车。看起来挺正常的一则推广,但有些眼尖的用户发现了一个问题:图里的自行车好像有两副车把。

    Reddit上有个帖子周末的时候火了,标题是「REI居然用AI垃圾广告,说好的环保呢」。帖子里的广告截图清楚地显示,那辆自行车的架子上长了两组把手——一组在平常的位置,另一组不知道从哪冒出来的,像是从车架中间伸出来的。

    这则广告很快就从Instagram上撤下来了,但截图已经在网上传开了。

    AI生成广告翻车概念图
    AI生成广告内容出错的概念示意图

    REI把锅甩给了Meta

    事情曝光后,REI对Business Insider的回应相当直接:这不是我们干的,是Meta的AI工具搞的。

    REI发言人的说法是,Meta自动把他们拉进了一个「AI个性化工具」的试用,这个工具会对广告素材做自动调整。结果就是,供应商提供的原始图片被AI改得面目全非,还多了一副车把。

    「虽然一辆有两个把手的自行车可能很有趣,但它不是我们的商品目录里会有的东西。」REI在声明里这样说。

    「Meta自动把我们拉进了一个AI个性化工具,它对我们供应商提供的图片做了不准确且不恰当的改动。」—— REI发言人

    原始图片没问题,是AI动的手

    Van Rysel North America随后也对Business Insider确认,提供给REI的原始图片来自一次正式的拍照活动,拍摄对象是自行车手Amity Rockwell,图片本身完全没有问题。「之后的任何改动都不是我们做的。」Van Rysel方面这样表示。

    也就是说,链条很清楚:Van Rysel提供了正常的产品图 → REI把它交给Meta投放 → Meta的AI广告工具自动对图片做了「优化」→ 自行车多了两根车把 → 网友发现后在Reddit上吐槽 → REI紧急撤广告并解释。

    Meta拒绝对此事发表评论。

    Meta的条款把责任推给了广告主

    这件事最值得玩味的地方在于Meta的使用条款。Meta在其生成式AI广告工具的条款里写得很清楚:AI生成的广告输出可能是「不准确的、不完整的、误导性的、冒犯性的和/或不恰当的」,广告主有责任在投放前对这些内容进行评估。

    REI表示他们已经退出了这个Meta工具。「这不符合我们的价值观,也不符合我们管理品牌的方式。产品的准确性和我们与供应商的关系很重要。对于造成的困惑,我们道歉。」

    但问题是:如果广告主是被「自动加入」的,而且在发现问题之前完全不知道AI在对图片做什么,这个责任归属到底该怎么算?

    REI不是第一个踩坑的

    Business Insider先前就报道过,有几个广告主反映Meta的AI工具生成了奇怪甚至荒谬的广告内容。而且有些设置——比如「测试新创意功能」和「自动调整」——是默认被打开的,广告主可能根本不知道自己在用这些功能。

    Meta当时的回应是:使用完整图片生成功能的广告主「有机会在广告投放前审查生成的图片」。他们还表示,数百万广告主认为他们的AI广告创意工具很有价值,而且这些工具提升了广告效果。

    这个回应在REI事件之后看起来有点站不住脚——如果广告主是被自动加入的,他们可能根本不知道自己需要去「审查」什么。

    AI广告工具的普遍问题

    REI这件事折射出一个更大的问题:AI广告工具正在被大范围推广,但质量控制和责任归属远远没有跟上。Meta、Google、Amazon都在推类似的AI广告生成工具,承诺能帮广告主「自动优化」创意素材。但当你把品牌形象的掌控权交给一个可能给自行车加两根车把的AI,这个风险到底值不值得冒?

    对大品牌来说,一次AI翻车的代价可能远远超过省下来的那点设计费用。REI的口号是「For all who love the outdoors」,这次事件对品牌形象的损害,可能不是撤广告和发声明就能完全消除的。


    AI广告工具会继续存在,而且会越来越强大。但REI这次翻车提醒所有人:用AI生成广告内容之前,至少要有人看一眼最终效果是什么。这个道理看起来很简单,但在「自动优化」的旗号下,它显然被很多人忽略了。

  • AI智能体开始”套娃”:让AI监督AI,这个循环能一直跑下去吗?

    当AI开始监督AI

    上週五,Meta办了一场@Scale技术大会。会上有一个环节,登场的是Anthropic旗下Claude Code的负责人Boris Cherny。问答环节刚开始,观众席上就有人问了一个看起来有点奇怪的问题:「Loops是下一个炒作周期,还是来真的?」

    Cherny的回答很干脆:「来真的。」

    他接着解释了一下为什么。他说,两年前我们还手写源代码。后来过渡到让AI智能体帮我们写代码。现在正处在下一个过渡期:让智能体去提示其他智能体,再由那些智能体来写代码。「从源代码到智能体这一步有多大,loops这一步就有多大。」

    这段话在会场里可能听起来很自然,但跳出来看,它描述了一个相当激进的变化。我们过去对AI智能体的想象,基本上是一个人下指令、AI执行、然后回报结果。Cherny描述的却是一个没有终点的过程:一群智能体在背景里不停工作,永远不会停止。

    AI智能体循环概念图
    AI智能体相互提示的循环结构(概念图)

    Cherny自己就在跑的loop

    Cherny在演讲后面(YouTube视频32分左右)具体讲了他自己在用的loops。他有一个智能体专门负责寻找改进代码架构的方法,另一个智能体负责寻找可以统一的重复抽象。它们像任何一个程序员一样提交pull request,而且因为代码在不断变化,它们永远不会停止运行。

    这个想法很有意思。过去几个月,大家讨论AI智能体的时候,重点一直是怎样把智能体管理好:设定清楚的目标、检查进度、别让它跑太远。Loop把这件事往前推了一步:授权一群智能体在背景里持续工作,没有尽头。这需要对于AI有很大的信任,但随着模型进步得越来越快,这可能是让AI真正处理实际工作的下一步。

    「从源代码到智能体这一步有多大,loops这一步就有多大。」—— Boris Cherny,Anthropic Claude Code 负责人

    技术上来说,这不算是全新的东西

    递归循环(recursive loops)——函数调用自己来重复一个动作,再加上一个停止条件——是计算机科学入门课程的标准内容。只不过这些loop遵循的是非决定论逻辑:由一个子智能体来决定什么时候停止循环,而不是一个清楚的条件。但基本方法是一样的。程序员一开始用AI来完成任务,某种版本的递归循环(由AI监督AI)迟早会出现。

    跟传统计算不一样的地方在于,智能体loop可以简单得让人抓狂。现在最流行的技巧之一叫「Ralph Loop」(以Ralph Wiggum命名),原理基本上就是把模型做过的所有工作总结一下,然后问它有没有达成目标。这是在处理AI模型跑太久之后迷路的问题——本质上就是不断让模型来回反弹,直到任务完成。

    跟test-time compute的关系

    另一个理解loop的方式是把它看成「增加test-time compute」这股大趋势的一部分。OpenAI研究员Noam Brown本月初观察到,当代模型只要砸足够的算力进去,几乎可以解决任何问题。这意味着确保一个问题被解决的方法之一,就是不断砸算力进去直到它完成。

    对于像改进代码库这种「爬山」问题来说尤其如此,模型可以一直做增量改进直到达到某个阈值。或者,像Cherny的例子一样,只要有算力可以花,它就可以一直做增量改进。

    成本是个大问题

    如果这听起来很贵,那是因为它真的很贵。跟agentic AI一样,AI loops烧token的速度比简单的问答聊天机器人快得多——而且因为重点是让loop一直跑下去,你能花多少钱是没有上限的。对Anthropic来说这没问题,因为它本质上就是在卖token。但对其他所有人来说,这可能是一种很贵的工作方式。

    话说回来,只要智能体loop要解决的问题值得,而且有适当的设置来监控token支出、漂移和其他典型的AI问题,好处可能大到足以抵消成本。


    这篇文章让我思考一个问题:我们到底要让AI跑到多远?当智能体开始监督其他智能体,当loop可以永远跑下去,人类在这个过程里还扮演什么角色?Cherny显然认为这是下一步,而且他说这话的时候很有说服力。但成本问题不解决,这可能只是大公司才能玩得起的游戏。

  • ElevenLabs全面接入SynthID水印,AI声音内容终于有迹可循

    AI声音越来越像真人,水印成了最后的防线

    以前AI生成的声音一听就知道是机器——语调平、没感情、偶尔还卡壳。现在不一样了。ElevenLabs、Google、OpenAI的语音模型出来的效果,打电话过去很多人根本分不出来对面是真还是假。这让”声音深伪”从一个技术问题变成了一个社会问题——诈骗电话、假录音、伪造名人发言,这些事已经在发生。

    ElevenLabs这周做了一个实质动作:把Google DeepMind的SynthID水印技术接入了自己的文字转语音生成流程。免费用户已经能用上,接下来几周会覆盖所有音频生成。这个水印是直接嵌进音频里的,人耳听不到,但用ElevenLabs的音频检测器可以识别出来。哪怕音频被裁剪、加速、转格式、删掉元数据,水印还在。

    AI生成音频水印示意图
    SynthID水印:嵌在音频里、人耳听不见、但可以检测 | 图片来源:ElevenLabs

    SynthID是什么,为什么是Google在推

    SynthID是Google DeepMind在2023年推出的AI内容水印系统,最初用于图片,后来扩展到音频和视频。原理是在生成内容里嵌入一个人类无法感知的模式,专门的检测器可以把它找出来,从而判断这段内容是不是AI生成的、是哪个平台生成的。

    今年5月的Google I/O上,Google宣布了一个”SynthID联盟”——OpenAI、英伟达、ElevenLabs、Kakao都承诺采用这个标准。这是AI行业少有的”主动给自己套绳子”的时刻:大家同意在自己的输出里加标记,让外界能追溯来源。当时这还只是一个承诺,ElevenLabs现在是第一个真正把这件事跑通的上线案例。

    “人们应该知道自己在和AI互动。随着我们的语音、音乐和音效模型越来越好,我们希望人们能够识别一段音频是否由AI生成,而且不需要专业工具。”——ElevenLabs产品团队

    水印能解决什么问题

    最直接的用途是溯源。如果有一段可疑的音频在传播,用ElevenLabs的免费音频检测器(Audio Detector)扫一下,就能知道是不是ElevenLabs生成的。这对打击深伪诈骗和虚假音视频有直接帮助。

    但这事也有局限性。水印只能证明”这段音频是ElevenLabs生成的”,不能证明”这段音频是某某人说过的”。如果有人用ElevenLabs克隆某人的声音去诈骗,水印能告诉你是ElevenLabs生成的,但没法直接告诉你克隆的是谁。要真正解决问题,还需要平台、法律、用户教育一起上。

    另一个现实问题是:水印只覆盖愿意加它的人。如果有人用没有水印的开源模型生成音频,这套体系就失效了。所以SynthID联盟的意义在于,让主流平台都加入,至少大部分商业AI音频是有标记的。

    ElevenLabs在博客里还提到,他们正在推动把SynthID加入C2PA的软绑定列表。C2PA是一个内容来源认证标准,能让被删掉元数据的内容重新”找回”自己的来源信息。这两个标准如果能打通,AI内容的溯源体系会更完整。

    监管压力是背后的推手

    越来越多的司法管辖区要求AI生成内容必须以机器可读的方式标注为”合成内容”。欧盟AI法案里有相关条款,美国各州也在推类似立法。对ElevenLabs来说,提前把水印做好,比事后被监管强制要求要主动得多。

    而且ElevenLabs本身也面临过滥用问题。2024年有过一波用ElevenLabs克隆名人声音制作深度伪造音频的事件,当时公司加强了安全审核。水印是又一层防护——就算有人绕过审核生成了不当内容,至少事后能追查来源。

    接下来,OpenAI、英伟达那边什么时候跟上,是业界最关注的。Google说它们都会用SynthID,但承诺和实际落地之间还有距离。ElevenLabs先走了一步,对其他平台是个压力,也是个参考。


  • 特朗普政府提议取消自动驾驶汽车刹车踏板要求,特斯拉Cybercab离上路更近了

    一个刹车踏板的存废,牵动整个自动驾驶行业的命运

    美国交通部这个提议听起来有点反直觉——允许自动驾驶汽车不带刹车踏板。但这恰恰是特斯拉Cybe​​rcab这类产品真正上路必须要跨过的监管门槛。现行联邦机动车安全标准(FMVSS)要求每辆车都必须配备刹车踏板,哪怕这辆车从设计上就没人开。特朗普政府现在想把这条改掉。

    国家公路交通安全管理局(NHTSA)管理员Jonathan Morrison在声明里说得很直白:”我们正站在自Model T以来车辆技术领域最大技术革命的边缘。如果想让美国领先,就得重新想象我们的监管框架。”这话的背景是,中国和其他国家在自动驾驶上也在加码,美国监管如果跟不上,优势就没了。

    特斯拉Cybercab概念车
    特斯拉Cybercab:没有方向盘,没有踏板,监管却还没跟上 | 图片来源:Tesla

    特斯拉等了很久的绿灯

    特斯拉过去几年一直在开发那辆两座Cybercab,定位就是完全自动驾驶、没有方向盘也没有踏板。马斯克这些年反复说,一旦监管批准,就能全国部署。但现实是,特斯拉从来没去申请FMVSS豁免——因为豁免就算批了,数量也有限制,不是真正的规模化路径。

    现在NHTSA的提议是直接改标准,而不是搞豁免。这意味着车企可以从设计阶段就按”无踏板”来走,不用每次都去华盛顿求情。对特斯拉来说,这比啥都管用。

    NHTSA表示,移除刹车踏板等部件要求”理论上将让车企能更快地把自动驾驶汽车推向道路”。

    当然,特斯拉现在也没闲着。过去一年在奥斯汀运营了一小片robotaxi服务,刚开始副驾有安全员,后来逐步撤掉,变成”无人监督”运行。不过NHTSA披露,特斯拉承认在用远程操作员——低速情况下远程介入,处理障碍物或事故后移动车辆。这说明完全无人化还没到那一步。

    不只是特斯拉受益

    Zoox(亚马逊旗下)其实是更典型的例子。他们造了一辆从头就是为自动驾驶设计的小巴式robotaxi,去年好不容易拿到FMVSS豁免才能演示,现在还在等商业化运营的豁免。如果标准直接改了,第二波、第三波产品就不用再走这个流程。

    Waymo相对好办一些,因为他们用的是改装版现有车型(捷豹I-Pace),本来就有方向盘和踏板,不受这个限制。但Waymo也在研发下一代没有手动控制的车辆,到时候同样会碰到这个问题。

    这个提案现在进入30天公众意见征集期。也就是说,接下来一个月,车企、安全倡导组织、竞争对手都会进来表态。最终是否生效,还得看DOT的决定。但从特朗普政府一连串动作来看——包括之前NHTSA提议取消雨刮器和除雾系统要求——方向是很明确的:能减就减,别让监管拖住创新。

    安全问题谁来管

    支持方的逻辑是:如果一辆车从设计上就没有驾驶员,刹车踏板就是个摆设,还可能增加成本和复杂度。NHTSA说他们会”加强对根本安全标准的要求,并让AV开发方对安全性能负责”——意思是,踏板可以不要,但安全不能含糊。

    但安全倡导组织肯定不这么看。没有刹车踏板的车,万一系统宕机了怎么办?乘客能做什么?这些问题不是技术白皮书能回答的,得真出点事才会有定论。30天意见期里,这类声音估计不会少。

    这件事更大的背景是中美在自动驾驶上的竞争。中国北京、上海、深圳的robotaxi已经跑了一段时间,监管上也在摸索。美国如果率先在联邦层面放开”无踏板”设计,对特斯拉和Zoox出海可能是个卖点——当然,前提是自己国内先跑通。


  • Gemini 3.5 Pro跳票到7月,谷歌在最不该慢的时候慢了

    谷歌AI人才流失概念图
    Gemini 3.5 Pro推迟发布之际,谷歌正面临顶尖AI研究员持续流向Anthropic和OpenAI的尴尬局面

    谷歌原本计划6月发布Gemini 3.5 Pro,现在推迟到了7月。单独看这件事,其实没什么大不了——让模型多喘口气、多改几版再发布,总比赶工出来一个半成品强。但问题是,这个推迟发生的时机实在太不凑巧了:同一周里,Transformer架构的共同作者Noam Shazeer离职去了OpenAI,诺贝尔化学奖得主John Jumper离职去了Anthropic。模型晚几周发布可以等,人才往外走这件事等不了。

    谷歌这周失去的不仅仅是几个研究员

    Shazeer这个名字在AI圈分量很重。2017年那篇”Attention Is All You Need”论文,他是共同作者之一,Transformer架构就是那篇论文里提出来的。谷歌在2024年花了27亿美元以acqui-hire的方式把他从Character.AI请回来主导Gemini项目,结果不到两年,他又走了,这次是去OpenAI。

    Jumper的离开在另一个维度上更伤——他领导的AlphaFold项目拿了2024年诺贝尔化学奖,这是谷歌DeepMind迄今为止最干净利落的科学成果。AlphaFold团队的核心成员跟着Jumper一起走,基本上等于把DeepMind这几年最亮眼的一张牌整个搬到了Anthropic。

    Alphabet的股价在6月22日跌了5%,2250亿美元的市值就这么蒸发了。市场反应不一定理性,但市场担心的东西很具体:前沿AI实验室同时在抢芯片、抢客户、抢分销渠道,而这些竞争的背后归根结底是抢人。谷歌在前面两项上有优势,在”抢人”这一项上不能出问题。

    企业买家关心的不仅仅是模型本身

    Gemini 3.5 Pro的延迟发布本身并不是致命伤。谷歌说推迟是为了收集早期测试用户的反馈,对模型做进一步优化,这个说法站得住脚。企业客户也不希望拿到一个匆忙上线、跑真实工作流就出问题的模型。

    但企业客户买AI模型的时候,看的不只是眼前这个版本好不好用,他们也在押注接下来半年到一年的路线图——下一版模型什么时候出、质量怎么样、做这个模型的人还在不在这个实验室里。当Shazeer和Jumper在同一周宣布离职,企业CIO做决策时的信心就会打个折扣。这个折扣不一定是理性的,但采购决策从来不纯粹是理性计算。


    谷歌并不是输了,但它需要证明更多

    把话说回来,谷歌DeepMind仍然拥有巨大的计算资源,Gemini通过Search和Workspace的分发渠道也是竞争对手眼馋的。Gemini 3.5 Pro完全有可能在7月发布一个质量很高的版本,把这一轮的注意力重新拉回来。

    真正的问题是信心。Anthropic靠着Claude在开发者社区里积累了很强的口碑,尤其是在代码生成这块;OpenAI有最强的消费者拉力和平台生态。谷歌不能只靠提醒所有人”Transformer是我们发明的”来赢这一局,它得持续证明前沿AI可以走得足够快,而且做这个研究的最优秀的人还愿意留下来。

    7月的发布会是一个观察窗口。如果谷歌能拿出一份足够硬核的基准测试数据、清晰的价格方案,以及开发者社区的积极反馈,那么6月的这次推迟和人才流失就会变成脚注。如果发布含糊其辞、细节有限,竞争对手会用这个空隙做文章。


    这一轮AI人才战的背后还有一个容易被忽略的驱动力:IPO预期。Anthropic和OpenAI都在筹备上市,在上市前进去拿股权,对于谷歌内部的顶级研究员来说是一个很难拒绝的财务激励。谷歌可以给高薪,但给不了上市前股权的倍数增长空间。这个结构性因素不会在短期内消失,谷歌需要想清楚除了薪资之外还能给顶尖研究员提供什么——这个问题,6月的这一周把它摆到了台面上。

  • 不做芯片做软件,Sail用8000万美元赌AI推理可以更便宜

    AI推理优化概念图
    Sail Research用软件优化替代定制芯片,把AI推理成本压到对手的十分之一

    everyone都在造芯片,Sail说软件就够了。这家刚刚冒出头的初创公司本周宣布完成8000万美元融资,估值4.5亿美元,由Kleiner Perkins和Sequoia联合押注。它的主张听起来有点反潮流——当OpenAI在做Jalapeño芯片、谷歌有TPU、亚马逊有Trainium的时候,Sail说光靠软件优化就能把AI推理成本压到对手的十分之一。

    长周期智能体才是主战场

    Sail Research的平台专门跑”长周期”AI智能体——就是那些需要连续工作数小时甚至数周才能完成的任务。它在Linux虚拟机(叫Sailboxes)里运行智能体,开发者可以自定义每个虚拟机的软件环境。关键是,当智能体在等待外部系统返回数据时,Sail会把整个智能体关掉,不再烧钱,等数据回来了再继续。这个设计思路很直接,但确实能省不少钱。

    他们在BrowseComp-Plus基准测试上拿了90.72%的分数,同时推理成本只有对手的十分之一。这个成绩单够亮眼,但真正有意思的是它背后的逻辑:大部分企业根本造不起自己的定制芯片,但它们可以在现有的英伟达GPU上跑Sail的软件层,达到类似的效率提升。

    Sail的CEO Neil Movva说得很直白:人类用电脑最看重速度,但智能体最需要的是规模、可靠性和可持续的成本。这句话其实点出了当前AI基础设施争论的核心——我们到底是在为什么买单?

    定制芯片 vs 软件优化,两条路都能走通

    这一轮AI基础设施的竞争,某种程度上分裂成了两个阵营。一边是”算力派”,认为推理成本的根本解法是定制芯片——OpenAI找Broadcom做Jalapeño,谷歌继续迭代TPU,亚马逊推Trainium,都在走这条路。另一边是”效率派”,认为现有的GPU已经够强,问题出在软件层没有把硬件能力吃干榨净。

    Sail属于后者。它改写了多个开源推理引擎,用了一套自己优化的算法来提升显存利用率。效果据称不错,但这个说法需要打一个问号:基准测试的跑分环境和真实生产环境往往是两回事,90.72%的分数能否在客户的实际工作负载上复现,还得等产品正式铺开才知道。


    投资者阵容值得注意

    这一轮的投资者名单里有两个名字很显眼:Intel CEO Lip-Bu Tan和Alphabet董事长John Hennessy。Hennessy的身份尤其微妙——他既是谷歌的董事长,又投了一家说”软件优化可以替代定制芯片”的初创公司。不管这在战略上意味着什么,至少说明业界对AI推理成本问题的关注度已经非常高了。

    Kleiner Perkins和Sequoia同时进场也是一个信号。两家顶级VC在同一个轮次里联手,通常意味着他们判断这个赛道已经过了”要不要做”的阶段,现在的问题是”谁能先做出来”。Sail的4.5亿美元估值不低,但它面对的是一个实实在在的市场需求:企业用完AI之后发现账单比预期厚得多,它们愿意为任何能压低成本的技术方案付钱。


    这一轮融资的时间点选得有点巧——正好是OpenAI官宣Jalapeño芯片之后没几天。两件事摆在一起看,像是一场关于”AI推理成本到底该怎么降”的公开辩论。OpenAI选了最难的路(自己做芯片),Sail选了最快落地的路(软件优化)。两条路都能走通,但受益的客户群不太一样:超大规模云厂商有能力做定制芯片,普通企业只能靠软件层省成本。

  • Haystack:构建生产级 LLM 应用的首选 AI 编排框架,25K+ Stars 让 RAG 和 Agent 工作流完全透明可控

    Haystack:构建生产级 LLM 应用的首选 AI 编排框架,25K+ Stars 让 RAG 和 Agent 工作流完全透明可控

    Haystack Banner

    Haystack 是由 deepset 团队(已被 Cohere 收购)开发的开源 AI 编排框架,专为构建生产级 LLM 应用而设计。它让开发者以显式控制的方式设计模块化 Pipeline 和 Agent 工作流,覆盖 RAG、多模态、语义搜索、问答系统和自主智能体等场景。

    📦 安装要求和过程

    环境要求

    • Python >= 3.9(推荐 3.10+)
    • pip 包管理器
    • 可选:Docker(用于容器化部署)
    • 可选:GPU(用于本地模型推理加速)

    快速安装

    # 安装稳定版
    pip install haystack-ai

    # 安装 nightly 预览版(尝鲜最新功能)
    pip install –pre haystack-ai

    # 验证安装
    python -c “import haystack; print(haystack.__version__)”

    💡 可选依赖:pip install haystack-ai[openai,anthropic,mistral] 可一次性安装主流模型提供商支持。

    🚀 核心功能

    🧠

    上下文工程优先

    显式控制信息检索、排序、过滤、组合、结构化和路由的全流程。Pipeline 和 Agent 工作流完全透明、可追踪。

    🔄

    模型与厂商无关

    集成 OpenAI、Mistral、Anthropic、Cohere、HuggingFace、Azure、AWS Bedrock、本地模型等。切换模型或基础设施无需重写系统。

    🧩

    模块化与可定制

    内置检索、索引、工具调用、记忆、评估等组件,也可自定义。支持循环、分支和条件逻辑,精确控制上下文流转。

    🌐

    可扩展生态系统

    通过统一接口构建和共享自定义组件,社区和第三方可轻松扩展 Haystack。支持 Hayhooks 将 Pipeline 包装为 REST API 或 MCP 服务器。

    💡 典型使用场景

    1

    企业级 RAG 知识库系统

    某德国联邦部委使用 Haystack 构建了面向公众的语义搜索系统,支持多语言文档检索和精准问答。通过 Haystack 的混合检索(稠密+稀疏向量)和重排序功能,实现了比传统关键词搜索高出 3 倍的准确率。系统部署在私有云上,数据完全合规。

    2

    多模态 AI 客服助手

    某欧洲航空公司使用 Haystack 构建了支持文本+图片输入的客服 Agent,客户可以上传行李损坏照片,Agent 自动检索相关政策文档并生成处理建议。Haystack 的多模态 Pipeline 设计让文本和视觉信息在统一框架下协同工作,大幅缩短了投诉处理周期。

    🌟 推荐理由

    💬 笔者心得

    在尝试了 LangChain、LlamaIndex 等多个 LLM 应用框架后,Haystack 给我留下的印象是「透明」和「可控」。与 LangChain 的「黑盒」链式调用不同,Haystack 的 Pipeline 是显式定义的——每个组件的输入输出、数据流向都一目了然,调试起来非常直观。

    特别值得一提的是 Haystack 对上下文工程(Context Engineering)的重视。在 RAG 系统中,如何精准控制检索策略、如何组合多路召回结果、如何设计记忆机制,这些才是决定效果的关键。Haystack 把这些控制权交给了开发者,而不是封装成不可见的「魔法」。

    另外,Haystack 的企业级基因也很突出——它诞生于 deepset 的商业化实践,从第一天就考虑了生产部署、可观测性、访问控制等现实需求。现在 deepset 被 Cohere 收购,Haystack 企业版(Haystack Enterprise Platform)更是提供了托管化生产 setup,对的企业用户来说是很好的选择。

    📥 下载地址

    🌐 官方网站

    haystack.deepset.ai

    🐙 GitHub 仓库

    github.com/deepset-ai/haystack

    25,730+ Stars · 2,884+ Forks

    📚 官方文档

    docs.haystack.deepset.ai

    💬 Discord 社区

    discord.gg/qZxjM4bAHU

    🐍 PyPI 安装

    pip install haystack-ai

    🍳 Cookbook 食谱

    haystack.deepset.ai/cookbook

    📊 项目速览
    ⭐ Stars:25,730+
    🍴 Forks:2,884+
    📅 创建时间:2019-11
    🔄 最近更新:2026-06-26
    📝 开源许可:Apache-2.0
    💻 主要语言:Python
    🏢 维护团队:deepset(Cohere 旗下)
    🌟 用户案例:Apple、Meta、NVIDIA、Netflix、Airbus 等

  • 高通想做下一个英伟达,先掏出了Dragonfly CPU

    高通Dragonfly CPU
    高通发布Dragonfly C1000 CPU,进军AI数据中心市场 | 图源:生成图

    美东时间6月25日,高通在纽约举办了2026投资者日暨股东大会。这场活动之前,市场对高通能不能在AI数据中心市场分一杯羹持怀疑态度——毕竟这个市场已经被英伟达、AMD和英特尔盯住了。但高通拿出来的一套完整产品路线图和一份大幅上调的财务指引,让股价在盘后直接涨了13%。

    Dragonfly C1000:专为AI智能体设计的CPU

    高通在投资者日上正式发布了Dragonfly C1000处理器。这款芯片的定位很明确:不是给普通服务器跑数据库的,是给AI智能体用的。随着自主智能体(Agentic AI)快速普及,CPU需要承担越来越多原本由GPU处理的任务——智能体要持续思考、调用数据库、执行代码,如果CPU跟不上,GPU就只能干等着,而GPU闲置对数据中心来说就是直接亏钱。

    高通的差异化优势在于功耗。做了几十年手机芯片的人,最知道怎么在性能和处理功耗之间找平衡。现在数据中心扩建最大的瓶颈不是芯片性能,是电力——各大云厂商都在为能耗发愁。高通把在手机和边缘计算上积累的能效技术搬到数据中心,正好打在了痛点之上。

    高通CFO Akash Palkhiwala在会后接受采访时说得很直白:”CPU市场供给不足,行业需要更多具备成熟技术能力的参与者。”言下之意:英伟达和AMD的CPU供应跟不上需求,高通来补这个缺口。

    Meta已经下单,2028年量产即部署

    发布的同时,高通宣布了一个重量级合作:Meta将在2028年Dragonfly C1000量产阶段大规模部署这款芯片,双方已签署长期供货协议。对高通来说,拿下Meta这样的头部云厂商的订单,是对产品竞争力的最好背书。

    除了Meta,高通还透露已经拿到两家超大规模云服务商(hyperscaler)的定制芯片大额订单,定制芯片业务将逐步兑现规模化收入。高通CEO Cristiano Amon说,高通和云厂商的合作”不是从零起步”——凭借手机芯片和边缘计算产品,高通早已和全球几乎所有头部云厂商建立了稳定合作关系。

    收购Modular,对标英伟达CUDA

    硬件之外,高通同步宣布收购AI软件公司Modular。这笔交易的对价是不超过1920万股高通普通股,按高通周二收盘价计算,价值约39.2亿美元。Modular拥有Mojo编程语言、MAX推理平台和AI编译器,这套软件体系可以实现AI应用在不同芯片架构上高效运行——高通明说,这个技术栈要对标的是英伟达的CUDA。

    CUDA是英伟达最深的护城河。无数AI应用和模型都基于CUDA开发,换不了平台,用户就被锁住了。高通收购Modular,就是要打通从芯片硬件、编译工具到模型部署的全链条,复制英伟达靠软硬件协同构筑行业壁垒的路径。这个算盘打得清楚:光有芯片不够,得有软件生态才能留住客户。


    财务指引大幅上调,股价盘后涨13%

    这次投资者日最刺激市场的地方,是高通大幅上调了中长期营收指引。2029财年非手机业务营收指引从原来的220亿美元上调至400亿美元,增幅接近91%。汽车业务的设计订单总价值已扩容至650亿美元,2029财年汽车板块收入目标提高至100亿美元。

    手机芯片一直是大通的基本盘,占最近季度总营收的三分之二。但全球智能手机出货量早在2017年就见顶了,增长空间有限。高通过去几年持续向智能汽车、机器人和云端算力倾斜资源,这次的财务指引上调,算是给市场交了一份多元化转型的时间表。

    多重利好催化下,高通股价在会后盘后交易中大涨13%。市场用钱投票,表达了对高通进军数据中心算力市场的看好。至于高通能不能真的从英伟达、AMD和英特尔手里抢到市场份额,接下来几年见分晓。