标签： AI

让AI替你面试——Stockholm创企想让招聘反过来玩

Fika Jobs平台让候选人与AI智能体进行视频面试（图源：Fika Jobs）

找工作这件事，从来都是候选人适应雇主的规则。简历怎么写、Cover Letter怎么改、HR的AI筛选系统要什么关键词——全是雇主说了算。斯德哥尔摩创企Fika Jobs想把这套逻辑翻过来。

6月23日，这家公司宣布完成400万美元pre-seed轮融资，由Luminar Ventures领投，Alliance VC和《Candy Crush》联合创始人Sebastian Knutsson、Riccardo Zacconi跟投。

让AI替你面试

Fika做的事情简单说就是：让AI智能体当面试官，把候选人的回答自动剪成短视频片段，做成一个持续更新的视频档案。雇主不用再对着一叠叠简历筛人，而是直接去浏览一个已经经过AI面试的候选者资料池。

创始人兄弟Jakob Dubois（CEO）和Alexander Dubois（CTO）的灵感来自他们上一次创业的经历。当时他们在招人做社交应用Gaff，有个候选人的简历平平无奇，他们差点就不聊了。结果一通电话打过去，几分钟就发现这人有着他们想要的全部特质——有韧性、有野心、沟通利索。”简历根本看不出来这些”，Jakob说。

Fika的操作流程是这样的：求职者先关联自己的LinkedIn档案，平台的AI会根据背景生成个性化面试问题，然后候选人和AI智能体进行一场大约10分钟的视频面试。面试用的是Google的Gemini模型驱动。结束后，Fika自动把回答切成短视频片段，整理成一个动态档案。

和竞争对手不一样的地方

和Alex、Maki、Mercor这些同样在用AI做招聘的工具不一样的是，Fika的重心在候选人这边。大多数竞品是帮雇主更高效地筛人，Fika想做的是让候选人建好一个视频档案之后，不用每投一个岗位就重新来一遍。

平台的商业模式是：对求职者免费，对雇主也不收预付费用。成功录用后，Fika抽候选人年薪的10%作为佣金。创始人说这比传统猎头20%到30%的收费要低。

传统猎头的收费一般是候选人年薪的20%到30%，Fika把这个数压到了10%，而且只有在成功录用后才收费。

视频档案的偏见风险

当然这个模式有明显的风险。视频档案意味着雇主能在看简历之前就看到候选人的种族、年龄、性别、外貌和口音——这些在纸质简历里至少是被部分遮蔽的信息。盲目简历筛选（blind resume screening）之所以被一些公司采用，就是为了避免这种前置偏见。Fika还没公开说明打算怎么处理这个问题。

目前平台上的等待名单上已经有超过100家公司，另有50多家公司已经测试过平台，包括Plenty Labs、SICS.ai、Kognity和Rebtel。平台本周向候选人开放早期访问，计划在秋季全面公开上线。前期聚焦瑞典市场，之后再向国际扩张。

Fika目前团队规模还小，预计到今年年底扩展到10人左右。

这件事最有意思的地方在于：当雇主用AI筛简历变得越来越普遍，候选人这边也开始用AI来展示自己。招聘这个双边市场，两边都在被AI重塑——只是方向还不太一样。

📎 原文来源：Fika Jobs raises $4M to build a video-first hiring platform where AI agents interview candidates — TechCrunch

2026年6月26日

FastAPI：构建AI服务API的现代化Python框架，80K+ Stars让API开发快如闪电

FastAPI — 构建API的现代化Python框架

📌 项目简介

FastAPI 是基于 Python 3.8+ 类型提示构建的高性能 Web 框架，专为构建 API 设计。它结合了 Starlette（Web部分）和 Pydantic（数据验证部分）的优点，让开发者能够用最少的代码快速构建生产级 API 服务。FastAPI 已成为 AI/ML 服务部署的标配框架，被 Netflix、Uber、Microsoft 等公司广泛使用。

80K+

GitHub Stars

8.5K+

Forks

4.6K+

贡献者

MIT

开源许可

⚙️ 安装要求和过程

环境要求

Python：3.8+ （推荐 3.10+ 获得最佳性能）
操作系统：Windows / macOS / Linux 全平台支持
依赖项：Starlette（Web框架）、Pydantic v2（数据验证）、Uvicorn（ASGI服务器）

快速安装

# 安装 FastAPI 和 Uvicorn（ASGI 服务器）
pip install fastapi uvicorn

# 如果需要所有可选依赖（包括 JSON Schema 生成、OAuth2 等）
pip install fastapi[all]

# 创建第一个 API
# main.py
from fastapi import FastAPI

app = FastAPI()

@app.get("/")
async def root():
    return {"message": "Hello World"}

# 启动服务
# uvicorn main:app --reload

依赖说明

依赖	用途
Starlette	Web 框架核心，处理请求路由、中间件、WebSocket等
Pydantic v2	数据验证和序列化，基于 Python 类型提示
Uvicorn	高性能 ASGI 服务器，用于运行 FastAPI 应用
httpx	异步 HTTP 客户端，用于测试

🚀 核心功能

1. 基于类型提示的自动数据验证

利用 Python 3.8+ 的类型提示（Type Hints）和 Pydantic，FastAPI 自动对请求参数、请求体进行数据验证，无需手动编写验证逻辑。如果验证失败，自动返回清晰的错误信息。

from fastapi import FastAPI
from pydantic import BaseModel

class Item(BaseModel):
    name: str
    price: float
    is_offer: bool = False

app = FastAPI()

@app.post("/items/")
async def create_item(item: Item):
    return {"item_name": item.name, "price": item.price}

2. 自动生成 API 文档（OpenAPI & JSON Schema）

FastAPI 基于 OpenAPI 标准自动生成交互式 API 文档，无需额外配置。启动服务后访问 /docs 即可看到基于 Swagger UI 的交互式文档，访问 /redoc 可看到 ReDoc 文档。

💡 自动文档：定义好 Pydantic 模型后，FastAPI 会自动生成符合 OpenAPI 规范的 JSON Schema，并渲染为可交互的文档界面，大大降低了前后端协作成本。

3. 异步支持（async/await）

基于 Python 的 async/await 语法，FastAPI 原生支持异步请求处理，能够充分利用现代 Python 的异步能力，处理高并发请求时性能卓越。与 Node.js 和 Go 相当的性能表现。

4. 依赖注入系统

FastAPI 提供了强大而直观的依赖注入（Dependency Injection）系统，可以轻松实现认证、数据库连接、权限校验等横切关注点，代码复用率高且易于测试。

from fastapi import Depends, HTTPException

async def verify_token(token: str):
    if token != "secret":
        raise HTTPException(status_code=401)
    return token

@app.get("/protected")
async def protected_route(token: str = Depends(verify_token)):
    return {"message": "Authenticated!"}

5. 安全性内置支持

FastAPI 内置了 HTTP 基础认证、OAuth2、JWT、API Key 等多种认证方式，并提供了完整的安全工具函数，帮助开发者轻松构建安全的 API 服务。

💡 典型使用场景

场景一：AI/ML 模型服务化部署

FastAPI 是 AI/ML 模型服务化部署的首选框架。结合 PyTorch/TensorFlow/ONNX Runtime，可以快速将训练好的模型封装为 HTTP API，供其他服务调用。

from fastapi import FastAPI
import torch
from transformers import pipeline

app = FastAPI()
model = pipeline("sentiment-analysis")

@app.post("/predict")
async def predict(text: str):
    result = model(text)[0]
    return {"label": result["label"], "score": result["score"]}

案例：Hugging Face 的 Inference API、Modal、Replicate 等 AI 推理平台都使用 FastAPI 作为底层 API 框架。

场景二：微服务架构中的 API 网关

FastAPI 的高性能和异步特性使其非常适合作为微服务架构中的 API 网关或边缘服务，负责请求路由、认证、限流、日志等横切关注点。

案例：Netflix 使用 FastAPI 构建部分数据管道的 API 服务；Microsoft 在 Azure 的一些内部服务中使用 FastAPI。

场景三：实时 WebSocket 应用

FastAPI 基于 Starlette，原生支持 WebSocket，适合构建实时通信应用，如在线聊天、实时数据推送、协同编辑等。

from fastapi import FastAPI, WebSocket

app = FastAPI()

@app.websocket("/ws")
async def websocket_endpoint(websocket: WebSocket):
    await websocket.accept()
    while True:
        data = await websocket.receive_text()
        await websocket.send_text(f"Message: {data}")

🌟 推荐理由

FastAPI 是我个人最喜爱的 Python Web 框架，没有之一。以下是我的使用心得：

开发效率极高：类型提示 + 自动验证 + 自动文档，让我能够专注于业务逻辑，而不是花时间写样板代码和文档。
学习曲线平缓：如果你熟悉 Python 类型提示，只需一个下午就能上手 FastAPI。官方文档非常详细，包含大量示例代码。
性能卓越：基于 Starlette 和 Pydantic，FastAPI 的性能可以媲美 Go 和 Node.js，在 Python Web 框架中属于第一梯队。
AI/ML 生态友好：FastAPI 是 AI/ML 社区的首选 API 框架，与 PyTorch、TensorFlow、Hugging Face Transformers 等库无缝集成。
生产就绪：内置数据验证、序列化、认证、文档等生产级特性，不需要依赖大量第三方库。

💡 个人建议：如果你正在构建 AI 服务的 API 接口，FastAPI 是不二之选。它不仅能提升你的开发效率，还能确保服务的性能和可维护性。我几乎所有 AI 相关的后端项目都使用 FastAPI。

📊 技术对比：FastAPI vs Flask vs Django

特性	FastAPI	Flask	Django
性能	⭐⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐
异步支持	原生支持	需第三方库	部分支持
数据验证	自动（Pydantic）	需手动/Marshmallow	Forms/Serializers
API 文档	自动生成	需第三方库	DRF 支持
学习曲线	平缓	最平缓	陡峭
适用场景	API 服务、AI/ML	小型应用、原型	全栈 Web 应用

📥 下载地址

⭐

GitHub 仓库

github.com/fastapi/fastapi

快速开始

# 安装 FastAPI 和 Uvicorn
pip install fastapi uvicorn

# 创建 main.py
from fastapi import FastAPI

app = FastAPI()

@app.get("/")
async def root():
    return {"message": "Hello FastAPI"}

# 启动开发服务器
uvicorn main:app --reload

# 浏览器访问 http://localhost:8000/docs

🚀 同类推荐

如果你喜欢 FastAPI，还可以关注：

Starlette：FastAPI 的底层 Web 框架，如果你需要更底层的控制
Pydantic：FastAPI 使用的数据验证库，也可独立使用
Uvicorn：FastAPI 推荐的 ASGI 服务器
Flask：轻量级 Web 框架，适合小型项目
Django REST Framework：如果你需要全栈 Web 框架 + API

📌 本文定期更新，最后更新：2026年6月 | 项目GitHub：fastapi/fastapi

2026年6月26日

REI的Instagram广告里自行车长了两副车把，锅居然甩给了Meta的AI

两根车把的自行车

户外用品零售商REI Co-op最近在Instagram上投了一则广告，推广Van Rysel品牌的自行车。广告图里，一位女士站在公园里，旁边是一辆自行车。看起来挺正常的一则推广，但有些眼尖的用户发现了一个问题：图里的自行车好像有两副车把。

Reddit上有个帖子周末的时候火了，标题是「REI居然用AI垃圾广告，说好的环保呢」。帖子里的广告截图清楚地显示，那辆自行车的架子上长了两组把手——一组在平常的位置，另一组不知道从哪冒出来的，像是从车架中间伸出来的。

这则广告很快就从Instagram上撤下来了，但截图已经在网上传开了。

AI生成广告内容出错的概念示意图

REI把锅甩给了Meta

事情曝光后，REI对Business Insider的回应相当直接：这不是我们干的，是Meta的AI工具搞的。

REI发言人的说法是，Meta自动把他们拉进了一个「AI个性化工具」的试用，这个工具会对广告素材做自动调整。结果就是，供应商提供的原始图片被AI改得面目全非，还多了一副车把。

「虽然一辆有两个把手的自行车可能很有趣，但它不是我们的商品目录里会有的东西。」REI在声明里这样说。

「Meta自动把我们拉进了一个AI个性化工具，它对我们供应商提供的图片做了不准确且不恰当的改动。」—— REI发言人

原始图片没问题，是AI动的手

Van Rysel North America随后也对Business Insider确认，提供给REI的原始图片来自一次正式的拍照活动，拍摄对象是自行车手Amity Rockwell，图片本身完全没有问题。「之后的任何改动都不是我们做的。」Van Rysel方面这样表示。

也就是说，链条很清楚：Van Rysel提供了正常的产品图 → REI把它交给Meta投放 → Meta的AI广告工具自动对图片做了「优化」→ 自行车多了两根车把 → 网友发现后在Reddit上吐槽 → REI紧急撤广告并解释。

Meta拒绝对此事发表评论。

Meta的条款把责任推给了广告主

这件事最值得玩味的地方在于Meta的使用条款。Meta在其生成式AI广告工具的条款里写得很清楚：AI生成的广告输出可能是「不准确的、不完整的、误导性的、冒犯性的和/或不恰当的」，广告主有责任在投放前对这些内容进行评估。

REI表示他们已经退出了这个Meta工具。「这不符合我们的价值观，也不符合我们管理品牌的方式。产品的准确性和我们与供应商的关系很重要。对于造成的困惑，我们道歉。」

但问题是：如果广告主是被「自动加入」的，而且在发现问题之前完全不知道AI在对图片做什么，这个责任归属到底该怎么算？

REI不是第一个踩坑的

Business Insider先前就报道过，有几个广告主反映Meta的AI工具生成了奇怪甚至荒谬的广告内容。而且有些设置——比如「测试新创意功能」和「自动调整」——是默认被打开的，广告主可能根本不知道自己在用这些功能。

Meta当时的回应是：使用完整图片生成功能的广告主「有机会在广告投放前审查生成的图片」。他们还表示，数百万广告主认为他们的AI广告创意工具很有价值，而且这些工具提升了广告效果。

这个回应在REI事件之后看起来有点站不住脚——如果广告主是被自动加入的，他们可能根本不知道自己需要去「审查」什么。

AI广告工具的普遍问题

REI这件事折射出一个更大的问题：AI广告工具正在被大范围推广，但质量控制和责任归属远远没有跟上。Meta、Google、Amazon都在推类似的AI广告生成工具，承诺能帮广告主「自动优化」创意素材。但当你把品牌形象的掌控权交给一个可能给自行车加两根车把的AI，这个风险到底值不值得冒？

对大品牌来说，一次AI翻车的代价可能远远超过省下来的那点设计费用。REI的口号是「For all who love the outdoors」，这次事件对品牌形象的损害，可能不是撤广告和发声明就能完全消除的。

AI广告工具会继续存在，而且会越来越强大。但REI这次翻车提醒所有人：用AI生成广告内容之前，至少要有人看一眼最终效果是什么。这个道理看起来很简单，但在「自动优化」的旗号下，它显然被很多人忽略了。

📎 原文来源：REI Faces Backlash for AI Instagram Ad and Blames a Meta AI Tool — Business Insider

2026年6月26日
AI智能体开始”套娃”：让AI监督AI，这个循环能一直跑下去吗？

当AI开始监督AI

上週五，Meta办了一场@Scale技术大会。会上有一个环节，登场的是Anthropic旗下Claude Code的负责人Boris Cherny。问答环节刚开始，观众席上就有人问了一个看起来有点奇怪的问题：「Loops是下一个炒作周期，还是来真的？」

Cherny的回答很干脆：「来真的。」

他接着解释了一下为什么。他说，两年前我们还手写源代码。后来过渡到让AI智能体帮我们写代码。现在正处在下一个过渡期：让智能体去提示其他智能体，再由那些智能体来写代码。「从源代码到智能体这一步有多大，loops这一步就有多大。」

这段话在会场里可能听起来很自然，但跳出来看，它描述了一个相当激进的变化。我们过去对AI智能体的想象，基本上是一个人下指令、AI执行、然后回报结果。Cherny描述的却是一个没有终点的过程：一群智能体在背景里不停工作，永远不会停止。

AI智能体相互提示的循环结构（概念图）

Cherny自己就在跑的loop

Cherny在演讲后面（YouTube视频32分左右）具体讲了他自己在用的loops。他有一个智能体专门负责寻找改进代码架构的方法，另一个智能体负责寻找可以统一的重复抽象。它们像任何一个程序员一样提交pull request，而且因为代码在不断变化，它们永远不会停止运行。

这个想法很有意思。过去几个月，大家讨论AI智能体的时候，重点一直是怎样把智能体管理好：设定清楚的目标、检查进度、别让它跑太远。Loop把这件事往前推了一步：授权一群智能体在背景里持续工作，没有尽头。这需要对于AI有很大的信任，但随着模型进步得越来越快，这可能是让AI真正处理实际工作的下一步。

「从源代码到智能体这一步有多大，loops这一步就有多大。」—— Boris Cherny，Anthropic Claude Code 负责人

技术上来说，这不算是全新的东西

递归循环（recursive loops）——函数调用自己来重复一个动作，再加上一个停止条件——是计算机科学入门课程的标准内容。只不过这些loop遵循的是非决定论逻辑：由一个子智能体来决定什么时候停止循环，而不是一个清楚的条件。但基本方法是一样的。程序员一开始用AI来完成任务，某种版本的递归循环（由AI监督AI）迟早会出现。

跟传统计算不一样的地方在于，智能体loop可以简单得让人抓狂。现在最流行的技巧之一叫「Ralph Loop」（以Ralph Wiggum命名），原理基本上就是把模型做过的所有工作总结一下，然后问它有没有达成目标。这是在处理AI模型跑太久之后迷路的问题——本质上就是不断让模型来回反弹，直到任务完成。

跟test-time compute的关系

另一个理解loop的方式是把它看成「增加test-time compute」这股大趋势的一部分。OpenAI研究员Noam Brown本月初观察到，当代模型只要砸足够的算力进去，几乎可以解决任何问题。这意味着确保一个问题被解决的方法之一，就是不断砸算力进去直到它完成。

对于像改进代码库这种「爬山」问题来说尤其如此，模型可以一直做增量改进直到达到某个阈值。或者，像Cherny的例子一样，只要有算力可以花，它就可以一直做增量改进。

成本是个大问题

如果这听起来很贵，那是因为它真的很贵。跟agentic AI一样，AI loops烧token的速度比简单的问答聊天机器人快得多——而且因为重点是让loop一直跑下去，你能花多少钱是没有上限的。对Anthropic来说这没问题，因为它本质上就是在卖token。但对其他所有人来说，这可能是一种很贵的工作方式。

话说回来，只要智能体loop要解决的问题值得，而且有适当的设置来监控token支出、漂移和其他典型的AI问题，好处可能大到足以抵消成本。

这篇文章让我思考一个问题：我们到底要让AI跑到多远？当智能体开始监督其他智能体，当loop可以永远跑下去，人类在这个过程里还扮演什么角色？Cherny显然认为这是下一步，而且他说这话的时候很有说服力。但成本问题不解决，这可能只是大公司才能玩得起的游戏。

📎 原文来源：The AI world is getting ‘loopy’ — TechCrunch

2026年6月26日
ElevenLabs全面接入SynthID水印，AI声音内容终于有迹可循

AI声音越来越像真人，水印成了最后的防线

以前AI生成的声音一听就知道是机器——语调平、没感情、偶尔还卡壳。现在不一样了。ElevenLabs、Google、OpenAI的语音模型出来的效果，打电话过去很多人根本分不出来对面是真还是假。这让”声音深伪”从一个技术问题变成了一个社会问题——诈骗电话、假录音、伪造名人发言，这些事已经在发生。

ElevenLabs这周做了一个实质动作：把Google DeepMind的SynthID水印技术接入了自己的文字转语音生成流程。免费用户已经能用上，接下来几周会覆盖所有音频生成。这个水印是直接嵌进音频里的，人耳听不到，但用ElevenLabs的音频检测器可以识别出来。哪怕音频被裁剪、加速、转格式、删掉元数据，水印还在。

SynthID水印：嵌在音频里、人耳听不见、但可以检测 | 图片来源：ElevenLabs

SynthID是什么，为什么是Google在推

SynthID是Google DeepMind在2023年推出的AI内容水印系统，最初用于图片，后来扩展到音频和视频。原理是在生成内容里嵌入一个人类无法感知的模式，专门的检测器可以把它找出来，从而判断这段内容是不是AI生成的、是哪个平台生成的。

今年5月的Google I/O上，Google宣布了一个”SynthID联盟”——OpenAI、英伟达、ElevenLabs、Kakao都承诺采用这个标准。这是AI行业少有的”主动给自己套绳子”的时刻：大家同意在自己的输出里加标记，让外界能追溯来源。当时这还只是一个承诺，ElevenLabs现在是第一个真正把这件事跑通的上线案例。

“人们应该知道自己在和AI互动。随着我们的语音、音乐和音效模型越来越好，我们希望人们能够识别一段音频是否由AI生成，而且不需要专业工具。”——ElevenLabs产品团队

水印能解决什么问题

最直接的用途是溯源。如果有一段可疑的音频在传播，用ElevenLabs的免费音频检测器（Audio Detector）扫一下，就能知道是不是ElevenLabs生成的。这对打击深伪诈骗和虚假音视频有直接帮助。

但这事也有局限性。水印只能证明”这段音频是ElevenLabs生成的”，不能证明”这段音频是某某人说过的”。如果有人用ElevenLabs克隆某人的声音去诈骗，水印能告诉你是ElevenLabs生成的，但没法直接告诉你克隆的是谁。要真正解决问题，还需要平台、法律、用户教育一起上。

另一个现实问题是：水印只覆盖愿意加它的人。如果有人用没有水印的开源模型生成音频，这套体系就失效了。所以SynthID联盟的意义在于，让主流平台都加入，至少大部分商业AI音频是有标记的。

ElevenLabs在博客里还提到，他们正在推动把SynthID加入C2PA的软绑定列表。C2PA是一个内容来源认证标准，能让被删掉元数据的内容重新”找回”自己的来源信息。这两个标准如果能打通，AI内容的溯源体系会更完整。

监管压力是背后的推手

越来越多的司法管辖区要求AI生成内容必须以机器可读的方式标注为”合成内容”。欧盟AI法案里有相关条款，美国各州也在推类似立法。对ElevenLabs来说，提前把水印做好，比事后被监管强制要求要主动得多。

而且ElevenLabs本身也面临过滥用问题。2024年有过一波用ElevenLabs克隆名人声音制作深度伪造音频的事件，当时公司加强了安全审核。水印是又一层防护——就算有人绕过审核生成了不当内容，至少事后能追查来源。

接下来，OpenAI、英伟达那边什么时候跟上，是业界最关注的。Google说它们都会用SynthID，但承诺和实际落地之间还有距离。ElevenLabs先走了一步，对其他平台是个压力，也是个参考。

📎 原文来源：ElevenLabs rolls out SynthID support — The Verge | Detecting audio generated by ElevenLabs with SynthID — ElevenLabs Blog

2026年6月26日
特朗普政府提议取消自动驾驶汽车刹车踏板要求，特斯拉Cybercab离上路更近了

一个刹车踏板的存废，牵动整个自动驾驶行业的命运

美国交通部这个提议听起来有点反直觉——允许自动驾驶汽车不带刹车踏板。但这恰恰是特斯拉Cybercab这类产品真正上路必须要跨过的监管门槛。现行联邦机动车安全标准（FMVSS）要求每辆车都必须配备刹车踏板，哪怕这辆车从设计上就没人开。特朗普政府现在想把这条改掉。

国家公路交通安全管理局（NHTSA）管理员Jonathan Morrison在声明里说得很直白：”我们正站在自Model T以来车辆技术领域最大技术革命的边缘。如果想让美国领先，就得重新想象我们的监管框架。”这话的背景是，中国和其他国家在自动驾驶上也在加码，美国监管如果跟不上，优势就没了。

特斯拉Cybercab：没有方向盘，没有踏板，监管却还没跟上 | 图片来源：Tesla

特斯拉等了很久的绿灯

特斯拉过去几年一直在开发那辆两座Cybercab，定位就是完全自动驾驶、没有方向盘也没有踏板。马斯克这些年反复说，一旦监管批准，就能全国部署。但现实是，特斯拉从来没去申请FMVSS豁免——因为豁免就算批了，数量也有限制，不是真正的规模化路径。

现在NHTSA的提议是直接改标准，而不是搞豁免。这意味着车企可以从设计阶段就按”无踏板”来走，不用每次都去华盛顿求情。对特斯拉来说，这比啥都管用。

NHTSA表示，移除刹车踏板等部件要求”理论上将让车企能更快地把自动驾驶汽车推向道路”。

当然，特斯拉现在也没闲着。过去一年在奥斯汀运营了一小片robotaxi服务，刚开始副驾有安全员，后来逐步撤掉，变成”无人监督”运行。不过NHTSA披露，特斯拉承认在用远程操作员——低速情况下远程介入，处理障碍物或事故后移动车辆。这说明完全无人化还没到那一步。

不只是特斯拉受益

Zoox（亚马逊旗下）其实是更典型的例子。他们造了一辆从头就是为自动驾驶设计的小巴式robotaxi，去年好不容易拿到FMVSS豁免才能演示，现在还在等商业化运营的豁免。如果标准直接改了，第二波、第三波产品就不用再走这个流程。

Waymo相对好办一些，因为他们用的是改装版现有车型（捷豹I-Pace），本来就有方向盘和踏板，不受这个限制。但Waymo也在研发下一代没有手动控制的车辆，到时候同样会碰到这个问题。

这个提案现在进入30天公众意见征集期。也就是说，接下来一个月，车企、安全倡导组织、竞争对手都会进来表态。最终是否生效，还得看DOT的决定。但从特朗普政府一连串动作来看——包括之前NHTSA提议取消雨刮器和除雾系统要求——方向是很明确的：能减就减，别让监管拖住创新。

安全问题谁来管

支持方的逻辑是：如果一辆车从设计上就没有驾驶员，刹车踏板就是个摆设，还可能增加成本和复杂度。NHTSA说他们会”加强对根本安全标准的要求，并让AV开发方对安全性能负责”——意思是，踏板可以不要，但安全不能含糊。

但安全倡导组织肯定不这么看。没有刹车踏板的车，万一系统宕机了怎么办？乘客能做什么？这些问题不是技术白皮书能回答的，得真出点事才会有定论。30天意见期里，这类声音估计不会少。

这件事更大的背景是中美在自动驾驶上的竞争。中国北京、上海、深圳的robotaxi已经跑了一段时间，监管上也在摸索。美国如果率先在联邦层面放开”无踏板”设计，对特斯拉和Zoox出海可能是个卖点——当然，前提是自己国内先跑通。

📎 原文来源：Trump administration proposes axing brake-pedal requirement for AVs in a boost for Tesla — TechCrunch

2026年6月26日
Gemini 3.5 Pro跳票到7月，谷歌在最不该慢的时候慢了

Gemini 3.5 Pro推迟发布之际，谷歌正面临顶尖AI研究员持续流向Anthropic和OpenAI的尴尬局面

谷歌原本计划6月发布Gemini 3.5 Pro，现在推迟到了7月。单独看这件事，其实没什么大不了——让模型多喘口气、多改几版再发布，总比赶工出来一个半成品强。但问题是，这个推迟发生的时机实在太不凑巧了：同一周里，Transformer架构的共同作者Noam Shazeer离职去了OpenAI，诺贝尔化学奖得主John Jumper离职去了Anthropic。模型晚几周发布可以等，人才往外走这件事等不了。

谷歌这周失去的不仅仅是几个研究员

Shazeer这个名字在AI圈分量很重。2017年那篇”Attention Is All You Need”论文，他是共同作者之一，Transformer架构就是那篇论文里提出来的。谷歌在2024年花了27亿美元以acqui-hire的方式把他从Character.AI请回来主导Gemini项目，结果不到两年，他又走了，这次是去OpenAI。

Jumper的离开在另一个维度上更伤——他领导的AlphaFold项目拿了2024年诺贝尔化学奖，这是谷歌DeepMind迄今为止最干净利落的科学成果。AlphaFold团队的核心成员跟着Jumper一起走，基本上等于把DeepMind这几年最亮眼的一张牌整个搬到了Anthropic。

Alphabet的股价在6月22日跌了5%，2250亿美元的市值就这么蒸发了。市场反应不一定理性，但市场担心的东西很具体：前沿AI实验室同时在抢芯片、抢客户、抢分销渠道，而这些竞争的背后归根结底是抢人。谷歌在前面两项上有优势，在”抢人”这一项上不能出问题。

企业买家关心的不仅仅是模型本身

Gemini 3.5 Pro的延迟发布本身并不是致命伤。谷歌说推迟是为了收集早期测试用户的反馈，对模型做进一步优化，这个说法站得住脚。企业客户也不希望拿到一个匆忙上线、跑真实工作流就出问题的模型。

但企业客户买AI模型的时候，看的不只是眼前这个版本好不好用，他们也在押注接下来半年到一年的路线图——下一版模型什么时候出、质量怎么样、做这个模型的人还在不在这个实验室里。当Shazeer和Jumper在同一周宣布离职，企业CIO做决策时的信心就会打个折扣。这个折扣不一定是理性的，但采购决策从来不纯粹是理性计算。

谷歌并不是输了，但它需要证明更多

把话说回来，谷歌DeepMind仍然拥有巨大的计算资源，Gemini通过Search和Workspace的分发渠道也是竞争对手眼馋的。Gemini 3.5 Pro完全有可能在7月发布一个质量很高的版本，把这一轮的注意力重新拉回来。

真正的问题是信心。Anthropic靠着Claude在开发者社区里积累了很强的口碑，尤其是在代码生成这块；OpenAI有最强的消费者拉力和平台生态。谷歌不能只靠提醒所有人”Transformer是我们发明的”来赢这一局，它得持续证明前沿AI可以走得足够快，而且做这个研究的最优秀的人还愿意留下来。

7月的发布会是一个观察窗口。如果谷歌能拿出一份足够硬核的基准测试数据、清晰的价格方案，以及开发者社区的积极反馈，那么6月的这次推迟和人才流失就会变成脚注。如果发布含糊其辞、细节有限，竞争对手会用这个空隙做文章。

这一轮AI人才战的背后还有一个容易被忽略的驱动力：IPO预期。Anthropic和OpenAI都在筹备上市，在上市前进去拿股权，对于谷歌内部的顶级研究员来说是一个很难拒绝的财务激励。谷歌可以给高薪，但给不了上市前股权的倍数增长空间。这个结构性因素不会在短期内消失，谷歌需要想清楚除了薪资之外还能给顶尖研究员提供什么——这个问题，6月的这一周把它摆到了台面上。

📎 原文来源：Google delays Gemini 3.5 Pro to July as talent exodus deepens the pressure on its AI ambitions — Startup Fortune

2026年6月26日
不做芯片做软件，Sail用8000万美元赌AI推理可以更便宜

Sail Research用软件优化替代定制芯片，把AI推理成本压到对手的十分之一

everyone都在造芯片，Sail说软件就够了。这家刚刚冒出头的初创公司本周宣布完成8000万美元融资，估值4.5亿美元，由Kleiner Perkins和Sequoia联合押注。它的主张听起来有点反潮流——当OpenAI在做Jalapeño芯片、谷歌有TPU、亚马逊有Trainium的时候，Sail说光靠软件优化就能把AI推理成本压到对手的十分之一。

长周期智能体才是主战场

Sail Research的平台专门跑”长周期”AI智能体——就是那些需要连续工作数小时甚至数周才能完成的任务。它在Linux虚拟机（叫Sailboxes）里运行智能体，开发者可以自定义每个虚拟机的软件环境。关键是，当智能体在等待外部系统返回数据时，Sail会把整个智能体关掉，不再烧钱，等数据回来了再继续。这个设计思路很直接，但确实能省不少钱。

他们在BrowseComp-Plus基准测试上拿了90.72%的分数，同时推理成本只有对手的十分之一。这个成绩单够亮眼，但真正有意思的是它背后的逻辑：大部分企业根本造不起自己的定制芯片，但它们可以在现有的英伟达GPU上跑Sail的软件层，达到类似的效率提升。

Sail的CEO Neil Movva说得很直白：人类用电脑最看重速度，但智能体最需要的是规模、可靠性和可持续的成本。这句话其实点出了当前AI基础设施争论的核心——我们到底是在为什么买单？

定制芯片 vs 软件优化，两条路都能走通

这一轮AI基础设施的竞争，某种程度上分裂成了两个阵营。一边是”算力派”，认为推理成本的根本解法是定制芯片——OpenAI找Broadcom做Jalapeño，谷歌继续迭代TPU，亚马逊推Trainium，都在走这条路。另一边是”效率派”，认为现有的GPU已经够强，问题出在软件层没有把硬件能力吃干榨净。

Sail属于后者。它改写了多个开源推理引擎，用了一套自己优化的算法来提升显存利用率。效果据称不错，但这个说法需要打一个问号：基准测试的跑分环境和真实生产环境往往是两回事，90.72%的分数能否在客户的实际工作负载上复现，还得等产品正式铺开才知道。

投资者阵容值得注意

这一轮的投资者名单里有两个名字很显眼：Intel CEO Lip-Bu Tan和Alphabet董事长John Hennessy。Hennessy的身份尤其微妙——他既是谷歌的董事长，又投了一家说”软件优化可以替代定制芯片”的初创公司。不管这在战略上意味着什么，至少说明业界对AI推理成本问题的关注度已经非常高了。

Kleiner Perkins和Sequoia同时进场也是一个信号。两家顶级VC在同一个轮次里联手，通常意味着他们判断这个赛道已经过了”要不要做”的阶段，现在的问题是”谁能先做出来”。Sail的4.5亿美元估值不低，但它面对的是一个实实在在的市场需求：企业用完AI之后发现账单比预期厚得多，它们愿意为任何能压低成本的技术方案付钱。

这一轮融资的时间点选得有点巧——正好是OpenAI官宣Jalapeño芯片之后没几天。两件事摆在一起看，像是一场关于”AI推理成本到底该怎么降”的公开辩论。OpenAI选了最难的路（自己做芯片），Sail选了最快落地的路（软件优化）。两条路都能走通，但受益的客户群不太一样：超大规模云厂商有能力做定制芯片，普通企业只能靠软件层省成本。

📎 原文来源：Sail Research raises $80M to optimize long-horizon AI agents — SiliconAngle

2026年6月26日
Haystack：构建生产级 LLM 应用的首选 AI 编排框架，25K+ Stars 让 RAG 和 Agent 工作流完全透明可控
Haystack 是由 deepset 团队（已被 Cohere 收购）开发的开源 AI 编排框架，专为构建生产级 LLM 应用而设计。它让开发者以显式控制的方式设计模块化 Pipeline 和 Agent 工作流，覆盖 RAG、多模态、语义搜索、问答系统和自主智能体等场景。

📦 安装要求和过程
环境要求

Python >= 3.9（推荐 3.10+）

pip 包管理器

可选：Docker（用于容器化部署）

可选：GPU（用于本地模型推理加速）

快速安装

# 安装稳定版

pip install haystack-ai

# 安装 nightly 预览版（尝鲜最新功能）

pip install –pre haystack-ai

# 验证安装

python -c “import haystack; print(haystack.__version__)”

💡 可选依赖：pip install haystack-ai[openai,anthropic,mistral] 可一次性安装主流模型提供商支持。
🚀 核心功能

🧠

上下文工程优先

显式控制信息检索、排序、过滤、组合、结构化和路由的全流程。Pipeline 和 Agent 工作流完全透明、可追踪。

🔄

模型与厂商无关

集成 OpenAI、Mistral、Anthropic、Cohere、HuggingFace、Azure、AWS Bedrock、本地模型等。切换模型或基础设施无需重写系统。

🧩

模块化与可定制

内置检索、索引、工具调用、记忆、评估等组件，也可自定义。支持循环、分支和条件逻辑，精确控制上下文流转。

🌐

可扩展生态系统

通过统一接口构建和共享自定义组件，社区和第三方可轻松扩展 Haystack。支持 Hayhooks 将 Pipeline 包装为 REST API 或 MCP 服务器。

💡 典型使用场景

1

企业级 RAG 知识库系统

某德国联邦部委使用 Haystack 构建了面向公众的语义搜索系统，支持多语言文档检索和精准问答。通过 Haystack 的混合检索（稠密+稀疏向量）和重排序功能，实现了比传统关键词搜索高出 3 倍的准确率。系统部署在私有云上，数据完全合规。

2

多模态 AI 客服助手

某欧洲航空公司使用 Haystack 构建了支持文本+图片输入的客服 Agent，客户可以上传行李损坏照片，Agent 自动检索相关政策文档并生成处理建议。Haystack 的多模态 Pipeline 设计让文本和视觉信息在统一框架下协同工作，大幅缩短了投诉处理周期。

🌟 推荐理由

💬 笔者心得

在尝试了 LangChain、LlamaIndex 等多个 LLM 应用框架后，Haystack 给我留下的印象是「透明」和「可控」。与 LangChain 的「黑盒」链式调用不同，Haystack 的 Pipeline 是显式定义的——每个组件的输入输出、数据流向都一目了然，调试起来非常直观。

特别值得一提的是 Haystack 对上下文工程（Context Engineering）的重视。在 RAG 系统中，如何精准控制检索策略、如何组合多路召回结果、如何设计记忆机制，这些才是决定效果的关键。Haystack 把这些控制权交给了开发者，而不是封装成不可见的「魔法」。

另外，Haystack 的企业级基因也很突出——它诞生于 deepset 的商业化实践，从第一天就考虑了生产部署、可观测性、访问控制等现实需求。现在 deepset 被 Cohere 收购，Haystack 企业版（Haystack Enterprise Platform）更是提供了托管化生产 setup，对的企业用户来说是很好的选择。

📥 下载地址

🌐 官方网站

haystack.deepset.ai

🐙 GitHub 仓库

github.com/deepset-ai/haystack

25,730+ Stars · 2,884+ Forks

📚 官方文档

docs.haystack.deepset.ai

💬 Discord 社区

discord.gg/qZxjM4bAHU

🐍 PyPI 安装

pip install haystack-ai

🍳 Cookbook 食谱

haystack.deepset.ai/cookbook

📊 项目速览

⭐ Stars：25,730+

🍴 Forks：2,884+

📅 创建时间：2019-11

🔄 最近更新：2026-06-26

📝 开源许可：Apache-2.0

💻 主要语言：Python

🏢 维护团队：deepset（Cohere 旗下）

🌟 用户案例：Apple、Meta、NVIDIA、Netflix、Airbus 等
2026年6月26日
高通想做下一个英伟达，先掏出了Dragonfly CPU

高通发布Dragonfly C1000 CPU，进军AI数据中心市场 | 图源：生成图

美东时间6月25日，高通在纽约举办了2026投资者日暨股东大会。这场活动之前，市场对高通能不能在AI数据中心市场分一杯羹持怀疑态度——毕竟这个市场已经被英伟达、AMD和英特尔盯住了。但高通拿出来的一套完整产品路线图和一份大幅上调的财务指引，让股价在盘后直接涨了13%。

Dragonfly C1000：专为AI智能体设计的CPU

高通在投资者日上正式发布了Dragonfly C1000处理器。这款芯片的定位很明确：不是给普通服务器跑数据库的，是给AI智能体用的。随着自主智能体（Agentic AI）快速普及，CPU需要承担越来越多原本由GPU处理的任务——智能体要持续思考、调用数据库、执行代码，如果CPU跟不上，GPU就只能干等着，而GPU闲置对数据中心来说就是直接亏钱。

高通的差异化优势在于功耗。做了几十年手机芯片的人，最知道怎么在性能和处理功耗之间找平衡。现在数据中心扩建最大的瓶颈不是芯片性能，是电力——各大云厂商都在为能耗发愁。高通把在手机和边缘计算上积累的能效技术搬到数据中心，正好打在了痛点之上。

高通CFO Akash Palkhiwala在会后接受采访时说得很直白：”CPU市场供给不足，行业需要更多具备成熟技术能力的参与者。”言下之意：英伟达和AMD的CPU供应跟不上需求，高通来补这个缺口。

Meta已经下单，2028年量产即部署

发布的同时，高通宣布了一个重量级合作：Meta将在2028年Dragonfly C1000量产阶段大规模部署这款芯片，双方已签署长期供货协议。对高通来说，拿下Meta这样的头部云厂商的订单，是对产品竞争力的最好背书。

除了Meta，高通还透露已经拿到两家超大规模云服务商（hyperscaler）的定制芯片大额订单，定制芯片业务将逐步兑现规模化收入。高通CEO Cristiano Amon说，高通和云厂商的合作”不是从零起步”——凭借手机芯片和边缘计算产品，高通早已和全球几乎所有头部云厂商建立了稳定合作关系。

收购Modular，对标英伟达CUDA

硬件之外，高通同步宣布收购AI软件公司Modular。这笔交易的对价是不超过1920万股高通普通股，按高通周二收盘价计算，价值约39.2亿美元。Modular拥有Mojo编程语言、MAX推理平台和AI编译器，这套软件体系可以实现AI应用在不同芯片架构上高效运行——高通明说，这个技术栈要对标的是英伟达的CUDA。

CUDA是英伟达最深的护城河。无数AI应用和模型都基于CUDA开发，换不了平台，用户就被锁住了。高通收购Modular，就是要打通从芯片硬件、编译工具到模型部署的全链条，复制英伟达靠软硬件协同构筑行业壁垒的路径。这个算盘打得清楚：光有芯片不够，得有软件生态才能留住客户。

财务指引大幅上调，股价盘后涨13%

这次投资者日最刺激市场的地方，是高通大幅上调了中长期营收指引。2029财年非手机业务营收指引从原来的220亿美元上调至400亿美元，增幅接近91%。汽车业务的设计订单总价值已扩容至650亿美元，2029财年汽车板块收入目标提高至100亿美元。

手机芯片一直是大通的基本盘，占最近季度总营收的三分之二。但全球智能手机出货量早在2017年就见顶了，增长空间有限。高通过去几年持续向智能汽车、机器人和云端算力倾斜资源，这次的财务指引上调，算是给市场交了一份多元化转型的时间表。

多重利好催化下，高通股价在会后盘后交易中大涨13%。市场用钱投票，表达了对高通进军数据中心算力市场的看好。至于高通能不能真的从英伟达、AMD和英特尔手里抢到市场份额，接下来几年见分晓。

📎 原文来源：东方财富网 – “下一个英伟达”？高通剑指AI算力赛道

2026年6月26日

标签： AI

让AI替你面试

和竞争对手不一样的地方

视频档案的偏见风险

📌 项目简介

⚙️ 安装要求和过程

环境要求

快速安装

依赖说明

🚀 核心功能

1. 基于类型提示的自动数据验证

2. 自动生成 API 文档（OpenAPI & JSON Schema）

3. 异步支持（async/await）

4. 依赖注入系统

5. 安全性内置支持

💡 典型使用场景

场景一：AI/ML 模型服务化部署

场景二：微服务架构中的 API 网关

场景三：实时 WebSocket 应用

🌟 推荐理由

📊 技术对比：FastAPI vs Flask vs Django

📥 下载地址

快速开始

🚀 同类推荐

两根车把的自行车

REI把锅甩给了Meta

原始图片没问题，是AI动的手

Meta的条款把责任推给了广告主

REI不是第一个踩坑的

AI广告工具的普遍问题

当AI开始监督AI

Cherny自己就在跑的loop

技术上来说，这不算是全新的东西

跟test-time compute的关系

成本是个大问题

AI声音越来越像真人，水印成了最后的防线

SynthID是什么，为什么是Google在推

水印能解决什么问题

监管压力是背后的推手

一个刹车踏板的存废，牵动整个自动驾驶行业的命运

特斯拉等了很久的绿灯

不只是特斯拉受益

安全问题谁来管

谷歌这周失去的不仅仅是几个研究员

企业买家关心的不仅仅是模型本身

谷歌并不是输了，但它需要证明更多

长周期智能体才是主战场

定制芯片 vs 软件优化，两条路都能走通

投资者阵容值得注意

📦 安装要求和过程

环境要求

快速安装

🚀 核心功能

上下文工程优先

模型与厂商无关

模块化与可定制

可扩展生态系统

💡 典型使用场景

企业级 RAG 知识库系统

多模态 AI 客服助手

🌟 推荐理由

📥 下载地址

Dragonfly C1000：专为AI智能体设计的CPU

Meta已经下单，2028年量产即部署

收购Modular，对标英伟达CUDA

财务指引大幅上调，股价盘后涨13%