博客

  • OpenAI秘密递交上市申请,AI双雄IPO竞速正式打响

    OpenAI本周悄悄向美国SEC提交了IPO申请,把”上市”这件事从传闻变成了实锤。这家公司过去一年半载都在各种场合暗示”我们会上市”,但一直没给出明确时间表,现在看来是坐不住了。

    OpenAI IPO
    OpenAI总部(资料图)

    有意思的是,Anthropic上周也刚递了上市材料。两家公司的IPO竞速,就这样毫无预兆地拉开了帷幕。

    高盛和摩根士丹利已经进场

    据彭博社援引知情人士消息,OpenAI已经拉着高盛和摩根士丹利在忙活了,目标是最快今年秋季完成上市。不过公司官方的话说得留有余地:”有些事在私有状态下更好办,上市这事我们还在权衡,可能需要一段时间。”

    翻译一下就是:文件递了,但别催,我们在看风向。

    还有一个细节值得注意。OpenAI计划在上市前几周启动一轮股票回购,给员工提供流动性。这说明公司手里是有钱的,回购不是问题,关键是把员工利益理顺,别让IPO变成内部矛盾爆发的导火索。

    Anthropic抢先了一步

    Anthropic上周递交IPO申请的时候,估值已经跳到了9650亿美元——这个数字第一次超过了OpenAI。而且Anthropic的收入增速也很猛,最新一轮私募融资里拿到的估值,直接把OpenAI挤到了第二的位置。

    两家公司的节奏现在完全错位了。Anthropic是先私募估值压过OpenAI,再抢先递表;OpenAI则是直接走IPO流程,试图用公开市场的溢价把估值追回来。

    这里面有一个微妙的变化:AI赛道里的公司,过去比的是谁的模型强、谁的用户多,现在开始比谁先上市、谁在公开市场上更值钱。融资竞赛已经从私募市场烧到了公开市场。

    OpenAI的压力比想象中大

    表面上看,OpenAI还是AI的代名词,ChatGPT的月活和数据摆在那里,没人能否认它的地位。但公司内部的问题,外界知道的可能只是一部分。

    据报道,OpenAI有几次内部的收入和用户增长目标没达到。多位核心高管过去一年离职或者退居二线,产品线也在不断收缩和整合。Anthropic的Claude在编程场景里抢走了一大块用户,Google的Gemini则在多模态上紧咬不放。

    IPO某种程度上是一次”强制体检”。所有财务数据、风险因素、竞争格局,都要摊开给监管机构和公众看。这对OpenAI来说,既是融资的机会,也是压力测试的关口。

    马斯克又多了一个对手

    如果OpenAI真的在今年上市,奥特曼和马斯克之间的较量就又多了一个维度。SpaceX计划本周上市,估值约1.8万亿美元;OpenAI单轮融资就拿了1220亿美元,估值8520亿美元,在融资额上已经超过了SpaceX的IPO募资规模。

    这两人之间的恩怨从OpenAI的创立一路延续到现在,诉讼、口水战、理念分歧,样样不落。现在连上市都要撞在一起,也算是某种宿命感。

    钱去哪儿了?

    各大AI公司现在都在拼命囤钱,名义是买芯片、建数据中心、训练下一代模型。OpenAI今年2月跟投资者说,公司计划到2030年在AI基础设施上投入大约6000亿美元。

    6000亿美元是什么概念?相当于每年要花1000多亿美元在算力上。这个数字已经不是一家科技公司正常的资本支出了,而是一个国家级的基建计划。IPO能帮OpenAI补上这个资金缺口,也可能让外界更清楚地看到,这场AI竞赛的真实成本到底有多高。


  • 亚马逊借了175亿美元搞AI,这笔钱能烧多久?

    亚马逊借了175亿美元搞AI,这笔钱能烧多久?

    亚马逊刚刚从银行拿到了175亿美元贷款。这个数字是什么概念?相当于一个中等国家的GDP,或者大约1200亿人民币。而亚马逊拿这笔钱的用途只有一个:砸进AI里。

    这不是亚马逊第一次为AI借钱。就在拿到这笔贷款前不久,亚马逊刚在加拿大发了一笔债券,规模大到创了加拿大企业债券发行的历史纪录。两笔融资加起来,亚马逊正在为它的AI野心准备一个巨大的资金池。

    亚马逊AI基础设施
    亚马逊在北弗吉尼亚的AI数据中心(图源:Pymnts)

    2000亿美元要花在哪里

    亚马逊2026年的资本支出预算是2000亿美元。比2025年的1318亿美元猛增了超过50%。这笔钱主要流向两个方向:AWS数据中心扩建,以及AI算力基础设施。

    你能想象2000亿美元堆在一起是什么样子吗?这笔钱可以买下大约40艘航空母舰,或者建造200个大型国际机场。而亚马逊计划把它全部投进服务器、GPU、数据中心和电力设施里。

    亚马逊CEO安迪·贾西在最新一季财报电话会上说得很直白:”我们正在尽可能快地安装产能,把产能变成收入。”翻译一下就是:钱先砸进去,后面再想办法赚回来。

    亚马逊2025年第四季度AWS营收同比增长24%,是近13个季度以来的最高增速。云业务还在涨,但钱也确实在往里砸。

    不是亚马逊一家在借,整个科技圈都在举债

    如果你觉得亚马逊借175亿美元很多,那你可能没看过整个科技行业的账单。2026年,亚马逊、Alphabet(谷歌母公司)、微软、Meta这四家公司的资本支出加起来预计会达到7250亿美元。

    7250亿美元。这个数字比很多国家的全年GDP还高。而这些钱,绝大部分都会流向AI。

    为什么大家都在借钱搞AI?因为AI军备竞赛的逻辑很简单:你不砸,别人就砸了;别人砸了,你就落后了;你落后了,之前的投入可能就打水漂了。这个正反馈循环让每家科技公司都不得不往里砸钱,哪怕这意味着公司债务会飙升。

    国际清算银行在2026年3月出了一份报告,说AI投资已经进入了”更危险的阶段”。超大规模云厂商把创纪录比例的经营现金流投进了资本支出,对外部融资的依赖度持续上升。翻译成人话:大家都在透支未来,赌AI能赚回这笔钱。

    这笔钱能换来什么

    亚马逊借钱砸AI,到底能不能赚回来?这个问题现在没有人能给出确定答案。

    乐观的人会说:你看AWS还在高速增长,AI需求只会越来越旺,现在砸的钱,未来会变成持续几十年的现金流。亚马逊现在是全球最大的云服务商,市场份额超过30%,AI浪潮只会让它更赚钱。

    悲观的人会说:2000亿美元砸进去,什么时候能回本?AI现在看起来很热闹,但真正赚大钱的应用还没出现。如果AI的商业化不及预期,亚马逊这笔债可能要还得非常辛苦。

    摩根士丹利的分析师算了一笔账:亚马逊2026年的自由现金流可能会变成负170亿美元。也就是说,经营活动赚的钱,还不够覆盖资本支出的窟窿,需要靠借钱来补。

    这种模式能维持多久?取决于两件事:第一,AWS的增长能不能持续;第二,AI能不能真的变成一门好生意。如果这两件事都发生,亚马逊的债务会变成未来收入的垫脚石;如果没发生,这些债务就是一颗定时炸弹。

    小公司已经玩不起了

    亚马逊这笔175亿美元贷款,给行业释放了一个很清晰的信号:AI的竞争门槛已经高到中小公司玩不起的程度了。

    你想做一个AI创业公司?先准备个几十亿美元的资金储备吧。没有这个体量,你连跟亚马逊、谷歌、微软、Meta竞争的资格都没有。这不是在比谁的产品更好,而是在比谁的融资能力强、谁敢借更多的钱。

    这对创业生态意味着什么?意味着AI领域的创新,会越来越集中在少数几家巨头手里。创业公司要么被收购,要么就专注做细分领域的小生意,再也别想挑战巨头的地位了。

    亚马逊愿意承担这么高的债务,本质上是在押注:AI是未来十年最重要的技术底座,谁先建立起算力优势,谁就能在未来的AI经济里占据最好的位置。这笔赌注有多大?175亿美元,加上之前借的,加上未来还要借的,可能要到上千亿美元的规模。赌赢了,亚马逊会变得更不可替代;赌输了,这笔债务的利息就能压得公司喘不过气。


  • 印度人做视频AI,价格打到国际大厂的二十分之一

    印度人做视频AI,价格打到国际大厂的二十分之一

    你有没有想过,为什么AI视频生成这么贵?用Veo、Kling、Runway这些工具生成几秒钟的视频,每秒收费动辄0.1美元以上,一个月下来账单能让你怀疑人生。但在印度,一群创业者正在用完全不同的思路做这件事。

    班加罗尔的Avataar AI最近推出了一个名为Varya的视频生成模型。他们的定价是每秒0.005美元——换算下来,只有国际主流视频AI模型的二十分之一。如果你用Veo生成一段10秒的视频要花1美元,用Varya只需要花5美分。

    Avataar Varya视频AI生成示例
    Avataar Varya的视频生成界面(图源:TechCrunch)

    不是从零训练,而是站在巨人肩膀上

    Varya并不是从零开始训练的大模型。它的底层基于阿里巴巴开源的Wan 2.2视频生成模型,然后做了一件事——模型蒸馏。

    简单来说,他们把Wan 2.2原本需要50步才能完成的生成流程,压缩到了4步。结果是什么?生成速度提升了10倍。在NVIDIA H200 GPU上,生成一段5秒的720p视频,Wan 2.2需要1230秒(超过20分钟),而Varya只需要45秒。

    这就像你把一辆车的发动机拆了,重新设计了一套更轻量、更高效的动力系统,结果跑得比以前快10倍,油耗还只有以前的二十分之一。

    专门给印度人做的AI,不会把节日搞错

    Varya有个很有意思的特点:它针对印度本土文化做了专项训练。你让它生成一个印度婚礼的场景,它能准确地画出新娘穿的红色纱丽、桌上的糖果摆盘、背景里的彩灯装饰。而用通用的AI视频模型,经常会出现文化刻板印象——比如把印度节日生成得像中东的庆典,或者把印度传统服饰画错。

    “我们的模型能理解印度文化的细微差别,这是通用模型做不到的。”——Avataar AI团队

    这个细节其实很重要。印度有14亿人口,说着22种官方语言,文化多样性极高。一个能真正理解本地文化的AI工具,和那种”差不多就行了”的通用模型,在实际使用中差距巨大。

    为什么要做这么便宜的AI?

    答案很简单:因为印度市场用不起那些昂贵的AI工具。

    印度是一个”视频优先”的市场。普通消费者刷YouTube、Instagram、WhatsApp Status的时间远超阅读文字内容。但对于印度的小企业主、内容创作者、教师来说,每个月花几十美元订阅一个AI视频工具,是一笔不小的开支。

    Avataar的创始人算了一笔账:如果一个印度小企业主每个月想用AI生成50段产品宣传视频,用Veo要花大约300美元(假设每段视频6秒),而用Varya只需要花15美元。这个价格差距,决定了AI视频能不能在印度真正普及。

    而且Avataar还做了一个很聪明的决定:把Varya的模型权重和训练数据完全开源,放在印度政府主办的AI Kosh平台上。任何开发者都可以免费下载、自行部署、根据自己的需求修改模型。这种开放策略在印度AI圈里越来越常见——既然在基础大模型上拼不过美国和中国,那就从应用层和开发者生态入手。

    印度AI的另一种玩法

    Varya的出现,其实反映了印度AI产业的一个有趣转向。过去几年,印度科技圈一直在纠结:我们要不要砸钱做自己的大模型?能不能在AI基础研发上追上美国?

    现在看起来,答案越来越清晰:不必硬刚。印度有庞大的开发者群体、有全球规模最大的IT外包产业、有14亿人口的本地市场需求。基于开源模型做蒸馏优化、针对本地需求做定制化、把价格打到能让普通人也用得起——这条路可能比烧钱训练基础大模型更实际,也更有商业价值。

    Avataar拿到了Peak XV(就是原来的红杉印度)的投资,还入选了印度政府”印度AI使命”计划的扶持名单。这个计划拿出了约12亿美元,专门补贴入选的AI初创企业,给他们提供便宜的GPU算力。政府的逻辑也很清楚:先让一批本土AI公司跑起来,再通过他们带动整个生态。

    Varya现在的体验入口已经在Avataar官网上线,你可以用文字描述想要的视频内容,也可以上传一张参考图让它生成视频。企业客户可以直接对接他们的API。接下来,Avataar计划跟Higgsfield、Adobe Firefly这些视频工具做集成,让Varya嵌入到更多创作者的工作流里。

    印度有14亿人,每年有上千万新人进入劳动力市场,有数千万小企业需要更便宜的营销工具。如果Varya真的能把AI视频的价格打到人人都用得起的程度,它不一定需要跟Veo在正面对决中赢,光是服务好印度这一个市场,就足够撑起一家有价值的公司了。


  • 【开源推荐】crawl4ai:68.3K+ Stars!专为LLM设计的网页爬虫,让AI直接读懂网页内容

    【开源推荐】crawl4ai:68.3K+ Stars!专为LLM设计的网页爬虫,让AI直接读懂网页内容

    crawl4ai - LLM友好网页爬虫工具

    crawl4ai – 专为LLM和AI Agent设计的网页爬虫工具 @reference_1@

    📌 项目简介

    crawl4ai 是一款专为LLM和AI Agent设计的开源网页爬虫工具,能将任意网页内容转换为干净的Markdown格式,可直接用于RAG、AI Agent、数据管道等场景,无需依赖任何付费API。

    68.3K+
    GitHub Stars

    Python
    开发语言

    v0.6+
    最新版本

    ⚙️
    安装要求和过程

    环境要求

    • Python ≥ 3.10
    • Playwright(用于异步浏览器控制)
    • 支持 Windows / macOS / Linux

    快速安装(4步搞定)

    # 第1步:安装 crawl4ai
    pip install -U crawl4ai
    # 第2步:配置浏览器依赖
    crawl4ai-setup
    # 第3步:验证安装
    crawl4ai-doctor
    # (可选)如 Playwright 报错,手动安装浏览器
    python -m playwright install chromium

    Docker 部署(生产推荐)

    # 拉取官方镜像
    docker pull unclecode/crawl4ai:latest
    # 启动容器
    docker run -d -p 11235:11235 –name crawl4ai –shm-size=1g unclecode/crawl4ai:latest
    # 访问监控面板
    http://localhost:11235/dashboard


    核心功能

    ① 智能 Markdown 生成

    生成结构清晰、格式准确的干净 Markdown,支持 Fit Markdown 启发式过滤,自动剔除无关噪音内容。支持 BM25 算法过滤,可提取核心信息,更适合 AI 处理。

    ② LLM 驱动的结构化数据提取

    支持所有 LLM(开源/闭源)驱动的结构化数据提取。内置多种分块策略,支持基于用户查询的语义内容匹配,可通过自定义 Schema 从重复页面模式中批量提取结构化 JSON。

    ③ 浏览器深度集成

    支持托管用户自有浏览器,通过 Chrome DevTools 协议实现远程浏览器控制。支持浏览器配置文件持久化(保存认证状态、Cookie),完美支持需要登录的网站爬取。

    ④ 动态页面与反爬对抗

    支持执行 JavaScript、等待异步动态内容加载、处理无限滚动页面。提供隐身模式模拟真实用户行为,支持自定义请求头、Cookie、User-Agent 和代理认证,有效绕过常见反爬限制。

    ⑤ Docker 一键部署 + API 服务

    提供优化后的 Docker 镜像,内置 FastAPI 服务,开箱即用。内置 JWT 令牌认证保障 API 安全,支持大规模生产环境部署,是构建数据采集基础设施的最佳选择。

    💡
    典型使用场景

    场景1:RAG 知识库数据准备

    将网页内容转换为干净 Markdown,作为 RAG 系统的知识库来源。crawl4ai 的 Fit Markdown 功能可自动过滤导航栏、广告、页脚等噪音,只保留核心正文,避免无关内容干扰大模型输出。配合深度爬取(BFS/DFS策略)可批量采集整个网站。

    场景2:AI Agent 实时信息获取工具

    将 crawl4ai 封装为 AI Agent 的工具函数,让 Agent 能够自主爬取所需网页内容。比如用户问”今天有哪些 AI 新闻?”,Agent 可自动爬取新闻网站并提取结构化信息,真正实现 AI 联网能力。

    场景3:大规模数据采集管道

    结合 Docker 部署、浏览器池、缓存机制,搭建大规模高并发网页数据采集系统。内置的浏览器配置文件持久化能力,可保存登录状态实现需要认证的网站批量采集,适合构建企业级数据采集基础设施。

    🚀 30秒快速开始

    Python 代码方式:
    import asyncio
    from crawl4ai import *

    async def main():
    async with AsyncWebCrawler() as crawler:
    result = await crawler.arun(url=”https://example.com”)
    print(result.markdown) # 获取干净 Markdown

    if __name__ == “__main__”:
    asyncio.run(main())

    CLI 命令行方式:
    crwl https://example.com -o markdown
    # 深度爬取,最多10个页面
    crwl https://docs.crawl4ai.com –deep-crawl bfs –max-pages 10

    💝
    推荐理由

    如果你正在构建 RAG 系统或 AI Agent,crawl4ai 是目前开源界最值得关注的网页数据采集工具。它解决了传统爬虫的两个核心痛点:

    第一,真正为 LLM 优化。 传统爬虫输出的是原始 HTML 或杂乱文本,需要大量后处理才能喂给大模型。crawl4ai 直接输出干净、结构化的 Markdown,内置的 Fit Markdown 功能可以智能过滤导航、广告等噪音,让 RAG 召回质量大幅提升。

    第二,对动态页面和反爬场景的支持非常完善。 基于 Playwright 的浏览器控制,可以处理 React/Vue 等前端框架渲染的页面,支持等待异步内容加载、处理无限滚动。隐身模式和浏览器指纹自定义功能,让我在采集一些有反爬机制的网站时也能稳定获取数据。

    最让我惊喜的是它的 Docker 部署方案。 几分钟就能搭建一个带 API 服务的爬取引擎,内置 JWT 认证,可以直接集成到现有数据管道中。对于需要大规模采集的场景,这比手写 Scrapy 爬虫效率高太多了。

    ⭐ 总之,如果你需要为 AI 应用添加网页数据获取能力,crawl4ai 是目前最成熟的开源选择,没有之一。

    📥 下载地址

    License: Apache 2.0 | 作者: UncleCode | 最近更新: 2026年6月

    💡 关注【开源推荐】系列,每周带你发现最值得关注的 AI 开源项目
    ⭐ 如果这篇文章对你有帮助,欢迎在 WordPress 点赞留言!

  • 贝索斯又出手了,这次是120亿美元砸向「通用人工工程师」

    贝索斯又出手了,这次是120亿美元

    杰夫·贝索斯悄悄布局AI这几年,这次的动作大得有点离谱。他跟谷歌旗下Verily的前联合创始人维克拉姆·巴贾杰一起搞了个物理AI公司,叫Prometheus,刚完成120亿美元融资,投后估值410亿美元。这个估值什么概念?这是有史以来估值最高的AI初创公司之一。

    这已经是Prometheus的第二轮融资了。去年年底成立的时候拿了62亿美元,这次直接翻倍还多。投资方名单读起来像全球金融圈的点名:摩根大通、高盛、贝莱德,再加上贝索斯本人。

    Jeff Bezos
    杰夫·贝索斯,来源:Getty Images

    “通用人工工程师”是个什么玩意

    Prometheus要做的东西,他们自己叫”通用人工工程师”(Artificial General Engineer)。说白了,就是一套能自动搞定复杂物理系统设计和制造的软件——从喷气发动机到药物化合物,都算。

    这个野心大到有点吓人。他们想用AI替代大部分工程类工作。但贝索斯在接受CNBC采访时表示,AI带来的生产力提升会产生他所说的”劳动力短缺”——意思是未来对劳动力的需求会超过供给。这个观点跟科技圈很多人的判断正好相反。不少人觉得AI会导致大规模失业,贝索斯不这么看。

    “经济的显著生产力提升将提高生活水平。现在很多双职工家庭会变成单职工家庭,有些加班的人也会不再需要加班。”贝索斯是这么说的。

    410亿美元估值,钱要花在哪

    Prometheus目前在旧金山、伦敦和苏黎世设有办公室,一共150名员工。贝索斯说,这轮融资的大部分资金将用于满足公司的大规模算力需求。这个信息很直白——物理AI很烧钱,尤其是训练模型和运行仿真。

    410亿美元的估值让Prometheus站在了物理AI赛道的最前面。但这个赛道不是只有它一个。近几个月,风险资本家正越来越多地向物理AI领域投钱。这个赛道被投资者和创业者认为比纯软件赛道更具防御性——因为物理世界能产生仅靠代码无法构建的护城河。

    贝索斯对大规模劳动力运作有深刻认知。在亚马逊,他担任执行董事长,也是最大的个人股东,亚马逊在全球拥有超过150万名员工。过去一年,随着公司加速自动化进程,亚马逊已经裁员数万人。所以他说”劳动力短缺”,多少有点讽刺——他自己的公司正在用自动化减少劳动力。

    Prometheus目前尚未披露其已有的具体研发成果。150人,120亿美元,410亿估值——这些数字摆在一起,外界难免好奇他们到底做出来了什么。接下来几个月,应该是Prometheus从神秘走向公开的关键期。


    • Prometheus完成120亿美元融资,投后估值410亿美元
    • 由Jeff Bezos和Verily前联合创始人Vik Bajaj创立
    • 开发”通用人工工程师”软件,目标替代大部分工程类工作
    • 贝索斯预测AI将导致”劳动力短缺”,与主流观点相反
    • 融资主要用于算力需求,公司在旧金山、伦敦、苏黎世设有办公室
  • 西班牙人做机器人,不走波士顿动力的路子

    西班牙人做机器人,不走波士顿动力的路子

    类人机器人喊了这么多年,工厂里还是少见。不是技术不行,是制造业等不及了。欧洲一家叫Theker的初创公司刚完成8500万美元A轮融资,做的就是这件事——让机器人真的进工厂。

    他们的思路跟波士顿动力那种固定形态的人形机器人不一样。Theker的机器人可以重新配置,手、手臂、整体形态都能根据任务换。今天分拣包裹,明天打包服装,后天在仓库里处理瓶罐,同一个机器人换个”零件”就能干。

    Theker机器人
    Theker联合创始人,来源:Theker

    Zara的母公司投了,但这只是起点

    Theker的第一个大客户是Zara的母公司Inditex。这件事的意义不只是拿到一个客户,而是证明了他们的方向是对的——零售和物流的场景足够复杂,能搞定这里,制造业就不会太远。

    这轮融资由美国VC公司CRV领投,三星和LVMH董事长贝尔纳·阿尔诺旗下的Aglaé Ventures也跟进了。三星目前还不是客户,但双方聊得很深。Theker的态度很明确:欢迎三星同时当客户、供应商和投资者,这种三重身份能让一家初创公司同时拿到大规模制造的订单和信任背书。

    “我们创立Theker不是为了做试点项目。”联合创始人Carla Gómez Cano说得很直接。所以他们完全跳过创新部门,直接找物流或运营部门谈,那些地方的合作是实打实的,决策也快得多。

    欧洲史上最大机器人A轮,钱要花在哪

    8500万美元,Theker说这是”欧洲有史以来规模最大的机器人领域A轮融资”。他们在巴塞罗那市中心设了展示厅,接下来还要在欧洲、美国和亚洲开更多。团队现在几十人,到今年年底要冲到120人——光是筛选15000份求职申请就够忙一阵的。

    融资额是原计划的两倍。Gómez Cano之前还说要融3000万或4000万美元,结果拿了两倍的份。这件事也让他们更坚定了把总部留在巴塞罗那的决定。巴塞罗那这几年机器人产业起来了,Theker就是其中的代表。

    工厂机器人这个赛道,过去几十年一直是日本和德国的天下。现在AI进来了,游戏规则开始变。Theker的赌注是:通用化,而不是 specialization。一个能换零件的机器人,比十个只能干一件事的机器人,对工厂来说可能更划算。


    • Theker完成8500万美元A轮融资,CRV领投,三星和Aglaé Ventures跟投
    • 机器人支持重新配置,可适配分拣、打包、仓储等多种任务
    • Zara母公司Inditex为早期支持者,目标拓展至制造业
    • 总部位于巴塞罗那,计划扩建展示厅并扩大团队至120人
  • 毕业典礼上学生嘘AI演讲,微软写了3100字长文回应:你们是在提醒我们

    这几年科技公司推广AI的方式,和大众对AI的真实感受,中间有一道越来越宽的裂缝。最近美国各地大学毕业典礼上出现了一个有趣的现象:只要演讲嘉宾提到AI,台下就会响起嘘声。相关视频在TikTok和X上疯传,成了某种集体情绪的出口。

    前谷歌CEO埃里克·施密特在亚利桑那大学演讲时遭遇学生大声抗议;另一场佛州毕业典礼上,演讲者刚说AI是「下一个工业革命」,台下的反应也是一片起哄。这些视频看起来是学生在闹,但实际上折射的是一种更广泛的不满——年轻人一边在用AI,一边对它带来的后果感到不安。

    Microsoft
    微软总部 | 来源:The Verge

    微软的3100字回应

    面对这个局面,微软副总裁兼总裁布拉德·史密斯(Brad Smith)没有直接无视,而是写了一篇超过3100字的长文,标题叫《AI、就业与下一代》。文章的态度是温和的,甚至有点反思的意味。

    史密斯在文章里说,那些对AI提及皱眉甚至发出嘘声的毕业生,「其实是在告诉我们该听的信息:是时候再次提高标准了」。他在X平台上也补充了一句:「发出嘘声的毕业生是在提醒我们,AI应该服务人,而不是取代人。」

    「你们处于能发挥积极影响的位置,你们经历过不少挑战。虽然就业市场的不确定性可能让你觉得不公平,但你就是为这个时刻而生的。」

    这封信是写给谁看的?

    The Verge的文章提出了一个挺尖锐的问题:史密斯这篇长文,到底是说给愤怒的毕业生听的,还是说给那些看了嘘声视频却不以为然的企业高管听的?

    如果是后者,那这篇文章的意义就不一样了。那些高管本来就需要被提醒「AI要服务人」,但问题是,他们本身就是推动AI大规模落地的人。指望他们自我约束,这件事本身就有点矛盾。

    更何况,科技圈在这件事上的公信力并不高。OpenAI的CEO山姆·奥特曼之前警告AI会有灾难性影响,后来发现这种说法不受欢迎,又改口了。微软自己的AI CEO Mustafa Suleyman也一直在就业话题上「走钢丝」。大家不信,也是有原因的。


    年轻人的AI愧疚感

    这件事背后还有一个值得注意的细节。最近有调研发现,Z世代其实广泛使用AI,但用的时候会有「愧疚感」。他们知道AI有问题——能耗、版权、对就业的影响——但又离不开它。这种矛盾心理,在毕业典礼那个场合被放大了。

    毕业典礼本来是个展望未来时刻,演讲嘉宾站在台上描绘AI将如何改变世界,台下的学生听到的可能是:「我未来的工作要被这个东西取代了,而你正是推动这件事的人。」嘘声是一种抗议,但也是一种无力感的表达。

    史密斯的长文试图消解这种对立,但他的核心逻辑还是「AI会来,我们要学会适应」。这个叙事框架本身,可能就是学生不信的原因之一。

  • 狮门影业买了Runway的股份,打算用《饥饿游戏》IP做AI短剧

    好莱坞和AI的关系一直很微妙。一边是编剧大罢工留下的伤口还没愈合,一边是各家制片厂悄悄地和AI公司签协议。6月11日,狮门影业(Lionsgate)和生成式视频AI公司Runway宣布把合作升级——不只是技术合作,狮门还直接拿了Runway的少数股权。

    从「用AI做电影」到「用IP做AI内容」

    这次合作的核心内容其实分三层。第一层是股权:狮门买进了Runway的少数股份,正式成为战略股东。第二层是内容开发:双方要联合开发新的IP,同时推出一系列AI驱动的合作项目,其中第一批落地的就是AI生成的短剧系列。第三层是IP授权:狮门把自己手里的一堆经典IP交给Runway,用来训练或者生成内容。

    狮门手里的IP清单相当能打——《饥饿游戏》《疾速追杀》《分歧者》《广告狂人》……这些IP加起来的全球票房超过200亿美元。现在Runway可以用这些IP来生成AI短剧,至于具体先用哪个IP,双方暂时还没公布。

    John Wick
    狮门影业经典IP《疾速追杀》剧照 | 来源:TheWrap

    Runway的CEO说:AI是创意资源,不是省钱工具

    这话说出来其实挺有讲究的。好莱坞对AI的最大恐惧就是「AI来替代编剧和演员」,所以美国编剧工会(WGA)2023年大罢工的核心诉求之一就是限制AI的使用。Runway联合创始人兼联席CEO Cristobal Valenzuela特意强调了这个定位:

    「我们一直看到,对AI最重视的制片厂都将其视为创意资源,而非削减成本的工具。狮门理解这一点。此次扩大合作将帮助更多故事更快被讲述。」

    狮门副董事长Michael Burns的表态也在这个方向上:「Runway是很好的创意合作伙伴……它将帮助我们的创作者重新定义和重塑他们创意实践中『可能性』的边界。」

    上次的合作其实卡住了

    这不是狮门和Runway第一次合作。2024年双方就签过合作协议,但据TheWrap此前的独家报道,那个合作在「用AI生成完整电影」这件事上遇到了不小的限制——生成出来的画面达不到电影级的要求。这次调整方向,改做短剧系列,某种程度上是双方在现实约束下找到的一个新路径。

    短剧这个格式对AI生成来说要比长片友好得多。单集几分钟,容错率更高,观众对画质的容忍度也更高。而且短剧现在的商业逻辑已经跑通了——TikTok、Reels、Shorts这些平台上的剧情类短内容,已经有稳定的受众和变现路径。


    AI电影节的信号

    作为合作的一部分,狮门会成为Runway今年6月举办的「Runway AI电影节」的呈现合作伙伴。这个电影节的定位是展示AI辅助创作的电影作品,狮门的加入等于给了这个活动一个主流制片厂的背书。

    目前双方还没有公布AI短剧系列的具体上线时间表。但从合作宣布的节奏来看,Runway显然希望在AI视频生成这个赛道上,抢在OpenAI的Sora正式大规模开放之前,先把自己的商业落地案例做出来。

  • 独立音乐人把Google告了:你在用我的歌训练AI,还不承认?

    Google Lyria AI音乐训练争议
    独立音乐人起诉谷歌,指控其使用YouTube内容训练Lyria AI音乐模型 | 图片来源:The Verge

    独立音乐人把Google告了:你在用我的歌训练AI,还不承认?

    一群独立音乐人正在起诉谷歌,理由听起来挺直接:谷歌非法使用他们上传到YouTube的歌曲来训练Lyria 3音乐生成模型。但谷歌的回应方式,比诉讼本身更值得玩味。

    谷歌已提交驳回诉讼的动议。它的抗辩策略是典型的”两步走”:先说”你们无法证明我们用了你们的具体作品来训练”,再退一步说”就算我们用了,你们也在服务条款里授权我们这么做了”。

    “他们的诉讼基于’谷歌用他们的特定作品进行训练’这一没有证据支持的假设。即使接受他们未经证实的指控为事实,这份起诉书也不成立。每位原告都授权YouTube及其服务提供方谷歌,对上传内容拥有广泛的使用许可。”

    这是法律文件的常规操作。但当记者直接问谷歌是否使用YouTube视频训练Lyria 3时,该公司拒绝置评。这个沉默本身,其实已经说明了一些问题。

    谷歌自己说漏过嘴

    把几件事放在一起看,答案其实相当明显。

    2024年4月,YouTube CEO尼尔·莫汉(Neal Mohan)在接受彭博社采访时提到,YouTube视频的”一部分”可能会被内部用于训练Gemini等模型。同年晚些时候,一篇关于创作者工具的官方博客也确认了这一点,称”我们使用上传到YouTube的内容,来改善YouTube和谷歌平台上的创作者和观众的产品体验,包括通过机器学习和AI应用的方式。”

    谷歌甚至向CNBC确认,它正在使用YouTube上传内容训练Gemini和Veo。只是从头到尾,它从来没有明确确认过:这些内容是否也被用来训练Lyria。

    所以在驳回诉讼的动议里,谷歌其实把底牌亮出来了:原告直接将内容上传到YouTube时,已同意YouTube的服务条款,该条款授予谷歌”复制、分发、制作衍生作品”等基于上传内容的广泛权利。

    为什么不干脆承认

    原因并不难理解。目前谷歌公开承认这件事并没有什么好处,而且在诉讼仍在进行的情况下,保持”合理推诿”是它经过计算的策略。

    但这件事触及的问题比一场诉讼更大。AI音乐生成模型需要大量音乐内容作为训练数据,而全球最大的音乐视频平台就是YouTube。如果谷歌在用YouTube上的音乐内容训练Lyria,它面对的就不只是这一场集体诉讼,而是整个音乐创作者群体对AI训练数据合法性的质疑。

    华纳音乐今年收购AI溯源公司Sureel AI,走的正是另一条路:用技术追踪AI训练中的版权使用,而不是等到被告上法庭才回应。谷歌选择的是更硬的抗辩姿态,这场官司怎么判,可能会影响整个AI音乐行业的游戏规则。


  • 在线购房平台Opendoor撤出印度,AI真的在吃掉外包饭碗吗

    Opendoor撤出印度
    Opendoor在印度业务仅运营不到两年便宣布撤出 | 图片来源:TechCrunch

    在线购房平台Opendoor撤出印度,AI真的在吃掉外包饭碗吗

    在线购房平台Opendoor本周宣布关停印度业务,距离它在钦奈和班加罗尔开设办公室还不到两年。CEO Kaz Nejatian给出的说法是:要把运营工作迁回客户所在的美国,同时转向规模更小、以AI为核心的团队。

    这则公告在硅谷引发了一轮不小的讨论。创始人、投资者和外包专家都在问同一个问题:AI是不是已经开始改变离岸工作的经济逻辑了?

    印度早已不是只做外包后台工作的地方。它是全球最大的全球能力中心(GCC)市场——跨国企业设立的专属离岸单元,负责处理从IT、财务到研发的所有业务。印度目前有超过2100个这类中心,雇佣约236万人,年营收接近1000亿美元。

    Opendoor在2024年进军印度时,在钦奈和班加罗尔组建了近250人的团队,主要处理分散在各系统中的手动工作流。但过去几年,整个公司一直在收缩。证券文件显示,去年年底Opendoor全球员工总数为1042人,而前一年是1470人;非美国员工数量也从342人缩减到184人。

    大规模裁员让人很难单纯从”AI替代外包”这个角度来理解印度业务的关停。在美国房地产市场低迷、在线购房业务整体承压的背景下,Opendoor一直在全业务线削减成本。但Nejatian解释这一举措时的表述,还是让投资者和外包分析师感到共鸣——他们认为AI正在重塑企业组织运营工作的方式。

    投资者怎么看

    部分投资者把Opendoor的决定当作AI对印度庞大外包劳动力影响的信号。Better Tomorrow Ventures联合创始人Sheel Mohnot直接写道:”随着手动工作被AI取代,印度的很多工作岗位都会消失。”

    另一些人看到的则是企业组织方式更大范围的转变。Emergent Ventures风险投资家Keshav Lohia称这是”AI驱动运营的转折点”,认为AI的进步正在开始挑战让印度成为热门离岸目的地的成本套利模式。

    HFS Research首席执行官Phil Fersht对TechCrunch表示,这一进展不应只被看作工作岗位从印度转移到美国,更重要的转变是:AI正在减少企业原本需要的运营人力规模,让企业无论位于何处都能以更精简的组织运营。

    “这不是一次孤立的重组。这是随着企业围绕AI、自动化和更精简的工作流重新设计运营,我们开始看到的更广泛模式的一部分。”

    “服务即软件”时代来了?

    Fersht认为,赢家将是那些把AI、软件和人类专业知识结合起来、在不持续增加人员规模的情况下交付成果的企业。他把这种模式描述为”服务即软件”(service-as-software)。

    他说,虽然Opendoor可能是第一个备受瞩目的案例,但不太可能是最后一个。

    部分投资者的思考已经延伸到单个企业之外。Speedinvest风险投资家Varun Rekhi认为,如果AI降低对劳动密集型服务的需求,最终可能会给印度最重要的出口产业之一带来压力——该产业的核心就是向全球企业供应人才和专业知识。

    目前的Opendoor案例仍然复杂。该公司多年来一直在大幅削减人员规模,其退出印度业务的原因,既关乎自身的困境,也关乎AI和离岸工作的未来。但可以肯定的是,类似的讨论只会越来越多。