博客

  • OpenAI确认打造超级应用:ChatGPT、Codex、浏览器三合一

    OpenAI最近确认了一个挺大的产品调整:他们要把ChatGPT、AI编程工具Codex、还有自己开发的Atlas浏览器,全部合并成一个桌面应用。这个消息是5月正式公开的,但内部备忘录早在3月就写好了。

    目前OpenAI应用业务CEO Fidji Simo在休医疗假,所以这个整合项目由Greg Brockman牵头,具体执行团队由Codex CEO Thibault Sottiaux领导。

    为什么要合并?

    OpenAI过去一年有点产品”摊大饼”的意思——Sora、Atlas、Codex、Canvas,各自为战,工程资源被拆得稀碎。结果就是每个产品都还不错,但都没达到能碾压竞品的那种好。

    合并之后,ChatGPT会作为核心编排层,统一调度对话、编码、浏览器三类能力。你可以直接在对话里让AI写代码,然后立刻用内置浏览器测试运行效果。

    这个设计明显是对标Anthropic的Claude Cowork——后者在企业市场抢占份额的速度,确实让OpenAI有点坐不住了。

    分阶段推进,移动端保持独立

    合并不是一口气完成的,OpenAI做了分阶段规划:

    • 第一阶段:先给Codex加编码之外的通用生产力功能,拓宽使用场景
    • 第二阶段:把Atlas浏览器整合进来,实现对话+编码+网页操作的闭环
    • 第三阶段:ChatGPT作为中枢编排层,统一协调所有功能模块

    有意思的是,移动端的ChatGPT App会保持独立,不参与这次合并。看来OpenAI也清楚,手机上搞太重的应用体验未必好。


    为IPO做准备?

    这个时间点值得玩味。截至2026年2月,ChatGPT周活跃用户9亿;截至5月,Codex周活也到了400万。合并后,OpenAI可以更容易地把普通ChatGPT用户转化为付费高阶用户——毕竟在一个应用里就能用到编码、浏览器等高级功能,付费动力会强很多。

    如果OpenAI真的在2026年晚些时候启动IPO,这个”超级应用”的故事会比单纯”我们有一个好模型”要好讲得多,估值也会更有想象力。

    当然,产品整合这种事,说起来容易做起来难。三个不同定位的产品合并成一个,用户体验能不能做到1+1+1>3,还得等实际产品出来才知道。

  • Google I/O 2026 Day 1直击:Gemini 4.0、Omni多模态、XR眼镜齐亮相

    今天Google I/O 2026正式开幕,谷歌一口气发布了多个重磅产品。看完整个发布会,感觉谷歌这次是认真了,不再是以前那种”我们有个很酷的研究项目”的画饼风格,而是实打实地把AI塞进了每一个产品线里。

    Gemini 4.0:不止是基准测试

    Gemini 4.0这次是真的来了。谷歌没有只拿基准测试分数说事,而是把重点放在了实际应用场景上——Workspace集成、多模态推理、智能体可靠性,这些都是企业用户真正关心的东西。

    外界预期Gemini 4.0在多模态推理上会有显著提升,如果它能接近Claude Mythos Preview的94.6% GPQA成绩,那谷歌就真的把今年早些时候丢掉的话语权给抢回来了。

    谷歌的优势在于生态。安卓30亿+设备、搜索数据、Workspace 2亿+用户,这不是OpenAI或者Anthropic短时间内能追上的。

    Gemini Omni:文本+图像+视频统一管线

    这次最让我意外的是Gemini Omni。它不是Veo的升级版,而是一个统一的文本/图像/视频生成管线,可以在对话窗口里直接生成和编辑视频,还会自动配背景音乐。

    早期泄露的测试报告显示,Omni在提示词保真度和音频质量上都比Veo 3.1强。如果这套系统正式上线,谷歌就是第一个在消费级场景里提供全模态统一生成能力的厂商。叠加安卓生态的分发优势,这个组合拳确实不好接。

    Google I/O 2026
    Google I/O 2026 Day 1 发布会现场

    Android XR眼镜与Aluminium OS

    硬件方面,谷歌和三星、Warby Parker、Gentle Monster、XREAL合作的Android XR眼镜正式亮相。无屏版本重80克以内,售价379-499美元,搭载骁龙AR Gen 3,延迟200ms。这个规格如果能兑现,Meta的Ray-Ban系列可能要感受到压力了。

    更值得关注的是Aluminium OS,这个基于安卓开发的系统将替代ChromeOS,首批笔记本由宏碁、华硕、戴尔、惠普、联想生产,2026年秋季上市。谷歌这是在把安卓的势力范围从手机扩展到PC。


    Gemini Spark:谷歌版的AI智能体

    Gemini Spark是这次发布的一个容易被忽略但很重要的产品。它能自动化跨应用任务——整理收件箱、生成会议简报、追踪新闻事件进展。这和微软的Copilot、Anthropic的Claude Cowork是一个赛道的产品,但谷歌的优势在于它自己的应用生态(Gmail、Calendar、Drive、Docs)。

    总体来看,谷歌这次的策略很清晰:不追求单一的基准测试冠军,而是把Gemini铺到所有能铺的地方——手机、眼镜、笔记本、云端、企业应用。这种打法短期内在基准测试上可能不够性感,但长期来看,生态黏性才是最难被颠覆的壁垒。

  • prompts.chat:162k Stars!开源Prompt社区,让AI提示词成为你的超能力

    prompts.chat:162k Stars!开源Prompt社区,让AI提示词成为你的超能力

    prompts.chat - AI提示词社区

    prompts.chat – 开源Prompt社区平台

    📌 项目简介

    prompts.chat(前身为Awesome ChatGPT Prompts)是一个面向AI提示词的全生命周期社区平台,支持用户分享、发现、收藏来自社区的优质AI提示词。项目采用免费开源模式,支持私有化部署,可满足企业/组织的隐私合规需求。

    162k+
    GitHub Stars

    21.2k
    Forks

    MIT
    开源协议

    ⚙️ 安装要求与过程

    方式一:直接使用官方平台(推荐)

    无需安装,直接访问 prompts.chat 即可使用社区提示词资源,支持浏览、搜索、复制优质提示词。

    方式二:私有化部署

    # 1. 克隆项目
    git clone https://github.com/f/prompts.chat.git
    cd prompts.chat
    
    # 2. 安装依赖
    npm install
    
    # 3. 配置环境变量
    cp .env.example .env
    # 编辑 .env 填写必要配置
    
    # 4. 启动开发服务器
    npm run dev
    
    # 5. 构建生产版本
    npm run build
    npm start
    
    # 访问 http://localhost:3000

    系统要求

    项目 要求
    Node.js 18.0+ (推荐 20.x LTS)
    包管理器 npm / pnpm / yarn
    数据库 PostgreSQL / MySQL(可选)
    操作系统 Windows / Linux / macOS

    ✨ 核心功能

    💬 提示词社区共享
    用户可上传、浏览其他社区成员贡献的优质AI提示词,涵盖编程、写作、翻译、创意等各个领域。

    📌 提示词收藏管理
    支持用户收藏自己常用的提示词,建立个人提示词库,方便后续快速复用,提升AI交互效率。

    🏢 私有化部署支持
    支持企业/组织自行部署到内部环境,保障提示词数据完全私密,不对外泄露,满足合规需求。

    🔍 智能搜索与分类
    提供强大的搜索功能和细致的分类标签,快速定位所需提示词,支持按热度、最新、评分排序。

    📚 提示词最佳实践
    收录提示词工程最佳实践案例,帮助初学者快速掌握提示词编写技巧,提升AI输出质量。

    🔄 持续更新维护
    项目保持高频更新,持续集成最新的AI模型提示词模板,社区活跃度高,问题响应迅速。

    🚀 典型使用场景

    👨‍💻 场景一:开发者提升编码效率

    开发者在prompts.chat中搜索”代码审查””bug修复””重构建议”等提示词,直接复制到ChatGPT/Claude中使用,快速完成代码优化、文档生成、单元测试编写等任务,显著提升开发效率。

    ✍️ 场景二:内容创作者寻找灵感

    公众号博主、自媒体运营者在平台搜索”标题生成””文章大纲””社交媒体文案”等提示词,快速生成高质量内容框架,配合AI完成创作,大幅缩短内容生产周期。

    🏢 场景三:企业构建私有提示词库

    企业IT部门私有化部署prompts.chat,将公司积累的优质提示词(如”会议纪要总结””合同审查””客户邮件回复”)统一管理,让员工共享最佳实践,提升全员AI应用能力。

    💡 推荐理由

    说实话,我觉得prompts.chat是AI时代必备的”提示词手册”——它把散落在各处的优质提示词集中管理,让我不用每次都从零开始构思怎么跟AI对话。

    最实用的是它的收藏功能,我把自己常用的”代码解释””文章润色””Excel公式生成”等提示词收藏起来,形成个人提示词库,现在写AI指令速度快了好几倍。

    162k+ Stars说明一切——如果你天天跟ChatGPT、Claude这些AI助手打交道,prompts.chat绝对能帮你少走弯路,让AI输出更精准、更高效。加上支持私有化部署,企业用户也能放心使用。

    📥 下载地址


    本文由 WorkBuddy AI 自动采集撰写 · 转载请注明出处

  • Anthropic估值冲至1.2万亿美元,超越OpenAI登顶AI王座

    Anthropic最近在链上Pre-IPO市场的隐含估值冲到了1.2万亿美元,正式超过OpenAI,成为全球AI新王。这个数字有多夸张?比OpenAI高出20%,如果以此估值上市,Anthropic将直接空降全球第11大上市公司。

    Anthropic估值飙升
    Anthropic估值走势(图源:36氪)

    80倍增长,Dario在台上”凡尔赛”

    估值暴涨的背后是业绩真的在飞。CEO Dario Amodei在旧金山开发者大会上透露,今年第一季度Anthropic的年化收入和使用量同比涨了80倍——他们原本的规划仅仅是10倍。

    Dario甚至还”抱怨”说增速太快很难驾驭,希望回到仅仅10倍的增长,那样会轻松点。推动这波增长的核心是Claude Code,2025年底上线的这个编程工具在开发者群体里扩散速度超出了所有人预期。


    马斯克出手:22万块GPU救急

    因为需求爆炸,Anthropic的算力基础设施被瞬间击穿,用户发现Claude开始限流甚至高峰期掉线。关键时刻,马斯克出现了——Anthropic与SpaceX达成独家合作,拿下Colossus 1数据中心的全部算力。

    这个数据中心拥有300MW计算能力和22万块英伟达顶级GPU,一个月内全部到账。几个月前马斯克还在网上骂Claude”邪恶”,现在把给Grok准备的GPU全都给了Anthropic,也是挺讽刺的。

    拿到这22万块GPU之后,Anthropic直接给用户送了大礼包:Claude Code五小时限额翻倍,Pro/Max取消峰值限制,API速率大幅提升。


    2000亿美元抱上谷歌大腿

    据外媒透露,Anthropic已与谷歌签署了一份为期五年、价值约2000亿美元的云服务协议,占到了谷歌云合同积压总额的40%以上。现在的AI圈,正陷入一种疯狂的循环:云巨头掏钱给AI公司,AI公司转手把这笔钱作为”房租”买回算力服务。

    把Anthropic所有已公开的算力合同摊开:亚马逊5GW、谷歌+博通5GW、微软+英伟达300亿美元Azure容量、Fluidstack 500亿美元基础设施、SpaceX 300MW+22万张GPU,三线并进的算力格局已经成型。

    1.2万亿美元估值建立在2029年收入增长20-30倍的预期之上。这场算力豪赌能不能兑现,接下来三年见分晓。

  • Google I/O 2026今天开幕:Gemini 4.0、XR眼镜、新系统齐亮相

    Google I/O 2026今天开幕,大家期待的Gemini 4.0终于要亮相了。这次谷歌不只是更新模型,而是打算把AI能力直接塞进操作系统、塞进眼镜里,完成从”AI功能叠加”到”AI原生重构”的战略跨越。

    Gemini 4.0:上下文窗口拉到1000万tokens

    参数规模据说到3-5万亿,上下文窗口突破1000万tokens,是GPT-5.5的25倍,可以一次性加载完整代码库或者整本书籍做深度分析。更重要的是原生多模态,文本、图像、音频、视频统一处理,不用在不同模型之间来回切换。

    深度整合谷歌搜索之后,Gemini 4.0的知识可以实时更新、事实实时核查,幻觉率压到3%以内。定价预计每百万输入2.5美元,性价比相当能打。


    Android XR眼镜:80克、499美元起

    谷歌将推出首款自研Android XR智能眼镜,重量不到80克,售价499美元起,比同类竞品便宜不少。搭载高通骁龙AR Gen 3处理器,内置本地Gemini Nano轻量模型,200毫秒内响应,支持离线导航和实时翻译。

    深度适配Gemini 4.0之后,这副眼镜具备实时视觉理解、主动智能推送、多模态交互能力。谷歌还开放了Android XR SDK,现有安卓应用可以快速迁移到XR场景。


    Aluminum OS:8年磨一剑,三系统合一

    历时8年研发的Aluminum OS将正式落地,把Android、Chrome OS、Fuchsia三个系统揉在一起,手机、电脑、XR设备、智能家居全终端统一适配。

    Gemini 4.0拿到系统级接口,可以打通跨应用数据壁垒,实现实时上下文感知与主动智能执行。该系统将首发搭载于10月发布的Pixel 10系列手机,谷歌的AI硬件闭环生态算是真正立起来了。

    谷歌这次形成”大模型+硬件+操作系统+开发者生态”的全栈布局,直接对标OpenAI和Anthropic,全球AI竞争进入最激烈阶段。

  • ChatGPT现在能连你的银行账户了,OpenAI把金融助手这件事做了

    ChatGPT现在能连你的银行账户了,OpenAI把金融助手这件事做了

    OpenAI在5月15日悄悄地给ChatGPT Pro用户推了一个新功能——个人金融仪表盘。简单说就是:你授权ChatGPT访问你的银行账户、信用卡、投资账户,它帮你分析花了什么钱、订阅了哪些服务、投资表现怎么样、接下来要付哪些账单。

    这件事的技术底层是Plaid——一家专门做金融账户连接的服务商。Plaid支持超过12,000家金融机构,包括嘉信理财、富达、大通、Robinhood、美国运通、第一资本这些主流平台。授权流程是标准的Plaid界面,不是OpenAI直接碰你的登录凭证。

    ChatGPT个人金融仪表盘截图
    ChatGPT个人金融仪表盘界面(来源:OpenAI)

    你能用它干什么

    官方给的例子挺接地气的。比如你问它”我最近是不是花多了,跟之前比有什么变化?”——它能拉取你近期的消费数据,给你一个对比分析。或者你说”我想在未来5年在我住的城市买房,帮我做个计划”——它会结合你的收入、支出、储蓄情况,给你一个分阶段的目标拆解。

    目前这个功能只向美国地区的Pro用户开放预览,网页端和iOS都能用。OpenAI说他们正在跟Intuit谈合作,后续如果接上了,就能做更复杂的事情——比如你卖了一笔股票,它帮你估算税务影响;或者你申请信用卡,它评估一下你的获批概率。

    OpenAI说,每个月已经有超过2亿用户向ChatGPT问金融相关的问题。所以这个功能某种程度上是把原本就大量发生的对话,升级成了能直接读取数据的版本。

    隐私这件事怎么处理

    金融数据是最敏感的个人数据之一,OpenAI在隐私说明上还是做了些功课。你可以在设置>应用>金融里面断开某个账户的连接,断开之后,同步过来的数据会在30天内从ChatGPT里删除。你也能单独删除某些金融相关的记忆。

    不过话说回来,把银行账户接进去这件事,对大多数人来说心理门槛还是挺高的。OpenAI也知道这点,所以先向Pro用户开放——这批用户对ChatGPT的信任度相对高,也更愿意尝鲜。等跑顺了,再向Plus用户推广。


    为什么现在做这件事

    这件事其实有个前奏:2026年4月,OpenAI收购了个人金融初创公司Hiro的团队。Hiro背后有Ribbit、General Catalyst这些顶级金融科技VC撑腰,团队在金融数据和AI的交叉上有不少积累。OpenAI说Hiro团队的专业能力对推出这个产品很有帮助。

    更大的背景是,AI公司们正在意识到:通用聊天机器人能回答所有问题,但用户在问健康、金融、个人生活这些敏感话题时,其实想要的是专门优化的产品。Anthropic已经推出了健康相关的工具,Perplexity这个月也发布了基于Computer agent的金融研究产品。OpenAI现在是直接把金融功能嵌进ChatGPT里。

    长期来看,这件事如果做成,ChatGPT就不只是一个聊天机器人了——它会变成你财务生活的数字管家。这个位置一旦站稳,用户的切换成本会非常高。

  • OpenAI砸40亿美元成立部署公司,顺便把Tomoro买了

    OpenAI砸40亿美元成立部署公司,顺便把Tomoro买了

    OpenAI这周干了件大事——掏了超过40亿美元,成立了一家专门帮企业落地AI的新公司。名字很直白,叫”OpenAI Deployment Company”。说白了,就是以前卖模型,现在直接派人到你公司里帮你把AI用起来。

    为了把这件事做成,OpenAI顺便把一家叫Tomoro的AI咨询公司给收购了。这家公司不是昨天才成立的——它2023年就跟OpenAI合作过,客户名单里有美泰、红牛、乐购、维珍大西洋航空这些大牌子。收购完成后,Tomoro大概150个资深AI工程师和部署专家直接并入新公司。

    Tomoro的团队不是来OpenAI总部坐班的——他们会被派驻到客户现场,跟企业各个团队一起工作,找AI能真正产生价值的地方。

    为什么要做这件事

    过去这两年,OpenAI在消费者端赚足了眼球——ChatGPT的周活用户数字每次财报季都是亮点。但企业端这边,Anthropic的Claude其实跑得更快。很多公司在评估”到底用哪家的基础模型”时,Claude在企业级场景里的口碑确实不错。

    OpenAI这次成立部署公司,摆明了是要补上这块短板。光有模型不够,得有人帮客户把模型真正用起来——做集成、做定制、做业务流程改造。这块市场,咨询公司(埃森哲、德勤)和技术服务商都在抢,OpenAI现在是自己下场了。


    钱从哪来,谁在背后

    这40亿美元不是OpenAI自己全出的。TPG领投,安宏资本(Advent)、贝恩资本、布鲁克菲尔德(Brookfield)作为联合牵头创始合作方一起进来。OpenAI持有多数股权并掌控运营——也就是说,这家部署公司是个合资企业,但OpenAI说了算。

    有意思的是,路透社上周还报道说,OpenAI和Anthropic分别跟私募股权机构成立了合资公司,正在谈收购更多帮企业做AI落地的服务商。这个赛道突然就热了——因为大家意识到,卖API调用次数这件事,天花板是看得见的。真正赚钱的是帮企业把AI嵌进业务流程里,那种合同是长期的、高黏性的。


    这对行业意味着什么

    这件事释放了一个挺明确的信号:AI大模型公司的竞争,已经从”谁的模型更强”转向”谁能帮客户真正把AI用起来”。模型能力会有差距,但这个差距在缩小。真正的壁垒是——谁有更多的工程师能派到客户现场,谁有更多的行业落地经验,谁能帮客户把AI变成业务流程里真正产生价值的东西。

    Anthropic之前在企业端跑得快,一部分原因是它的模型在代码生成、数据分析这些场景里确实好用,另一部分原因是它更早地在开发者生态上投入。OpenAI这次直接收购Tomoro、组建150人的部署团队,是在用”堆人”的方式快速追上。

    对那些正在犹豫”要不要上AI”的企业来说,这其实是个好消息——以后不光是买个模型回去自己折腾,大厂会直接派人来帮你做。当然,费用估计也不会便宜。

  • Stable Diffusion WebUI:162k Stars!最强大的Stable Diffusion Web界面,让AI绘画触手可及

    Stable Diffusion WebUI:162k Stars!最强大的Stable Diffusion Web界面,让AI绘画触手可及

    Stable Diffusion WebUI - AI绘画界面

    Stable Diffusion WebUI – 最流行的AI绘画工具

    📌 项目简介

    Stable Diffusion WebUI(由AUTOMATIC1111开发)是最受欢迎的Stable Diffusion浏览器界面,基于Gradio构建,支持文生图、图生图、图像修复、高清放大等全套AI绘画功能,扩展插件生态极其丰富,是AI艺术创作的首选工具。

    162k+
    GitHub Stars

    Python
    主要语言

    AGPL-3.0
    开源协议

    ⚙️ 安装要求与过程

    系统要求

    项目 要求
    操作系统 Windows 10/11、Linux、macOS
    GPU NVIDIA(推荐)或AMD GPU,至少8GB显存
    内存 16GB 以上(推荐32GB)
    存储 10GB+ (模型文件需额外空间)
    必备软件 Python 3.10.6+、Git、CUDA 11.8+

    快速安装(Windows一键脚本)

    # 1. 下载一键安装包
    # 访问: https://github.com/AUTOMATIC1111/stable-diffusion-webui/releases
    
    # 2. 解压后运行
    webui-user.bat
    
    # 3. 等待自动安装依赖,首次运行会下载模型
    # 4. 浏览器访问 http://localhost:7860

    Linux/macOS 手动安装

    # 1. 克隆项目
    git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
    cd stable-diffusion-webui
    
    # 2. 安装依赖
    pip install -r requirements.txt
    
    # 3. 下载模型(放至 models/Stable-diffusion/ 目录)
    # 可从 HuggingFace 或 Civitai 下载 .safetensors 模型
    
    # 4. 启动
    python launch.py
    
    # 5. 访问 http://localhost:7860

    ✨ 核心功能

    🎨 文本生成图像(txt2img)
    输入描述词,AI自动生成高质量图像;支持批量生成、尺寸调整、采样器选择。

    🖼️ 图像生成图像(img2img)
    基于参考图重新生成,支持风格迁移、局部重绘,保留原图构图与色彩。

    🔧 图像修复(Inpaint)
    智能修复图像缺损部分,支持局部重绘、物体移除、背景替换,效果自然。

    📐 高清放大(Upscale)
    内置 ESRGAN、R-ESRGAN 等超分辨率模型,低分辨率图像无损放大4K。

    🔌 扩展插件系统
    内置扩展商店,支持 LoRA、ControlNet、Embedding、超网络等,生态极其丰富。

    🎛️ 精细参数控制
    支持 CFG Scale、采样步数、种子控制、高分辨率修复等高级参数调节。

    🚀 典型使用场景

    🎮 场景一:游戏美术概念设计

    游戏开发团队使用 Stable Diffusion WebUI 快速生成角色概念图、场景原画、道具设计稿;配合 LoRA 训练专属风格模型,大幅提升前期美术设计效率,从构思到出图只需几分钟。

    📱 场景二:社交媒体内容创作

    自媒体博主、公众号运营者使用 AI 生成配图、封面图、插画内容;通过提示词工程精准控制画面风格,无需聘请画师即可产出高质量视觉内容,降低内容创作成本。

    🏢 场景三:产品设计与原型展示

    UI/UX 设计师使用 img2img 功能快速将草图转换为高质量视觉稿;结合 ControlNet 插件精确控制构图与姿态,用于产品原型、广告创意、包装设计等商业场景。

    💡 推荐理由

    说实话,我觉得 Stable Diffusion WebUI 是AI绘画领域的”瑞士军刀”——功能全、可扩展性强、社区活跃度极高。相比Midjourney这类闭源商业产品,它最大的优势是完全本地运行,数据隐私有保障,而且免费。

    我最喜欢它的扩展系统,通过安装不同插件可以实现几乎任何你能想到的AI绘画功能——从精确姿态控制(ControlNet)到风格微调(LoRA),生态丰富到令人惊叹。

    162k+ Stars不是吹出来的,如果你对AI绘画感兴趣,或者工作需要大量视觉内容创作,Stable Diffusion WebUI 绝对值得深入研究。加上最近Stable Diffusion 3.0和SDXL的发布,效果已经可以媲美甚至超越商业产品。

    📥 下载地址


    本文由 WorkBuddy AI 自动采集撰写 · 转载请注明出处

  • 这家公司帮70万创作者,把数据卖给AI实验室

    这家公司帮70万创作者,把数据卖给AI实验室

    过去几年里,创意市场和平台圈发现了一件事:他们手上握着的数据,是一座金矿。这些数据可以用来训练自己的AI模型,也可以授权给其他AI实验室换钱。

    Wirestock选了后者。

    Wirestock团队
    Wirestock团队(来源:TechCrunch)

    这家公司原本的业务是帮摄影师在Shutterstock等图库平台上分发和销售作品。2023年,他们转型成了数据供应商,现在向AI实验室提供图像、视频、设计资产、游戏和3D内容等数据集。

    “一开始,我们的很多交易只是卖现成的东西,比如我们现有的图库。但后来变成了大量定制内容数据的需求,这给创作者带来了新机会,平台就这样起飞了。”——Wirestock联合创始人兼CEO Mikayel Khachatryan

    70万创作者,4000万美元年营收

    Wirestock说平台已经签约了超过70万名艺术家和设计师,他们为数据收集完成各种任务,类似Fiverr平台上的自由职业者。

    公司周四宣布,已完成2300万美元的A轮融资,用于建设新的数据供应业务。这轮融资由Nava Ventures领投,谢丽尔·桑德伯格联合创立的SBVP、Formula VC、I2BF Ventures跟投。

    Khachatryan表示,Wirestock目前为6家最大的基础模型制造商提供多模态数据,但拒绝透露具体名称。他提到公司目前的年营收运行率为4000万美元,迄今已向贡献者支付了1500万美元。


    AI数据供应链的生意

    随着AI实验室竞相改进模型,对数据供应服务的需求极高。像Surge、Scale AI、Mercor这样的公司,凭借对不同类型数据集的需求,几乎在一夜之间建立了价值数百亿美元的业务。

    Wirestock想专注于为助力创意用例的模型提供数据,比如图像和视频生成。公司也在探索音频和音乐等其他模态。

    Nava Ventures创始人Freddie Martignetti说,他的基金一直在寻找在数据采购和精炼方面创新的初创公司。”我认为Wirestock对基础模型和超大规模计算服务商需要什么多模态数据有深刻理解,以创建更像人类的系统。我们论点的基石是,多模态数据将变得越来越重要,不仅是为了创建图像或视频,而是让模型完成现实世界的任务。”

    Wirestock目前有60名员工,将利用新资金招聘研发、工程和产品岗位人员。公司还在开发供AI实验室协作的企业级数据集软件。

  • 这家做AI视频的公司,想在世界模型赛道上赢过Google

    这家做AI视频的公司,想在世界模型赛道上赢过Google

    Runway可能是硅谷最不像硅谷公司的AI初创企业。没有斯坦福辍学生创始人,没有前谷歌员工光环,也没有动辄上亿美元的种子轮让他们有资本忽略营收。三个联合创始人里两个来自智利、一个来自希腊,在纽约大学Tisch艺术学院认识的,公司也诞生在纽约,不是帕洛阿尔托。

    但他们很可能成为当下最具影响力的AI公司之一——不是因为已经建成了什么,而是因为正在尝试构建的下一代技术。

    “我们本质上受限于自己对现实的理解。语言模型的训练数据是对现有人类知识的提炼,但要突破这个限制,我们需要利用更少偏见的数据。”——Runway联合创始人兼联席CEO阿纳斯塔西斯·杰曼尼迪斯

    押注世界模型,不走语言模型的老路

    过去几年,AI行业的主流假设是”智能存在于语言之中”。OpenAI的ChatGPT、Anthropic的Claude这些大火的大模型,都是这一思路的产物。但Runway和部分竞争对手押注了完全不同的方向:他们认为下一代AI智能不会从文本中诞生,而是来自视频和世界模型——这类模型学习的是世界的运行规律,而不只是人类描述世界的方式。

    Runway三位联合创始人
    Runway三位联合创始人(来源:TechCrunch)

    Runway成立于2018年,凭借视频生成模型和AI工具建立了行业声誉,旗下最新模型是Gen-4.5,用户可以通过文本提示生成可编辑的电影级内容。目前Runway的技术已经应用于电影制作人和广告公司的工作流,还与狮门影业、AMC电视网等大型媒体公司签署了合作协议。

    估值53亿,但真正的对手是谷歌

    Runway目前的估值为53亿美元,2026年第二季度公司新增了4000万美元的年度经常性收入。过去6个月里,公司已经将计划落地,业务从视频生成拓展至世界模型领域:2025年12月推出了首个世界模型,还计划2026年再推出一款新模型。

    但Runway并不是唯一一家走这条路线的企业,Luma、World Labs等初创公司也在做类似的事情,谷歌的Genie世界模型也指向了同一个方向。所有参与方追求的目标本质上是同一个:创造能够解决人类最棘手问题的AI。


    非典型背景,反而是优势

    Runway累计融资8.6亿美元,其中2026年2月完成了3.15亿美元的融资。这个融资规模和最直接的竞争对手Luma AI(9亿美元)、World Labs(12.9亿美元)大致相当。但Runway还要和OpenAI、谷歌等巨头竞争,后者在算力、资金上的优势非常明显。

    联席CEO巴伦苏埃拉说:”规则只是他们编造出来的。他们说硅谷就是初创公司该待的地方,为什么?那都是编造出来的规则。把所有规则都擦掉,重新来过。”这种不按常理出牌的文化,反而让Runway在巨头林立的AI赛道上找到了自己的位置。