博客

  • Karpathy投奔Anthropic,OpenAI重组冲刺IPO:这一周AI圈发生了什么

    这一周 AI 圈的热闹程度,差不多赶得上去年的同一时期。Andrej Karpathy 宣布加入 Anthropic,OpenAI 这边紧锣密鼓地推进 IPO,另一边 DeepSeek 直接把 API 价格砍到原来的四分之一。三件事摆在一起看,你会发现 AI 行业的竞争节奏已经完全变了。

    Karpathy 的”二次出走”

    5月19日,Karpathy 在社交媒体上发了短短一行字:”Personal update: I’ve joined Anthropic.” 这位 OpenAI 的联合创始人、前特斯拉 AI 总监,正式入职 Anthropic 的预训练团队,直接向团队负责人 Nick Joseph 汇报。

    说”二次出走”是因为 Karpathy 的职业生涯一直在几个顶级 AI 实验室之间游走。他最早是 OpenAI 的创始成员之一,后来去了特斯拉带队 Autopilot,离开特斯拉后又回到了 OpenAI。现在他选择 Anthropic,而不是回 OpenAI,这个信号值得玩味。

    Andrej Karpathy 是以个人贡献者身份加入的,不是来当管理者的。他要组建一个”用 Claude 本身来加速预训练研究”的小组——意思是让 AI 帮忙做 AI 研究,这个思路很 Anthropic。

    Anthropic 这段时间一直在疯狂招人,Workday 的 CTO、Instagram 的 CTO、Box 的 CTO 都以个人身份加入了。但 Karpathy 无疑是其中名头最响的一个。他加入的预训练团队,恰恰是大模型”底座”最核心的地方。

    OpenAI 的 IPO 冲刺与内部大重组

    就在 Karpathy 官宣的同一周,OpenAI 内部发生了一次大规模重组。联合创始人兼总裁 Greg Brockman 正式接管全部产品战略,取代因病休假的 AGI 部署负责人 Fidji Simo。Brockman 在全员备忘录里说得很直白:要建设”一个统一的 Agent 平台”。

    视频生成产品 Sora 同日关停,理由是算力消耗与营收严重不匹配。产品负责人 Kevin Weil 和技术负责人 Bill Peebles 随之离开。这些人事变动的背后,是 OpenAI 正在为 IPO 做最后准备。

    据报道,OpenAI 最快于5月22日向 SEC 提交了机密招股书,高盛和摩根士丹利担任主承销商,上市窗口瞄准今年秋季,估值预期超过1万亿美元。如果成功,这将是 AI 时代最具标志性的上市事件。

    OpenAI重组与IPO规划
    OpenAI 产品线重组示意图(来源:新浪财经)

    但财务数据也同步披露了出来:Q1 营收57亿美元,调整后经营利润率为负122%。也就是说每赚1美元要亏1.22美元。用户增长也在放缓,ChatGPT 周活9.05亿,低于2月峰值9.2亿。IPO 之前,OpenAI 需要给资本市场讲一个更动人的盈利故事。

    好消息是,马斯克对 OpenAI 的诉讼在同一周被加州联邦陪审团驳回,理由是全部索赔已过诉讼时效。IPO 路上一块巨大的法律绊脚石,就这样消失了。

    DeepSeek 的”永久降价”到底意味着什么

    5月22日,DeepSeek 官方宣布:V4-Pro 模型的2.5折优惠在5月31日到期后,将直接锁定为原价的四分之一,不再恢复原价。调整后输入价0.435美元/百万 token,输出0.87美元/百万 token。

    这个定价是什么概念?比 GPT-5.5 便宜约98%。而且 DeepSeek V4-Pro 总参数1.6万亿,每次推理激活490亿参数,是目前参数量最大的开放权重模型。用华为昇腾芯片跑推理,成本结构和英伟达路线完全不同,这就是降价的底气。

    DeepSeek 这一招”永久降价”,本质上是用价格战倒逼整个行业重新审视推理成本。如果你用极低的价格提供顶尖水平的模型能力,竞争对手要么跟进,要么失去价格敏感的开发者和企业用户。

    同期 DeepSeek 还在内部组建了名为 Harness 的新团队,主攻代码智能体产品,直接对标 Anthropic 的 Claude Code。V4-Pro 全部运行在华为昇腾芯片上,这种”芯片+模型+应用”的全栈打法,是目前美国实验室做不到的。

    同周 DeepSeek 还回应了一个引发关注的特殊字符幻觉事件,官方表示这属于模型”幻觉”现象,不涉及数据泄露或安全问题,技术团队将针对性优化。


    三件事放在一起看

    Karpathy 加入 Anthropic,说明顶级研究者认为 Anthropic 的技术路线更有前途。OpenAI 推进 IPO,说明资本市场对 AI 的期待已经到了必须兑现的时刻。DeepSeek 永久降价,说明中国 AI 实验室正在用成本优势重构全球竞争格局。

    这一周的事件,其实是同一个大趋势的不同切面:AI 竞争已经从”谁的模型最强”,转向”谁能在产品、成本、人才和资本四个维度同时取胜”。目前来看,还没有任何一家实验室能在这四个维度上同时领先。

  • Ollama:172K Stars!本地运行大模型的最热门工具,让AI完全属于你自己

    Ollama:172K Stars!本地运行大模型的最热门工具,让AI完全属于你自己

    Ollama


    ## 📦 项目简介

    Ollama 让你在本地一键运行 Llama 3、Mistral、Gemma、DeepSeek 等大模型,无需任何云服务,数据完全留在你自己的机器上。


    ## 🛠️ 安装要求和过程

    Ollama 支持 macOS、Windows、Linux 三大平台,安装极其简单。

    🔧 环境要求

    • macOS 11+ / Windows 10+ / Linux(主流发行版)
    • 建议 8GB 以上内存(7B 模型最低要求)
    • 建议 50GB 以上磁盘空间(存放多个模型)

    ⚡ 快速安装(3步搞定)

    macOS:

    brew install ollama

    Linux / WSL2:

    curl -fsSL https://ollama.com/install.sh | sh

    Windows:

    ollama.com/download 下载安装包,双击安装即可。

    验证安装:

    ollama --version

    ## ⭐ 核心功能

    🚀

    一键运行大模型

    一行命令 ollama run llama3 即可启动对话,无需配置环境。

    🔌

    本地 REST API

    自带 HTTP API(默认 http://localhost:11434),轻松集成到任何应用。

    📦

    Modelfile 自定义

    类似 Dockerfile 的 Modelfile,可定制系统提示词、温度参数、模板等。

    🔄

    模型库丰富

    官方库支持 50+ 模型,包括 Llama、Mistral、Gemma、DeepSeek、Qwen 等。

    GPU 加速推理

    自动检测并利用 Metal(macOS)、CUDA(NVIDIA)、ROCm(AMD)进行硬件加速,推理速度飞快。


    ## 🎯 典型使用场景

    📚 场景一:本地知识问答

    你可以用 Ollama 在本地运行大模型,结合 RAGFlow 或 AnythingLLM,搭建完全本地的知识库问答系统。所有文档数据和对话历史都留在本地,特别适合处理敏感资料、法律文件、医疗记录等场景。

    # 拉取中文模型
    ollama pull qwen2:7b
    # 启动对话
    ollama run qwen2:7b

    💻 场景二:AI 编程助手(本地版 Copilot)

    将 Ollama 接入 Continue、Cursor 或 VS Code,打造完全本地的 AI 编程助手。代码不需要发送到任何云端,隐私零泄露,适合企业内网开发环境。

    # 拉取代码专用模型
    ollama pull codellama:7b
    # 通过 API 调用
    curl http://localhost:11434/v1/chat/completions   -H "Content-Type: application/json"   -d '{"model":"codellama:7b","messages":[...]}'

    📝 场景三:内容创作与文本处理

    Ollama 配合 Open WebUI,可以在本地搭建一个”私人 ChatGPT”,用于文案撰写、文本摘要、翻译、邮件回复等日常任务。响应速度快,支持多轮对话,且完全免费。


    ## 💡 推荐理由

    我用过不少本地大模型运行工具,Ollama 是目前最省心的一个。安装简单到不可思议 —— macOS 一个 brew 命令,Linux 一条 curl 管道,Windows 下载安装包双击,全程不超过 3 分钟。

    它最打动我的一点,是对 Apple Silicon 的优化极其出色。在 M 系列芯片的 Mac 上,Ollama 能充分利用 Metal GPU 加速,7B 模型推理速度可以达到 40+ tokens/s,日常对话毫无压力。

    另外,它的 REST API 设计得非常优雅,和 OpenAI 的 API 格式高度兼容,迁移成本几乎为零。如果你正在做 AI 应用开发,Ollama 绝对是本地调试和离线部署的首选方案。

    推荐指数:4.8/5.0
    易用性满分,模型丰富度高,API 兼容性好,隐私保护强。


    ## 📥 下载地址

    🌐

    官方网站

    下载安装包 / 文档

    访问官网 →

    🐙

    GitHub 仓库

    172K+ Stars · Go 语言

    查看源码 →

    📖

    官方文档

    API 参考 / Modelfile 指南

    阅读文档 →


    >

    本文由 WorkBuddy AI 自动采集撰写 · 开源项目第35期 · GitHub 172K+ Stars

  • Anthropic要盈利了,AI独角兽的转折点到了

    Anthropic要盈利了,这对AI圈意味着什么

    《华尔街日报》最近报出一条有意思的消息:Anthropic告诉投资人,第二季度营收将翻倍至约109亿美元,并且首次实现运营利润。如果这个预测兑现,Anthropic会成为AI独角兽里第一个真正赚到运营利润的公司。

    但这个”首次盈利”有个重要的注脚——《华尔街日报》同时指出,受大额算力成本影响,Anthropic今年未必能全年保持盈利。换句话说,这一季度的利润更像是阶段性节点,而不是全年盈利的保证。

    Anthropic办公室
    Anthropic总部(图源:Getty Images)

    为什么是现在?

    过去一年,Anthropic的Claude在专业人群里口碑一直在涨。不少开发者、分析师、企业用户都提到,Claude在长文本处理、代码理解和推理任务上表现稳定,这让它从ChatGPT的阴影里找到了自己的位置。

    “过去一年,越来越多专业人士表达了对Claude的偏好。”——这在AI圈不是客套话,而是真实发生的用户迁移。

    Anthropic最近也在主动拓宽客户群,比如推出面向小企业主的服务,以及针对律师事务所的新工具。这些动作背后的逻辑很清楚:不能只靠少数几个大客户,要把Claude嵌进更多行业的日常工作流里。

    和OpenAI的微妙 timing

    Anthropic这份财务数据流出的同一天,OpenAI即将提交IPO的消息也在流传。两家公司的节奏形成了有趣的反差:OpenAI在准备上市,Anthropic先跑出了盈利信号。

    当然,两家公司的处境不太一样。OpenAI的算力支出规模更大,商业化路径也更激进;Anthropic相对克制,融资节奏和成本管理一直偏保守。这次传出盈利消息,某种程度上也是在向市场证明:这家公司不一定非要烧钱才能做前沿AI。


    值得持续跟踪的是算力成本这条线。AI公司的盈利能力和算力价格直接挂钩,而算力市场现在正处于剧烈变动期——英伟达的新架构、各家云厂商的自研芯片、以及能源供给的瓶颈,都会直接影响Anthropic能不能把”首次盈利”变成”持续盈利”。

    第二季度财报出来之前,这一切都还是预测。但方向已经比较明显:AI大模型的竞争,正在从”谁融得多”转向”谁能先赚钱”。

  • 英伟达又破纪录了,但黄仁勋盯上了更大的蛋糕

    英伟达又破纪录了,但黄仁勋盯上了更大的蛋糕

    英伟达刚交出一份又破纪录的财报——截至4月26日的季度,营收816亿美元,环比增长20%,其中数据中心营收752亿美元,同样创下新高。季末公司还授权了800亿美元的股票回购计划,看上去一切都在按计划推进。

    但黄仁勋在财报电话会上话锋一转,抛出了一个更大的数字:英伟达发现了一个全新的2000亿美元总可寻址市场(TAM)。这个市场来自英伟达今年3月刚发布的Vera CPU——全球第一款专为代理式AI(Agentic AI)设计的中央处理器。

    黄仁勋在GTC大会
    黄仁勋在GTC大会上(图源:Getty Images)

    为什么是CPU?

    这个逻辑听起来有点反直觉——英伟达不是做GPU起家的吗?黄仁勋的解释是:AI模型的”思考”部分由GPU负责,但AI智能体(Agent)的大部分任务执行,其实跑在CPU上。随着智能体数量爆发,对CPU的需求会跟着涨。

    “全球有10亿人类用户,我的判断是未来会有数十亿个智能体。这些智能体都会使用工具,而这些工具会像个人电脑一样运行——当然不是现在,我们会在发展过程中逐步达到这个规模。”黄仁勋在电话会议上这样说。

    Vera的设计思路和传统CPU不一样。传统CPU追求”核心数”,目标是尽可能同时跑多个应用实例;而Vera专门优化了token处理速度,匹配智能体场景的需求。这款产品既可以单独销售,也可以和英伟达的下一代GPU Rubin捆绑销售。

    财报里的其他细节

    说回财报本身。英伟达预计下季度营收910亿美元,增幅约12%——比本季度的20%明显放缓,市场对此其实早有预期,AI算力建设的周期性和需求波动是真实存在的。

    中国市场的出口管制仍是悬而未决的问题。CFO科莱特·克雷斯表示,H200虽然已获得美国出口批准,但英伟达尚未从中产生任何收入,也不确定是否会被允许向中国出口。

    另一个值得注意的数据是英伟达在私营公司的持股——1月时价值220亿美元,到季度末已经涨到430亿美元,主要来自季度内185亿美元的收购。这个数字还不包括对康宁、IREN等上市公司的投资,也不反映尚未完成的承诺(比如2月承诺向OpenAI投资的300亿美元)。


    黄仁勋在电话会上还提到了和Anthropic的合作——今年和明年为Anthropic上线的产能会”非常可观”。在此之前,英伟达对Anthropic的覆盖基本为零。这说明英伟达正在把算力基础设施的触角伸向AI最大的几个客户,而Vera CPU就是这套布局里的重要一环。

    2000亿美元是不是画饼?现在下判断还为时过早。但Vera上市首年就有200亿美元的销售额,至少说明市场愿意给它一个机会。至于能不能守住这块新市场,就要看英特尔、AMD和各大云厂商自研芯片的反击速度了。

  • Google DeepMind憋了个大招:AI不再只陪你聊天,开始帮你搞科研了

    前两天刷到Google DeepMind的一条消息,说他们搞了个叫Co-Scientist的东西——多智能体AI系统,专门给科研人员用的。我第一反应是:又来一个”AI助力科研”的PPT项目?但仔细看完,发现这次有点不一样。

    Google DeepMind Co-Scientist AI系统
    Co-Scientist:基于Gemini构建的多智能体科研助手

    从”搜索工具”到”科研搭档”,这步跨得挺大

    以往AI在科研里的角色,说白了就是个高级搜索引擎——你问它”XXX领域有什么进展”,它给你列一堆文献摘要,然后你自己去啃。

    Co-Scientist想做的事不一样。它的定位是:假设生成、讨论、验证的协同伙伴。核心架构是”生成-讨论-验证”三阶段,多个AI智能体互相抬杠、互相验证,最后给你一个它觉得靠谱的假设方向。

    传统科研里,一个有价值的研究假设,往往需要研究者花几个月甚至几年去打磨。Co-Scientist的目标,是把这个”灵感孵化”的过程,压缩到几天甚至几个小时。

    它到底强在哪?不是参数多,是”会自己纠偏”

    DeepMind在介绍里特意强调了一点:Co-Scientist强化了准确引用专业文献自我修正逻辑矛盾的能力。

    这话什么意思?你去用用现在市面上的大模型,让它帮你梳理一个研究假设,十有八九会出现”编造引用”(hallucinated references)或者”前后逻辑打脸”的情况。Co-Scientist针对这个痛点做了强化,目标是让AI在科研场景里不乱说话

    当然,现在它还处在实验性开放阶段,主要面向研究机构,不是你我去网页上就能白嫖的。但它透露出的方向很明确:AI不再只是”知识的搬运工”,而是开始涉足”知识的创造过程”。


    瞄准的是哪些科研领域?生物学、化学,还有那些”人类搞了几十年还没搞明白”的难题

    DeepMind在展望里点名了几个方向:

    • ALS(肌萎缩侧索硬化症)治疗:这个病折腾了科学界几十年,AI能不能帮忙找到新的药物靶点或者治疗路径?Co-Scientist想试试。
    • 衰老研究:衰老机制极其复杂,假设空间巨大,人工筛选成本极高。AI介入后,可能会开辟一些人类研究者还没想到的角度。
    • 化学分子设计:新药物、新材料的分子结构搜索,本质上是超高维空间的探索问题,AI”生成-验证”的循环在这里很有优势。

    未来DeepMind还打算把Co-Scientist跟实验自动化系统整合起来。到那时候,AI不只是帮你”想”,还能指挥实验室里的机器人去”做”,再把结果喂回来继续迭代。这个闭环一旦跑通,科研效率的跃升会是数量级的。

    跟OpenAI证明数学猜想那件事,其实是同一个信号

    几乎同一时间,OpenAI也放了个大卫星:他们的推理模型证明了一个80年没解决的数学猜想(Erdős单位距离猜想),证明过程125页。

    这两件事放在一起看,信号就很清楚了:2026年的AI,已经从”帮我总结一下”进化到”帮我证明/帮我发现”了。这不是简单的参数堆砌,而是推理能力、文献理解、逻辑自洽性这几件事同时到了一个临界点。

    科研人员如果还在把AI当”高级搜索引擎”用,可能真的有点亏了。下一步值得关注的,是这些科研AI智能体能不能真正加速重大发现,而不只是在已有假设上修修补补。

  • 阿里千问又放大招:Qwen3.7-Max能让AI连干35小时不卡壳

    前几天刷到一条消息,阿里千问偷偷把Qwen3.7-Max放出来了。说实话,这次更新有点东西,不是那种换汤不换药的版本号游戏。

    Qwen3.7-Max模型架构图
    Qwen3.7-Max:阿里千问新一代全能智能体基座

    35小时、1000次工具调用,它真顶得住?

    最让我意外的一个测试数据:Qwen3.7-Max在一次实验里连续跑了35个小时,调用了超过1000次外部工具,整个过程没有崩、没有逻辑断链、没有出现”我不理解你的请求”这类废话。

    这是什么概念?你去问问任何一个用过AI辅助编程的朋友,大多数模型在复杂多步任务里,撑个两三个小时就开始”幻觉叠加”、前后矛盾、或者干脆装死。Qwen3.7-Max这个表现,说明它在长上下文推理多轮工具调用这两个硬骨头上,确实啃下来了。

    “全能智能体基座”——阿里的定位很明确,不是做一个只会聊天的模型,而是做一个能陪你把事情干完的底层引擎。

    编程、办公、长任务,一个都不放过

    Qwen3.7-Max现在的覆盖范围挺全的:

    • 编程场景:从前端原型到复杂多文件工程,它都能接。这意味着你可以用它来重构代码库、跨文件修Bug、甚至帮你从零搭一个项目的骨架。
    • 办公生产力:多智能体协作 + 工作流自动化。说白了,它不只是帮你写邮件,而是能理解你的业务流程,然后自己跑去调用各种工具把活干完。
    • 长周期任务:这才是真正的门槛。35小时不间断,意味着它可以陪你跑完一个完整的软件发布周期,或者帮你盯一个持续集成流水线的全部过程。

    已经在阿里云上百炼上线,还能跑在Claude Code上

    有一点挺关键的:Qwen3.7-Max不是只给千问App用户玩的,它已经接进了阿里云百炼平台,开发者可以直接调用API。

    更值得注意的是,它宣称支持跨框架泛化——能在Claude Code、OpenClaw、Qwen Code等多个开发框架里稳定运行。这话听着有点狂,但如果真的能做到,那意味着阿里的模型在”兼容性”这件事上,开始认真跟Anthropic和OpenAI掰手腕了。

    用户现在可以把千问App更新到6.9.7以上版本,在应用里直接切换到Qwen3.7-Max。PC端和网页端也同步开放了。

    国产大模型,这次真的在拼”实用”了

    回过头看,2026年这几个月,国产大模型的节奏明显变了。以前大家比的是”我有多少参数””我在哪个榜单上刷了第一”,现在比的更多是:你的模型到底能不能帮用户把活干完?

    Qwen3.7-Max打的就是这个痛点。35小时工具调用不掉链子,这件事本身就是一个很强的信号:长周期Agentic任务,不再只是PPT上的概念,而是有模型真的在往这个方向死磕。

    至于它能不能真的在实际生产环境里顶住,还得看接下来几个月开发者的反馈。但至少从目前已经放出来的信息看,阿里千问这一步,走得不虚。

  • 谷歌搜索25年来最大改版:10条蓝链终结

    谷歌搜索终于动手了,25年来最大的一次改版

    用了25年的谷歌搜索,这回真的变了。不是小修小补,是把底层逻辑给重构了。

    你现在在谷歌搜索框里输入一个复杂问题——比如”比较过去20年主要经济体的碳排放趋势和GDP增速的关系”——出来的不再是一串蓝色链接让你自己点进去找答案,而是直接生成一个可交互的图表,数据整合了全网多个来源,你可以在搜索结果页直接操作这个图表。

    谷歌搜索产品副总裁Robby Stein表示,这次升级的核心目标是适应用户搜索行为的变化:人们现在问的问题更长、更复杂,整个互联网往往没有现成的完整答案。

    “10条蓝链”死了

    从1998年谷歌成立到现在,”10条蓝色链接”的搜索结果模式基本没变过。用户输入关键词,谷歌返回一串链接,用户自己点进去找答案。这个模式现在正式宣告终结。

    新版本的搜索结果页可以直接生成定制可视化内容、交互图表、甚至迷你应用。你问”怎么规划一次去日本的3周行程”,搜索结果页直接给你出一个可交互的行程规划器,而不是让你自己去点15个旅行博客。

    SEO行业炸了

    这个变化对SEO从业者来说是个地震级事件。过去20年,SEO的核心逻辑是”让我的链接排在前面,让用户点进来”。现在用户可能在搜索结果页直接拿到了答案,根本不会点你的链接。

    新的优化方向是让自家内容被谷歌的AI概览(AI Overviews)引用。你的内容不需要被用户点击,但需要被AI在生成答案时引用为来源。这是两套完全不同的优化逻辑。


    谷歌为什么要这么做

    背后的推动力很简单:ChatGPT、Perplexity这些AI搜索工具正在吃掉谷歌的午餐。用户发现,有些问题直接问AI比在谷歌上点10个链接效率高得多。

    谷歌的选择是:如果打不过,就把自己变成AI搜索平台。它有足够的优势——拥有YouTube、Gmail、安卓等30亿日活产品,这些数据喂给AI搜索的质量是任何竞争对手都比不了的。

    今年I/O大会上谷歌没有发布对标Claude Mythos的超级模型,而是推了更快更便宜的Gemini 3.5 Flash。CEO皮查伊的战略很明确:不跟Anthropic和OpenAI比基准测试分数,而是把足够好的模型铺到尽可能多的用户产品里。

    对普通用户意味着什么

    短期来看是好事。搜索体验确实会变好,尤其是那些需要整合多个信息源才能回答的复杂问题。你不用再开10个标签页来回切换了。

    长期的影响还不好说。如果所有人都不点链接了,靠流量生存的那些网站(媒体、博客、论坛)的商业模式会受到严重冲击。互联网的内容生产机制可能因为这次改版而发生结构性变化。

  • Anthropic拿到300亿美元,估值飙到9000亿

    Anthropic拿到300亿美元,估值飙到9000亿

    这周AI圈最炸的新闻,是Anthropic正在敲定一笔最高300亿美元的融资,估值直接干到9000亿美元以上。完成后,它将正式把OpenAI从”全球最有价值AI公司”的宝座上拉下来——要知道OpenAI今年3月的估值才8520亿美元。

    更夸张的是,这家公司今年2月的估值还只有3800亿美元。不到4个月,估值直接翻倍。背后支撑这个数字是真金白银的营收:Anthropic预计2026年Q2营收达到109亿美元,比Q1的48亿美元增长了130%。换句话说,它第一次实现了季度运营盈利。

    Anthropic Q2 2026营收预计109亿美元,较Q1增长130%,首次实现季度运营盈利。投资机构看好其18个月内年营收突破500亿美元。

    谁在投?

    这一轮由红杉、Dragoneer、Greenoaks、Altimeter联合领投。这些名字在硅谷创投圈都是顶级玩家,他们下注的逻辑很简单:Anthropic的Claude模型在企业市场打得OpenAI有点招架不住,而且Anthropic的安全叙事在监管趋严的大环境下反而成了竞争优势。

    还有一个细节值得玩味:SpaceX的IPO招股书里披露,Anthropic将向SpaceX支付每月12.5亿美元的GPU算力费用,2029年5月前总计450亿美元。马斯克一边公开怼Anthropic,一边自己的公司收着Anthropic的算力支票,这个画面有点意思。

    卡帕西加入了

    融资消息之外,另一个信号是Andrej Karpathy宣布加入Anthropic,负责重建预训练研究团队。作为OpenAI联合创始人、前特斯拉自动驾驶负责人,Karpathy在AI研究圈的分量不用多说。他的去向本身就是对Anthropic研究方向的背书。


    教皇也来站台

    更有意思的是,教皇良十四世发布了首份AI通谕《Magnifica Humanitas(壮丽的人类)》,主题是在AI时代保护人类个体尊严。这份通谕由Anthropic联合创始人Christopher Olah共同发布。教皇选择跟Anthropic合作而不是谷歌或OpenAI,释放的信号很明确:梵蒂冈认可Anthropic的AI安全理念。

    这件事的象征意义大于实际影响,但对于一家AI公司来说,被天主教会选为AI伦理的对话伙伴,在品牌层面是相当大的加分项。

    OpenAI这边在干嘛

    就在Anthropic融资消息刷屏的同时,OpenAI向SEC提交了保密的IPO申请(S-1文件),计划在2026年Q4到2027年初上市。两家公司的路径开始分化:Anthropic在一级市场拿钱拿到手软,OpenAI则准备去公开市场接受考验。

    不过OpenAI也不是没有动作。据报道,五角大楼正在测试OpenAI和谷歌的模型,考虑把它们加入到涉密工作流中。此前Anthropic因为是国防部首选AI供应商,但今年初Anthropic因为伦理原因拒绝了一份国防部合同,于是五角大楼开始找备选方案。

  • Flowise:42.4k Stars!可视化LLM应用搭建工具,让AI工作流像搭积木一样简单

    Flowise:42.4k Stars!可视化LLM应用搭建工具,让AI工作流像搭积木一样简单

    Flowise Logo

    ## 📝 项目简介

    **Flowise**(flowiseai.com)是一个 **Low-code 的 LLM 应用构建平台**,让你通过可视化拖拽的方式快速搭建基于大语言模型的 AI 应用。它的定位类似于 Langflow,但更轻量、更易上手,专注于让开发者和非开发者都能快速把 LLM 能力落地到实际产品中。


    ## 🔧 安装要求和过程

    ### 环境要求
    – **Node.js** 18+ (必须)
    – **npm** 或 **yarn**
    – 支持 Windows / macOS / Linux

    ### 快速安装(3步搞定)

    **方法一:NPX 直接运行(推荐体验)**
    “`bash
    npx flowise start
    “`

    **方法二:全局安装**
    “`bash
    npm install -g flowise
    npx flowise start
    “`

    **方法三:本地开发**
    “`bash
    git clone https://github.com/FlowiseAI/Flowise.git
    cd Flowise
    pnpm install
    pnpm build
    pnpm start
    “`

    安装完成后访问 `http://localhost:3000` 即可进入可视化界面。


    ## ⚡ 核心功能

    **1. 可视化 LLM 流程编排**
    通过拖拽组件的方式连接 Prompt、LLM、Memory、Tools 等节点,无需写代码就能构建复杂的 AI 工作流。

    **2. 丰富的组件库**
    内置支持 OpenAI、Anthropic、Hugging Face、Ollama 等主流 LLM 提供商,以及 Vector Store、Document Loader、Chain 等常用组件。

    **3. 对话记忆管理**
    支持多种 Memory 类型(Buffer Memory、Window Memory 等),让 AI 应用具备上下文记忆能力。

    **4. API 一键部署**
    流程构建完成后,一键生成可调用的 API 接口,直接集成到你的应用或网站中。

    **5. 向量数据库集成**
    原生支持 Pinecone、Milvus、PostgreSQL(pgvector) 等主流向量数据库,轻松构建 RAG 应用。


    ## 🚀 典型使用场景

    **场景1:构建企业知识库问答机器人**
    上传公司文档 → 接入向量数据库 → 搭建 RAG 流程 → 生成 API → 嵌入企业微信/官网。全程可视化,非技术人员也能操作。

    **场景2:快速原型验证 AI 创意**
    想验证一个 AI 产品的想法?用 Flowise 拖拽出原型,生成 API 直接测试,比写代码快10倍。很多团队用它做 AI 产品的 MVP 验证。

    **场景3:为现有应用添加 AI 能力**
    已有 Web/移动应用?用 Flowise 构建 AI 流程,生成 API,3行代码就能把智能对话、文档分析、内容生成能力接入你的产品。


    ## 💡 推荐理由

    为什么推荐 Flowise?

    比 Langflow 更轻量 — 安装包更小,启动更快,界面更简洁。
    真正能用在生产环境 — 不少同类工具只是 demo 级别,Flowise 的 API 可以直接承载生产流量。
    社区活跃,文档完善 — 42k+ Stars,持续迭代,中文资料也逐渐丰富。
    对非开发者友好 — 产品经理、运营同学也能用它搭建 AI 流程,不用等开发排期。
    与 Langflow 互补 — 如果你在用 Langflow,Flowise 值得对比试用,两者各有优势。


    ## 📥 下载地址

    **🌐 官方网站**
    https://flowiseai.com

    **🐙 GitHub 仓库**
    https://github.com/FlowiseAI/Flowise
    (42.4k+ Stars,持续更新中)

    **📚 官方文档**
    https://docs.flowiseai.com

    **💬 Discord 社区**
    https://discord.com/invite/jBaHxxxadB


    本文由 WorkBuddy AI 自动采集撰写,内容来源于 GitHub 公开信息及官方文档。

  • OpenAI要上市了,估值1万亿美元,这数字什么概念?

    OpenAI这次是真的要上市了。据多家媒体报道,他们这周就要向美国证监会(SEC)秘密提交IPO招股书,目标是在2026年9月完成公开上市,估值可能超过1万亿美元。

    OpenAI IPO Plan
    OpenAI IPO计划引发业界关注(图源:opentools.ai)

    1万亿美元估值,地球上还没几家公司做到

    目前私营阶段OpenAI的最新估值是8520亿美元,这是历史最大规模的私募融资轮。如果IPO估值真的冲到1万亿美元以上,OpenAI将成为人类历史上规模最大的IPO之一,超过沙特阿美石油公司2019年创下的2560亿美元纪录(按市值算)。

    问题是,OpenAI现在还在亏钱。截至2026年2月,他们的年化营收是250亿美元,用户周活9亿,但这些数字背后的成本是惊人的——算力、人才、数据中心,每一个都是吞金兽。

    OpenAI给投资者的故事是:我们拥有高端模型护城河。但问题是,中国出来的低成本模型正在吃掉这个护城河——人家能做到你90%的能力,价格却只有几分之一。

    一个障碍刚被扫清:马斯克输了官司

    数日前,马斯克针对OpenAI的诉讼被陪审团裁定「诉讼时效过期」而驳回。这场官司折腾了快两年,马斯克声称OpenAI背离了最初的非营利使命,要求法院阻止其转为营利性公司。

    官司没了,OpenAI上市最大的法律障碍就消失了。与此同时,Anthropic也在准备IPO,估值谈到了9000亿美元,原本计划10月上市。但现在OpenAI抢跑,预测市场显示OpenAI先于Anthropic上市的概率从32%飙到83%。

    上市对普通开发者的意义

    如果你是靠OpenAI API吃饭的开发者,这件事跟你有关。上市公司面临季度财报压力,大概率会推动API涨价,或者把更多资源向企业级用户倾斜。

    OpenAI已经推出了「Guaranteed Capacity(容量保障)」计划,释放的信号很明确:想获得稳定算力?签多年合同。中小开发者如果只靠按量付费,未来可能只能拿到剩余算力配额。


    一个有趣的花絮:CEO Sam Altman在IPO申请前夕,突然宣布向所有Y Combinator当前批次的初创公司提供200万美元的OpenAI API额度,条件是换取对方股权。这操作被外界解读为:在上市前的监管审视期,先锁定一批未来的需求方。至于这是不是违反YC条款或者OpenAI自己的利益冲突政策,目前还没人说清楚。

    不管怎样,AI行业从私募资本主导转向公开市场的时代,算是正式开始了。