标签: AI技术

  • GitHub Copilot改按token计费,有开发者月账单从29美元飙到750美元

    6月1日,GitHub Copilot的计费模式要变天了。微软把原来每个月固定费率订阅,改成了按token使用量计费。这个变化对个人开发者和小型团队来说,代价可能相当惨烈。

    消息在Reddit和X上传开之后,吐槽帖铺天盖地。有个用户说自己现在每个月付大约29美元,新模式下算下来每个月要接近750美元——涨了将近25倍。另一个人的账单更夸张,从每月50美元左右直接跳到了3000美元上下。光看数字确实吓人。

    一名Reddit用户原话是:”真是个笑话。这种新的使用量计费模式贵得离谱,我打算直接取消订阅。这个价格下,它已经没有任何性价比和实用价值了。”

    两派观点吵翻了

    帖子下面的评论区,画风出现了明显分化。一部分人同情这些”账单暴涨”的用户,认为微软之前一直在鼓励无节制使用Copilot,各种”氛围编码”(vibe coding)的工作流被官方当成正面案例来宣传,现在突然改规则,感觉像是背刺。

    另一派则说,能达到这种天价账单的,多半是没有任何工程约束地乱用AI——让模型不停地重试、生成大量冗余代码、开几十个子代理并发跑任务。有经验的开发者表示,自己一整天用下来,超额费用很少,和新定价之间的差距根本没那么夸张。

    有个回帖说得很直白:费用高到这种程度,唯一的可能是你纯粹在靠”氛围编码”干活,进行了大量冗余的迭代。如果你把它当作一个正经工具来用,哪怕是小团队也能负担得起。

    GitHub Copilot interface screenshot
    GitHub Copilot 聊天界面(图源:GitHub)

    微软之前到底在补贴多少

    这场争论里有个问题挺值得思考:Copilot之前每个月十几美元或者几十美元的订阅费,微软到底在里面补贴了多少?按token计费的模式一出来,答案似乎开始浮出水面了——之前的价格,可能远低于实际服务成本。

    尤其是”氛围编码”这种用法,一个提示词下去,模型可能要跑好几个小时甚至好几天,中间还要生成几十个甚至上百个子代理协同工作。这种级别的计算资源消耗,用每个月29美元去覆盖,换谁来做都很难盈利。

    有用户发帖直接问:”天呐,Copilot之前到底亏了多少钱?”这个问题目前只有微软自己能回答。但可以肯定的是,从固定费率切换到按量计费,不只是定价策略的调整,更是微软把AI辅助编程从”补贴推广期”推进到”商业化回收期”的一个转折点。

    对于专业开发者来说,只要用法得当,新计费模式倒也不至于用不起。真正受冲击的,是那些把Copilot当成”随便试错”工具的 casual 用户——他们可能要开始认真算账了。

  • 谷歌AI把Google拼错了,大语言模型的拼写死穴到底能不能修好

    上周有个网友在X上发帖吐槽,说用谷歌搜索”Google”的时候,AI概览(AI Overview)给出的结果里,Google这个单词里有两个P。等等,Google里明明只有一个P啊。

    这不是孤例。有人问AI”poop”里有几个R,它说有1个(实际是2个)。问”journalism”怎么拼,它给出的答案是j-o-u-r-n-a-d-i-s-m——多了一个完全不存在的D。”disregard”更离谱,AI概览直接输出了”我明白了,如果你有新的提示或问题请告诉我”,活像是把训练语料里的客服话术当成了单词释义。

    谷歌通过邮件向TechCrunch回应称:”统计单词内字母数量一直是大语言模型的已知难题,我们正在努力修复这个问题。”说实话这个回应挺诚实的——他们没狡辩,也没说这是特性不是bug。

    为什么AI不会拼单词

    这事的根源得从Transformer架构说起。大语言模型处理文本的时候,不是逐字母读取的,它会把文本切分成一个个”token”——一个token可能是一个完整单词,也可能是一个音节,甚至单个字母。模型内部存的是这些token的数字编码,根本不知道T-H-E分别是哪几个字母。

    阿尔伯塔大学的AI研究员Matthew Guzdial给TechCrunch举了个例子:当你输入单词”the”的时候,模型拿到的是”the”这个整体对应的编码,它完全不知道这个单词是由T、H、E这三个字母构成的。这就好比你认识一个人,但说不出他长什么样——你知道这个token”长什么样”,但拆不开它。

    Google AI Overview spelling error screenshot
    谷歌AI概览将”Google”错误拼写为两个P的截图(TechCrunch修改标注)

    东北大学研究大语言模型可解释性的博士生Sheridan Feucht说得更直白:对于语言模型来说,”单词”到底是什么其实是很难界定的问题。哪怕我们让人类专家达成一个完美的token词表共识,模型可能还是觉得需要把内容拆分得更细。他猜测,由于这种模糊性,根本不存在完美的分词器。


    这不是第一次,也不会是最后一次

    谷歌上一次在AI搜索上翻车,还是AI概览刚上线的时候。当时它引用讽刺网站The Onion和Reddit的帖子,给出了”每天吃一块小石头””在披萨上涂胶水”这类荒谬建议,闹得沸沸扬扬。这次谷歌把整个搜索体验都改成了生成式AI驱动,是搜索产品25年来最大的一次重构,拼写错误只是暴露出来的冰山一角。

    有意思的是,拼写测试已经成了AI圈的一个梗。每当有公司发布新模型,大家都会问它”strawberry里有几个R”——这个简单问题曾经难倒了所有主流模型。现在情况好多了,但Google这件事说明,哪怕模型能在几秒内写出一整个应用,或者解决困扰数学家几十年的难题,拼写能力还是和幼儿园小朋友差不多。

    研究人员并不乐观认为这个问题能被彻底解决。但换个角度想,大语言模型的价值本来也不在拼写能力上。这些明显的低级错误反而是个好事——它提醒我们,AI并不完美,哪怕它有时候看起来全知全能。用AI输出结果之前,二次核对准确性这件事,永远不能省。

  • 微软正在打造AI超级应用——把Copilot全家桶装进一个入口

    据《财富》杂志报道,微软正在开发一款AI”超级应用”——把现在散落在各处的AI能力全部整合到同一个入口。具体来说,这款应用会把GitHub Copilot、Copilot聊天机器人、Copilot Cowork,以及一个内部代号为”Autopilot”的新智能体工作流能力,全部塞进一个App里。

    这个思路听起来很熟悉,对吧?OpenAI已经在走这条路了——把对话、搜索、代码、智能体编排全部整合进ChatGPT,让它成为一个真正的”超级应用”入口。现在微软想做同样的事,只不过依托的是自己整个Copilot产品线。

    微软的打法其实很清晰:它拥有全链路的产品布局——从代码编辑器里的Copilot,到Microsoft 365里的Copilot,再到独立发布的Copilot Cowork智能体平台。唯一缺的就是一个把它们串起来的”总控制台”。

    可能在Build大会上亮相

    《财富》的报道推测,这款超级应用可能会在近期举办的Microsoft Build开发者大会上亮相。Build是微软每年最重要的开发者活动,通常是发布重磅AI战略更新的场合。如果这款产品真的在Build上出现,基本等于微软官方确认了”超级应用”战略。

    值得一提的是,微软过去一年在Copilot品牌上投入极大,但用户体验一直是碎片化状态——写代码要用GitHub Copilot,处理文档要用Microsoft 365 Copilot,管理智能体工作流要用Copilot Cowork,三者之间的数据和上下文并不打通。这款超级应用如果成真,最直接的价值就是解决这个问题。

    和OpenAI的超级应用有什么不同?

    OpenAI的”超级应用”路线是围绕ChatGPT构建的——所有能力都收敛到一个对话窗口里,用户跟AI交互的主要方式还是”说话”和”看结果”。微软的路线则更偏向”工作流”——它继承的是Office、Azure、GitHub这套企业生产力生态,AI超级应用更像是一个”智能工作操作系统”。

    两套打法背后的逻辑不太一样。OpenAI是从消费者往上打,微软是从企业往下打。最终谁能先把”超级应用”这件事做成,很大程度上取决于谁能先把多智能体协作、跨应用上下文传递、以及企业数据安全这三个问题解决掉。


    目前微软官方还没有确认这款产品的存在,按照惯例,在Build大会之前所有消息都只是传闻。但如果《财富》的报道方向是对的,这会是微软在AI应用层最重要的一次产品整合,也意味着”Copilot”作为一个独立品牌,正在从”功能”升级为”平台”。

  • 互联网正在为机器重构——AI智能体正在改写整个网络基础设施

    过去二十年,互联网一直是围绕人类行为设计的。人们搜索、点击、滚动、串流,这些动作有规律、可预测。但AI智能体不这么干活。它们能在几秒钟内发起一连串突发请求,同时调出十几个子智能体,疯狂查询数据库、检索文档、调用API,然后突然全部消失。这种流量模式,人类的网络基础设施从来没为它设计过。

    AWS悄悄改写了搜索数据库的底层的

    本周,亚马逊云科技(AWS)发布新一代OpenSearch Serverless——一个专门面向AI智能体负载设计的托管搜索和向量数据库。最核心的变化是:计算和存储解耦了。智能体发起任务时,算力可以在几秒内弹性扩容;智能体 idle 时,算力可以缩到零。客户不用再为空闲的计算资源付费。

    “智能体正从实验阶段走向生产环境,它们产生的流量模式,是之前的基础设施根本没考虑过的。”
    ——Tia White,亚马逊OpenSearch服务总经理

    之前的Serverless版本也有弹性,但存储和计算是绑定的,你至少得保留一个运行中的实例。说白了就是:哪怕你没在用,也得一直付停车费。新一代相当于改成了计时停车位——来了才计费,走了就归零。

    AI智能体概念图
    AI智能体正在改变互联网流量结构(图片来源:Getty Images)

    机器流量已经超过你想象

    Cloudflare的数据很说明问题:过去六个月, bots 流量已经占到整体HTTP流量的31%。其中AI爬虫、搜索引擎和AI助手加起来,约占所有bot请求的25%。Cloudflare高级产品经理Lai Yi Ohlsen预计,2027年上半年,非人类流量就会超过人类流量。

    这不只是在抢带宽。智能体的检索模式跟人类完全不一样——它们会并发查询数百个数据源,对延迟极度敏感,而且流量峰值毫无规律。传统的基础设施假设用户是”逐步浏览”的,但智能体是”瞬间爆发”的。

    整个行业都在跟

    AWS不是唯一一个在干这件事的。Databricks和Snowflake正在把自己重新定位为企业AI内存和检索系统;微软Azure最近也推出了针对AI智能体突发流量和多智能体共享内存的更新;Cloudflare上个月发布了面向智能体的持久化环境和即时扩展基础设施。

    Google I/O上周也释放了信号:用户很快就能把购物研究、行程预订、网页浏览等任务委派给AI系统。不管是面向消费者的AI智能体,还是企业内外部部署的智能体,机器对机器的流量正在指数级增长。


    这场基础设施的重构,本质上是为下一个十年做准备。当智能体成为互联网的主要”用户”,整个堆栈——从数据库到CDN,从API网关到身份认证——都得重新思考。目前看,大的云厂商已经跑起来了,但这一步才刚刚开始。

  • 2026年5月AI大模型密集发布:GPT-5.5、DeepSeek v4、Claude 4.6谁更胜一筹?

    GPT-5.5来了:OpenAI的又一次跳跃

    4月24日,OpenAI发布了GPT-5.5,官方描述是”迄今为止最智能、最直观的模型”。数字上的提升是实的:在Terminal-Bench 2.0测试中拿到82.7%,GDPval评测84.9%。

    但更值得关注的是它在Agentic coding(智能体编程)上的进步。写代码不再只是”补全下一行”,而是能自主规划多步骤任务、调用工具、自己debug。这对开发者来说,意味着AI编程助手真的从一个”聪明补全器”变成了”能一起干活的搭档”。


    DeepSeek v4:国产大模型的反击

    同一天,DeepSeek放出v4,推出Flash和Pro双版本。最炸裂的参数是1M+ token的超长上下文窗口——这意味着它可以一口气读完一整本技术手册,然后基于全书内容跟你对话。

    更妙的是它兼容OpenAI和Anthropic的SDK,开发者迁移成本几乎为零。加上本身就便宜,这波发布直接把”长上下文+低成本”的标杆拉高了。


    Claude Sonnet 4.6:接近Opus的性能,一半的价格

    3天后,Anthropic更新了Claude Sonnet 4.6和Haiku。核心卖点是”接近Opus级别的性能,但价格便宜得多”。对于已经在用Claude API做产品的团队来说,这个性价比提升是实打实的。

    这次更新还修了之前版本里推理不稳定和缓存出错的bug。对于生产环境用户来说,稳定性往往比基准测试分数更值钱。


    Google Gemini Pro & Flash:双版本策略的聪明之处

    Google也在同一天(4月27日)更新了Gemini Pro和Flash。Pro负责扛性能大旗,Flash负责低延迟和高并发场景。两个版本都支持1M token上下文窗口,多模态能力和推理能力都有明显提升。

    Google这波操作聪明在:不让用户做”性能vs成本”的单选题,而是两个版本各司其职。对于需要同时服务C端和B端的应用来说,这种组合很实用。


    IBM Granite 4.1:小参数模型的逆袭

    4月30日,IBM发布了Granite 4.1,参数只有8B,但性能居然能跟32B的MoE模型掰手腕。这件事传递的信号很清楚:堆参数不是唯一出路,数据质量和训练效率同样能打

    对于想在本地部署、或者推理预算有限的团队来说,这类小参数高性能模型是真正的香饽饽。大模型不一定非得”大”。


    四个趋势,定义接下来半年

    把这波发布潮放在一起看,有四个趋势已经很明显了:

    • 超长上下文正在变成标配。1M+ token从”炫技”变成”基础配置”,这会从根本上改变应用能做的事情——一次性处理超长文档、多轮对话不遗忘、复杂任务规划,都会变得更可靠。
    • 小参数模型崛起。DeepSeek v4和IBM Granite 4.1都在证明:聪明的训练比盲目的参数堆砌更有效率。这对降低推理成本、推动AI应用普及是好事。
    • Agentic能力成为新战场。从GPT-5.5到Claude 4.6,所有厂商都在强化”让AI不只是回答,而是主动完成任务”的能力。这是从”对话助手”到”智能代理”的关键一跃。
    • 监管压力在累积。欧盟AI Act的合规期限是2026年8月,没几个月了。技术在狂奔,但安全性和透明度基准测试的进度明显滞后。这波发布潮里,几乎每家都提到了”负责任的AI”,但真正做到多少,还得看。

    对开发者意味着什么

    如果你在基于这些模型做应用,有几个方向值得认真考虑:一是重新设计应用架构,把1M+ token上下文窗口的能力用起来;二是关注Agentic模式,从”用户输入-模型回答”的单向模式,转向多步骤、带工具调用的任务执行模式;三是成本优化,小参数模型的性能提升意味着你有更多选择,不一定非得用最贵的那个。

    2026年5月的这波模型发布,表面上是各家在比拼基准测试分数,实际上是AI从”技术演示”走向”大规模应用”的转折点。谁能把模型能力稳定、低成本、安全地交付到用户手里,谁就赢了。

  • Anthropic砸650亿美元融资,估值逼近1万亿——这家公司到底在押什么

    Anthropic砸650亿美元融资,估值逼近1万亿——这家公司到底在押什么

    如果你最近关注AI融资圈,这条消息大概已经刷过你的屏了。Anthropic在5月28日官宣完成H轮650亿美元融资,投后估值9650亿美元——离1万亿只差一小步。

    这个数字什么概念?OpenAI最新一轮融资后的估值是7300亿美元,Anthropic这一轮直接把门槛抬高了两个身位。

    钱从哪里来,又往哪里去

    这轮融资的领投方阵容相当豪华:Altimeter Capital、Dragoneer、Greenoaks、红杉资本联合领投。跟投名单里你能看到黑石、富达、淡马锡、Baillie Gifford这些名字——基本上就是全球最有钱的那批机构排队送钱。

    Anthropic说这笔钱主要花在三件事上:推进安全研究、扩大算力储备、把产品铺到更多客户那里去。听起来像是标准融资说辞,但仔细看他们最近签的算力合同,你就知道这个”扩大算力”不是开玩笑的。

    Anthropic CFO Krishna Rao的说法是:”Claude对全球客户来说越来越不可或缺了。这笔融资帮我们对需求做好准备,保持在研究前沿,把Claude推到更多工作场景里。”

    算力布局比你想的更激进

    真正值得关注的是他们悄悄签下的一堆算力协议。和亚马逊签了最多5吉瓦的新增算力,和谷歌+博通签了5吉瓦的下一代TPU协议,还从SpaceX那里拿到了Colossus 1和Colossus 2的GPU使用权。

    这些合同加起来意味着什么?意味着Anthropic从根本上解决了”模型训练出来但跑不起来”这个AI公司最头疼的问题。算力供给锁死了,接下来就是产品和销售的事了。

    还有一个细节:Claude目前是全世界第一个在亚马逊AWS、谷歌云、微软Azure三大云平台上都能用到的前沿模型。AWS是主要训练合作伙伴,但这个”三云平台通吃”的站位,OpenAI其实并没有完全做到(微软的排他性一直是个问题)。

    收入数字终于肯说了

    Anthropic这轮融资最硬的底气来自收入。2026年5月,他们的营收运转率(run-rate revenue)已经突破47亿美元。这个数字是从2月份G轮融资之后涨上来的,也就是说在不到三个月里,收入规模又上了一个台阶。

    企业客户在用Claude处理实际工作流——不是试用,是真的把业务跑在上面。Anthropic的说法是Claude正在”学习企业实际运营的逻辑”,包括业务上下文、流程和判断逻辑。这话听起来有点玄,但翻译成人话就是:企业用得越深,切换成本越高,Anthropic的护城河就越宽。


    投资人这边当然也说了一堆好话。红杉资本合伙人Alfred Lin说初创公司和全球5000强都在部署Claude处理复杂工作流。Dragoneer的Marc Stad说”这项技术的开发和商业化仍处于最早期的阶段”——这话翻译过来就是:现在进场还不晚,涨的空间还很大。

    估值9650亿美元到底贵不贵?如果你觉得Claude值得比OpenAI高,那这个估值就有它的逻辑。如果你觉得大模型赛道接下来会卷价格战,那这个故事就不好说了。但至少从现在的数据来看,Anthropic在企业市场上的渗透速度,确实比大多数人的预期要快。

  • 微软正在开发自己的 AI 超级应用,要把所有 Copilot 装进一个入口

    微软正在悄悄打造一款 AI 超级应用,目标是把散落在各个产品里的 Copilot 工具全部塞进一个入口。这件事背后的动机其实很直接——用户被一堆 Copilot 搞烦了,不知道该用哪个,微软自己也清楚这个问题拖不下去了。

    一个入口管所有 Copilot

    据《财富》杂志的独家报道,这款超级应用要把 GitHub Copilot(写代码的)、Copilot 聊天机器人(聊天的)、Copilot Cowork(协同工作的),还有一个内部叫 Autopilot 的新Agent工作流功能,全部整合到同一个界面里。

    微软内部给这个项目喊的口号是”交付一个 Copilot”——不管你用的是哪个场景,进同一个应用就够了。

    这个项目由今年3月刚被提拔的 Copilot 负责人 Jacob Andreou 牵头。消息人士透露,应用的部分元素可能会在下周的微软 Build 开发者大会上被提到,但完整展示还要等一段时间。微软的计划是夏末把这款超级应用推出来。


    微软的 Copilot 困局

    说起来有些尴尬,微软是最早重金押注 AI 的科技公司之一,和 OpenAI 绑定的130亿美元合作曾经让它在赛道上遥遥领先。但这几年竞争对手涌进来太快,微软反而把早期的领先优势给弄丢了。

    Copilot 品牌本身的问题也不少——历史上它一直依赖 OpenAI 的模型,而这些模型在基准测试里一度被竞争对手甩在后面;微软自己研发的模型又进展缓慢;更让用户困惑的是,微软推出了好几个不同版本的 Copilot,消费端和企业端是分开的,内部团队也是各搞各的,始终没有一个统一的 AI 愿景。

    现在 Microsoft 365 有4.5亿用户,但付费使用 Copilot 的比例不到4.5%。GitHub Copilot 虽然有超过470万付费订阅用户,但也正面临 Cursor 和 Anthropic Claude Code 的猛烈追击。


    不是唯一在搞超级应用的公司

    微软当然不是唯一想做超级应用的公司。它的合作伙伴兼竞争对手 OpenAI 早就有类似打算,想把 ChatGPT、Codex 和浏览器整合进同一个入口。埃隆·马斯克的 X(原 Twitter)也一直在往”通信+媒体+商务”的超级应用方向靠。Uber 和 Meta 也在把越来越多的服务塞进单个应用里。

    对微软来说,这款超级应用能不能成,很大程度上取决于它能不能真正把割裂的 AI 产品线整合起来。CEO 纳德拉过去一年一直在调整高管团队,试图让公司在 AI 赛道上把丢掉的优势追回来。这款超级应用就是他们给出的最新答案。

  • OpenAI Codex 现已能控制你的 Windows 电脑

    OpenAI 的 Codex 在 Mac 端上线之后,现在终于轮到 Windows 用户了。这次更新把 computer use 功能带到了 Windows 平台,意思是这个应用现在能”看见”你的屏幕,还能在你的设备上直接执行各种任务。

    不用坐在电脑前也能管任务

    OpenAI 同时表示,你现在可以通过 ChatGPT 应用在离开电脑的时候管理和查看 Codex 的任务执行情况。这对需要跑长任务的开发者来说挺实用的——不用一直守在屏幕前,手机上就能看进度。

    Codex 的 computer use 功能正式登陆 Windows,AI 编程助手从”帮你写代码”进化到”直接帮你操作电脑”。


    Mac 端先跑,Windows 跟上

    事实上 Codex 的 computer use 功能在 Mac 上已经跑了一阵子了,这次 Windows 版本的到来算是补齐了主流桌面平台的覆盖。OpenAI 在 X(原 Twitter)上还专门发了条推文:”Windows users, this one’s for you.”,语气倒是挺轻松的。

    这个功能本质上是让 AI 能够理解屏幕内容并模拟人类操作——点按钮、填表单、切换窗口,都在这个能力范围内。对于需要做 UI 自动化测试或者批量操作的场景,这比传统的脚本方式要灵活得多。


    和 Claude 的 computer use 打对台

    Anthropic 的 Claude 早就有了类似的 computer use 能力,现在 OpenAI 把这块能力也补上了,两个头部玩家在”让 AI 直接操作电脑”这个方向上的竞争又多了一个维度。区别可能在于 OpenAI 把这套能力和 Codex 的编程场景绑得更紧——你写的代码,Codex 可以直接帮你跑起来、点按钮、看结果。

  • XCENA拿了一轮1.35亿美元:AI的最大瓶颈不是算力,是内存

    做AI芯片的公司在2026年并不稀奇,但一家韩国初创公司拿了1.35亿美元融资,理由是”AI的最大瓶颈不是算力,是内存”——这个说法至少让投资圈认真听了。

    数据在CPU、GPU、内存之间来回跑,每一次都要钱

    XCENA的核心判断很简单:你现在每次跟AI说一句话,数据都要在内存、CPU、GPU之间跑一个来回。数据从内存取出来,CPU预处理一遍,送到GPU算,结果再写回内存。生成一个词要走一遍这个流程。

    这不是纯理论问题。它意味着你每用一次AI,都伴随着一笔不算小的数据传输成本。日活几亿次请求的规模下,这个开销是真实的。

    XCENA的估算是:原本需要10台服务器才能跑完的AI推理任务,如果用他们的方案,1台就够了。

    把计算搬到内存旁边去

    他们的办法是做一枚叫MX1的芯片,思路叫”存算一体”——计算不要老盯着GPU做,把一部分活儿搬到内存模块附近完成。

    具体说,MX1通过CXL(Compute Express Link,一个专门连接处理器和内存的高速通道)跟CPU对接,把预处理、KV缓存管理、数据缓存这些事情,在内存模块里面直接做完。数据不用出门,结果也不用搬回来。

    XCENA MX1芯片
    XCENA MX1芯片原型(图源:TechCrunch)

    技术上有几个值得说的地方。MX1基于开源RISC-V指令集设计,里面有数千个小型高效核心,专门为数据搬运和预处理优化过。竞争对手Marvell的方案只用少量通用核心,理论上效率有差距。

    XCENA还做了垂直整合——内存层级、互联总线、DRAM控制器全是自研的。大多数芯片公司会把这类工作外包,他们选择自己做,理由是只有全栈控制才能把内存效率压榨到极限。

    三星、SK海力士的前员工出来创业,时机刚好

    这家公司2022年创办,三位创始人Jin Kim(CEO)、Dohun Kim(CTO)、Harry Juhyun Kim(CPO)全部来自三星和SK海力士。做内存的人出来做AI基础设施,这个组合在2026年看起来挺合理的。

    本轮1.35亿美元由韩国VC机构Atinum、IMM Investment联合领投,跟投方包括Corstone Asia、老股东SBI Investment、Mirae Asset Capital。公司累计融资已达1.85亿美元,估值5.7亿美元。


    一个有趣的行业背景:2026年5月,三星、SK海力士、美光三大内存芯片厂商的市值首次同时突破1万亿美元。内存价格的上涨和AI需求的持续拉动,正在把”内存中心架构”从学术概念推向产业现实。

    MX1目前还在原型阶段,预计2026年底在三星代工厂量产,2027年开始产生收入。目标客户很明确:每年在AI基础设施上花几百亿美元的超大云厂。对这些公司来说,内存效率提升5%,可能就意味着几亿美元的成本节省。

    XCENA不直接跟英伟达在训练侧竞争——他们瞄准的是推理侧的内存密集型层。这个位置刚好卡在GPU算力和内存带宽之间的夹缝里,是一个有理由存在的细分市场。

  • Anthropic估值超OpenAI逼近1万亿美元,Claude Code三个月烧出9650亿

    Anthropic完成了一轮让整个硅谷侧目的融资。650亿美元进账,投后估值9650亿美元,这家公司现在的身价已经把OpenAI甩在了身后。

    从3800亿到9650亿,只用了3个月

    今年2月,Anthropic的估值还是3800亿美元。3个月后再融资,直接飙到9650亿。这种涨幅在AI圈也算是现象级的。

    本轮由Altimeter Capital、Dragoneer、Greenoaks和红杉资本联合领投,同时还包含了此前承诺的150亿美元投资(其中亚马逊出了50亿)。作为对比,OpenAI在3月下旬完成1220亿美元融资后,估值为8520亿美元。

    Anthropic的年度经常性收入已经达到470亿美元,远高于今年早些时候的300亿美元,也比去年同期的100亿美元高出近4倍。

    营收暴涨的核心驱动力是Claude Code——这款AI编程助手正在成为越来越多开发者和企业的标配工具。Anthropic首席财务官Krishna Rao的话说得很直白:Claude在客户群体里越来越不可或缺,这笔钱就是用来满足历史性需求的。

    Anthropic融资估值超OpenAI
    Anthropic最新一轮融资650亿美元,估值达9650亿美元(图源:CNBC)

    三强争霸,都在准备上市

    头部AI公司的IPO竞赛已经打响。马斯克的SpaceX(旗下有SpaceX AI)上周提交了招股说明书,合并后估值1.25万亿美元。OpenAI也准备在未来几天内提交保密招股书,最早今年9月挂牌。

    Anthropic虽然在幕后也在筹备IPO,但时机还不明确。毕竟手里有650亿美元现金,并不急着上市。真正让外界关注的是,它是否已经走到了”盈利”这个AI公司集体梦寐以求的节点。

    同期发布的Claude Opus 4.8和具备高级网络安全能力的Claude Mythos Preview,也在向市场传递一个信号:Anthropic不只是钱多,技术也在往前走。


    有意思的是,这轮融资完成后,全球AI版图上估值最高的私有公司头衔,正式从OpenAI交棒给了Anthropic。而就在一年多前,绝大多数人还认为这个位置非OpenAI莫属。

    资本用脚投票的背后,是Claude在企业级市场的真实渗透力。比起OpenAI消费者端的耀眼数据,Anthropic的企业客户粘性可能是它估值能够持续走高的更底层逻辑。