不做芯片做软件，Sail用8000万美元赌AI推理可以更便宜

作者：

在

AI推理优化概念图 — Sail Research用软件优化替代定制芯片，把AI推理成本压到对手的十分之一

everyone都在造芯片，Sail说软件就够了。这家刚刚冒出头的初创公司本周宣布完成8000万美元融资，估值4.5亿美元，由Kleiner Perkins和Sequoia联合押注。它的主张听起来有点反潮流——当OpenAI在做Jalapeño芯片、谷歌有TPU、亚马逊有Trainium的时候，Sail说光靠软件优化就能把AI推理成本压到对手的十分之一。

长周期智能体才是主战场

Sail Research的平台专门跑”长周期”AI智能体——就是那些需要连续工作数小时甚至数周才能完成的任务。它在Linux虚拟机（叫Sailboxes）里运行智能体，开发者可以自定义每个虚拟机的软件环境。关键是，当智能体在等待外部系统返回数据时，Sail会把整个智能体关掉，不再烧钱，等数据回来了再继续。这个设计思路很直接，但确实能省不少钱。

他们在BrowseComp-Plus基准测试上拿了90.72%的分数，同时推理成本只有对手的十分之一。这个成绩单够亮眼，但真正有意思的是它背后的逻辑：大部分企业根本造不起自己的定制芯片，但它们可以在现有的英伟达GPU上跑Sail的软件层，达到类似的效率提升。

Sail的CEO Neil Movva说得很直白：人类用电脑最看重速度，但智能体最需要的是规模、可靠性和可持续的成本。这句话其实点出了当前AI基础设施争论的核心——我们到底是在为什么买单？

定制芯片 vs 软件优化，两条路都能走通

这一轮AI基础设施的竞争，某种程度上分裂成了两个阵营。一边是”算力派”，认为推理成本的根本解法是定制芯片——OpenAI找Broadcom做Jalapeño，谷歌继续迭代TPU，亚马逊推Trainium，都在走这条路。另一边是”效率派”，认为现有的GPU已经够强，问题出在软件层没有把硬件能力吃干榨净。

Sail属于后者。它改写了多个开源推理引擎，用了一套自己优化的算法来提升显存利用率。效果据称不错，但这个说法需要打一个问号：基准测试的跑分环境和真实生产环境往往是两回事，90.72%的分数能否在客户的实际工作负载上复现，还得等产品正式铺开才知道。

投资者阵容值得注意

这一轮的投资者名单里有两个名字很显眼：Intel CEO Lip-Bu Tan和Alphabet董事长John Hennessy。Hennessy的身份尤其微妙——他既是谷歌的董事长，又投了一家说”软件优化可以替代定制芯片”的初创公司。不管这在战略上意味着什么，至少说明业界对AI推理成本问题的关注度已经非常高了。

Kleiner Perkins和Sequoia同时进场也是一个信号。两家顶级VC在同一个轮次里联手，通常意味着他们判断这个赛道已经过了”要不要做”的阶段，现在的问题是”谁能先做出来”。Sail的4.5亿美元估值不低，但它面对的是一个实实在在的市场需求：企业用完AI之后发现账单比预期厚得多，它们愿意为任何能压低成本的技术方案付钱。

这一轮融资的时间点选得有点巧——正好是OpenAI官宣Jalapeño芯片之后没几天。两件事摆在一起看，像是一场关于”AI推理成本到底该怎么降”的公开辩论。OpenAI选了最难的路（自己做芯片），Sail选了最快落地的路（软件优化）。两条路都能走通，但受益的客户群不太一样：超大规模云厂商有能力做定制芯片，普通企业只能靠软件层省成本。

📎 原文来源：Sail Research raises $80M to optimize long-horizon AI agents — SiliconAngle

AI AI基础设施 AI技术 AI投资 AI推理

不做芯片做软件，Sail用8000万美元赌AI推理可以更便宜

长周期智能体才是主战场

定制芯片 vs 软件优化，两条路都能走通

投资者阵容值得注意

评论

发表回复 取消回复

更多文章

FastAPI：构建AI服务API的现代化Python框架，80K+ Stars让API开发快如闪电

REI的Instagram广告里自行车长了两副车把，锅居然甩给了Meta的AI

AI智能体开始”套娃”：让AI监督AI，这个循环能一直跑下去吗？

ElevenLabs全面接入SynthID水印，AI声音内容终于有迹可循

发表回复取消回复