
everyone都在造芯片,Sail说软件就够了。这家刚刚冒出头的初创公司本周宣布完成8000万美元融资,估值4.5亿美元,由Kleiner Perkins和Sequoia联合押注。它的主张听起来有点反潮流——当OpenAI在做Jalapeño芯片、谷歌有TPU、亚马逊有Trainium的时候,Sail说光靠软件优化就能把AI推理成本压到对手的十分之一。
长周期智能体才是主战场
Sail Research的平台专门跑”长周期”AI智能体——就是那些需要连续工作数小时甚至数周才能完成的任务。它在Linux虚拟机(叫Sailboxes)里运行智能体,开发者可以自定义每个虚拟机的软件环境。关键是,当智能体在等待外部系统返回数据时,Sail会把整个智能体关掉,不再烧钱,等数据回来了再继续。这个设计思路很直接,但确实能省不少钱。
他们在BrowseComp-Plus基准测试上拿了90.72%的分数,同时推理成本只有对手的十分之一。这个成绩单够亮眼,但真正有意思的是它背后的逻辑:大部分企业根本造不起自己的定制芯片,但它们可以在现有的英伟达GPU上跑Sail的软件层,达到类似的效率提升。
Sail的CEO Neil Movva说得很直白:人类用电脑最看重速度,但智能体最需要的是规模、可靠性和可持续的成本。这句话其实点出了当前AI基础设施争论的核心——我们到底是在为什么买单?
定制芯片 vs 软件优化,两条路都能走通
这一轮AI基础设施的竞争,某种程度上分裂成了两个阵营。一边是”算力派”,认为推理成本的根本解法是定制芯片——OpenAI找Broadcom做Jalapeño,谷歌继续迭代TPU,亚马逊推Trainium,都在走这条路。另一边是”效率派”,认为现有的GPU已经够强,问题出在软件层没有把硬件能力吃干榨净。
Sail属于后者。它改写了多个开源推理引擎,用了一套自己优化的算法来提升显存利用率。效果据称不错,但这个说法需要打一个问号:基准测试的跑分环境和真实生产环境往往是两回事,90.72%的分数能否在客户的实际工作负载上复现,还得等产品正式铺开才知道。
投资者阵容值得注意
这一轮的投资者名单里有两个名字很显眼:Intel CEO Lip-Bu Tan和Alphabet董事长John Hennessy。Hennessy的身份尤其微妙——他既是谷歌的董事长,又投了一家说”软件优化可以替代定制芯片”的初创公司。不管这在战略上意味着什么,至少说明业界对AI推理成本问题的关注度已经非常高了。
Kleiner Perkins和Sequoia同时进场也是一个信号。两家顶级VC在同一个轮次里联手,通常意味着他们判断这个赛道已经过了”要不要做”的阶段,现在的问题是”谁能先做出来”。Sail的4.5亿美元估值不低,但它面对的是一个实实在在的市场需求:企业用完AI之后发现账单比预期厚得多,它们愿意为任何能压低成本的技术方案付钱。
这一轮融资的时间点选得有点巧——正好是OpenAI官宣Jalapeño芯片之后没几天。两件事摆在一起看,像是一场关于”AI推理成本到底该怎么降”的公开辩论。OpenAI选了最难的路(自己做芯片),Sail选了最快落地的路(软件优化)。两条路都能走通,但受益的客户群不太一样:超大规模云厂商有能力做定制芯片,普通企业只能靠软件层省成本。
发表回复