人人都在建AI数据中心,但这家小公司说「我能让你快三个月上线」

AI热潮起来之后,干什么的都想搭个数据中心。GPU有了、交换机有了、存储也有了,结果卡在最后一步——怎么把这一堆硬件变成能对外提供AI训练和推理服务的云平台。搞网络配置、搞多租户隔离、搞自动化运维,没几个月搞不定。而这几个月里,成百上千张GPU就那么闲着,烧钱不产出。

AI数据中心网络自动化
AI新云的网络自动化,是个被忽视但极其痛的问题(图:Netris)

网络配置这件「苦差事」,终于有人做了自动化

Netris做的是AI数据中心里的网络自动化。它的软件跑在网络交换机上,把原本需要工程师手动配置的成千上万个交换机参数,变成自动化的流程。新云(neocloud)运营商用它,可以把上线时间从几个月压缩到几周。

CEO Alex Saroyan说了一句话挺有意思:传统数据中心的SDN(软件定义网络)在AI时代不够用了,因为AI的流量太大,必须硬件加速。Netris做的就是这个——「像SDN一样灵活,但是完全硬件加速」。

「对于AI,软件是不够的,因为流量太大了,一切都必须硬件加速。你需要一个像SDN一样的东西,但是完全硬件加速的。这就是我们做的,而且我们已经做了八年。」——Netris CEO Alex Saroyan

英伟达也在帮它介绍客户

两年前,Netris给英伟达做了一次技术演示,后者印象深刻,开始主动把客户推荐给Netris。目前Netris已经在全球35个GPU集群上线,总共约100万张GPU,客户包括Lightning AI、富士康、HPE、TensorWave、加拿大电信Telus等。

它的平台是供应商中立的,同时支持英伟达和AMD的服务器网络标准。这一点很关键——现在AI芯片除了英伟达,AMD、自研芯片都在冒头,新云运营商不希望被绑死在一个硬件生态里。

a16z为什么投?

这一轮1500万美元A轮,领投方是a16z。合伙人Guido Appenzeller加入董事会。逻辑其实很清楚:AI新云越多,网络自动化的需求就越大。而这块以前是被大厂(微软、谷歌、AWS)自己搞定的,它们有工程师团队写自动化工具。但新云创业公司没这个资源,只能买。

Netris特别强调一点:它们没有用AI来做网络配置。Saroyan说AI是非确定性的,有时候会「自己搞事情」,改几千个交换机配置这种事不需要创意,需要的是稳定和可重复。所以Netris用的是传统算法。

「AI是非确定性的,对吧?有时候它喜欢自己搞事情。创意工作不错,但是改几千个交换机配置,你不需要有创意,你需要非常稳定和可重复。」——Alex Saroyan

钱往哪里花?

融资完成后,Netris要招更多工程师和销售人员,增加对更多硬件厂商的支持,同时继续完善它的核心算法。这个赛道目前还没有特别大的竞争对手,但随着AI新云越来越多,迟早会有大厂盯上这块。


📎 原文来源:TechCrunch – Netris raises $15M Series A from a16z to help AI neoclouds go live faster

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注