给AI模型排座次的Arena,只用了8个月就跑出了1亿美元营收

从伯克利走廊到1亿美元营收

如果你最近在关注AI大模型,大概率见过那个叫Arena的排行榜——让两个匿名模型PK,用户投票决定谁更强。这个几乎被所有人引用的AI排行榜,现在不只是学术项目了。

Arena在2023年起源于UC Berkeley的一个研究项目,靠着超过1000万次用户评估,攒出了业内最受关注的AI模型性能排行榜。但很多人不知道的是,这家公司现在已经是个年营收运转率1亿美元的生意了。

从去年9月推出商业服务算起,只用了8个月。

Arena AI排行榜平台概念图
Arena AI排行榜已成为行业标杆

“大家还以为我们是开源项目”

Arena的CEO Anastasios Angelopoulos说了一句话挺有意思:”很多人甚至不知道我们在赚钱,大家还是把我们当开源项目看。”

这话不假。直到今天,Arena的AI模型排行榜对公众依然是免费的,真正买单的是那些需要深度性能分析的模型厂商和企业客户。去年9月,Arena推出了”AI Evaluations”服务,面向模型实验室和企业提供从社区收集的深度性能分析。

Arena的联合创始人兼CEO Anastasios Angelopoulos:”很多人甚至不知道我们在赚钱,大家还是当我们是开源项目看。”

这个服务的增长速度快得离谱。今年1月Arena完成1.5亿美元A轮融资、估值17亿美元的时候,年化营收才3000万美元;现在,仅仅5个月后,已经跑到了1亿美元。

不过Angelopoulos也澄清了一件事:Arena说的”ARR”其实不是真正意义上会重复的收入,因为他们是按”消耗量”收费的,不是订阅制。这在这个年头的AI创业公司里倒也不稀奇——不少公司为了把数字做好看,会把所有能年化的值都叫ARR。

抢的是人工标注公司的饭碗

Arena的竞争对手不是另一个排行榜。Angelopoulos说,他们抢的是和Mercor、Surge、Scale AI这些人工标注公司”同一笔预算”。

这些公司的业务是在模型后训练阶段帮AI公司做人工精调,而Arena的思路是用大规模用户评估来替代部分人工标注。这个赛道现在热得发烫:

  • Mercor的年化营收今年早些时候已经突破了10亿美元,比去年9月的5亿翻了一倍
  • Handshake的AI训练相关业务年化营收从1月的5.5亿涨到了近10亿
  • AI公司对后训练优化服务的需求还在持续飙升

Arena的排行榜覆盖了文本、编程、视觉、图像生成,以及最近推出的Agent Mode——评估模型在复杂长流程任务里的表现。但对模型厂商来说,Arena的价值不止是排行榜本身:在这个平台上,他们能拿到早期用户对新模型的反馈,有时候甚至能在模型正式发布前就拿到外部评估数据。


Databricks联合创始人坐镇

这家公司的创始团队也挺能打。除了CEO Angelopoulos和CTO Wei-Lin Chiang(两人都是UC Berkeley的博士后),还有一位联合创始人是Ion Stoica——就是那个Databricks的联合创始人、UC Berkeley的著名教授。Stoica在2025年4月Arena正式注册为公司之前,一直以顾问身份参与项目。

目前Arena总共融了2.5亿美元,投资方包括Felicis、a16z、Kleiner Perkins、Lightspeed等。考虑到现在AI基础设施和评估工具的需求还在疯涨,这个数字可能还会继续往上走。

📎 原文来源:Arena, the AI leaderboard everyone uses, is now a $100M business — TechCrunch

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注