给AI模型排座次的Arena，只用了8个月就跑出了1亿美元营收

作者：

hiyoho

在

AI资讯

从伯克利走廊到1亿美元营收

如果你最近在关注AI大模型，大概率见过那个叫Arena的排行榜——让两个匿名模型PK，用户投票决定谁更强。这个几乎被所有人引用的AI排行榜，现在不只是学术项目了。

Arena在2023年起源于UC Berkeley的一个研究项目，靠着超过1000万次用户评估，攒出了业内最受关注的AI模型性能排行榜。但很多人不知道的是，这家公司现在已经是个年营收运转率1亿美元的生意了。

从去年9月推出商业服务算起，只用了8个月。

“大家还以为我们是开源项目”

Arena的CEO Anastasios Angelopoulos说了一句话挺有意思：”很多人甚至不知道我们在赚钱，大家还是把我们当开源项目看。”

这话不假。直到今天，Arena的AI模型排行榜对公众依然是免费的，真正买单的是那些需要深度性能分析的模型厂商和企业客户。去年9月，Arena推出了”AI Evaluations”服务，面向模型实验室和企业提供从社区收集的深度性能分析。

Arena的联合创始人兼CEO Anastasios Angelopoulos：”很多人甚至不知道我们在赚钱，大家还是当我们是开源项目看。”

这个服务的增长速度快得离谱。今年1月Arena完成1.5亿美元A轮融资、估值17亿美元的时候，年化营收才3000万美元；现在，仅仅5个月后，已经跑到了1亿美元。

不过Angelopoulos也澄清了一件事：Arena说的”ARR”其实不是真正意义上会重复的收入，因为他们是按”消耗量”收费的，不是订阅制。这在这个年头的AI创业公司里倒也不稀奇——不少公司为了把数字做好看，会把所有能年化的值都叫ARR。

抢的是人工标注公司的饭碗

Arena的竞争对手不是另一个排行榜。Angelopoulos说，他们抢的是和Mercor、Surge、Scale AI这些人工标注公司”同一笔预算”。

这些公司的业务是在模型后训练阶段帮AI公司做人工精调，而Arena的思路是用大规模用户评估来替代部分人工标注。这个赛道现在热得发烫：

Mercor的年化营收今年早些时候已经突破了10亿美元，比去年9月的5亿翻了一倍
Handshake的AI训练相关业务年化营收从1月的5.5亿涨到了近10亿
AI公司对后训练优化服务的需求还在持续飙升

Arena的排行榜覆盖了文本、编程、视觉、图像生成，以及最近推出的Agent Mode——评估模型在复杂长流程任务里的表现。但对模型厂商来说，Arena的价值不止是排行榜本身：在这个平台上，他们能拿到早期用户对新模型的反馈，有时候甚至能在模型正式发布前就拿到外部评估数据。

Databricks联合创始人坐镇

这家公司的创始团队也挺能打。除了CEO Angelopoulos和CTO Wei-Lin Chiang（两人都是UC Berkeley的博士后），还有一位联合创始人是Ion Stoica——就是那个Databricks的联合创始人、UC Berkeley的著名教授。Stoica在2025年4月Arena正式注册为公司之前，一直以顾问身份参与项目。

目前Arena总共融了2.5亿美元，投资方包括Felicis、a16z、Kleiner Perkins、Lightspeed等。考虑到现在AI基础设施和评估工具的需求还在疯涨，这个数字可能还会继续往上走。

📎 原文来源：Arena, the AI leaderboard everyone uses, is now a $100M business — TechCrunch

AI AI模型 AI研究

给AI模型排座次的Arena，只用了8个月就跑出了1亿美元营收

从伯克利走廊到1亿美元营收

“大家还以为我们是开源项目”

抢的是人工标注公司的饭碗

Databricks联合创始人坐镇

评论

发表回复 取消回复

更多文章

Adobe把Topaz Labs收了，AI图像视频增强能力直接吞进来

Gemini个性化图像生成向美国用户免费开放，7.5亿人都在用

Agent-Reach：给AI Agent一键装上互联网能力，44.1K+ Stars让Agent自由访问Twitter/Reddit/YouTube等10+平台

Cursor推出移动端APP，编程智能体装进了口袋

发表回复取消回复