标签: AI排行榜

  • 那个人人都看的AI排行榜,现在一年能赚1亿美元

    如果你最近半年关注过AI大模型,大概率见过那个叫Arena的排行榜。用户同时跟两个匿名模型对话,然后投票哪个回答更好——这套众包评测机制,现在居然长成了一个年营收1亿美元的生意。

    Arena的起源是UC Berkeley 2023年的一个研究项目,今年4月才正式注册为公司。但就在商业化服务上线仅仅8个月之后,它的年化营收跑到了1亿美元。CEO Anastasios Angelopoulos说,很多人到现在还以为他们是个开源项目,根本不知道已经在赚钱了。

    AI模型排行榜Arena
    Arena AI模型排行榜已成1亿美元生意(概念图)

    免费排行榜只是入口,真正的钱在别处

    Arena最广为人知的产品是那个公共排行榜,任何人都可以去给两个匿名模型投票,累计超过1000万次用户评估之后,形成一个动态更新的模型排名。这个排行榜是免费的,钱从哪里赚?

    答案是去年9月推出的”AI Evaluations”服务。模型开发公司和企业在推出新模型之前,可以用Arena的平台做深度性能分析——这些数据来自真实的用户评估,比自己跑 benchmark 更有参考价值。简单说,Arena把众包评判做成了卖给模型实验室的企业服务。

    “很多人甚至不知道我们在赚钱,大家还是把我们看成一个开源项目。”——Arena联合创始人兼CEO Anastasios Angelopoulos

    没有直接对手,但战场不小

    Angelopoulos说Arena没有直接的竞争对手——另一家做众包模型评选的创业公司Yupp已经在今年3月关闭了。但Arena跟一批人力标注公司(Mercor、Surge、Scale AI)在争同一笔预算,这些公司的业务是在后训练阶段帮模型厂商精炼AI。

    这个市场的增长很猛。据The Information报道,Mercor的年化营收今年早些时候突破了10亿美元,比去年9月的5亿翻了一倍。Handshake的AI训练相关业务年化营收也从5.5亿涨到了接近10亿。Arena能在8个月里跑到1亿,说明这条赛道确实在爆发。


    伯克利基因,1.7亿估值

    Arena的三位联合创始人都是UC Berkeley出来的。除了CEO Angelopoulos和CTO Wei-Lin Chiang,还有一位名叫Ion Stoica的联合创始人——这个人同时也是Databricks的联合创始人,在伯克利当教授,在硅谷是个很有分量的人物。

    今年1月,Arena完成了1.5亿美元A轮融资,投后估值17亿美元。当时它的年化营收是3000万美元。8个月之后营收跑到1亿,增速确实惊人。总融资额到现在是2.5亿美元,投资方包括Felicis、a16z、Kleiner Perkins、Lightspeed等一线机构。

    不过有一个细节值得注意:Arena说的”年化营收”其实是按使用量收费的,不是真正意义上的递归收入。Angelopoulos自己澄清了这一点。在AI创业公司里,把消费额折算成”ARR”来讲故事已经是个比较普遍的操作,但投资人怎么看这个数字,就是另一回事了。

    排行榜还能做什么

    Arena现在除了文本、代码、视觉、图像生成这些常规评测,最近还上线了”Agent Mode”——评测模型在长时间、多步骤任务里的表现。这块是现在大模型竞争的新焦点,OpenAI、Anthropic、Google都在推自己的agent能力,有独立的第三方评测,对大家都值钱。

    从研究项目到1亿美元生意,Arena只用了不到三年。接下来能不能把”消费制”收入做成真正的订阅制,能不能在模型公司自己的评测能力越来越强的情况下保持独立价值,这些是Arena要回答的下一个问题。