给AI打个分,结果搞出17亿估值独角兽???

128次阅读
没有评论

AI打个分,结果搞出17亿估值独角兽???

「匿名对战」出圈了

闻乐 发自 凹非寺

量子位 | 公众号 QbitAI

大模型竞技场LMArena官宣拿下1.5亿美元A轮融资。

估值升至17亿美元,妥妥的新年开门红!

给AI打个分,结果搞出17亿估值独角兽???

这波融资由Felicis和加州大学投资公司UC Investments领投,Andreessen Horowitz、The House Fund等机构跟投。

资本用真金白银投票,足以见得AI时代大模型评估这个赛道有多香~

而这支90后华人含量99%团队的走红之路,还得从2023年ChatGPT横空出世后说起。

从学术探索到商业崛起

LMArena的前身是曾经火爆AI圈的Chatbot Arena,最早由LMSYS这个自发的开源组织创建。

组织的核心成员全是来自UC伯克利、斯坦福、UCSD、CMU等顶尖高校的学霸。

他们的开源推理引擎SGLang在业内首次实现了在96块H100上跑出几乎媲美DeepSeek官方报告吞吐量的开源方案。

目前SGLang已经实现大规模部署,被xAI、英伟达、AMD、谷歌云、甲骨文云、阿里云、美团、腾讯云等企业和机构采用。

不过,比起硬核技术,他们最主要也更出圈的工作是对大模型进行评估

在ChatGPTClaude一众模型刚刚面世之际,他们率先创办了Chatbot Arena这么一个第三方众包基准测评平台。

LMSYS的创办人之一、SGLang主导者郑怜悯曾对我们透露,当时之所以创建Chatbot Arena,是因为他们自己训练了小羊驼Vicuna的开源模型。

给AI打个分,结果搞出17亿估值独角兽???

当时他们觉得自己模型还不错,但市面上已有的各种基准测试很难真正区分出模型是“真好”还是“假好”。

团队认为,评估模型最好的方式就是将其放到网上,让用户试用并投票。于是乎他们就搞了个众包测试平台Chatbot Arena,通过实际的用户交互来评估模型性能。

结果没想到的是后来Chatbot Arena已独立成一家公司,而小羊驼Vicuna等大模型的研发已经停滞。

给AI打个分,结果搞出17亿估值独角兽???

早期的Chatbot Arena搞的是双盲测试,让用户在不知道模型身份的情况下盲选最优回答,这种模式吸引了大量AI爱好者来打卡。

后来,全球各地一有新模型更新都会在里面偷偷测一把,Chatbot Arena逐渐成为模型测评首选的排行榜。

这样的影响力让Chatbot Arena在AI领域崭露头角,获得资本市场的认可。

它独立出来成为一家商业公司lmarena.ai,专注于AI模型评估。

2025年5月,被曝获种子轮1亿美元投资,估值达到6亿美元。

动态竞技场

lmarena.ai的主要项目就是如今全球大模型的动态竞技场LMArena。

给AI打个分,结果搞出17亿估值独角兽???

核心评估规则围绕匿名对战、Elo式评分和人机协同框架展开,方式也比较有意思。

用户只要输入问题,系统就会随机匹配两个模型来做匿名回答。

这时候大家不用管模型是谁,只需要根据回答的好坏投票选出更优的那个,系统在投完票之后才会揭晓模型的真实身份。

在评分上,平台基于Bradley–Terry模型设计了Elo评分机制,每个模型都有初始分数,赢了就加分,输了就扣分,随着对战次数越来越多,分数会慢慢稳定下来,最终形成实时更新的排行榜。

除此之外,平台还采用了人机协同的评估模式,用人类的真实投票来反映大家对模型的偏好,再通过算法去平衡各个模型的出场次数、任务类型和样本分布,避免有的模型因为曝光多就被高估,或者因为曝光少就被低估,确保整个评估过程公平客观。

就这样,LMArena成了各家新模型“出道”时的必测榜单。当前Gemini 3 Pro以1490分位居榜首。

给AI打个分,结果搞出17亿估值独角兽???

去年拿到1亿美元种子轮融资后,LMArena的发展迅速超出预期。

在短时间内不仅累计了涵盖文本、视觉、网络开发等跨模态的5000万张投票,完成了400余种开放及专有模型的评估,还产出了覆盖文本、多模态、专家及职业等多个类别的14.5万个开源战斗数据点。

现在,LMArena计划将新筹集的资金用于平台运营,确保平台稳定且高效运行,提升用户体验。同时扩大技术团队,为平台发展注入更多专业技术力量。

参考链接:https://news.lmarena.ai/series-a/

— 完 —

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2026 年 1 月
 1234
567891011
12131415161718
19202122232425
262728293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享 衡宇 2026-01-08 20:...
「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2...
开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!

开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!

开源“裸考”真实世界,国产具身智能基座模型拿下全球第二! 西风 2026-01-08 19:02:20 来源:...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex 衡宇 2026-01-06 13:0...
杜比在CES 2026重塑了观影、娱乐的方式

杜比在CES 2026重塑了观影、娱乐的方式

杜比在CES 2026重塑了观影、娱乐的方式 十三 2026-01-07 12:47:06 来源:量子位 树立...
全自主、更好用!北京人形 “干活机器人” 惊艳亮相 CES2026

全自主、更好用!北京人形 “干活机器人” 惊艳亮相 CES2026

全自主、更好用!北京人形 “干活机器人” 惊艳亮相 CES2026 量子位的朋友们 2026-01-06 16...
港科大教授实测AI眼镜“作弊”:30分钟碾压95%的学生,把传统教学评估体系整破防了

港科大教授实测AI眼镜“作弊”:30分钟碾压95%的学生,把传统教学评估体系整破防了

港科大教授实测AI眼镜“作弊”:30分钟碾压95%的学生,把传统教学评估体系整破防了 梦瑶 2026-01-0...