大模型终于通关《宝可梦蓝》!网友:Gemini 2.5 Pro酷爆了

682次阅读
没有评论

大模型终于通关《宝可梦蓝》!网友:Gemini 2.5 Pro酷爆了

首个大模型宝可梦联盟冠军

鱼羊 发自 凹非寺

量子位 | 公众号 QbitAI

就在刚刚,Gemini 2.5 Pro在直播中通关了《宝可梦蓝》!

谷歌CEO劈柴哥第一时间兴奋官宣,放出通关时刻珍贵影像:

大模型终于通关《宝可梦蓝》!网友:Gemini 2.5 Pro酷爆了

大模型这一小步,把网友们也整嗨了。

大模型终于通关《宝可梦蓝》!网友:Gemini 2.5 Pro酷爆了

满屏画风皆是:泰!酷!辣!

这回,Gemini的自我介绍里可以多一条了:首个成为宝可梦联盟冠军、登入《宝可梦蓝》名人堂的大模型。(doge)

大模型终于通关《宝可梦蓝》!网友:Gemini 2.5 Pro酷爆了
大模型终于通关《宝可梦蓝》!网友:Gemini 2.5 Pro酷爆了

要知道,一年前的旧模Claude 3.5还只能勉强走出新手村到达常磐森林,2个月前,Claude 3.7倒是终于能击败道馆主了,但也并未通关宝可梦。

Gemini 2.5 Pro通关宝可梦

游戏已通关,但直播仍继续。

画面是酱婶的:

大模型终于通关《宝可梦蓝》!网友:Gemini 2.5 Pro酷爆了

有一说一,过程看上去是有那么点无聊,因为每动一步Gemini都要深思熟虑……

左边的文本框里显示了Gemini每个行动背后的详细思考过程。

在上面这个片段中,Gemini的主要目标是探索华蓝洞穴,寻找和捕获超梦。

直播中可以看到,在完成了一长串行动,走到了目标位置之后,Gemini 2.5 Pro足足思考了40多秒,消耗76011个token,才开启下一步的行动规划。

大模型终于通关《宝可梦蓝》!网友:Gemini 2.5 Pro酷爆了

(因为有点迷路,Gemini后面还想了很久很久……)

不过从这些思考过程中,可以清晰地看到大模型是怎么理解宝可梦游戏的。

总结起来,Gemini玩宝可梦的基本步骤如下:

  1. 截取屏幕截图并检索游戏状态数据
  2. 用网格覆盖处理图像,以辅助空间推理
  3. 将屏幕截图和游戏信息发送给模型
  4. AI决定是直接响应还是调用专门的智能体
  5. 解析响应内容,以确定按下哪个按钮
  6. 执行按钮按下操作,并等待游戏更新
  7. 对下一帧重复该过程

如果你对Gemini的宝可梦直播感兴趣,可以在twitch上搜索“gemini plays pokemon”,传送门我们也会在文末奉上~

宝可梦难在哪儿?

尽管已经是联盟冠军,但可以看出的是,在宝可梦这样一款最初主要面向儿童和青少年推出的游戏中,大模型的表现明显不如人类(经常一整个大迷路什么的……)

参照Claude Plays Pokémon项目研究人员的说法,这主要是因为大模型“视力不佳”。

以Claude为例,模型很难像人类一样去解读Game Boy屏幕里展现出的低分辨率、像素化的世界。

同时,游戏中的二维地图看上去对未经专门训练的大模型而言也充满挑战性。

我们很容易理解(游戏中)的建筑物就是建筑物,是无法穿过的。

这对Claude来说却相当有挑战性。

大模型终于通关《宝可梦蓝》!网友:Gemini 2.5 Pro酷爆了

△图源:Anthropic

另外,模型上下文的限制也影响了它们在游戏中的表现。

不过,在游戏中偏文本的部分,此前Claude就已经有惊艳表现。

比如,在宝可梦对战中,当游戏提示电属性宝可梦的攻击对岩石属性对手“效果不佳”时,Claude能马上get到其中的意思,并在此后将这些知识整合到自己的战斗策略里。

大模型终于通关《宝可梦蓝》!网友:Gemini 2.5 Pro酷爆了

现在,谷歌率先实现了新的突破,并表示还将在这个有趣的挑战中进行更多探索(直播将至少持续数天)。

或许真的像网友所说:

以后测试大模型的基准要变成谁能更快通关宝可梦了。

大模型终于通关《宝可梦蓝》!网友:Gemini 2.5 Pro酷爆了

直播地址:
https://www.twitch.tv/gemini_plays_pokemon

参考链接:
[1]https://x.com/sundarpichai/status/1918455766542930004
[2]https://arstechnica.com/ai/2025/03/why-anthropics-claude-still-hasnt-beaten-pokemon/

— 完 —

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 5 月
 1234
567891011
12131415161718
19202122232425
262728293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了

企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了

企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了 衡宇 2025-12-16 20:10:53 来...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026

小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026

小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026 克雷西 2025-...
顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式

顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式

顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式 思邈 2025-12-16 10:24:0...
PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026

PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026

PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026 梦瑶 2025-12...
Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控

Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控

Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控 量子位的朋友们 2025-12-16...
推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码

推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码

推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码 henry 2025-12-16 15:03:31 ...