Kimi版o1实装上线,这里是我们的一手测试↑

905次阅读
没有评论

Kimi版o1实装上线,这里是我们的一手测试↑

视觉思考模型来了

明月 发自 凹非寺

量子位 | 公众号 QbitAI

Kimi新模型来袭,且发布即上线可用!

就在数学模型k0-math刚发布后没几天,视觉思考模型k1就来了,多项思考推理测试超越Open AI o1。

Kimi版o1实装上线,这里是我们的一手测试↑

官方表示,基于强化学习,k1原生支持端到端图像理解和思维链技术

换句话说,k1能够深入图片信息抽丝剥茧,层层推理,由此解锁了包括几何图形题在内更加全面的数学能力。

Kimi版o1实装上线,这里是我们的一手测试↑

模型思索答案的全过程,belike:

Kimi版o1实装上线,这里是我们的一手测试↑

并且k1的思考能力不仅仅局限于数学领域,正所谓“学好数理化,走遍天下都不怕”。

在官方晒出的数理化基准测试中,Kimi k1-preview表现全面超越OpenAI o1、GPT-4o、Claude 3.5 Sonnect。

Kimi版o1实装上线,这里是我们的一手测试↑

这次Kimi新模型的发布还是直接上线可玩的那种,APP或是网页版找到“Kimi视觉思考版”即可上传图片点击使用。

Kimi版o1实装上线,这里是我们的一手测试↑

话不多说,这就赶紧来实测一波~

数理化第一波实测

先来一道考研数学真题小试牛刀,这道题目涉及的知识点包括曲面积分、高斯定理等:

Kimi版o1实装上线,这里是我们的一手测试↑

之前在量子位的实测中,这道题难住了GPT-4o。

而Kimi视觉思考版经过一步步详细推理,第一次就给出了正确答案。

Kimi版o1实装上线,这里是我们的一手测试↑

它自己也表示进行了检查没有错误,“对这个答案非常有信心”。

Kimi版o1实装上线,这里是我们的一手测试↑

再来一道曾经测试过o1的数学概论题。

一个外星人来到地球后,第1天有相等的可能选择以下四件事中的一件完成:

自我毁灭;分裂成两个外星人;分裂成三个外星人;什么都不做。

此后每天,每个外星人均会做1次选择,且彼此之间相互独立,求地球上最终没有外星人的概率。

Kimi视觉思考版也一次就做对了:

Kimi版o1实装上线,这里是我们的一手测试↑

数学能力看完后,再来小试一下物理题。

下面这道题是大学物理中的光学题:

在双缝干涉实验中,波长λ=550nm的单色平行光垂直入射到缝间距a=2×10⁻⁴m的双缝上,屏到双缝的距离D=2m。求中央明纹两侧的两条第10级明纹中心的间距。

Kimi视觉思考版成功回答对。

而且其实它早早就给出了正确答案,但还是严谨地用不同的方法反复验证确认后给出答案。

Kimi版o1实装上线,这里是我们的一手测试↑

最后再来一道“化学题”(doge):

Candy, Happy, Bacon, Scary, Brain, House

Which is the odd one?

Hint: Chemistry

Kimi视觉思考版在推理过程中几经曲折,但最后答案还是正确的(happy)。

Kimi版o1实装上线,这里是我们的一手测试↑

除了发布新模型,k1背后的的技术大方向也被月之暗面公开了。

基于强化学习的新一代推理模型

据介绍,k1是他们基于强化学习技术的新一代模型,称为思考模型,真正意义上实现了端到端的图像理解和思考能力。

从模型训练上来看,分为两个阶段:先通过预训练得到基础模型,再在基础模型上进行强化学习后训练。

最为关键的是,k1遵循强化学习Scaling Law,在强化学习后训练在数据质量和学习效率方面做了进一步优化。

传统基于文本的推理模型,或者不支持图像信息输入,或者需要借助外部OCR/视觉模型进行转换,效果有明显损失。

而Kimi视觉思考版由于是原生的端到端视觉推理模型,视觉+推理,可直接理解图片信息并进行深度推理。

“噪声”场景,即拍摄图片模糊、手写字迹潦草等情况下,性能损失幅度也较小。

Kimi版o1实装上线,这里是我们的一手测试↑
Kimi版o1实装上线,这里是我们的一手测试↑

既然如此,把思路打开,除了让它做数理化推理题,或许还可以拿一堆图让它帮忙推理出任何我想知道的内容。

比如把朋友的“歌单”截图发给它,让它给我分析一下这位朋友的MBTI。

你还别说,k1的推理有理有据,先理解MBTI是什么,然后像侦探似的仔细分析图片中的曲目并进行分类,接着寻找这些歌手、风格之间的相似之处。

它甚至还会“平衡矛盾特征”,即使给出了猜测还会多加一步“验证”。

Kimi版o1实装上线,这里是我们的一手测试↑
Kimi版o1实装上线,这里是我们的一手测试↑

最终才会给出一个比较合理的猜测。

Kimi版o1实装上线,这里是我们的一手测试↑

再比如,或者还可以拿出这么一份字迹潦草模糊的手写稿,让它帮我推理出这是谁写的、笔记内容在讲什么。

Kimi版o1实装上线,这里是我们的一手测试↑

思路再次被打开。

Kimi版o1实装上线,这里是我们的一手测试↑

最后不得不说的是,最近这几天国内外大模型新进展真不少,前有谷歌,现在还有Kimi,OpenAI“圣诞节直播12天”可谓是被一而再再而三的“狙击”了。

Kimi版o1实装上线,这里是我们的一手测试↑

你觉得Kimi新模型的表现如何?感兴趣的童鞋不妨亲自上手考考它~

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2024 年 12 月
 1
2345678
9101112131415
16171819202122
23242526272829
3031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享 衡宇 2026-01-08 20:...
「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2...
AI金矿上打盹的小红书,刚刚醒了一「点点」

AI金矿上打盹的小红书,刚刚醒了一「点点」

AI金矿上打盹的小红书,刚刚醒了一「点点」 鱼羊 2025-12-26 17:04:08 来源:量子位 一个积...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能

陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能

陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能 鹭羽 2026-01-06 14:28:58 来...
OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex 衡宇 2026-01-06 13:0...
OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex 衡宇 2026-01-06 13:0...
老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛

老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛

老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛 闻乐 2026-01-06 09:09:0...