刚刚,DeepSeek能看懂猫片了!腾讯混元加持

1,015次阅读
没有评论

刚刚,DeepSeek能看懂猫片了!腾讯混元加持

免费无限用

白交 发自 凹非寺

量子位 | 公众号 QbitAI

DeepSeek能看懂图片了!

今天,腾讯AI助手“腾讯元宝”再次上新——

所接入的DeepSeek能够理解图片信息了。在此之前,DeepSeek主要支持扫描图片中的文字。

刚刚,DeepSeek能看懂猫片了!腾讯混元加持

虽然DeepSeek不能读懂图,但现在腾讯元宝里的DeepSeek可以!

比如看看这张猫片~

刚刚,DeepSeek能看懂猫片了!腾讯混元加持

这张白猫特效做出来的图,被它解读出了三个艺术层次(Doge):最终形成令人会心一笑的视觉童话

刚刚,DeepSeek能看懂猫片了!腾讯混元加持

不错不错,再识别一下这只凶神恶煞擅长PUA的猫头鹰Duo呢。

结果元宝成功读取到了这是多邻国的界面,然后具体到每个文字、图标都给出了正确的释义。

刚刚,DeepSeek能看懂猫片了!腾讯混元加持

据介绍,这项功能结合了混元的多模态理解(读图)能力。今后用户发送任意图片,元宝都能结合图片内容给出自己的分析和理解。

使用方式很简单,依旧是选取DeepSeek「深度思考」模式,但不要选择「联网搜索」。如果看到上传图片的位置从“图片识文字”变成了“图片”,就说明已经是能看懂照片的DeepSeek了。

刚刚,DeepSeek能看懂猫片了!腾讯混元加持

话不多说,实测这就走起~

DeepSeek能看懂猫片了

首先来试试基本的看图说话,单纯测试大模型的多模态理解能力。

比如这只躺着的白猫,不知道它在干嘛,把这张图扔给元宝。它给出的答案是:

刚刚,DeepSeek能看懂猫片了!腾讯混元加持

它首先细致地描绘出了猫的状态——液体版的放松姿态,微微抬起的脑袋和专注的眼神,然后判断出这是猫咪感到安心满足的典型表现。最后还描绘了整张照片呈现出来的大致场景。

不错不错,确实是看懂了。

那么再上点难度,在理解的基础上抛出一些问题,让它进一步推理和思考。

比如春晚上跳二人转的宇树机器人,「如果他们的自我意识觉醒,会说哪句话」。

刚刚,DeepSeek能看懂猫片了!腾讯混元加持

它判断出这是机器人在集体跳舞,于是给出了这句话,代表着机械性特征与意识觉醒的双重特点。

我们的舞步是代码的意志,还是觉醒的序曲?

还可以问一些无厘头的,给满是餐桌椅子的图,让它规划一下「有100个人抽烟要怎么排队」。

嗯,这个看似两者*(图跟问题)之间毫无联系的请求,硬是被它给回答出来了——

正儿八经地采用「太极烟圈阵」,包括了动线设计、时间管理以及空气动力学方面方案。

刚刚,DeepSeek能看懂猫片了!腾讯混元加持

回答的最后,它还建议购买场地责任险,毕竟这排烟量够把背景楼宇熏成赛博朋克风滤镜了,(Doge)。

是有点幽默了,DeepSeek。

刚刚,DeepSeek能看懂猫片了!腾讯混元加持

最后,再放上一个此前难倒一大片模型的脑筋急转弯:

如何用其中三个数字加起来等于30?

刚刚,DeepSeek能看懂猫片了!腾讯混元加持

这需要模型理解到图片是台球上面的数字,因此只有将9旋转至6,就有机会实现6+11+13等于30的可能。

来看看它的思考过程:

它已经判断出准确判断出台球上面的数字,常规思路下,四种组合方式都不成立。

刚刚,DeepSeek能看懂猫片了!腾讯混元加持

最终在思考70秒探讨了多种可能性之后,成功回答对了问题!

刚刚,DeepSeek能看懂猫片了!腾讯混元加持

不过在实测过程中也发现一些小问题,比如无法完全做到让DeepSeek「识人」,需要借助图片上的文字或者Prompt

比如扔给它一个《知否》二创解说的截图,它能准确推理出大概是哪一集得情节。

刚刚,DeepSeek能看懂猫片了!腾讯混元加持

而给它一张甄嬛传(没有字幕)的照片,推理停留在了是否是甄嬛传这部剧上面。

刚刚,DeepSeek能看懂猫片了!腾讯混元加持

不过有一说一,这种双模型聚合的方式,确实让腾讯元宝更好用了。

腾讯元宝动作频频

过去十天,腾讯元宝加班加点,迎来一系列迭代和功能更新。

  • 2月13日,腾讯元宝接入Deepseek-R1满血版,同时支持混元和DeepSeek两大模型;
  • 2月17日,腾讯自研的深度思考模型“混元T1”在元宝灰度上线;
  • 2月18日,腾讯紧急调用元宝支持微信搜索,进一步推动更多用户使用DeepSeek;
  • 2月19日,深度思考模型“混元T1”完成全量上线;
  • 2月21日,腾讯元宝再次上新,DeepSeek和混元两大模型均能理解图片信息。

在腾讯元宝,用户可以使用DeepSeek-R1满血版、推理模型混元T1进行深度思考,也可通过DeepSeek-V3、腾讯混元Turbo快速输出答案。

至此,元宝内的所有模型都支持理解图片、解析文件、联网搜公众号,从微信上传文件。

好了,感兴趣的朋友,可以赶紧去试试哦~

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 2 月
 12
3456789
10111213141516
17181920212223
2425262728  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态 量子位的朋友们 2025-...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离...
英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离不开它

英伟达护城河又宽了!低调收购开源算力调度王牌工具,全球过半顶级超算在用,Thinking Machines也离...
是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛

是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛

是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛 一水 2025-12-17 ...
人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态

人车家全生态持续破圈,小米宣布对开发者开放小米MiMo大模型、CarIoT硬件生态 量子位的朋友们 2025-...