吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

754次阅读
没有评论

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

目前人人免费可玩

刚刚,AI大牛吴恩达官宣创业公司新成果——Agentic Object Detection(Agent目标检测)。

无需标注训练数据,模型仅通过推理就能在图片中定位指定物体。

举个栗子,在一张长满草莓的图片中,提示词为“未成熟的草莓”,AI模型立马分分钟帮你找出。

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

据吴恩达介绍,以前视觉AI要想识别物体,需要在大量标注数据上训练,而现在AI只需瞥一眼图片,短暂思考后(当前约20~30s)就能立刻输出正确内容。

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

通过推理实现零样本标记的方法也令一众网友感到兴奋,未来应用潜力巨大。

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测
吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

目前这个AI工具人人免费可玩(也为开发者提供了API),仅过去几小时,一大波网友试玩已新鲜出炉~

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

网友疯狂试玩ing

还是先来看下吴恩达的详细介绍。

在他看来,Agentic Object Detection改变了目标检测的工作流程

传统视觉AI的目标检测,通常需要绘制大量边框来标注数据,然后在神经网络上训练。

而现在,新的AI系统将耗时耗力的标注过程省略了。它将感知规划行动等都糅合在一起,通过调用一系列工具,以及对任务长度进行推理,最终实现了零样本标记输入输出。

按他的说法,这就好比“睁眼版”o1和DeepSeek R1,看一眼,然后立即思考作答。

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

介绍过程中,除了一开始提到的草莓识别,他还展示了其他几个demo(请大家来找茬doge)。

planes with two engines(带两个引擎的飞机)

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

再比如在超市货架上找出某品牌的麦片。

Kellogg’s branded cerea

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

当然更实用的场景是,假如在家里翻箱倒柜找不着东西了,召唤它来帮忙(妈妈:别整天妈妈妈)。

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

除此之外,网友们也开始集体交作业,整体看下来大部分都成功了

简单的有,找出板球运动中的击球手(batsman)。

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

或者检测出特定程序项目。

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

再比如找出航拍视角下的荒漠绿植。

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

当然,还有类似下面这样的日常生活。AI成功找到了一大盘食物中的寿司,不过在找货架上的汽水时,网友反馈只有详细到芬达这个品牌名才有可能成功,单纯提示“汽水”nonono。

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

更难的有,分别识别出美式足球中的攻守两方队员(上下验证能对得上)。

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测
吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

甚至也能快速找出非常迷你的飞镖。

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

不过,也有网友分享了少部分翻车案例。

同一张图,当网友试图找出戴帽子的人,AI明显漏了,一眼就能看到23号队员。

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

而且也无法识别图中的矩形。(地面,看看我)

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

经网友总结,显然Agentic Object Detection对一些常见问题(如遮挡、光线过曝等)还无法良好适应。

正如我们前面提到的草莓,有火眼金睛的网友发现,AI误将一个光线不佳的成熟草莓识别为“未成熟”。

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

不过吴恩达也早已提到,目前这个还只是初步尝试,检测质量、回答速度等后续还会进行优化。

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

出自吴恩达第二个创业项目

众所周知,吴恩达从2017年离开百度后(百度前首席科学家)便投身AI创业。

目前已知的人工智能项目有3个。

2017年6月,他官宣了第一个创业项目Deeplearning.ai,主要和教育相关(他目前还是斯坦福大学CS客座教授)。

这是一个AI在线教育平台,通过提供深度学习课程和资源,帮助人们学习AI技术

在这之后,他又推出了第二个创业项目Landing.ai,专注于帮助企业实现人工智能转型。

从当时的介绍来看,其目标是通过AI技术提升企业效率,解决制造业中的痛点问题。例如提高生产效率、优化供应链管理、减少浪费等。

后来Landing.ai还和富士康等企业建立了战略合作关系,共同开发AI技术、人才和系统。

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

而这一次的Agentic Object Detection,从官宣视频来看即是出自该项目。

这也透露了,这一新工具大概率也是面向B端应用。

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

也几乎是同时,他在2018年成立了第三个创业项目AI Fund,显然这是一家专注于投资人工智能初创企业的投资基金。

当时资金规模达到1.75亿美元,投资者包括NEA(New Enterprise Associates)、红杉和软银等一众知名机构。

而近来,他更是对Agent智能体押下重注。

早在去年年初,他曾通过Deeplearning.ai平台预言:

超越下一代基础模型,Agent工作流将推动AI巨大进步。

当时他就提到,就像大语言模型(LLMs)在零样本模式下工作(提示模型逐个生成最终输出token,而不修改其工作),Agent在执行一系列步骤(如规划、执行、反思等)后可能比单次产生更好的效果。

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

现在,是时候逐步检验一系列新成果了。

所以,你能想到这项技术还有哪些潜在应用吗?

(发出网友同款疑问)

吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测

在线试玩:
https://va.landing.ai/demo/agentic-od

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 2 月
 12
3456789
10111213141516
17181920212223
2425262728  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026 量子位的朋友...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 量子位的朋友们 2025-12-20 13:06:52 来源:量...
奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板? 量子位的朋友们 2025-12-20 20:49:32 来源:量子位 谁能带来更...
奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板?

奥迪+华为=油车智能天花板? 量子位的朋友们 2025-12-20 22:09:18 来源:量子位 2025年...
库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山

库克提拔复旦校友掌舵苹果基础模型!庞若鸣走后涨薪止血,谷歌旧部占据半壁江山 衡宇 2025-12-21 10:...
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026

清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026 Jay 2025...