智源研究院提出SegGPT: 一个用于分割上下文中所有事物的通用模型

935次阅读
没有评论

标题:SegGPT: Segmenting Everything In Context

作者:Xinlong WangXiaosong ZhangYue CaoWen WangChunhua ShenTiejun Huang

[Beijing Academy of Artificial Intelligence& Zhejiang University & Peking University]

简介:

我们提出了SegGPT,一个用于分割上下文中所有事物的通用模型。我们将各种分割任务统一到一个通用的上下文学习框架中,通过将不同类型的分割数据转化为相同的图像格式,来容纳这些数据。SegGPT的训练被表述为一个上下文中的着色问题,每个数据样本都有随机的颜色映射。其目的是根据上下文完成不同的任务,而不是依赖特定的颜色。

经过训练,SegGPT可以通过上下文推理在图像或视频中执行任意的分割任务,如物体实例、东西、部分、轮廓和文本。SegGPT在广泛的任务中进行了评估,包括少数照片的语义分割、视频物体分割、语义分割和全景分割。我们的结果显示,在对域内和域外目标进行分割时,无论从质量上还是从数量上都有很强的能力。

https://arxiv.org/pdf/2304.03284.pdf

智源研究院提出SegGPT: 一个用于分割上下文中所有事物的通用模型

智源研究院提出SegGPT: 一个用于分割上下文中所有事物的通用模型

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy