美团视觉GPU推理服务部署架构优化实践

1,072次阅读
没有评论

面对在线推理服务使用的GPU资源不断增加、GPU利用率普遍较低的挑战,美团视觉研发团队决定通过模型结构拆分和微服务化进行优化,他们提出一种通用高效的部署架构,来解决这种常见的性能瓶颈问题。以“图像检测+分类”服务为例,优化后的服务压测性能指标GPU利用率由40%提升至100%,QPS也提升超过3倍。本文将会重点介绍推理服务部署架构优化的工程实践,希望对大家能有所帮助或启发。

相关推荐: 世界,您好!

欢迎使用WordPress。这是您的第一篇文章。开始写作吧! 相关推荐: 世界,您好!欢迎使用WordPress。这是您的第一篇文章。开始写作吧!

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy