GTC 2023:多模态短视频模型推理优化方案解析

电子说

1.2w人已加入

描述

 演讲人:李杰,快手科技算法引擎工程师

    关于多模态短视频模型推理优化方案解析

 多卡推理--流水线并行:将模型和数据切分,以流水线形式计算,提高GPU利用率。模型切分策略:依照各部分的计算时间和参数量设计。

英伟达

英伟达

英伟达

英伟达

英伟达

英伟达

英伟达

英伟达

英伟达

英伟达

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分