Torchvision介绍
Torchvision是基于Pytorch的视觉深度学习迁移学习训练框架,当前支持的图像分类、对象检测、实例分割、语义分割、姿态评估模型的迁移学习训练与评估。支持对数据集的合成、变换、增强等,此外还支持预训练模型库下载相关的模型,直接预测推理。
对象检测支持
Pytorch中的torchvision是一个轻量化的迁移学习框架,支持图像分类、对象检测、实例分割、语义分割模型的自定义数据集的迁移学习,其中对象检测迁移学习支持模型包括:
- Faster-RCNN - FCOS - RetinaNet - SSD - SSDlite其中Faster-RCNN支持骨干网络基于ResNet50,RPN支持FPN方式,同时支持ViT Block作为骨干网络。Torchvision中的对象检测模型参数指标列表如下:
Faster-RCNN改进
在多数深度学习开发者的印象中Faster-RCNN与Mask-RCNN作为早期的RCNN系列网络现在应该是日薄西山,再也没有什么值得留恋的地方,但是你却会发现Pytorch无论哪个版本的torchvision都一直在支持Faster-RCNN与Mask-RCNN模型网络的迁移学习训练。原因不难理解,因为torchvision框架的开发者与维护者一直在不断改善与提升Faster-RCNN的模型,它已经不是2015的Faster-RCNN了,torchvision 0.13版本以后的Faster-RCNN支持两个版本分别是
- Faster-RCNN V1版本 - Faster-RCNN V2版本 V1版本是基于FPN加持、
V2版本是基于VIT+FPN加持
对应的论文分别发表于2017年与2021年底。所以说虽然是2023年了,但是torchvision中的Faster-RCNN模型还是可以用的,而且还是很有用的。
Faster-RCNN训练与部署
torchvision中支持的模型都可以一键导出ONNX格式模型,然后直接通过ONNXRUNTIME与OpenVINO实现模型部署与加速推理,通过torchvision框架可以实现自定义数据集的Faster-RCNN对象检测模型训练,我自己分别基于无人机与飞鸟数据集、宠物数据集实现了Faster-RCNN的自定义模型训练与部署,运行截图如下:
全网最高性价比的Pytorch框架CV开发课程,错过了不是时间,而是给自己改变的机会!
全部0条评论
快来发表一下你的评论吧 !