目標(biāo)檢測(cè)作為計(jì)算機(jī)視覺中的一個(gè)重要分支,近些年來(lái)隨著神經(jīng)網(wǎng)絡(luò)理論研究的深入和硬件 GPU 算力的大幅度提升,一舉成為全球人工智能研究的熱點(diǎn),落地項(xiàng)目也最先開始。 縱觀 2013 年到 2020 年,從最早的 R-CNN、OverFeat 到后來(lái)的 SSD、YOLO v3 再到去年的 M2Det,新模型層出不窮,性能也越來(lái)越好!本文將完整地總結(jié) 52 個(gè)目標(biāo)檢測(cè)模型極其性能對(duì)比,包括完備的文獻(xiàn) paper 列表。 首先直奔主題,列出這 52 個(gè)目標(biāo)檢測(cè)模型(建議收藏): 這份表看得太舒適了!這份目標(biāo)檢測(cè)超全的技術(shù)路線總結(jié)來(lái)自于 GitHub 上一個(gè)知名項(xiàng)目,作者是畢業(yè)于韓國(guó)首爾國(guó)立大學(xué)電氣與計(jì)算機(jī)工程專業(yè)的 Lee hoseong,目前已經(jīng)收獲 7.3k star。 該項(xiàng)目地址是: https://github.com/hoya012/deep_learning_object_detection 該技術(shù)路線縱貫的時(shí)間線是 2013 年到 2020 年初,上圖總結(jié)了這期間目標(biāo)檢測(cè)所有具有代表性的模型。圖中標(biāo)紅的部分是相對(duì)來(lái)說(shuō)比較重要,需要重點(diǎn)掌握的模型。 更新日志值得一提的是紅色石頭早在去年年初的時(shí)候已經(jīng)發(fā)文給大家推薦過(guò)這個(gè)項(xiàng)目,作者也一直在更新,截至 2020 年 2 月,作者主要的更新如下:
下面詳細(xì)介紹! 模型性能對(duì)比表由于硬件不同(例如 CPU、GPU、RAM 等),來(lái)比較 FPS 往往不夠準(zhǔn)確。更合適的比較方法是在同一硬件配置下測(cè)量所有模型的性能。以上所有模型的性能對(duì)比結(jié)果如下: 從上面的表格中,可以清楚看到不同模型在 VOC07、VOC12、COCO 數(shù)據(jù)集上的性能表現(xiàn)。同時(shí)列出了模型論文發(fā)表來(lái)源。 下面列舉一些重點(diǎn)標(biāo)紅的模型進(jìn)行簡(jiǎn)要介紹。 模型論文篇2014 年 R-CNN Rich feature hierarchies for accurate object detection and semantic segmentation | [CVPR' 14] 論文: https:///pdf/1311.2524.pdf 官方代碼 Caffe: https://github.com/rbgirshick/rcnn OverFeat OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks | [ICLR' 14] 論文: https:///pdf/1312.6229.pdf 官方代碼 Torch: https://github.com/sermanet/OverFeat 2015 年 Fast R-CNN Fast R-CNN | [ICCV' 15] 論文: https:///pdf/1504.08083.pdf 官方代碼 caffe: https://github.com/rbgirshick/fast-rcnn Faster R-CNN Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks | [NIPS' 15] 論文: https://papers./paper/5638-faster-r-cnn-towards-real-time-object-detection-with-region-proposal-networks.pdf 官方代碼 caffe: https://github.com/rbgirshick/py-faster-rcnn 非官方代碼 tensorflow: https://github.com/endernewton/tf-faster-rcnn 非官方代碼 pytorch: https://github.com/jwyang/faster-rcnn.pytorch 2016 年 OHEM Training Region-based Object Detectors with Online Hard Example Mining | [CVPR' 16] 論文: https:///pdf/1604.03540.pdf 官方代碼 caffe: https://github.com/abhi2610/ohem YOLO v1 You Only Look Once: Unified, Real-Time Object Detection | [CVPR' 16] 論文: https:///pdf/1506.02640.pdf 官方代碼 c: https:///darknet/yolo/ SSD SSD: Single Shot MultiBox Detector | [ECCV' 16] 論文: https:///pdf/1512.02325.pdf 官方代碼 caffe: https://github.com/weiliu89/caffe/tree/ssd 非官方代碼 tensorflow: https://github.com/balancap/SSD-Tensorflow 非官方代碼 pytorch: https://github.com/amdegroot/ssd.pytorch R-FCN R-FCN: Object Detection via Region-based Fully Convolutional Networks | [NIPS' 16] 論文: https:///pdf/1605.06409.pdf 官方代碼 caffe: https://github.com/daijifeng001/R-FCN 非官方代碼 caffe: https://github.com/YuwenXiong/py-R-FCN 2017 年 YOLO v2 YOLO9000: Better, Faster, Stronger | [CVPR' 17] 論文: https:///pdf/1612.08242.pdf 官方代碼 c: https:///darknet/yolo/ 非官方代碼 caffe: https://github.com/quhezheng/caffe_yolo_v2 非官方代碼 tensorflow: https://github.com/nilboy/tensorflow-yolo 非官方代碼 tensorflow: https://github.com/sualab/object-detection-yolov2 非官方代碼 pytorch: https://github.com/longcw/yolo2-pytorch FPN Feature Pyramid Networks for Object Detection | [CVPR' 17] 論文: http://openaccess./content_cvpr_2017/papers/Lin_Feature_Pyramid_Networks_CVPR_2017_paper.pdf 非官方代碼 caffe: https://github.com/unsky/FPN RetinaNet Focal Loss for Dense Object Detection | [ICCV' 17] 論文: https:///pdf/1708.02002.pdf 官方代碼 keras: https://github.com/fizyr/keras-retinanet 非官方代碼 pytorch: https://github.com/kuangliu/pytorch-retinanet 非官方代碼 mxnet: https://github.com/unsky/RetinaNet 非官方代碼 tensorflow: https://github.com/tensorflow/tpu/tree/master/models/official/retinanet Mask R-CNN Mask R-CNN | [ICCV' 17] 論文: http://openaccess./content_ICCV_2017/papers/He_Mask_R-CNN_ICCV_2017_paper.pdf 官方代碼 caffe2: https://github.com/facebookresearch/Detectron 非官方代碼 tensorflow: https://github.com/matterport/Mask_RCNN 非官方代碼 tensorflow: https://github.com/CharlesShang/FastMaskRCNN 非官方代碼 pytorch: https://github.com/multimodallearning/pytorch-mask-rcnn 2018 年 YOLO v3 YOLOv3: An Incremental Improvement | [arXiv' 18] 論文: https:///media/files/papers/YOLOv3.pdf 官方代碼 c: https:///darknet/yolo/ 非官方代碼 pytorch: https://github.com/ayooshkathuria/pytorch-yolo-v3 非官方代碼 pytorch: https://github.com/eriklindernoren/PyTorch-YOLOv3 非官方代碼 keras: https://github.com/qqwweee/keras-yolo3 非官方代碼 tensorflow: https://github.com/mystic123/tensorflow-yolo-v3 RefineDet Single-Shot Refinement Neural Network for Object Detection | [CVPR' 18] 論文: http://openaccess./content_cvpr_2018/papers/Zhang_Single-Shot_Refinement_Neural_CVPR_2018_paper.pdf 官方代碼 caffe: https://github.com/sfzhang15/RefineDet 非官方代碼 chainer: https://github.com/fukatani/RefineDet_chainer 非官方代碼 pytorch: https://github.com/lzx1413/PytorchSSD 2019 年 M2Det M2Det: A Single-Shot Object Detector based on Multi-Level Feature Pyramid Network | [AAAI' 19] 論文: https:///pdf/1811.04533.pdf 官方代碼 pytorch: https://github.com/qijiezhao/M2Det 2020 年 Spiking-YOLO Spiking-YOLO: Spiking Neural Network for Real-time Object Detection | [AAAI' 20] 論文: https:///pdf/1903.06530.pdf 數(shù)據(jù)集論文篇同時(shí)作者也列出了以上模型通常使用的公開數(shù)據(jù)集:VOC、ILSVRC、COCO,如下表所示: 用于目標(biāo)檢測(cè)的數(shù)據(jù)集相關(guān)論文如下: |
|