<small id='teljv'></small> <noframes id='UCgGwbWs'>

  • <tfoot id='tzAyNH'></tfoot>

      <legend id='Jy5Sf7Y4'><style id='2Z8xwzdL'><dir id='zULnSYp'><q id='DX2e3pHxRG'></q></dir></style></legend>
      <i id='yO6qHdL'><tr id='5ISP4Qq'><dt id='b5epHoPYxM'><q id='QDvr'><span id='ygAeH'><b id='4AgzVT81GM'><form id='jdqumIn'><ins id='EcLZ0g2yH'></ins><ul id='TdXF'></ul><sub id='hIc3'></sub></form><legend id='HRetANFr'></legend><bdo id='BLnHRKcg'><pre id='9Amrou4R'><center id='0q3O6tw'></center></pre></bdo></b><th id='nWzC5Z7L'></th></span></q></dt></tr></i><div id='TNwD3'><tfoot id='nzRbEuMs'></tfoot><dl id='NSP6TxJ'><fieldset id='gVLJ'></fieldset></dl></div>

          <bdo id='VqX5Wr7S'></bdo><ul id='GPicjXt'></ul>

          1. <li id='wNu2UQ'></li>
            登陆

            1号站软件下载-方针检测算法之Fast RCNN

            admin 2019-07-14 166人围观 ,发现0个评论

            Fast RCNN自然是对R1号站软件下载-方针检测算法之Fast RCNNCNN的改善,且仍然是Ross Girshick作为榜首作者。

            论文见此:https://arxiv.org/pdf/1504.08083.pdf

            它测验的模型如下

            Fast RCNN对RCNN的改善

            Fast RCNN是为了改善RCNN的缺陷而诞生的。RCNN的缺陷主要是:
            1)Selective Search从原图上抠出来的每一个proposal框需求独自经过CNN来取得特征图,重复核算量大。而终究被留下来作为终究猜测框的proposal框是很少的,不划算。

            2)框物体分类和方位调整是相互独立的两个模型,需求别离练习。

            根据上面两个缺陷,Fast RCNN做了如下改善:
            1)ROI Pooling Layer: 先对图片全体经过CNN取得一个大的特征图,再从这个特征图中抠出proposal框对应的小特征图们。这样完成了CNN的同享,没有重复劳动。
            2)Multi-task: 整合本来的物体分类和方位调整两个独立使命到一个多使命的CNN网络中。

            1) ROI Pooling Layer

            Fast RCNN对RCNN的榜首个改善是运用卷积同享,先取得整张图片的特征图,核算量大大减少了,可是提出了一个新问题:在这张大的特征图上,怎么再去提取归于每个proposal框的小特征们呢?

            其实很简单,做个线性映射就好了——假定原始图片的shape是1000*1000,某个proposal框的对角极点坐标在(300,400)和(600,500)。图片在进行卷积之后得到的特征图巨细为100*100,那么上述的proposal框的对角极点在此1号站软件下载-方针检测算法之Fast RCNN特征图上的映射为(30,40),(60,50),如此咱们便拿到了proposal框的特征。

            这儿还有一个问题:从上面的办法中,能够想见,不同shape的proposal框会映射出不同shape的特征。假如要将这些特征输入到后续的全衔接层的话,那么全衔接层的参数个数是需求跟着不同shape改变的,这是无法接受的。由于这意味着咱们在运用一个不确定结构的模型,也意味着在完成中(比方运用TensorFlow)无法去界说这个网络成果。为了确保正常的网络构建,需求把特征们统一化到一个shape上去。所以ROI Pooling层被引入了。

            一个proposal框的特征图被称作是一个ROI,也便是Region of Interest. ROI Pooling完成的是一种特别的max pooling,它能够将任何shape的矩阵进1号站软件下载-方针检测算法之Fast RCNN行不规则切割,然后经过最大池化转换为方针shape的矩阵,一图明晰:

            2) Multi-task

            在Fast RCNN中,不再需求把proposal框的图画输入到额定的SVM去分类,也不再需求把框的方位输入到额定的线性回归器1号站软件下载-方针检测算法之Fast RCNN去调整方位。上述两部分被整合到全衔接中。运转流程是:从ROI Pooling后得到的特征图(1*4096向量)开端,进行多个全衔接,然后别离输入到 FC+softmax 和 FC+regressor两条支路去别离猜测图画分类和方位调整。这种运转方法称作Multi-task:


            这儿有个问题是,由于proposal框是十分多的,能够预见全衔接层的参数十分多,所以整个网络的练习和猜测在全衔接环节的核算量十分大。

            为了节约核算量,Ross想到了用SVD进行降维。在之前的文章中咱们讲过,SVD能够将矩阵进行奇特值分解,并经过取部分奇特值及其对应维度的方法,在能够接受的信息丢失下进行矩阵的降维:

            Fast RCNN的练习

            Fast RCNN练习的特别之处源于模型的multi-task环节,这使得咱们在构建丢失函数的时分需求联合考虑分类丢失和方位丢失。分类来自softmax,丢失函数运用的是log丢失;方位来自线性回归,丢失函数运用的是smooth L1丢失。将丢失和作为Fast RCNN的终究丢失:


            以上。


            参阅

            https://www.cnbl魔王ogs.com/skyfsm/p/6806246.html
            https://zhuanlan.zhihu.com/p/43619815
            https://blog.csdn.net/lanran2/article/details/54376126
            https://zhuanlan.zhihu.com/p/30720870



            请关注微信公众号
            微信二维码
            不容错过
            Powered By Z-BlogPHP