SSD论文阅读笔记

news/2024/11/5 11:09:10

SSD: Single Shot MultiBox Detector

论文arxiv链接:https://arxiv.org/pdf/1605.06409v2.pdf

  • 亮点在于对多个size的featuremap产生各自scale的bbox:
    在这里插入图片描述
  • scale采取的是0-1的归一化scale,假设一共利用了m个大小不同的feature map,就会有m个scale,对于一个第k个featuremap,每一个location的default bbox的scale是: s k = s m i n + s m a x − s m i n m − 1 ( k − 1 ) s_k = s_{min} + \frac{s_{max}-s_{min}}{m-1}(k-1) sk=smin+m1smaxsmin(k1),而aspect对每一个featuremap都是 a r ∈ { 1 , 2 , 3 , 1 2 , 1 3 } a_r \in \{1, 2, 3, \frac{1}{2}, \frac{1}{3}\} ar{1,2,3,21,31}, bbox的长宽计算方法是 w = s a , h = s / a w = s\sqrt{a}, h = s/\sqrt{a} w=sa ,h=s/a ,对于 a r = 1 a_r=1 ar=1的情况再加一种长宽都为 s k s k + 1 \sqrt{s_ks_{k+1}} sksk+1 的bbox,所以对于每一个feature map的每一个location都有6个default bbox. 假设第k个feature map的size是 c k × p k × p k c_k \times p_k \times p_k ck×pk×pk那么feature map
    上索引为 ( i . j ) (i. j) (i.j)的default bbox的中心对应到原图的位置是 ( i + 0.5 p k , j + 0.5 p k ) (\frac{i+0.5}{p_k}, \frac{j+0.5}{p_k}) (pki+0.5,pkj+0.5)其中 i , j ∈ [ 0 , p k ) i, j \in [0, p_k) i,j[0,pk)
  • 此外有一点需要注意的是,不同于其它检测器在训练时match GTbox的时候只选择与dtbox iou最高的GTbox为GT, SSD是通过阈值选择的,也即只要iou超过某个阈值(一般是0.5),就认为是GT,也就是说同一个dt可以match到多个GT,具体还得看代码

http://www.niftyadmin.cn/n/3658057.html

相关文章

Calling Convention的总结

因为经常需要和不同的Calling Convention打交道,前段时间整理了一下它们之间的区别,如下:清理堆栈参数压栈顺序命名规则 (MSVC)备注Cdecl调用者 (Caller)从右往左 FuncName因为是调用者清理Stack,因此允许变参 (如printf)Pascal被…

如何调试托管代码(managed code)和非托管代码(native code)混合的项目

在调试同时存在托管代码和非托管代码的程序的时候,需要特别注意选用适当的调试器的类型。因为看到类似的问题问得比较多,因此这里把做法写出来。在托管项目中在调试之前,需要打开对非托管代码调试的功能,这个选项在项目的属性的De…

NLP学习笔记(2)

如果你的数据集比较小,最好不要自己训练词向量,容易过拟合,直接download别人在某些语料库上训练好的词向量fix下来比较好但是如果你的数据集比较大,你可以随机初始化你的词向量并且在训练过程中训练他们window classification是最…

Silverlight 1.1正式更名为Silverlight 2.0

详情请参看下面两篇Blog:http://weblogs.asp.net/scottgu/archive/2007/11/29/net-web-product-roadmap-asp-net-silverlight-iis7.aspxhttp://blogs.msdn.com/tims/archive/2007/11/29/silverlight-1-1-is-now-silverlight-2-0.aspx

FPN阅读笔记

Feature Pyramid Networks for Object Detection arxiv链接:https://arxiv.org/pdf/1612.03144v2.pdf 网络结构示意图 核心思想是,高级语义信息在靠后的feature map,但是分辨率太小,导致小物体的特征几乎没有了,分辨…

ASP.NET 2.0 HttpHandler实现生成图片验证码(示例代码下载)

学习整理了一下(一).功能用HttpHandler实现图片验证码(二).代码如下1. 处理程序文件 ValidateImageHandler.ashx代码如下1 <% WebHandler Language"C#"Class"ValidateImageHandler"%>2 3 usingSystem;4 usingSystem.Web;5 usingSystem.Web.SessionSt…

NLP学习笔记(3)

NMT&#xff08;nerual machine translation&#xff09;任务经常被描述为一个encode-decode过程&#xff0c;输入序列利用RNN进行encode产生一个编码&#xff08;包含句子的语义信息&#xff09;&#xff0c;将这个编码送进decode的RNN产生target的语言序列&#xff0c;这就完…

NLP学习笔记(4)

不要在RNN的水平方向使用dropout&#xff08;虽然有人这么做&#xff0c;但是是用特殊的方法的&#xff09;&#xff0c;但是经常在垂直方向使用dropout初始化参数的时候&#xff0c;LSTM的forget gate的bias给1或2确保不会一开始就遗忘&#xff0c;然后其它的参数要初始化为很…