样本不平衡

Posted on 07-01-2020 16:52:34 Edited on 09-01-2020 23:38:04 In 机器学 Comments:

过采样

随机过采样

从样本少的类别中随机抽样，再将抽样得来的样本添加到数据集中。然而这种方法如今已经不大使用了，因为重复采样往往会导致严重的过拟合。

Unet

Posted on 06-01-2020 20:18:31 Edited on 07-01-2020 03:20:52 In 计算机视觉 , 深度学习 , 语义分割 Comments:

简介

在医疗生物的图像处理中，我们希望输出包括定位，也就是对于每一个像素进行分类。此外，卷积神经网络需要使用几千张图像进行训练，这常常超过了医疗生物能获得的数量范围。为了解决这些问题，Cireans et al训练了一个基于滑动窗口的网络用来预测每一个像素的分类（把每一个像素周围一定范围内的像素用作输入）。这个网络可以实现定位，而且训练数据也远远大于训练用的图片（每个图片都被分为很多小patch）。

目标检测：YOLO

Posted on 17-12-2019 11:13:10 Edited on 18-12-2019 19:30:00 In 计算机视觉 , 目标检测 , 深度学习 Comments:

目标检测：YOLO

简介

对yolo的印象就是快，yolo把整个目标检测（分类和定位）当作一个回归问题，直接从图像像素输出bbox坐标和类别，如下图:

png

yolo使用一个卷积神经网络同时预测多个检测目标。它首先把图像resize到$448 \times 448$，图像通过卷积网络后生成bbox坐标和分类，然后用NMS进行筛选。

目标检测：YOLO

Posted on 17-12-2019 11:13:10 Edited on 18-12-2019 19:30:00 In 计算机视觉 , 目标检测 , 深度学习 Comments:

目标检测：YOLO

简介

对yolo的印象就是快，yolo把整个目标检测（分类和定位）当作一个回归问题，直接从图像像素输出bbox坐标和类别，如下图:

png

yolo使用一个卷积神经网络同时预测多个检测目标。它首先把图像resize到$448 \times 448$，图像通过卷积网络后生成bbox坐标和分类，然后用NMS进行筛选。

目标检测:SSD

Posted on 16-12-2019 16:44:39 Edited on 17-12-2019 17:28:16 In 计算机视觉 , 目标检测 Comments:

Single Shot MultiBox Detector

目标检测的算法主要分为两个：

two-stage算法，比如RCNN系列。需要先生成候选区域，再对候选区域进行分类和回归。
one-stage 比如yolo和SSD，不需要先生成候选区域，而是直接从图片上进行不同尺度(scale)和长宽比(aspect ratio)的抽样，然后经由CNN提取特征后直接进行分类和回归。这种方法的优势是速度快。

目标检测：Faster-RCNN

Posted on 12-12-2019 11:53:34 Edited on 23-02-2020 18:41:10 In 计算机视觉 , 深度学习 , 目标检测 Comments:

Faster-RCNN

Fast-RCNN回顾

尽管相比起RCNN，Fast-RCNN网络中有许多改进。但是对于候选区域的生成仍然使用selective search这一十分耗时的方法。而在Faster-RCNN中对这一项进行了改进。

Faster-RCNN

我们先来看看Faster-RCNN整个网络的结构：

png

整个网络被分为两个部分，上半部分就是我们在Fast-RCNN中熟悉过的网络结构（除去候选区域生成部分），而下半部分就是用来生成候选区域的Region Proposal Network（RPN）
（有的博主认为在Fast-RCNN部分中有特有不共享的卷积层，但是在论文中并没有看到哪里提及）

目标检测：Fast-RCNN

Posted on 11-12-2019 19:13:08 Edited on 17-12-2019 17:28:54 In 计算机视觉 , 深度学习 , 目标检测 Comments:

Fast-RCNN

回顾RCNN

RCNN网络的不足：

在RCNN网络的训练和测试都很慢，因为每一张图片都需要先经过selective search去选择约2k个候选框（而且这些候选框很多都是重叠的），然后再对候选框通过CNN网络进行特征提取，这个过程是很冗余的，因为相当于我们对很多重复的区域进行了特征提取。
其次我们在训练的时候步骤非常繁琐。不仅仅是CNN的特征提取，还有SVM的分类器（20个），Bounding Box的回归器（20个）需要训练。同时在训练分类器和回归器的是，特征都需要存储在本地，占用大量的存储空间

Fast-RCNN

那么作为RCNN的改进型，Fast-RCNN是如何改进上述的不足呢？先来看看FRCNN网络的结构:

Classiczy

39 posts

16 categories

19 tags

GitHub E-Mail Instagram Bilibili