Classiczy

  • Home

  • About

  • Tags

  • Categories

  • Archives

样本不平衡

Posted on 07-01-2020 16:52:34 Edited on 09-01-2020 23:38:04 In 机器学 Comments:

过采样

随机过采样

从样本少的类别中随机抽样,再将抽样得来的样本添加到数据集中。然而这种方法如今已经不大使用了,因为重复采样往往会导致严重的过拟合。

Read more »

Unet

Posted on 06-01-2020 20:18:31 Edited on 07-01-2020 03:20:52 In 计算机视觉 , 深度学习 , 语义分割 Comments:

简介

在医疗生物的图像处理中,我们希望输出包括定位,也就是对于每一个像素进行分类。此外,卷积神经网络需要使用几千张图像进行训练,这常常超过了医疗生物能获得的数量范围。为了解决这些问题,Cireans et al训练了一个基于滑动窗口的网络用来预测每一个像素的分类(把每一个像素周围一定范围内的像素用作输入)。这个网络可以实现定位,而且训练数据也远远大于训练用的图片(每个图片都被分为很多小patch)。

Read more »

目标检测:YOLO

Posted on 17-12-2019 11:13:10 Edited on 18-12-2019 19:30:00 In 计算机视觉 , 目标检测 , 深度学习 Comments:

目标检测:YOLO

简介

对yolo的印象就是快,yolo把整个目标检测(分类和定位)当作一个回归问题,直接从图像像素输出bbox坐标和类别,如下图:

png

yolo使用一个卷积神经网络同时预测多个检测目标。它首先把图像resize到$448 \times 448$,图像通过卷积网络后生成bbox坐标和分类,然后用NMS进行筛选。

Read more »

目标检测:YOLO

Posted on 17-12-2019 11:13:10 Edited on 18-12-2019 19:30:00 In 计算机视觉 , 目标检测 , 深度学习 Comments:

目标检测:YOLO

简介

对yolo的印象就是快,yolo把整个目标检测(分类和定位)当作一个回归问题,直接从图像像素输出bbox坐标和类别,如下图:

png

yolo使用一个卷积神经网络同时预测多个检测目标。它首先把图像resize到$448 \times 448$,图像通过卷积网络后生成bbox坐标和分类,然后用NMS进行筛选。

Read more »

目标检测:SSD

Posted on 16-12-2019 16:44:39 Edited on 17-12-2019 17:28:16 In 计算机视觉 , 目标检测 Comments:

Single Shot MultiBox Detector

目标检测的算法主要分为两个:

  1. two-stage算法,比如RCNN系列。需要先生成候选区域,再对候选区域进行分类和回归。
  2. one-stage 比如yolo和SSD, 不需要先生成候选区域,而是直接从图片上进行不同尺度(scale)和长宽比(aspect ratio)的抽样,然后经由CNN提取特征后直接进行分类和回归。这种方法的优势是速度快。
Read more »

目标检测:Faster-RCNN

Posted on 12-12-2019 11:53:34 Edited on 23-02-2020 18:41:10 In 计算机视觉 , 深度学习 , 目标检测 Comments:

Faster-RCNN

Fast-RCNN回顾

尽管相比起RCNN,Fast-RCNN网络中有许多改进。但是对于候选区域的生成仍然使用selective search这一十分耗时的方法。 而在Faster-RCNN中对这一项进行了改进。

Faster-RCNN

我们先来看看Faster-RCNN整个网络的结构:

png

整个网络被分为两个部分,上半部分就是我们在Fast-RCNN中熟悉过的网络结构(除去候选区域生成部分),而下半部分就是用来生成候选区域的Region Proposal Network(RPN)
(有的博主认为在Fast-RCNN部分中有特有不共享的卷积层,但是在论文中并没有看到哪里提及)

Read more »

目标检测:Fast-RCNN

Posted on 11-12-2019 19:13:08 Edited on 17-12-2019 17:28:54 In 计算机视觉 , 深度学习 , 目标检测 Comments:

Fast-RCNN

回顾RCNN

RCNN网络的不足:

  1. 在RCNN网络的训练和测试都很慢,因为每一张图片都需要先经过selective search去选择约2k个候选框(而且这些候选框很多都是重叠的),然后再对候选框通过CNN网络进行特征提取,这个过程是很冗余的,因为相当于我们对很多重复的区域进行了特征提取。
  2. 其次我们在训练的时候步骤非常繁琐。不仅仅是CNN的特征提取,还有SVM的分类器(20个),Bounding Box的回归器(20个)需要训练。同时在训练分类器和回归器的是,特征都需要存储在本地,占用大量的存储空间

Fast-RCNN

那么作为RCNN的改进型,Fast-RCNN是如何改进上述的不足呢?先来看看FRCNN网络的结构:

Read more »
123…6
Classiczy

Classiczy

39 posts
16 categories
19 tags
GitHub E-Mail Instagram Bilibili
© 2020 Classiczy
Powered by Hexo v3.9.0
|
Theme – NexT.Pisces v7.3.0
0%