博客
关于我
深度学习_人脸检测_级联卷积神经网络
阅读量:544 次
发布时间:2019-03-08

本文共 1514 字,大约阅读时间需要 5 分钟。

#Cascade CNN的人脸检测框架解读

Cascade CNN 是一种高效的、基于深度学习的人脸检测算法,旨在在保持较高准确性的同时,最大程度地提高检测速度。其核心思想是通过多个级联的卷积神经网络 (CNN),逐步筛选和校正人脸区域,最终实现高效且准确的人脸检测。本文将详细解读 Cascade CNN 的框架结构及其工作原理。

一.Cascade CNN 的整体框架

Cascade CNN 的整体架构可以分为几个关键部分:

  • 12-net、24-net、48-net 三个级别的CNN

    这三个网络的结构基本相同,但在输入图片的分辨率和网络复杂度上有所不同。前面的简单网络用于快速筛选非人脸区域,拒绝大部分不属于人脸的部分。剩余的难以区分的区域则会传递到后续更复杂的网络进行进一步处理。这种级联结构充分发挥了不同阶段网络的优势,使得整体检测过程更加高效。

  • 校准网络 (12-calibration-net、24-calibration-net、48-calibration-net)

    校准网络的主要作用是对初步检测出的人脸边界进行优化。其通过对原图进行多次变换,计算每个变换后的边界得分,最后综合得分进行边界修正。这种方法可以有效避免初步检测中可能存在的误差。

  • 人脸校验模块

  • Cascade CNN 还配备了一个人脸校验模块,主要用于校正候选框的定位。通过对三个偏移变量 (Xn、Yn、Sn) 的校正,可以进一步优化候选框的位置和尺度,使得最终的检测更加精确。

    二.训练样本的准备

    为了实现 Cascade CNN 的高效人脸检测,必须依赖高质量的训练样本。训练数据应包括充分数量的真实人脸样本和非人脸样本。非人脸样本的多样化程度应尽可能提高,以便模型能够充分学习和区分人脸与非人脸的特征。此外,平衡的数据分布对模型的性能至关重要,避免类别倾向问题。

    三.级联结构的优势

  • 提高检测效率

    前端网络的简单结构允许快速筛选非人脸区域,大大减少了后续网络的工作量。

  • 确保召回率

    前端网络设定较为宽松的判别阈值,确保召回率的同时剔除非人脸。后续网络则设计复杂度较高,提升了检测的准确性。

  • 合并利用性能较差的分类器

    通过多个阶段的校准和校验,Cascade CNN 实现了对不同网络能力的结合,最大化利用了各阶段的优势。

  • 适应不同分辨率的检测需求

    不同级别的网络能够处理不同尺寸的输入图像,在保证效率的同时,实现适应性检测。

  • 四.Cascade CNN 的主要贡献

  • 快速检测速度
  • Cascade CNN 在单张图片上可以在毫秒级别内完成人脸检测,特别是在 CPU 上达到了 14FPS,在 GPU 上更是提升至 100FPS。

    1. 在FDDB上的卓越性能

      在 Face Detection Dataset for Binary Classification (FDDB) 上,Cascade CNNре达 2017 年最好的检测性能,使其成为该领域的代表性算法之一。

    2. 多级校正机制

      通过边界校正网络和人脸校验模块,Cascade CNN 实现了对人脸边界的精准定位,显著提升了检测的精确度。

    3. 模块化设计理念

    4. Cascade CNN 的模块化设计使其易于扩展和_upgrade,具备良好的扩展性和易维护性。

      五.总结

      Cascade CNN 凭借其创新的级联结构和强大的多级校正能力,在人脸检测领域取得了显著的进步。通过前端网络高效筛选非人脸,中端网络精准校准人脸边界,后端网络进一步优化候选框,最终实现了高效且准确的人脸检测。其设计理念不仅为人脸检测算法提供了新的思路,也为后续深度学习基的人脸识别系统奠定了坚实基础。

    转载地址:http://lbbiz.baihongyu.com/

    你可能感兴趣的文章
    NIS服务器的配置过程
    查看>>
    Nitrux 3.8 发布!性能全面提升,带来非凡体验
    查看>>
    NiuShop开源商城系统 SQL注入漏洞复现
    查看>>
    NI笔试——大数加法
    查看>>
    NLog 自定义字段 写入 oracle
    查看>>
    NLog类库使用探索——详解配置
    查看>>
    NLP 基于kashgari和BERT实现中文命名实体识别(NER)
    查看>>
    NLP 模型中的偏差和公平性检测
    查看>>
    Vue3.0 性能提升主要是通过哪几方面体现的?
    查看>>
    NLP 项目:维基百科文章爬虫和分类【01】 - 语料库阅读器
    查看>>
    NLP_什么是统计语言模型_条件概率的链式法则_n元统计语言模型_马尔科夫链_数据稀疏(出现了词库中没有的词)_统计语言模型的平滑策略---人工智能工作笔记0035
    查看>>
    NLP三大特征抽取器:CNN、RNN与Transformer全面解析
    查看>>
    NLP学习笔记:使用 Python 进行NLTK
    查看>>
    NLP度量指标BELU真的完美么?
    查看>>
    NLP的不同研究领域和最新发展的概述
    查看>>
    NLP的神经网络训练的新模式
    查看>>
    NLP采用Bert进行简单文本情感分类
    查看>>
    NLP问答系统:使用 Deepset SQUAD 和 SQuAD v2 度量评估
    查看>>
    NLP项目:维基百科文章爬虫和分类【02】 - 语料库转换管道
    查看>>
    NLP:使用 SciKit Learn 的文本矢量化方法
    查看>>