Indexed by:
Abstract:
图像分类是计算机视觉领域研究的重要问题,作为图像底层特征与高层语义之间的桥梁,是图像内容理解的关键技术。图像分类可以作为基础模块来实现目标检测与识别、图像分割、图像检索等计算机视觉任务,具有重要的研究意义和广泛的应用价值。近年来,大规模图像分类成为人们关注和研究的热点问题。对于大规模的图像数据,传统的图像分类方法面临着巨大的挑战。一方面,更多的图像类数目、更高维度的图像表示要求更高效的学习算法;另一方面,更加复杂多变的视觉属性、更加紧密的类间相关性要求更具区分性的图像表示。针对这些挑战,本文从图像类间的视觉相关性出发,以类间结构为线索,深入研究了字典学习、层次化结构创建、低维度量学习等问题。本文的主要研究内容包括:
1)提出了一种视觉相关的组字典学习算法用于更具区分性的图像表示。不同于常用的通用字典和专用字典学习方法,本文所提的字典学习方法能够充分考虑图像类间的视觉相关性。基于视觉特征空间,构建了一个图像类视觉网络用于刻画图像类间的视觉相关性;并且根据相关性的强弱,将所有图像类分成互不相交的多个图像类组。同一组内的图像类通常共享部分视觉属性,联合学习一个共有的组字典能够有效增加这些图像类间的区分性,同时不同组内的图像类通过不同的组字典来区分。利用视觉相关的组字典,一种基于组的结构化分类方法被用于实现图像分类。在两种标准图像数据集上的实验结果表明,视觉相关的组字典学习算法能够显著提高图像分类的性能。
2)提出了一种视觉树学习算法用于支持层次化图像分类。相比于传统的扁平化方法,层次化结构能够有效降低分类器学习和图像预测的复杂度,是实现大规模图像分类的高效结构。视觉树模型从图像的视觉特征出发,采用均值向量来表示图像类的视觉内容。根据图像类间的视觉相似性,两种不同的层次化聚类方法被用于构建视觉树模型,该模型能够保证树节点的视觉一致性。为了增强子节点间的区分性,提出了基于组字典的视觉树模型来实现字典学习与节点划分的统一。同时提出了一种软预测方法来改善层次化图像分类方法的错误传播问题。在ILSVRC2010图像数据集上的实验结果表明,视觉树模型能够获得更高的加速比,同时软预测方法显著提高了层次化图像分类方法的准确率。
3)基于视觉树模型,提出了一种层次化大间隔度量学习算法。随着图像规模的增长,图像视觉特征的复杂度和差异性也随之增大,学习合适的距离度量有助于发现图像数据间的本质关系。本文采用大间隔的思想,基于简单的NCM(Nearest Class Mean)分类器设计度量学习模型。考虑图像数据的高维特性,为了降低计算复杂度,特征降维被作为正则化约束用于度量学习目标函数的优化。针对层次化大规模图像分类方法,为了提高节点分类器的准确率,结合视觉树模型提出了两种自顶而下的层次化方法分别用于父节点和子节点的度量学习。在ILSVRC2010图像数据集上的实验结果表明,层次化大间隔度量学习算法能够在低维空间获得更高的分类准确率。
Keyword:
Reprint Author's Address:
Email:
Basic Info :
Degree: 工学博士
Mentor: 辛景民
Student No.:
Year: 2015
Language: Chinese
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 10
Affiliated Colleges: