基于超像素和快速三分图的图像前景提取方法
【技术领域】
[0001] 本发明属于计算机视觉和图像处理技术领域,特别针对有明显前景目标的自然图 像,进行前景目标的提取工作,为后续的应用处理提供有效的前景信息,可以应用到图像编 辑、目标跟踪、图像检索等方面。
【背景技术】
[0002] 前景提取就是指从现实图像中把感兴趣的目标识别和提取出来的一个任务。它是 图像分割的一个分支,也是计算机视觉和模式识别领域的关键问题之一。图象分割在图像 分析和图像处理研宄中起着承前启后的作用,它是图像处理的一个重要环节。它不但可以 检验图像的预处理效果,而且为后续的图像分析和处理奠定坚实基础。从其产生至今,它广 泛地应用在诸多领域,为人们生活中的图像处理水平提高做出了重大贡献,也为人类生产 力科技水平的提高起到了很大促进作用。因此,在过去的四十多年里,关于图像分割的研宄 一直受到人们的高度重视。
[0003] 在人们生活工作中,图像分割的技术有广泛应用,一直是图像技术研宄的热点方 向。图像分割技术是计算机视觉系统、自动目标获取、视频监控等图像识别和解析系统中需 要首要解决的问题,它在计算机视觉和图像识别中的广泛应用系统中占有关键地位。但是, 到目前为止,世界上还没有一个普适的或者在某一应用领域能够完全满足人们应用需求的 图像分割算法,当然也不存在判断分割是否成功的客观标准。因此,图像分割算法的研宄还 有广阔的探索空间。
[0004] 当把图像的前景提取出来后,我们可以利用它做进一步处理或研宄,比如进行特 征提取,然后用于识别,跟踪和图像检索。例如,如果我们能准确全面的提取出一个人的 身体或物体的某个部分,这对于理解人的感兴趣目标和目标跟踪的问题将是一个很大的贡 献,也使得这些问题在将来能够得到解决。通过提取前景并且与所需的背景图像进行融合, 我们也可以实现虚拟现实与增强现实。另外,前景提取也广泛地应用在如电视,广告,杂志 等领域。因此,前景提取是图像处理中的基本操作,也是视觉特效中的最重要的操作。对于 图像分割,科研人员已经提出了大量的方法。传统的方法有基于阈值的方法、颜色直方图的 方法、边缘检测的方法、区域相似性的方法、聚类的方法以及分水岭方法等。但是这些方法 的一个共同缺点是分割结果的语义表达难以满足人们需求。
[0005] 目前较新的方法大多是基于能量优化、GraphCut以及能够表达语义的图像分 割模式。一种能够较好表达用户意图的分割模式是交互式图像分割技术,而GrabCut是 其中最具有代表性的算法:C.Rother,V.Kolmogorov,andA.Blake.GrabCut:Interactive foregroundextractionusingiteratedgraphcuts.ACMTransactionson Graphics, 23:309 - 314, 2004.GrabCut的主要思路是:(1)手工交互的给出一个前景区域 的包围盒;(2)根据当前的前景和背景分割结果,分别估计前景和背景的GMM模型;(3)用 maxflow/mincut算法进行分割。GrabCut对GraphCut有如下的改进:(1)利用了GMMs 取代了直方图来描述前景与背景像素的分布,并且由灰度图像的处理发展到了彩色图的处 理;(2)GrabCut应用了迭代估计的方法代替了原来GraphCut的一次最小化的估计来完成 能量最小化的计算;(3)GrabCut允许通过非完全标记,减少了与用户的交互,用户只需用 矩形框标记出背景区域并且少量修饰即可。也就是说只需要矩形框选目标,那么在方框外 的像素全部当成背景,这时候就可以对背景和前景分别用GMM进行建模和完成良好的分割 了。
[0006] 存在的问题:
[0007] 1)计算时间复杂度和空间复杂度比较大;
[0008] 2)后续Matting处理需要的三分图Trimap不能自动自适应。
【发明内容】
[0009] 本发明针对上述现有方法的不足,提出一种基于超像素和快速三分图的图像前景 提取方法。该方法利用超像素生成技术SLIC来进行图像与处理,使得图像前景分割计算的 时间复杂度和空间复杂度的到大幅降低,同时提出主动自适应的三分图Trimap,使得后续 Matting处理的效率提高。
[0010] 具体实现方案包括如下步骤:
[0011] (1)对输入的图像,采用简单线性迭代聚类(SLIC)算法进行超像素预处理,得到 以超像素块为单元的超像素图像;
[0012] (2)以超像素块内的信息代替单个像素的信息进行分割运算,提取超像素特征;
[0013] (3)利用GrabCut技术,对超像素图像构建吉布斯能量公式,建立有向带权图结 构,采用最大流/最小割的方法将超像素图像进行迭代能量最小化分割,得到RawMask分 割结果;
[0014] (4)基于RawMask,以硬分割边界为中心,若干个像素范围内标记为未知区域来得 到快速自适应Trimap;
[0015] (5)应用SharedMatting和Trimap对初步硬分割边缘进行平滑处理得到Refined Mask;
[0016] (6)应用RefinedMask,提取前景图像输出。
[0017] 上述超像素块可设置为由大约10个像素构成。
[0018] 上述超像素特征至少包括平均颜色特征和重心位置坐标。
[0019] 上述步骤⑶具体如下:
[0020] 通过矩形框选目标来得到一个初始的TrimapT,即方框外的像素全部作为背景像 素TB,而方框内TU的像素全部作为"可能是目标"的像素;GrabCut分别对前景目标和背景 进行GMM建模,然后应用GrabCut在超像素图上进行分割;通过带权图和最大流/最小割算 法做最小能量迭代优化求解以下能量公式
[0022] 注:a、0均为参数集,以下划线表示,此为本领域通用表达方式。
[0023] 上述步骤(4)具体可在以硬分割边界为中心、5个像素范围内标记为未知区域来 得到快速自适应Trimap。
[0024] 上述步骤(5)进行平滑处理,当RefinedMask符合期望,则输出;不符合,则进行 交互标记,迭代分割。
[0025] 本发明具有以下技术效果:
[0026] 1)本发明算法通过超像素算法预处理,图像分割效率很高;
[0027] 2)结合快速自适应三分图Trimap的自动生成算法,使得图像Matting边缘修正能 够更加方便和高效;
[0028] 3)通过定性和定量实验对比证明了本发明算法具有高效性、精确性、先进性等显 著优点,具有很高的实际应用价值。
【附图说明】
[0029] 图1为本发明基于超像素和快速三分图的前景提取算法流程图;
[0030] 图2、图3为本发明实验中采用的实验图以及不同算法的可视化结果图。
【具体实施方式】
[0031] 以下面结合附图,对本发明作进一步的详细描述。
[0032] 参照图1,本发明实现的步骤如下。
[0033] 步骤1载入图片,进行超像素预处理
[0034] 基于像素级别的GrabCut图像分割很耗时,因此很有必要应用超像素进行预处理 来加速。超像素即在图像中由一系列位置相邻且颜色、亮度、纹理等特征相似的像素点组成 的小区域。简单线性迭代聚类(SLIC)算法被证明是目前最好的超像素分割方法。SLIC把 LAB颜色空间和坐标空间转化成5维向量。超像素小区域大多保留了进一步进行图像分割 的有效信息,且一般不会破坏图像中物体的边界信息。算法把超像素大小设置为包含大约 10个像素的大小来处理得到预处理超像素图。
[0039] 步骤2,提取超像素特征
[0040] 利用超像素块内的信息代替单个像素的信息进行分割运算,因此要计算像素块的 颜色特征和位置特征。颜色信息采用的是每个像素块内的RGB颜色均值(也可以是其他颜 色特征),位置信息是像素块的重心位置。重心坐标用于交互label过程中定位超像素块。
[0043] 步骤3,超像素图像上GrabCut分割
[0044] 用户通过直接框选目标来得到一个初始的TrimapT,即方框外的像素全部作为背 景像素TB,而方框内TU的像素全部作为"可能是目标"的像素。对TB内的每一像素n,初 始化像素n的标签an = 〇,即为背景像素;而对TU内的每个像素n,初始化像素n的标签 an= 1,即作为"可能是目标"的像素。经过上面两个步骤,我们就可以分别得到属于目标 (an= 1)的一些像素,剩下的为属于背景(an= 0)的像素,这时候,就可以通过这个像素 来估计目标和背景的GMM了。我们可以通过k-means算法分别把属于目标和背景的像素聚 类为K类,S卩GMM中的K个高斯模型,这时候GMM中每个高斯模型就具有了一些像素样本集, 这时候它的参数均值和协方差就可以通过他们的RGB值估计得到,而该高斯分量的权值可 以通过属于该高斯分量的像素个数与总的像素个数的比值来确定。
[0045] 当得到超像素块的特征之后,就可以得到一幅相当于缩小10倍的超像素图。然后 应用GrabCut在超像素图上进行分割。GrabCut用矩形框初始化前景和背景,并分别前景目 标和背景进行建模。对于每个像素,要不来自于目标GMM的某个高斯分量,要不就来自于背 景GMM的某个高斯分量。每个GMM模型由5个高斯混合而成,每个高斯都是3维颜色向量 的分布。下面是P(z)是高斯混合模型的概率分布
[0047] 该算法通过吉布斯能量E(a,k, 9,z)来进行能量优化求解AlphaMask。该能量 优化公式不仅考虑了像素颜色信息的概率分布,即区域能量项U(a,k,0,z),而且考虑了 领域之间的平滑信息,即边界平滑项V(a,z)。
[0048] E(a,k, 9 ,z) =U(a,k, 0 ,z)+V(a,z)
[0049] 区域能量项:
[0050] U(a,k, 9 ,z) =P(z)
[0051] 边界平滑项:
[0053] 并通过建立有向带权图和最大流/最小割算法做最小能量迭代求解。
[0055] 步骤4,基于RawMask产生快速自适应Tri
map
[0056]通过步骤(3),就可以得到一个超像素图的前景和背景的label标记信息,我们通 过映射得到原始图像的RawMask。因为这样的分割是硬分割,即分割边缘会有锯齿状或者 不平滑,不能满足要求。因此,需要对该结果进行修正。而后续Matting技术所需的三分图 Trimap-般来自人工标记,很繁琐。本算法通过扩展硬分割边界来得到不确定的分割区域 标记,比如在以硬分割边界为中心,5个像素范围内标记为未知区域。这种方法简单而高效, 完全通过计算机自动生成,不需要人工标记。
[0057] 步骤5,Matting边缘处理得到RefinedMask
[0058] SharedMatting是一种实时图像边缘处理技术:E.GastalandM.Oliveira, "Sharedsamplingforreal-timealphaMatting,''ComputerGraphicsForum,vol. 29,no. 2,pp. 575 - 584,2010.该技术需要三分图的辅助,在步骤(4)中生成的快速自适应三分 图Trimap可以被用于SharedMatting对初步硬分割边界进行平滑处理。该方法操作简单 且计算高效,如果有GPUs的辅助,则完全可以达到实时要求。当RefinedMask符合期望, 则输出;不符合,则进行交互标记,迭代分割。
[0059] 步骤6,输出前景图像
[0060] 通过步骤(5)得到满意的RefinedMask,我们将它用于前景图像的提取并输出。 本发明可以通过以下仿真实验做进一步的说明。
[0061] 1)仿真条件
[0062]本发明是在中央处理器为Intel(R)Corei3-21303. 40GHZ、内存 16G、WINDOWS7 操作系统上,运用VisualStudio2010软件进行C++与Opencv程序的仿真,使用的是 Release版本编译。实验中使用的实验数据是从公开的数据库获得:
[0063] 以下面结合附图,对本发明实现的步骤作进一步的详细描述:
[0064] Valphamattingdataset(http://www.alphamatting,com)
[0065] VBSDS500 (http://www.eecs.berkeley.edu/Research/Projects/CS/vision/)
[0066] 其中,alphamatting数据集提供了一个27幅图像的训练集。训练集包含Ground truth,而测试集的Groundtruth被隐藏。在我们的实验中,我们使用训练集来验证我们 的方法的有效性。数据集BSDS500由500个自然的图像。该数据清晰地分离成不相交的训 练,验证和测试子集。评价指标是(1)每次交互时间(TimeCriterion) ; (2)最小均方误差 (MeanSquareError(MSE)) ; (3)绝对误差和(SumofAbsoluteDifference(SAD))。
[0069] 2)仿真内容
[0070] (1)为了证明本算法相对于原始GrabCut的改善效果,在一个对比实验里,我们对 比了SuperpixelGrabCut与原始GrabCut在时间,MSE,SAD等三个衡量指标。
[0071] 表1.SuperpixelGrabCut与原始算法的指标对比
[0072]
[0073] 本实验选择了 6幅来自BSDS500和6幅来自alphamattingdataset的图片作为 实验对象。因为第一个数据库的图片尺寸小(481X321),第二个数据库图片尺寸大(大 约800X550),这样可以同时证明算法在小尺寸和大尺寸图片的分割都有效。其中选自 BSDS500 的图片分别为 3063, 8068, 29030, 65019, 124084 和 388016 ;而选自alphamatting dataset的图片分别是GT02,GT05,GT06,GT13,GT14和GT15。实验中将两种算法的分割结 果与Groundtruth进行比较,计算得到MSE和SAD指标,同时统计每次交互算法的运行时 间,结果如表1所示。表1中的黑体代表的是最好的结果,指标越低,效果越好。
[0074] 从表1可见,本发明的绝大多数指标都优于原始算法,尤其是时间指标和MSE指 标,都展现了本算法对于图像分割效果有很大的提升。而由于超像素块相对的不精细,使 得SAD指标略微的差了一些,但是差距不是太大。而我们的主要目的是提高分割效率,因 此本算法的分割效率优势非常明显。另外,图2是实验的可视化结果,从左到右每列依 次是图片8068,29030, 124084,GT02和GT06。图2第一行是原始图片,第二行是Ground truth,第三行是原始算法,第四行是提出的SuperpixelGrabCut的可视化结果图,可以 看出我们的算法在很多细节方面都比原始算法有很大改善,例如,图片GT02里面的镂空, SuperpixelGrabCut有更符合实际的分割结果。
[0075] (2)实验2是为了证明本算法相比于其他同类算法的优势,我们选择了另外两种 算法作为本算法的对比算法。第一种是Growcut,代码用Matlab和MEX实现,详细介绍 参考论文:V.VladimirandK.Vadim, "Growcut:Interactivemulti-labeln_dimage segmentationbycellularautomata, "inProc.ofGraphicon, 2005,pp. 150 - 156. 另一种是LazySnapping,代码用C++实现,详细介绍参考论文:Y.Li,J.Sun,C.Tang,andH.Shum,"Lazysnapping,''ACMTransactionsOnGraphic. ,vol. 23,no. 3,pp. 303 - 308, 2004.表2是量化的指标对比,黑体数字是最好的指标,实验2是用 alphamattingdataset里的27幅训练库来做的,可以看出觉得大多数最好的指标都是 SuperpixelGrabCut得到,而最关键的时间指标,提出的算法平均时间是0. 06秒,相比于 Growcut的9. 13秒和LazySnapping的0. 72秒,分别有两个数量级和一个数量级的提升, 达到了实时效果。而且在平均MSE和平均SAD指标也达到最好水平。图3是实验的可视 化结果,其中图3a)是原始图片数据,图3(b)是Groundtruth,图3(c)到图3(e)依次是 Growcut、LazySnapping以及本发明算法等3种图像分割算法的可视化结果图。可以看出, 本发明算法的视觉结果图都是最好的,尤其是图片GT25,本算法的分割结果基本符合实际 前景目标,而另外两种的结果有较大变形和错误。因此通过与同类算法的定性和定量的对 比,进一步验证了本发明的先进性。
[0076] 表2. 3种算法图像分割结果指标对比
[0078] 通过定性和定量实验对比证明,本发明具有高效性、精确性、先进性等特点。
【主权项】
1. 基于超像素和快速三分图的图像前景提取方法,包括以下步骤: (1) 对输入的图像,采用简单线性迭代聚类(SLIC)算法进行超像素预处理,得到以超 像素块为单元的超像素图像; (2) 以超像素块内的信息代替单个像素的信息进行分割运算,提取超像素特征; (3) 利用GrabCut技术,对超像素图像构建吉布斯能量公式,建立有向带权图结构,采 用最大流/最小割的方法将超像素图像进行迭代能量最小化分割,得到Raw Mask分割结 果; (4) 基于Raw Mask,以硬分割边界为中心,若干个像素范围内标记为未知区域来得到快 速自适应Trimap ; (5) 应用Shared Matting和Trimap对初步硬分割边缘进行平滑处理得到Refined Mask ; (6) 应用Refined Mask,提取前景图像输出。2. 根据权利要求1所述的基于超像素和快速三分图的图像前景提取方法,其特征在 于:所述超像素块由10个像素构成。3. 根据权利要求1所述的基于超像素和快速三分图的图像前景提取方法,其特征在 于:所述超像素特征至少包括平均颜色特征和重心位置坐标。4. 根据权利要求1所述的基于超像素和快速三分图的图像前景提取方法,其特征在 于,步骤⑶具体如下: 通过矩形框选目标来得到一个初始的TrimapT,即方框外的像素全部作为背景像素 TB,而方框内TU的像素全部作为"可能是目标"的像素;GrabCut分别对前景目标和背景进 行GMM建模,然后应用GrabCut在超像素图上进行分割;通过带权图和最大流/最小割算法 做最小能量迭代优化求解以下能量公式5. 根据权利要求2所述的基于超像素和快速三分图的图像前景提取方法,其特征在 于:步骤⑷具体在以硬分割边界为中心、5个像素范围内标记为未知区域来得到快速自适 应 Trimap06. 根据权利要求1所述的基于超像素和快速三分图的图像前景提取方法,其特征在 于:步骤(5)进行平滑处理,当Refined Mask符合期望,则输出;不符合,则进行交互标记, 迭代分割。
【专利摘要】本发明公开了一种基于超像素和快速三分图的图像前景提取方法。该方法主要包括:(1)采用SLIC算法进行超像素预处理;(2)根据所提取的超像素块,提取平均颜色特征和重心位置坐标等超像素特征;(3)利用GrabCut技术,建立有向带权图结构,将超像素分割得到的图像进行迭代能量最小化分割;(4)基于Raw Mask产生快速自适应Trimap;(5)应用Shared Matting和Trimap对初步硬分割边缘进行平滑处理得到Refined Mask;(6)应用Refined Mask,提取前景图像输出。本发明能够提高图像分割的效率,图像Matting边缘修正能够更加方便和高效,有很高的应用价值。
【IPC分类】G06T7/00
【公开号】CN104899877
【申请号】CN201510260422
【发明人】李学龙, 刘康, 董永生
【申请人】中国科学院西安光学精密机械研究所
【公开日】2015年9月9日
【申请日】2015年5月20日