基于频域局部统计模型的数字图像拼接被动检测方法

xiaoxiao2020-10-23 21

基于频域局部统计模型的数字图像拼接被动检测方法
【技术领域】
[0001] 本发明涉及数字图像处理技术领域，具体是一种基于频域局部统计模型的数字图像拼接被动检测方法。
【背景技术】
[0002] 随着电子信息技术的快速发展，数字图像以其信息量大、可视性强等优点，广泛应用于科学研宄、新闻报道和广告策划等领域。在日常生活和工作中，大多数人对数字图像的编辑和修饰只是为了满足某些现实需求，但也有一些不法分子怀有某种恶意目的去伪造和散布一些肉眼难以区分的数字伪造图像，从而误导公众，给个人和社会造成严重的不良影响。因此，数字图像真伪鉴定在司法鉴定和版权保护等领域有着十分重要的意义。当前的数字图像篡改检测技术大致可分为两大类，即主动篡改检测方法和被动篡改检测方法。传统的主动篡改检测方法是将数字水印或数字签名嵌入数字图像，通过检测数字水印或数字签名的改变来鉴定图像的真实性；被动图像篡改检测方法不需要图像的先验信息，而是利用图像本身的特征进行分析。与主动篡改检测方法相比，被动篡改检测方法具有较高的实用价值和较广阔的应用前景。
[0003] 数字图像拼接是图像内容篡改中最常见的一种技法，是指在多幅数字图像之间进行复制一一粘贴处理以产生伪造数字图像的篡改操作。一幅原始数字图像在空间域和频域 (变换域）往往存在一些内在的关联性，而拼接操作本身会或多或少地破坏这些底层统计特性。
[0004] 经文献检索发现，ShiYun-Qing、ChenChun-Hua和ChenWen在论文"Anatural imagemodelapproachtosplicingdetection"（《基于自然图像模型的图像拼接检测方法》）（Proceedingsofthe9thACMWorkshoponMultimedia&Security，2007:51 - 62) (ACM多媒体与安全国际学术会议）中提出了一种图像拼接被动检测方法，该方法分别从图像的分块离散余弦变换（BlockDiscreteCosineTransform，BDCT)域和离散小波变换 (DiscreteWaveletTransform，DWT)域进行统计建模，提取BDCT域Markov特征和DWT域特征函数的Moment特征来区分真实图像和拼接图像；
[0005] 另经文献检索发现，HeZhong-Wei、LuWei和SunWei等在论文"Digital imagesplicingdetectionbasedonMarkovfeaturesinDCTandDWTdomain" （〈〈基于DCT域和DWT域Markov特征的数字图像拼接检测》）（PatternRecogniti on，2012, 45 (12) : 4292 - 4299)(模式识别杂志）中从变换域图像特征分析角度对图像拼接检测展开进一步研宄，该文利用Markov转移概率刻画拼接引起的图像BDCT系数和DWT系数的统计特性变化，对数字拼接图像进行鉴定。实验结果表明，DWT域Markov特征和BDCT 域Markov特征的有机结合能够有效地改善单一变换域特征的检测性能，然而所提取的高维统计特征也加大了算法的计算复杂度。总的来说，上述两种方法不仅具有较高的计算复杂度，而且在检测精度上仍需一定的提升空间。
[0006] 再经文献检索发现，TanXiao-Yang和TriggsBill在论文"Enhanced localtexturefeaturesetsforfacerecognitionunderdifficultlighting conditions"（《复杂光照环境下面向人脸识别的增强局部纹理特征集》）（IEEE TransactionsonImageProcessing, 2010, 19(6) : 1635 - 1650)(IEEE图像处理汇刊）中提出了一种面向人脸识别的空间域局部三值模式（LocalTernaryPattern，LTP)特征建模方法。
[0007] 空间域LTP特征建模过程如下所述：给定大小为(^〇2的图像I，设g。是图像I中半径为R的圆形L邻域上的中心像素点，其坐标为（x。，y。）（0 <Qrl，0 <Q2_1)， gl(l= 0, 1，2,…，L-l)是以像素点g。为中心、半径为R的圆形L邻域上的采样点，其坐标为 (xc+RC〇S (2Jr1/L)，ye-Rsin(2Jr1/L))。若存在gl (1 = 0, 1，2,…，L-1)的坐标不能刚好落在图像I的像素点位置，那么该gl的取值可以通过其邻域像素进行双线性插值计算得到。对中心像素点g。所对应的半径为R的L邻域中的所有元素进行三值化，得到三值序列
[0008] LTPl；e(xc,yc) ={t(g〇-gc),t(g^g^ , ???,t(gL_rgc)}
[0009] 其中，g。为中心像素点，gpgp. . .、gM为经双线性插值计算得到的以像素点g。为中心、半径为R的圆形L邻域上的采样点；t(w)为三值编码函数，其计算公式如下：
[0011] 其中，e是阈值，可以根据实际需要进行设定。
[0012] 对给定图像I上的每个像素点（xe，y。）（0彡X。彡Q「1，0彡y#Q2_l)，分别将其作为中心像素点，利用上述方法计算其半径为R的圆形L邻域上所对应的三值序列 LTPl，k(x。，y。）；将这些三值序列分别分解为两个二值分量LTPl，k，p(x。，y。）和LTPl，k，n(x。，yc)，其中LTPuk，p(x。，y。）是将原始三值序列LTPUK(x。，y。）中的"-1"编码成"0"得到， LTPUN (x。，y。）则是将原始三值序列LTPUK (x。，y。）中的" 1"编码成" 0 "，将" -1"编码成 "1"得到；再分别将LTPUK，P(Xc;，y。）和LTPUK，N(Xc;，y。）作为二进制序列，按照二进制转十进制的计算方法，将其转换为十进制码，记作LTPCuk，p(x。，y。）和LTPCUK，N(x。，y。）。按照上述 LTPCuk，p(X。，y。）码和LTPCUK，N(x。，y。）码的计算步骤对图像I上所有像素点进行处理，再根据下式计算图像I的空间域LTP特征F:
[0013] F= {HL；E；a (k) |aG{P,N},kG[0,2L-1]},
[0015] 其中，HUK，P和\"依次分别表示十进制码LTPCuk，p和十进制码LTPCUK，N的直方图，S函数定义为
[0017] 给定一幅图像，按照上述空间域LTP特征建模方法得到的空间域LTP直方图维数为2lX2,而一般的LTP特征建模方法的直方图维数为该方法具有计算量小、存储空间小的优点。但是，基于空间域LTP特征建模方法得到的直方图特征与图像内容具有较大的相关性，不能很好地体现图像拼接过程中产生的边缘细节信息，导致基于空间域LTP特征建模方法的数字图像拼接检测精度较低，有效性有待加强。

【发明内容】

[0018] 本发明的目的在于针对上述现有技术的不足，提出一种基于频域局部统计模型的数字图像拼接被动检测方法，不仅具有较高的检测正确率，而且计算复杂度也有了较大的提尚。
[0019] 本发明是通过以下技术方案实现的：
[0020] 自然图像的频域系数（如BDCT系数和DWT系数）往往具有一定的局部相关性，图像篡改往往会使这些局部相关性发生变化，而LTP特征能够较好地描述图像局部统计特性，对BDCT系数和DWT系数，利用这个特点进行LTP特征提取。首先分别提取自然图像的 BDCT域LTP特征和DWT域LTP特征，然后将所提取的BDCT域LTP特征和DWT域LTP特征进行组合，得到的组合特征用于图像拼接检测，再利用核主成分分析（KernelPrincipal ComponentAnalysis，KPCA)对所获得的组合特征进行降维处理以提高算法的计算效率，最后通过支持向量机（SupportVectorMachine，SVM)分类判决技术对图像的真伪性进行鉴定。
[0021] 一种基于频域局部统计模型的数字图像拼接被动检测方法，具体包括如下步骤：
[0022] ①提取训练集中的图像的频域LTP特征，具体是：
[0023] 1)将大小为QiXQ2的图像划分为
个互不重叠且大小为bXb的图像块，得到分块矩阵
[0025] 其中，乂'5表不分块大小为bXb的图像分块矩阵，
表不大小为 bXb的图像像素矩阵，bG{4, 8, 16};
[0026] 2)对每一个图像像素矩阵;^实施二维DCT变换，得到分块大小为bXb的BDCT系数矩阵
[0028] 其中，Yb表示分块大小为bXb的BDCT系数矩阵，
表示大小为bXb的DCT系数矩阵，bG{4, 8, 16}，其中，矩阵C的元素为
[0030] 3)选取邻域元素数目L= 8、半径RG{1，2}和e= 〇. 9,对取绝对值后的BDCT 系数矩阵Yb(be{4, 8, 16})进行LTP特征提取，再将所得的LTP特征进行组合，得到BDCT域的LTP特征：
[0032] 4)选取Meyer小波函数对图像进行一级小波变换，得到图像的低频子带、水平高频子带、竖直高频子带和对角高频子带，依次分别记作CA、CH、CV和CD;
[0033] 5)选取邻域元素数目L= 8、半径R= 1和e= 1. 5,分别计算取绝对值后的子带 CH的LTP特征、取绝对值后的子带CV的LTP特征和取绝对值后的子带CD的LTP特征，依次分别记作Fg、Fg和;然后将这三个子带的LTP特征进行组合，得到DWT域LTP特征：
[0035] 6)将步骤3)中的BDCT域LTP特征和步骤5)中的DWT域LTP特征进行组合，得到用于图像拼接检测的频域LTP特征
[0036] n={nf|f G{BDCT，DWT}}。
[0037] ②对频域LTP特征进行规范化处理，利用KPCA对规范化后的频域LTP特征进行降维处理；
[0038] ③将降维后的特征输入SVM分类器进行训练，保存已训练好的分类器；
[0039] ④提取待测图像的频域LTP特征，并进行规范化和降维处理；
[0040] ⑤利用步骤③训练好的SVM分类器与步骤④得到降维特征进行比较，以鉴定待测图像的真伪性。
[0041] 所述的SVM分类过程，包括以下步骤：
[0042] 1)用一些已知类别的图像构成训练集（包括真实图像和拼接图像），对训练集的每一幅图像提取上述频域LTP特征，并用不同的标志位来标志其图像所属类别，例如真实图像用标志位"-1"表示，拼接图像用标志位" 1"表示；
[0043] 2)SVM分类器核函数选用径向基函数，首先使用KPCA对规范化处理后的训练集特征进行降维处理，然后将降维后的训练集特征送入SVM，获得交叉验证准确率最高的最优参数c和丫，并用它们训练SVM;
[0044] 3)提取待测图像的频域LTP特征，对其进行规范化和KPCA降维处理，再使用训练好的SVM对待测图像所述类别进行鉴定。
[0045] 与现有技术相比，本发明的有益效果是：
[0046] 针对图像拼接篡改，提取图像的频域LTP特征，同时结合KPCA特征降维处理，利用分类器进行分类，较好地解决了图像拼接盲检测问题。
[0047] 对于要进行篡改鉴别的图像，通过提取其频域LTP特征，结合KPCA特征降维，再经过分类器分类判决即可给出其鉴定结果。
[0048] 将KPCA用于特征降维，在有效降低特征维数的前提下，仍然能够保证较高的检测准确率。
[0049] 在检测精度和计算效率上均具有明显优势。
【附图说明】
[0050] 图1是本发明的检测方法框图；
[0051] 图2是本发明的特征提取流程图；
[0052] 图3是计算LTP特征采用的圆形邻域示意图。
【具体实施方式】
[0053] 下面结合附图和具体实施实例对本发明的技术方案做详细说明。
[0054] 本发明使用哥伦比亚大学建立的图像拼接检测评估数据库（CISDED)作为基准数据库，该数据库已经广泛应用于图像拼接检测领域，包含了 933幅真实图像和912幅拼接图像，图像尺寸均为128X128,数据类型为BMP格式，可通过http://www.ee.Columbia. edu/ln/dvmm/downloads/AuthSplicedDataSet/AuthSplicedDataSet.htm获得。本发明中的SVM分类器选用台湾大学林智仁教授团队开发的LIBSVM软件包，该软件可通过http:// www.csie.ntu.edu.tw/~cjlin/libsvm/下载，其中SVM分类器的核函数选择径向基核函数（RBF)。下面给出详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的技术方案。
[0055] 基于上述的CISDED图像库，本发明的具体实施过程如下：
[0056]①随机地从真实图像中选取778幅（约占真实图像的5/6)、拼接图像中选取760 幅（约占拼接图像的5/6)组成训练集，其余图像组成测试集：将933幅真实图像编号为1 至933,利用随机函数，产生一组1-933之间的随机数，将图像按照随机数的编号重新排列，取前778幅作为训练集部分，剩余作为测试集部分；同理，在拼接图像上进行类似的操作，可以构建训练集和测试集；
[0057] ②对训练集中的图像进行频域LTP特征提取：
[0058] 第一步：将图像划分为
个互不重叠且大小为bXb的图像块，得到分块矩阵
[0060] 其中，乂'5表不分块大小为bXb的图像分块矩阵，
表不大小为 bXb的图像像素矩阵，bG{4, 8, 16};
[0061] 第二步：对每一个图像像素矩阵夂^实施二维DCT变换，得到分块大小为bXb的 BDCT系数矩阵
[0062]
[0063] 其中，Yb表示分块大小为bXb的BDCT系数矩阵，
1表示大小为bXb的DCT系数矩阵，bG{4, 8, 16}，其中，矩阵C的元素为
[0065] 第三步：选取邻域元素数目L= 8、半径RG{1，2}和e=〇? 9,对取绝对值后的 BDCT系数矩阵Yb(be{4, 8, 16})进行LTP特征提取，再将所得的LTP特征进行组合，得到 BDCT域的LTP特征：
[0067] 第四步：选取Meyer小波函数对图像进行一级小波变换，得到图像的低频子带、水平高频子带、竖直高频子带和对角高频子带，依次分别记作CA、CH、CV和CD;
[0068] 第五步：选取邻域元素数目L= 8、半径R= 1和e= 1. 5,分别计算取绝对值后的子带CH的LTP特征、取绝对值后的子带CV的LTP特征和取绝对值后的子带CD的LTP特征，依次分别记作^巧和咬？；然后将这三个子带的LTP特征进行组合，得到DWT域 LTP特征：
[0070] 第六步：将第三步计算得到的BDCT域LTP特征和第五步计算得到的DWT域LTP特征进行组合，得到用于图像拼接检测的频域LTP特征
[0071] n={nf|f G{BDCT,DWT}}
[0072] ③利用KPCA对规范化后的训练集特征和测试集特征进行降维处理，降维后的特征维数d取400 ;
[0073] 所述的规范化处理，具体是：
[0074] 令P= [^，，…，& ]7'表示原始特征集，其中，M表示图像样本个数，&表示第i幅图像的原始特征，Pi(l<i<M)表示规范化处理后的第i幅图像的特征，规范化处理的公式如下：
[0076] 其中，MinValue表示的最小值，MaxValue表示的最大值。
[0077] 所述的KPCA降维方法的具体步骤如下：
[0078] 1)计算核矩阵K:
[0079] KiJ=<pi,pJ>
[0080]其中，<Pi，Pj>表示pJPp』的内积，1彡i彡M，1彡j彡M;
[0081] 2)对K进行中心化处理：
[0083] 其中，义表示中心化处理后的核矩阵；
[0084] 3)首先利用公式￡// =似对矩阵元进行对角化，其中，H= [hpl^，…，hM]为特征向量矩阵，对角矩阵A=diagUi，A2，…，AM)的对角元素\(1彡i彡M)为特征值；然后对\(1彡i彡M)按照从大到小的顺序进行排序得到排序后的特征值对特征值进行排序后相应的特征向量记作从）；最后取前d(d彡M)个主特征向量,利用公式
I进行归一化处理得到特征向量 a!(1 <i<d);
[0085] 4)计算降维特征：
[0087] 其中，其中表示经过KPCA降维后的第i幅图像的特征，< 表示向量 ad的第j位置处的元素。
[0088] ④用降维后的训练特征集训练SVM分类器，保存已训练好的分类器。其中，SVM分类器中的径向基核函数（RBF)的最优参数是通过6折交叉验证和网格搜索算法计算得到，网格参数（C，y)G{2、|iG{〇,1，…，10}，j G{-5, -4,…，3}}。
[0089] ⑤提取测试集中图像的频域LTP特征，并进行规范化和降维处理。
[0090] ⑥利用训练好的SVM，对规范化和降维处理后的测试集进行分类判决，记录检测正确率。为了减小图像样本随机性的影响，上述实验被重复进行100次，检测正确率取100次实验的平均值。
[0091] 本实施案例的计算机硬件系统为Intel E7500CPU，2G内存，操作系统平台为 Windows XP Professional2002。总的时间耗费包括特征提取时间、降维时间（未采用降维算法的降维时间计为0)、SVM训练与测试时间（交叉验证和网格参数搜索时间均计入）。实验结果如表1和表2所示。由表1可以看出，本发明的检测正确率比现有两种方法分别提高了 1.92%和3. 95%。由表2可以看出，与上述算法相比，本发明具有更高的计算效率。由此可见，与现有典型图像拼接检测算法相比，本发明在检测精度和计算效率上都有了显著的提高。
[0092] 表1检测正确率比较
[0094] 表2时间耗费比较
【主权项】
1. 一种基于频域局部统计模型的数字图像拼接被动检测方法，其特征在于：该方法包括： ① 提取训练集中的图像的频域LTP特征； ② 对频域LTP特征进行规范化处理，利用KPCA对规范化后的频域LTP特征进行降维处理； ③ 将降维后的特征输入SVM分类器进行训练，保存已训练好的分类器； ④ 提取待测图像的频域LTP特征，并进行规范化和降维处理； ⑤ 利用步骤③训练好的SVM分类器与步骤④得到降维特征进行比较，以鉴定待测图像的真伪性。2. 根据权利要求1所述的基于频域局部统计模型的数字图像拼接被动检测方法，其特征是，所述的图像频域LTP特征提取，具体包括以下步骤： 1) 将大小Sq1Xq2的图像划分为~ Μ)个互不重叠且大小为 bXb的图像块，得到分块矩阵其中，Xb表示分块大小为bXb的图像分块矩阵，尤（1彡i彡r，1彡j彡s)表示大小为bXb的图像像素矩阵，b e {4, 8, 16}; 2) 对每一个图像像素矩阵X,6,实施二维DCT变换，得到分块大小为bXb的BDCT系数矩阵其中，Yb表示分块大小为b X b的BDCT系数矩阵，匕=,π? ?·, 1 5Ξ ./S .V)表示大小为bXb的DCT系数矩阵，b e {4, 8, 16}，其中，矩阵C的元素为3) 选取邻域元素数目L = 8、半径R e {1，2}和ε = 0. 9,对取绝对值后的BDCT系数矩阵Yb (b e {4, 8, 16})进行LTP特征提取，再将所得的LTP特征进行组合，得到BDCT域的 LTP特征： ^bdct = h e !4,8,16!, Δ = 8, Λ = {1,2! } 4) 选取Meyer小波函数对图像进行一级小波变换，得到图像的低频子带、水平高频子带、竖直高频子带和对角高频子带，依次分别记作CA、CH、CV和CD ; 5) 选取邻域元素数目L = 8、半径R = 1和ε = 1. 5,分别计算取绝对值后的子带CH 的LTP特征、取绝对值后的子带CV的LTP特征和取绝对值后的子带CD的LTP特征，依次分别记作巧巧、校!和^^纟;然后将这三个子带的LTP特征进行组合，得到DWT域LTP特征： I·?/ = 0e jC/y,CK,C7J!,/. = H,/^ = li 6) 将步骤3)中的BDCT域LTP特征和步骤5)中的DWT域LTP特征进行组合，得到用于图像拼接检测的频域LTP特征 Π = {nf|f e {BDCT，DWT}}。3.根据权利要求1所述的基于频域局部统计模型的数字图像拼接被动检测方法，其特征是，所述的训练集是由一些已知类别的图像构成，包括自然图像和拼接图像，对训练集的每一幅图像提取上述频域LTP特征，并用不同的标志位来标志其图像所属类别。
【专利摘要】本发明涉及的是一种基于频域局部统计模型的数字图像拼接被动检测方法，首先，提取训练集中的每一幅图像的频域LTP特征，利用核主成分分析(KPCA)对规范化处理后的特征进行降维处理；然后，将降维处理后的特征数据输入SVM分类器进行训练，得到训练好的分类器；最后，按上述方法提取待测图像的频域LTP特征，并进行规范化和降维处理，利用训练好的SVM分类器对待测图像的真伪性进行鉴定。本发明在检测精度和计算效率上均具有明显优势。
【IPC分类】G06T5/50, G06T3/40, G06K9/66
【公开号】CN104899846
【申请号】CN201510258216
【发明人】李生红, 张玉金, 张爱新, 王凡铭
【申请人】上海交通大学
【公开日】2015年9月9日
【申请日】2015年5月20日

2012-2014专利技术

最新回复(0)