图片分类方法及装置的制造方法

xiaoxiao2020-10-23 31

图片分类方法及装置的制造方法
【技术领域】
[0001]本公开涉及图像识别技术领域，尤其涉及一种图片分类方法及装置。
【背景技术】
[0002]卷积神经网络是近年来广泛应用于图像处理等领域的一种高效识别算法，是神经网络的一种结构。当卷积神经网络的结构搭建好后，卷积神经网络的训练与多层神经网络训练方式相同。如果直接应用卷积神经网络对图片进行分类识别，在卷积神经网络的最后一个全连接层后得到的特征直接输入到卷积神经网络的softmax层，softmax层的分类器应用多分类逻辑回归进行分类，分类方式较为单一，致使对图片的分类精确度不高。

【发明内容】

[0003]为克服相关技术中存在的问题，本公开实施例提供一种图片分类方法及装置，用以提高对图片分类的精确度。
[0004]根据本公开实施例的第一方面，提供一种图片分类方法，包括:
[0005]将原始图片输入到训练后的卷积神经网络；
[0006]通过所述卷积神经网络的全连接层确定所述原始图片的特征参数；
[0007]将所述特征参数输入到训练后的支持向量机中，通过所述支持向量机对所述原始图片进行分类。
[0008]在一实施例中，所述将所述特征参数输入到支持向量机中，通过所述支持向量机对所述原始图片进行分类，可包括:
[0009]在所述支持向量机中确定与所述特征参数相对应的核函数；
[0010]根据所述核函数对所述原始图片进行分类。
[0011]在一实施例中，所述方法还可包括:
[0012]通过一组图片对所述卷积神经网络进行训练，确定所述卷积神经网络的全连接层参数，所述全连接层参数作为所述支持向量机的输入参数；
[0013]通过所述全连接层参数对所述支持向量机进行训练。
[0014]根据本公开实施例的第二方面，提供一种图片分类装置，包括:
[0015]输入模块，被配置为将原始图片输入到训练后的卷积神经网络；
[0016]确定模块，被配置为通过所述卷积神经网络的全连接层确定所述输入模块输入的所述原始图片的特征参数；
[0017]分类模块，被配置为将所述确定模块确定的所述特征参数输入到训练后的支持向量机中，通过所述支持向量机对所述原始图片进行分类。
[0018]在一实施例中，所述分类模块可包括:
[0019]确定子模块，被配置为在所述支持向量机中确定与所述确定模块确定的所述特征参数相对应的核函数；
[0020]分类子模块，被配置为根据所述确定子模块确定的所述核函数对所述原始图片进行分类。
[0021]在一实施例中，所述装置还可包括:
[0022]第一训练模块，被配置为通过一组图片对所述输入模块需要的所述卷积神经网络进行训练，确定所述卷积神经网络的全连接层参数，所述全连接层参数作为所述支持向量机的输入参数；
[0023]第二训练模块，被配置为通过所述第一训练模块训练的得到的所述全连接层参数对所述支持向量机进行训练。
[0024]根据本公开实施例的第三方面，提供一种图片分类装置，包括:
[0025]处理器；
[0026]用于存储处理器可执行指令的存储器；
[0027]其中，所述处理器被配置为:
[0028]将原始图片输入到训练后的卷积神经网络；
[0029]通过所述卷积神经网络的全连接层确定所述原始图片的特征参数；
[0030]将所述特征参数输入到训练后的支持向量机中，通过所述支持向量机对所述原始图片进行分类。
[0031]本公开的实施例提供的技术方案可以包括以下有益效果:通过将卷积神经网络的全连接层的特征参数输入到训练后的支持向量机中，通过支持向量机对原始图片进行分类，由于支持向量机有各种核函数可选，因此可以针对不同类的特征参数选取更合适的核函数，避免了采用单一的softmax分类器，从而可以使图片具有更好的识别效果，提高图片分类的精确度。
[0032]应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。
【附图说明】
[0033]此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。
[0034]图1A是根据一示例性实施例示出的图片分类方法的流程图。
[0035]图1B是根据一示例性实施例示出的卷积神经网络与支持向量机的示意图。
[0036]图2是根据一示例性实施例一示出的图片分类方法的流程图。
[0037]图3是根据一示例性实施例二示出的图片分类方法的流程图。
[0038]图4是根据一示例性实施例示出的一种图片分类装置的框图。
[0039]图5是根据一示例性实施例示出的另一种图片分类装置的框图。
[0040]图6是根据一示例性实施例示出的一种适用于图片分类装置的框图。
【具体实施方式】
[0041]这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
[0042]图1A是根据一示例性实施例示出的图片分类方法的流程图，图1B是根据一示例性实施例示出的卷积神经网络与支持向量机的示意图；该图片分类方法可以应用在终端设备(例如:智能手机、平板电脑、台式计算机)上，可以通过在智能手机或者平板电脑上安装应用的方式或者在台式计算机上安装软件的方式实现，如图1A所示，该图片分类方法包括以下步骤SlOl-S 103:
[0043]在步骤SlOl中，将原始图片输入到训练后的卷积神经网络。
[0044]在一实施例中，可以通过一组图片对卷积神经网络进行训练，得到训练后的卷积神经网络。
[0045]在步骤S102中，通过卷积神经网络的全连接层确定原始图片的特征参数。
[0046]在一实施例中，全连接层位于卷积神经网络的倒数第二层，当卷积神经网络训练好之后，在全连接层后得到经过卷积神经网络提取的特征参数。
[0047]在步骤S103中，将特征参数输入到训练后的支持向量机中，通过支持向量机对原始图片进行分类。
[0048]在一实施例中，训练完之后卷积神经网络的倒数第二层的所有节点作为特征参数输入到支持向量机中，在一实施例中，输入到支持向量机的特征参数为全连接层上的所有节点的值组成的向量。
[0049]如图1B所示，本公开所使用的网络包括:输入层11、卷积神经网络12和支持向量接13，其中，输入层11可以输入原始图片的像素值，卷积神经网络12的倒数第二层的所有节点作为特征参数输入到支持向量机13中，本领域技术人员可以理解的是，图1B仅作为示意性说明而非限制，只要能够将卷积神经网络12的倒数第二层的所有节点作为特征参数输入到支持向量机13从而实现对原始图片进行分类的实现方式均为本公开所涵盖。
[0050]本实施例中，通过将卷积神经网络的全连接层的特征参数输入到训练后的支持向量机中，通过支持向量机对原始图片进行分类，由于支持向量机有各种核函数可选，因此可以针对不同类的特征参数选取更合适的核函数，避免了采用单一的softmax分类器，从而可以使图片具有更好的识别效果，提高图片分类的精确度。
[0051]在一实施例中，将特征参数输入到支持向量机中，通过支持向量机对原始图片进行分类，可包括:
[0052]在支持向量机中确定与特征参数相对应的核函数；
[0053]根据核函数对原始图片进行分类。
[0054]在一实施例中，方法还可包括:
[0055]通过一组图片对卷积神经网络进行训练，确定卷积神经网络的全连接层参数，全连接层参数作为支持向量机的输入参数；
[0056]通过全连接层参数对支持向量机进行训练。
[0057]具体如何对图片进行分类的，请参考后续实施例。
[0058]至此，本公开实施例提供的上述方法，可以避免采用单一的softmax分类器，使图片具有更好的识别效果，提高图片分类的精确度。
[0059]下面以具体实施例来说明本公开实施例提供的技术方案。
[0060]图2是根据一示例性实施例一示出的图片分类方法的流程图；本实施例利用本公开实施例提供的上述方法，以如何确定支持向量机中的核函数为例进行示例性说明，如图2所示，包括如下步骤:
[0061]在步骤S201中，将原始图片输入到训练后的卷积神经网络。
[0062]在步骤S202中，通过卷积神经网络的全连接层确定原始图片的特征参数。
[0063]步骤S201和步骤S202的描述请参见上述步骤SlOl和步骤S102的描述，在次不再详述，
[0064]在步骤S203中，在支持向量机中确定与特征参数相对应的核函数。
[0065]在步骤S204中，根据核函数对原始图片进行分类。
[0066]在一实施例中，为了确保原始图片具有更好的识别率，由于支持向量机包括线性核函数和RBF核函数，因此本公开可以针对不同类的特征参数确定与特征参数更合适的核函数，避免了采用单一的softmax分类器。例如，如果特征参数本身比较稀疏或者明显线性可分，则既可以采用线性核函数也可以采用RBF核函数，对于线性核分类一般的情况或者明显特征线性不可分的情况，则可以采用RBF核函数，从而确保对原始图片的分类具有更显著的效果。
[0067]本实施例中，通过与特征参数相对应的核函数对原始图片进行分类，避免了采用单一的softmax分类器，使图片具有更好的识别效果，提高图片分类的精确度。
[0068]图3是根据一示例性实施例二示出的图片分类方法的流程图；本实施例利用本公开实施例提供的上述方法，以如何对卷积神经网络和支持向量机进行训练为例进行示例性说明，如图3所示，包括如下步骤:
[0069]在步骤S301中，通过一组图片对卷积神经网络进行训练，确定卷积神经网络的全连接层参数，全连接层参数作为支持向量机的输入参数。
[0070]在步骤S302中，通过全连接层参数对支持向量机进行训练。
[0071]在一实施例中，可以通过卷积神经网络采用相关技术中的训练方式对一组图片进行训练，在对卷积神经网络训练完成后，收敛结果即为卷积神经网络中的每个参数的值，将卷积神经网络的倒数第二层(即，全连接层)的所有节点作为特征参数输入到支持向量机中，进而对支持向量机进行训练，由于卷积神经网络的倒数第二层作为支持向量机的输入特征，以及输入特征对应的训练集的标签(label)，从而可以通过训练得到支持向量机的分类器的参数。
[0072]本实施例中，通过对卷积神经网络与支持向量机进行训练，从而使卷积神经网络与支持向量机进行结合，实现对原始图片的分类，由于在卷积神经网络的最后一个全连接层后得到的特征参数会直接输入支持向量机中，提高了对原始图片的识别分类强度，避免了将全连接层得到的特征参数输入到softmax层，采用多分类逻辑回归进行分类，由此提升了原始图片的识别效果，提高了图片分类的精确度。
[0073]图4是根据一示例性实施例示出的一种图片分类装置的框图，如图4所示，图片分类装置包括:
[0074]输入模块41，被配置为将原始图片输入到训练后的卷积神经网络；
[0075]确定模块42，被配置为通过卷积神经网络的全连接层确定输入模块41输入的原始图片的特征参数；
[0076]分类模块43，被配置为将确定模块42确定的特征参数输入到训练后的支持向量机中，通过支持向量机对原始图片进行分类。
[0077]图5是根据一示例性实施例示出的另一种图片分类装置的框图，如图5所示，在上述图4所示实施例的基础上，在一实施例中，分类模块43可包括:
[0078]确定子模块431，被配置为在支持向量机中确定与确定模块42确定的特征参数相对应的核函数；
[0079]分类子模块432，被配置为根据确定子模块431确定的核函数对原始图片进行分类。
[0080]在一实施例中，装置还可包括:
[0081]第一训练模块44，被配置为通过一组图片对输入模块41需要的卷积神经网络进行训练，确定卷积神经网络的全连接层参数，全连接层参数作为支持向量机的输入参数；
[0082]第二训练模块45，被配置为通过第一训练模块44训练的得到的全连接层参数对支持向量机进行训练。
[0083]关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
[0084]图6是根据一示例性实施例示出的一种适用于图片分类装置的框图。例如，装置600可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。
[0085]参照图6，装置600可以包括以下一个或多个组件:处理组件602，存储器604，电源组件606，多媒体组件608，音频组件610，输入/输出(I/O)的接口 612，传感器组件614，以及通信组件616。
[0086]处理组件602通常控制装置600的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理元件602可以包括一个或多个处理器620来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件602可以包括一个或多个模块，便于处理组件602和其他组件之间的交互。例如，处理部件602可以包括多媒体模块，以方便多媒体组件608和处理组件602之间的交互。
[0087]存储器604被配置为存储各种类型的数据以支持在设备600的操作。这些数据的示例包括用于在装置600上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器604可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。
[0088]电力组件606为装置600的各种组件提供电力。电力组件606可以包括电源管理系统，一个或多个电源，及其他与为装置600生成、管理和分配电力相关联的组件。
[0089]多媒体组件608包括在所述装置600和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件608包括一个前置摄像头和/或后置摄像头。当设备600处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
[0090]音频组件610被配置为输出和/或输入音频信号。例如，音频组件610包括一个麦克风(MIC)，当装置600处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器604或经由通信组件616发送。在一些实施例中，音频组件610还包括一个扬声器，用于输出音频信号。
[0091]I/O接口 612为处理组件602和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
[0092]传感器组件614包括一个或多个传感器，用于为装置600提供各个方面的状态评估。例如，传感器组件614可以检测到设备600的打开/关闭状态，组件的相对定位，例如所述组件为装置600的显示器和小键盘，传感器组件614还可以检测装置600或装置600一个组件的位置改变，用户与装置600接触的存在或不存在，装置600方位或加速/减速和装置600的温度变化。传感器组件614可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件614还可以包括光传感器，如CMOS或CXD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件614还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。
[0093]通信组件616被配置为便于装置600和其他设备之间有线或无线方式的通信。装置600可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信部件616经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信部件616还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UffB)技术，蓝牙(BT)技术和其他技术来实现。
[0094]在示例性实施例中，装置600可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSro)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。
[0095]在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器604，上述指令可由装置600的处理器620执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
[0096]本领域技术人员在考虑说明书及实践这里公开的公开后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。
[0097]应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
【主权项】
1.一种图片分类方法，其特征在于，所述方法包括: 将原始图片输入到训练后的卷积神经网络；通过所述卷积神经网络的全连接层确定所述原始图片的特征参数；将所述特征参数输入到训练后的支持向量机中，通过所述支持向量机对所述原始图片进行分类。2.根据权利要求1所述的方法，其特征在于，所述将所述特征参数输入到支持向量机中，通过所述支持向量机对所述原始图片进行分类，包括: 在所述支持向量机中确定与所述特征参数相对应的核函数；根据所述核函数对所述原始图片进行分类。3.根据权利要求1所述的方法，其特征在于，所述方法还包括: 通过一组图片对所述卷积神经网络进行训练，确定所述卷积神经网络的全连接层参数，所述全连接层参数作为所述支持向量机的输入参数；通过所述全连接层参数对所述支持向量机进行训练。4.一种图片分类装置，其特征在于，所述装置包括: 输入模块，被配置为将原始图片输入到训练后的卷积神经网络；确定模块，被配置为通过所述卷积神经网络的全连接层确定所述输入模块输入的所述原始图片的特征参数；分类模块，被配置为将所述确定模块确定的所述特征参数输入到训练后的支持向量机中，通过所述支持向量机对所述原始图片进行分类。5.根据权利要求4所述的装置，其特征在于，所述分类模块包括: 确定子模块，被配置为在所述支持向量机中确定与所述确定模块确定的所述特征参数相对应的核函数；分类子模块，被配置为根据所述确定子模块确定的所述核函数对所述原始图片进行分类。6.根据权利要求4所述的装置，其特征在于，所述装置还包括: 第一训练模块，被配置为通过一组图片对所述输入模块需要的所述卷积神经网络进行训练，确定所述卷积神经网络的全连接层参数，所述全连接层参数作为所述支持向量机的输入参数；第二训练模块，被配置为通过所述第一训练模块训练的得到的所述全连接层参数对所述支持向量机进行训练。7.一种图片分类装置，其特征在于，所述装置包括: 处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为: 将原始图片输入到训练后的卷积神经网络；通过所述卷积神经网络的全连接层确定所述原始图片的特征参数；将所述特征参数输入到训练后的支持向量机中，通过所述支持向量机对所述原始图片进行分类。
【专利摘要】本公开是关于一种图片分类方法及装置，用以提高图片分类的准确性。所述方法包括：将原始图片输入到训练后的卷积神经网络；通过所述卷积神经网络的全连接层确定所述原始图片的特征参数；将所述特征参数输入到训练后的支持向量机中，通过所述支持向量机对所述原始图片进行分类。本公开技术方案可以避免采用单一的softmax分类器，使图片具有更好的识别效果，提高图片分类的精确度。
【IPC分类】G06K9/62
【公开号】CN104899610
【申请号】CN201510363919
【发明人】龙飞, 汪平仄, 侯文迪
【申请人】小米科技有限责任公司
【公开日】2015年9月9日
【申请日】2015年6月26日

2012-2014专利技术

最新回复(0)