控制方法、控制程序以及控制装置的制造方法
【技术领域】
[0001 ] 本发明涉及控制方法、控制程序以及控制装置。
【背景技术】
[0002]已知一种为了在从对象用户终端向其它用户终端分配图像时,减少对网络的负荷,对象用户终端根据图像数据计算特征量并向其它用户终端发送的技术(例如,参照下述专利文献I)。另外,已知一种根据特征量来分组各数据的技术。
[0003]另外,已知一种为了减少移动电话中的处理负荷,代理服务器代替移动电话,对根据来自移动电话的内容的阅览请求,从内容服务器获取的内容进行分析的技术(例如,参照下述专利文献2)。
[0004]专利文献1:日本特开2004 - 46641号公报
[0005]专利文献2:日本特开2005 - 56096号公报
[0006]然而,在根据各数据具有的特征量来分组各数据时,存分类精度因特征量的种类而降低的问题点。
【发明内容】
[0007]在一个方面,本发明的目的在于提供一种能够实现分类精度的提高的控制方法、控制程序以及控制装置。
[0008]根据本发明的一个方面,提出一种控制方法、控制程序以及控制装置,其中,根据规定数据具有的各种特征量中的规定种类的特征量将上述规定数据分类为多个组中的任意一个并使存储部存储的计算机执行如下的处理:针对上述多个组的每个,将分类出的表示上述规定数据中的特征量的分布位置的信息写入上述存储部;基于写入的表示上述特征量的分布位置的信息来计算表示上述多个组间的上述特征量的分布位置间的接近度的信息;在计算出的表示上述分布位置间的接近度的信息满足规定条件的情况下,根据上述各种特征量中的与上述规定种类不同种类的特征量将与上述规定数据同种的数据分类为上述多个组中的任意一个,并使上述存储部存储。
[0009]根据本发明的一个方面,能够实现分类精度的提高。
【附图说明】
[0010]图1是表示增加特征量的种类的例子的说明图。
[0011]图2是表示减少特征量的种类的例子的说明图。
[0012]图3是表示实施方式所涉及的控制装置和分类装置的每个的硬件构成例的框图。
[0013]图4是表示存储针对各簇的多个种类的每个的特征量的数据库的说明图。
[0014]图5是表示分类装置的功能构成的框图。
[0015]图6是表示基于簇分析部的聚类的说明图。
[0016]图7是表示控制装置的功能构成的框图。
[0017]图8是表示基于分类装置的聚类处理顺序的一个例子的流程图。
[0018]图9是表示基于控制装置的控制处理顺序的一个例子的流程图。
[0019]图10是表示基于控制装置的详细的控制处理顺序的一个例子的流程图。
[0020]图11是表示基于控制装置的详细的控制处理顺序的其它例子的流程图。
【具体实施方式】
[0021]以下参照添加附图,详细地对本发明所涉及的控制方法、控制程序以及控制装置的实施方式进行说明。
[0022]图1是表示增加特征量的种类的例子的说明图。进行图1的聚类的系统100具有控制装置101和分类装置102。在图1的例子中,根据各数据具有的特征量X以及特征量Y将各数据分类为3个组。图表111中示出各数据的特征量X和特征量Y的组合的分布位置。此处的组称为簇,将进行分类称为聚类。聚类的利用例例如例举用于对录音的会议的声音数据的各数据标记出席者的聚类。例如,作为数据,例举录音的声音数据等,作为簇,例举录音成声音数据的会议的出席者。
[0023]控制装置101是对根据规定数据具有的各种特征量中的规定种类的特征量将规定数据聚类为多个簇中的任意一个的计算机即分类装置102进行控制的计算机。规定数据如上述,例举声音数据等。控制装置101例如是服务器。分类装置102例如是移动终端装置。例如从数字化的声音数据获得MFCC (Mel — Frequency Cepstral Coefficient:梅尔频率倒谱系数)、音调、GPR(Glottal Pulse Rate:声门脉冲率)、VTL(Vocal Tract Length:声道长度)等多个种类的特征量。分类装置102能够计算多个种类的特征量的全部,并能够根据来自控制装置101的指示来变更对多个种类中的哪个种类进行计算。对于多个种类中的规定种类,是分类装置102能够计算的特征量的种类中的、任意或者由用户指定,或者过去通过控制装置101指示的种类。在图1的例子中,规定种类为I个以上的种类。
[0024]控制装置101针对多个簇的每个,将表示规定数据中的特征量的分布位置的信息写入存储部。此处,该信息是通过分类装置102分类出的表示规定数据中的特征量的分布位置的信息。对于表示特征量的分布位置的信息,可以从分类装置102接收,也可以从控制装置101能够访问的存储装置读取,也可以通过输入单元从控制装置101的用户输入。此处,设控制装置101接收从分类装置102发送的与分布位置有关的信息。另外,存储部是RAM、磁盘等的控制装置101具有的存储装置。表示有关各簇的特征量的分布位置的信息例如可以是被分类成各簇的数据的特征量本身,也可以是通过将特征量模型化而获得的表示有关各簇的特征量的分布范围的信息。
[0025]在图1的例子中,各图表111、112上所示的三角形、正方形,菱形的形状的各点表示与被归一化的特征量的分布位置有关的信息。图表111上所示的各圆圈是表示通过根据被归一化的特征量进行模型化而获得的有关各簇的分布范围arll、arl2、arl3的信息。图表112上也同样地,未附加符号,但存在表示有关簇的分布范围的信息。具体地表示分布范围aril、arl2、arl3的信息具有中心位置、椭圆的直径的长度等即可。与特征量的分布位置有关的信息可以是多个信息的集合,也可以如表示有关各簇的特征量的分布范围arll、arl2、arl3的信息那样是一个信息。
[0026]由于与特征量的分布位置有关的信息被归一化,所以图1所示的各图表111、112的轴的单位相同,即使是不同的种类的特征量,控制装置101也能够比较位置、长度。对于归一化,可以由分类装置102进行,也可以由控制装置101进行。通过在分类装置102进行聚类时对各特征量被归一化所得的值进行模型化,而能够使从分类装置102向控制装置101的通信量降低。
[0027]接下来,控制装置101基于写入到存储部的表示特征量的分布位置的信息,导出表示多个簇之间的特征量的分布位置的接近度的信息。在图1的例子中,表示接近度的信息是表示分布范围arll、arl2、arl3的重复程度的信息。更具体而言,是连结各分布范围arll、arl2、arl3的中心间的线段中的重复的区域所包含的线段的长度。如上述,由于表示分布范围arll、arl2、arl3的信息被归一化,所以即使是不同的种类的特征量也能够进行比较。在图1的例子中,表示簇a与簇b的接近度的信息为长度dl,但表示簇a与簇c的接近度的信息为0,表示簇b与簇c的接近度的信息为O。
[0028]或者,例如,表示接近度的信息可以是有关多个簇的每个的特征量的平均值、中央值间的分布位置的距离。或者,例如,表示接近度的信息也可以是有关多个簇的每个的特征量中的分布位置最近的特征量的分布位置间的距离,也可以是最远的特征量的分布位置间的距离。
[0029]控制装置101判定导出的表示接近度的信息是否满足规定条件。例如,规定条件是指比规定的接近度近。规定的接近度由控制装置101的设计者设定。在图1的例子中,例如,控制装置101判定表示簇a与簇b的接近度的信息即dl是否是阈值以上。阈值也可以由控制装置101的设计者设定,也可以是经由输入单元由用户输入的值。另外,阈值被存储在控制装置101能够访问的存储装置中。
[0030]控制装置101在判定为满足规定条件的情况下,进行根据各种特征量中的与规定种类不同种类的特征量使分类装置102将与规定数据同种的数据聚类为多个簇中的任意一个的控制。与规定数据同种的数据是具有与规定数据同种的特征量的数据,与规定数据同种的数据可以是同一数据,也可以是不同的数据。从各种特征量中的与规定种类不同的种类选择哪个种类后述。例如,控制装置101可以通过对分类装置102发送表示根据不同的种类进行分类的信息来控制分类装置102。由此,能够变更特征量的种类,并实现分类精度的提高。
[0031]另外,控制装置101在判定为满足规定条件的情况下,进行根据追加与规定种类不同的种类后的种类的特征量使分类装置102将与规定数据同种的数据聚类为多个簇中的任意一个的控制。在图表112中,由于追加了特征量Z,所以与图表111相比轴增加一个。由此,能够追加特征量的种类,并实现分类精度的提高。<
br>[0032]图2是表示减少特征量的种类的例子的说明图。控制装置200是对能够根据规定数据具有的多个种类的特征量将规定数据聚类为多个簇中的任意一个的分类装置102进行控制的计算机。
[0033]控制装置200将表示多个数据的每个中的多个种类的特征量的分布位置的信息写入存储部。数据可以与图1所示的例子相同。图表211中示出各数据的特征量X和特征量Y的组合的分布位置。在图2的例子中,对于表示分布位置的信息,也与图1所说明的例子同样地,如图表211所示,可以获取表示分布范围ar21、ar22、ar23的信息。控制装置200基于写入的表示多个种类的特征量的分布位置的信息,针对多个种类的各组合,计算组合所包含的表示各种类的特征量的相关的强度的信息。具体而言,控制装置200对多个种类的各组合计算相关系数。相关系数表示越是与I或者一 I接近的值,2个组合的值的相关越强,表示越是与O接近的值,2个组合的值的相关越弱。
[0034]控制装置200确定多个种类的各组合中计算出的信息所表示的相关的强度为规定的强度以上的组合。对于规定的强度,预先由控制装置200的设计者、控制装置200的用户设定。表示相关的强度的信息为相关系数的情况下,控制装置200确定多个种类的各组合中计算出的相关系数的绝对值为规定值以上的组合。设有关图2所示的特征量X和特征量Y的相关系数为阈值以上。
[0035]控制装置200进行根据从多个种类除去确定出的组合所包含的各种类的任意一个种类之外的种类的特征量使分类装置102将规定数据分类为多个簇中的任意一个的控制。由此,能够维持分类精度,并根据最小限度的种类的特征量来进行分类。
[0036]另外,控制装置200对确定出的组合所包含的各种类中的、确定出的组合所包含的种类的特征量的偏差程度较大的一方的种类进行确定。在图2的例子中,控制装置200对各种类方向计测各分布范围的长度。控制装置200计算按照每个种类计测出的长度的合计值。在图2的例子中,有关特征量X的偏差程度为dx21、dx22、和dx23的合计值,有关特征量Y的偏差程度为dy21、dy22、和dy23的合计值。此处,将计算出的合计值作为偏差程度,控制装置200将合计值较大的一方的种类确定为偏差程度较大的一方的种类。在图2的例子中,由于作为纵向的种类的特征量Y的合计值比作为横方向的种类的特征量X的合计值大,所以控制装置200确定特征量Y。
[0037]而且,控制装置200也可以进行根据从多个种类除去确定出的种类之外的种类的特征量使分类装置102将规定数据分类为多个簇中的任意一个的控制。在图2的例子中,控制装置200进行根据特征量X使分类装置102将规定数据分类为多个簇中的任意一个的控制。在图表212中示出仅利用特征量X进行分类的例子。由此,由于偏差小的一方的种类的特征量与偏差大的一方的种类的特征量相比分类精度较高,所以能够根据最小限度的种类的特征量,且分类精度较高的种类的特征量来进行分类。
[0038](控制装置的硬件构成例)
[0039]图3是表示实施方式所涉及的控制装置和分类装置的每个的硬件构成例的框图。系统100具有控制装置300和分类装置102。此处,控制装置300是都具有图1所说明的控制装置101和图2所说明的控制装置200的功能的计算机。图3中,控制装置300具有CPU (Central Processing Unit:中央处理单元)301、存储装置302、和网络I/FdnterFace:接口)303。另外,各部通过总线304分别连接。
[0040]此处,CPU301管理控制装置300的整体的控制。CPU301通过执行存储在存储装置302中的各种程序,读出存储装置302内的数据,或将成为执行结果的数据写入存储装置302。
[0041]存储装置302 是 ROM (Read Only Memory)、RAM (Random Access Memory)、闪存、磁盘驱动器等存储部。变为CPU301的工作区,或存储各种程序、各种数据。
[0042]网络I/F303 通过通信线路与 LAN(Local Area Network:局域网)、WAN (Wide AreaNetwork:广域网)、因特网等网络NET连接,并经由该网络NET与分类装置102连接。而且,网络I/F303管理网络NET和内部的接口,并控制来自外部装置的数据的输入输出。网络I/F303能够采用例如调制解调器、LAN适配器等。
[0043]另外,分类装置102具有CPU311、存储装置312、网络I/F313、输入装置314、输出装置315、和传感器316。另外,各部通过总线317分别连接。
[0044]此处,CPU311管理分类装置102的整体的控制。CPU311通过执行存储在存储装置312中的各种程序,来读出存储装置312内的数据,或将成为执行结果的数据写入存储装置312。
[0045]对于存储装置312,例举R0M、RAM、闪存、磁盘驱动器等。变为CPU311的工作区,或者存储各种程序、各种数据。
[0046]网络I/F313通过通信线路与LAN、WAN、因特网等网络NET连接,并经由该网络NET与控制装置300连接。而且,网络I/F313管理网络NET和内部的接口,并控制来自外部装置的数据的输入输出。网络I/F313能够采用例如调制解调器、LAN适配器等。
[0047]输入装置314是通过用户操作键盘、鼠标、触摸面板等来进行各种数据的输入的接口。另外,输入装置314也能够从照相机获取图像、视频。
[0048]输出装置315是根据CPU311的指示输出数据的接口。输出装置315例举显示器、打印机。
[0049]传感器316例如对设置有分类装置102的设置位置的规定的位移量进行检测。例如,传感器316能够检测声音,或检测温度。
[0050]图4是表示存储有关各簇的多个种类的每个的特征量的数据库的说明图。此处,将簇设为会议的出席者候补。数据库400具有出席者候补、以及多个种类的特征量的分布位置的字段。通过在各字段设定信息,来存储记录(例如,401 — 1、401 — 2?)。数据库400通过存储装置来实现。
[0051]例如,在出席者候补的字段登记有表示会议的出席者的候补的识别信息。例如,在特征量的分布位置的字段登记有与有关各出席者候补的声音有关的特征量的分布位置所涉及的信息。对于与各声音有关的特征量的分布位置所涉及的信息,例如特征量被归一化而被登记到数据库400,即使是不同的种类的特征量,也能够通过控制装置300进行比较。
[0052]另外,例如对于各种类,可以将与多个分布位置有关的信息存储在数据库400中。或者,例如也可以存储有关各出席者候补的各种类的特征量的分布位置的最小值、以及最大值,也可以存储多个特征量的分布位置被模型化的分布范围。
[0053](分类装置102的功能构成例)
[0054]图5是表示分类装置的功能构成的框图。分类装置102具有接收部501、选择指示部502、传感器部503、特征量计算部504、簇分析部505、特征量存储部506、簇模型化部507、和发送部508。发送部508和接收部501通过网络I/F313来实现。
[0055]从选择指示部502起,簇分析部505、和簇模型化部507可以由作为逻辑积电路的AND、作为负逻辑电路的反相器(INVERTER)、作为逻辑和电路的OR、作为锁存电路的FF(Flip Flop:触发器)等元件形成。或者,选择指示部502、传感器部503、特征量计算部
504、簇分析部505、和簇模型化部507的处理例如被编码成存储在CPU311能够访问的存储装置312中的分类程序。而且,CPU311从存储装置312读出分类程序,执行被编码成分类程序的处理。由此,可以实现选择指示部502、传感器部503、特征量计算部504、簇分析部
505、和簇模型化部507的处理。
[0056]传感器部503能够检测控制装置300中的位移量。例如图1所说明那样,作为位移量,例举声音。例如,传感器部503检测声音。传感器部503可以例如如第I?第m传感器部503 — I?503 — m那样设置多个传感器部503,并利用多个传感器部503来检测声音。通过选择指示部502来选择多个传感器部503 — I?503 — m中的哪个传感器部503进行动作。
[0057]特征量计算部504能够计算从由传感器部503检测出的数据获得的多个种类的特征量。例如,特征量计算部504能够计算多个种类的每个,分别利用第I?第η特征量计算部504 — I?504 — η计算η种类的特征量的每个。通过选择指示部502来指示选择第I?第η特征量计算部504 — I?504
— η中的哪个特征量计算部504。
[0058]簇分析部505根据由特征量计算部504计算出的特征量来进行聚类。
[0059]图6是表示基于簇分析部的聚类的说明图。图表600中示出根据从各数据获得的特征量X和特征量Y的组合的分布位置而聚类为哪个簇。例如,按照每个簇预先定义有关各种类的特征量的阈值,簇分析部505通过判定由特征量计算部504计算出的特征量是否是各阈值以下来进行聚类。图6的图表600内所记载的倾斜的线11、12表示阈值。例如,控制装置300根据图表600上,各数据具有的特征量X和特征量Y的组合包含在簇a?d的哪个区域来进行聚类。
[0060]特征量存储部506对由特征量计算部504计算出的一定时间量的特征量进行存储。一定时间由分类装置102的设计者设定。特征量存储部506通过存储装置312来实现。
[0061]接收部501从控制装置300接收与根据多个种类中的哪个种类的特征量来进行聚类有关的信息。另外,接收部501也可以从控制装置300接收在通过簇分析部505进行聚类时所使用的阈值。
[0062]选择指示部502基于由接收部501接收到的信息来指示传感器部503使传感器部503内的哪个执行,并指示特征量计算部504使特征量计算部504内的哪个执行。并且,选择指示部502指示簇分析部505根据哪个种类的特征量进行聚类。
[0063]簇模型化部507每隔一定时间或者按照由用户指定的定时,根据存储在特征量存储部506中的最近的一定时间的指定的各种类的特征量来进行模型化。作为模型化的手法,例如例举k 一平均法。例如,簇模型化部507通过k 一平均法进行模型化,按照每个簇生成图1和图2所示的表示分布范围的信息。并且,簇模型化部507对表示分布范围的信息进行归一化。
[0064]发送部508向控制装置300发送通过簇模型化部507所得到的表示分布范围的信息。或者,发送部508也可以向控制装置300发送通过簇分析部505所得到的表示特征量的分布位置的信息。此处,分类装置102向控制装置300发送表示特征量的分布位置的信息或者表示特征量的分布范围的信息,但也可以存储在控制装置300和分类装置102都能够访问的存储装置中。
[0065](控制装置300的功能构成例)
[0066]图7是表示控制装置的功能构成的框图。控制装置300具有获取部701、第I导出部702、判定部703、检测部704、第2导出部705、提取部706、计算部707、确定部708、种类确定部709、以及控制部710。从获取部701至控制部710的处理具体而言例如被编码为存储在存储装置303中的控制程序。而且,CPU302通过执行从存储装置303读取解析程序,并被编码为解析程序的处理,来实现从获取部701部到控制部710的处理。或者,CPU302也可以经由网络I/F303从网络NET获取解析程序。如图1所说明那样,组称为簇。
[0067]获取部701针对多个簇的每个,获取由分类装置102分类出的表示规定数据中的特征量的分布位置的信息,并存储于存储部。如使用图1所说明那样,表示特征量的分布位置的信息可以是特征量被归一化后的值,也可以是表示特征量的分布范围的信息。具体而言,如图7所示,获取部701可以通过接收部711从分类装置102接收,也可以从控制装置300能够访问的存储装置获取从分类装置102获得的表示特征量的分布位置的信息。或者,如果在控制装置300设置输入单元,则也可以经由输入单元接受从分类装置102获得的表示特征量的分布位置的信息的输入。
[0068]第I导出部702基于由获取部701获取的表示特征量的分布位置的信息,导出表示多个簇间的特征量的分布位置的接近度的信息。如使用图1所说明那样,例如,表示特征量的分布位置的接近度的信息可以是表示分布范围的重复程度的信息,也可以是最近的分布位置间的距离、平均的分布位置间的距离。
[0069]判定部703判定由第I导出部702导出的表示接近度的信息是否满足规定条件。在由判定部703判定为满足规定条件的情况下,控制部710进行根据各种特征量中的与规定种类不同的种类的特征量使分类装置102将与规定数据同种的数据分类为多个簇中的任意一个的控制。具体而言,控制部710通过向分类装置102发送表示根据哪个种类的特征量进行聚类的信息,来远程控制分类装置102。
[0070]另外,在由判定部703判定为满足规定条件的情况下,控制部710进行根据与规定种类不同种类的特征量使分类装置102将同种的数据分类为多个簇中的任意一个的控制。
[0071]另外,检测部704针对通过判定部703判定为表示接近度的信息满足规定条件的簇的组合,从数据库400检测不同种类的每个的特征量的分布位置。在图1所使用的例子中,表示有关簇a和簇b的组合的接近度的信息被判定部703判定为满足规定条件,规定种类是特征量X和特征量Y。具体而言,检测部704针对簇a和簇b的每个,从数据库400检测特征量X和特征量Y以外的种类的特征量的分布位置。
[0072]第2导出部705针对确定出的组合,导出由检测部704检测出的表示特征量的分布位置的接近度的信息。具体而言,第2导出部705针对特征量X和特征量Y以外的种类的每个,计算簇a和簇b之间被检测出的分布位置的距离。例如,存储在数据库400中的与分布位置有关的信息为与特征量的分布范围有关的信息的情况下,簇a和簇b之间被检测出的分布位置的距离可以是分布范围中的最近的位置彼此的距离。该最近的位置彼此的距离为各种类中的分类装置102的聚类能力的极限。
[0073]或者,存储在数据库400中的与分布位置有关的信息为与特征量的分布范围有关的信息的情况下,簇a和簇b之间被检测出的分布位置的距离可以是分布范围中的最远离的位置彼此的距离。或者,例如,存储在数据库400中的与分布位置有关的信息为多个特征量的情况下,簇a和簇b之间被检测出的分布位置的距离也可以是特征量的分布位置间的距离中的最远的距离。
[0074]提取部706提取不同种类中的由第2导出部705导出的表示接近度的信息满足规定条件的种类。例如,导出的表示接近度的信息为上述的最近的位置彼此的距离的情况下,规定条件可以为计算出的距离最大,也可以为计算出的距离从大到小顺序第规定个以内。最近的位置彼此的距离越远的种类,簇a和簇b的分类精度越高。在图1的例子中,提取特征量Z。
[0075]在由判定部703判定为满足规定条件的情况下,在控制部710中进行根据由提取部706提取出的种类的特征量使分类装置102将同种的数据分类为多个簇中的任意一个的控制。在图1的例子中,控制部710进行除了规定种类的特征量X和特征量Y之外还根据特征量Z使分类装置102将同种的数据分类为多个簇中的任意一个的控制。由此,根据多个种类中的推断为分类精度提高的种类的特征量来进行聚类,能够实现分类精度的提高。
[0076]接下来,对图2所示的例子,使用各功能模块进行说明。计算部707进行由获取部701获取的表示多个种类的特征量的分布位置的信息,针对多个种类的各组合,计算表示组合所包含的各种类的特征量的相关的强度的信息。如使用图2说明那样,表示相关的强度的信息例如是相关系数。
[0077]确定部708确定多个种类的各组合中的、由计算部707计算出的信息所表示的相关的强度为规定的强度以上的组合。例如,确定部708将相关系数的绝对值为阈值以上的组合确定为表示相关的强度的信息为规定的强度以上的组合。规定的强度例如是由用户指示的强度,预先被存储在存储装置302中。
[0078]控制部710进行根据从多个种类除去由确定部708确定出的组合所包含的各种类的任意一个种类之外的种类的特征量使分类装置102将规定数据分类为多个簇中的任意一个的控制。
[0079]另外,种类确定部709确定由确定部708确定出的组合所包含的各种类中的、确定出的组合所包含的种类的特征量的偏差程度较大的种类。如使用图2所说明那样,偏差程度是针对各种类方向按照每个种类将各分布范围的长度合计所得的合计值。种类确定部709将合计值较大的一方的种类确定为偏差程度较大的种类。
[0080]而且,控制部710进行根据从多个种类除去由种类确定部709确定出的种类之外的种类的特征量使分类装置102将规定数据分类为多个簇中的任意一个的控制。具体而言,控制部710也可以通过发送部712向分类装置102发送表示根据哪个种类的特征量来进行聚类的信息,从而远程控制分类装置102。
[0081](基于分类装置102的聚类处理顺序)
[0082]图8是表示基于分类装置的聚类处理顺序的一个例子的流程图。分类装置102判断是否接收到表示种类、阈值的变更的信息(步骤S801)。分类装置102接收到表
示种类、阈值的变更的信息的情况下(步骤S801:是),向各部指示种类的变更、阈值的变更(步骤S802),进行传感器取样(步骤S803)。分类装置102在未接收到表示种类、阈值的变更的信息的情况下(步骤S801:否),移至步骤S803。
[0083]分类装置102基于传感器取样的检测结果来计算特征量(步骤S804),根据计算出的特征量来进行簇分析(步骤S805),并将计算出的特征量存储于存储装置(步骤S806)。步骤S805、步骤S806的接下来,分类装置102判断从以前进行簇模型化时是否经过一定时间(步骤S807) ο
[0084]分类装置102判断为经过一定时间的情况下(步骤S807:是),进行簇模型化(步骤S808),并向控制装置300发送模型化结果(步骤S809),返回到步骤S801。模型化结果是上述的表示每个簇的特征量的分布范围的信息。分类装置102判断为未经过一定时间的情况下(步骤S807:否),返回到步骤S801。
[0085](基于控制装置300的控制处理顺序)
[0086]图9是表示基于控制装置的控制处理顺序的一个例子的流程图。控制装置300从分类装置102接收模型化结果(步骤S901)。模型化结果如上述是表示每个簇的特征量的分布范围的信息。控制装置300测量分离度(步骤S902),并基于模型化结果从出席者候补确定出出席者(步骤S903)。
[0087]控制装置300基于确定出的出席者和测量出的分离度来决定特征量的种类(步骤S904),并决定进行聚类时的阈值(步骤S905)。而且,控制装置300向分类装置102发送决定结果(步骤S906),结束一系列的处理。有关步骤S903、步骤S904的详细内容,使用图10、图11进行说明。
[0088]图10是表示基于控制装置的详细的控制处理顺序的一个例子的流程图。控制装置300获取与每个簇的各种类的特征量的分布位置有关的信息,并存储于存储部(步骤SlOODo存储部例如是存储装置302。控制装置300判断多个种类的各组合中是否有未选择的组合(步骤S1002)。此处的多个种类是对获取的与分布位置有关的信息进行聚类时的特征量的种类。
[0089]在有未选择的组合的情况下(步骤S1002:是),控制装置300从未选择的组合中选择一个组合(步骤S1003)。控制装置300计算选择出的组合的相关系数c (步骤S1004),并判断是否I c I <阈值(步骤S1005)。
[0090]在不是|c| <阈值的情况下(步骤S1005:否),控制装置300将选择出的组合确定为包括冗余的种类的组合(步骤S1006),返回到步骤S1002。在|c| <阈值的情况下(步骤S1005:是),返回到步骤S1002。
[0091]另一方面,在步骤S1002中,在没有未选择的组合的情况下(步骤S1002:否),判断确定出的包括冗余的种类的组合中是否有未选择的组合(步骤S1007)。在有未选择的组合的情况下(步骤S1007:是),控制装置300从包括未选择的冗余的种类的组合中选择一个组合(步骤S1008)。而且,控制装置300基于表示每个簇的分布范围的信息来确定选择出的组合所包含的各种类方向的长度(步骤S1009)。
[0092]控制装置300按照组合所包含的每个种类对确定出的长度计算合计值(步骤S1010)。控制装置300将选择出的组合所包含的种类中合计值较大的一方的种类确定为偏差程度较大的冗余的种类(步骤S1011),返回到S1007。而且,在没有未选择的组合的情况下(步骤S1007:否),控制装置300进行根据从多个种类除去确定的种类之外的种类的特征量进行聚类的控制(步骤S1012),结束一系列的处理。控制装置300在步骤S1012中控制分类装置102,但在分类装置102和控制装置300为同一装置的情况下,仅根据从多个种类除去确定出的种类之外的种类的特征量进行聚类即可。
[0093]图11是表示基于控制装置的详细的控制处理顺序的其它例子的流程图。控制装置300获取与每个簇的各种类的特征量的分布位置有关的信息,并存储于存储部(步骤S1101),判断多个簇的各组合中是否有未选择的组合(步骤S1102)。存储部例如是存储装置302。在多个簇的各组合中有未选择的组合的情况下(步骤S1102:是),控制装置300从未选择的组合中选择一个组合(步骤SI 103)。
[0094]控制装置300对选择出的组合的各簇的分布位置的中心间的线段进行检测(步骤S1104),并判断检测出的线段中每一簇的分布范围所包含的线的长度是否为规定比例以上(步骤S1105)。规定比例例如是由用户指示的比例,预先被存储在存储装置302中。检测出的线段中每一簇的分布范围所包含的线的长度为规定比例以上的情况下(步骤S1105:是),返回到步骤S1102。检测出的线段中每一簇的分布范围所包含的线的长度不是规定比例以上的情况下(步骤S1105:否),移至步骤S1106。控制装置300检测与选择出的组合的各簇的分布位置的距离为阈值以下的分布位置的簇、和选择出的组合的各簇,作为分析候补的簇(步骤SI 106)。
[0095]控制装置300针对分析候补的簇的各组合,从数据库检测未选择的种类的每个的特征量(步骤S1107)。控制装置300针对分析候补的簇的各组合,计算未选择的种类的特征量的每个的分布位置间的距离(步骤S1108)。此处,未选择的种类表示数据具有的特征量的多个种类中通过分类装置102在能够预先计算的多个种类中的步骤SllOl所获取到的分类结果中未被使用的种类。
[0096]控制装置300按照未选择的种类的特征量的每个从计算出的距离导出最小距离(步骤S1109),从未选择的种类提取最小距离最大的种类(步骤S1110),返回到步骤S1102o
[0097]在步骤SI 102中,没有未选择的组合的情况下(步骤SI 102:否),控制装置300进行追加提取出的种类的特征量并使分类装置102进行聚类的控制(步骤S1111),结束一系列的处理。控制装置300在步骤Sllll中控制分类装置102,但在分类装置102和控制装置300为同一装置的情况下,仅追加提取出的种类的特征量进行聚类即可。
[0098]如以上说明那样,控制装置使用分类装置根据规定种类的特征量对声音数据等规定数据进行分类的结果,如果组间的特征量的分布位置接近,则进行变更特征量的种类来使分类装置对以下的数据进行分类的控制。由此,能够实现分类精度的提高。
[0099]另外,如果组间的特征量的分布位置近,则控制装置可以进行增加特征量的种类来使分类装置对以下的数据进行分类的控制。由此,能够实现分类精度的提高。
[0100]另外,控制装置也可以进行增加推断为能够分类分布位置较近的组间的种类来使分类装置对以下的数据进行分类的控制。由此,与追加从未选择的种类随机选择的种类的情况相比,能够实现分类精度的提高。并且,能够将追加的种类抑制为最小限度,所以能够抑制分类装置中的消耗电力的增大,并能够实现分类装置向控制装置发送表示特征量的分布位置的信息时的通信量的降低化。
[0101]另外,分类装置向控制装置发送与特征量的分布范围有关的信息作为与特征量的分布位置有关的信息,控制装置获取与特征量的分布范围有关的信息。由此,能够降低从分类装置向控制装置发送数据时的通信量。
[0102]另外,控制装置使用特征量的分布范围的重叠程度,作为表示组间的分布位置的接近度的信息。由此,能够降低控制装置中的计算量,并并降低消耗电力。
[0103]如以上说明那样,根据控制方法、控制程序、以及控制装置,基于各数据中的多个种类的特征量从多个种类的各组合确定出相关度强的组合。而且,控制装置进行从多个种类除去确定出的组合所包含的一个种类之外的种类的特征量使分类装置对数据进行分类的控制。由此,能够维持分类精度,并且降低特征量的种类。由于能够降低分类装置的特征量的计算量,所以能够降低分类装置中的消耗电力。另外,能够实现分类装置向控制装置发送表示特征量的分布位置的信息时的通信量的降低化。
[0104]另外,控制装置进行根据从多个种类除去相关度较强的组合所包含的种类中的特征量的偏差程度较大的一方的种类之外的种类的特征量使分类装置对数据进行分类的控制。
[0105]此外,本实施方式所说明的控制方法、分类方法通过利用PC (Personal Computer:个人计算机)、服务器、工作站等计算机执行预先准备的控制程序、分类程序能够实现。本控制程序和本分类程序分别被记录于硬盘、⑶一 ROM、DVD、USB存储器等可变型记录介质、闪存等半导体存储器、硬盘驱动器等计算机能够读取的记录介质中。而且,通过计算机从记录介质读取本控制程序和本分类程序来执行。另外,
也可以经由因特网等网络分配本控制程序、分类程序。
[0106]另外,本实施方式所说明的控制装置能够通过标准单元、结构化ASIC (Applicat1n Specific Integrated Circuit:专用集成电路)等适合特定用途IC(以下,仅称为“ASIC”。)、FPGA 等 PLD(Programmable Logic Device:可编程逻辑器件)来实现。具体而言,例如,通过HDL描述对上述的控制装置的功能进行功能定义,并对该HDL描述进行逻辑合成来赋予给ASIC、PLD,从而能够制造控制装置。
[0107]另外,本实施方式所说明的分类装置也能够通过标准单元、ASIC、FPGA等PLD来实现。具体而言,例如,通过HDL描述对上述的分类装置的功能进行功能定义,并对该HDL描述进行逻辑合成来赋予给ASIC、PLD,从而能够制造分类装置。
[0108]另外,在本实施方式中,将分类装置进行分类的对象的数据设为声音数据,但并不限于此。另外,在本实施方式中,将簇的候补选为会议的出席者等人物,但并不限于此。
[0109]符号说明
[0110]101、200、300…控制装置;102…分类装置;400…数据库;701…获取部;702…第I导出部;703…判定部;704…检测部;705…第2导出部;706…提取部;707…计算部;708…确定部;709…种类确定部;710…控制部;arll、arl2、arl3、ar21、ar22、ar23…分布范围。
【主权项】
1.一种控制方法,其特征在于, 根据规定数据具有的各种特征量中的规定种类的特征量将所述规定数据分类为多个组中的任意一个,并使存储部存储的计算机执行如下的处理: 针对所述多个组的每个,将分类出的表示所述规定数据中的特征量的分布位置的信息写入所述存储部; 基于写入的表示所述特征量的分布位置的信息来计算表示所述多个组间的所述特征量的分布位置间的接近度的信息; 在计算出的表示所述分布位置间的接近度的信息满足规定条件的情况下,根据所述各种特征量中的与所述规定种类不同种类的特征量将与所述规定数据同种的数据分类为所述多个组中的任意一个,并使所述存储部存储。2.根据权利要求1所述的控制方法,其特征在于, 在所述分类并使所述存储部存储的处理中,在满足所述规定条件的情况下,根据所述规定种类、和所述不同种类的特征量将所述同种的数据分类为所述多个组中的任意一个,并使所述存储部存储。3.根据权利要求1或者2所述的控制方法,其特征在于, 所述计算机执行如下的处理:针对表示所述接近度的信息满足所述规定条件的组的组合,从存储有关所述多个组的每个的所述各种特征量的分布位置的存储装置,检测所述不同种类的每个的特征量; 针对满足所述规定条件的组的组合,计算检测出的表示所述特征量的分布位置间的接近度的信息; 提取所述不同种类中计算出的表示所述接近度的信息满足规定条件的种类, 在进行所述分类并存储的控制的处理中,在判定为满足所述规定条件的情况下,根据提取出的种类的特征量将所述同种的数据分类为所述多个组中的任意一个,并使所述存储部存储。4.根据权利要求1?3中的任意一项所述的控制方法,其特征在于, 表示所述特征量的分布位置的信息是表示所述特征量的分布范围的信息。5.根据权利要求4所述的控制方法,其特征在于, 表示所述特征量的分布位置的接近度的信息是所述特征量的分布范围的重复程度。6.一种控制方法,其特征在于, 根据规定数据具有的各种特征量中的规定种类的特征量将所述规定数据分类为多个组中的任意一个,并使存储部存储的计算机执行如下的处理: 将表示与所述规定数据同种的多个数据的每个中的多个种类的特征量的分布位置的信息写入所述存储部; 基于写入的表示所述多个种类的特征量的分布位置的信息,针对所述多个种类的各组合,计算表示所述组合所包含的各种类的特征量的相关的强度的信息; 确定所述多个种类的各组合中计算出的信息所表示的所述相关的强度为规定的强度以上的组合; 根据从所述多个种类除去确定出的组合所包含的各种类中的任意一个种类之外的种类的特征量将所述规定数据分类为所述多个组中的任意一个,并使所述存储部存储。7.根据权利要求6所述的控制方法,其特征在于, 在进行所述分类并存储的控制的处理中,根据从所述多个种类除去确定出的组合所包含的各种类中获取的信息所表示的所述分布位置的偏差程度较大的一方的种类之外的种类的特征量将所述规定数据分类为所述多个组中的任意一个,并使所述存储部存储。8.一种控制程序,其特征在于, 使根据规定数据具有的各种特征量中的规定种类的特征量将所述规定数据分类为多个组中的任意一个,并使存储部存储的计算机执行如下的处理: 针对所述多个组的每个,将分类出的表示所述规定数据中的特征量的分布位置的信息写入所述存储部; 基于写入的表示所述特征量的分布位置的信息来计算表示所述多个组间的所述特征量的分布位置间的接近度的信息; 在计算出的表示所述分布位置间的接近度的信息满足规定条件的情况下,根据所述各种特征量中的与所述规定种类不同种类的特征量将与所述规定数据同种的数据分类为所述多个组中的任意一个,并使所述存储部存储。9.一种控制程序,其特征在于, 使根据规定数据具有的各种特征量中的规定种类的特征量将所述规定数据分类为多个组中的任意一个,并使存储部存储的计算机执行如下的处理: 将表示与所述规定数据同种的多个数据的每个中的多个种类的特征量的分布位置的信息写入所述存储部; 基于写入的表示所述多个种类的特征量的分布位置的信息,针对所述多个种类的各组合,计算表示所述组合所包含的各种类的特征量的相关的强度的信息; 确定所述多个种类的各组合中的、计算出的信息所表示的所述相关的强度为规定的强度以上的组合; 根据从所述多个种类除去确定出的组合所包含的各种类中的任意一个种类之外的种类的特征量将所述规定数据分类为所述多个组中的任意一个,并使所述存储部存储。10.—种控制装置,是对根据规定数据具有的各种特征量中的规定种类的特征量将所述规定数据分类为多个组中的任意一个的分类装置进行控制的控制装置,其特征在于,具有: 获取部,其针对所述多个组的每个,获取通过所述分类装置分类出的表示所述规定数据中的特征量的分布位置的信息,并存储于存储部; 导出部,其基于通过所述获取部而存储在所述存储部中的表示所述特征量的分布位置的信息,导出表示所述多个组间的所述特征量的分布位置间的接近度的信息; 判定部,其判定通过所述导出部导出的表示所述接近度的信息是否满足规定条件;以及 控制部,在通过所述判定部判定为满足所述规定条件的情况下,该控制部进行根据所述各种特征量中的与所述规定种类不同种类的特征量使所述分类装置将与所述规定数据同种的数据分类为所述多个组中的任意一个的控制。11.一种控制装置,是对能够根据规定数据具有的多个种类的特征量将所述规定数据分类为多个组中的任意一个的分类装置进行控制的控制装置,其特征在于,具有: 获取部,其获取表示与所述规定数据同种的多个数据的每个中的多个种类的特征量的分布位置的信息,并存储于存储部; 计算部,其基于通过所述获取部而存储在所述存储部中的表示所述多个种类的特征量的分布位置的信息,针对所述多个种类的各组合,计算表示所述组合所包含的各种类的特征量的相关的强度的信息; 确定部,其确定所述多个种类的各组合中的、通过所述计算部计算出的信息所表示的所述相关的强度为规定的强度以上的组合;以及 控制部,其进行根据从所述多个种类除去通过所述确定部确定出的组合所包含的各种类中的任意一个种类之外的种类的特征量使所述分类装置将所述规定数据分类为所述多个组中的任意一个的控制。
【专利摘要】本发明涉及控制方法、控制程序以及控制装置。控制装置(101)对根据规定数据具有的各种特征量中的规定种类的特征量(X,Y)将规定数据分类为多个簇(a~c)中的任意一个的分类装置(102)进行控制。控制装置(101)针对多个簇(a~c)的每个,基于通过分类装置(102)分类出的表示规定数据中的特征量的分布位置的信息,导出表示多个簇(a~c)间的特征量的分布位置间的接近度的信息,并判断导出的表示接近度的信息是否满足规定条件。在判定为满足规定条件的情况下,控制装置(101)进行根据各种特征量中的追加与规定种类不同种类的特征量(X,Y,Z)使分类装置(102)将与规定数据同种的数据分类为多个簇(a~c)中的任意一个的控制。
【IPC分类】G10L25/51
【公开号】CN104903957
【申请号】CN201380069902
【发明人】山崎博信
【申请人】富士通株式会社
【公开日】2015年9月9日
【申请日】2013年1月10日
【公告号】US20150293951, WO2014109040A1