基于支持向量回归机学习的无标定手眼协调模糊控制方法
【技术领域】
[0001] 本发明涉及一种机器人手眼协调控制方法,特别是一种基于支持向量回归机学习 的无标定手眼协调模糊控制方法。
【背景技术】
[0002] 支持向量回归机(Support Vector Regression, SVR)是 Vapnik 等人于 20 世纪 90 年代中期在统计学理论基础上发展并提出的一种新的机器学习算法。作为统计学习理论的 核心内容,SVR能够较好的解决小样本学习问题,支持向量回归机已经成为机器学习建模和 优化的研宄热点。
[0003] 由于机器人本身是一个非线性、强耦合的系统,往往存在各种参数未知情况,而且 摄像机获取的末端执行器图像信息和各个关节角度之间是一种复杂的非线性关系,精确的 数学模型并不容易获取,即使存在这样的模型也常对应着难以实施的复杂控制器。这些原 因导致了一些基于模型的控制方法往往无法较好地发挥作用,因此不需要精确模型的控制 方法如模糊控制和神经网络等智能学习方法成为新的选择。以神经网络为代表的一些智能 算法已经广泛用于机器人无标定视觉伺服控制中视觉映射模型,比如拟合图像雅可比矩阵 或者逆图像雅可比矩阵,这些机器学习算法有着共同的理论基础之一是统计学,传统的统 计学是研宄样本数目趋于无穷大时的渐近理论,现有的许多算法都是基于此假设。对于机 器人视觉伺服中的视觉映射模型而言,若采用传统智能算法建模,需要离线训练大量的机 器人运动空间的大量样本,但是样本数量往往是有限的,特别对高自由度的复杂运动,同时 由于维数的增加训练样本将成几何级数增长,实际可以获得样本就变得非常有限了,因此 无穷大样本数量在实际中是难以保证的,理论上很优秀的学习方法在实际中的表现可能就 不尽人意了。如何利用较少的样本建立机器人视觉映射模型无疑具有重要的实际意义。
【发明内容】
[0004] 针对上述问题,本发明的目的是提供一种基于支持向量回归机学习的无标定手眼 协调模糊控制方法,利用机器学习算法支持向量回归机与模糊思想相结合来建立视觉伺服 的视觉映射模型,并设计成基于SVR的模糊控制器对机器人的手眼协调运动实时控制。
[0005] 为实现上述目的,本发明采用如下技术方案:
[0006] 一种基于支持向量回归机学习的无标定手眼协调模糊控制方法,利用机器学习算 法支持向量回归机结合模糊思想设计成控制器,包括以下步骤:
[0007] 1)目标物体与机器人手爪运动记录及图像投影记录:目标物体在工作平面上做 随机运动,同时机器人手爪在工作平面上也以不同的速度做随机运动,通过摄像机记录下 目标物体和机器人手爪的运动,并投影到图像平面中;将机器人手爪在图像平面上的投影 位置( Xg,yg)和目标物体在图像平面上的投影位置(W。)作为重要的输入量;
[0008] 2)图像处理与目标标识:通过图像特征提取和目标识别获取手爪图像坐标和目 标图像坐标,具体方法为:在图像处理中计算图像平面上相应色块的中心坐标(i.r),作为 目标与手爪的图像位置,即
?其中N为像素矩阵中值为"1"的像素 点个数,Xi、yi为相应色块在图像中的第i个像素点坐标;整个过程分为图像采集、HSI转换、 颜色分割,然后手爪图像和目标图像经过图像预处理及目标识别后分别得到手爪图像坐标 和目标图像坐标;
[0009] 3)运动估计:经过图像特征提取和目标识别后得到目标物体在图像平面中的位 置,然后通过运动估计的方法估计出目标物体下个时刻的位置,将手爪的图像位置与目标 的估计位置作对比,进行跟踪;运动估计如下,设f;(k+l)为估计的k+1时刻的目标的图像 特征,贝 1」通过一阶估计获得:fQ(k+l) = fQ(k) + (f;(k)-f;(k-l)) = 2 ? fQ(k)-f;(k-l),其中 fjk-lhfjk)分别是k-1和k时刻的目标图像特征。同时,考虑到手爪关节增量需要转换 到机器人的关节速度接口,受到机器人的最大关节速度的限制,同时保证手爪快速达到目 标位置,将输出关节控制量做如下修正:11 1^1〇〇=111;[11(1100,11_),其中1100为1^时刻输出 的关节控制量,11_为机器人的关节最大控制值,u Mal(k)为k时刻实际输出的关节控制量;
[0010] 4)基于SVR的模糊控制器设计:模糊控制器的输入为机器手爪与目标物体在图像 平面的位置误差e,该位置误差值通过图像平面中的手爪位置坐标与目标位置坐标差值得 到;模糊控制器一方面是基于规则库的控制器,它由一系列语言规则构造而成;另一方面, 它又是非线性映射,由准确而严密的数学公式表达;对于一个具有s个输入、单个输出的多 输入单输出模型,即MISO,采用乘积推理机、高斯型隶属度函数、"linear"解模糊器和模糊 单值型隶属度,得到该模糊模型输出为:
[0012] 其中模糊基函数为
;u1GU(U表示集合论 域)为激发规则札(即第1条规则)的后件集的质心;Ci为高斯隶属度函数的中心;〇 表高斯隶属函数的宽度;由核函数的性质可知,核函数的乘积也是核函数,即高斯隶函数的 乘积
是Mercer核,其中X,x' G Rs,x在式子中表示的是输入向 量,x'在式子中表示的是支持向量;当核函数
时,得到SVR决 策函数为:
[0014] 式中x代表输入向量,代表支持向量机,x,x¥ Rs,n为支持向量机的个数, 为支持向量机对应的权重系数,0 ^C,常数C控制模型复杂度和训练误差 的折衷关系称为惩罚因子;一个支持向量机相当于一个条模糊规则,且为高斯隶属度函数 的中心,模糊规则数即支持向量机的个数,而模糊控制后件输出w =(< ;综上所述,基 于模糊基核函数的SVR得到的模糊控制器的第1条模糊规则可表示如下:
[0016] 其中x代表输入向量,x,表支持向量机,x,Rs,u为控制输出量。
[0017] 5)输出为机器手爪达到期望位置需要的增量W 机器人根据控制器输 出的值进行控制手爪的运动,逐渐逼近运动的目标物体从而达到跟踪目标物体的目的。
[0018] 与现有技术相比,本发明具有以下优点:
[0019] 1、本发明方法使回归模型充分利用历史训练结果,能够显著减少后续训练时间, 同时相对于其他方法需要的样本数量更少而且控制效果好。
[0020] 2、本发明方法具有良好的自学习和泛化能力,以及语言可解释性的特点。
[0021 ] 3、本发明方法中的模糊控制器基于模糊基函数,这不仅为分析函数近似特性提供 了方便,还为合并专家知识和数据信息产生的模糊规则提供了一种有效的途径。
[0022] 4、本发明方法采用图像雅克比矩阵方法建立实际运动空间中跟踪物体位移量到 图像空间跟踪位移量的映射关系,并采用SVR对图像雅克比矩阵在线辨识,避免了现有摄 像机标定环节及由此引入的测量误差。
[0023]5、本发明方法基于视觉反馈进行自动跟踪控制,通过图像上的标记与试样标记间 的距离差来设计实际控制律,驱动被控对象机械臂以不同速度旋转,实现机械臂对试样标 记的实时精密跟踪,克服环境干扰能力强,跟踪精度高。
【附图说明】
[0024] 图1为基于SVR的模糊控制的无标定手眼协调控制组成图。
[0025] 图2为图像处理与目标识别过程。
[0026] 图3为基于SVR的模糊控制器结构。
[0027] 图4为模糊控制器的三层网络结构图。
【具体实施方式】
[0028] 下面结合附图,对本发明的具体实施例做进一步的说明。
[0029] 如图1所示,一种基于支持向量回归机学习的无标定手眼协调模糊控制方法,利 用机器学习算法支持向量回归机结合模糊思想设计成控制器,包括以下步骤:
[0030] 1)目标物体与机器人手爪运动记录及图像投影记录:目标物体在工作平面上做 随机运动,同时机器人手爪在工作平面上也以不同的速度做随机运动,通过摄像机记录下 目标物体和机器人手爪的运动,并投影到图像平面中;在图像平面上将机器人手爪的投影 位置(X g(k),yg(k))和目标物体的投影位置(1。〇〇,7。〇〇)作为重要
的输入量;
[0031] 2)图像处理与目标标识:通过图像特征提取和目标识别获取手爪图像坐标和目 标图像坐标,具体方法为:在图像处理中计算图像平面上相应色块的中心坐标氐另,作为 目标与手爪的图像位置,
其中N为像素矩阵中值为"1"的像素 点个数,Xi、yi为相应色块在图像中的第i个像素点坐标;整个过程分为图像采集、HSI转换、 颜色分割,然后手爪图像和目标图像经过图像预处理及目标识别后分别得到手爪图像坐标 和目标图像坐标;图像特征提取与目标识别的过程如图2所示。
[0032] 3)运动估计:经过图像特征提取和目标识别后得到目标物体在图像平面中的位 置,然后通过运动估计的方法估计出目标物体下个时刻的位置,将手爪的图像位置与目标 的估计位置作对比,进行跟踪;运动估计如下,设f;(k+l)为估计的k+1时刻的目标的图像 特征,贝 1」通过一阶估计获得:fQ(k+l) = fQ(k) + (f;(k)-f;(k-l)) = 2 ? fQ(k)-f;(k-l),其中 fjk-lhfjk)分别是k-1和k时刻的目标图像特征。同时,考虑到手爪关节增量需要转换 到机器人的关节速度接口,受到机器人的最大关节速度的限制,同时保证手爪快速达到目 标位置,将输出关节控制量做如下修正:11 1^1〇〇=111;[11(1100,11_),其中1100为1^时刻输出 的关节控制量,11_为机器人的关节最大控制值,u Mal(k)为k时刻实际输出的关节控制量;
[0033] 4)基于SVR的模糊控制器设计,其基本结构如图3所示:模糊控制器的输入为机 器手爪与目标物体在图像平面的位置误差e,该位置误差值通过图像平面中的手爪位置坐 标与目标位置坐标差值得到;模糊控制器一方面是基于规则库的控制器,它由一系列语言 规则构造而成;另一方面,它又是非线性映射,由准确而严密的数学公式表达;对于一个具 有s个输入、单个输出的多输入单输出模型,即MISO,采用乘积推理机、高斯型隶属度函数、 " linear"解模糊器和模糊单值型隶属度,得到该模糊模型输出为:
[0035] 其中模糊基函数为
表示集合论 域)为激发规则札(即第1条规则)的后件集的质心;Ci为高斯隶属度函数的中心;〇 表高斯隶属函数的宽度。该模糊控制器的三层网络结构如图4所示。
[0036] 由核函数的性质可知,核函数的乘积也是核函数,即高斯隶函数的乘积
是Mercer核,其中X,x' G Rs,x在式子中表示的是输入向量, x'在式子中表示的是支持向量;当核函数
时,得到SVR决策函 数为:
[0038] 式中x代表输入向量,代表支持向量机,x,x¥ Rs,n为支持向量机的个数, 为支持向量机对应的权重系数,S C,常数C控制模型复杂度和训练误差 的折衷关系称为惩罚因子;一个支持向量机相当于一个条模糊规则,且为高斯隶属度函数 的中心,模糊规则数即支持向量机的个数,而模糊控制后件输出W ;综上所述,基 于模糊基核函数的SVR得到的模糊控制器的第1条模糊规则可表示如下:
[0040] 其中X代表输入向量,X,表支持向量机,x,PgRs,u为控制输出量。
[0041] 5)输出为机器手爪达到期望位置需要的增量;机器人根据控制器输 出的值进行控制手爪的运动,逐渐逼近运动的目标物体从而达到跟踪目标物体的目的。
【主权项】
1. 一种基于支持向量回归机学习的无标定手眼协调模糊控制方法,利用机器学习算法 支持向量回归机结合模糊思想设计成控制器,包括以下步骤: 1) 目标物体与机器人手爪运动记录及图像投影记录:目标物体在工作平面上做随机 运动,同时机器人手爪在工作平面上也以不同的速度做随机运动,通过摄像机记录下目标 物体和机器人手爪的运动,并投影到图像平面中;将机器人手爪在图像平面上的投影位置 (Xg,yg)和目标物体在图像平面上的投影位置(X〇,y。)作为重要的输入量; 2) 图像处理与目标标识:通过图像特征提取和目标识别获取手爪图像坐标和目标图 像坐标,具体方法为:在图像处理中计算图像平面上相应色块的中心坐标氐j),作为目标与 手爪的图像位置,即·其中N为像素矩阵中值为"1"的像素点个数, Xi、yi为相应色块在图像中的第i个像素点坐标;整个过程分为图像采集、HSI转换、颜色分 害J,然后手爪图像和目标图像经过图像预处理及目标识别后分别得到手爪图像坐标和目标 图像坐标; 3) 运动估计:经过图像特征提取和目标识别后得到目标物体在图像平面中的位置,然 后通过运动估计的方法估计出目标物体下个时刻的位置,将手爪的图像位置与目标的估计 位置作对比,进行跟踪;运动估计如下,设f;(k+l)为估计的k+Ι时刻的目标的图像特征,则 通过一阶估计获得:fQ(k+l) = fQ(k) + (f;(k)-f;(k-l)) = 2 ·?;(1〇-?;(1?-1),其中 fQ(k-l)、 f;(k)分别是k-1和k时刻的目标图像特征;同时,考虑到手爪关节增量需要转换到机器人 的关节速度接口,受到机器人的最大关节速度的限制,同时保证手爪快速达到目标位置,将 输出关节控制量做如下修正:uMal(k) = min(u(k),umax),其中u(k)为k时刻输出的关节控 制量,Umax为机器人的关节最大控制值,u Mal (k)为k时刻实际输出的关节控制量; 4) 基于SVR的模糊控制器设计:模糊控制器的输入为机器手爪与目标物体在图像平 面的位置误差e,该位置误差值通过图像平面中的手爪位置坐标与目标位置坐标差值得到; 模糊控制器一方面是基于规则库的控制器,它由一系列语言规则构造而成;另一方面,它又 是非线性映射,由准确而严密的数学公式表达;对于一个具有s个输入、单个输出的多输入 单输出模型,即MISO,采用乘积推理机、高斯型隶属度函数、"linear"解模糊器和模糊单值 型隶属度,得到该模糊模型输出为:(1) 其中模糊基函数为U1E U,U表示集合论 域,为激发规则R1,即第1条规则的后件集的质心,Ci为高斯隶属度函数的中心;〇 ,代表高 斯隶属函数的宽度;由核函数的性质可知,核函数的乘积也是核函数,即高斯隶函数的乘积是Mercer核,其中X,X' e Rs,X在式子中表示的是输入向量, X'在式子中表示的是支持向量;当核函数-时,得到SVR决策函 数为:式中X代表输入向量,X·3代表支持向量机,X,X Rs,n为支持向量机的个数, 为支持向量机对应的权重系数,SC,常数c控制模型复杂度和训练误差的折衷关 系称为惩罚因子;一个支持向量机相当于一个条模糊规则,且为高斯隶属度函数的中心,模 糊规则数即支持向量机的个数,而模糊控制后件输出《 = ??丨-综上所述,基于模糊基 核函数的SVR得到的模糊控制器的第1条模糊规则可表示如下: R: : IF X is close to SVR(x J), THEN it is close to (a* - a(); 其中X代表输入向量,表支持向量机,X,X Rs,U为控制输出量; 5)输出为机器手爪达到期望位置需要的增量w = ;机器人根据控制器输出的 值进行控制手爪的运动,逐渐逼近运动的目标物体从而达到跟踪目标物体的目的。
【专利摘要】本发明涉及一种基于支持向量回归机学习的无标定手眼协调模糊控制方法。先通过摄像机记录下机器人手爪和目标物体的运动情况并将运动情况投影到图像平面中,采用图像处理和目标识别的方法标识出手爪与目标在图像平面中的投影位置,将手爪与目标的位置差值作为输入量输入到本发明设计的基于SVR的模糊控制器中,该控制器输出机器人手臂关节改变的量从而控制手爪的运动到达跟踪目标物体的目的。本发明大大减少了样本数量,控制中的步骤更少效果更佳,同时还具有良好的自学习和泛化能力,以及语言可解释性的特点。基于模糊基核函数的模糊控制器设计不仅为分析函数近似特性提供了方便,还为合并专家知识和数据信息产生的模糊规则提供有效的途径。
【IPC分类】G05B13/04
【公开号】CN104898421
【申请号】CN201510225550
【发明人】张宪霞, 张炳飞, 戚俊达
【申请人】上海大学
【公开日】2015年9月9日
【申请日】2015年5月5日