如何在模型未知時實ç¾å°æ©Ÿå™¨äººçš„æŽ§åˆ¶é€™ä¸€å•é¡Œçš„ç ”ç©¶å°æ©Ÿå™¨äººç†è«–的發展和機器人控制ç†è«–在實è¸ä¸çš„æ‡‰ç”¨éƒ½å…·æœ‰é‡è¦çš„æ„ç¾©ã€‚æœ¬æ–‡æå‡ºä¸€ç¨®åŸºäºŽç¥žç¶“網絡機器人模型辨è˜çš„è¿ä»£å¸ç¿’智能控制方法。仿真表明該方法具有滿æ„的效果。
1 å‰è¨€
作為在ç¾ä»£æŽ§åˆ¶ç†è«–鼎盛時期å•世的機器人,其控制技術的æˆé•·èˆ‡ç¾ä»£æŽ§åˆ¶ç†è«–的發展有著密切的關系。在機器人技術三å多年的æˆé•·éŽç¨‹ä¸ç¾ä»£æŽ§åˆ¶ç†è«–所æä¾›çš„幾乎所有的è¨è¨ˆæ–¹æ³•都在機器人上åšéŽæ‡‰ç”¨çš„å˜—è©¦ï¼Œé€™äº›æŽ§åˆ¶æ–¹æ³•åœ¨å»ºç«‹æ©Ÿå™¨äººçš„æ•¸å¸æ¨¡åž‹æ™‚需è¦åšåˆç†çš„近似處ç†ï¼Œå¿½ç•¥ä¸€äº›ä¸ç¢ºå®šæ€§å› ç´ ã€‚ç„¶è€Œï¼Œæ©Ÿå™¨äººå‹•åŠ›å¸å…·æœ‰é«˜åº¦éžç·šæ€§ã€å¼·è€¦åˆç‰ç‰¹é»žï¼Œå…¶ä¸ç¢ºå®šçš„å› ç´ å®¢è§€å˜åœ¨ï¼Œé€™äº›ä¸ç¢ºå®šçš„æœªå»ºæ¨¡éƒ¨åˆ†å‹•態地影響這些ç†è«–çµæžœåœ¨å¯¦éš›ä¸çš„æ‡‰ç”¨ã€‚如何在模型未知時實ç¾å°æ©Ÿå™¨äººçš„æŽ§åˆ¶é€™ä¸€å•é¡Œçš„ç ”ç©¶å°æ©Ÿå™¨äººç†è«–的發展和機器人控制ç†è«–在實è¸ä¸çš„æ‡‰ç”¨éƒ½å…·æœ‰é‡è¦çš„æ„ç¾©ã€‚
人工神經元網絡(Artifical Neural Network)是在ç¾ä»£ç¥žç¶“å¸ã€ç”Ÿç‰©å¸ã€å¿ƒç†å¸ç‰ç§‘å¸é ˜åŸŸæˆæžœçš„åŸºç¤Žä¸Šç”¢ç”Ÿçš„ï¼Œåæ˜ 了生物神經系統的基本特å¾ï¼Œæ˜¯å°ç”Ÿç‰©ç¥žç¶“系統的æŸç¨®æŠ½è±¡ã€ç°¡åŒ–與模擬,是ç†è«–åŒ–çš„äººè…¦ç¥žç¶“ç¶²çµ¡çš„æ•¸å¸æ¨¡åž‹ï¼Œå…¶èƒ½å¤ 逼近任æ„éžç·šæ€§æ˜ 射的特性,為解決機器人控制å•題æä¾›äº†æ–°çš„æ‰‹æ®µã€‚
本文æå‡ºä¸€ç¨®åŸºäºŽç¥žç¶“網絡機器人模型辨è˜çš„è¿ä»£å¸ç¿’æŽ§åˆ¶æ–¹æ³•ã€‚é€™ç¨®æ–¹æ³•ç”¨ç¥žç¶“ç¶²çµ¡è¾¨è˜æ©Ÿå™¨äººç³»çµ±çš„æ£å‘æˆ–逆呿¨¡åž‹ï¼Œå¹¶æ¶ˆé™¤ç³»çµ±ä¸ç¢ºå®šæ€§å’Œå¤–部干擾的影響。仿真表明這種方法效果良好。
2 基于神經網絡模型辨è˜çš„æ©Ÿå™¨äººè¿ä»£å¸ç¿’控制
è¿ä»£å¸ç¿’控制方法在解決由于å°è±¡å˜åœ¨éžç·šæ€§æˆ–建模ä¸è‰¯é€ æˆçš„ä¸ç¢ºå®šæ€§å•題方é¢å…·æœ‰å¾—天ç¨åŽšçš„å„ªè¶Šæ€§ã€‚å®ƒæ¨¡ä»¿äººé¡žçš„å¸ç¿’功能,在å¸ç¿’éŽç¨‹ä¸ä¸æ–·å½Œè£œç¼ºä¹çš„先驗知è˜ï¼Œé€²è€Œèƒ½ä½¿ç³»çµ±çš„æŽ§åˆ¶æ€§èƒ½å¾—åˆ°ä¸æ–·æ”¹å–„。
é‡‡ç”¨ç¥žç¶“ç¶²çµ¡è¾¨è˜æ©Ÿå™¨äººçš„逆呿¨¡åž‹ï¼Œä½¿æ©Ÿå™¨äººçš„關節é‹å‹•沿è¿ä»£è»¸æ–¹å‘逼近期望軌跡;è¿ä»£å¸ç¿’控制器在線å¸ç¿’控制åƒé‡ï¼Œä½¿é—œç¯€é‹å‹•沿時間軸方å‘跟蹤期望軌跡。在æ¯ä¸€æ¬¡çš„è¿ä»£å¸ç¿’éŽç¨‹ä¸ï¼Œä½¿ç¥žç¶“ç¶²çµ¡è¨“ç·´åˆ°å°æ¨¡åž‹çš„辨è˜é”到比較好的逼近精度åŽï¼Œåˆ©ç”¨ç¥žç¶“å…ƒç¶²çµ¡çš„è¼¸å‡ºæ§‹é€ ä¸‹ä¸€æ¬¡è¿ä»£å¸ç¿’éŽç¨‹ä¸å‰é¥‹éƒ¨åˆ†çš„æŽ§åˆ¶å¾‹ï¼Œå†å°‡å…¶èˆ‡å¯¦æ™‚å饋控制çµåˆï¼Œå½¢æˆé¯æ£’è¿ä»£å¸ç¿’控制算法。
2.1 å饋控制器的è¨è¨ˆ
ç”¨ç¥žç¶“ç¶²çµ¡çš„è¾¨è˜æ¨¡åž‹è¿‘ä¼¼ä»£æ›¿æ©Ÿå™¨äººç³»çµ±çš„å¯¦éš›æ¨¡åž‹æ™‚ï¼Œç¥žç¶“ç¶²çµ¡å¿…é ˆé€²è¡Œä¸€æ¬¡æˆ–å¤šæ¬¡åœ¨ç·šè¨“ç·´ç›´è‡³æ”¶æ–‚ç‹€æ…‹ï¼Œé€™å½±éŸ¿äº†æŽ§åˆ¶çš„å¯¦æ™‚æ€§ã€‚æ¤å¤–,å¸ç¿’控制ä¸ä¸€å®šèƒ½ä¿è‰æ¯æ¬¡å¸ç¿’時都能補償跟蹤誤差,傳統的åé¥‹æŽ§åˆ¶æœ‰åŠ©äºŽå…‹æœæ¤é¡žå•題,所以為了æé«˜ç³»çµ±çš„æŠ—干擾性能和åˆå§‹é¯æ£’性,在控制系統ä¸å¯ä»¥å¼•å…¥å饋控制。

引入å饋控制增強了系統的抗干擾性能,æé«˜äº†ç³»çµ±çš„靿£’性,從而ä¿è‰æ¯æ¬¡å¸ç¿’時都能跟蹤補償誤差。
2.2 神經網絡辨è˜å™¨è¨è¨ˆ
機器人éžç·šæ€§è‡ªå›žæ¸æ»‘動平凿¨¡åž‹ï¼ˆ
NARMAX模型)的一般形å¼ç‚º
y(t)=f(y(t-1),y(t-2),…,y(t-n);u(t-1),u(t-2),…,u(t-m))
å…¶ä¸ï¼Œ
u(t)和
y(t)分別是系統的輸入和輸出å‘é‡ï¼›
m和
n為輸入和輸出的最大時延。
f為未知的輸入輸出éžç·šæ€§å‡½æ•¸ã€‚將上å¼ç°¡è¨˜ç‚º
y(t)=f(I(t-1)),其ä¸ï¼Œ
I(t-1)=[y(t-1)[SUP]T[/SUP],…,Y(t-n),…,u(t-1)[SUP]T[/SUP],…,u(t-m)[SUP]T[/SUP]]∈R[SUP]nq+mp[/SUP]
å‰‡ä¸‰å±¤ç¥žç¶“ç¶²çµ¡çµæ§‹çš„
BPç¥žç¶“ç¶²çµ¡è¾¨è˜æ¨¡åž‹å¯ä»¥è¡¨ç¤ºç‚º

å…¶ä¸ï¼Œ
W代表網絡的權值,
Nä»£è¡¨ç¥žç¶“ç¶²çµ¡è¼¸å…¥è¼¸å‡ºæ˜ å°„å‡½æ•¸ï¼Œç¥žç¶“ç¶²çµ¡çš„è¼¸å…¥ç‚º
I(t)∈R[SUP]nq+mp[/SUP],網絡的輸出為

,它由
N[SUB]0[/SUB]個輸出神經元構æˆï¼Œå¯ä»¥ç¢ºå®šè©²ç¥žç¶“網絡輸出層神經元的個數為
N[SUB]0[/SUB]=q。
å°äºŽç¢ºå®šçš„ç¥žç¶“ç¶²çµ¡çµæ§‹ï¼Œå°å…¶é€²è¡Œè¨“ç·´å’Œå¸ç¿’ï¼Œæ‰¾åˆ°æ»¿è¶³è¦æ±‚çš„æ¬Šå€¼åƒæ•¸ï¼Œä½¿çµ¦å®šçš„目標函數最優。通常,找到最優權值比較困難,åªèƒ½æ‰¾åˆ°çœŸå¯¦å‡½æ•¸çš„一個近似。為æ¤ï¼Œçµ¦å®šä¸€å€‹é€¼è¿‘精度ε>0,åªè¦æ‰¾åˆ°æ¬Šå€¼
W*使得網絡輸出與期望輸出的誤差å°äºŽÎµï¼Œä¾¿èªç‚ºç¶²çµ¡æ¨¡åž‹
y(t+1)=N(I(t),Wï¼Šï¼‰æ˜¯å°æœªçŸ¥å‡½æ•¸çš„一個逼近。å‡è¨ç¥žç¶“網絡的辨è˜èª¤å·®æ˜¯

ç•¶æ¤ç¥žç¶“網絡經éŽè¨“ç·´åŽï¼Œç²å¾—最優權值(
W*)時滿足
‖
f(I(t))-N(I(t),W*
)‖=‖
e[SUB]n[/SUB](t+1)‖≤ε,

,
D為R[SUP]nq+mp[/SUP]上的一個集åˆã€‚
至æ¤ï¼Œæˆ‘們得到了逼近機器人系統的神經網絡模型,將神經網絡的訓練與å¸ç¿’控制çµåˆèµ·ä¾†ï¼Œåœ¨ç¬¬æ¬¡è¿ä»£å¸ç¿’çš„éŽç¨‹ä¸ï¼Œä½¿ç¥žç¶“網絡å¸ç¿’一定的次數以逼近機器人系統模型。通常以誤差準則

來作為網絡模型逼近機器人系統的標準。g(·)是e(t)的函數,e是定義在[0,r]上的誤差函數,是網絡模型與實際系統的åå·®ï¼Œæ˜¯ç¶²çµ¡æ¨¡åž‹åƒæ•¸ï¼ˆé€šå¸¸è¡¨ç¾ç‚ºæ¬Šå€¼ï¼‰çš„éžç·šæ€§å‡½æ•¸ï¼ŒäºŽæ˜¯ï¼Œè¾¨è˜å•題æ¸çµç‚ºéžç·šæ€§å„ªåŒ–å•題。神經網絡具有處ç†éžç·šæ€§å„ªåŒ–å•題的能力,且能并行處ç†ä¿¡æ¯ï¼Œé€Ÿåº¦è¼ƒå¿«ï¼Œå› æ¤ï¼Œåœ¨ç¥žç¶“網絡辨è˜ä¸é‡‡ç”¨é€™ç¨®èª¤å·®æº–則。
采用BP算法修整神經網絡的權值和閾值,使誤差性能函數

最å°ï¼Œå…¶ä¸k代表è¿ä»£å¸ç¿’的次數,

和

代表實際輸出和網絡模型的輸出,Tç‚ºç¥žç¶“ç¶²çµ¡é‡‡æ¨£æ™‚é–“ã€‚é‡‡ç”¨æ¢¯åº¦ä¸‹é™æ³•éžæŽ¨å’Œä¿®æ£æ¬Šå€¼

å…¶ä¸Î²ç‚ºå¸ç¿’å› å,也就是按梯度法æœç´¢çš„æ¥é•·ï¼Œç•¶å…¶å–值大時,å¸ç¿’速度就快,但容易引起權值震蕩甚至發散,其å–值尿™‚,網絡訓練的時間長,å¸ç¿’速度較慢。α為動é‡å› åï¼Œå®ƒçš„å¤§å°æ±ºå®šéŽåŽ»æ¬Šå€¼è®ŠåŒ–å°ç›®å‰å€¼çš„影響程度,其作用為記憶上次連接權值的變化方å‘,抑制系統å¯èƒ½ç”¢ç”Ÿçš„æŒ¯è•©ï¼Œèµ·å¹³æ»‘çš„ä½œç”¨ã€‚é¸æ“‡é©ç•¶çš„å‹•é‡å› å,å¯ä»¥é™ä½Žå傳算法å°èª¤å·®è¡¨é¢çš„éˆæ•度,使網絡é¿å…陷入局部最å°é»žï¼Œä¸€èˆ¬é¸åœ¨0.9å·¦å³ã€‚γ為網絡訓練次數。
在第k次é‡å¾©è©¦é©—çš„éŽç¨‹ä¸ï¼Œæ¬Šå€¼

éš¨Î³çš„å¢žåŠ æœæœ€å„ªæ–¹å‘ä¿®æ•´ï¼Œä½¿å¾—è¾¨è˜æ¨¡åž‹èª¤å·®é€æ¼¸æ¸›å°‘,當é”到給定的逼近精度時便å¯ä»¥çµæŸè¨“練,得到最優權值

,利用

計算得到網絡的輸出

,用æ¤è¼¸å‡ºæ§‹é€ 第k+1次è¿ä»£å¸ç¿’çš„å‰é¥‹ä½œç”¨ï¼Œèˆ‡å¯¦æ™‚å饋作用共åŒç”¢ç”ŸæŽ§åˆ¶è¼¸å…¥
2.3機器人控制方案è¨è¨ˆ
完æˆç¥žç¶“網絡辨è˜å™¨ä»¥åŠå饋控制器的è¨è¨ˆåŽï¼Œå¼•å…¥è¿ä»£å¸ç¿’æŽ§åˆ¶å™¨ï¼Œå®Œæˆæ•´å€‹æŽ§åˆ¶æ–¹æ¡ˆçš„è¨è¨ˆã€‚整個系統控制框圖如圖1。
[align=center]

圖1 æŽ§åˆ¶ç³»çµ±çµæ§‹æ¡†åœ–[/align]
è¿ä»£å¸ç¿’控制器采用簡單的Påž‹çµæ§‹ï¼Œu[SUB]fb[/SUB]ã€u[SUB]ff [/SUB]分別是由å饋控制器和å¸ç¿’控制器確定的控制律,第k次è¿ä»£å¸ç¿’éŽç¨‹ä¸ï¼Œæ©Ÿå™¨äººçš„è¿ä»£å¸ç¿’控制律為

å…¶ä¸

為åé¥‹æŽ§åˆ¶é …ï¼Œk[SUB]p[/SUB]å’Œk[SUB]d[/SUB]為æ£å®šçš„ä½ç½®å’Œé€Ÿåº¦å¢žç›ŠçŸ©
陣,

是系統的期望軌跡,

是第k次è¿ä»£å¸ç¿’éŽç¨‹
系統的實際輸出。

為å¸ç¿’æŽ§åˆ¶é …ï¼Œk[SUB]ILC[/SUB]為å¸ç¿’增益矩
陣,

為第k次è¿ä»£å¸ç¿’éŽç¨‹ç¥žç¶“網絡的輸出。
å‰é¢æ‰€ç”¨çš„å¸ç¿’律ä¸èƒ½åˆ©ç”¨å…¶å®ƒæŽ§åˆ¶æ–¹æ³•得到的先驗知è˜ï¼Œå°äºŽæ–°çš„æœŸæœ›è»Œè·¡å¿…é ˆé‡æ–°é–‹å§‹å¸ç¿’,這種å¸ç¿’機制ä¸ç¬¦åˆäººé¡žçš„å¸ç¿’行為,這是è¿ä»£å¸ç¿’控制難以推廣的é‡è¦åŽŸå› ï¼Œæœ‰é—œæ–‡ç»é‡å°äºŽæ¤å¼•入了éºå¿˜å› å。éºå¿˜å› å的引入抑制了è¿ä»£é–‹å§‹æ™‚跟蹤誤差的大幅度擺動,å°è¦æ±‚跟蹤的新的期望軌跡先利用系統的æ·å²æŽ§åˆ¶ç¶“驗,用神經網絡估計系統的期望輸入,作為è¿ä»£å¸ç¿’控制算法的åˆå§‹æŽ§åˆ¶è¼¸å…¥ï¼Œå†ç”±è¿ä»£å¸ç¿’律逿¥æ”¹å–„控制輸入,使得åªéœ€å°‘數的è¿ä»£æ¬¡æ•¸å°±èƒ½é”åˆ°è·Ÿè¹¤ç²¾åº¦çš„è¦æ±‚,大大æé«˜äº†ç³»çµ±çš„å¸ç¿’é€Ÿåº¦ï¼Œä½¿æ‰€ç ”ç©¶çš„æŽ§åˆ¶æ–¹æ³•æ›´å…·æœ‰å¯¦ç”¨åƒ¹å€¼ã€‚ç‚ºäº†å¯¦ç¾å°æœŸæœ›è»Œè·¡y[SUB]d[/SUB](t)的漸近跟蹤,采用改進的å¸ç¿’律:

å¼ä¸Î³ç‚ºéºå¿˜å› å0≤γ≤1,e[SUB]k[/SUB](t)為跟蹤誤差,e[SUB]k[/SUB](t)=y[SUB]d[/SUB](t)-y[SUB]k[/SUB](t)
R(t)為有界å¸ç¿’增益矩陣,R(t)∈R[SUP]mxr[/SUP]
åˆå§‹ä¿®æ£é …γu0(t)å¯ä»¥é¿å…è¿ä»£è»Œè·¡çš„大幅度擺動,從而å¯ä»¥åŠ å¿«è¿ä»£æ”¶æ–‚速度。
3 機器人控制仿真
通éŽä»¿çœŸåˆ†æžæ©Ÿå™¨äººç³»çµ±æŽ§åˆ¶æ–¹æ¡ˆæ•ˆæžœå¹¶èˆ‡å¸¸è¦æ©Ÿå™¨äººPID控制進 è¡Œå°æ¯”ã€‚ç”±ä»¿çœŸçµæžœå¯ä»¥çœ‹å‡ºï¼ŒåŸºäºŽç¥žç¶“網絡的è¿ä»£å¸ç¿’控制收斂速度快ã€è·Ÿè¹¤ç²¾åº¦é«˜ï¼Œè¶…調å°ï¼Œå…·æœ‰è‰¯å¥½çš„靿£’性和控制性能。
[align=center]

圖2 基于神經網絡模型辨è˜çš„è¿ä»£å¸ç¿’控制響應曲線

圖3 常è¦PID控制響應曲線[/align]
è¿ä»£å¸ç¿’控制響應曲線ã€å¸¸è¦PID 響應曲線分別如圖2ã€åœ–3所示。仿真曲線縱軸單ä½ç‚ºå¼§åº¦,橫軸單ä½ç‚ºç§’。
[align=center]

圖4 有干擾輸入無神經網絡辨è˜å™¨ä½œç”¨éŸ¿æ‡‰æ›²ç·š

圖5 有干擾輸入有神經網絡辨è˜å™¨ä½œç”¨éŸ¿æ‡‰æ›²ç·š

圖6 è¿ä»£å¸ç¿’控制跟蹤誤差輸出曲線[/align]
神經網絡辨è˜å™¨çµ¦å‡ºäº†æ©Ÿå™¨äººè¼ƒç‚ºç²¾ç¢ºçš„æ¨¡åž‹å¹¶æ¶ˆé™¤ç³»çµ±ä¸ç¢ºå®šæ€§å’Œå¤–部干擾的影響神經網絡辨è˜å™¨ä½œç”¨éŸ¿æ‡‰æ›²ç·šå¦‚圖4ã€åœ–5ã€åœ–6所示。
4 çµèªž
先進的建模與控制技術應用到以機器人為代表的éžç·šæ€§ã€æ™‚變ã€å¼·è€¦åˆå°è±¡ä¸åŽ»å·²ç¶“æˆç‚ºæ™ºèƒ½æŽ§åˆ¶æ–¹æ³•ç ”ç©¶çš„ç†±é»žã€‚éš¨è‘—æ™ºèƒ½æŽ§åˆ¶æ–¹æ¡ˆçš„æˆç†Ÿç™¼å±•ï¼Œå¿…å°‡åŠ å¿«æ©Ÿå™¨äººçš„æ‡‰ç”¨é€Ÿåº¦ã€‚ç•¶ç„¶ï¼Œå„種智能控制方案在機器人ä¸çš„實際應用還需è¦å¾ˆé•·çš„è·¯è¦èµ°ã€‚