概述
在當(dāng)今的數(shù)字時代,人們對于用現(xiàn)代科技解決復(fù)雜任務(wù)的需求日益高漲。雖然隨著機器人技術(shù)的發(fā)展,機器人的能力不斷提高, 機器人應(yīng)用的領(lǐng)域和范圍也在不斷擴展,但是對于一些復(fù)雜的任務(wù),單個機器人不再是最好的解決方案,而由是多個機器人組成的系統(tǒng)。
多機器人系統(tǒng)不是物理意義上的單個機器人的簡單代數(shù)相加,其作用效果也不是單個機器人作用的線性求和,它應(yīng)該還包括一個“線性和”之外的基于個體之間相互作用的增量。這種個體之間的相互作用包含兩個因素:“協(xié)調(diào)”與“合作”。
因此,多機器人系統(tǒng)是指若干個機器人通過合作與協(xié)調(diào)而完成某一任務(wù)的系統(tǒng)。它包含兩方面的內(nèi)容,即多機器人合作與多機器人協(xié)調(diào)。當(dāng)給定多機器人系統(tǒng)某項任務(wù)時,首先面臨的問題是如何組織多個機器人去完成任務(wù),如何將總體任務(wù)分配給各個成員機器人,即機器人之間怎樣進(jìn)行有效地合作。當(dāng)以某種機制確定了各自任務(wù)與關(guān)系后,問題變?yōu)槿绾伪3謾C器人間的運動協(xié)調(diào)一致,即多機器人協(xié)調(diào)。對于由緊耦合子任務(wù)組成的復(fù)雜任務(wù)而言,協(xié)調(diào)問題尤其突出[1]。
多機器人合作和協(xié)調(diào)是多機器人系統(tǒng)研究中的兩個不同而又有聯(lián)系的概念。前者研究的重點是高層的組織與運行機制問題,側(cè)重實現(xiàn)系統(tǒng)快速組織與重構(gòu)的柔性控制機制;后者則是研究機器人之間合作關(guān)系確定后具體的運動控制問題。
1 多機器人系統(tǒng)的優(yōu)點
與單個機器人相比,多機器人系統(tǒng)具有許多優(yōu)點:
(1)單個機器人不能完成某些任務(wù),必須依靠多個機器人才能完成。例如讓機器人搬運一個重物,對于這樣的任務(wù)也許可以設(shè)計一個能力特別強的機器人來完成,但從設(shè)計的復(fù)雜性和成本等方面來考慮,這樣的方案不如讓多個簡單的機器人組成系統(tǒng)來協(xié)作搬運。還有一些任務(wù),如執(zhí)行戰(zhàn)術(shù)使命、足球比賽等,必須要由一個機器人團隊來完成而非單個機器人。
(2)對于可以分解的任務(wù)來說,多個機器人可以分別并行地完成不同的子任務(wù),這比單個機器人完成所有的子任務(wù)要快得多。就是說,多機器人系統(tǒng)可以提高工作效率。對未知的區(qū)域建立地圖、對某區(qū)域進(jìn)行探雷均屬于這類任務(wù)。
(3)對于多機器人系統(tǒng)來說,可以將其中的成員設(shè)計成完成某項任務(wù)的“專家”,而不是設(shè)計成完成所有任務(wù)的“通才”,使得機器人的設(shè)計有更大的靈活性,完成有限任務(wù)的機器人可以設(shè)計得更完善。
(4)如果成員之間可以交換信息,多機器人系統(tǒng)可以更有效和更精確地進(jìn)行定位。這對于野外作業(yè)的機器人尤其重要。
(5)多機器人系統(tǒng)中的成員相互協(xié)作可以增加冗余度,消除失效點,增加解決方案的魯棒性。例如,裝配有攝像機的多機器人系統(tǒng)要建立某動態(tài)區(qū)域的基于視覺的地圖,那么某個機器人的失效不會對全局任務(wù)產(chǎn)生很大影響,因此,這樣的系統(tǒng)可靠性更強。
(6)多機器人系統(tǒng)與單個機器人相比,可以提供更多的解決方案,因此可以針對不同的具體情況,優(yōu)化選擇方案。
2 多機器人系統(tǒng)的應(yīng)用領(lǐng)域
由于多機器人系統(tǒng)的優(yōu)點,使得它的潛在應(yīng)用領(lǐng)域非常廣泛,列舉如下:
遠(yuǎn)地作業(yè)
某些應(yīng)用要求群體自主機器人系統(tǒng)能夠自動完成復(fù)雜的工作,而人類可以不時地從遠(yuǎn)處進(jìn)行干預(yù),以改變操作過程,彌補機器人的能力不足,與機器人協(xié)作共同完成復(fù)雜的任務(wù)。這類應(yīng)用領(lǐng)域如行星科學(xué)探險,在煤礦、火山口等高危環(huán)境下作業(yè)以及在水下培育作物等。
協(xié)助軍事行動
現(xiàn)代戰(zhàn)爭中使用機器人代替士兵執(zhí)行危險的任務(wù)能最大限度地減少地面部隊和非參戰(zhàn)人員的傷亡。這類任務(wù)有排雷、放哨、搜索、追蹤及架設(shè)通信設(shè)施等。
協(xié)助震后搜索與營救
城市搜尋和營救人員只有48小時在倒塌的建筑物中尋找被困的幸存者。否則,他們存活的可能性幾乎為零。近來發(fā)生在一些地區(qū)的地震,造成的城市環(huán)境的破壞程度超過了現(xiàn)有的營救資源(搜尋和營救專家、狗和探測器等)的能力。由于難以知道大型建筑物破壞的程度,影響了營救人員對該建筑物進(jìn)行安全、有效的搜索。有時由于人和狗的體積太大,不能到達(dá)要搜索的空間。如果能使機器人協(xié)助進(jìn)行這方面的工作,那么將會產(chǎn)生很大的影響。
自動倉庫管理
倉庫操作人員面臨著在降低成本的同時提高對客戶的反應(yīng)速度的競爭挑戰(zhàn)。由于涉及的勞動內(nèi)容以及設(shè)備投資等原因,指令揀選過程(order picking)在配送中心是成本最高的作業(yè)之一。操作人員依靠人力來進(jìn)行揀選并借助碼垛車或傳送帶系統(tǒng)運輸物料。將這些作業(yè)自動化將會受益非淺。在倉庫管理系統(tǒng)的全局監(jiān)控下,自動碼垛車在配送中心漫游,并移動到某個停駐在物料通道邊的揀選機,運送物料。這樣揀選機就可以專門進(jìn)行揀選而不需要花時間來回移動。因此,就可以實現(xiàn)倉庫管理工作的自動化和智能化,提供工作效率。
智能環(huán)境
智能環(huán)境是指利用計算機來完全改善日常活動的空間。智能環(huán)境通過把計算機和日常現(xiàn)象聯(lián)系起來,能夠使原來處于人-機范圍之外的事情相互作用。這可以應(yīng)用到智能房間和個人助理。許多環(huán)境如辦公樓、超市、教室及飯店很可能在今后逐漸發(fā)展成智能環(huán)境。這些環(huán)境中,智能體將會監(jiān)視資源的優(yōu)化使用,也會解決資源使用方面的沖突,智能體還要跟蹤環(huán)境中對各種資源的需求。另外,進(jìn)入環(huán)境中的每個人都會擁有一個智能體,該智能體的目標(biāo)是為用戶優(yōu)化環(huán)境中的條件。
自動建造
該應(yīng)用領(lǐng)域涉及大規(guī)模結(jié)構(gòu)的裝配,諸如高樓大廈、行星居住區(qū)或空間設(shè)備。將來,多異構(gòu)機器人系統(tǒng)將會在空間組裝大型空間設(shè)備,而這對于人類來說是非常困難的。
教育及娛樂系統(tǒng)
機器人玩具、教育工具及娛樂系統(tǒng)越來越風(fēng)行。許多這樣的系統(tǒng)(如機器人足球)要求多機器人之間進(jìn)行協(xié)調(diào)。
自動化工廠
工廠實現(xiàn)自動化是發(fā)展趨勢。為了增加產(chǎn)量、減少勞動成本,提高效率、安全性及總體質(zhì)量,越來越多的產(chǎn)業(yè)在尋求生產(chǎn)自動化設(shè)備。這要求有高效、高魯棒性的異構(gòu)多機器人系統(tǒng)的協(xié)作。
清除危險區(qū)域
這樣的例子有機器人掃雷、清掃核廢料及清掃災(zāi)區(qū)。
農(nóng)業(yè)機器人
在艱苦條件下的重體力勞動、單調(diào)重復(fù)的工作,如噴灑農(nóng)藥、收割及分選作物等有望由多農(nóng)業(yè)機器人系統(tǒng)完成,以解放出大量的人力資源。
3 多機器人系統(tǒng)的性能衡量指標(biāo)
各個應(yīng)用領(lǐng)域要求多機器人系統(tǒng)要有很高的性能,這些性能由下列指標(biāo)衡量[2]:
(1)魯棒性(Robustness):對機器人出現(xiàn)故障具有魯棒性。因為許多應(yīng)用要求連續(xù)的作業(yè),即使系統(tǒng)中的個別機器人出現(xiàn)故障或被破壞,這些應(yīng)用要求機器人利用剩余的資源仍然能夠完成任務(wù)。
(2)最優(yōu)化(Optimized):對動態(tài)環(huán)境有優(yōu)化反應(yīng)。由于有些應(yīng)用領(lǐng)域涉及的是動態(tài)的環(huán)境條件,具有根據(jù)條件優(yōu)化系統(tǒng)的反應(yīng)的能力成為能否成功的關(guān)鍵。
(3)速度(Speed):對動態(tài)環(huán)境反應(yīng)要迅速。如果總是要求將環(huán)境信息傳輸?shù)絼e的地方進(jìn)行處理才能作出決策,那么當(dāng)環(huán)境條件變化很快時,決策系統(tǒng)就有可能不能及時提供給機器人如何行動的指令。
(4)可擴展性(Extensibility):根據(jù)不同應(yīng)用的要求易于擴展以提供新的功能,從而可以完成新的任務(wù)。
(5)通信(Communication):要有處理有限的或不太好的通信的能力。要求應(yīng)用領(lǐng)域為機器人之間提供理想的通信,這在許多情況下是不現(xiàn)實的。因此,協(xié)調(diào)體系結(jié)構(gòu)對通信失效要具有很強的魯棒性。
(6)資源(Resource):合理利用有限資源的能力。優(yōu)化利用現(xiàn)有的資源,是優(yōu)化多機器人協(xié)調(diào)的重要因素。
(7)分配(Allocation):優(yōu)化分配任務(wù)。多協(xié)調(diào)機器人系統(tǒng)中一個主要難點就是確定個體機器人的任務(wù),這是設(shè)計體系結(jié)構(gòu)時要考慮的重要因素。
(8)異構(gòu)性(Heterogeneity):能夠應(yīng)用到異構(gòu)機器人團隊的能力。為了易于規(guī)劃,許多體系結(jié)構(gòu)以同構(gòu)機器人為假設(shè)條件。如果是異構(gòu)機器人的情況,協(xié)調(diào)問題將更困難。成功的體系結(jié)構(gòu)應(yīng)當(dāng)對同構(gòu)機器人和異構(gòu)機器人都適用。
(9)角色(Roles):優(yōu)化指定角色。許多體系結(jié)構(gòu)將機器人限于完成一種角色的功能,但機器人擁有的資源可以完成多種任務(wù)。優(yōu)化指定角色可以使機器人根據(jù)當(dāng)時可以利用的資源盡可能地完成多個角色的功能,并且隨著條件的變化而變化。
(10)新輸入(New Input):有處理動態(tài)新任務(wù)、資源和角色的能力。許多動態(tài)性應(yīng)用領(lǐng)域要求機器人系統(tǒng)能夠在運行過程中處理一些變化,如處理新分配的任務(wù)、增加新資源或引進(jìn)新角色。所有這些都由體系結(jié)構(gòu)支持。
(11)靈活性(Flexibility):易于適應(yīng)不同的任務(wù)。由于不同的應(yīng)用,有不同的要求,因此通用的體系結(jié)構(gòu)需要有針對不同的問題可以輕松重新配置的能力。
(12)流動性(Fluidity):易于適應(yīng)在操作過程中增加或減少機器人。一些應(yīng)用要求可以在系統(tǒng)運行過程中添加新的機器人成員。同樣,在執(zhí)行任務(wù)的過程中系統(tǒng)也要具有適應(yīng)減少成員或成員失效的現(xiàn)象。合理的體系結(jié)構(gòu)可以處理這些問題。
(13)學(xué)習(xí)(Learning):在線適應(yīng)特定的任務(wù)。雖然通用的系統(tǒng)非常有用,但將它用于特定應(yīng)用上時,通常需要調(diào)整一些參數(shù)。因此具有在線調(diào)整相關(guān)參數(shù)的能力是非常吸引人的,這在將體系結(jié)構(gòu)轉(zhuǎn)移到其它應(yīng)用時可以節(jié)省許多工作。
(14)實現(xiàn)(Implementation):能夠在物理系統(tǒng)上實現(xiàn)和驗證。和其它問題一樣,用實際的系統(tǒng)證實更能令人信服。然而要想成功實現(xiàn)物理系統(tǒng)需要解決那些在仿真軟件系統(tǒng)上不能發(fā)現(xiàn)的細(xì)節(jié)問題。
表1.1是目前多機器人系統(tǒng)在一些應(yīng)用領(lǐng)域的性能指標(biāo)實現(xiàn)情況。其中,“√”表示對應(yīng)的指標(biāo)已實現(xiàn)或達(dá)到。
應(yīng)
用
領(lǐng)
域 |
魯棒性 |
最優(yōu)化 |
速度 |
可擴展性 |
通信 |
資源 |
分配 |
異構(gòu)性 |
角色 |
新輸入 |
靈活性 |
流動性 |
學(xué)習(xí) |
實現(xiàn) |
自主群體 |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
城市偵察 |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ | |
城市搜索與營救 |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
|
√ |
倉庫管理 |
√ |
√ |
√ |
√ |
|
√ |
√ |
√ |
√ |
√ |
|
|
√ |
√ |
智能環(huán)境 |
√ |
√ |
√ |
√ |
|
√ |
|
√ |
|
√ |
√ |
√ |
√ |
√ |
自動建造 |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
|
|
√ |
教育與娛樂 |
√ |
√ |
√ |
√ |
|
|
|
√ |
|
|
√ |
|
√ |
√ |
自動工廠 |
√ |
√ |
√ |
√ |
|
√ |
√ |
√ |
√ |
|
√ |
|
√ |
√ |
探索危險區(qū)域 |
√ |
√ |
√ |
√ |
√ |
√ |
|
√ |
|
√ |
√ |
√ |
|
√ |
清除危險地點 |
√ |
√ |
√ |
√ |
√ |
√ |
|
√ |
|
√ |
√ |
√ |
|
√ |
農(nóng)業(yè)機器人 |
√ |
√ |
√ |
√ |
√ |
√ |
|
√ |
|
|
√ |
√ |
√ |
√ |
4 多機器人系統(tǒng)的研究現(xiàn)狀和研究內(nèi)容
正是因為多機器人系統(tǒng)有許多優(yōu)點和應(yīng)用領(lǐng)域,它才日益引起國內(nèi)外學(xué)術(shù)界的興趣與關(guān)注。在20世紀(jì)40年代中期,Grey Walter、Wiener和Shannon一起研究海龜一樣的機器人,這些機器人裝備有燈和接觸傳感器。通過對相互之間動作的反應(yīng),這些簡單的機器人顯示出“復(fù)雜的社會行為”。
自從20世紀(jì)70年代,多智能體的研究在分布式人工智能領(lǐng)域得到重視,一些機器人學(xué)的研究者開始將分布式人工智能(DAI)理論應(yīng)用到多機器人系統(tǒng)的研究中。
由于多機器人系統(tǒng)的應(yīng)用前景非常巨大,美、歐、日等發(fā)達(dá)國家從20世紀(jì)80年代中期就對多機器人系統(tǒng)投入了相當(dāng)大的研究熱情,協(xié)作機器人學(xué)得到發(fā)展,起初的項目有ACTRESS、DEBOT、GOFER、SWARM等。早期的研究主要以仿真為主,但近來的研究更強調(diào)實際的物理實現(xiàn)。如歐盟設(shè)立專門進(jìn)行多機器人系統(tǒng)研究的MARTHA課題――“用于搬運的多自主機器人系統(tǒng)(Multiple Autonomous Robots for Transport and Handling Application)”。美國海軍研究部和能源部也對多機器人系統(tǒng)的研究進(jìn)行了資助。國內(nèi)在該領(lǐng)域的研究工作很少,只有少數(shù)的研究所和大學(xué)在進(jìn)行相關(guān)的研究,且大部分的研究工作仍然停留在仿真和實驗室階段。
20世紀(jì)80年代后期,協(xié)作多機器人系統(tǒng)的快速發(fā)展體現(xiàn)為三個方面的相互影響:問題、系統(tǒng)和理論。為解決一個給定的問題,想象出一個系統(tǒng),然后進(jìn)行仿真、構(gòu)建,借用別的領(lǐng)域的理論進(jìn)行協(xié)作。將這些實際應(yīng)用中多機器人合作所面臨的任務(wù)加以抽象,列出了一些代表性的任務(wù),這些任務(wù)可分三類:
交通控制(Traffic Control)
當(dāng)多個機器人運行在同一環(huán)境中時,它們要努力避碰。從根本上說,這可以看作是資源沖突的問題,這可以通過引進(jìn)如交通規(guī)則、優(yōu)先權(quán)或通信結(jié)構(gòu)等來解決。從另一個角度來看,進(jìn)行路徑規(guī)劃必須考慮其它機器人和全局環(huán)境。這種多機器人規(guī)劃本質(zhì)上是配置空間-時間中的幾何問題。
推箱子/協(xié)作操作(Box-Pushing/Cooperative Manipulation)
許多工作是討論推箱子問題的。有的集中在任務(wù)分配、容錯和強化學(xué)習(xí)上,而有的則研究通信協(xié)議和硬件。協(xié)作操作較大的物體也非常令人感興趣,因為即使機器人之間相互不知道對方的存在也可以實現(xiàn)協(xié)作行為。
采蜜(Foraging)
它要求一群機器人去揀起散落在環(huán)境中的物體。這可以聯(lián)想到有毒廢物清除,收割,搜尋和營救等。采蜜任務(wù)是協(xié)作機器人學(xué)的規(guī)范的試驗床。這個問題之所以感興趣是因為,一方面這種任務(wù)可以由單個機器人來完成,另一方面可以從生物學(xué)獲得靈感來研究協(xié)作機器人系統(tǒng)。解決方案有最簡單的隨機運動拾撿,還有將機器人沿著目標(biāo)排成鏈型隊形將目標(biāo)傳遞到目的地。在研究這類問題時,群體的體系結(jié)構(gòu)和學(xué)習(xí)也是主要的研究主題。
多機器人系統(tǒng)是一個復(fù)雜的系統(tǒng),研究的內(nèi)容涉及方方面面,主要有:
(1)群體的體系結(jié)構(gòu)
體系結(jié)構(gòu)是多機器人系統(tǒng)的最高層部分和基礎(chǔ), 多機器人之間的協(xié)作機制就是通過它來體現(xiàn)的, 它決定了多機器人系統(tǒng)在任務(wù)分解、分配、規(guī)劃、決策及執(zhí)行等過程中的運行機制以及系統(tǒng)各機器人成員所擔(dān)當(dāng)?shù)慕巧绺鳈C器人成員在系統(tǒng)中的相對地位如何,是平等、自主的互惠互利式協(xié)作還是有等級差別的統(tǒng)籌規(guī)劃協(xié)調(diào)。總之,正如社會制度作用于人類社會一樣, 它決定了多機器人系統(tǒng)的運作機制, 事關(guān)協(xié)作效率的高低。從系統(tǒng)設(shè)計的角度而言, 系統(tǒng)結(jié)構(gòu)要有利于個體能力最大程度的發(fā)揮和任務(wù)的最高效完成。另外,協(xié)作機器人系統(tǒng)面向的是動態(tài)變化的環(huán)境,因而系統(tǒng)結(jié)構(gòu)要對環(huán)境有自組織適應(yīng)能力。
一般地,根據(jù)系統(tǒng)中是否有組織智能體為標(biāo)準(zhǔn),將體系結(jié)構(gòu)分為集中式控制和分布式控制,分別如圖1.1和圖1.2所示。
圖1.1 集中式控制 圖1.2 分布式控制
集中式結(jié)構(gòu)以有一個組織智能體為特點,由該組織智能體負(fù)責(zé)規(guī)劃和決策,其協(xié)調(diào)效率比較高,減少了用于協(xié)商的開銷,最突出的優(yōu)點是可以獲得最優(yōu)規(guī)劃。但難以解決計算量大的問題,因此其實時性和動態(tài)特性較差,不適用于動態(tài)、開放的環(huán)境。
分布式結(jié)構(gòu)沒有組織智能體,個體高度自治,每個機器人根據(jù)局部信息規(guī)劃自己的行為,并能借助于通信手段合作完成任務(wù),其所有智能體相對于控制是平等的,這種結(jié)構(gòu)較好地模擬了自然社會系統(tǒng),具有反應(yīng)速度快、靈活性高、適應(yīng)性強等特點,適用于動態(tài)、開放的任務(wù)環(huán)境。但這種結(jié)構(gòu)增加了系統(tǒng)的復(fù)雜性,由于沒有一個中心規(guī)劃器,所以難于得到全局最優(yōu)的方案,還可能帶來通信的巨大開銷。目前,分布式結(jié)構(gòu)是主流。
普遍的看法是分布式結(jié)構(gòu)在某些方面(如故障冗余、可靠性、并行開發(fā)的自然性和可伸縮性等)比集中式結(jié)構(gòu)要好。
另外,有的學(xué)者將分布式結(jié)構(gòu)和集中式結(jié)構(gòu)相結(jié)合,相互取長補短,系統(tǒng)中的組織智能體對其它個體只有部分的控制能力。
Anthony Stentz和M. Bernardine Dias提出了用自由市場體系的方法協(xié)作一組機器人實現(xiàn)特定的目標(biāo)。自由市場體制已被證實是一種能組織大量個體,從而提高總體生產(chǎn)效率的機制。這種方法對特定任務(wù)的解決方案定義收入和支出函數(shù),將任務(wù)分解成子任務(wù),機器人在執(zhí)行任務(wù)時,為了獲得最大的個人收入就會出現(xiàn)合作和競爭,從而實現(xiàn)目標(biāo)。這種基于自由市場體系的控制方法由于沒有集中控制而會有很高的魯棒性,并且能夠在動態(tài)環(huán)境中有效地利用資源。這種控制體系本質(zhì)上是分布式的,但有時會形成集中式的子組以提高效率。
在群體體系結(jié)構(gòu)中還涉及同構(gòu)與異構(gòu)的問題。如果群體中所有機器人的能力一樣,則這樣的系統(tǒng)為同構(gòu)系統(tǒng),如果群體中機器人的能力不盡相同,那么這樣的系統(tǒng)為異構(gòu)系統(tǒng)。相比之下,異構(gòu)系統(tǒng)更具有普遍性,但它會使問題更復(fù)雜,任務(wù)分配更加困難,智能體更需要對群體中的其它個體建模。在異構(gòu)系統(tǒng)中,任務(wù)分配一般按個體的能力來確定,在同構(gòu)系統(tǒng)中,各智能體需要被區(qū)分為不同的角色,以便控制時加以識別。群體體系結(jié)構(gòu)要能夠適應(yīng)動態(tài)自組織的要求。在系統(tǒng)拓?fù)浣Y(jié)構(gòu)可變情況下,動態(tài)選舉組織智能體和建立多智能體之間的關(guān)系是建立體系結(jié)構(gòu)時要考慮的問題之一。目前的研究中以同構(gòu)系統(tǒng)居多。
在協(xié)作多機器人系統(tǒng)中,比較典型的體系結(jié)構(gòu)有GOFER、MURDOCH、KAMARA、ALLIANCE、STEAM、CEBOT、SWARM等。
Caloud和Lepape等人用GOFER體系結(jié)構(gòu)研究了室內(nèi)環(huán)境中多個移動機器人進(jìn)行分布式求解問題。在該體系結(jié)構(gòu)中,有一個中心任務(wù)規(guī)劃系統(tǒng)(CTPS)。CTPS與所有的機器人進(jìn)行通信,對所有機器人的運行狀態(tài)和任務(wù)的完成情況有全局了解。然后,CTPS產(chǎn)生計劃結(jié)構(gòu),并將其通知所有的機器人。機器人利用任務(wù)分配算法來決定自身的角色。這樣,各機器人就可以知道系統(tǒng)在完成任務(wù)的過程中自身的目標(biāo),并利用傳統(tǒng)的AI規(guī)劃技術(shù)來實現(xiàn)該目標(biāo)。利用GOFER已經(jīng)成功地完成了三個機器人進(jìn)行推箱子、跟蹤等任務(wù)。
Gerkey和Mataric等人提出了MURDOCH體系結(jié)構(gòu),它是一種以資源為中心的信息交流模型。該結(jié)構(gòu)的主要特點在于,所有的通信交流都是以完成某任務(wù)所需要的資源為中心的,而不是基于名稱的。所有的任務(wù)分配都是根據(jù)單輪的拍賣交易而定。拍賣者決定誰是贏家,并通知該出價者。贏家獲得了任務(wù)合同,并要在有限的時間內(nèi)完成該任務(wù)。拍賣者負(fù)責(zé)監(jiān)控任務(wù)的完成情況,并周期性地給贏家發(fā)送合同更新信息,贏家要返回確認(rèn)信息。這些信息交流就對通信系統(tǒng)提出了一定的要求。如果拍賣者沒有及時收到確認(rèn)信息,則它認(rèn)為贏家機器人已經(jīng)出現(xiàn)了故障,并將該任務(wù)交給其它的出價者來完成。這樣,系統(tǒng)中就可能有多個機器人來完成同一項任務(wù)。
為了研究松耦合的中小型異構(gòu)機器人團隊的合作問題,Parker等人設(shè)計了ALLIANCE體系結(jié)構(gòu),它是一種具有容錯和自適應(yīng)能力的多機器人協(xié)調(diào)體系結(jié)構(gòu)。單個機器人采用基于行為的控制器,并將行為擴展為“行為集合”,這些行為集合可以完成一定的任務(wù)。這些行為集合靠動機行為(如急躁、默許)激活,從而使機器人去完成其它機器人不能完成的任務(wù)或放棄自己不能完成的任務(wù)。這就要求機器人可以通過感知或明確的廣播通信獲得它自身以及其它機器人的行為結(jié)果。雖然在這種體系結(jié)構(gòu)中機器人團隊具有容錯能力和適應(yīng)性,但系統(tǒng)不能夠?qū)討B(tài)變化的條件作出快速優(yōu)化的反應(yīng)。利用這種結(jié)構(gòu)已經(jīng)實現(xiàn)完成了推箱子、收集圓盤、隊形前進(jìn)等任務(wù)。
CEBOT是一種分散式、分層體系結(jié)構(gòu),它是由Fukuda和Nakagawa等人從生物學(xué)中的細(xì)胞結(jié)構(gòu)獲得靈感而提出的。系統(tǒng)中的“細(xì)胞”就是自主機器人,它和其它的“細(xì)胞”相互耦合,并可以根據(jù)環(huán)境的變化動態(tài)地重新配置它們的結(jié)構(gòu),從而達(dá)到某種最優(yōu)的結(jié)構(gòu)。CEBOT的層次中,“主細(xì)胞”(master cell) 用來協(xié)調(diào)子任務(wù)并和其它的主細(xì)胞進(jìn)行通信。其他的一些學(xué)者還對這種體系結(jié)構(gòu)中主細(xì)胞的選擇機制、通信以及對細(xì)胞行為的建模等問題進(jìn)行了研究。
總之,雖然許多多機器人協(xié)作結(jié)構(gòu)已經(jīng)在機器人系統(tǒng)上得到了實現(xiàn),并取得了不同程度的成功,但都需要滿足一定的前提條件。至今仍然沒有一種通用的體系結(jié)構(gòu)可以滿足在動態(tài)環(huán)境中多機器人有效協(xié)作的所有準(zhǔn)則。
對于單機器人來說,主要有分層遞階和基于行為兩種體系結(jié)構(gòu)。
(2)通信與協(xié)商
為進(jìn)行合作,多智能體之間要進(jìn)行協(xié)商。協(xié)商從形式上看是合作前或合作中的通信過程。因此,通信是多機器人系統(tǒng)動態(tài)運行時的關(guān)鍵。一些研究雖然在探討無通信的合作,但依據(jù)通信使系統(tǒng)效率得到提高是更實際的。按照交互方式可以將通信分為三類:
通過環(huán)境實現(xiàn)交互 即以環(huán)境作為通信的媒體,這是簡單的交互方式,但機器人之間并沒有明確的通信。
通過感知實現(xiàn)交互 機器人之間距離在傳感器感知范圍之內(nèi)時,可以相互感知到對方的存在,感知是一種局部的交互,機器人之間也沒有明確的通信。這種類型的交互要求機器人具有區(qū)分機器人與環(huán)境中物體的能力。多智能體機器人系統(tǒng)由于每個機器人都可能具有自己的傳感器系統(tǒng),整個系統(tǒng)的傳感器信息融合和有效利用是一個重要問題。
通過明確的通信實現(xiàn)交互 機器人之間有明確的通信,包括直接型通信和廣播型通信。
盡管計算機網(wǎng)絡(luò)通信提供了機器人之間通信的基本解決方案,但適合多機器人的實時性要求的通信協(xié)議、網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)及通信方式還需要進(jìn)行研究。目前計算機網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,為分布式信息處理系統(tǒng)帶來極大的便利。多機器人系統(tǒng)作為典型的分布式控制系統(tǒng)之一,網(wǎng)絡(luò)結(jié)構(gòu)將是其特征之一。但是,多機器人系統(tǒng)的通信與面向數(shù)據(jù)處理與信息共享的計算機網(wǎng)絡(luò)通信有很大的不同。如果機器人之間過分依賴通信進(jìn)行信息獲取,那么,當(dāng)機器人數(shù)量增加,系統(tǒng)通信就會變成提高系統(tǒng)效率的瓶頸。因此,既要研究適合多機器人系統(tǒng)通信的機制,又要利用智能體機器人具有對周圍環(huán)境的感知和推斷能力,研究機器人系統(tǒng)能基于對合作伙伴的行為推斷,輔之以必要的通信的控制策略。
(3)學(xué)習(xí)
找到正確的控制參數(shù)值,從而導(dǎo)致協(xié)作行為對于設(shè)計者來說是一項花費時間且困難的任務(wù)。學(xué)習(xí)是系統(tǒng)不斷尋找或優(yōu)化協(xié)作控制參數(shù)正確值的一種手段,也是系統(tǒng)具有適應(yīng)性和靈活性的體現(xiàn)。因此,非常渴望多機器人系統(tǒng)能夠?qū)W習(xí)從而優(yōu)化控制參數(shù)完成任務(wù),且能適應(yīng)環(huán)境的變化。強化學(xué)習(xí)(Reinforcement learning)是多機器人協(xié)作系統(tǒng)中經(jīng)常使用的一種學(xué)習(xí)方式。
(4)建模與規(guī)劃
如果智能體對與之協(xié)作的其他智能體的意圖、行動、能力和狀態(tài)等進(jìn)行建模,可使智能體之間的合作更有效。當(dāng)智能體具有對其他智能體行為進(jìn)行建模的能力時,對通信的依賴也就降低了。這種建模要求智能體能夠具有關(guān)于其他智能體行為的某種表達(dá),并依據(jù)這種表達(dá)對其他智能體的行動進(jìn)行推理。
根據(jù)系統(tǒng)全局目標(biāo),各智能體應(yīng)采用反應(yīng)式規(guī)劃的方法,包括由全局任務(wù)級規(guī)劃到各智能體動作級規(guī)劃的實現(xiàn),傳感器信息的利用,智能體間任務(wù)轉(zhuǎn)移,事件驅(qū)動的行為響應(yīng)(事件包括來自傳感器、人機接口信息和其他智能體的通信)等。
(5)防止死鎖與避碰
多個智能體機器人在共同的環(huán)境中運行時,會產(chǎn)生資源(如時間和空間)沖突問題。碰撞實際上也是一種資源沖突。在解決資源沖突的過程中,如果沒有適當(dāng)?shù)牟呗裕到y(tǒng)會造成一種運行的動態(tài)停頓。通過規(guī)劃(如事先確定某些規(guī)則、優(yōu)先級等),可以避免一部分死鎖與碰撞。多智能體機器人系統(tǒng)在事先難于預(yù)料的重組后,其死鎖避碰問題仍是富有挑戰(zhàn)性的題目。
(6)合作根源
智能體之間能否自發(fā)地產(chǎn)生合作,合作動機是什么,是一個令人感興趣的問題。目前的多機器人系統(tǒng)研究中幾乎都是人為地假設(shè)了合作必然發(fā)生。McFarland定義了自然界中的兩種群體行為:純社會行為(eusocial behavior)和協(xié)作行為。純社會行為可以在螞蟻或蜜蜂這一類昆蟲群體中發(fā)現(xiàn),是個體行為進(jìn)化所決定的行為。在這樣的社會中,個體智能體的能力十分有限,但從它們的交互中卻呈現(xiàn)出了智能行為。這種行為對生態(tài)群體中個體的生存是絕對必要的。協(xié)作行為是存在于高級動物中的社會行為,是在自私的智能體之間交互的結(jié)果。協(xié)作行為不象純社會行為,不是由天生行為所激發(fā)的,而是由一種潛在的協(xié)作愿望,以求達(dá)到最大化個體利益所驅(qū)動的。生物學(xué)系統(tǒng)的群體行為是有啟發(fā)的,但在目前機器人的智能水平上實現(xiàn)也許為時尚早,但這個問題的研究會有助于實際系統(tǒng)的設(shè)計與實現(xiàn)。
(7)多智能體機器人控制系統(tǒng)的實現(xiàn)
傳統(tǒng)的商品化機器人控制器是面向機器人以部件單元式應(yīng)用而發(fā)展起來的,難于滿足多機器人協(xié)作控制的要求。多智能體機器人控制器與傳統(tǒng)的機器人控制器將有很大的區(qū)別,它不僅要求較高的智能與自治的控制能力,而且要有易于協(xié)作、集成為系統(tǒng)工作的機制與能力。在控制器實現(xiàn)時,要具備支持協(xié)作的新軟件和硬件體系結(jié)構(gòu),如編程語言、人機交互方式、支持系統(tǒng)擴展的機制等。在具有分布式控制器的多機器人系統(tǒng)中,構(gòu)造與實現(xiàn)系統(tǒng)(包括支持多機器人協(xié)調(diào)合作的問題求解或任務(wù)規(guī)劃機制,控制計算機系統(tǒng)架構(gòu),分布式數(shù)據(jù)庫等)應(yīng)能使系統(tǒng)具有柔性、快速響應(yīng)性和適應(yīng)環(huán)境變化的能力。
5 多機器人系統(tǒng)的研究發(fā)展趨勢
由于協(xié)作機器人學(xué)是一個高度交叉的學(xué)科,其它相關(guān)學(xué)科的發(fā)展對它的影響很大,研究協(xié)作多機器人系統(tǒng)需要借鑒這些學(xué)科或解決某些問題的理論和方法,這是研究多機器人系統(tǒng)的發(fā)展方向和趨勢,具體來說,這些學(xué)科有:
分布式人工智能(DAI)
DAI主要研究由智能體組成的分布式系統(tǒng),它分為兩個部分:分布式問題求解(DPS)和多智能體系統(tǒng)(MAS)。DPS主要研究利用多個智能體解決同一個問題,智能體獨立地解決每個子問題或子任務(wù),并周期性地進(jìn)行交流結(jié)果。DPS中至少有三方面可以供多機器人系統(tǒng)借鑒:問題分解(任務(wù)分配)、子問題求解以及解綜合。
MAS研究多智能體的群體行為,這些智能體的目標(biāo)存在潛在的沖突。MAS可以供協(xié)作多機器人學(xué)借鑒的東西不只是MAS的一些具體的結(jié)論,更重要的是它的方法,如Agent建模方法、Agent的反射式行為驅(qū)動策略、Agent的拓?fù)浣Y(jié)構(gòu)、組織方法、多機器人Agent系統(tǒng)的框架、通信協(xié)議、磋商和談判策略以及系統(tǒng)的實現(xiàn)方法等。
分布式系統(tǒng)(Distributed System)
多機器人系統(tǒng)實際上就是一個分布式系統(tǒng)的特例,因此分布式系統(tǒng)是解決多機器人系統(tǒng)問題的重要思想來源。但分布式計算僅僅提供理論基礎(chǔ),具體的應(yīng)用還有具體分析。利用多機器人系統(tǒng)與分布式計算系統(tǒng)的相似性,一些學(xué)者已經(jīng)利用分布式系統(tǒng)的理論試圖解決死鎖、消息傳遞、資源分配等問題。
生物學(xué)(Biology)
生物學(xué)中螞蟻、蜜蜂及其它群居昆蟲的協(xié)作行為提供了有力的證據(jù):簡單的智能體組成的系統(tǒng)能完成復(fù)雜的任務(wù)。這些昆蟲的認(rèn)知能力非常有限,但通過相互交互就可以出現(xiàn)復(fù)雜行為。研究其自組織機制和合作機制,對于實現(xiàn)多機器人系統(tǒng)的協(xié)作將很有幫助。
另外,相關(guān)的學(xué)科還有社會學(xué)、生命科學(xué)以及工程學(xué)等。