導(dǎo)讀:2023國家機器人發(fā)展論壇(CAA菁英系列活動)于2023年6月17-18日在廣東深圳召開,壇以“集群促發(fā)展,創(chuàng)新向未來”為主題,聚焦智能機器人產(chǎn)業(yè),邀請多位行業(yè)領(lǐng)軍人物同臺,助力打造世界級先進制造業(yè)集群。會上,中國自動化學(xué)會會士、理事、浙江大學(xué)熊蓉教授,作題為“人形機器人研究進展與發(fā)展挑戰(zhàn)”的大會報告,重點介紹了人形機器人的研究背景與意義、研究歷史與進程的基礎(chǔ)上其團隊在人形機器人系統(tǒng)研制、運動控制、智能移動等方面開展的工作和進展等內(nèi)容。
人形機器人,也被稱為仿人機器人,是一類具有人類外形、模仿人類功能和智能的機器人。與其他機器人相比,它的區(qū)別在于擁有人類外形,包括雙足、雙臂和頭部。這種外形使得人形機器人在人類的工作和生活環(huán)境中具有更強的通用性和適應(yīng)性。它能夠適應(yīng)人類環(huán)境的不連續(xù)性,像人類一樣使用自己創(chuàng)造的工具,從而能夠?qū)崿F(xiàn)人與機器人的無縫銜接和替換。此外,人形機器人的人類外形也更容易被人們接受,在人機交互過程中起到重要的作用。
一、研究背景與意義
人形機器人領(lǐng)域是機器人領(lǐng)域中一個重要的技術(shù)挑戰(zhàn)點,甚至被稱為國與國之間技術(shù)競爭的制高點。首先,它涉及到機器人的各個方面的關(guān)鍵技術(shù)以及這些技術(shù)的集成和融合。從系統(tǒng)角度看,人形機器人是一個高自由度的復(fù)雜系統(tǒng)。其制造、設(shè)計、建模和規(guī)劃都涉及到許多問題,如驅(qū)動和傳動的實現(xiàn)、感知與決策的融合,以及軟硬件的有效融合等。
從運動的角度看,人形機器人是以腳為支撐點與地面進行間斷性接觸的。它的腳與地面接觸的空間很小,時間也很短,這導(dǎo)致了穩(wěn)定控制的時空域非常有限。同時,人形機器人面臨建模的不準確性、地面的不平整性以及作業(yè)過程中各種位置干擾等問題,如圖1所示,由于其本質(zhì)上不穩(wěn)定,從而在應(yīng)用中面臨著許多困難。上世紀60年代到本世紀2015年,學(xué)術(shù)界主要關(guān)注的問題都是圍繞如何設(shè)計制造具有穩(wěn)定運動能力的人形機器人展開研究。
圖1 人形機器人的技術(shù)難點
隨著這些關(guān)鍵技術(shù)的逐步解決,我們目前的焦點已經(jīng)擴展至如何將人形機器人應(yīng)用于多樣化的場景中。這與其他機器人技術(shù)的發(fā)展趨勢相似,機器人需要應(yīng)對各種不同的環(huán)境,并能夠適應(yīng)各種特定需求,另外,還需要具備通用性,能夠在這種形態(tài)下執(zhí)行各種任務(wù)。
總的來說,人形機器人給機器人技術(shù)的各個方面都帶來了挑戰(zhàn),并推動了相關(guān)零部件和技術(shù)的發(fā)展。從電機、傳動到液壓器件,它對機器人領(lǐng)域和產(chǎn)業(yè)的發(fā)展起到了積極的推動和支持作用。
二、研究歷史與進程
下面簡要介紹一下整個人形機器人的發(fā)展歷程,其發(fā)展歷史如圖2所示。第一臺人形機器人誕生于1969年,由日本早稻田大學(xué)研制,它采用液壓驅(qū)動,驅(qū)動部件龐大且重量較大,并且都放置在機器人的外部,采用的是靜態(tài)行走方式,每步行走距離為15厘米,需要約40秒的時間。隨后,許多研究機構(gòu)開始進行人形機器人的研究。在80年代,出現(xiàn)了兩個對當前發(fā)展起到了重要基礎(chǔ)作用的團隊。其中一家是本田公司,于1986年開始研究人形機器人,注重系統(tǒng)設(shè)計和動態(tài)運動方面的研究。2000年,本田公司的研究取得了重要突破,推出了ASIMO人形機器人。ASIMO能夠以每小時1.6公里的速度行走,其研發(fā)過程中采用了直流電機和諧波減速器等關(guān)鍵技術(shù),這對相關(guān)產(chǎn)業(yè)的發(fā)展起到了重要推動作用。另一個重要的團隊是來自麻省理工學(xué)院(MIT)的Marc Raibert在1986年提出的動態(tài)行走理論。這一理論的提出為后來波士頓動力公司的成立以及其研發(fā)的四足和雙足機器人打下了堅實的基礎(chǔ)。這一階段可以稱為基礎(chǔ)理論與系統(tǒng)形成的階段。
圖2 人形機器人的研究歷史
2000年之后,人形機器人的研究取得了更多的進展。例如,ASIMO等研究機構(gòu)不斷優(yōu)化和改進機器人的行走速度,并引入了人機運動映射技術(shù),使機器人能夠執(zhí)行更復(fù)雜的動作。同時,研究人員進一步結(jié)合智能技術(shù),使機器人具備與人類進行交互的能力,例如為人端茶遞物。自2009年起,波士頓動力公司開始致力于滿足美軍的需求,并在福島核電站事故后開始研究高動態(tài)運動的人形機器人,以便執(zhí)行特種任務(wù)。這一階段研究領(lǐng)域形成了不同的技術(shù)流派,包括多種不同的平衡控制技術(shù)以及不同的驅(qū)動技術(shù)。這些技術(shù)的發(fā)展使得人形機器人的技術(shù)變得多樣化且具有廣泛的應(yīng)用前景。在2022年特斯拉所發(fā)布的人形機器人,馬斯克關(guān)于人形機器人方面的一系列的規(guī)劃、布局,引起了世界的廣泛關(guān)注。
從上個世紀90年代開始,國防科技大學(xué)、北京理工大學(xué)以及其他高校、研究機構(gòu)和企業(yè)也都積極投身于人形機器人領(lǐng)域的研究。浙江大學(xué)自2006年起著手研究人形機器人,并以踢足球的小型仿人機器人作為起點,積累相關(guān)技術(shù),并成功將智能感知、定位、導(dǎo)航規(guī)劃等能力融入其中。
2008年至2011年期間,我們在國家“863”重點課題的支持下成功研制了一款能夠與人或其他機器人進行兵乓球?qū)Υ虻姆氯藱C器人,如圖3所示。這款機器人具有成人大小,身高1.65米,重量56公斤。該項目的突破之處在于設(shè)計了輕量化的機械結(jié)構(gòu),并實現(xiàn)了30個自由度的高實時控制。針對乒乓球這種高速運動的飛行物體,浙大團隊解決了在線準確識別定位和軌跡預(yù)測的問題,同時還實現(xiàn)了實時運動規(guī)劃和全身平衡控制,以應(yīng)對手臂大加速度帶來的不穩(wěn)定性。該成果在發(fā)布后引起了國內(nèi)外廣泛關(guān)注,包括國外知名媒體對其進行了報道和拍攝。此外,該成果還被收錄進美國基金委向奧巴馬政府提交的工作報告中,進一步彰顯了其重要性和影響力。
圖3 浙江大學(xué)人形機器人研究
但是機器人打球的過程中,主要依靠下肢來進行平衡控制。由于行走速度僅達到1.2公里/小時,無法跟上快速打球的節(jié)奏。因此,從2012年開始,我們的研究重點轉(zhuǎn)向如何提高機器人的行走速度,并使其能夠在室內(nèi)外不平整的地面以及各種未知擾動下行走。同時,還著重考慮了上肢運動的結(jié)合,為機器人的發(fā)展奠定了基礎(chǔ)。
過去的10年時間里,浙大團隊進行了大量的研究工作,包括驅(qū)動系統(tǒng)、傳動系統(tǒng)、機構(gòu)設(shè)計、控制方法以及運動學(xué)習(xí)和生成等方面。目前,機器人已經(jīng)實現(xiàn)了6.6公里/小時的行走速度,可以在室內(nèi)外不平整的地面上自主適應(yīng)和適應(yīng)大的外力擾動,能夠上下15度的斜坡,并可以跳下20厘米高的臺階。
三、關(guān)鍵技術(shù)與進展
在人形機器人的技術(shù)發(fā)展中,我們按照系統(tǒng)集成、運動和未來作業(yè)需求的角度進行了劃分,分別稱為體能、技能和智能。在體能方面,我們探索了不同的技術(shù)路線,如圖4所示。一種方法是采用直流電機+諧波減速器+彈性單元的組合,以實現(xiàn)高效的彈跳能力。然而,這種彈性元件的變化也帶來了許多挑戰(zhàn)。因此,在2015年之后,浙大團隊開始采用四足機器人中常用的大間隙半徑電機,通過力位的伺服控制來驅(qū)動機器人。
圖4 關(guān)節(jié)運動方式
在人形機器人的技能方面,我們重點關(guān)注它的穩(wěn)定平衡運動能力,并進行了相關(guān)的研究工作。目前,主要有兩種方法:一種是傳統(tǒng)的基于模型的方法,通過建立機器人的運動學(xué)和動力學(xué)模型,進行擺動腿的軌跡規(guī)劃,進而開展平衡控制。除了傳統(tǒng)的方法,另一種是采用學(xué)習(xí)的方法,如模仿學(xué)習(xí)和生成學(xué)習(xí),來生成機器人的運動和控制策略。
穩(wěn)定平衡控制是其中最核心的問題,在整個發(fā)展過程中涌現(xiàn)出多種方法,如圖5所示,并都發(fā)揮了重要作用。其中,ASIMO采用了ZMP判據(jù)的控制方法,密歇根大學(xué)等采用混雜零動態(tài)規(guī)劃方法實現(xiàn)機器人狀態(tài)在穩(wěn)定平面上的控制, Marc Raibert等人提出了虛擬模型的解耦控制方法。這些方法各有優(yōu)缺點,前兩者依賴于精確的動力學(xué)模型。
圖5 基于模型的穩(wěn)定平衡控制
通過研究,我們發(fā)現(xiàn)虛擬模型控制方法在降低對精確模型依賴性方面取得了進展。然而,在復(fù)雜環(huán)境下,虛擬模型控制的容錯性存在限制。因此,我們進行了相關(guān)研究,并借鑒人類保持平衡時的行為策略。與傳統(tǒng)方法不同,人類在受到擾動時采用踮腳的方式來保持穩(wěn)定,從而縮小了穩(wěn)定域的范圍。我們在理論上證明,只需保持在穩(wěn)定域邊界上即可實現(xiàn)穩(wěn)定性,而不需要較大的穩(wěn)定域和支撐域。進一步,基于虛擬模型的思想,我們提出了一種通過足部傾斜主動控制來增加穩(wěn)定域的方法,如圖6所示。在人形機器人上成功實現(xiàn)了該方法,并發(fā)表了高水平的論文。然而,人形機器人在多個虛擬模型的結(jié)合和協(xié)調(diào)方面存在一定限制,以及在不同場景下設(shè)計不同虛擬模型的通用性的挑戰(zhàn)。
圖6 虛擬模型下主動欠驅(qū)動平衡控制
所以,采用模型預(yù)測控制和全身控制的方法可以提高人形機器人的動作穩(wěn)定性和協(xié)調(diào)性,如圖7所示。這種方法基于軌跡規(guī)劃和剛體動力學(xué)建模,通過模型預(yù)測控制計算地面反作用力和力矩,并結(jié)合全身控制生成關(guān)節(jié)力矩。通過該集成控制策略,我們能夠更準確地預(yù)測和調(diào)整機器人的運動,使其能夠在復(fù)雜環(huán)境中實現(xiàn)穩(wěn)定的運動和協(xié)調(diào)的動作。在仿真環(huán)境中已經(jīng)實現(xiàn)了一些復(fù)雜動作,如跳躍和后空翻,但仍需要進一步提升關(guān)節(jié)力矩以實現(xiàn)更高水平的執(zhí)行能力。我們將繼續(xù)努力改進和優(yōu)化控制方法,以進一步提升人形機器人的運動能力和執(zhí)行復(fù)雜動作的能力。
圖7 全身協(xié)調(diào)模型預(yù)測控制
此外我們有兩項工作對研究機器人控制方法起到了關(guān)鍵作用。首先,我們致力于在線辨識動力學(xué)參數(shù),以確保準確建立模型,適應(yīng)機器人在運動過程中構(gòu)型和動力學(xué)參數(shù)發(fā)生變化等復(fù)雜情況。引入隨機變量后驗概率估計的方法后,通過定義隨機變量的向量空間以及相關(guān)的數(shù)據(jù)結(jié)構(gòu)和投影運算,可以實現(xiàn)一種級連式的估計方法。對于每個關(guān)節(jié)模塊,可以建立運動模型和等效辨識模型,并進行迭代運行。在單腿和雙腿的情況下,包括腿部質(zhì)量變化和外部負載變化等擾動,該方法的具有較好的有效性。
然而,僅僅依靠模型預(yù)測控制可能無法有效應(yīng)對大擾動,因此,在2009年浙大團隊提出了一種方法,如圖8所示,通過建立速度與著地點之間的關(guān)系,將擾動轉(zhuǎn)化為速度變化,并根據(jù)這些速度確定適當?shù)闹攸c。將這一方法與之前的控制方法相結(jié)合,可以實現(xiàn)了在面對大幅擾動時的穩(wěn)定平衡控制。
圖8 基于速度感知的動態(tài)落腳點規(guī)劃
近年來,深度學(xué)習(xí)和強化學(xué)習(xí)的發(fā)展為人形機器人的平衡控制提供了新的方法,如圖9所示。在國內(nèi)外的研究中,人們致力于利用強化學(xué)習(xí)來實現(xiàn)人形機器人的平衡控制。例如,在四足機器人領(lǐng)域,蘇黎世理工學(xué)院等機構(gòu)開展了大量研究工作。在人形機器人領(lǐng)域,美國的Oregon州立大學(xué)等研究機構(gòu)也進行了各種研究,包括提高機器人在不同地面上運動的魯棒性,如轉(zhuǎn)彎、上下臺階以及走梅花樁等動作。此外,研究人員還關(guān)注如何根據(jù)感知信息提升運動的準確性,并使機器人能夠適應(yīng)復(fù)雜的環(huán)境變化。這些研究都為人形機器人的平衡控制領(lǐng)域做出了重要貢獻。
圖9 采用學(xué)習(xí)的穩(wěn)定平衡控制
浙大團隊之前研究了四足機器人步態(tài)學(xué)習(xí),采用強化學(xué)習(xí)方法進行步態(tài)生成,并提出了一種步態(tài)生成網(wǎng)絡(luò),以整合各種步態(tài),可根據(jù)機器人當前的狀態(tài)選擇適宜的步態(tài)。這一網(wǎng)絡(luò)使機器人能夠在面對未知環(huán)境時做出合適的步態(tài)選擇,并通過綜合多種步態(tài)以適應(yīng)環(huán)境變化,從而在新環(huán)境中展示出靈活的行動能力。該研究為機器人應(yīng)對各種挑戰(zhàn)并在新環(huán)境中表現(xiàn)出優(yōu)異的適應(yīng)性提供了有益的探索和成果。
然而,在應(yīng)用純強化學(xué)習(xí)方法于人形機器人時,由于人形機器人具有相對較小的穩(wěn)定時空域,這導(dǎo)致獲得穩(wěn)定案例和進行迭代學(xué)習(xí)的速度較慢。因此,我們提出了將模型方法與學(xué)習(xí)方法相結(jié)合的策略,如圖10所示。通過采用啟發(fā)式模型來規(guī)劃擺動腿的運動,該模型對支撐腿的參數(shù)高度依賴,而對于參數(shù)依賴較強的情況,可以采用學(xué)習(xí)方法。通過串并聯(lián)混合的方法,加速了學(xué)習(xí)過程,并提高了對質(zhì)量、擾動和噪聲等因素的魯棒性。然而,人形機器人仍然容易受到地面不平整等因素的影響。為此,需要引入了隱藏空間的學(xué)習(xí),采用教師-學(xué)生模型,通過從一些優(yōu)秀模型中學(xué)習(xí)隱藏空間的映射關(guān)系,可以進一步提升機器人穩(wěn)定性。目前,浙大人形機器人已成功實現(xiàn)了在15-18厘米地形起伏的不同環(huán)境下穩(wěn)定行走,并達到了3公里/小時的速度。
圖10 模型-學(xué)習(xí)混合的雙足步行運動生成
此外,在運動學(xué)習(xí)和強化學(xué)習(xí)生成方面,浙大團隊也做出了一定的貢獻。通過圖神經(jīng)網(wǎng)絡(luò)構(gòu)建學(xué)習(xí)模型,并結(jié)合最優(yōu)化搜索,在編碼后的隱藏空間中尋找最佳匹配,之后進行最優(yōu)化搜索,以實現(xiàn)對大型動作序列的快速學(xué)習(xí),如圖11所所示。結(jié)果顯示,學(xué)習(xí)時間提升了10-100倍,同時動作相似性評估也有了顯著提升。
圖11 隱空間優(yōu)化的映射學(xué)習(xí)
此外,我們擴展了研究范圍,將其應(yīng)用于不同的結(jié)構(gòu)中。對于包括動畫角色在內(nèi)的多樣化動作,可以解決其在拓撲結(jié)構(gòu)上的差異性。在與此相關(guān)的數(shù)字虛擬人研究中驗證,能夠成功地遷移至未曾接觸過的拓撲結(jié)構(gòu),并在已有結(jié)構(gòu)上實現(xiàn)更優(yōu)秀的接觸和穿模。進一步地,我們開始將動力學(xué)約束融入研究中,并在仿真環(huán)境中成功地將之前學(xué)習(xí)到的知識應(yīng)用于新的結(jié)構(gòu)中。
最后,我們還開展了智能移動和智能操作方面的研究。自2003年以來,浙大一直在這個領(lǐng)域進行研究,并在各種機器人應(yīng)用中進行了驗證,包括工業(yè)機器人、無人駕駛車輛以及特殊環(huán)境。結(jié)合腿足機器人,團隊還專注于以下方面的進一步研究:首先如何構(gòu)建大范圍全局一致的稠密高程地圖,如圖12所示;其次,為解決足式運動引起的震蕩問題、足式運動所帶來的計算資源限制,以及在特殊環(huán)境中紋理稀缺或傳感器失效的情況下如何選擇適合的傳感器和傳感器融合問題;以及如何規(guī)劃落腳點。
圖12 大范圍全局一致稠密高程地圖構(gòu)建
在操作方面,聚焦于感知、力位控制、序列生成和語義動作生成等方面的研究,并探索如何將這些工作應(yīng)用于人形機器人??傮w而言,我們的下一步研究旨在實現(xiàn)智能操作和移動與人形機器人運動的綜合。
四、進展機遇與挑戰(zhàn)
在當前的背景下,我國也在積極探索人形機器人技術(shù)與產(chǎn)業(yè)化的發(fā)展。除了浙江大學(xué),還有許多研究機構(gòu)致力于人形機器人的研究,整體技術(shù)積累十分豐富,但仍有一些技術(shù)需要突破。與國際水平相比,在集成方面存在一定差距。具體需要突破的技術(shù)包括零部件方面,如關(guān)節(jié)的高力矩能力和靈巧手;智能感知、協(xié)同作業(yè)以及系統(tǒng)安全,包括機器人自身安全、交互安全和信息安全等方面;另外還有軟硬件集成方面的挑戰(zhàn),需要實現(xiàn)高度融合、輕量化、穩(wěn)定性和可靠性。這些都是需要進一步攻克的技術(shù)難題。
從產(chǎn)業(yè)鏈的角度來看,多年來機器人和汽車產(chǎn)業(yè)鏈為人形機器人的發(fā)展提供了基礎(chǔ)。然而,與其他產(chǎn)業(yè)鏈相比,人形機器人的產(chǎn)業(yè)鏈更為復(fù)雜和長鏈條。如何實現(xiàn)在眾多技術(shù)領(lǐng)域的緊密結(jié)合,并形成產(chǎn)學(xué)研用的協(xié)同機制,是一個重要的問題。
在人形機器人的研發(fā)方面,國外已經(jīng)在控制器、仿真軟件開發(fā)平臺、大型訓(xùn)練平臺和數(shù)據(jù)集等方面做了大量工作,形成了相對完善的生態(tài)體系。然而,我們在這方面的大部分研究仍然依賴國外平臺,因此迫切需要建立自己的工具鏈和生態(tài)體系。
在人形機器人的產(chǎn)業(yè)化過程中,供應(yīng)鏈管理和低成本制造是重要的考慮因素。然而,與此同時,如何確保人形機器人具備高性能,并應(yīng)對其作為新型復(fù)雜系統(tǒng)所帶來的制造工藝等挑戰(zhàn)也是需要解決的問題。
自2000年開始機器人研究,并于2006年開始專注于人形機器人研究以來,浙大團隊經(jīng)歷了人形機器人領(lǐng)域的高潮和低谷。盡管遇到了挑戰(zhàn),但我們?nèi)栽趫猿植恍傅赝苿游覈谌诵螜C器人技術(shù)和產(chǎn)業(yè)方面的發(fā)展。
聯(lián)系客服