在黃仁勛和馬斯克接連看到了AI智能體的發(fā)展?jié)摿螅琌penAI聯(lián)合創(chuàng)始人,特斯拉前人工智能總監(jiān)Andrej Karpathy也在最近高呼,AI智能體代表著一個(gè)瘋狂的未來。
Andrej Karpathy直言,自己在特斯拉的工作時(shí)“被自動(dòng)駕駛分了心”,鉆研自動(dòng)駕駛和VR都不是發(fā)展AI智能體的正確道路。此刻正是回歸神經(jīng)科學(xué),從中尋求靈感的時(shí)刻。
另一方面,Andrej Karpathy認(rèn)為每個(gè)人在構(gòu)建AI智能體的方面都比OpenAI這樣的公司更有優(yōu)勢,大家目前處于平等競爭的狀態(tài),因此他很期待看到這方面的成果:
AI智能體代表著一個(gè)瘋狂的未來,雖然可能還有點(diǎn)遠(yuǎn),但是今天到場的大家構(gòu)建的AI智能體已經(jīng)處于AI智能體能力的最前沿。
現(xiàn)在所有正在做大語言模型的機(jī)構(gòu),比如OpenAI等,我覺得都沒有處于這個(gè)領(lǐng)域的最前,最前沿的是在座的各位。
谷歌旗下AI團(tuán)隊(duì)DeepMind的最新論文介紹了一種能夠進(jìn)行自我改進(jìn)的AI智能體——RoboCat,本質(zhì)上是由AI賦能的軟件程序,相當(dāng)于機(jī)器人的“大腦”。由其加持的機(jī)器人與傳統(tǒng)機(jī)器人不同之處在于,RoboCat更具“通用性”,并可實(shí)現(xiàn)自我改進(jìn)、自我提升。
具身智能相當(dāng)于AI的大腦,而這個(gè)大腦的載體可以是任何形式??梢允且粋€(gè)機(jī)械臂,一只機(jī)器狗,更或者是一輛小汽車。
而反觀人形機(jī)器人,當(dāng)下為何被看做是一個(gè)不太聰明的鋼鐵巨人,核心還是因?yàn)槿鄙貯I大腦+不太靈活的軀體。
簡單來說,類似GPT-4這樣的大模型,對物理世界并不能真的產(chǎn)生影響,而具身智能則多了一個(gè)身體,通過傳感器收集環(huán)境信息,利用機(jī)械執(zhí)行器進(jìn)行物理操作,或者通過機(jī)器人等具體實(shí)體與人類和環(huán)境進(jìn)行實(shí)時(shí)互動(dòng)。
馬斯克曾說,雖然未來有一天人人可能會(huì)擁有一個(gè)人形機(jī)器人,但是目前展現(xiàn)的Optimus人形機(jī)器人產(chǎn)品也就只能執(zhí)行重復(fù)性的簡單勞動(dòng)。
具身智能的目標(biāo)是使機(jī)器能夠更好地理解和適應(yīng)復(fù)雜的環(huán)境,更高效地解決問題,并具備更靈活的行為能力。通過融合感知、決策和執(zhí)行的過程,具身智能使機(jī)器能夠更接近人類智能的表現(xiàn),從而在機(jī)器人技術(shù)、自動(dòng)駕駛、智能制造等領(lǐng)域發(fā)揮重要作用。
Karpathy直言,在7年前,研究AI智能體的時(shí)機(jī)還不成熟,因技術(shù)所限做出來的效果不好,于是他和OpenAI就改變了方向,開始研究大語言模型。
而現(xiàn)在有了全新的技術(shù)手段來研究AI智能體,情況和2016年完全不同了:
最簡單的例子就是,現(xiàn)在沒有人再像2016年那樣用強(qiáng)化學(xué)習(xí)的方法來研究AI智能體了?,F(xiàn)在的研究方法和方向在當(dāng)年是不可想象的。
大語言模型的出現(xiàn),給構(gòu)建具身智能體帶來了全新的可能性。因?yàn)榛贚LM的智能體可以利用預(yù)訓(xùn)練模型中蘊(yùn)含的世界知識(shí),生成一致的行動(dòng)計(jì)劃或可執(zhí)行策略,這就非常適合應(yīng)用于游戲和機(jī)器人之類的任務(wù)。
DeepMind的RoboCat只是AI賦能機(jī)器人的主要案例之一。
今年以來,已經(jīng)有數(shù)家公司將語言模型運(yùn)用到了機(jī)器人上:2023年年初,谷歌推出視覺語言模型PaLM-E,并運(yùn)用到工業(yè)機(jī)器人上;4月,阿里巴巴將千問大模型接入工業(yè)機(jī)器人;5月,特斯拉人形機(jī)器人Optimus展示了精準(zhǔn)的控制、感知能力,同月,英偉達(dá)發(fā)布全新自主移動(dòng)機(jī)器人平臺(tái)。
得益于此,人工智能加持的機(jī)器人化身具身智能吸引了全球的廣泛關(guān)注。
聯(lián)系客服