文丨《瞭望東方周刊》記者萬宏蕾 原文標(biāo)題:當(dāng)AI“煉”成人形,能為人類做些什么?
完整、逼真的“人形”身體,因?qū)θ祟愑歇?dú)特的親和力、有望實(shí)現(xiàn)復(fù)雜功能等特性,被視為AI的一種理想載體,甚至“終極形態(tài)”。
7月4日,在2024世界人工智能大會拍攝的“十八金剛 眾創(chuàng)未來——人形機(jī)器人先鋒陣列”( 王翔/攝)
8月21-25日,在北京舉行的2024世界機(jī)器人大會上,27款國產(chǎn)人形機(jī)器人引發(fā)廣泛關(guān)注。“他們”在大會現(xiàn)場演奏揚(yáng)琴、潑墨揮毫、比球賽、打辯論、跳“科目三”,賺足了流量。
7月4日,在上海開幕的2024世界人工智能大會(WAIC)上,由15款、18臺人形機(jī)器人組成的“十八金剛”陣列,向現(xiàn)場觀眾做出整齊的動作,分外吸睛。國家地方共建人形機(jī)器人創(chuàng)新中心的“青龍”、智元機(jī)器人的遠(yuǎn)征A2、宇樹科技的Unitree H1、傅利葉的GR-1、達(dá)闥的雙足XR4等國產(chǎn)具身機(jī)器人產(chǎn)品紛紛亮相。
7月6日,在2024世界人工智能大會上,人們觀看宇樹科技通用人形機(jī)器人Unitree H1表演“科目三”舞蹈(王翔/攝)
“具身智能是人工智能發(fā)展的下一個浪潮。”中國工程院院士、清華大學(xué)信息學(xué)院院長、北京信息科學(xué)與技術(shù)國家研究中心主任、中國人工智能學(xué)會理事長戴瓊海說。
所謂“具身智能”,就是給能理解、推理并與物理世界互動的AI“頭腦”再加上一個“身體”,“身體”可以是手機(jī)、汽車、機(jī)床、機(jī)械臂等等,而完整、逼真的“人形”身體,因?qū)θ祟愑歇?dú)特的親和力、有望實(shí)現(xiàn)復(fù)雜功能等特性,被視為AI的一種理想載體,甚至“終極形態(tài)”。這兩年,在大模型高速發(fā)展帶動下,人形機(jī)器人產(chǎn)業(yè)迎來風(fēng)口,成為全球科技業(yè)最熱的賽道之一。
2024年8月,美國具身智能公司Figure AI發(fā)布二代人形機(jī)器人Figure02。此前,Figure 01已進(jìn)入寶馬工廠工作。國內(nèi),優(yōu)必選的人形機(jī)器人Walker S先后走進(jìn)比亞迪、蔚來、東風(fēng)柳汽、極氪等汽車工廠“打工”,智元機(jī)器人的人形機(jī)器人遠(yuǎn)征A1也在汽車工廠完成底盤裝配和外觀質(zhì)檢等任務(wù)……
“AI大模型將賦能人形機(jī)器人走向主動交互,成為繼計(jì)算機(jī)、智能手機(jī)、新能源汽車后的顛覆性產(chǎn)品。”8月13日,十四屆全國政協(xié)常委、工業(yè)和信息化部原副部長、中國電子學(xué)會理事長徐曉蘭在2024世界機(jī)器人大會新聞發(fā)布會上說。
越來越“像”人
在位于上海浦東張江科學(xué)城的國家地方共建人形機(jī)器人創(chuàng)新中心(以下簡稱“國地中心”)內(nèi),身高185厘米、體重80公斤,擁有多達(dá)43個主動自由度的人形機(jī)器人“青龍”雙臂輕展,用五根鋼鐵手指,將面包輕輕捏起。
全球首款全尺寸通用人形機(jī)器人開源公版機(jī)——“青龍”機(jī)器人正在展示(萬宏蕾/攝)
“‘青龍’具有五感能力:能看,能聞,能聽,有觸覺,還有姿態(tài)傳感器。它雙手非常靈活,能精準(zhǔn)抓取兩厘米的小物件,能用工具在小米里挑出芝麻。”國地中心總經(jīng)理許彬告訴《瞭望東方周刊》,“‘青龍’機(jī)器人平臺的核心技術(shù)前期經(jīng)過了十余年的沉淀。從國地中心成立到最近在世界人工智能大會上整機(jī)亮相,我們團(tuán)隊(duì)在短短半年時間內(nèi),厚積薄發(fā),從無到有,實(shí)現(xiàn)了突破。”
“端水、抓取,聽起來簡單,做起來復(fù)雜,涉及從感知、決策到控制的多項(xiàng)技術(shù)。”國地中心首席科學(xué)家江磊說,“‘青龍’一條手臂有7個自由度、末端手指有6個自由度,指尖有觸覺傳感器,因此可以完成對抓取的自主判斷。”
“對人形機(jī)器人來說,大腦對應(yīng)智能系統(tǒng),小腦對應(yīng)控制系統(tǒng),五官對應(yīng)機(jī)器人的感知,執(zhí)行則通過關(guān)節(jié)進(jìn)行。”上海機(jī)器人產(chǎn)業(yè)技術(shù)研究院副院長周梅杰說。
“‘青龍’之所以聰明,在于機(jī)器人和大模型的深度融合,負(fù)責(zé)人機(jī)交互和決策的‘大腦’(朱雀具身大腦大模型)、負(fù)責(zé)穩(wěn)定行走的‘小腦’(玄武小腦模型),共同形成人形機(jī)器人的技術(shù)基座。”江磊介紹說,朱雀具身大腦如同一個智能化指揮調(diào)度中心,以多模態(tài)大模型為核心,能夠接收文字信息、圖像信息等多種輸入,并輸出精準(zhǔn)的語音交互以及明智的任務(wù)決策信息;玄武小腦模型側(cè)重于任務(wù)執(zhí)行,其軌跡規(guī)劃模塊采用“端到端”模仿學(xué)習(xí)驅(qū)動的方式。
“在大數(shù)據(jù)、大模型和大算力的支持下,人形機(jī)器人正在變得越來越聰慧,逐漸具備自主完成任務(wù)的能力。”徐曉蘭說。
機(jī)器人產(chǎn)業(yè)已發(fā)展多年,過去的機(jī)器人一般只側(cè)重一個“技能點(diǎn)”,“寫一段代碼做一件事”。比如:一些工業(yè)機(jī)器人,主要比“肌肉”,側(cè)重發(fā)展運(yùn)動控制技術(shù);掃地機(jī)器人是否好用,取決于能否規(guī)避障礙,把屋子打掃干凈,主要側(cè)重發(fā)展導(dǎo)航傳感技術(shù)。而人形機(jī)器人,要和人一樣有“知行合一”的綜合能力,就要在芯片、傳感器、軟件、人工智能、通信、機(jī)械、材料等諸多前沿技術(shù)以及綜合應(yīng)用上實(shí)現(xiàn)突破。
“在此輪發(fā)展大模型之前,在機(jī)器人‘大腦’層面,技術(shù)上幾乎沒有什么水花,各家推出的模型,基本都只能實(shí)現(xiàn)簡單任務(wù)。這兩年,相關(guān)技術(shù)迎來質(zhì)變的拐點(diǎn)。”許彬說,“未來,隨著人形機(jī)器人高速‘成長’,其心智或許很快會脫離稚嫩,邁向‘成年人’的賽道。”
“深度學(xué)習(xí)讓人工智能對世界有了感知,大模型則讓人工智能有了自主生成的決策能力。”北京新鼎榮盛資本管理有限公司董事長、創(chuàng)始合伙人張弛說,“不遠(yuǎn)的未來,人形機(jī)器人將走向通用和商業(yè)化”。
多城市布局
“人形機(jī)器人正在成為科技競爭的新高地、未來產(chǎn)業(yè)的新賽道,蘊(yùn)藏巨大的市場空間和發(fā)展機(jī)遇。”徐曉蘭在2024世界機(jī)器人大會新聞發(fā)布會上表示。
早在2021年,“十四五”規(guī)劃綱要就將機(jī)器人產(chǎn)業(yè)提到了重要位置。由工業(yè)和信息化部、國家發(fā)展改革委等十五部門發(fā)布的《“十四五”機(jī)器人產(chǎn)業(yè)發(fā)展規(guī)劃》提出,到2025年,中國要成為全球機(jī)器人技術(shù)創(chuàng)新策源地、高端制造集聚地和集成應(yīng)用新高地。
2023年,隨著AI大模型技術(shù)加速迭代,“人形機(jī)器人”作為熱詞頻繁出現(xiàn)在國家和相關(guān)部委文件中。當(dāng)年10月,工業(yè)和信息化部印發(fā)的《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見》提出,到2025年,我國人形機(jī)器人創(chuàng)新體系初步建立;到2027年,人形機(jī)器人技術(shù)創(chuàng)新能力顯著提升,綜合實(shí)力達(dá)到世界先進(jìn)水平。
以政策為牽引,各省市圍繞著人形機(jī)器人產(chǎn)業(yè)的布局加速展開。
2023年4月,杭州提出,力爭到2026年實(shí)現(xiàn)智能機(jī)器人全產(chǎn)業(yè)鏈工業(yè)產(chǎn)值突破500億元。
2023年5月,上海印發(fā)《上海市推動制造業(yè)高質(zhì)量發(fā)展三年行動計(jì)劃(2023-2025年)》,特別提到加快人形機(jī)器人創(chuàng)新發(fā)展。同時,上海在全球投資促進(jìn)大會現(xiàn)場發(fā)布2024“投資上海”政策包,其中最引人關(guān)注的就是千億母基金。該母基金由上海市國資委推動設(shè)立,圍繞集成電路、生物醫(yī)藥、人工智能三大先導(dǎo)產(chǎn)業(yè),重點(diǎn)投向集成電路、創(chuàng)新藥、智能機(jī)器人等領(lǐng)域。
同期,深圳印發(fā)《深圳市加快推動人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動方案(2023-2024年)》,明確提出發(fā)展人形機(jī)器人。
2023年6月,北京印發(fā)《北京市機(jī)器人產(chǎn)業(yè)創(chuàng)新發(fā)展行動方案(2023-2025年)》,針對人形機(jī)器人行業(yè)進(jìn)行政策指導(dǎo),提出加緊布局人形機(jī)器人。
多地發(fā)展人形機(jī)器人的戰(zhàn)略圖景中出現(xiàn)了一個新角色——人形機(jī)器人創(chuàng)新中心。“創(chuàng)新中心本質(zhì)上承擔(dān)著調(diào)動當(dāng)?shù)刭Y源,促進(jìn)當(dāng)?shù)厝诵螜C(jī)器人產(chǎn)業(yè)發(fā)展的責(zé)任。”許彬說。
2023年5月在上海揭牌的國地中心,是人形機(jī)器人領(lǐng)域首個國家級公共平臺。“當(dāng)時,為了國地中心選址,我們考察了好幾個城市。”許彬回憶說,“人形機(jī)器人很多技術(shù)基礎(chǔ)和工業(yè)機(jī)器人、新能源汽車的產(chǎn)業(yè)鏈?zhǔn)枪餐ǖ模虾T谶@些領(lǐng)域產(chǎn)業(yè)基礎(chǔ)雄厚。出于產(chǎn)業(yè)基礎(chǔ)、政策環(huán)境等綜合考慮,落戶上海是優(yōu)選。”
“國地中心核心任務(wù)之一就是加速機(jī)器人通用場景的落地。”許彬辦公桌對面的白板上,密密麻麻手寫著其對創(chuàng)新中心組織架構(gòu)的思考。“2024年,我們計(jì)劃在上海打造能容納 100臺人形機(jī)器人的訓(xùn)練場。我們先選擇相對簡單的、方便實(shí)施的場景來落地,推動人形機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新,并帶動通用場景的落地。”
所謂“訓(xùn)練場”,就是數(shù)據(jù)生產(chǎn)和數(shù)據(jù)規(guī)模化場地。這里會建設(shè)實(shí)時標(biāo)定系統(tǒng)、控制系統(tǒng)、數(shù)據(jù)采集系統(tǒng)和數(shù)據(jù)反饋系統(tǒng),通過數(shù)字孿生來生成合成式數(shù)據(jù),為人形機(jī)器人產(chǎn)業(yè)打造真實(shí)和生成式數(shù)據(jù)。
作為技術(shù)領(lǐng)域廣泛、生產(chǎn)工藝復(fù)雜的實(shí)體產(chǎn)業(yè),人形機(jī)器人涉及數(shù)千乃至上萬個零部件的細(xì)分產(chǎn)業(yè)。發(fā)展人形機(jī)器人,對直接創(chuàng)造產(chǎn)值、帶動就業(yè)、引領(lǐng)產(chǎn)業(yè)鏈發(fā)展,都具有重要意義。“這也是多地積極籌建人形機(jī)器人創(chuàng)新中心,大力推動人形機(jī)器人產(chǎn)業(yè)發(fā)展的原因之一。”許彬說。
目前,北京、上海、寧波、合肥、成都等城市均已建設(shè)人形機(jī)器人創(chuàng)新中心,在人形機(jī)器人賽道上搶先發(fā)力。
產(chǎn)業(yè)化在即
企查查數(shù)據(jù)顯示,目前我國機(jī)器人相關(guān)企業(yè)主要集中在深圳、廣州、上海和蘇州,這四個城市分別擁有4.94萬、4.41萬、3.61萬和3.52萬家相關(guān)企業(yè)。人形機(jī)器人最關(guān)鍵的核心零部件頭部供應(yīng)商及供應(yīng)鏈企業(yè),主要分布在長三角和珠三角。
產(chǎn)業(yè)發(fā)展離不開資本投入,伴隨人形機(jī)器人迎著風(fēng)口“起飛”,VC(風(fēng)險投資)、PE(私募股權(quán)投資)前仆后繼地涌入這條頗具科幻感的賽道。
2024年8月18日,被譽(yù)為“天才少年”的智元機(jī)器人聯(lián)合創(chuàng)始人彭志輝一口氣發(fā)布五款商用人形機(jī)器人新品,分別為“遠(yuǎn)征”和“靈犀”系列。同時,彭志輝宣布智元機(jī)器人啟動一系列開源計(jì)劃:包括具身智能機(jī)器人訓(xùn)練所需的百萬條真機(jī)數(shù)據(jù)集和千萬條仿真數(shù)據(jù)集。
“我們希望通過數(shù)據(jù)開源、提供零部件,讓更多人利用智元的零部件,快速掌握人形機(jī)器人技術(shù)。”智元機(jī)器人合伙人兼營銷服務(wù)副總裁姜青松說。
一年前的2023年8月,智元機(jī)器人發(fā)布第一代通用型具身智能機(jī)器人——遠(yuǎn)征A1,并把2024年定義為智元機(jī)器人“商用元年”。該公司預(yù)測,2024年發(fā)貨量為300臺,其中雙足機(jī)器人200臺,輪式機(jī)器人100臺,主要用于交付服務(wù)場景和工業(yè)場景。
作為行業(yè)內(nèi)的明星企業(yè),智元機(jī)器人融資迅猛。目前,該公司已完成天使輪、A輪、A1輪、A1+輪、A2輪等多輪融資,A系列融資多達(dá)6輪。
2024年2月,宇樹科技宣布完成B++輪融資,投資方包括美團(tuán)、金石投資、源碼資本,老股東深創(chuàng)投、中網(wǎng)投、容億、敦鴻和米達(dá)鈞石跟投,融資近10億元。
把時間軸拉長,可以看到達(dá)闥機(jī)器人、傅利葉智能、樂森機(jī)器人等相關(guān)創(chuàng)業(yè)公司身后都擠滿了投資機(jī)構(gòu)。據(jù)統(tǒng)計(jì),2024年上半年相關(guān)融資總額超過70億元。
市場前景方面,據(jù)國際投資銀行高盛預(yù)測,到2035年,人形機(jī)器人市場規(guī)模有望達(dá)到1540億美元(約合人民幣11037億元)。
另據(jù)2024年4月首屆中國人形機(jī)器人產(chǎn)業(yè)大會上發(fā)布的《人形機(jī)器人產(chǎn)業(yè)研究報(bào)告》預(yù)測,2024年中國人形機(jī)器人市場規(guī)模將達(dá)約27億元,2026年達(dá)104億元,2029年達(dá)750億元,占彼時世界總量的32.7%,位居世界第一,到2035年有望達(dá)到3000億元規(guī)模。通過在“智慧大腦”的深度學(xué)習(xí)、“敏捷小腦”的精準(zhǔn)控制、“強(qiáng)健肢體”的創(chuàng)新設(shè)計(jì)上取得關(guān)鍵性突破,人形機(jī)器人產(chǎn)業(yè)將加速從“樣機(jī)炫技”走向商業(yè)化應(yīng)用的落地。
“人形機(jī)器人是人工智能技術(shù)與制造業(yè)場景深度融合的載體,中國人形機(jī)器人產(chǎn)業(yè)正處于井噴前夜。”徐曉蘭作出這樣的判斷。
開源新生態(tài)
2024世界人工智能大會上,國地中心正式發(fā)布“青龍”為全球首款全尺寸通用人形機(jī)器人開源公版機(jī)。
“每年我們團(tuán)隊(duì)會更新一版公版機(jī),大家拿到我們的設(shè)計(jì)參考,能有的放矢地進(jìn)行很多人形機(jī)器人方面的創(chuàng)新。”許彬介紹,作為全球首款全尺寸通用人形機(jī)器人,“青龍”集成了43個主動自由度,實(shí)現(xiàn)了頭部、手部、臂部、腿部、腰部、踝部的全尺寸設(shè)計(jì)。“借鑒科學(xué)界和技術(shù)界在技術(shù)分享與開源創(chuàng)新方面的經(jīng)驗(yàn)和做法,經(jīng)過評估,我們對‘青龍’設(shè)計(jì)圖紙、軟件代碼和數(shù)據(jù)集進(jìn)行開源,旨在吸引全球范圍內(nèi)的開發(fā)者、研究者和企業(yè)家共同參與人形機(jī)器人的研發(fā)和應(yīng)用,加速人形機(jī)器人技術(shù)的普及和產(chǎn)業(yè)化進(jìn)程。”
“我們有一個共同想法,要打造中國人形機(jī)器人的底座技術(shù)。”江磊說,開源不僅能夠匯聚全球智慧,加速技術(shù)創(chuàng)新,還能為中國科技在國際舞臺上贏得更多話語權(quán)。
“長期以來,全球科技領(lǐng)域的開源項(xiàng)目多由國外主導(dǎo),我們在人形機(jī)器人領(lǐng)域亟待打破這一局面,建立屬于自己的全尺寸開源社區(qū)。”江磊說,通過開源,把相關(guān)技術(shù)向全社會開放,降低進(jìn)入門檻,這樣就有更多資源、更多開發(fā)者涌入這個行業(yè),有利于促進(jìn)整個行業(yè)的發(fā)展。“3年至5年后,人形機(jī)器人基本上可以在物流分揀等一些簡單生產(chǎn)線上使用,5年至10年后,基本上可以在家庭、服務(wù)等要求比較高、比較開放的環(huán)境下使用。”
針對當(dāng)前人工智能行業(yè)普遍困擾的“大模型缺乏高質(zhì)量訓(xùn)練數(shù)據(jù)”等問題,國地中心將提供標(biāo)準(zhǔn)化的數(shù)據(jù)采集工具,以及基于數(shù)字孿生系統(tǒng)完成的快速數(shù)據(jù)二次評估。此外,國地中心還將構(gòu)建開放、開源的標(biāo)注工具,鼓勵生態(tài)聯(lián)盟單位一起加速數(shù)據(jù)集構(gòu)建,通過開源數(shù)據(jù)場景和行業(yè)專用數(shù)據(jù)賦能應(yīng)用。
目前,在國地中心打造的OpenLoong開源社區(qū)網(wǎng)站上,已經(jīng)開源了機(jī)器人硬件結(jié)構(gòu)及參數(shù),即將開源具身智能軟件包。總體來看,人形機(jī)器人這個賽道目前規(guī)模還比較小,開源生態(tài)的建立有望吸引更多人才和企業(yè)加入,共同突破人形機(jī)器人的共性關(guān)鍵技術(shù)。
除了“青龍”系列機(jī)器人項(xiàng)目,目前,國地中心還在加快推進(jìn)訓(xùn)練中心建設(shè),推動人形機(jī)器人在更多的真實(shí)場景中應(yīng)用落地。根據(jù)規(guī)劃,中心首期可容納100個人形機(jī)器人訓(xùn)練,計(jì)劃到2027年可容納1000個人形機(jī)器人同時訓(xùn)練。
作為2024世界人工智能大會入口處“十八金剛”之一,傅利葉通用人形機(jī)器人GR-1已于7月在建設(shè)銀行上海浦東分行出任“大堂經(jīng)理”。
“在建行的銀行大堂經(jīng)理場景訓(xùn)練基地,GR-1承擔(dān)的工作包括引導(dǎo)客戶、分流叫號,還能對客戶進(jìn)行簡單的反詐培訓(xùn)。”傅利葉智能CEO顧捷說,“目前,GR-1比較側(cè)重與客戶進(jìn)行語言交互,我們希望下一步可以更多地開發(fā)身體功能,讓機(jī)器人完成迎賓接待、巡邏、文本裝訂,甚至存取款的工作。”
公眾非常期待讓人形機(jī)器人提供照顧老人孩子等家庭服務(wù),客觀看,距離人形機(jī)器人實(shí)現(xiàn)大規(guī)模商用,甚至以平價“飛入尋常百姓家”,到底還有多遠(yuǎn)?
“未來可期,投資火熱,但大熱賽道更需要冷靜攻堅(jiān)。”許彬說。
“目前的人形機(jī)器人,功能有限,價格昂貴。在ChatGPT出現(xiàn)之前,大家也覺得AI不夠智能,這和人形機(jī)器人目前的狀態(tài)有些類似。”宇樹科技創(chuàng)始人、CEO王興興說。
“場景豐富是我們的最大優(yōu)勢之一。有場景,就有望驅(qū)動技術(shù)的攻堅(jiān)突破。說到底,目前人類科學(xué)仍在弱人工智能階段,人形機(jī)器人離‘像人一樣學(xué)習(xí)和理解’還差十萬八千里。眼下最重要的是走出實(shí)驗(yàn)室,真正走向市場。”中國科學(xué)院院士丁漢說。