當(dāng)前人形機(jī)器人吸引著眾多企業(yè)“群雄逐鹿”。布局人形機(jī)器人這一新賽道的企業(yè),大體可分為傳統(tǒng)機(jī)器人巨頭、初創(chuàng)機(jī)器人企業(yè)與AI公司。其中科大訊飛就是AI龍頭布局人形機(jī)器人的代表企業(yè)之一。
科大訊飛布局人形機(jī)器人賽道,目標(biāo)是打造機(jī)器人的“大腦”,推動機(jī)器人行業(yè)“腦力”升級。此次大會,科大訊飛亮相了大模型+具身智能的人形機(jī)器人最新進(jìn)展,整體運動性能提升2倍,復(fù)雜任務(wù)拆解成功率超過95%,交互能力、運動性能進(jìn)一步提升。
產(chǎn)業(yè)賦能上,訊飛機(jī)器人超腦平臺已賦能420家機(jī)器人企業(yè),深度鏈接1.5萬機(jī)器人開發(fā)者,與優(yōu)必選、宇樹科技、智元機(jī)器人、銀河通用、人形機(jī)器人創(chuàng)新中心(上海)等人形機(jī)器人企業(yè)達(dá)成廣泛合作。
大模型助力人形機(jī)器人“腦力”再升級
在本次機(jī)器人大會上,科大訊飛帶來了“訊飛超腦2030計劃”的最新科技成果,大模型加持下的“腦力”再升級的訊飛人形機(jī)器人。去年科大訊飛業(yè)界率先亮相大模型+具身智能的人形機(jī)器人,今年的機(jī)器人大會上,基于星火大模型的加持下,訊飛人形機(jī)器人在人機(jī)交互能力、具身智能、運動性能以及國產(chǎn)自主可控方面帶來全新升級。
當(dāng)前,科大訊飛最新發(fā)布的訊飛星火V4.0,整體可對標(biāo)GPT-4Turbo,使得大模型“智商”不斷升級。例如,訊飛星火語言理解和邏輯推理等方面的能力提升,使得人形機(jī)器人“腦力”不斷升級,更智能更“聰明。”。大模型的思維鏈推理能力將顯著提升具身通用機(jī)器人對于復(fù)雜任務(wù)的理解能力,并提供符合物理世界常識的拆解規(guī)劃;將具身感知模型和具身決策模型相結(jié)合,極大提升具身通用機(jī)器人在真實場景下的多模態(tài)感知和理解能力。
對于以機(jī)器人產(chǎn)業(yè)為代表的新興科技領(lǐng)域而言,核心技術(shù)及生態(tài)鏈自主可控至關(guān)重要。訊飛星火一直堅持大模型底座的自主可控,去年10月24日,科大訊飛與華為聯(lián)合發(fā)布了中國首個全國產(chǎn)算力平臺“飛星一號”,訊飛星火成為中國首個基于全國產(chǎn)算力訓(xùn)練出的全民開放的大模型,保障了科大訊飛人形機(jī)器人及國內(nèi)機(jī)器人大腦底座生態(tài)更加自主可控。
此外,多模態(tài)大模型與具身智能的結(jié)合,讓科大訊飛人形機(jī)器在復(fù)雜任務(wù)拆解、開放場景物體識別、多模態(tài)感知與理解等維度顯著提升。這次科大訊飛展示的人形機(jī)器人高約1.7米,體重為60公斤,幾乎跟一位成年男子相仿。要靈活控制這么大一個軀體,首先需要提升人形機(jī)器人在開放場景下的環(huán)境感知能力和理解能力,還極度考驗四肢協(xié)同能力。在現(xiàn)場,我們不僅能看到科大訊飛人形機(jī)器人直立行走和屈膝站立,還能看到它輕松倒一杯咖啡,雙臂協(xié)同靈活用毛巾“擦汗”,就像人類的動作一樣自然,相較于上一代人形機(jī)器人,整體運動性能提升2倍,復(fù)雜任務(wù)拆解成功率超過95%。顯然,星火大模型已成為科大訊飛人形機(jī)器人關(guān)鍵能力提升的加速器。
根據(jù)官方報道,始于2022年初的“訊飛超腦2030計劃”,其終極目標(biāo)是打造懂知識、會學(xué)習(xí)的軟硬一體式陪伴機(jī)器人。進(jìn)入大模型時代,星火大模型成為賦能人形機(jī)器人邁向具身智能通用機(jī)器人的關(guān)鍵一步,也在加速訊飛超腦2030計劃的實現(xiàn)。
超擬人交互技術(shù)讓人形機(jī)器人更具“人情味”
語音是萬物互聯(lián)的入口,語音交互的變革也將引領(lǐng)新一輪機(jī)器人產(chǎn)業(yè)變革,這恰恰是科大訊飛最重要的優(yōu)勢所在。8月19日,科大訊飛宣布星火語音大模型升級,重磅推出了星火極速超擬人交互功能。在技術(shù)層面,它擁有更快的響應(yīng)和打斷速度,更知性的情緒感知和更知心的情感共鳴,同時在語音可控表達(dá)和人設(shè)扮演方面迎來了突破,進(jìn)一步聚焦于解決復(fù)雜環(huán)境下機(jī)器人聽得清、聽得懂、有溫度、有情感的交互問題。
當(dāng)這項功能與人形機(jī)器人結(jié)合,不僅能讓機(jī)器人更快聽懂用戶的語言表達(dá),還能結(jié)合當(dāng)下語境和場景洞察用戶意圖,也就是我們常說的“聽話要聽音”,繼而提供真正有用的陪伴式服務(wù)。從長遠(yuǎn)來看,超擬人交互能力可進(jìn)一步提升人形機(jī)器人的交互能力,助力人形機(jī)器人更加智能化,智慧化,讓其無限接近類人級別的領(lǐng)悟水平和響應(yīng)速度。訊飛星火語音大模型超擬人交互能力對人形機(jī)器人的賦能,進(jìn)一步讓科大訊飛人形機(jī)器人“腦力”再升級,大模型讓人形機(jī)器人更有“人情味兒”,堪比電影《Her》中的人機(jī)交互體驗照進(jìn)現(xiàn)實。
在訊飛星火大模型和機(jī)器人超腦平臺的帶動下,科大訊飛正在助推國內(nèi)機(jī)器人產(chǎn)業(yè)生態(tài)加速發(fā)展。據(jù)了解,目前,已有420家機(jī)器人企業(yè)采用了訊飛“機(jī)器人超腦平臺”方案,深度鏈接1.5萬名機(jī)器人開發(fā)者。在人形機(jī)器人領(lǐng)域,科大訊飛也積極拓展技術(shù)合作,與包括優(yōu)必選、宇樹科技、智元機(jī)器人、銀河通用、人形機(jī)器人創(chuàng)新中心(上海)等頭部玩家一起,共同探索如多人多模態(tài)交互等領(lǐng)先方案的集成應(yīng)用,推動人形機(jī)器人的技術(shù)發(fā)展和應(yīng)用落地。
根據(jù)《人形機(jī)器人產(chǎn)業(yè)研究報告》預(yù)測,2029年中國人形機(jī)器人市場規(guī)模將達(dá)到750億元,占世界總量的32.7%。科大訊飛通過機(jī)器人超腦平臺構(gòu)建了良好生態(tài),并在今年6月啟動了機(jī)器人超腦平臺2.0項目,將多模態(tài)大模型能力進(jìn)一步賦能機(jī)器人領(lǐng)域,有助于提升機(jī)器人行業(yè)的整體創(chuàng)新能力,加速推動人形機(jī)器人走進(jìn)千家萬戶的進(jìn)程。(高青)