
“目前機器人其實可以學習人的任何動作?!?/p>
前不久,在北京舉辦的2026人形機器人與具身智能標準化年會上,宇樹科技創(chuàng)始人王興興用“任何動作”,概括機器人的能力邊界。而要實現(xiàn)這一效果,需提前采集真人數(shù)據(jù)進行訓練。
在機器人的“成長”過程中,采集真人數(shù)據(jù)為何如此關鍵?海量數(shù)據(jù)又如何賦予機器以“人”的靈性?這些問題的答案,正隨著一座座數(shù)據(jù)采集訓練場的落地而逐漸清晰。

訓練場上:1250遍“手把手”陪練
春日的青島嶗山區(qū),國家高端智能化家用電器創(chuàng)新中心里,正緊鑼密鼓地推進一項關鍵項目:機器人的真機數(shù)據(jù)采集與“崗前教育”。
今年1月,青島市人形機器人數(shù)據(jù)采集訓練場在此啟用。整層室內(nèi)環(huán)形訓練場被錯落切割為廚房、商超、汽車制造等7個實景,每塊置景內(nèi)均有1—2位真人“老師”,耐心地“手把手”教導31個名為夸父的機器“學生”。
均齡20出頭的年輕數(shù)采師頭戴VR設備,緊握手柄,耐心而小幅度地比劃著行走、蹲起、抓取等基礎動作。銀黑相間的“夸父”們則略顯生澀地同步扭動關節(jié),嘗試完美復刻。
這里鮮有言語聲,偶爾,“咚”的一聲悶響會打斷這份安靜——新手老師動作過急,嘗試練習平穩(wěn)行走的機器學生便笨拙栽倒。
這些動作并非隨性編排,而是遵循嚴格的工業(yè)標準。小組長劉文碩告訴記者,訓練流程一般是甲方提出需求,位于北京的研發(fā)部門將其拆解為具體動作步驟,最終“發(fā)包”至各地訓練場。

訓練師們領到的任務通常是10秒至2分鐘長的演示視頻,他們須在時限內(nèi)高精度還原視頻動作,并重復單一任務至少1250遍,以便機器學生完美復刻?!皠幼鞑坏轿痪褪菬o效數(shù)據(jù),直接作廢?!眲⑽拇T說。
與沉默的機器學生為伴,每日枯燥地重復單一動作,“老師”秦小杰仍顯得興致勃勃,“一想到未來大街上的機器人都是自己親手教出來的,還是很有成就感的?!?/p>
然而,看似簡單的動作,卻屢屢讓滿身前沿科技的金屬身軀“翻車”,“比如拿個杯子,機器人的手掌有時會整個翻轉(zhuǎn),非常別扭。”
靈巧手,在業(yè)內(nèi)被認為決定著人形機器人的功能上限。秦小杰有時會握住“學生”這雙分布著數(shù)百個感應點的修長鐵手,感受相似形態(tài)下悄然生出的親密。
人類從具備抓握功能到熟練使用工具,走過了逾百萬年的漫長進化;而今,這一進化歷程則被壓縮至以月、年為單位的“商業(yè)催熟”中。
靈巧手并非唯一的關卡??ㄗ∪诵螜C器人商業(yè)化步伐的,更多的是一顆能獨立決策、應對未知的聰慧“大腦”。
因此,海量訓練的深層目標,是賦予機器人舉一反三的“泛化能力”?!皵?shù)據(jù)能夠幫助機器人學習環(huán)境變化規(guī)律和自身行為策略。”山東大學控制科學與工程學院教授王元哲解釋。
“結(jié)構(gòu)化的數(shù)據(jù)集被喂給大模型后,將迭代出更智慧的機器‘大腦’。”青島市人形機器人數(shù)據(jù)采集訓練場總經(jīng)理李彥杰進一步介紹,目前,業(yè)界突破主要聚焦兩個方向:負責決策感知的“大腦”與負責運動控制的“小腦”。
沿循這兩個方向,業(yè)界分化出不同研發(fā)重心:一派專注硬件動作表現(xiàn),被稱作“本體派”;另一派致力于提升其智商,即“AI派”。
巧婦難為無米之炊,受限于數(shù)據(jù)短缺,AI派遲遲未能迎來自己的革命性進化。正如王興興所言,“誰能把機器人用的大模型做出來,誰就是全世界最厲害的AI和機器人公司?!?/p>

公共空間中:讓數(shù)據(jù)走出“孤島”
對高質(zhì)量數(shù)據(jù)的渴求,已成為行業(yè)的共同訴求。盡管自家機器人已在簡單動態(tài)場景中表現(xiàn)出一定的自主心智,松延動力負責人仍表示:“當前產(chǎn)業(yè)的最大瓶頸,在于缺乏高質(zhì)量的真實場景數(shù)據(jù)集。任何實質(zhì)性突破都依賴于此,但行業(yè)尚未形成規(guī)?;e累?!?/p>
大型訓練場的出現(xiàn),恰恰是為了實現(xiàn)“規(guī)?;姆e累”。山東大學控制學院機器人工程系副主任張國騰說,“這是把數(shù)據(jù)采集從‘手工作坊’升級為更標準化的‘數(shù)據(jù)工程’?!?/p>

當下,不同品牌、構(gòu)型的機器人,僅遵循各自軟硬件體系,數(shù)據(jù)質(zhì)量參差不齊,未形成通用的數(shù)據(jù)語言,各家形同小小“孤島”,直接制約著行業(yè)發(fā)展效率。
公共訓練場的價值在于,它為各類機構(gòu)提供了一個可以互動、達成通約的平臺性空間,從而避免重復建設,并最終走出“各自為戰(zhàn)”的封閉敘事?!拔覀円呀?jīng)開源了部分數(shù)據(jù)集,期待能激發(fā)更多創(chuàng)新?!崩顝┙苷f。
即便訓練失敗,在此亦有價值——失敗能暴露傳感噪聲、接觸動力學、控制飽和、軟硬件延遲等真實問題,往往更有含金量。
進入2025年后,各地對于建設訓練場的熱情逐步迸發(fā)。去年1月,上海浦東新區(qū)率先落子,建成全國首個異構(gòu)人形機器人訓練場;北京、合肥、無錫等地步伐緊跟。在山東,除青島外,濟南平陰縣于去年12月亦宣布啟用面積達4000平方米的訓練場。
“我們的核心目標之一,是實現(xiàn)產(chǎn)業(yè)場景的落地?!崩顝┙鼙硎?,青島這座訓練場定位清晰,即面向具有本土特色的海洋、康養(yǎng)、新零售等產(chǎn)業(yè)開展實訓,精準服務一線需求。
當市場尚就“人形”是否必要爭論不休時,部分“夸父”機器人已悄然現(xiàn)身服裝、汽配等場景中,開啟了進廠“打工”生涯。

實驗室里:在仿真中“窮盡可能”
為了讓機器人“耳聰目明”,在山東大學創(chuàng)新大廈內(nèi),另一條技術(shù)路徑正在探索中:構(gòu)建于仿真世界的推演訓練。
這里同樣孕育著激動人心的成果。7層的機器人中心實驗室孵化出了“優(yōu)寶特”這一山東名片;5層的視覺感知與智能系統(tǒng)實驗室則與宇樹科技成立了人形機器人聯(lián)合實驗室,攻關雙足機器人關鍵技術(shù)。
“企業(yè)提供機器人作為硬件平臺,我們就在其中刷程序,調(diào)優(yōu)軟件性能?!睆垏v認為,高校受限于資金,難以購買昂貴的算力和硬件,企業(yè)恰好可以提供這些重資產(chǎn),以換取智力支持。
更重要的是,在行業(yè)通用標準尚未確立的當下,哪家機器人能夠作為高兼容的“底座”支撐更多軟件開發(fā),誰就可能在未來的標準之爭中占得先機。

與訓練場不同,實驗室里少有完整的機器人,取而代之的是拆得七零八落的零部件。來自機器人工程、電子信息、物理等專業(yè)的碩博學生埋首仿真軟件,一遍遍修改參數(shù)、切換視角、調(diào)試細節(jié),以使模擬空間無限逼近物理現(xiàn)實。
“現(xiàn)有的人形機器人,空間理解能力比較差,這是很大一塊短板。”張國騰舉例,面對一張低矮的桌子,小貓小狗都知道低頭穿過,機器人卻會將其視為整塊障礙物而選擇繞行。
仿真訓練的本質(zhì),是一種“窮盡可能性”的探索。機器人工程專業(yè)大三學生趙凱濤解釋:“我們會在仿真環(huán)境里創(chuàng)建任何可能出現(xiàn)的地形,讓機器人一遍遍試錯,摔倒就懲罰,成功就獎勵。”
憑借這套虛擬的獎懲機制,仿真世界中成百上千個機器人正日復一日“變聰明”,這常讓整個實驗室興奮不已。
那么,實景與仿真訓練,孰優(yōu)孰劣?
張國騰認為,兩者并無高下之分。仿真訓練更靈活、方便、低成本,但虛擬環(huán)境與現(xiàn)實世界始終存在鴻溝。實景數(shù)據(jù)則是縮窄這道鴻溝的最佳標尺。
一個更務實的策略是:仿真用于快速篩選方向,少量高質(zhì)量的真機數(shù)據(jù),則用于最終的校準與驗證。
“最希望具身智能大模型從‘讀萬卷書’過渡到‘行萬里路’?!睂ξ磥?,張國騰不免暢想,在充沛數(shù)據(jù)的支持下,擁有聰明“腦袋”的機器人,終將走出實驗室,與人類一同前行萬里。
(大眾新聞記者 張瑞雪 金芮宏 趙浩然 白曉)