現(xiàn)在,一個新工種隨著具身機器人的火爆而出現(xiàn)。在Boss直聘、實習(xí)僧等求職APP上,一些公司正招聘學(xué)歷要求大專以上,名叫“機器人數(shù)據(jù)采集員”的崗位。
前有深圳的眾擎機器人完成全球首例前空翻,后有杭州宇樹科技機器人實現(xiàn)720度回旋踢。3月11日,前華為天才少年“智暉君”創(chuàng)立的智元機器人,發(fā)布了人形機器人靈犀X2。在視頻里,機器人不僅可以像人一樣走路、跑步,還能玩滑板車、騎自行車。
人們正通向“機器人養(yǎng)老”的美好愿景,而現(xiàn)在,一個新工種隨著具身機器人的火爆而出現(xiàn)。在Boss直聘、實習(xí)僧等求職APP上,一些公司正招聘學(xué)歷要求大專以上,名叫“機器人數(shù)據(jù)采集員”的崗位。
這份工作的主要內(nèi)容包括:負責機器人數(shù)據(jù)采集工作、控制機器人正確移動、保護機器人處于安全狀態(tài),等等。
除此以外,很多崗位還列出了對人的外形的要求,有的是,“不戴眼鏡,沒有高度近視”;有的要求“男生身高170-175,體重65公斤以內(nèi);女生160-168,體重55公斤內(nèi)”;還有的公司要求,“不能有小肚子,身體協(xié)調(diào)性較好,細心、靈活、有控制力”。
這些崗位成功引起了眾人的注意。人們不禁好奇:機器人的數(shù)據(jù)采集員,會是一份什么樣的工作?這個問題的答案,關(guān)系到了人形機器人的技術(shù)路徑和當下的阻礙。更本質(zhì)的問題是,機器人實現(xiàn)智能的背后,會像AI倚賴數(shù)據(jù)標注一樣,“有多少人工就有多少智能”嗎?
薪資100元-240元/天,在社交媒體上,關(guān)于機器人數(shù)據(jù)采集員的兼職、全職工作正在火熱招聘中。
上海的“90后”張謙看到了這樣的趨勢,近半年來一直在給“數(shù)據(jù)采集崗”投遞簡歷。事實上,她在一家經(jīng)濟貿(mào)易公司有全職工作,但在AI浪潮下,她愈發(fā)感到危機降臨,想轉(zhuǎn)行到一個代表未來的行業(yè)。
具身機器人賽道就是她瞄準的方向,而數(shù)據(jù)采集員就是其中最簡單的跳板?!伴T檻低,這是我投數(shù)據(jù)采集員最主要的原因。畢竟AI等未來產(chǎn)業(yè),許多崗位都是招工程師,對代碼或硬件知識有一定要求?!彼龑}財經(jīng)說。
她同時感到這類工作是有趣的?!坝行?shù)據(jù)采集工作會模擬真實作業(yè)環(huán)境。數(shù)據(jù)采集員穿動捕服,戴VR眼鏡第一視角模擬機器人完成任務(wù)。感覺很像游戲。”只是,投遞了多份簡歷后,她仍未收到一份有效回復(fù),轉(zhuǎn)行之夢離她仍有些遙遠。
而正如張謙所感受的,機器人數(shù)據(jù)采集崗的工作內(nèi)容,與游戲3D動畫有相似之處。多位業(yè)內(nèi)人士告訴鹽財經(jīng),訓(xùn)練機器人時,他們都運用了與游戲3D相似的動作捕捉技術(shù)。
所謂的動作捕捉,即通過人類穿戴各種設(shè)備,測量、跟蹤、記錄人的運動軌跡,再經(jīng)過計算機處理,得到三維空間坐標的數(shù)據(jù)。當數(shù)據(jù)被計算機識別后,人體3D技術(shù)可以應(yīng)用在動畫制作、步態(tài)分析,生物力學(xué)、人機工程等各個領(lǐng)域。
事實上,業(yè)內(nèi)人士都清楚,這波數(shù)據(jù)采集員的招聘熱,最早是由全球頂尖機器人公司帶動的。2024年8月,特斯拉率先為旗下Optimus人形機器人招募數(shù)據(jù)采集操作員(Data Collection Operator)。據(jù)介紹,其工作內(nèi)容為穿戴動作捕捉服和 VR 頭盔,每天沿著測試路線小時以上,身上同時攜帶最多30磅(13.61千克)的重物。
與此同時,該崗位還要求采集員身高在170-180厘米之間,因為該職位需要穿上特制動捕服,身材要與機器人相似。采集員需要穿戴設(shè)備,在工作過程中站立、坐下、行走、彎腰、伸展、蹲伏和扭轉(zhuǎn)身體。
特斯拉還給這群數(shù)據(jù)采集員提供了有競爭力的薪酬:每小時25-48 美元(約人民幣 180-342元),以及股權(quán)刺激。
相似的大型招聘同時在上海開啟。2024年6月,智元機器人在上海建立了一座面積3000平方米的數(shù)采工廠。公開視頻顯示,在這個工廠里,人需要通過在胸前佩戴VR設(shè)備等進行數(shù)據(jù)采集,比如,人佩戴設(shè)備教機器人疊衣服。
智元機器人具身產(chǎn)品線總裁姚卯青對媒體介紹,數(shù)采廠模擬了家庭、零售、服務(wù)業(yè)、餐飲、工廠的五個場景,未來將源源不斷為機器人學(xué)習(xí)提供數(shù)據(jù)養(yǎng)料。去年數(shù)采工廠僅投入使用兩個多月,就采集了超百萬量級真機數(shù)據(jù)集。
從大廠的爭相布局和落地來看,真實數(shù)據(jù)正成為機器人行業(yè)的一道門檻。唯一的問題是,機器人數(shù)據(jù)采集員門檻究竟高嗎?
鹽財經(jīng)記者以求職者身份,試圖聯(lián)系多個招聘機器人數(shù)據(jù)采集員的科技公司。來自深圳某科技公司的招聘經(jīng)理張女士表示,數(shù)據(jù)采集員多數(shù)是臨時性的崗位,“我們有較大數(shù)據(jù)需求才會招人”。
據(jù)她介紹,機器人數(shù)據(jù)采集工作技術(shù)難度不算高,每天,采集員需要穿上一套設(shè)備,重復(fù)性地做某類任務(wù)。比如,為了訓(xùn)練機器人學(xué)習(xí)拿礦泉水,采集員需要在桌子前反復(fù)完成拿礦泉水的動作,“如果數(shù)據(jù)需求大的話,可能一個星期都要重復(fù)做這一個動作”。
數(shù)據(jù)采集員的招聘一定程度上反映了機器人行業(yè)的變化。國內(nèi)動作捕捉廠商、NOKOV度量動捕負責人告訴鹽財經(jīng),近兩年,隨著人形機器人為代表的具身智能在國內(nèi)火熱,機器人產(chǎn)業(yè)對動作捕捉的設(shè)備需求也隨之大增。
為什么是近兩年的需求增長?該負責人介紹,這是因為人形機器人要求精度更高的人體運動數(shù)據(jù)。相比于電腦模擬的理想仿真環(huán)境而言,由人采集回來的真實數(shù)據(jù),可以兼容更多的隨機性和意外。
舉個例子,他說,機器人在遇見凹凸不平的地面時,因為機械機構(gòu)的原因,很容易摔倒。但是,如果是人在面對一些崎嶇地面或者突發(fā)狀況時,人體本身可以自適應(yīng),很快能自己調(diào)節(jié)過來。
機器人資深從業(yè)者、北京某高校學(xué)者孔博士也告訴鹽財經(jīng),機器人行業(yè)對真實數(shù)據(jù)的需求,是隨著這兩年AI大模型技術(shù)的發(fā)展而興。一個典型標桿是特斯拉人型機器人的Optimus,采用端到端的技術(shù),試圖通過給機器人喂大量的數(shù)據(jù),從而訓(xùn)練出具有通用能力的機器人。
此外,Transformer架構(gòu)、VLA(Vision-Language-Action)的發(fā)展和應(yīng)用,讓機器人行業(yè)對數(shù)據(jù)的要求又增加了,如今,業(yè)界亟需精度高、質(zhì)量佳的數(shù)據(jù)。
當下,來自業(yè)界一個共識是,“人類老師”對機器人的能力增長必不可少。上海通用機器人公司傅利葉生態(tài)拓展負責人周斌告訴鹽財經(jīng),人類采集的數(shù)據(jù)可以反映真實世界的復(fù)雜性。比如在訓(xùn)練機器人時,周斌說,他們會首先運用仿真數(shù)據(jù)進行預(yù)訓(xùn)練和初調(diào);接著,再使用人類采集的高質(zhì)量數(shù)據(jù),進行多次精調(diào),“這樣可以確保部署到真實物理世界的性能和效果”。
這一過程,智元具身研究中心常務(wù)主任廣輝也曾打過一個形象的比方。他以學(xué)習(xí)乒乓球為例,一般我們要通過圖文、看別人打球或看比賽等方式,先了解基礎(chǔ)或理論,再去訓(xùn)練場通過發(fā)球機或者和別人打球簡單模擬?!叭绻懈咭?,還要找教練一對一手把手教學(xué)。”
總的來說,人類老師就是機器人的“一對一教練”。一對一教學(xué)的最終目的,是為了讓機器人更像人類。
除了確保與真實世界相符,機器人的“一對一教練”還有一個更重要的功能??撞└嬖V鹽財經(jīng),目前機器人行業(yè)一個最大的難點是上肢力量。
相比于人類教學(xué),當前行業(yè)內(nèi)還有一個更主流的方向,叫強化學(xué)習(xí)。這是一種在仿真環(huán)境下通過試錯(Trial and Error),讓機器人學(xué)習(xí)做出最優(yōu)決策的方式。
他舉例:“通俗的理解,強化學(xué)習(xí)就像喂一個小狗,這個小狗它做對了,我就獎勵它,他做錯了,我就懲罰他。強化學(xué)習(xí)本質(zhì)就是一個獎勵函數(shù)?!?/p>
這一獎勵最佳路徑的方式,如今被發(fā)現(xiàn)能較好地訓(xùn)練機器人走路、跑動等運動自平衡能力??撞⑵湫稳轂闄C器人的“下肢力量”,他稱,業(yè)內(nèi)主流的宇樹科技等公司,都是運用強化學(xué)習(xí)訓(xùn)練的。
“但現(xiàn)在人形機器人最讓人期待的使用上肢,去干具體的事,”孔博告訴鹽財經(jīng),“它不應(yīng)僅僅是個玩具,它要成為一個生產(chǎn)力,去工廠干活,去商店買東西,最終進入家庭,成為機器人保姆。這里的關(guān)鍵是在上肢?!?/p>
不過,與公眾的期待仍有差距的是,孔博說,在實踐中,訓(xùn)練機器人的上肢比下肢要難得多。而且,上肢訓(xùn)練在仿真環(huán)境下,通過強化學(xué)習(xí)訓(xùn)練得到的效果較差。
因此,多數(shù)機器人公司需要通過動作捕捉、遙操作等方式,讓機器人觀察人類演示后,遷移到自己本體上(尤其是上肢動作)去執(zhí)行任務(wù)。這在機器人行業(yè)內(nèi),叫做模仿學(xué)習(xí)。
國內(nèi)專注于機械臂和機器人本體的廣東某機器人技術(shù)總監(jiān)告訴鹽財經(jīng),機器人獲取“上肢”力量之所以難,其實是難在機器人的“控制”端。
相比于移動、平衡小腦等類似于人類小腦的功能,機器人“大腦”控制端需要面對各類復(fù)雜的物理場景。這很難通過獎勵函數(shù),在仿真環(huán)境中大規(guī)模訓(xùn)練就可以得到好的效果。
他舉例,即使是簡單地使用機械臂,實施抓取動作,也面臨著復(fù)雜的狀況?!袄硐氲姆抡姝h(huán)境都是存在系統(tǒng)誤差的。(例如)在真實世界里,機械臂在運動過程中,會因為重力因素存在抖動狀況。這些誤差怎么去模擬出來,這是一個難題?!?/p>
因此,在操作端,該技術(shù)總監(jiān)表示,還是人類在真實場景下進行數(shù)據(jù)采集,手把手教學(xué)的效果最好?!罢鎸嵉臄?shù)據(jù)是最直觀的,雖然在目前的成本是最高的,但是在訓(xùn)練大模型時候,效果是最好的,也更容易進行參數(shù)調(diào)優(yōu)。”他說。
與此同時,他強調(diào),人工采集數(shù)據(jù),不僅是簡單的采集,還包括上游的環(huán)境搭建、下游對數(shù)據(jù)的清洗和審核,這些步驟都需要大量的人力。
從這個角度而言,機器人行業(yè)也屬于“有多少人工,就有多少智能”的勞動密集型工作。
從招聘APP的熱門崗位可以看出來,機器人行業(yè)正在經(jīng)歷與AI一樣的數(shù)據(jù)“危機”——在AI行業(yè)里,數(shù)據(jù)被稱為石油。OpenAI公司聯(lián)合創(chuàng)始人兼前首席科學(xué)家伊利亞·蘇茨克維爾2024年曾公開警告,“AI的訓(xùn)練數(shù)據(jù)如同化石燃料一樣面臨著耗盡的危機”。
傅利葉負責人周斌對鹽財經(jīng)表示,“真實場景下的機器人動作數(shù)據(jù)在行業(yè)內(nèi)一直是個瓶頸,因為它的采集成本非常高,很多數(shù)據(jù)的標注精度也不夠。高質(zhì)量數(shù)據(jù)的缺失,是制約機器人發(fā)展的一個主要卡點?!?/p>
相較于自動駕駛而言,周斌介紹,機器人行業(yè)對數(shù)據(jù)的需求和要求也高得多?!熬拖裉厮估淖詣玉{駛技術(shù),需要有海量的數(shù)據(jù)才能訓(xùn)練出來。但汽車需要控制的變量其實并不多,無非是加速、減速,轉(zhuǎn)向?!?/p>
相比之下,周斌說,人型機器人至少有三四十個自由度的數(shù)據(jù)輸出,“它背后的數(shù)據(jù)集的需求非常巨大”。
與此同時,在AI大模型的浪潮下,如今機器人行業(yè)迎來了全新的目標——追求通用性??撞└嬖V鹽財經(jīng),機器人行業(yè)一直以來很難突破的地方是,機器人只能完成特定場景下的特定任務(wù)。
“過去的技術(shù)一直只適用于固定的結(jié)構(gòu)化場景,它的位置姿態(tài)都是固定的。”孔博介紹,“比如,一個立方體在桌子上,機器人可以去抓取。但是如果讓它去拿一個水果,或者擇菜,他就搞不了?!?/p>
大模型和具身智能火了后,上述多家機器人公司負責人都對鹽財經(jīng)提到,他們追求的是讓機器人具有泛化性,意思就是,機器人可以同時完成多種任務(wù),適用于多種場景。這就需要機器人擁有認知物理世界的“智慧”大腦。
而形成智能的關(guān)鍵,首先依賴大量高質(zhì)量的數(shù)據(jù),對機器人的AI算法進行訓(xùn)練。
不過,多位業(yè)內(nèi)人士也承認,目前在機器人的數(shù)據(jù)上,仍存在許多不確定的因素。比如,當前各家機器人公司的形態(tài)、技術(shù)路徑都不一樣,導(dǎo)致了采集的數(shù)據(jù)形態(tài)不一,很難實現(xiàn)通用。
此外,真實世界因為存在過多的變量,例如光照因素、物理因素等等影響,需要采集的數(shù)據(jù)量也變得無窮大。而對于采集大量數(shù)據(jù)后,機器人能否擁有預(yù)想中的泛化性和通用性,目前還是未知數(shù)。
“目前來說大家都傾向于相信(具身智能)這個方向可以,但是究竟能不能行,目前還是有待觀察?!笨撞┦靠偨Y(jié)。相比于AI,多重學(xué)科交叉的機器人還處在產(chǎn)業(yè)爆發(fā)的初期,前方仍有很多不確定性。
而當下,處在爆發(fā)期的機器人行業(yè),也逐漸形成共識:各企業(yè)共同打造開放共建的生態(tài),推動機器人數(shù)據(jù)共享。3月12日,智元機器人攜手上海人工智能實驗室、國家地方共建人形機器人創(chuàng)新中心等機構(gòu),發(fā)布全球百萬真機數(shù)據(jù)集開源項目 AgiBot World。3月17日,傅里葉也正式開源全尺寸人形機器人數(shù)據(jù)集Fourier ActionNet。
“如何解決數(shù)據(jù)(緊缺)的問題,我們認為首先需要一個更加開放共建行業(yè)的生態(tài)?!敝鼙罂偨Y(jié)道,“這不是說是一家公司能夠?qū)崿F(xiàn)的,應(yīng)該由企業(yè)、研究機構(gòu)共同努力,參與數(shù)據(jù)的貢獻與算法的優(yōu)化。”
可以肯定的是,真實的人類動作數(shù)據(jù)正在被機器人企業(yè)所珍視,成為未來一大段時間的“石油”。眾多機器人企業(yè)也將依靠著一名名“大專生”,一遍遍完成最簡單的人類行為,等待機器人行業(yè)的ChatGPT時刻降臨。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
東北高溫下學(xué)生花式避暑,哈工大招生打出“空調(diào)牌” 氣象專家:當?shù)貙⒂涤杲禍?/p>
廣漢老人被毒蛇咬傷后病情反復(fù)逐漸惡化 家屬含淚接他回家:“最難做的決定莫過于此”
山西洪洞縣財政局原局長被曝年齡學(xué)歷造假且有犯罪記錄,當?shù)兀杭o委、司法等相關(guān)部門已介入調(diào)查
《編碼物候》展覽開幕 北京時代美術(shù)館以科學(xué)藝術(shù)解讀數(shù)字與生物交織的宇宙節(jié)律
爺爺給孫女切西瓜,一刀一塊滿是疼愛 網(wǎng)友:這一幕,仿佛回到了小時候,熟悉的那份甜…… #睡個好覺
小米更新 YU7 鎖單交付時間:標準最快 53 周、Max 最快 33 周
UBI:京東方已建成年產(chǎn) 1 億片蘋果 iPhone OLED 屏幕產(chǎn)能體系
蘋果iOS/iPadOS 18.6將在歐盟簡化從網(wǎng)絡(luò)安裝應(yīng)用/第三方商店體驗
LG開始量產(chǎn) 27 英寸第 4 代 OLED 屏幕:峰值亮度 1500 尼特
不到6000的50系獨顯筆記本?看看華碩無畏Pro16 2025 RTX5060版
傳部分英特爾Nova Lake CPU的緩存技術(shù)有望挑戰(zhàn)AMD 3D V-Cache