核心提示:對人類來說,還有什么夢想會比成為造物主更終極?人形機器人大抵就是這種夢想的最佳載體。因此當(dāng)馬斯克宣布Tesla Bot將
對人類來說,還有什么夢想會比成為造物主更終極?
人形機器人大抵就是這種夢想的最佳載體。因此當(dāng)馬斯克宣布Tesla Bot將改名為“擎天柱Optimus”時,才會攪動全球科技界的輿論,甚至帶動了千里之外的中國機器人上市公司股價大漲。
按馬斯克的說法,我們最早能在9月末的特斯拉AI Day上見到這個“迄今為止最像人的機器人”。從外形看,Optimus與人類相比已不差分毫:有軀干、頭部和四肢,身高5英尺8英寸(約1.72m),體重125磅(約56.7kg),可負載20kg,行動速度最高可達8公里/小時;它還擁有“皮膚”——肩部以下由輕量材料覆蓋,馬斯克表示甚至比人的皮膚更光滑。
而除了特斯拉,以家電產(chǎn)品“出圈”的戴森也在做人形機器人,目前已發(fā)布的是一款能拿起漂白劑、夾起盤子的機械臂。戴森的愿景是,在未來10年內(nèi)推出可以做家務(wù)的人形機器人。憑借在掃地機器人、吹風(fēng)機和吸塵器等產(chǎn)品在家庭服務(wù)領(lǐng)域積累的經(jīng)驗和技術(shù),打造下一個更高效替代人力的家電產(chǎn)品或許是戴森的邏輯。無獨有偶,36氪獲悉,從智能清潔品類突圍的追覓科技,也有入局人形的規(guī)劃。
人類對于創(chuàng)造酷肖自己的機器的熱情,從上世紀就從未熄滅。79年前西屋電氣公司制造的“Televox”會走路、會說話,還會抽煙。此后,人形機器人一次又一次逼近人類的相貌外形、活動方式。從本田推出能跳躍和使用樓梯的ASIMO、到法國Aldebaran Robotics發(fā)布可以踢足球、跳舞、拳擊的NAO,再到軟銀機器人公司發(fā)布能通過語音語調(diào)識別情緒的Pepper,再到波士頓動力逐年改進Atlas的運動流暢能力……
但除了引起一些「機器人會不會消滅人類」的杞人憂天外,人形機器人這些年在現(xiàn)實生活的落地并沒往前走幾步。以至于機器人界不斷在爭論一個問題:機器真的需要像人嗎?
而狂人馬斯克,顯然用Optimus給了一個確定的「Yes」。
當(dāng)機器像人一樣運動
人形機器人是由什么組成的?
36氪曾觀察過一款人形機器人的雛形:心臟是以高速馬達為代表的電機,大腦是智能算法的處理系統(tǒng);其他的重要技術(shù)棧包括關(guān)節(jié)(電機、減速器、驅(qū)控等)的設(shè)計與集成、人形整機的系統(tǒng)設(shè)計與穩(wěn)定平衡控制,此外還包括三維環(huán)境的感知理解技術(shù)、結(jié)合感知的操控等。
很明顯,除了讓機器人看起來像人的部件外,更多技術(shù)棧指向的是運動能力。動起來像人,才是人形的靈魂。
Optimus在“動起來像人”的突破主要體現(xiàn)在眼睛和四肢運動能力上。沿用特斯拉在自動駕駛上的純視覺路徑,Optimus的“眼睛”也是攝像頭而不是激光雷達,面部顯示信息的屏幕內(nèi)置FSD芯片,與汽車共用AI系統(tǒng),在攝像頭采集信息后,可以通過神經(jīng)網(wǎng)絡(luò)處理進行識別、預(yù)測和規(guī)劃。
Optimus的身體由輕質(zhì)材料組成,具有人類級別的雙手雙腳,四肢由全身搭載的40個機電執(zhí)行器控制,雙腳可通過力反饋感應(yīng)系統(tǒng)來實現(xiàn)平穩(wěn)和敏捷地行走,手臂和雙手分別各依靠12個機電執(zhí)行器,可以執(zhí)行一些人類精細化的作業(yè)。
此外,Optimus還擁有強大的“大腦”:采用特斯拉的超級計算機系統(tǒng)Dojo,通過AI大數(shù)據(jù)進行神經(jīng)網(wǎng)絡(luò)訓(xùn)練。其核心是算力極強、帶寬超高的“D1”芯片,通過Dojo接口處理器進行互連,25個芯片組成一個訓(xùn)練單元,算力可達9千萬億次。這是什么概念?人類大腦通過接近一千億個神經(jīng)元,平均算力接近5千萬億次。也就是說,一個訓(xùn)練單元就相當(dāng)于兩個成年人的算力,而目前Dojo組成的機柜集群包含120個訓(xùn)練單元。
馬斯克曾放言:“特斯拉可以說是全球最大的機器人公司,因為我們的汽車就像輪子上的半感知機器人。”而Optimus確實證明了,在視覺和感知方面,特斯拉在車和人形機器人間的技術(shù)遷移是順暢的。
但人形機器人和汽車畢竟有著本質(zhì)區(qū)別,汽車用輪子向前滾,而人形要用關(guān)節(jié)來行走。追覓告訴36氪,人形機器人的研發(fā)最核心的就是人形整機的平衡控制——比如機器人在受外力等干擾時如何穩(wěn)住自己——這需要研發(fā)人員在軟件算法和機械設(shè)計的雙重能力。
在平穩(wěn)運動方面,四足機器人、人形機器人都曾經(jīng)歷過耗時不短的探索。2016年,波士頓動力的Atlas正式亮相,彼時外觀已與現(xiàn)在無異。但當(dāng)時的Atlas動作不連貫,甚至常常有摔倒的趨勢,后來Atlas逐漸學(xué)會了保持身體平衡,以及協(xié)調(diào)各種動作,學(xué)會了后空翻、跳舞和跑酷等等,動作越來越接近人類。這個過程就用了數(shù)年時間。
而如今機器人的運動能力究竟能達到怎樣的流暢協(xié)調(diào)程度,或許還要看機器狗(也稱仿生四足機器人)的運動水平。當(dāng)前,機器狗的功能主要包括自主跑跳、在不規(guī)則不平整地形環(huán)境中運動,穿行突破障礙物等,機器狗產(chǎn)品在運動表現(xiàn)中的平衡性和穩(wěn)定性,以及運動速度的一再提升突破是其區(qū)別于其他移動機器人的最重要特性之一。
盡管機器狗已經(jīng)有了很穩(wěn)定的運動能力,但再好的機器狗也只能替代寵物狗。從四足到兩足,科技公司們依然有新的技術(shù)難關(guān)要突破。
人形的落地迷局
在馬斯克的設(shè)想中,Optimus可以是工業(yè)機器人,也可以是家庭服務(wù)機器人。
他在TED演講中說道,Optimus主要用于各類“危險、重復(fù)性或者無聊的工作” 以及那些人們不想做的工業(yè)生產(chǎn)工作。未來還會走進家庭之中,可以跑雜貨店、撿拾家庭物品。
從現(xiàn)有的工業(yè)和家庭場景對于機器人的運用來看,人形進入這兩個場景的那天還很遙遠。目前,主流的工業(yè)機器人形態(tài)是AMR或復(fù)合機器人,本質(zhì)而言,這些機器人都是對某個場景中某個動作的特定替代,比如移動、識別、抓取;家庭中常見的則是掃地機器人、陪伴機器人等,實現(xiàn)的功能也僅是針對某一具體的家庭活動需求。至于“全能”的、能夠有效替代人力的人形機器人,既沒有急迫的市場需求驅(qū)動,也還未出現(xiàn)完全匹配的適用場景。
事實上,人形機器人的落地一直都不順利。之前想進入家庭場景的優(yōu)必選,已于近年將重點轉(zhuǎn)向To B業(yè)務(wù)。優(yōu)必選創(chuàng)始人兼CEO周劍在去年的一次采訪中談到,“(人形機器人)要真正進入家庭服務(wù),我覺得至少還需要5-10年,甚至更長的時間。”
國外的情況也大同小異。前文提到的“NAO”銷量僅在萬臺左右,更多賣到高校,用于科研教學(xué)、比賽。在本田東京總部,Asimo也于日前正式宣布退役,結(jié)束了長達 22 年的表演服務(wù)生涯。最典型例子是波士頓動力,技術(shù)越進步,商業(yè)價值越不被看好。目前公司估值僅為11億美元,剛夠到獨角獸的門檻,估值較6年前而言下降了66%。
但長期來看,此路雖漫長,人類已在人形機器人的迭代上往前邁了好幾步。追覓方面對36氪表示,在結(jié)構(gòu)化環(huán)境和相對簡單的非結(jié)構(gòu)化環(huán)境中,人形機器人當(dāng)前已經(jīng)具備了基礎(chǔ)的行走運動、簡單的操作作業(yè)能力。也就是說,在一些簡單任務(wù)上,已經(jīng)可以達到替代人力。
他們認為,樂觀估計5年左右將會看到人形在展覽演出、限定場景服務(wù)員等場景的落地。而在家庭服務(wù)場景中,追覓認為人形機器人會是目前很多家用產(chǎn)品的終極進階版。這也是其研發(fā)這一形態(tài)的重要原因。
特斯拉在落地上的優(yōu)勢則是對汽車產(chǎn)業(yè)鏈的復(fù)用帶來的價格優(yōu)勢。馬斯克此前透露,其單價將“不會高得恐怖,或許會比一輛車的價格更低”。在財報電話會議上他也表示,如果未來兩年內(nèi)Optimus能夠量產(chǎn),在規(guī)模效應(yīng)下,其成本比汽車還要低,相關(guān)業(yè)務(wù)規(guī)模,將比特斯拉汽車業(yè)務(wù)規(guī)模更大。
國盛證券指出,考慮到特斯拉汽車在中國的售價最低為30萬元左右, Optimus機器人的單體價格大體將位于17-30萬元之間。這一價格區(qū)間相對波士頓動力機器人顯著更低。波士頓動力在2020年首次發(fā)布用于商業(yè)的機器狗Spot,售價為7.45萬美元/臺,折合人民幣50萬元左右。
而Optimus能否真如馬斯克所言的“行動自如”,在原型機出現(xiàn)之前,僅靠PPT和真人cosplay展示,恐怕還得打個問號。除了運動能力,與一眾電子產(chǎn)品一樣,機器人的電池續(xù)航、內(nèi)部散熱能力、結(jié)構(gòu)穩(wěn)定性、傳感器技術(shù)表現(xiàn)等等,也要等Optimus真身出現(xiàn)或許才能回答。
對于人形機器人,人類總是既渴求也恐懼。它究竟會帶人類走向西部世界的恐怖谷還是美麗新世界,或許還要幾十、上百年才能有答案。但在我們這一代中,馬斯克似乎是最可能帶來有趣答案的那一個。9月,馬斯克請回答。
人形機器人大抵就是這種夢想的最佳載體。因此當(dāng)馬斯克宣布Tesla Bot將改名為“擎天柱Optimus”時,才會攪動全球科技界的輿論,甚至帶動了千里之外的中國機器人上市公司股價大漲。
按馬斯克的說法,我們最早能在9月末的特斯拉AI Day上見到這個“迄今為止最像人的機器人”。從外形看,Optimus與人類相比已不差分毫:有軀干、頭部和四肢,身高5英尺8英寸(約1.72m),體重125磅(約56.7kg),可負載20kg,行動速度最高可達8公里/小時;它還擁有“皮膚”——肩部以下由輕量材料覆蓋,馬斯克表示甚至比人的皮膚更光滑。
特斯拉人形機器人Optimus的核心參數(shù)
而除了特斯拉,以家電產(chǎn)品“出圈”的戴森也在做人形機器人,目前已發(fā)布的是一款能拿起漂白劑、夾起盤子的機械臂。戴森的愿景是,在未來10年內(nèi)推出可以做家務(wù)的人形機器人。憑借在掃地機器人、吹風(fēng)機和吸塵器等產(chǎn)品在家庭服務(wù)領(lǐng)域積累的經(jīng)驗和技術(shù),打造下一個更高效替代人力的家電產(chǎn)品或許是戴森的邏輯。無獨有偶,36氪獲悉,從智能清潔品類突圍的追覓科技,也有入局人形的規(guī)劃。
來源:戴森
人類對于創(chuàng)造酷肖自己的機器的熱情,從上世紀就從未熄滅。79年前西屋電氣公司制造的“Televox”會走路、會說話,還會抽煙。此后,人形機器人一次又一次逼近人類的相貌外形、活動方式。從本田推出能跳躍和使用樓梯的ASIMO、到法國Aldebaran Robotics發(fā)布可以踢足球、跳舞、拳擊的NAO,再到軟銀機器人公司發(fā)布能通過語音語調(diào)識別情緒的Pepper,再到波士頓動力逐年改進Atlas的運動流暢能力……
但除了引起一些「機器人會不會消滅人類」的杞人憂天外,人形機器人這些年在現(xiàn)實生活的落地并沒往前走幾步。以至于機器人界不斷在爭論一個問題:機器真的需要像人嗎?
而狂人馬斯克,顯然用Optimus給了一個確定的「Yes」。
當(dāng)機器像人一樣運動
人形機器人是由什么組成的?
36氪曾觀察過一款人形機器人的雛形:心臟是以高速馬達為代表的電機,大腦是智能算法的處理系統(tǒng);其他的重要技術(shù)棧包括關(guān)節(jié)(電機、減速器、驅(qū)控等)的設(shè)計與集成、人形整機的系統(tǒng)設(shè)計與穩(wěn)定平衡控制,此外還包括三維環(huán)境的感知理解技術(shù)、結(jié)合感知的操控等。
很明顯,除了讓機器人看起來像人的部件外,更多技術(shù)棧指向的是運動能力。動起來像人,才是人形的靈魂。
Optimus在“動起來像人”的突破主要體現(xiàn)在眼睛和四肢運動能力上。沿用特斯拉在自動駕駛上的純視覺路徑,Optimus的“眼睛”也是攝像頭而不是激光雷達,面部顯示信息的屏幕內(nèi)置FSD芯片,與汽車共用AI系統(tǒng),在攝像頭采集信息后,可以通過神經(jīng)網(wǎng)絡(luò)處理進行識別、預(yù)測和規(guī)劃。
Optimus的身體由輕質(zhì)材料組成,具有人類級別的雙手雙腳,四肢由全身搭載的40個機電執(zhí)行器控制,雙腳可通過力反饋感應(yīng)系統(tǒng)來實現(xiàn)平穩(wěn)和敏捷地行走,手臂和雙手分別各依靠12個機電執(zhí)行器,可以執(zhí)行一些人類精細化的作業(yè)。
此外,Optimus還擁有強大的“大腦”:采用特斯拉的超級計算機系統(tǒng)Dojo,通過AI大數(shù)據(jù)進行神經(jīng)網(wǎng)絡(luò)訓(xùn)練。其核心是算力極強、帶寬超高的“D1”芯片,通過Dojo接口處理器進行互連,25個芯片組成一個訓(xùn)練單元,算力可達9千萬億次。這是什么概念?人類大腦通過接近一千億個神經(jīng)元,平均算力接近5千萬億次。也就是說,一個訓(xùn)練單元就相當(dāng)于兩個成年人的算力,而目前Dojo組成的機柜集群包含120個訓(xùn)練單元。
Optimus的AI功能
馬斯克曾放言:“特斯拉可以說是全球最大的機器人公司,因為我們的汽車就像輪子上的半感知機器人。”而Optimus確實證明了,在視覺和感知方面,特斯拉在車和人形機器人間的技術(shù)遷移是順暢的。
但人形機器人和汽車畢竟有著本質(zhì)區(qū)別,汽車用輪子向前滾,而人形要用關(guān)節(jié)來行走。追覓告訴36氪,人形機器人的研發(fā)最核心的就是人形整機的平衡控制——比如機器人在受外力等干擾時如何穩(wěn)住自己——這需要研發(fā)人員在軟件算法和機械設(shè)計的雙重能力。
在平穩(wěn)運動方面,四足機器人、人形機器人都曾經(jīng)歷過耗時不短的探索。2016年,波士頓動力的Atlas正式亮相,彼時外觀已與現(xiàn)在無異。但當(dāng)時的Atlas動作不連貫,甚至常常有摔倒的趨勢,后來Atlas逐漸學(xué)會了保持身體平衡,以及協(xié)調(diào)各種動作,學(xué)會了后空翻、跳舞和跑酷等等,動作越來越接近人類。這個過程就用了數(shù)年時間。
波士頓動力Atlas最新運動表現(xiàn)
來源:波士頓動力
而如今機器人的運動能力究竟能達到怎樣的流暢協(xié)調(diào)程度,或許還要看機器狗(也稱仿生四足機器人)的運動水平。當(dāng)前,機器狗的功能主要包括自主跑跳、在不規(guī)則不平整地形環(huán)境中運動,穿行突破障礙物等,機器狗產(chǎn)品在運動表現(xiàn)中的平衡性和穩(wěn)定性,以及運動速度的一再提升突破是其區(qū)別于其他移動機器人的最重要特性之一。
盡管機器狗已經(jīng)有了很穩(wěn)定的運動能力,但再好的機器狗也只能替代寵物狗。從四足到兩足,科技公司們依然有新的技術(shù)難關(guān)要突破。
人形的落地迷局
在馬斯克的設(shè)想中,Optimus可以是工業(yè)機器人,也可以是家庭服務(wù)機器人。
他在TED演講中說道,Optimus主要用于各類“危險、重復(fù)性或者無聊的工作” 以及那些人們不想做的工業(yè)生產(chǎn)工作。未來還會走進家庭之中,可以跑雜貨店、撿拾家庭物品。
從現(xiàn)有的工業(yè)和家庭場景對于機器人的運用來看,人形進入這兩個場景的那天還很遙遠。目前,主流的工業(yè)機器人形態(tài)是AMR或復(fù)合機器人,本質(zhì)而言,這些機器人都是對某個場景中某個動作的特定替代,比如移動、識別、抓取;家庭中常見的則是掃地機器人、陪伴機器人等,實現(xiàn)的功能也僅是針對某一具體的家庭活動需求。至于“全能”的、能夠有效替代人力的人形機器人,既沒有急迫的市場需求驅(qū)動,也還未出現(xiàn)完全匹配的適用場景。
事實上,人形機器人的落地一直都不順利。之前想進入家庭場景的優(yōu)必選,已于近年將重點轉(zhuǎn)向To B業(yè)務(wù)。優(yōu)必選創(chuàng)始人兼CEO周劍在去年的一次采訪中談到,“(人形機器人)要真正進入家庭服務(wù),我覺得至少還需要5-10年,甚至更長的時間。”
國外的情況也大同小異。前文提到的“NAO”銷量僅在萬臺左右,更多賣到高校,用于科研教學(xué)、比賽。在本田東京總部,Asimo也于日前正式宣布退役,結(jié)束了長達 22 年的表演服務(wù)生涯。最典型例子是波士頓動力,技術(shù)越進步,商業(yè)價值越不被看好。目前公司估值僅為11億美元,剛夠到獨角獸的門檻,估值較6年前而言下降了66%。
但長期來看,此路雖漫長,人類已在人形機器人的迭代上往前邁了好幾步。追覓方面對36氪表示,在結(jié)構(gòu)化環(huán)境和相對簡單的非結(jié)構(gòu)化環(huán)境中,人形機器人當(dāng)前已經(jīng)具備了基礎(chǔ)的行走運動、簡單的操作作業(yè)能力。也就是說,在一些簡單任務(wù)上,已經(jīng)可以達到替代人力。
他們認為,樂觀估計5年左右將會看到人形在展覽演出、限定場景服務(wù)員等場景的落地。而在家庭服務(wù)場景中,追覓認為人形機器人會是目前很多家用產(chǎn)品的終極進階版。這也是其研發(fā)這一形態(tài)的重要原因。
特斯拉在落地上的優(yōu)勢則是對汽車產(chǎn)業(yè)鏈的復(fù)用帶來的價格優(yōu)勢。馬斯克此前透露,其單價將“不會高得恐怖,或許會比一輛車的價格更低”。在財報電話會議上他也表示,如果未來兩年內(nèi)Optimus能夠量產(chǎn),在規(guī)模效應(yīng)下,其成本比汽車還要低,相關(guān)業(yè)務(wù)規(guī)模,將比特斯拉汽車業(yè)務(wù)規(guī)模更大。
馬斯克TED交流視頻截圖
國盛證券指出,考慮到特斯拉汽車在中國的售價最低為30萬元左右, Optimus機器人的單體價格大體將位于17-30萬元之間。這一價格區(qū)間相對波士頓動力機器人顯著更低。波士頓動力在2020年首次發(fā)布用于商業(yè)的機器狗Spot,售價為7.45萬美元/臺,折合人民幣50萬元左右。
而Optimus能否真如馬斯克所言的“行動自如”,在原型機出現(xiàn)之前,僅靠PPT和真人cosplay展示,恐怕還得打個問號。除了運動能力,與一眾電子產(chǎn)品一樣,機器人的電池續(xù)航、內(nèi)部散熱能力、結(jié)構(gòu)穩(wěn)定性、傳感器技術(shù)表現(xiàn)等等,也要等Optimus真身出現(xiàn)或許才能回答。
對于人形機器人,人類總是既渴求也恐懼。它究竟會帶人類走向西部世界的恐怖谷還是美麗新世界,或許還要幾十、上百年才能有答案。但在我們這一代中,馬斯克似乎是最可能帶來有趣答案的那一個。9月,馬斯克請回答。