人形機器人,一場事先張揚的反常識-(2)
黃仁勛在2023年ITF世界大會上說:「人工智能和加速計算正在共同改變技術行業。下一波人工智能浪潮將是一種被稱為具身AI的新型人工智能,即能夠理解、推理並與物理世界互動的智能系統,即具身智能。」
具身智能是能夠提升當前「弱人工智能」認知能力的重要方式。亦是產生超級人工智能的一條可能路徑。
具身智能可以理解為人工智能發展的高階形態,也有可能成為AI的終極形態。說得更加透徹一點,人形機器人的未來,就是賦能了具身智能的真正智能機器人。
如此智能的人形機器人會是如何接受指令,完成任務的呢?
首先,機器人的感知系統把機器人的各種「內部狀態信息」和「環境信息」從「信號」轉變為機器人自身或者機器人之間能夠理解和應用的「數據」和「信息」。也即是說,讓機器人理解周圍的環境。
科學家(廠家)在機器人身上安裝各類傳感器,包括光、聲音、溫度、距離、壓力、定位、接觸等等,讓機器人能通過「五官」來接近人類,收集感知外界的信息。
各類傳感器應用技術的突飛猛進,保證了人形機器人得以發展。
傳感器精度和可靠性的不斷提高是當前亟待解決的難題之一。舉例來說,在進水,進到粉塵或者顛簸之後,相機的校準就容易失效,長期使用之後像素點就容易壞死等硬件問題都會直接導致機器識別率在準確性上的丟失。
其次,機器人的驅動系統和末端執行系統需要協同工作,各司其職,就如同人類依靠身體各部位上的78個關節來行動。
用在機器人上的每一個關節的技術門檻和成本都很高,不僅要求體積小、精度高、重量輕,還同時要求抗摔耐撞。當機器人快速運動時,驅動力輸出功率很高,要保證不會因為發熱問題而燒壞,同時具備緩衝能力,保護「機器人關節」不怕撞擊。
末端執行系統中的「手」,是技術難度非常高的部分。在實際抓、舉、拿、捏等動作的操作過程中,機器人手指柔軟度與抓握力度的協同性非常重要:抓輕了東西容易掉,抓得重了則直接破碎。
舉例來說,特斯拉發布的Optimus展示出了與人手非常相似的機械手:
Optimus擁有11個精細的自由度,結合控制軟件,能完成像人手一樣複雜的操作,承擔約9公斤負重。最新的demo視頻中,我們也能看到特斯拉機器人在硬件上的一定優勢,包括能控制力度的抓握很多物品,並且不會打碎雞蛋。
再次,機器人的驅動系統和能源供應系統用於保障其動作的完成。按照波士頓動力官網的描述:Atlas機器人,雖然各種炫技動作很酷,但必須配置功率很大的液壓驅動。實際上,Atlas配置了28個液壓驅動器才能讓機器人完成各種爆發力超強的動作,而這樣的代價也是波士頓動力的老問題了——
製造成本居高不下,難以走出實驗室完成商業化。
馬斯克在Optimus身上選用了穩定性、性價比更高的電機驅動方案,就是出於成本考慮。也正是因為這樣,才有底氣把Optimus的目標售價定在2萬美元,以此來滿足巨大的潛在市場需求。
最後,用機器人的運算系統及軟件來進行分析思考和對應指令的下達。
第一,理解需求和環境。機器人會通過傳感器了解周圍環境,搞清楚要做什麼。
這一層的難點在於:視覺等環境識別和理解,包括識別未知物體以及識別物體的未知姿態。
第二,拆解任務和進行路徑規劃。
這一層的難點在於:人工智能輸出時的不穩定性。因為在人工智能拆解任務的時候,每一次的解法可能都不相同,可能導致任務拆解的不一致,產生意想不到的結果。
第三,命令驅動硬件執行任務。需要把運動規劃轉變成機械指令發到機器人的驅動系統上,確定能量、動量、速度等合適後,開始執行任務。
這一層的難度在於:目前的人工智能還做不到100%的準確率,同時速度較慢,耗時耗力,但是硬件執行任務的驅動需要精準控制,要以100%的準確率作為基礎,因此業內還是會採用傳統的控制論方式來發號施令,執行任務。
由此可知,要讓人形機器人身上的這四大硬件,一大軟件系統有機地整合在一起,協同工作,相互配合,同時還要讓合適的部位有合適的力量、速度和準確性來完成所需的任務,絕非易事。
仍以特斯拉的Optimus來說。2021 年 8 月,馬斯克在特斯拉年度 AI 開放日上首次公開展示了Optimus的想法。僅過一年時間,「擎天柱」原型機就於 9 月30 日特斯拉 AI Day 發布,硬件方面,「擎天柱」身高 172CM,整體重量 73KG;行走功率500W,坐下功率 100W,整體參數與 2021 年概念機略有出入(概念機參數:身高172CM,體重 57KG,負載 20KG,行走速度最高可達每小時 8 公里)。
電機驅動上,Optimus擁有 2.3KWH、52V 電壓的電池組,內置電子電器元件的一體單位,支持人形機器人工作一整天;選用 28 個定製關節驅動器,復用汽車動力總成設計經驗,設計 6 種關節驅動器,包括 3 種不同規格的舵機(採用諧波減速器)和 3 種不同規格的直線執行器(採用永磁電機,可抬動 1.5 噸三角鋼琴的),找到成本與效率的最佳組合。
目前特斯拉已把汽車的一些技術運用到了Optimus上,例如電池組、冷卻系統等,還使用與汽車測試類似的技術來進行機器人的運動和對外部碰撞模擬。
特斯拉的全自動駕駛系統FSD也直接被應用在Optimus上,機器人採用了與汽車一樣的視覺感知,使用攝像頭輸入數據,以神經網絡進行計算。
未來對特斯拉人形機器人或許還有以下驚喜:
特斯拉在新材料、電子技術上的研發能力較強,可能會用到特斯拉在火箭上的技術積累;給特斯拉帶來持續爆款話題等。
02 人形機器人的產業鏈各環節分析
先說結論。未來人形機器人產品之間的競爭,歸根到底是一場各個本體廠家在人工智能(AI)賽道上的競爭。
首先比的是人工智能水平的高低:能否像人一樣,理解外部環境和內部中樞發出的信息和指令,理解,判斷並做出正確反應。
其次比的是各個軟硬件之間的協同工作能力:哪怕每一個部件都是同類中最好的,但總成不好,搭配不當,同樣發揮不了最佳實用效果。
再次就是量產後的成本比拼了:人形機器人終究是一種商品,如果其最終成本達不到市場能接受的程度,那做的再好充其量也只是一種沒有商用價值的實驗室產品。
人形機器人,作為機器人領域裡新崛起的一個重要分支,其產業鏈也是由上中下游三個部分組成。
上游為核心軟硬件,硬件包括伺服電機、減速器、控制器、傳感器等;軟件方面主要包括機器視覺、人機交互、機器學習、系統控制等。
中游則是人形機器人本體製造商,也就是能把上游的核心軟硬件組合在一起,生產出能走、蹲、跑、跳、能撿東西、能抓物體的人形機器人的廠家。國內主要有優必選、北京鋼鐵科技、小米等,國外的則包括波士頓動力、美國敏捷機器人、特斯拉、日本豐田、本田等;
下游目前還未有特別成熟的商業應用
製圖:星船知造
從人形機器人當前的產業鏈狀況來看,雖說馬斯克推出的Optimus早已給期盼它正式上市的人們注入了一劑超級強心劑,然而在現實市場中,其上游產業鏈走的依然是常規工業機器人的路線。
主要硬件部分除了傳感器之外,其他三樣就是工業機器人的三大核心零部件(控制器、伺服電機和減速機)。由此,也就能發現即便當下人形機器人的熱度再大,風頭再勁,「人」味再濃,最終採用的卻還是工業機器人的那套基本架構。