人形機器人,一場事先張揚的反常識-(3)
機器人能夠靈活工作的核心之一在於運動的精確控制,其技術難度最高的三大核心零部件分別是控制器、伺服電機和精密減速器,這三者成本的占比分別約為15%、20%、35%。
以2022年9月特斯拉發布的首款人形機器 人Optimus為例:
它擁有28個關節驅動器,使全身能夠產生200個以上不同角度的動作。
手部有五個手指,配備6個驅動器,擁有人類的靈巧性。
要實現這些功能,上述三大產業鏈核心零部件的性能必須要達到相當高的要求。
從成本上分析,人形機器人的成本大致可拆分為動力總成系統(占總成本比重的60%)、智能感應系統(占20%)、結構件及其他(占20%)三個部分。
其中,動力總成系統包括電池系統、電驅系統(這裡的動力總成定義類似電動車上的「三電系統」),預計這兩者分別占到總成本的10%、50%。
綜合技術與成本兩個方面來看,核心零部件的重要性尤為突出。
一方面,人形機器人技術的本質是3D空間中高維度的感知與運動,高性能的核心零部件是實現感知與運動的基礎。
另一方面,控制器、交流伺服電機和精密減速機這三個最重要的核心零部件在成本中所占的比例還是相當之高。
控制器是工業機器人的大腦,對機器人的性能起着決定性的影響。工業機器人控制器主要控制機器人在工作空間中的運動位置、姿態和軌跡,操作順序及動作的時間等;
伺服電機在自動控制系統中,用作執行元件,把所收到的電信號轉換成電動機軸上的角位移或角速度輸出。機器人每個關節運動均需靠伺服電機驅動,以實現多自由度的運動;
精密減速器則是連接動力源和執行機構的中間機構,具有匹配轉速和傳遞轉矩的作用,也是機器人生產中壁壘最高的零部件,主要包括諧波減速器與RV減速器,但其工作原理和應用場景存在較大區別:
諧波減速器:由波發生器、柔輪和剛輪組成。當波發生器被放入柔輪內圓時,柔輪產生彈性變形彎曲成橢圓狀。由於柔輪外側的剛輪比其多2個齒,導致柔輪長軸部分正好可以與剛輪的齒輪嚙合,而短軸部分與剛輪的齒輪呈脫離狀態。
RV減速器:由兩個減速部構成,在第一減速部中,輸入軸的旋轉從輸入齒輪傳遞到直齒輪,按齒數比進行減速;在第二減速部中,有一個曲柄軸與直齒輪相連接,在曲柄軸的偏心部分,通過滾動軸承安裝RV齒輪,曲柄軸會帶動RV減速機做偏心運動。
六軸工業機器人 source:遨博機器人
除了以上的三大核心部件外,傳感器在人形機器人身上的作用也極其重要。
人形機器人要具備對外界環境的識別能力,實現導航、避障、交互等功能,就需要使用傳感器識別物體、測距等。
識別外部環境主要使用攝像頭、激光雷達等傳感器,其傳感器方案和需求場景與自動駕駛存在類似之處,因此價值量較高的自動駕駛類傳感器存在新的機遇。
自動駕駛傳感器廠商、機器視覺廠商都是人形機器人傳感器的參與者。
以三大核心零部件來分類的方式通常更適用於相對粗獷的工業機器人,要想更好地解析人形機器人,五大系統的分法其實更為科學。
感知系統,也即是傳感器,如攝像頭、麥克風、激光雷達、距離感應器等等,負責收集、傳遞信息,相當於人的眼、鼻、耳,即人的「五官」;
驅動系統,比如驅動輪子的馬達,機械臂上液壓動力系統或氣動系統,相當於人的「肌肉」;
末端執行系統,既可以是機械手,也可以是機械臂上的一把螺絲刀或者噴槍,用以與外界環境進行物理交互,相當於人的「雙手」或「四肢」;
能源供應系統,如電源或電池,是機器人的能量供應中心;
運算系統及軟件,將上面所有的系統整合起來,完成指定任務,是機器人的「大腦」。 之所以需要用相當大的篇幅來介紹上游產業鏈中的核心零部件、軟件及系統部分,就是因為它們是人形機器人能夠身輕如燕地跑跳蹲立,靈活自如地抓取捧舉,聰明伶俐地辨物識人,言聽計從地信手拈來的關鍵所在。 沒有這些部件的縝密配合,外觀再逼真的人形機器人也只能算作是繡花枕頭,中看不中用。
相對於種類繁多的上游產業鏈,人形機器人的中游產業鏈顯得簡單明了:就是那些能夠把這些核心零部件及軟件組合在一起,使機器人能夠發揮出最大仿人效能的本體製造商。
如本文開頭所說,目前人形機器人本體上處於領跑位置的玩家,要麼是像特斯拉這樣的汽車行業大佬,要麼是小米這樣的科技企業。工業機器人大佬反而鮮有入局。
以筆者的判斷來看,雖然人形機器人脫胎於工業機器人而來,但由於前者在AI領域方面的要求遠高於後者,所以反而是高科技企業(尤其是在AI領域有較高建樹的)有後發優勢。
當然,把特斯拉、豐田、本田歸類為汽車企業未免太過片面,這幾家都是具備了極強科研開發能力的高科技企業(尤其是特斯拉在全自動駕駛技術FSD上的超強實力,已經讓人形機器人和汽車擁有了一樣視覺感知:以攝像頭輸入數據,通過神經網絡進行計算)。
03 ChatGPT實體化和機器人終極猜想
最近舉辦的一場人形機器人比賽中,由OpenAI支持的實體機器人公司1x出品的EVE,擊敗了特斯拉的Optimus機器人。
EVE機器人的部分軟件功能由ChatGPT提供支持,也就是說將ChatGPT實體化,應用在現實場景中。
GPT技術在人形機器人中的場景應用打開了新的想象空間,引發了國內資本市場對機器人產業的高度關注。
從業內人士的角度來看,GPT大模型技術應用到人形機器人上,可以為機器人提供「常識」,使其具備理解與推理能力。
在邊緣端布局面向機器人作業的中模型,能夠較為快速處理機器人的傳感信息,結合機器人端部署的運動規劃與控制小模型,這樣才能構建出「雲邊端」一體化的智能機器人系統,完成人形機器人的智能閉環。
由此再次鞏固了我們的判斷——人形機器人產品之間的競爭,歸根到底就是一場各個本體廠家在人工智能(AI)賽道上的競爭。
先拼AI研發能力,再比各軟硬件之間的協同工作能力,最後大家一起拼成本。
以筆者之見,人形機器人在不久的將來會有三個發展趨勢:
一是成本越來越低,進到千家萬戶是大勢所趨。
有鑑於當前人形機器人高昂的零售價格(未量產狀態),即便其下游的產業鏈前景被資本市場長期看好,但至少在當下,能夠實現商業化的場景還是屈指可數。
波士頓動力的Atlas單台價值為200萬美金,本田Asimo的單台價值250萬美元,小米Cyber One單台造價也高達60-70萬人民幣。基本杜絕了普通人的購買奢望。
不過,假如Optimus在3-5年後通過量產,售價做到2萬美元一台,且替代人類完成瑣碎複雜的工作(非簡單重複型),這樣的下游產業鏈場景無疑會是相當廣泛且極具商業價值的。
如馬斯克所描繪的,在量產規模達到特斯拉汽車的水平(幾百萬台),各種更加經濟實用的替代品被投放到原來昂貴易損的零部件位置之後,2萬美金一台的價格將只是初級目標。畢竟,卡爾·弗里德里希·本茨(Karl Friedrich Benz)發明的世界上第一台內燃機汽車並不足以讓它走入到千家萬戶,量產後的福特T型車才是。
二是智能越來越高,替代複雜繁瑣的工作是民心所向。
與工業機器人主要用於取代工廠里簡單、重複、危險的勞動定位不同,人形機器人更加適合用作替換與人類有直接接觸,相對更為智能、繁瑣、貼身的工作,如導購、接待、看護、餵養寵物等。(更多機器人進入下游應用領域,請點擊閱讀星船知造文章:《萬億級機器人賽道里:為什麼它最卷?》)
隨着人工智能水平提升,越來越多AI技術被運用到人形機器人身上,機器人越來越「人性化」,與人類的緊密度和契合度也會越來越高。
三是人工智超越人類的智能會是未來的大概率事件。
無論爆火的ChatGPT還是曾擊敗李世石的AlphaGo都屬於弱人工智能。
強人工智能至今尚未出現。但綜合來看,人工智能在與人腦的對抗中有以下三條優勢:
首先是能耗,人工智能思考和解答問題比人腦消耗的能量低得多。大腦是人體能耗最大的一個器官,為什麼人類總是討厭學習和思考,這是求生本能決定的,為了避免過度思考帶來的身體能量過度的消耗。
其次是存儲,人會遺忘。但人工智能只要信息輸入,就會存儲下來。強人工智能還能通過學習關聯更多知識和信息。
最後也是最致命的優勢就是人工智能的時間效率。這裡的效率有兩個方面的理解,一是學習效率,相比人類需要娛樂、社交、睡覺等,AI24小時不眠不休的學習和進化,昨天還是嬰兒明天就是成人後天就是最強大腦。二是解決問題的效率,人工智能全天候處理問題和工作,未來人工智能會比人類更熟練的使用各類工具,可能你一輩子才精通的操作精密機床的手藝,AI一晚上就學會了。
最後,讓我們回到阿西莫夫的機器人三部曲。
《鋼穴》裡,中年便衣刑警貝萊問機器人丹尼爾,為什麼人類那麼執着要造出有手有腳有腦袋的機器人?為什麼他們多多少少總要做得像個人?
丹尼爾的回答很簡單。至今為止一切為人類發明的東西,人型機器人直接就能用。
所以,是的,一切都是基於經濟上的考慮。-[文:星船知造 清波*編輯:唐曉園/藍鯨財經]