人形機(jī)器人決策難度更高:決策層依據(jù)感知層獲取的信息進(jìn)行決策判斷,來控制機(jī)器人身體做出動作規(guī)劃
并下發(fā)指令。特斯拉人形機(jī)器人與FSD底層模塊打通,一定程度上算法可復(fù)用,但人形機(jī)器人需完成人類
各種動作,動作連續(xù)復(fù)雜、需頻繁的物理交互且操作因果性多,算法難度遠(yuǎn)高于自動駕駛。
⚫ ChatGPT助力拆解任務(wù):大語言模型擅長推斷語言條件,并利用其代碼編寫能力,拆分任務(wù),給出運(yùn)動規(guī)劃的
目標(biāo)函數(shù)。
⚫ 實時反饋以便調(diào)整動作:依據(jù)感知系統(tǒng)的反饋,可實時調(diào)整動作規(guī)劃,并執(zhí)行
第一代FSD芯片單個算力72tops,CPU做控制,GPU做圖像處理,NPU為神經(jīng)處理單元,完全適用于人形機(jī)器人;D1芯片32位浮點計算的最大性能達(dá)到22.6TFLOPs
大模型提升仿真學(xué)習(xí)能力,可大幅提升算法訓(xùn)練效率,縮短算法與硬件調(diào)整時間,極大提高訓(xùn)練效率,可加快軟件更新迭代
人形機(jī)器人進(jìn)入門檻高,科技巨頭擁有研發(fā)實力及軟件基礎(chǔ),在視覺感知,算法,虛擬仿真等軟件方面領(lǐng)先優(yōu)勢明顯,且與原有業(yè)務(wù)協(xié)同效應(yīng)明顯
人形機(jī)器人本質(zhì)是AI系統(tǒng)落地物理世界的最佳載體,但更核心問題在于是算法對運(yùn)動能力的控制,包括本體平衡,行走的步態(tài),部抓取等規(guī)劃與控制
預(yù)測全球25年人形機(jī)器人初步商業(yè)化,銷量3萬臺左右,30年這些領(lǐng)域就滲透率1.5-2%對應(yīng)存量需求230萬臺,新增需求100萬臺+,2035年銷量有望突破1000萬臺
為人形機(jī)器人的成熟也是漸進(jìn)式,可在細(xì)分市場的率先商業(yè)化,后逐步成熟轉(zhuǎn)為通用型機(jī)器人 ,由tob轉(zhuǎn)為toc,進(jìn)入家政等市場,做人想做但是不能做的工作
硬件難點是靈敏度與承壓能力的協(xié)調(diào),關(guān)節(jié)能力不能匹配運(yùn)動規(guī)劃;軟件難點是訓(xùn)練不同任務(wù)的運(yùn)動規(guī)劃,實時反饋視覺檢測與理解,并對運(yùn)動規(guī)劃做調(diào)整
感知模塊包括兩方面視覺和觸覺,視覺有純視覺路線,也有依靠雷達(dá)等多方式融合路線;決策模塊是機(jī)器人的大腦,核心是芯片與算法
人形機(jī)器人擁有更高級的感知交互系統(tǒng),包括傳感模塊和軟件方面,人形機(jī)器人比服務(wù)機(jī)器人更高,靠雙足行走,對減速器負(fù)載和電機(jī)響應(yīng)速度要求更高
具身智能與垂直大模型,人形與四足仿生機(jī)器人,三維感知模型和多模態(tài)信息融合,機(jī)器人新型核心零部件與靈巧操作,腦機(jī)接口,生肌電一體化與微納機(jī)器人
特殊場景服役機(jī)器人是指在特定環(huán)境或情況下執(zhí)行任務(wù)的機(jī)器人,在消防救援,電力勘測,農(nóng)業(yè),建筑,核工業(yè),反恐防暴,國防安全,空間探測等領(lǐng)域具有巨大需求
群體機(jī)器人技術(shù)的應(yīng)用領(lǐng)域廣泛,集群智能作為人工智能的分支,將得到越來越多的應(yīng)用,有望在機(jī)器人等領(lǐng)域創(chuàng)造出新的應(yīng)用和創(chuàng)新