對話宇樹科技王興興:人形機(jī)器人體量尚未成規(guī)模 5年內(nèi)會出現(xiàn)“iPhone時刻”
原創(chuàng)
2024-08-22 15:20 星期四
科創(chuàng)板日報記者 李明明
①關(guān)于G1售價僅9.9萬元起的定價, 宇樹科技創(chuàng)始人王興興表示,產(chǎn)品有市場的前提是價格比較友好,但價格定太低對整個行業(yè)都不是好事;
②他還表示,ChatGPT的出現(xiàn)讓大家意識到大語言模型在機(jī)器人的AI領(lǐng)域也非常重要。

《科創(chuàng)板日報》8月22日訊(記者 李明明)人形機(jī)器人被認(rèn)為是最容易適應(yīng)現(xiàn)實(shí)世界的機(jī)器人,其應(yīng)用場景還在不斷拓展。因此,人形機(jī)器人也逐漸成為創(chuàng)投領(lǐng)域的熱門賽道。

作為業(yè)內(nèi)頭部獨(dú)角獸,宇樹科技越來越多地受到市場關(guān)注。近日,宇樹科技人形機(jī)器人G1量產(chǎn)版發(fā)布。據(jù)介紹,G1量產(chǎn)版具備了大規(guī)模生產(chǎn)能力,性能和外觀都得到升級,而它的售價僅9.9萬元起。

在2024世界機(jī)器人大會期間,《科創(chuàng)板日報》記者專訪了宇樹科技創(chuàng)始人王興興,關(guān)于G1售價問題,他表示,“我們一直希望用更合理的價格提供產(chǎn)品給客戶,產(chǎn)品有市場的前提是價格比較友好。” 但他也坦言,目前人形機(jī)器人的體量還沒有完全起來,如果價格定得太低,可能對整個行業(yè)都不是好事,“一直不希望帶頭把行業(yè)做爛。”

image

(宇樹科技創(chuàng)始人王興興)

王興興還表示,目前的大語言模型還是不能充分支持人形機(jī)器人大模型的發(fā)展,后者的技術(shù)路線各家也并不統(tǒng)一,現(xiàn)狀很像ChatGPT出來的前一兩年。

image

從人形機(jī)器人的“反對者”到“進(jìn)場者”

《科創(chuàng)板日報》:在本屆世界機(jī)器人大會上,宇樹帶來了哪些新品,有哪些想要重點(diǎn)展示的?

王興興:本次公司的展示場地比較大,我們帶來了消費(fèi)級四足機(jī)器人Go2和它的新型號Go2-W輪足版本,工業(yè)級四足機(jī)器人B2、B2-W,還有不斷升級版的通用人形機(jī)器人H1,以及今年5月發(fā)布的G1人形智能體,僅僅3個月后又迎來了其量產(chǎn)版本,并在本次大會上首度亮相。

還有一些小的產(chǎn)品比如機(jī)械臂Z1也有展示。另外我們還帶來了3D激光雷達(dá)升級版本,這款雷達(dá)此前還沒有發(fā)布,可以讓機(jī)器狗有更靈敏的感知、導(dǎo)航?jīng)Q策。

《科創(chuàng)板日報》:早期業(yè)界不那么看好人形機(jī)器人,請問宇樹怎么看待外界的聲音,公司在人形機(jī)器人上的發(fā)展戰(zhàn)略是怎樣的?

王興興:發(fā)展人形機(jī)器人基本上還是要追尋整個社會的共識節(jié)奏,因?yàn)槔总娬f過順勢而為,要追隨社會潮流去做,如果做得太早或太晚,其實(shí)都是不好的。

像在2020年前,有很多投資人問我做不做人形機(jī)器人,當(dāng)時我斬釘截鐵地回答不做,主要由于當(dāng)時全球范圍內(nèi),在人形機(jī)器人的控制技術(shù)等方面,普遍發(fā)展的不理想,也看不到實(shí)用價值。

而近年,在馬斯克的帶領(lǐng)下,全球?qū)θ诵螜C(jī)器人非常關(guān)注;同時,2022年底大語言模型的出現(xiàn),使得AI技術(shù)產(chǎn)生了質(zhì)變,讓人們看到了AI在賦能機(jī)器人上的潛力。同年底,雖然宇樹還沒做人形機(jī)器人,但已經(jīng)有一些客戶找過來要購買。所以我們認(rèn)為社會的共識、熱度、客戶的期待程度方面已經(jīng)足夠了,于是在2023年正式開始做人形機(jī)器人。(小K注:宇樹科技成立于2016年8月,最早專注四足機(jī)器人的研發(fā)和銷售。)

目前人形機(jī)器人體量尚未成規(guī)模,定價太低傷害行業(yè)

《科創(chuàng)板日報》:目前,宇樹在機(jī)械和動力等方面的重要突破有哪些?外界評價宇樹的硬件很厲害,對此你怎么看?

王興興:很多人對我們公司的印象是硬件公司,我個人還挺喜歡這個標(biāo)簽的,因?yàn)檫@也代表了大家認(rèn)可公司的硬件。機(jī)器狗目前在全球范圍內(nèi)出貨量一直較好,我們也在硬件上做了一部分軟件升級。

比如去年的Go2機(jī)器狗,就集成了Open AI的大語言模型接口,人們可以跟它對話,它把識別的對話發(fā)送到Open AI的服務(wù)器上,然后把結(jié)果反饋給機(jī)器狗,讓其去執(zhí)行一些底層預(yù)設(shè)的功能,即把整個任務(wù)的編排和執(zhí)行的操作權(quán)放在了Open AI的接口上。目前已經(jīng)留了一些接口,授權(quán)給大語言模型接口,讓它調(diào)用底層的一些功能,比如走路跳躍、拍照等。

此外,我們也做了機(jī)器人運(yùn)動控制相關(guān)的強(qiáng)化學(xué)習(xí)。而對于讓機(jī)器人“干活”這個重點(diǎn),則需要用到一部分大語言模型的技術(shù)。比如采集圖片的數(shù)據(jù)、機(jī)器人關(guān)節(jié)指令數(shù)據(jù)等,然后去做訓(xùn)練。

《科創(chuàng)板日報》:宇樹和電動Atlas采用的都是三指方案,為何你們設(shè)計的是三指,而不是四指或者五指?

王興興:目前從全球來看,人形機(jī)器人技術(shù)方案尚未統(tǒng)一,最典型一個代表就是機(jī)器人到底有幾個手指,到現(xiàn)在各家都沒有統(tǒng)一的意見。

我們的G1人形機(jī)器人身高1.3米左右,如果給其裝個五指,會導(dǎo)致手部較大,所以希望盡量減少手指。后來發(fā)現(xiàn)大部分產(chǎn)品上三指都能用,比如,抓取物品方面,三個手指可以抓得很牢,適用于超過90%的操作,在工廠的波士頓動力Atlas也是采用三指的方案。另外從實(shí)用性的角度,也希望其硬件越來越簡單。

再分享一個觀點(diǎn):隨著AI技術(shù)的成熟和進(jìn)步,人形機(jī)器人對硬件的需求如自由度、數(shù)量、外觀靈活度等將越來越低,甚至沒有手指也能干活。

《科創(chuàng)板日報》: G1人形機(jī)器人的價格非常親民,為何能夠做到大幅度的降本?

王興興:我們一直希望用更合理的價格提供產(chǎn)品給客戶,產(chǎn)品有市場的前提也是價格比較友好。G1價格目前比較有競爭力,是因?yàn)槲覀冏鏊淖銠C(jī)器人已經(jīng)有不少年頭,所以對機(jī)械方面,比如關(guān)節(jié)電機(jī)的生產(chǎn)、整體機(jī)械結(jié)構(gòu)、傳感器、整體電控系統(tǒng)芯片等,積累了較多的經(jīng)驗(yàn)心得。

但是,哪怕公司目前已經(jīng)有好幾款產(chǎn)品的量產(chǎn)經(jīng)驗(yàn),在當(dāng)下而言,我們量產(chǎn)一款產(chǎn)品還是較有壓力,需要涉及和考慮的方面很多,在產(chǎn)品的設(shè)計階段就要做好降成本的準(zhǔn)備,每個零部件都要做的更加簡化,比如每一個零部件細(xì)節(jié)的設(shè)置和精度要求、零部件之間的配合以及工藝要求、零部件的量產(chǎn)規(guī)劃以及對生產(chǎn)工人的流程配合等都要考慮,所以對整體管理和成本管控的要求比較高。

目前人形機(jī)器人的體量還沒有完全起來,如果我們把價格定得太低,可能對整個行業(yè)包括我們自身都不是好事,宇樹一直不希望帶頭把行業(yè)做爛,如果把人形機(jī)器人定價為每臺1萬元,那會傷害整個行業(yè)。我們還是希望價格相對合理,如果后續(xù)整體產(chǎn)品體量和出貨量提升的話,價格可以有一些更好的調(diào)整。

image

不超過5年 人形機(jī)器人領(lǐng)域?qū)霈F(xiàn)“iPhone時刻”

《科創(chuàng)板日報》:目前大模型可重點(diǎn)解決哪些人形機(jī)器人研發(fā)的技術(shù)問題?可以滿足后者的發(fā)展嗎?

王興興:實(shí)際上,真正的人形機(jī)器人大模型再往下發(fā)展,目前的大語言模型還是不能充分支持的,個人認(rèn)為,人形機(jī)器人大模型本質(zhì)上和大語言模型有很大的區(qū)別。

舉個最直觀的例子,在工廠里工作的機(jī)器人,其完全可以不用講話,給一張照片,或者敲一個指令過去,它就可以完成指派的任務(wù),即“干活”。如果單純需要人機(jī)對話的情景,那么可能一個手機(jī)就可以做好,所以我認(rèn)為“干活”是最主要的點(diǎn)。

另外,在目前的人形機(jī)器人大模型領(lǐng)域,每家的想法、技術(shù)路線、包括共性都不太一樣,比如機(jī)器人的相機(jī)應(yīng)該裝什么配置、裝在什么部位、應(yīng)該裝幾個相機(jī)、傳感器數(shù)據(jù)應(yīng)該怎么采、是否需要觸覺傳感器等。目前國外有些流派,連靈巧手都不想開發(fā),就想開發(fā)機(jī)器人的爪子,而有些流派則希望手部更加靈活,即手指要更多,每個手指上有豐富的傳感器。

所以,目前整體上,人形機(jī)器人大模型的技術(shù)路線尚未統(tǒng)一,因此很難評價每家路線是否正確,以及哪條路線推進(jìn)到了什么節(jié)奏。現(xiàn)在人形機(jī)器人大模型的發(fā)展比較像ChatGPT出來的前一兩年,大家已經(jīng)發(fā)現(xiàn)了要往這個方向做,但實(shí)際上沒有哪家敢打保票,保證自己的方向是絕對正確的。

《科創(chuàng)板日報》:近期,國內(nèi)很多人形機(jī)器人廠商宣布其產(chǎn)品“進(jìn)廠打工”,你如何看待這個現(xiàn)象?對此,宇樹人形機(jī)器人未來規(guī)劃是怎樣的?

王興興:我認(rèn)為“進(jìn)廠打工”是一個趨勢,但目前還處于試點(diǎn)階段,過去幾個月,我們與蔚來的汽車工廠有合作,部署了人形機(jī)器人去做現(xiàn)場搬運(yùn)等服務(wù),國內(nèi)一些人形機(jī)器人廠商也和汽車工廠有類似合作。

我們目前更多還是售賣本體,但工業(yè)領(lǐng)域的應(yīng)用場景也在推進(jìn)中,比如部署人形機(jī)器人去工廠做一些簡單的生產(chǎn)裝配和搬運(yùn)等工作,以及其他類型的支持,但并沒有對此快速推進(jìn)。原因是對行業(yè)比較有耐心,不打算近期在工廠里部署目標(biāo)“XX臺”的機(jī)器人,也沒有給自己定很緊張的目標(biāo),還是尊重市場的反應(yīng),等到技術(shù)和產(chǎn)品、商業(yè)推廣發(fā)展更好后,我們再去大規(guī)模的推進(jìn)。

《科創(chuàng)板日報》: 人形機(jī)器人領(lǐng)域什么時候會出現(xiàn)一個iPhone時刻?AI大模型為機(jī)器人領(lǐng)域帶來了哪些明顯的能力的提升,目前還存在哪些挑戰(zhàn)?

王興興:“iPhone時刻”也是市場非常關(guān)注的熱點(diǎn),而且是非常重要的一個時間節(jié)點(diǎn)。但是目前離“iPhone時刻”還有距離,因?yàn)槠涑霈F(xiàn)并不只是有一個特別的技術(shù)突破,實(shí)際上更多是一個綜合性的突破。

只有在工業(yè)或服務(wù)業(yè)能真正出現(xiàn)終端產(chǎn)品,而且到達(dá)出貨量暴增這個節(jié)點(diǎn),才會產(chǎn)生“iPhone時刻”,所以它將會再遠(yuǎn)一點(diǎn)出現(xiàn),可能要在未來3年或4年左右,但是不會超過5年

AI的技術(shù)進(jìn)步很多情況下是階梯性的進(jìn)步,比如,在ChatGPT沒有出現(xiàn)之前,大家一直認(rèn)為大語言模型收效甚微,但出現(xiàn)ChatGPT之后,大家發(fā)現(xiàn)其很智能,在機(jī)器人的AI領(lǐng)域也非常重要。

收藏
65.44W
我要評論
歡迎您發(fā)表有價值的評論,發(fā)布廣告和不和諧的評論都將會被刪除,您的賬號將禁止評論。
發(fā)表評論
要聞
股市
關(guān)聯(lián)話題
2.17W 人關(guān)注
6705 人關(guān)注
4.26W 人關(guān)注
7618 人關(guān)注