專題:《硬核AI客》
文|《硬核AI客》欄目 羅寧
近日,一段優必選人形機器人方陣視頻在海外科技圈引發震動,全球估值最高的機器人獨角獸Figure的創始人甚至親自逐幀分析,質疑視頻是“CG偽造”。面對爭議,優必選用“一鏡到底”的拍攝花絮強勢回應,硬核舉證結束了這場真假之爭。
爭論背后,折射出業界對人形機器人發展的深度關注。機器人方陣,究竟意味著什么?當人形機器人從科幻作品走進現實產業,這場技術革命如何真正創造商業價值?中國企業在全球人形機器人競爭中占據怎樣的地位?
新浪財經《硬核AI客》欄目,聯合開源基金董事總經理、首席經濟學家楊德龍,與優必選首席品牌官譚旻展開深度對話。在譚旻看來,網上一些人認為“中國的機器人只會表演,美國的機器人才會干活”這樣的觀點過于片面,因為現在全世界最先進的工廠超過80%左右都新建在中國,這為人形機器人行業發展提供了豐饒的土壤。
而在唱歌跳舞吸引流量的“眼球經濟”當下,他十分清醒地認識到:機器人產業經過一兩年的喧嘩,已經逐步逐步地回歸到真正的場景應用當中來,這才是整個產業健康發展的一個正確的方向。
以下內容節選自《硬核AI客》視頻欄目,完整版可觀看視頻:
《硬核AI客》:如今AI大模型進入各行各業,不同的大模型,它們對于機器人將來的進化,特別是智慧大腦的形成,它們之間的差別,您感覺大不大?
譚旻:得益于我們在全棧式技術上面的13年的布局積累,實際上優必選一直都是采取一個開放生態的合作,我們跟國外、國內的大模型其實都保持很好的合作跟應用,目的實際上是不斷在測試不同模型的優勢。我們因為從小的人形機器人,就是桌面型人形機器人,甚至乎到AI的萌寵,都在應用語言大模型。我們到人形機器人就更不用說了,其實它無論在理解這個世界,在推理端,其實都是依靠大模型的一個很重要的單點突破的能力。但是目前來講,從總體的大模型來講,我們應用LLM語言大模型,對于人形機器人發展來講是遠遠不夠的。
我們其實除了在語言大模型上面的應用,人形機器人實際上要全面發展,比如說我們要去接觸世界的物體、信息錄入、互動,其實80%左右的信息交換是通過視覺,而不是通過語言來溝通的。所以,我們認為下一個更為重大的大模型的突破,它一定是要結合我們的視覺,就是我們的computer vision,在機器視覺上面要讓人去跟機器、跟世界互動,要通過一個視覺能夠連接在一起,這也是為什么我們在新一代的工業人形機器人Walker S2上面采取的是類人的雙目視覺的這么一項突破創新的技術,因為只有讓機器人擁有跟人一樣的雙眼,它擁有跟人一樣類似的身高,它其實建立起來的世界模型有點像我們真實世界的一個鏡像跟復刻。這個對于人形機器人進入到我們人類社會進行服務,具備這個能力是很關鍵的。
《硬核AI客》:網上有一種說法叫“中國的機器人只會表演,美國的機器人才會干活?”中國的機器人和硅谷的機器人到底誰更強呢?
譚旻:這個說法可能有所片面,我認為可能大家僅僅看到中國機器人唱歌、跳舞的那個部分。我們其實在2023年12月29號就推出了第一款工業人形機器人Walker S,在2024年到現在,我們通過23個月的時間,其實是通過小步快跑、快速迭代的方式,我們迭代了三代工業人形機器人。從Walker S到Walker S1,到現在我們在全球能夠實現自主換電的Walker S2,其實大家看到我們其實已經擁有了全球最多的工廠的實訓場景,我們從北到南,包括北邊一汽奧迪、一汽大眾的青島的國家級工廠、北京汽車集團,到長三角的極氪、吉利,到我們西南的賽力斯,再到在南邊的包括東風柳汽。在深圳我們其實除了跟富士康在整個3C智能制造的場景拓展之外,其實我們跟順豐在智慧物流方面其實也達成了戰略的合作。所以,其實大家以這個場景來看的話,反而其實優必選或者是說中國其它很多的人形機器人,正在從大模型的裝載,在具身智能這個時代,其實迅速地聚焦在我們的應用場景當中,去做各個場景的垂直應用,這個是我們現在看到中國人形機器人百花齊放的一個非常蓬勃發展的這么一個局面。
相對的,美國的人形機器人公司,反而它們其實是all in AI,它們其實是擁有更龐大的對AI投資的能力,這是我們目前中國人形機器人產業所不具備的超規模化的AI投資的能力。
《硬核AI客》:和特斯拉機器人相比,中國的機器人公司將來能不能給全世界造機器人?我們有沒有這樣的能力和信心?
譚旻:我們是非常有信心的,當然這是建構在兩個很核心的基礎能力上面。
從人形機器人這個角度來講,我們認為中國的人形機器人有機會成為制定標準的實施者。因為人形機器人直到目前為止,每一家的技術都還沒有收攏,人形機器人在全球行業里面還沒有形成標準化,比如說汽車是四個輪子,我們的轎車是什么樣的一個規格,它其實通過百年的汽車工業,已經逐漸形成了數據,形成了生產規則,然后形成了整個行業的生態,它才會誕生出來新能源汽車。但是中國的人形機器人得益于我們的這些(優勢),包括新能源汽車的爆發,產生了我們對電機這個單一技術的突破,我們現在已經是全球最大的新能源汽車的生產者,從而我們對電機這個技術,無論是技術、產能,都有了很好的成本上面的控制的能力。在這個基礎上面我們再發展一個更為顛覆性創新的人形機器人行業,這個時候,我們在技術還沒有收攏、還沒有標準化的時候,我們就有機會跟整個產業鏈的系統化一起,能夠在這個標準上面形成中國人形機器人的產業標準。
大家不要忘了,我們其實擁有全世界最大的智能制造的應用場景,現在全世界新建的最先進的工廠可能超過80%左右都在中國,這個實際上是有利于我們進一步加強我們在標準制定上面的話語權,這個真正是整個人形機器人行業發展的一個更為豐饒的土壤。
《硬核AI客》:特斯拉未來要年產100萬臺機器人?優必選會有什么樣的目標?
譚旻:我們其實今年是500臺到1000臺交付數量的范疇,明年我們的目標是3000到5000臺,2027年是10000臺。通過這三個步驟的POC的驗證,大家一定要記住,沒有真正通過商業驗證的量產交付都沒有意義。
比如說特斯拉說它要形成100萬臺,那是一個對未來的期許,它其實沒有任何現在能夠對于場景應用上面的一個驗證,光談數量是沒有意義的。所以,反向如果說我們以100萬臺來看現在上游的投資,那肯定會有一個過高的預期。但是如果我們把這個關注的維度放到中國的場景應用當中來,我認為實際上是能夠給所有的投資者一個更加真實的一個參考坐標,這也是外國的投資基金來到中國進行很多廠家上游的實地考研之后,得出了一個很重要的節點,就是說可能大家都高估了現在的發展速度,但是低估了未來的成長速度,這是其重要的一個點。
《硬核AI客》:如何看待機器人創業公司瘋狂砸錢推產品的做法?
譚旻:大家要了解到,在過往的兩年左右的時間里面,其實中國已經成立了接近200家人形機器人的公司,大家在百花齊放的過程中,一定是八仙過海、各顯神通,所以大家為了能夠更好地發展,其實一定會用各種各樣新奇的手段來吸引眼球,這實際上非常非常正常,這也是新創公司能夠更好地贏取投資人的注意,能夠拿到更多融資的其中的一種方式,大家更值得關注的不是能夠有多大的流量,(不是)能夠有更多的花式的玩法,現在市場其實通過這一兩年的喧嘩,已經逐步逐步地回歸到真正的場景應用當中來,這才是整個產業健康發展的一個正確的方向。我們也看到,國家在這個方向是鼓勵大家把人形機器人更多地帶到真實應用當中去,更多地讓機器人去干實業的一個很重要的產業上面的指導。
《硬核AI客》:近一年,機器人表演唱歌、跳舞等娛樂性項目已成趨勢,這種趨勢是正確的方向嗎?
譚旻:其實優必選作為一個創業公司,也經歷過這種過程。優必選在13年的創業歷程當中,其實已經四次上過春晚,每一次上春晚都是不同的機器人。優必選也經歷過2016年我們540臺機器人集體跟孫楠一起載歌載舞的時刻,它是作為創業公司,在剛剛創立的過程中,向投資者、向整個業界去證實自己能力的其中一種方法。
在一百多家人形機器人新創的公司,要突圍而出,實際上唱歌、跳舞確實是一個比較容易抓取眼球的方法。
但是我們相信,唱歌、跳舞絕對不是人形機器人發展的一個真正能夠落地應用的方向。我們看到政府,其實也號召人形機器人真正更快地能夠投入到產業應用當中去,真正進廠打工,是我們整個中國人形機器人產業發展大的政策上面的指引跟方向。由此大家其實已經看到,優必選在過往的兩年當中,其實已經是率先比我們美國的同行,更早地投入到我們的產業應用當中去,更早地把機器人投入到我們實體經濟的這么一個更高的效能提升當中去,做一個新質生產力,人形機器人我們相信真正能夠對我們的智能制造、對我們下一代的生產力革命,進行一個推動,讓我們的人形機器人幫助我們的人工智能,更快地對我們不同行業提質增效,發生真正的推動。這是我們中國人形機器人產業面對的挑戰,也是我們真正遇到的非常大的機遇。擁抱這個機遇,克服這個挑戰,我相信人形機器人在中國的發展就會迎來我們整個新的萬億集群的這么一個形成。