免费无码国产一级aⅴ片_一区二区理伦视频_久久這里只有精品1_国产亚洲日韩精品激情a_國產最新自拍視頻_国产在线观看黄色_好色先生污版_欧美成人精品三级在线_亚洲黄色网址在线播放_ass女了下郎欣赏BBW

Language
400-996-7588
搜索

搜索發(fā)現(xiàn)

具身智能落地工業(yè)場(chǎng)景,人形不一定是最優(yōu)解

企業(yè)新聞
2024.10.22

1729576628756.jpg

關(guān)于人形機(jī)器人是否有用的爭(zhēng)論還在繼續(xù),比如,工業(yè)場(chǎng)景是否需要人形?

「如果工業(yè)場(chǎng)景有一個(gè)具備感知、認(rèn)知、執(zhí)行的能力的智能體,人形并不一定是工業(yè)現(xiàn)場(chǎng)中的最優(yōu)解?!?/span>

「工業(yè)現(xiàn)場(chǎng)最初是為人類(lèi)設(shè)計(jì)的,所以人形機(jī)器人可以第一時(shí)間進(jìn)入到現(xiàn)場(chǎng),但今天,工業(yè)現(xiàn)場(chǎng)的生產(chǎn)并不一定要為人設(shè)計(jì)?!?/span>

這是微億智造張志琦的觀(guān)點(diǎn),他們剛剛推出了一款具身智能工業(yè)機(jī)器人「創(chuàng) TRON」,實(shí)現(xiàn)了 LLM 在機(jī)器人領(lǐng)域的技術(shù)落地和商業(yè)化。

大模型在工業(yè)場(chǎng)景,相比消費(fèi)端,在數(shù)據(jù)上有更多的優(yōu)勢(shì),「(大模型)集成到工業(yè)領(lǐng)域后,我們能夠在每個(gè)場(chǎng)景中積累數(shù)據(jù),并通過(guò)機(jī)器人載體有效執(zhí)行和落地,沉淀有價(jià)值的數(shù)據(jù)?!?/strong>

最近,在 Founder Park 直播間,F(xiàn)ounder Park COO 艾之與微億智造董事長(zhǎng)&CEO 張志琦、捷勃特機(jī)器人副總裁&CTO 賀巖,一起聊了聊新產(chǎn)品「創(chuàng) TRON」誕生的幕后,以及工業(yè)機(jī)器人在今天商業(yè)落地的更多可能性。

文章基于直播整理,略有調(diào)整。

一些有趣的點(diǎn):


今天國(guó)內(nèi)市場(chǎng)上的機(jī)械臂已經(jīng)很便宜了,但為什么企業(yè)還不用?很多老板吐苦水說(shuō),買(mǎi)了幾萬(wàn)塊的機(jī)械臂,還得配一個(gè)月薪幾萬(wàn)的工程師來(lái)調(diào)教它,而且訂單和產(chǎn)線(xiàn)經(jīng)常變化,工程師還需要時(shí)間去不斷調(diào)整。相比之下,招一個(gè)臨時(shí)工,或者讓老師傅帶一下,幾乎就可以立即上崗。這是現(xiàn)實(shí)中的情況。


具身智能工業(yè)機(jī)器人會(huì)改變行業(yè)對(duì)自動(dòng)化的思考。傳統(tǒng)的流水線(xiàn)設(shè)計(jì),把人當(dāng)機(jī)器一樣去「使用」。通過(guò)流程和 SOP 標(biāo)準(zhǔn)化,去除個(gè)體差異。穩(wěn)定后,再逐步用機(jī)械設(shè)備替代人力。但當(dāng)機(jī)器人具備人類(lèi)的理解和認(rèn)知能力,能夠基于感知來(lái)思考,同時(shí)在執(zhí)行側(cè)又能夠像人一樣靈活應(yīng)對(duì)執(zhí)行任務(wù),工作流要發(fā)生變化。


「創(chuàng)TRON」在設(shè)計(jì)上對(duì)標(biāo)人類(lèi)員工。人有時(shí)會(huì)犯錯(cuò),它也會(huì),但有機(jī)制來(lái)糾正和提升。類(lèi)似于自動(dòng)駕駛的 L1-L5 級(jí)別,「創(chuàng) TRON」大概是 L2、L3 級(jí)別。它需要人類(lèi)監(jiān)督,在執(zhí)行時(shí),發(fā)現(xiàn)問(wèn)題,及時(shí)糾正,而這些糾正會(huì)幫助模型在下一次的能力提升中表現(xiàn)得更好。


工業(yè)現(xiàn)場(chǎng)最初是為人類(lèi)設(shè)計(jì)的,所以人形機(jī)器人可以第一時(shí)間進(jìn)入到現(xiàn)場(chǎng),但今天,工業(yè)現(xiàn)場(chǎng)的生產(chǎn)并不一定要為人設(shè)計(jì)。


工業(yè)現(xiàn)場(chǎng)的第一個(gè)問(wèn)題就是要把賬算清楚。今天許多與人形機(jī)器人相關(guān)的成本,一部分是在執(zhí)行結(jié)構(gòu)上,另一部分是用了大量傳感器,如果我們把這種模式應(yīng)用到工業(yè)現(xiàn)場(chǎng),問(wèn)題就很難解決,賬是算不過(guò)來(lái)的。所以我們給團(tuán)隊(duì)設(shè)定了一個(gè)預(yù)設(shè)條件——不能使用貴的傳感器,也不能用更貴的技術(shù)來(lái)實(shí)現(xiàn)這些目標(biāo)。


從 AI 公司成長(zhǎng)為機(jī)器人公司很難,從機(jī)器人公司成長(zhǎng)為 AI 公司也很難。像「創(chuàng) TRON」這種具身智能產(chǎn)品,必須是硬件與軟件、機(jī)器人與 AI 的深度結(jié)合。今天很多人形機(jī)器人公司動(dòng)輒有 400-500 人的團(tuán)隊(duì),至少需要 200 多人的硬件團(tuán)隊(duì),100 多人的算法和軟件團(tuán)隊(duì),才能逐步將產(chǎn)品做起來(lái)。



1729575859390.jpg


01

「創(chuàng)TRON」:

有自主學(xué)習(xí)能力的具身智能工業(yè)機(jī)器人

艾之:這不是你們合作的第一款機(jī)械臂產(chǎn)品了,能不能請(qǐng)您先介紹一下,相比之前的產(chǎn)品,「創(chuàng)TRON」從功能到任務(wù)完成上,有哪些突破?

張志琦:「創(chuàng)TRON」這個(gè)產(chǎn)品是微億智造和捷勃特聯(lián)合推出的第一款具身智能工業(yè)機(jī)器人。為什么稱(chēng)它為具身智能工業(yè)機(jī)器人,與傳統(tǒng)的機(jī)械臂有什么區(qū)別?這個(gè)機(jī)器人在使用的過(guò)程中,真正實(shí)現(xiàn)了從傳統(tǒng)的人工編程或手動(dòng)拖動(dòng)方式的示教過(guò)程,轉(zhuǎn)變?yōu)樽詣?dòng)落地執(zhí)行。這跟傳統(tǒng)機(jī)器人在傳統(tǒng)的機(jī)械臂中間加上視覺(jué)能力的方式有很大差別。


這款機(jī)器人就像一個(gè)學(xué)徒。一般在工業(yè)現(xiàn)場(chǎng),師傅帶徒弟時(shí),師傅演示一遍,徒弟在旁邊看一遍,然后自己操作一遍,如果操作正確,徒弟就算合格上崗了。我們的「創(chuàng)TRON」也是類(lèi)似的模式,師傅做一遍,機(jī)器人通過(guò)視覺(jué)系統(tǒng)「看」一遍,然后在仿真系統(tǒng)里學(xué)習(xí),再在真實(shí)物理環(huán)境中操作一遍,所有這些事情成功之后,最后把所有指令下達(dá)給工業(yè)機(jī)器人,工業(yè)機(jī)器人就能用更高效、更精準(zhǔn)的方式完成所有工作。

這就是「創(chuàng)TRON」與傳統(tǒng)機(jī)器人之間的最大差異。過(guò)去我們看到的是冷冰冰的自動(dòng)化設(shè)備,而今天的「創(chuàng)TRON」是一個(gè)活生生的、可以和人進(jìn)行交互的智能化產(chǎn)品。

同時(shí),它在執(zhí)行過(guò)程中如果遇到任何干擾,比如運(yùn)行線(xiàn)路被阻擋、抓取過(guò)程中受到干擾,東西掉了、被拿走等等,它都可以自己感知、修正,繼續(xù)執(zhí)行任務(wù)。這是傳統(tǒng)自動(dòng)化設(shè)備無(wú)法實(shí)現(xiàn)的,而具身智能的工業(yè)機(jī)器人有能力處理這類(lèi)任務(wù)。

艾之:過(guò)去的自動(dòng)化機(jī)械臂生產(chǎn)線(xiàn)上是不存在這樣的任務(wù)學(xué)習(xí)環(huán)節(jié)的。那傳統(tǒng)的自動(dòng)化機(jī)械臂在生產(chǎn)線(xiàn)上,如何把一個(gè)任務(wù)分解為不同機(jī)械臂需要協(xié)作和執(zhí)行的指令?

賀巖:傳統(tǒng)工業(yè)機(jī)器人要在線(xiàn)上工作的話(huà),實(shí)際上并不是簡(jiǎn)單的把人替換成機(jī)器人。這是一個(gè)很復(fù)雜的過(guò)程。

首先,原始材料要規(guī)整地排列在固定的位置上,然后要有工程師為機(jī)器人編程,這是需要專(zhuān)業(yè)知識(shí)的,只有專(zhuān)業(yè)的機(jī)器人工程師才能編寫(xiě)程序,告訴機(jī)器人去哪個(gè)點(diǎn)抓取物品,在哪個(gè)點(diǎn)安裝。每一步都要程序化地編好。

這個(gè)過(guò)程要求兩點(diǎn):一是上料必須規(guī)整,二是編程初始化。這是傳統(tǒng)工業(yè)機(jī)器人替代工人的過(guò)程,非常復(fù)雜。而「創(chuàng) TRON」就像一個(gè)學(xué)徒,能在師傅示范下學(xué)習(xí)并完成任務(wù),這是一個(gè)革命性的突破。

艾之:大家挺關(guān)心機(jī)器人在實(shí)際應(yīng)用中的穩(wěn)定性,機(jī)器人在跟真實(shí)的人交互的時(shí)候,表現(xiàn)的穩(wěn)定性如何?

賀巖:實(shí)話(huà)實(shí)說(shuō),我們確實(shí)有失敗的案例,但我認(rèn)為,失敗的案例在整個(gè)過(guò)程中給我們提供了很多學(xué)習(xí)機(jī)會(huì)。同時(shí),我覺(jué)得「示教」這個(gè)切入點(diǎn)選得非常好。

正如志琦總提到的,大多數(shù)工業(yè)場(chǎng)景對(duì)可靠性、容錯(cuò)性要求很高,而「示教」這件事本身是有一定容錯(cuò)性的。比如我示范一次,你做錯(cuò)了,我告訴你錯(cuò)了,再做一遍,直到你做對(duì)為止。這個(gè)過(guò)程就像 ChatGPT 一樣,你回答錯(cuò)了,我告訴你錯(cuò)了,再來(lái)一次,直到你答對(duì)為止。在「示教」環(huán)節(jié),目前這個(gè)狀態(tài)下,它是可用的,并且能創(chuàng)造很大的價(jià)值。

艾之:對(duì),在一些對(duì)容錯(cuò)率要求相對(duì)寬松的場(chǎng)景里,它已經(jīng)達(dá)到了實(shí)際可用的狀態(tài)。

張志琦:我們?cè)诂F(xiàn)場(chǎng)演示時(shí)分為兩部分,一部分是學(xué)習(xí)區(qū),另一部分是工廠(chǎng)的執(zhí)行區(qū)。坦白說(shuō),在學(xué)習(xí)過(guò)程中它確實(shí)有時(shí)會(huì)出錯(cuò)。因?yàn)楸澈蟮牟僮髁鞒淌菣C(jī)器人先在仿真環(huán)境中學(xué)習(xí),再在實(shí)際環(huán)境中執(zhí)行。就像人類(lèi)員工,能力稍弱的徒弟第一次不一定能學(xué)會(huì),沒(méi)學(xué)會(huì),師傅就得再教一遍。而在每次教學(xué)的過(guò)程中,系統(tǒng)其實(shí)會(huì)通過(guò)這些失敗的樣本,進(jìn)一步將數(shù)據(jù)回流到模型中,進(jìn)行進(jìn)一步提升。而在執(zhí)行區(qū),也就是工廠(chǎng)那一側(cè),成功率非常高,因?yàn)槟遣糠质窃诟咝Лh(huán)境下執(zhí)行的。

所以,「創(chuàng)TRON」這個(gè)產(chǎn)品本質(zhì)上就是對(duì)標(biāo)人類(lèi)員工的。人有時(shí)會(huì)犯錯(cuò),它也會(huì),但我們有機(jī)制來(lái)糾正和提升。同樣的,我們的機(jī)器人在執(zhí)行時(shí)也有監(jiān)督機(jī)制,類(lèi)似于自動(dòng)駕駛的 L1-L5 級(jí)別的過(guò)渡,今天我們的產(chǎn)品大概是 L2、L3 級(jí)別。它需要人類(lèi)監(jiān)督,在執(zhí)行時(shí),發(fā)現(xiàn)問(wèn)題,及時(shí)糾正,而這些糾正會(huì)幫助模型在下一次的能力提升中表現(xiàn)得更好。這是我們覺(jué)得比較有意思的一點(diǎn)。

當(dāng)然,在實(shí)際現(xiàn)場(chǎng)我們也遇到過(guò)一些意外情況。比如這次國(guó)際工業(yè)博覽會(huì)上,很多媒體對(duì)設(shè)備感興趣,拿著閃光燈猛拍,結(jié)果我們突然發(fā)現(xiàn),一個(gè)機(jī)器人的「眼睛」暫時(shí)失明了,因?yàn)殚W光燈太強(qiáng)烈了。這其實(shí)是個(gè)很好的 Badcase。接下來(lái)我們就要考慮怎樣讓模型更好地處理這種干擾,快速修正和恢復(fù),確保在學(xué)習(xí)過(guò)程中能更有效地執(zhí)行。

所以,我們認(rèn)為,AI 和具身智能類(lèi)產(chǎn)品最不怕失敗,只有在這種模式下,才能有效提升模型能力。不過(guò),我們需要解決的核心問(wèn)題是,如何在工業(yè)現(xiàn)場(chǎng)中將這些失敗變?yōu)榭煽匾蛩?,從而讓產(chǎn)品能夠真正落地和執(zhí)行。如果產(chǎn)品一直不穩(wěn)定,坦白講,像人類(lèi)員工一樣,如果他一直不穩(wěn)定,早就被解雇了。如果我們的產(chǎn)品也不穩(wěn)定,肯定也沒(méi)人用。

因此,在示教的過(guò)程中,我們?cè)试S一定程度的失敗,人類(lèi)在這個(gè)過(guò)程中會(huì)不斷對(duì)它進(jìn)行矯正,一旦模型穩(wěn)定下來(lái),它就能快速落地執(zhí)行,且效率極高。以前,我們可能需要編程來(lái)讓設(shè)備理解人的指令,要花費(fèi)幾天甚至幾周時(shí)間。今天通過(guò)示教和修正,機(jī)械設(shè)備可以在幾個(gè)小時(shí)內(nèi)快速實(shí)現(xiàn)。


02 

工業(yè)機(jī)器人不需要是人形,

但需要比人做得好


艾之:作為一直深耕工業(yè)領(lǐng)域的人,具身智能概念火起來(lái)之后,給這個(gè)行業(yè)帶來(lái)哪些變化?

賀巖:具身智能這個(gè)概念興起之后,尤其是馬斯克公布了他的人形機(jī)器人計(jì)劃,讓人們對(duì)未來(lái)有了更高的期望,比如我可以做百萬(wàn)臺(tái)甚至上千萬(wàn)臺(tái)低成本的機(jī)器人。我切身的感覺(jué)是,可選的供應(yīng)商變得越來(lái)越多了,因?yàn)樵絹?lái)越多供應(yīng)商對(duì)這件事充滿(mǎn)了希望,會(huì)在之前比較小眾的零部件上投入更多資源。

對(duì)于我們來(lái)說(shuō),可以想象一下,如果人形機(jī)器人售價(jià)是 2 萬(wàn)美金,那么單個(gè)手臂的成本可能會(huì)低至 2,000 美金,這樣的話(huà),在很多場(chǎng)合,我們可能不需要整個(gè)人形機(jī)器人,只需要一個(gè)手臂就能完成很多任務(wù),怎么算賬都算得過(guò)來(lái)。

張志琦:人形機(jī)器人火了之后,讓工業(yè)場(chǎng)景也變得更熱鬧了。大家看到打工人突然多了一個(gè)「鋼鐵之身」,能夠幫助我們解放人力。

傳統(tǒng)的流水線(xiàn)設(shè)計(jì),把人當(dāng)機(jī)器一樣去「使用」。通過(guò)流程和 SOP 標(biāo)準(zhǔn)化,去除個(gè)體差異。當(dāng)這種模式穩(wěn)定后,再逐步用機(jī)械設(shè)備替代人力。但現(xiàn)在突然出現(xiàn)了一個(gè)「鋼鐵之身」,這個(gè)機(jī)器人具備人類(lèi)的理解和認(rèn)知能力,能夠基于感知來(lái)思考,同時(shí)在執(zhí)行側(cè)又能夠像人一樣靈活應(yīng)對(duì)執(zhí)行任務(wù)。它在突然間就改變了我們對(duì)自動(dòng)化的許多思考。

以前自動(dòng)化追求的是高效率,犧牲的是柔性和個(gè)性,大家一直認(rèn)為效率和柔性是矛盾的。而現(xiàn)在,好像來(lái)了一個(gè)新事物,可能有機(jī)會(huì)把效率和柔性統(tǒng)一起來(lái)。

柔性化:一般機(jī)器的小批量快速量產(chǎn)能力,相對(duì)于通用的定制化,需要有更多靈活性。

當(dāng)然,目前人形機(jī)器人在工業(yè)現(xiàn)場(chǎng)的效率還不夠高,需要加快,還在努力解決柔性化的問(wèn)題。但我們想通過(guò)「創(chuàng) TRON」這款產(chǎn)品,讓行業(yè)理解,實(shí)際上我們是有機(jī)會(huì)將柔性化和高效率結(jié)合起來(lái)的,因?yàn)檫@才是真正意義上工業(yè)的需求——就是要做到比人更好,才能真正用設(shè)備去替代人力。

艾之 :當(dāng)我們談?wù)摼呱碇悄苓@個(gè)概念時(shí),大多數(shù)人可能首先想到的是人形機(jī)器人。具身智能工業(yè)機(jī)器人(Embodied Intelligent Industrial Robots, EIIR)這個(gè)品類(lèi)是如何一步步被創(chuàng)造出來(lái)的?與傳統(tǒng)工業(yè)機(jī)器人的差別是什么?

賀巖:在工業(yè)機(jī)器人普及的過(guò)程中,調(diào)試和傳統(tǒng)示教是非常復(fù)雜的過(guò)程。企業(yè)如果要使用工業(yè)機(jī)器人,需要招聘有資質(zhì)、有專(zhuān)業(yè)背景且有經(jīng)驗(yàn)的人,才能把機(jī)器人用起來(lái),這極大限制了工業(yè)機(jī)器人的應(yīng)用范圍。很多企業(yè)主寧愿用人,因?yàn)槿丝梢赃m應(yīng)各種隨意的來(lái)料,而且人還可以做別的事,只要去吩咐他就行了。

布置一個(gè)機(jī)器人是非常繁瑣的,如果有這樣一種示范教學(xué)的模式,工業(yè)機(jī)器人可以被應(yīng)用的場(chǎng)合會(huì)大幅增多。

關(guān)于二者的分野,我覺(jué)得「智能」這個(gè)詞是有時(shí)效性的,比如說(shuō)我們現(xiàn)在管手機(jī)叫「智能手機(jī)」,但是我覺(jué)得我女兒不會(huì)這么認(rèn)為,她會(huì)覺(jué)得手機(jī)不就是現(xiàn)在這樣嗎,為什么還要強(qiáng)調(diào)智能兩個(gè)字?我們對(duì)具身智能的理解是,目標(biāo)是讓它把我們操心的事情都干了。現(xiàn)階段的第一步任務(wù)是,怎樣更方便的向機(jī)器人傳達(dá)指定任務(wù)?不用專(zhuān)業(yè)支持就能夠把我想要的事情交給機(jī)器人來(lái)做。這是從傳統(tǒng)工業(yè)機(jī)器人向具身智能機(jī)器人邁出的重要的邁進(jìn)。

張志琦:我從通俗的角度再聊一聊。我們?cè)谠O(shè)計(jì)具身智能工業(yè)機(jī)器人時(shí),實(shí)際上是根據(jù)我們?cè)跈C(jī)器人使用過(guò)程中發(fā)現(xiàn)的許多問(wèn)題來(lái)做的。

微億智造從成立以來(lái)就是一家使用機(jī)器人「很深」的企業(yè),我們最早是從產(chǎn)品外觀(guān)檢測(cè)開(kāi)始,也在大量使用機(jī)器人來(lái)實(shí)現(xiàn)針對(duì)機(jī)構(gòu)側(cè)的要求,就像人的手一樣。同時(shí),我們也在光學(xué)、AI、模擬方面做了很多能力的提升。

在使用機(jī)器人的過(guò)程中,首先就像賀總提到的,確實(shí)很難操作,必須有專(zhuān)業(yè)知識(shí)來(lái)進(jìn)行有效調(diào)整。我們走訪(fǎng)了許多企業(yè)后發(fā)現(xiàn),不僅僅是我們難,整個(gè)制造業(yè)都難。很多企業(yè)老板寧愿雇個(gè)臨時(shí)工來(lái)解決生產(chǎn)力問(wèn)題,也好過(guò)去買(mǎi)一個(gè)機(jī)械臂。以前是因?yàn)楹芏嗳擞X(jué)得機(jī)械臂太貴,今天國(guó)內(nèi)市場(chǎng)上的機(jī)械臂已經(jīng)很便宜了,但為什么企業(yè)還不用?很多老板吐苦水說(shuō),買(mǎi)了幾萬(wàn)塊的機(jī)械臂,還得配一個(gè)月薪幾萬(wàn)的工程師來(lái)調(diào)教它,而且訂單和產(chǎn)線(xiàn)經(jīng)常變化,工程師還需要時(shí)間去不斷調(diào)整。相比之下,我今天招一個(gè)臨時(shí)工來(lái),或者讓老師傅帶一下,幾乎就可以立即上崗。這是現(xiàn)實(shí)中的情況。

我們從很多第三方的市場(chǎng)報(bào)告中看到,每萬(wàn)名工人的機(jī)械臂使用量,幾年前是 200-300 臺(tái),現(xiàn)在達(dá)到 300-400 臺(tái),甚至在發(fā)達(dá)制造地區(qū)達(dá)到了 400-500 臺(tái)。

這個(gè)數(shù)字看起來(lái)有點(diǎn)奇怪,為什么每萬(wàn)名工人只用 500 臺(tái)機(jī)械臂?剩下的 9500 名工人到底在做什么?其實(shí)就是因?yàn)?,傳統(tǒng)固化的機(jī)器人使用場(chǎng)景無(wú)法覆蓋那么多崗位。很多企業(yè)主跟我們聊,他們?cè)O(shè)定了指標(biāo),每年要用一萬(wàn)臺(tái)機(jī)械臂替代工人,但生產(chǎn)主管覺(jué)得真的好難,不知道能在哪些場(chǎng)景使用,能用的場(chǎng)景都用了,但是真的還是有太多場(chǎng)景還是要依靠人來(lái)解決。雖然工人難招,相對(duì)流動(dòng)性大,不斷要做培訓(xùn)。

今天是否能有一臺(tái)設(shè)備能真正意義上像人一樣學(xué)習(xí),還能在執(zhí)行過(guò)程中動(dòng)態(tài)處理問(wèn)題,最終以完成任務(wù)為核心?

這就是我們「創(chuàng) TRON」這款具身智能工業(yè)機(jī)器人的核心目標(biāo),希望它能像工人一樣通過(guò)學(xué)習(xí)完成工作,安裝到現(xiàn)場(chǎng),跟老師學(xué)一遍,就能把活兒干了。

艾之:這里面的鴻溝其實(shí)是,教人比教機(jī)器要簡(jiǎn)單太多了,專(zhuān)業(yè)人才的缺口應(yīng)該仍然很大。高端人才一方面成本高,一方面供應(yīng)量也未必能滿(mǎn)足工廠(chǎng)需求。因此,具身智能的核心定義應(yīng)該是「像人一樣」。但到底是像人的外形,還是像人的思考和解決問(wèn)題的能力?可能后者才是核心的概念。

張志琦:是的,這兩年大家對(duì)具身智能的理解越來(lái)越深入了,人形機(jī)器人也幫助了大眾理解具身智能的能力??吹揭粋€(gè)人形設(shè)備能夠在現(xiàn)場(chǎng)解決很多人做的事情,突然間對(duì)這個(gè)能力有很大認(rèn)可。但在工業(yè)場(chǎng)景上,我們也要解決「如何算得過(guò)來(lái)賬」的問(wèn)題。

我們的具身智能工業(yè)機(jī)器人基本上可以讓工廠(chǎng)在一個(gè)比較低的成本的情況下去應(yīng)用,基于使用的過(guò)程積累數(shù)據(jù),不斷提升能力,從而真正讓這個(gè)產(chǎn)品不光是「算得過(guò)來(lái)」,同時(shí)產(chǎn)品本身的能力還能持續(xù)提升,這是這個(gè)閉環(huán)中的最核心的點(diǎn)。

艾之:你們覺(jué)得工業(yè)場(chǎng)景中最終需要人形機(jī)器人嗎?還是說(shuō)結(jié)論并不一定?

張志琦:從我的觀(guān)點(diǎn)來(lái)看,人形機(jī)器人不一定是工業(yè)現(xiàn)場(chǎng)的最佳解決方案。機(jī)械臂不一定要是兩只手,也可能是四只手,甚至更多。也不一定要有雙足,可以是輪子或者其他更高效的移動(dòng)方式。

工業(yè)現(xiàn)場(chǎng)最初是為人類(lèi)設(shè)計(jì)的,所以人形機(jī)器人可以第一時(shí)間進(jìn)入到現(xiàn)場(chǎng),但今天,工業(yè)現(xiàn)場(chǎng)的生產(chǎn)并不一定要為人設(shè)計(jì)。

就像以前我們做勞動(dòng)防護(hù)時(shí)還得帶上防毒面具,各方面考慮,它也不可能實(shí)現(xiàn) 24 小時(shí)不間斷的生產(chǎn)。今天這些設(shè)備都可以超越人的能力,不見(jiàn)得是人的形態(tài),但是它能夠更好地發(fā)揮效益。所以,人形并不一定是工業(yè)現(xiàn)場(chǎng)中的最優(yōu)解。如果有一個(gè)具備感知、認(rèn)知、執(zhí)行的能力的智能體,工業(yè)現(xiàn)場(chǎng)可能更需要這樣的產(chǎn)品。

賀巖:我感覺(jué)可以把具身智能體比作硅基生物?,F(xiàn)在的情況有點(diǎn)像寒武紀(jì)時(shí)期的生物大爆發(fā),氧氣增加帶來(lái)生命的爆發(fā)式增長(zhǎng)?,F(xiàn)在的「氧氣」是算力、數(shù)據(jù)和算法,這些技術(shù)的成熟帶來(lái)了具身智能體的爆發(fā)式增長(zhǎng)。

前段時(shí)間看到騰訊推出的「騰訊 5 號(hào)」養(yǎng)老機(jī)器人,這是一個(gè)家用機(jī)器人,主要是幫助老年人,但它不是雙足機(jī)器人。因?yàn)楝F(xiàn)在雙足機(jī)器人走路比老年人還要顫顫巍巍,怎么能幫助老年人呢?所以它的支撐結(jié)構(gòu)做得非常穩(wěn)固。其次,它沒(méi)有頭。當(dāng)它幫助老人從輪椅轉(zhuǎn)移到床上時(shí),如果有頭反而會(huì)成為干擾。沒(méi)有頭會(huì)讓人感覺(jué)更舒服。如果它長(zhǎng)出一個(gè)頭來(lái),反而顯得多余。

這樣的例子讓我看到未來(lái)多種多樣的硅基生物的可能性,具身智能體會(huì)以各種形態(tài)出現(xiàn),但最終會(huì)是什么形態(tài)我沒(méi)有辦法做出預(yù)測(cè)。

艾之:這有點(diǎn)像人類(lèi)本身,不是在每個(gè)場(chǎng)景中都需要發(fā)揮所有能力。比如走路時(shí)是小腦在控制,讀論文時(shí)大腦的核心區(qū)域正在被激活。

其實(shí)有點(diǎn)像去把人這樣一個(gè)已經(jīng)進(jìn)化得非常好的超級(jí)智能體的能力重新排列組合。如果只是單獨(dú)實(shí)現(xiàn)其中一個(gè)模塊的話(huà),成本其實(shí)是要低很多的。不需要在每一個(gè)場(chǎng)景里面都放一個(gè)特別厲害的技工,或者說(shuō)特別厲害的一個(gè)人。

我想稍微做一下推演,如果以機(jī)械臂為例,像自動(dòng)駕駛一樣有 L1-L5 的分級(jí),賀巖總,您覺(jué)得「創(chuàng) TRON」這款機(jī)器人大概屬于哪個(gè)級(jí)別?如果往更高的級(jí)別發(fā)展,它會(huì)是什么樣的?

賀巖:自動(dòng)駕駛的過(guò)程,是隨著等級(jí)提升,對(duì)人的依賴(lài)越來(lái)越低。目前的工業(yè)機(jī)器人,是要有「駕照」才能用,需要專(zhuān)業(yè)操作人員才能使用。而「創(chuàng) TRON」可以實(shí)現(xiàn)在「沒(méi)有駕照」的情況下,在特定領(lǐng)域內(nèi),沒(méi)有專(zhuān)業(yè)背景的情況下,也能夠用起來(lái)。

L1,就像是在自動(dòng)倒車(chē)入庫(kù)這樣的場(chǎng)景中,不用專(zhuān)業(yè)的技能,普通用戶(hù)也能自動(dòng)完成。

L2、L3 的話(huà),相當(dāng)于在高速公路上跟車(chē)的這些功能,可以在沒(méi)有專(zhuān)業(yè)技能的情況下自動(dòng)完成。我認(rèn)為「創(chuàng) TRON」大概相當(dāng)于 L2-L3 級(jí)別。

進(jìn)化到 L4 或 L5 級(jí)別時(shí),用戶(hù)只需要告訴機(jī)器人我要完成什么任務(wù),完全不需要任何專(zhuān)業(yè)技能。那時(shí),它就真的像一位聰明的工人了。


03

智能臂的新可能:

一個(gè)集裝箱里生產(chǎn) iPhone


艾之:具身智能工業(yè)機(jī)器人和消費(fèi)類(lèi)機(jī)器人是針對(duì)不同場(chǎng)景和目標(biāo)設(shè)計(jì)的。兩者在技術(shù)路徑上應(yīng)該有很大的區(qū)別吧?在發(fā)展過(guò)程中要攻克的技術(shù)難題,以及難題的優(yōu)先級(jí),是否存在很大的不同?

張志琦:對(duì),二者的技術(shù)路徑上和場(chǎng)景有一定的差別。

工業(yè)場(chǎng)景相對(duì)來(lái)說(shuō)是一個(gè)閉環(huán)。它不像開(kāi)放的世界那樣,可能會(huì)受到各種外界因素的干擾。

舉個(gè)例子,像消費(fèi)類(lèi)機(jī)器人在不同環(huán)境中幫助老人時(shí),物理世界的干擾因素很多;但在工業(yè)場(chǎng)景中,在工廠(chǎng)內(nèi)部,干擾相對(duì)有限。

在工廠(chǎng)里,操作的對(duì)象可能是物料、生產(chǎn)設(shè)備,或者生產(chǎn)過(guò)程中的工人,環(huán)境相對(duì)封閉。它需要理解和處理的物理世界的量更加有限,這使得工業(yè)場(chǎng)景在模型訓(xùn)練和技術(shù)實(shí)現(xiàn)上相對(duì)容易一些。但工業(yè)場(chǎng)景也有它的難點(diǎn),比如對(duì)精度和效率沒(méi)有容忍度。在 C 端場(chǎng)景中,如果機(jī)器人沒(méi)抓住杯子,可以再試一次;但在工業(yè)場(chǎng)景中,任何錯(cuò)誤和失誤都是不可接受的,精度必須極高,效率也必須算得過(guò)來(lái)。如果執(zhí)行速度太慢,工廠(chǎng)可能寧愿繼續(xù)使用人力,因?yàn)槲覀兊母?jìng)爭(zhēng)對(duì)手始終是人。

因此,我們要做的所有具身智能產(chǎn)品的核心目標(biāo)就是,在工業(yè)現(xiàn)場(chǎng)中做得比人更好,這樣才能讓工廠(chǎng)接受并引入設(shè)備。這也是工業(yè)場(chǎng)景比生活場(chǎng)景更復(fù)雜的地方。

我們?cè)谀承┓矫嫦鄬?duì)容易,比如在目標(biāo)對(duì)象的訓(xùn)練、對(duì)世界模型和環(huán)境的理解上,工業(yè)場(chǎng)景的范圍更小,數(shù)據(jù)集也更小。但困難之處在于,執(zhí)行的操作精度和效率必須極高,因此需要更強(qiáng)的技術(shù)手段來(lái)落地實(shí)現(xiàn)。

兩者在技術(shù)路徑上存在差異,尤其是在落地性上,工業(yè)場(chǎng)景里有一個(gè)大挑戰(zhàn):工廠(chǎng)老板算不過(guò)來(lái)賬,他就不用。AI 產(chǎn)品都是越用越好的,數(shù)據(jù)越來(lái)越多,能力越用越強(qiáng)。如果一開(kāi)始在商業(yè)化模式上算不過(guò)來(lái),可能就變成了一個(gè)「秀場(chǎng)」,大家鼓個(gè)掌,但無(wú)法實(shí)際落地。

然而,一旦可以算得過(guò)來(lái)賬,能夠產(chǎn)生實(shí)際的數(shù)據(jù)和業(yè)務(wù)價(jià)值,它就會(huì)有巨大的市場(chǎng)潛力。因此,這一點(diǎn)是我們需要跨越的。

艾之:總結(jié)起來(lái),核心就是成本、工作效率和任務(wù)執(zhí)行的準(zhǔn)確度,要在這三者之間找到最優(yōu)解。當(dāng)然這個(gè)成本并不是一個(gè)靜態(tài)的標(biāo)價(jià),而是在做所有的技術(shù)方案組合的時(shí)候,要去不斷計(jì)算的。產(chǎn)品上線(xiàn)之后,它至少要和人類(lèi)表現(xiàn)得一樣好,甚至在某些任務(wù)上比人類(lèi)更出色。

有觀(guān)眾問(wèn)到,機(jī)械臂有了智慧后,是否可以降低配套設(shè)備的要求?因?yàn)楫a(chǎn)線(xiàn)上不只是機(jī)械臂,還有很多其他系統(tǒng)設(shè)備。

張志琦:這兩年我們也和很多大型制造集團(tuán)交流過(guò),包括像蘋(píng)果、特斯拉這樣在全球制造領(lǐng)域中相對(duì)走到最前端的技術(shù)部門(mén)。大家過(guò)去看到的生產(chǎn)線(xiàn)可能很壯觀(guān),上百米長(zhǎng),充滿(mǎn)了機(jī)械設(shè)備整齊如一。但最近跟全球的這些客戶(hù)溝通的時(shí)候發(fā)現(xiàn),大家在這兩年的思路有很大變化,探討的其中一個(gè)新話(huà)題是:有沒(méi)有可能在一個(gè)集裝箱大小的空間內(nèi)完成一臺(tái) iPhone 的生產(chǎn)?

艾之 :這是一個(gè)非常大膽的場(chǎng)景設(shè)想。

張志琦:如果能實(shí)現(xiàn)這個(gè)目標(biāo),將會(huì)對(duì)整個(gè)制造行業(yè)產(chǎn)生巨大的影響。過(guò)去我們聽(tīng)過(guò)「黑燈工廠(chǎng)」的概念,但現(xiàn)在都很少提這個(gè)話(huà)題,因?yàn)榇蠹彝蝗婚g發(fā)覺(jué)它生產(chǎn)的東西很有限,它的柔性化程度較低。

黑燈工廠(chǎng):Dark Factory,即智慧工廠(chǎng),因?yàn)閺脑牧系阶罱K成品,所有的加工、運(yùn)輸、檢測(cè)過(guò)程均在空無(wú)一人的「黑燈工廠(chǎng)」內(nèi)完成,無(wú)需人工操作。

現(xiàn)在的問(wèn)題是,能否有一個(gè)工廠(chǎng),生產(chǎn)過(guò)程可以動(dòng)態(tài)調(diào)配?

如果我今天雇了一幫工人來(lái),今天培訓(xùn)什么,他們就能干什么。明天再培訓(xùn)其他內(nèi)容,他們就能生產(chǎn)其他的東西。從這個(gè)角度上說(shuō),人的柔性化程度是最高的。

如果我們把這些思路結(jié)合在一塊的話(huà),你會(huì)發(fā)覺(jué),這樣一來(lái),原來(lái)的自動(dòng)化設(shè)備只能做單一的任務(wù),而未來(lái)應(yīng)該能夠執(zhí)行多項(xiàng)任務(wù),甚至如果下面有一個(gè)抽屜的話(huà),它還能找到不同的工具完成各類(lèi)操作。

這才是「在一個(gè)集裝箱里生產(chǎn)出一臺(tái) iPhone」的核心點(diǎn)。

在集裝箱的這個(gè)范圍內(nèi),只要給到足夠的工具和材料,人也能干,但今天,我們能不能用這類(lèi)的設(shè)備去干?這是我們?cè)诂F(xiàn)在和將來(lái),在智能制造上要去考慮的問(wèn)題。

的確,具身智能設(shè)備的應(yīng)用會(huì)簡(jiǎn)化整個(gè)制造過(guò)程中上下游設(shè)備的要求。因?yàn)槿撕腿酥g能夠直接進(jìn)行溝通和交流,具身智能設(shè)備之間同樣可以通過(guò)更靈活的方式完成各工序的銜接,從而進(jìn)一步簡(jiǎn)化流程。設(shè)想未來(lái)某一天,具身智能機(jī)器人被廣泛應(yīng)用時(shí),只需下發(fā)一個(gè)指令,只要有原材料的,這些設(shè)備就能自動(dòng)化地完成生產(chǎn)任務(wù)。這正是我們對(duì)未來(lái)制造場(chǎng)景的美好愿景。


04

多模態(tài)大模型是智能臂落地關(guān)鍵,

工業(yè)場(chǎng)景不缺數(shù)據(jù)


艾之:微億團(tuán)隊(duì)可能主要負(fù)責(zé)算法部分,讓機(jī)械臂學(xué)習(xí)人類(lèi)的動(dòng)作和任務(wù),其中有哪些關(guān)鍵環(huán)節(jié)?大模型在這一過(guò)程中發(fā)揮了哪些作用?

張志琦:其實(shí),這項(xiàng)技術(shù)能夠真正落地,本質(zhì)上得益于人工智能的進(jìn)步。在過(guò)去的自動(dòng)化領(lǐng)域,實(shí)現(xiàn)這種技術(shù)是不可能的。我們可以簡(jiǎn)單拆解一下這個(gè)過(guò)程。首先,關(guān)鍵在于操作對(duì)象是什么,必須讓機(jī)械臂識(shí)別這個(gè)對(duì)象,讓它能夠操作。第二,有了這個(gè)操作對(duì)象之后,如何完成這個(gè)任務(wù)?在三維空間中,需要去動(dòng)態(tài)規(guī)劃和執(zhí)行。因此,這個(gè)過(guò)程包括感知、認(rèn)知、規(guī)劃、驅(qū)動(dòng)和執(zhí)行,它會(huì)把每個(gè)部分都緊密結(jié)合。

在感知方面,我們會(huì)基于視覺(jué)的能力,以前的機(jī)械臂只能通過(guò)電機(jī)傳感信號(hào)了解自身的位置,而沒(méi)有視覺(jué)能力。但今天我們?yōu)闄C(jī)器人裝上了「眼睛」,它多了視覺(jué)的能力,不僅能感知操作對(duì)象,還能感知到自己和環(huán)境,在感知上我們就必須把三個(gè)感知的能力要融合在一起。

感知完成后,我們需要進(jìn)行認(rèn)知。以前的認(rèn)知過(guò)程非常簡(jiǎn)單,可能就像我們做質(zhì)檢時(shí),認(rèn)知只是在拍攝的圖片上進(jìn)行分析和判別。但現(xiàn)在的認(rèn)知必須結(jié)合三種不同的感知能力,真正理解整件事情。就像我們之前提到的,人類(lèi)以目標(biāo)和任務(wù)為核心,具體是怎么完成某項(xiàng)工作的?我們需要有效地將任務(wù)拆解為子任務(wù),并在執(zhí)行過(guò)程中將這些任務(wù)重新整合在一起。

完成認(rèn)知后,接下來(lái)就是規(guī)劃,需要用什么樣的流程和方式去完成這個(gè)任務(wù),同時(shí)還要和機(jī)械臂更深度結(jié)合,把驅(qū)動(dòng)和執(zhí)行有效地結(jié)合起來(lái)。在驅(qū)動(dòng)和執(zhí)行的過(guò)程中,因?yàn)槲覀冎缹?shí)際操作中可能會(huì)遇到干擾,或者出現(xiàn)異常,需要?jiǎng)討B(tài)地修正和重新規(guī)劃,基于新的感知和認(rèn)知,形成新的規(guī)劃和執(zhí)行。這個(gè)過(guò)程必須嚴(yán)絲合縫地形成高速執(zhí)行的結(jié)果,動(dòng)態(tài)地完成過(guò)程中的規(guī)劃和修正,才能真正實(shí)現(xiàn)任務(wù)的落地執(zhí)行。

這與傳統(tǒng)自動(dòng)化完全不一樣。傳統(tǒng)自動(dòng)化就是通過(guò)編程,按照固定任務(wù)和結(jié)果執(zhí)行。而現(xiàn)在的流程,在各個(gè)環(huán)節(jié)中都需要大量的循環(huán)往復(fù),把感知、認(rèn)知、規(guī)劃、驅(qū)動(dòng)和執(zhí)行緊密結(jié)合,才能真正完成任務(wù)。

因此,如果只從算法側(cè),微億是做不了這件事的,必須與捷勃特,特別是機(jī)械臂的本體之間進(jìn)行深度的整合,才能有效結(jié)合動(dòng)態(tài)規(guī)劃和執(zhí)行,把感知、認(rèn)知與執(zhí)行機(jī)構(gòu)緊密銜接。只有這樣,才能將這些環(huán)節(jié)像人類(lèi)一樣去操作、去落地。

艾之:在具身智能領(lǐng)域,我們都知道可能會(huì)有不同的技術(shù)路徑。有些原本專(zhuān)注于機(jī)器人制造的公司,在解決這一命題時(shí)會(huì)思考,算法如何更好地與機(jī)械本體的控制系統(tǒng)、驅(qū)動(dòng)系統(tǒng)結(jié)合。能否更形象地展開(kāi)一下,算法真正與機(jī)械本體深度融合的難點(diǎn)究竟在哪里?

賀巖:舉個(gè)例子,因?yàn)槲覀兊臄z像頭是安裝在機(jī)械臂上,相當(dāng)于你的「眼睛」一直在移動(dòng)。當(dāng)你看到一幅畫(huà)面時(shí),首先要知道我的眼睛到底在哪里,因?yàn)樗皇枪潭ǖ模莿?dòng)態(tài)的。因此,這需要一個(gè)非常高速的數(shù)據(jù)交互能力,系統(tǒng)能夠獲取攝像頭的當(dāng)前位置,將這兩組數(shù)據(jù)拼起來(lái),才能形成準(zhǔn)確的空間感知,否則就會(huì)出現(xiàn)混亂。

另外,如果系統(tǒng)要規(guī)劃?rùn)C(jī)械臂的運(yùn)動(dòng),機(jī)械臂的物理能力是有上限的。如果速度過(guò)快,電機(jī)會(huì)損壞,所有的物理系統(tǒng)都有極限。我們需要在不超過(guò)物理極限的情況下,盡可能提高機(jī)械臂的效率,這就要求將動(dòng)力學(xué)模型深度集成到這套系統(tǒng)中。這是一個(gè)非常深度的綁定,一般的合作關(guān)系很難打通,我們?cè)谝黄鹁o密合作才實(shí)現(xiàn)了這樣的技術(shù)突破。

艾之:剛才提到的視覺(jué)模塊,它捕捉的是視頻的連續(xù)幀信息,還是靜態(tài)照片信息?

張志琦:其實(shí)我們是從連續(xù)的信息中抽取幀,一幀一幀地抽出來(lái)。

前面我們也談到,工業(yè)現(xiàn)場(chǎng)的第一個(gè)問(wèn)題就是要把賬算清楚。今天許多與人形機(jī)器人相關(guān)的成本,一部分是在執(zhí)行結(jié)構(gòu)上,比如關(guān)節(jié)的成本很高。另一部分是,人形機(jī)器人在感知能力上比較強(qiáng),它們用了大量傳感器,從激光雷達(dá)到 3D 相機(jī),能裝的設(shè)備幾乎都裝上了,保證有足夠的信息量,提升設(shè)備的環(huán)境感知能力。但坦白說(shuō),這些傳感器都是成本。

如果我們把這種模式應(yīng)用到工業(yè)現(xiàn)場(chǎng),問(wèn)題就很難解決,賬是算不過(guò)來(lái)的。所以我們給團(tuán)隊(duì)設(shè)定了一個(gè)預(yù)設(shè)條件——不能使用貴的傳感器,也不能用更貴的技術(shù)來(lái)實(shí)現(xiàn)這些目標(biāo)。

艾之:先把上限卡死。

張志琦:對(duì),我必須設(shè)定一個(gè)上限,在受限的環(huán)境中解決問(wèn)題。這增加了團(tuán)隊(duì)的難度,比如在二維圖像的方案中,我們看到的都是一張張 2D 的照片。如何基于 2D 照片判斷對(duì)象物體的位置、擺放方式、與我們的相對(duì)距離。所有這些都需要將 2D 轉(zhuǎn)換為 3D 的空間信息,而且精度必須非常高。工業(yè)現(xiàn)場(chǎng)不能容忍超過(guò) 1 毫米以上的公差,否則機(jī)械臂就抓不起來(lái),或者無(wú)法正確操作。因此,我們必須在受限的環(huán)境中實(shí)現(xiàn)這些目標(biāo),這是一個(gè)較大的難題。

正是因?yàn)橥瓿闪诉@項(xiàng)工作,具身智能工業(yè)機(jī)器人在成本上才與傳統(tǒng)工業(yè)機(jī)械臂接近。它沒(méi)有增加昂貴的感知設(shè)備,而是依靠算法能力,通過(guò)機(jī)器人的相對(duì)空間位置和視覺(jué)捕捉的對(duì)象物體畫(huà)面,同時(shí)參考對(duì)象物體的 3D CAD 圖紙,完成空間建模,從而進(jìn)行 3D 空間計(jì)算、執(zhí)行。這背后的技術(shù)難度比較高。

就像前面提到,「AI 教母」李飛飛,最近也在做與空間智能相關(guān)的工作,通過(guò)一張 2D 照片就能理解背后的物理關(guān)系。今天,我們?cè)诠I(yè)現(xiàn)場(chǎng)實(shí)現(xiàn)了類(lèi)似的方式,通過(guò)一張或一組連續(xù)的照片,判斷對(duì)象物體與機(jī)器人本體的相對(duì)位置、物理環(huán)境和空間坐標(biāo),完成特定任務(wù)。這是其中比較難的點(diǎn)。

艾之:這個(gè)模型是端側(cè)的小模型,還是多模態(tài)模型?它是由幾個(gè)模型配合完成的嗎?

張志琦:今天具身智能的難點(diǎn)在于它使用了大量不同能力的組合。比如說(shuō)對(duì)象物體的識(shí)別,它涉及 2D 到 3D 的模型能力的轉(zhuǎn)化,但它本質(zhì)上是一個(gè)小模型,難點(diǎn)在于算法精度必須非常高,訓(xùn)練數(shù)據(jù)集也要足夠小,訓(xùn)練時(shí)間要短。

過(guò)去,我們的第一個(gè)版本需要一天的時(shí)間,通過(guò)拍攝幾千張不同位置的照片才能完成空間建模?,F(xiàn)在,我只需要 200 張以?xún)?nèi)的照片,在幾個(gè)小時(shí)內(nèi)就能完成,這在速度上有了極大的提升,但本質(zhì)上仍是一個(gè)參數(shù)級(jí)不高的小模型。

同時(shí),我們也有大模型在背后支持。當(dāng)人類(lèi)操作時(shí),實(shí)際上處理的是一組連續(xù)的視頻,我們通過(guò)大模型技術(shù)來(lái)理解視頻中的語(yǔ)義,從而理解人類(lèi)是如何操作對(duì)象物體的,再將這些操作拆解成不同的任務(wù),進(jìn)行編排和執(zhí)行。這是有大模型在背后支撐的。當(dāng)然,這其中存在錯(cuò)誤的概率,因?yàn)榇蠹叶贾溃竽P驮诔跗谳敵鰰r(shí)會(huì)有不穩(wěn)定性,有時(shí)它學(xué)錯(cuò)了動(dòng)作,還需要我們修正。

本質(zhì)上,這背后是由一個(gè)視頻語(yǔ)義理解的大模型來(lái)落地執(zhí)行。但在每個(gè)子任務(wù)級(jí),它又是由一堆高精度的小模型指揮機(jī)器人完成不同的運(yùn)動(dòng)規(guī)劃任務(wù)的集合,過(guò)程中要去跟機(jī)器人自身運(yùn)動(dòng)的動(dòng)力學(xué)算法打通,確保機(jī)器人在執(zhí)行時(shí)達(dá)到最高效率。所以在這個(gè)過(guò)程中,其實(shí)是融合了大量技術(shù)。

這也是為什么大家覺(jué)得具身智能產(chǎn)品「很難」,難點(diǎn)就在于,它必須將各種技術(shù)捏合在一起,才能完成特定任務(wù)。而且,還得把實(shí)驗(yàn)室級(jí)別的技術(shù)和實(shí)際落地的工程化產(chǎn)品結(jié)合起來(lái),因?yàn)樽罱K落地的還是一個(gè)工程化的產(chǎn)品,要能夠被客戶(hù)使用。這是其中最難的部分。

艾之:感覺(jué)你們絕對(duì)是屬于務(wù)實(shí)派,直接坦誠(chéng)地告訴我們,其實(shí)有些 badcase,不要抱太高的預(yù)期,不過(guò)在精度要求不那么高的場(chǎng)景下,已經(jīng)可以使用了。

你們團(tuán)隊(duì)的研發(fā)風(fēng)格也是,設(shè)定了明確的上限,堅(jiān)守在這個(gè)成本范圍內(nèi)尋求最優(yōu)解,而不是無(wú)限制地投入研發(fā)經(jīng)費(fèi)去追求更好的技術(shù)參數(shù)或零部件。因?yàn)榧幢阃度朐俣?,如果最終算不過(guò)來(lái),也無(wú)法真正投產(chǎn)。

這種務(wù)實(shí)的思維,可能是來(lái)自長(zhǎng)期扎根工業(yè)場(chǎng)景的經(jīng)驗(yàn)。這個(gè)可能也是工業(yè)機(jī)器人出身的團(tuán)隊(duì),或者說(shuō)一直扎根在工業(yè)場(chǎng)景里面的團(tuán)隊(duì)去創(chuàng)新時(shí),可能會(huì)有的一些不同的思維和切入角度。

剛才我們講了大致的實(shí)現(xiàn)路徑,我想請(qǐng)教一下賀巖總,您怎么看待微億和捷勃特的技術(shù)路徑與端到端模型算法的路徑?您對(duì)這些技術(shù)路徑的未來(lái)有怎樣的判斷?

賀巖:首先在端到端路徑上,它必須是在容錯(cuò)率非常高的場(chǎng)景中,可以一步步走向?qū)嵱煤统墒?。而在工業(yè)成熟的場(chǎng)景中,我相信,不得不采用這種,一部分基于訓(xùn)練,一部分基于規(guī)則的拼裝組合的方式。因?yàn)樵蕉嗟穆涞貓?chǎng)景,越多的數(shù)據(jù),就越能推動(dòng)技術(shù)的發(fā)展。因?yàn)槭紫任业迷谝粋€(gè)場(chǎng)景中落地,越落地越有數(shù)據(jù),可能越成熟。

艾之:得先讓這個(gè)飛輪轉(zhuǎn)起來(lái)。

賀巖:對(duì),而且在中國(guó)這樣一個(gè)制造業(yè)強(qiáng)國(guó),我們有大量的數(shù)據(jù)源可以利用。所以只要這些數(shù)據(jù)被有效使用,我們就能逐步走向成熟。最終,這兩條路徑應(yīng)該是殊途同歸的。但先得落地,接觸場(chǎng)景和布局是非常重要的,如果無(wú)法接觸到這些場(chǎng)景,就很難爬上這坡。

艾之:關(guān)于模型的能力。今天大模型能力還在不斷迭代,像 OpenAI 最近發(fā)布了新模型,我們看到了推理和 agent 能力的提升。這種基礎(chǔ)模型的提升,能否在工業(yè)場(chǎng)景中帶來(lái)同等比例的能力提升?

張志琦:是的,今天我們的「創(chuàng)TRON」1.0 在工業(yè)現(xiàn)場(chǎng)能應(yīng)對(duì)的場(chǎng)景還是有限的。我們目前主攻四個(gè)場(chǎng)景:上料下料、裝配、打磨和質(zhì)檢。這些都是制造業(yè)中常見(jiàn)的場(chǎng)景。隨著基礎(chǔ)模型能力的提升,我們可以針對(duì)不同的工業(yè)場(chǎng)景,進(jìn)一步提升能力,提高不同領(lǐng)域中的任務(wù)復(fù)雜度,逐步讓機(jī)器人越來(lái)越像有經(jīng)驗(yàn)的人一樣應(yīng)對(duì)各種場(chǎng)景。

所以從大模型的技術(shù)能力提升上來(lái)說(shuō),工業(yè)現(xiàn)場(chǎng)的場(chǎng)景化應(yīng)用的能力也是會(huì)越來(lái)越豐富的。有時(shí)候大家談到工業(yè)大模型和通用化大模型,很多人覺(jué)得難,因?yàn)闆](méi)有足夠的數(shù)據(jù)。這也是工業(yè) AI 導(dǎo)入速度偏慢的原因之一。但通過(guò)具身智能工業(yè)集成,我們能夠在每個(gè)場(chǎng)景中積累數(shù)據(jù),并通過(guò)機(jī)器人載體有效執(zhí)行和落地,沉淀有價(jià)值的數(shù)據(jù)。

我們經(jīng)常開(kāi)玩笑說(shuō),工業(yè)具身智能機(jī)器人是一個(gè)學(xué)徒,跟著老師傅去學(xué)習(xí),其實(shí)就是把人腦里的知識(shí)倒出來(lái),通過(guò)數(shù)字化載體記錄和儲(chǔ)存下來(lái),以前好工人的經(jīng)驗(yàn)是口口相傳的,而今天是,用一個(gè)有數(shù)字化能力的產(chǎn)品把這部分經(jīng)驗(yàn)和知識(shí)沉淀下來(lái)。

所以,可以暢想一下,雖然目前我們只支持四個(gè)場(chǎng)景,但隨著底層模型能力的提升,我們能夠應(yīng)對(duì)更多復(fù)雜場(chǎng)景,逐漸替代部分人工。

回過(guò)頭來(lái)看,具身智能工業(yè)機(jī)器人的目標(biāo)非常簡(jiǎn)單。如果今天某些地區(qū)有一萬(wàn)名工人,有 500 臺(tái)機(jī)械臂,那我們的目標(biāo)很簡(jiǎn)單,就是希望通過(guò)機(jī)械臂替代這 9500 個(gè)工人,把人從整個(gè)制造的環(huán)節(jié)里完全釋放出來(lái)。

艾之:模型算法每次迭代更新需要多長(zhǎng)時(shí)間?你們有具體數(shù)據(jù)或案例嗎?

張志琦:學(xué)習(xí)上需要花一些時(shí)間,切換上速度是極其快的。

目前,對(duì)于操作對(duì)象物體的處理,基本上是在小時(shí)級(jí)。機(jī)器人學(xué)習(xí)一遍后,基于任務(wù)的復(fù)雜度,也能在小時(shí)級(jí)完成所有模型構(gòu)建。一般在工廠(chǎng)培訓(xùn)新員工也需要花半天時(shí)間,而我們的設(shè)備基本可以在同樣時(shí)間內(nèi)實(shí)現(xiàn)落地。但在執(zhí)行過(guò)程中,設(shè)備的效率一定比人高,一方面執(zhí)行速度更快,另一方面設(shè)備可以 7x24 小時(shí)不間斷工作。一旦學(xué)完一遍,產(chǎn)線(xiàn)的切換就可以在秒級(jí)完成,也就是可以非??斓卦诓煌哪P椭g進(jìn)行有效的轉(zhuǎn)化。


05

以前是人適應(yīng)機(jī)器,

現(xiàn)在是機(jī)器人去理解人


艾之:中國(guó)作為制造業(yè)大國(guó),很多場(chǎng)景下人力成本仍然低于機(jī)器成本。我們現(xiàn)在有個(gè)大前提,就是希望成本盡量可控,讓機(jī)器人順利進(jìn)入生產(chǎn)線(xiàn)。其次,我們需要大量的數(shù)據(jù),不斷完善和提升模型能力。

賀巖總,從您的角度來(lái)看,像「創(chuàng) TRON」這樣的機(jī)器人,或者未來(lái)更先進(jìn)的版本,如何才能順利進(jìn)入生產(chǎn)線(xiàn)?對(duì)于客戶(hù)來(lái)說(shuō),用新的解決方案替代掉老生產(chǎn)線(xiàn)上的方案,他們的核心動(dòng)力是什么?如何讓他們更愿意接受這些新方案?這些客戶(hù)肯定是非常精打細(xì)算、成本敏感的,怎么讓他們?cè)敢庾龀鲞@種切換?

賀巖:對(duì)于成熟的生產(chǎn)線(xiàn),如果沒(méi)有升級(jí)的需求,它們可能會(huì)繼續(xù)使用傳統(tǒng)方法。問(wèn)題在于,很多工廠(chǎng)和企業(yè)主想用機(jī)器人,但用不起來(lái)。這限制了工業(yè)機(jī)器人適用的范圍。

「創(chuàng)TRON」的出現(xiàn)解決了幾個(gè)問(wèn)題。首先,自動(dòng)化設(shè)備,對(duì)上下料的要求不高。其次,我不需要招有學(xué)歷、有資質(zhì)的專(zhuān)業(yè)人員來(lái)實(shí)施這套系統(tǒng),這對(duì)企業(yè)來(lái)說(shuō)是一個(gè)巨大的優(yōu)勢(shì)?,F(xiàn)在工業(yè)機(jī)器人替代工人的滲透率還很低,比如 1 萬(wàn)名工人中只有五六百臺(tái)機(jī)器人,這是因?yàn)楹芏鄨?chǎng)景上,工業(yè)機(jī)器人根本就用不起來(lái)。

我相信,現(xiàn)在使用工業(yè)機(jī)器人的那些成熟生產(chǎn)線(xiàn)會(huì)繼續(xù)存在下去,但「創(chuàng)TRON」的目標(biāo)市場(chǎng)是那些剩下的 9000 多個(gè)崗位。它能夠真正解決的是想用但是沒(méi)法用的企業(yè)主的問(wèn)題。

張志琦:我再補(bǔ)充一下,坦白講,機(jī)器人市場(chǎng)每年的增長(zhǎng)幅度其實(shí)有限。

近年來(lái)協(xié)作機(jī)械臂的興起,替代了一些傳統(tǒng)工業(yè)機(jī)械臂的場(chǎng)景,但協(xié)作機(jī)械臂的應(yīng)用量仍然有限。以前它解決的最核心問(wèn)題是安全性問(wèn)題,比如在人和設(shè)備共處時(shí),設(shè)備碰到人會(huì)自動(dòng)停下來(lái),避免傷害。盡管協(xié)作機(jī)械臂在一些生活場(chǎng)景中應(yīng)用增加,但整體市場(chǎng)的增長(zhǎng)量每年也就 20% 左右,這里面協(xié)作機(jī)械臂的量甚至蠶食了部分工業(yè)機(jī)械臂的市場(chǎng)份額。

這也明確地回應(yīng)到剛才賀巖總提到的話(huà)題,今天其實(shí)仍然是一個(gè)傳統(tǒng)市場(chǎng),為什么增長(zhǎng)幅度沒(méi)有那么的快?就是因?yàn)樘嗟膱?chǎng)景,不是今天的工業(yè)機(jī)器人或者工業(yè)機(jī)器人加上傳統(tǒng)的協(xié)作機(jī)器人能夠去覆蓋的場(chǎng)景,還是需要依靠人力去做。

而我們的「創(chuàng) TRON」這一類(lèi)產(chǎn)品,一方面是能夠比傳統(tǒng)機(jī)器人在使用上更加簡(jiǎn)潔。我們真正的目標(biāo)市場(chǎng)是那些無(wú)法靠工業(yè)機(jī)器人或協(xié)作機(jī)器人解決問(wèn)題的市場(chǎng),因?yàn)檫@些場(chǎng)景需要靈活性和應(yīng)對(duì)多種變化,而傳統(tǒng)工業(yè)機(jī)器人對(duì)此無(wú)能為力。但今天,我們有機(jī)會(huì)依靠具身智能產(chǎn)品,用人類(lèi)的方式來(lái)完成這些任務(wù)。既然這些任務(wù)今天是由人來(lái)做的,我們就有機(jī)會(huì)用這類(lèi)產(chǎn)品替代人力,實(shí)現(xiàn)自動(dòng)化。這才是我們這款產(chǎn)品真正的目標(biāo)市場(chǎng)和用戶(hù)群體。

艾之:確實(shí)有很多場(chǎng)景,大家想用機(jī)器人但覺(jué)得太難,甚至不是成本問(wèn)題,而是技術(shù)能力的鴻溝問(wèn)題,這在過(guò)去這一直是一個(gè)編程和翻譯的難題——如何將工藝翻譯成機(jī)械臂和機(jī)器人能理解的數(shù)字語(yǔ)言?

張志琦:現(xiàn)在很多專(zhuān)業(yè)人員的工作是「幫機(jī)器人理解業(yè)務(wù)和人類(lèi)需求」,而「創(chuàng) TRON」這類(lèi)產(chǎn)品的目標(biāo)是讓機(jī)器去更好地理解人,而不是讓人去適應(yīng)機(jī)器。這是是我們產(chǎn)品的核心點(diǎn)。

艾之:我有個(gè)外行問(wèn)題,現(xiàn)在我們的機(jī)械臂像個(gè)學(xué)徒,去學(xué)習(xí)老師傅的工藝。那么,在工業(yè)制造領(lǐng)域,工藝的數(shù)字化水平大概是什么樣的?

賀巖:工藝是生產(chǎn)某個(gè)產(chǎn)品時(shí)專(zhuān)業(yè)的 know-how,關(guān)于「我怎么把這件事情做好」。

未來(lái)的生產(chǎn)應(yīng)該是,機(jī)器人的使用者只需要知道如何生產(chǎn)出好的產(chǎn)品,只需要知道自己怎么把這個(gè)東西做好,然后能夠通過(guò)自己的專(zhuān)業(yè)語(yǔ)言讓機(jī)器人聽(tīng)懂就可以了,而不需要懂得機(jī)器人的專(zhuān)業(yè)知識(shí)。這是「創(chuàng)TRON」的目標(biāo)。

張志琦:對(duì),其實(shí)這也涉及到另一個(gè)話(huà)題。

機(jī)器人市場(chǎng)發(fā)展了幾十年,很多海外頭部的機(jī)器人廠(chǎng)商已經(jīng)在不同的場(chǎng)景中已經(jīng)積累了大量經(jīng)驗(yàn),這些經(jīng)驗(yàn)逐漸成為他們另一個(gè)最核心的盈利產(chǎn)品,就是所謂的工藝包或 SDK 庫(kù)。比如說(shuō)在焊接或涂膠等領(lǐng)域,他們有很多這樣的庫(kù),能夠幫助專(zhuān)業(yè)人員更好地翻譯業(yè)務(wù)上的訴求和需求,同時(shí)能夠在機(jī)器人運(yùn)動(dòng)控制和操作對(duì)象方面快速適應(yīng)。然而,回到國(guó)內(nèi)來(lái)看,許多汽車(chē)廠(chǎng)商在這方面的積累相對(duì)有限。

為什么積累有限?首先,起點(diǎn)不同,國(guó)外廠(chǎng)商發(fā)展了幾十年,而國(guó)內(nèi)很多廠(chǎng)商相對(duì)年輕。其次,這與市場(chǎng)原則有關(guān)。因?yàn)楣に嚢举|(zhì)上是一個(gè)軟件包,軟件包的成本是很低的。今天,國(guó)外的機(jī)器人在硬件上已經(jīng)被國(guó)內(nèi)廠(chǎng)商卷到掙不到什么錢(qián)的程度了,但在這一部分軟件包上,還是保持了很大的利潤(rùn)。而在國(guó)內(nèi),機(jī)器人工程師和集成商的人工成本還相對(duì)偏低,因此集成商往往不會(huì)購(gòu)買(mǎi)國(guó)外的 SDK 庫(kù)和工藝包,而是手動(dòng)調(diào)試,調(diào)整到能基本滿(mǎn)足需求的程度就可以了。但這樣做的柔性化程度會(huì)變得更低,機(jī)器人廠(chǎng)商也難以在這一領(lǐng)域積累經(jīng)驗(yàn)。因此,這就是為什么在這類(lèi)工藝包上的數(shù)據(jù)積累較少。

同時(shí),國(guó)內(nèi)還有沒(méi)有機(jī)會(huì)解決這個(gè)問(wèn)題呢?這也是一個(gè)「先有雞還是先有蛋」的問(wèn)題。

可能一部分有支付能力的廠(chǎng)商不加思考地就選擇了國(guó)外的機(jī)器人和工藝包,能夠把這類(lèi)場(chǎng)景覆蓋掉,這樣就沒(méi)有國(guó)產(chǎn)機(jī)器人的事了。但國(guó)產(chǎn)機(jī)器人廠(chǎng)商又因?yàn)榧缮痰氖謩?dòng)調(diào)試,無(wú)法積累數(shù)據(jù),這就導(dǎo)致國(guó)產(chǎn)廠(chǎng)商難以在這方面進(jìn)一步提升能力。

但是,像「創(chuàng) TRON」這樣的產(chǎn)品恰恰解決了這個(gè)問(wèn)題,因?yàn)樗軌蛟跀?shù)據(jù)能力上不斷積累,去對(duì)于生產(chǎn)中間的所有的過(guò)程數(shù)據(jù),不管是 good case 還是 bad case,它都可以有效記錄,不斷提升模型能力。

因此,以前想在這些場(chǎng)景中「彎道超車(chē)」其實(shí)是不太可能的。而今天通過(guò) AI 技術(shù),我們實(shí)際上是換了條道。依靠具身智能產(chǎn)品,我們有機(jī)會(huì)去實(shí)現(xiàn)這個(gè)目標(biāo)。

艾之:確實(shí),大模型技術(shù)讓我們看到了另一種可能性,就像從另一個(gè)坡爬上去,可能可以把中間的四五步并作兩三步,直接達(dá)到同樣的目標(biāo)。因?yàn)橄窆I(yè) 4.0、柔性制造這些概念,已經(jīng)喊了很多年了,本身是從國(guó)外興起的。


06

我們既不怕被抄,

也歡迎大家來(lái)抄


艾之:從整個(gè)國(guó)外的產(chǎn)業(yè)基礎(chǔ)來(lái)看,他們的數(shù)字化和信息化積累還是非常扎實(shí)的。不過(guò),可能他們也存在原有的路徑依賴(lài),比如你們?cè)诠I(yè)博覽會(huì)上展示機(jī)械臂的時(shí)候,我聽(tīng)說(shuō)「四大家族」也都在。能不能給我們分享一下傳統(tǒng)工業(yè)機(jī)器人「四大家族」的最新嘗試?我們?cè)谌蚍秶鷥?nèi)的競(jìng)爭(zhēng)力現(xiàn)在處于什么樣的水平?

注:傳統(tǒng)工業(yè)機(jī)器人領(lǐng)域的「四大家族」指的是瑞士的 ABB、德國(guó)的 KUKA、日本的 FANUC(發(fā)那科)和安川電機(jī)(Yaskawa)。

賀巖:我們的展臺(tái)在「四大家族」展區(qū)的中心位置,因此我們也觀(guān)察了一圈。老實(shí)說(shuō),我們沒(méi)有看到像「創(chuàng) TRON」這樣的創(chuàng)新產(chǎn)品,至少在展會(huì)上沒(méi)有看到特別亮眼的具身智能技術(shù)。

張志琦:其實(shí)看完之后我們更加有信心了,哈哈。應(yīng)該這樣說(shuō),「四大家族」確實(shí)有很大的包袱。

艾之:對(duì),這就是我剛才提到的路徑依賴(lài)問(wèn)題,之前他們的基礎(chǔ)太扎實(shí)了。

張志琦:坦白講,很多時(shí)候這種路徑依賴(lài)會(huì)抑制創(chuàng)新能力。所以今年看到的四大家族,還是在機(jī)器人的底層技術(shù)上不斷精進(jìn),比如運(yùn)動(dòng)控制和系統(tǒng)控制。機(jī)器人已經(jīng)發(fā)展了幾十年,這些方面能提升的空間是有限的。但反觀(guān)國(guó)產(chǎn)機(jī)器人的展館就熱鬧得多,各種類(lèi)型的機(jī)器人都有,比如幫人按摩、針灸、沖咖啡的,各種各樣的展示非常豐富。

艾之:是的,沖咖啡的都是入門(mén)基礎(chǔ)款。

張志琦:對(duì),現(xiàn)場(chǎng)很熱鬧。我們也看到一些廠(chǎng)商放的視頻,展示的功能和我們的「創(chuàng)TRON」有些接近,向大家展示大模型如何與機(jī)器人技術(shù)結(jié)合。但坦白說(shuō),在實(shí)際操作上,還沒(méi)有誰(shuí)敢真正搬一臺(tái)設(shè)備到現(xiàn)場(chǎng),和大家互動(dòng)演示。這一點(diǎn)其實(shí)很有意思。我們的展臺(tái)上有很多友商,氣氛也很熱鬧。國(guó)外的機(jī)器人廠(chǎng)商和國(guó)內(nèi)的同行都來(lái)看,大家對(duì)我們的設(shè)備評(píng)價(jià)都很高。

艾之:剛才提到另辟蹊徑,找到了一些技術(shù)紅利,走了一條創(chuàng)新的路徑。想請(qǐng)教一個(gè)外行問(wèn)題,如果別人想抄我們的技術(shù),好抄嗎?

張志琦:本質(zhì)上來(lái)說(shuō),產(chǎn)品的理念和設(shè)計(jì)并不是別人完全想不到的。今天,「創(chuàng) TRON」這個(gè)產(chǎn)品的技術(shù)分解后,會(huì)發(fā)現(xiàn)其中有很多復(fù)雜問(wèn)題,涉及技術(shù)、工程等一系列難題,必須將這些問(wèn)題整合起來(lái),才能真正落地。

從一家 AI 公司成長(zhǎng)為一家機(jī)器人公司很難,從一家機(jī)器人公司成長(zhǎng)為一家 AI 公司也很難。像「創(chuàng)TRON」這種具身智能產(chǎn)品,必須是硬件與軟件、機(jī)器人與 AI 的深度結(jié)合。今天很多人形機(jī)器人公司動(dòng)輒有 400-500 人的團(tuán)隊(duì),至少需要 200 多人的硬件團(tuán)隊(duì),100 多人的算法和軟件團(tuán)隊(duì),才能逐步將產(chǎn)品做起來(lái)。

如果沒(méi)有這樣的團(tuán)隊(duì)配置,基本上就是缺胳膊少腿,很難做到。我們?cè)谧鼍呱碇悄芄I(yè)集成時(shí),如果沒(méi)有兩家在技術(shù)上的深度合作,這件事幾乎不可能實(shí)現(xiàn)。許多同行在工博會(huì)上看到我們的產(chǎn)品時(shí),都說(shuō)這確實(shí)很難做到。外行可能覺(jué)得機(jī)器人很聰明,但內(nèi)行看門(mén)道,他們能看出我們?cè)诩夹g(shù)上涉及了很多細(xì)節(jié),超越了很多技術(shù)能力已經(jīng)不錯(cuò)的公司。

從我的角度來(lái)說(shuō),我希望「創(chuàng)TRON」這個(gè)產(chǎn)品能以點(diǎn)帶面。首先,它能引導(dǎo)微億和捷勃特的產(chǎn)品更好地向具身智能方向發(fā)展。其次,我也希望同行能看到這個(gè)產(chǎn)品的價(jià)值,進(jìn)入這個(gè)賽道。工業(yè)賽道的天花板非常高,不僅是微億和捷勃特兩家公司能夠完成的。雖然門(mén)檻高,但如果大家一起努力前行,整個(gè)中國(guó)的制造業(yè)就有機(jī)會(huì)登上珠穆朗瑪峰。無(wú)論我們是從北坡攀登,還是友商從南坡攀登,或者我們?yōu)楹髞?lái)的公司踩出了一些腳印,讓他們能夠更快前進(jìn),對(duì)整個(gè)中國(guó)制造業(yè)登頂珠峰都有幫助。所以我們既不怕被抄,也歡迎大家來(lái)抄。

艾之:先把蛋糕做大再說(shuō),對(duì)吧?

賀巖:對(duì),我從另一個(gè)角度稍微補(bǔ)充一下。

我們剛才說(shuō)的門(mén)檻,首先是微億智造和捷勃特在工業(yè)場(chǎng)景中的深厚積累和理解。我們要做具身人工智能,但客戶(hù)到底需要什么,這需要我們?cè)谛袠I(yè)里深耕多年積累的經(jīng)驗(yàn)。第二,是微億團(tuán)隊(duì)對(duì) AI 技術(shù)的強(qiáng)大把控能力。

再有,捷勃特機(jī)器人的自研率非常高。所以當(dāng)微億智造問(wèn)能否實(shí)現(xiàn)某個(gè)功能時(shí),我們都能做到,因?yàn)樗械募夹g(shù)都是自主研發(fā)的。

還有一點(diǎn)非常重要,就是雙方之間深厚的互信。我把我的技術(shù)開(kāi)放給你,你也開(kāi)放給我,這都建立在彼此深層的信任基礎(chǔ)上。

所以,這幾方面都是很高的門(mén)檻。

艾之:未來(lái)你們的產(chǎn)品和技術(shù)路線(xiàn)上,可能會(huì)帶來(lái)什么樣的機(jī)械臂或具身智能工業(yè)機(jī)器人?

賀巖:首先我們要把「創(chuàng) TRON」這款產(chǎn)品真正落地。因?yàn)閺某晒β屎托实慕嵌瓤矗x「為客戶(hù)創(chuàng)造價(jià)值」,我們還有很多事可以做,如果能夠把這個(gè)事情做到更好,本身就是一件偉大、蠻有挑戰(zhàn)的事。從產(chǎn)品展示到找到種子客戶(hù),再到讓客戶(hù)真正意識(shí)到這款產(chǎn)品的價(jià)值,這中間還有一段路要走,希望能踏實(shí)地把這條路走好,走穩(wěn)。

艾之:先讓更多的工廠(chǎng)和生產(chǎn)線(xiàn)用起來(lái),這是關(guān)鍵。

張志琦:對(duì)的,其實(shí)按照我們和捷勃特的時(shí)間規(guī)劃,明年上半年我們計(jì)劃完成產(chǎn)品的小批量生產(chǎn),下半年會(huì)完成大批量生產(chǎn)。就像賀巖總說(shuō)的,產(chǎn)品工程化過(guò)程中還有很多工作要快速落地和實(shí)現(xiàn)。同時(shí)我們的第一批種子客戶(hù)已經(jīng)逐步開(kāi)始導(dǎo)入這些設(shè)備,完成第一期項(xiàng)目的落地。我們也希望在這批項(xiàng)目中盡快看到成果,為更多同行業(yè)甚至跨行業(yè)的客戶(hù)提供一個(gè)良好的基礎(chǔ)。

賀巖:從長(zhǎng)遠(yuǎn)來(lái)看,未來(lái)我們可能會(huì)結(jié)合力學(xué)和觸覺(jué),現(xiàn)在我們已經(jīng)結(jié)合了視覺(jué),接下來(lái)還會(huì)賦予機(jī)器人更多像人一樣的感覺(jué)——有眼睛、有大腦、再加上重量感。未來(lái)還有很多事情可以做。


(文章轉(zhuǎn)載自Founder Park)