華為“天才少年”彭志輝(稚暉君)2023年3月成立智元機(jī)器人,1年時(shí)間里獲得5次融資,最高一次獲得了超6億元,比亞迪是方之一,它希望引進(jìn)智元的機(jī)器人革新某些生產(chǎn)工藝;
另一位天才楊植麟是月之暗面的創(chuàng)始人,在今年2月完成10億美元的融資,創(chuàng)下大模型融資新紀(jì)錄,月之暗面推出的Kimi火爆網(wǎng)絡(luò),月活用戶達(dá)到百萬,但楊植麟預(yù)測,大模型更多有價(jià)值的突破會(huì)產(chǎn)生在工業(yè)界;
英偉達(dá)CEO黃仁勛2023年10月以3200萬美元領(lǐng)投了一家機(jī)器人公司,這家公司試圖用機(jī)器人技術(shù)和人工智能的最新進(jìn)展來建造下一代工廠。除了創(chuàng)立了英偉達(dá),黃仁勛還是個(gè)頂級科學(xué)家,今年年初,他當(dāng)選美國工程院院士。
傳統(tǒng)工廠確實(shí)太老了。距離1913年福特發(fā)明流水生產(chǎn)線年;就連雷軍造車引以為豪的“工業(yè)機(jī)械臂”也是在1954年就發(fā)明出來了;馬斯克曾設(shè)想建全自動(dòng)化的超級工廠,但遭遇了產(chǎn)能陷阱,他不得不與自己妥協(xié)。ChatGPT興起,機(jī)器與人的界限被打破,舊有的生產(chǎn)體系滿足不了具身智能的生產(chǎn),它呼喚新的工廠體系。
需求從市場規(guī)模的持續(xù)增長也能窺見一二。據(jù)市場研究機(jī)構(gòu)Mordor Intelligence數(shù)據(jù),2023年全球智能工廠市場規(guī)模估計(jì)約為3231.3億美元,預(yù)計(jì)到2028年將達(dá)到5142.9億美元(約合37204億元人民幣)。
比稚暉君和楊植麟更早,來自香港中文大學(xué)的終身教授賈佳亞更早看到智能制造的未來。賈佳亞是CV(計(jì)算機(jī)視覺)領(lǐng)域的頂級科學(xué)家,2019年從騰訊離開后,賈佳亞成立思謀科技,即“Smart More”的音譯——讓工廠更聰明更智能。
按照賈佳亞的定義,大模型時(shí)代會(huì)誕生相對應(yīng)的工廠生產(chǎn)方式,當(dāng)機(jī)械臂裝上大模型或者擁有智能以后,它能靈活地自適應(yīng),像人一樣思考,而不是如現(xiàn)在般由人工設(shè)置程序、設(shè)置參數(shù)。
“人最后的結(jié)局是從復(fù)雜、危險(xiǎn)、重復(fù)的工作中解脫,退出生產(chǎn)一線,并成為決策一線?!辟Z佳亞在近期接受《中國企業(yè)家》采訪時(shí)說,這是一個(gè)極致的物的世界,人的角色最終會(huì)轉(zhuǎn)向決策與管理者。
那時(shí)候,AI四小龍(商湯科技、曠視科技、依圖科技、云從科技)正在經(jīng)歷最后的余暉,此前,市場上大量資金都投向了它們,它們的視覺技術(shù)用在了安防、消費(fèi)等領(lǐng)域,但都收不回成本,陷入巨額虧損之中。
這讓AI的故事在人面前難以為繼。2019年,國內(nèi)AI企業(yè)的融資金額比2018年下滑了34.8%。
但一些人仍堅(jiān)定支持賈佳亞的創(chuàng)業(yè),他們認(rèn)定,當(dāng)姚明出現(xiàn)的時(shí)候,你不可能不注意到他,賈佳亞就是AI界的高個(gè)子“姚明”——他是一個(gè)頂級科學(xué)家。
2000年,賈佳亞本科畢業(yè)于復(fù)旦大學(xué)計(jì)算機(jī)系,隨后在香港科技大學(xué)獲得計(jì)算機(jī)科學(xué)博士學(xué)位,成為香港中文大學(xué)終身教授。他在香港中文大學(xué)創(chuàng)建的DV Lab(深度視覺實(shí)驗(yàn)室)被認(rèn)為是亞洲在CV和AI領(lǐng)域最領(lǐng)先的實(shí)驗(yàn)室。在這期間,賈佳亞還曾去微軟研究院做訪問學(xué)者,當(dāng)時(shí)的院長是沈向洋。
2017年,賈佳亞加盟騰訊優(yōu)圖實(shí)驗(yàn)室,并當(dāng)選騰訊杰出科學(xué)家,這個(gè)實(shí)驗(yàn)室以視覺技術(shù)見長,它支持了騰訊高清以及無延遲的直播等多項(xiàng)業(yè)務(wù)。
之所以離開騰訊選擇進(jìn)入制造業(yè),是因?yàn)橘Z佳亞相信,人類發(fā)展最根本的主題是如何大規(guī)模地進(jìn)行生產(chǎn),技術(shù)和軟件要靠硬件去承載,去驅(qū)動(dòng)生產(chǎn)和生活,“就如同有個(gè)PC你可以玩游戲,有一個(gè)好的茶具你可以跟人家喝茶,有個(gè)摩托車你可以出去開”。
2019年底,賈佳亞離開騰訊,創(chuàng)立思謀,這是一個(gè)為工廠提供工具的公司,比如用于質(zhì)檢的傳感器,出貨量達(dá)到10萬臺,為3C、芯片、汽車、新能源等國際大廠商供貨,“這個(gè)和傳統(tǒng)人工的肉眼檢測相比,無論是效率還是準(zhǔn)確率,都有百千倍的提高”。
此外,在賈佳亞為各大制造廠商打造的智能工廠里,有各種奇思妙想的智能機(jī)械:比如自動(dòng)擠奶油機(jī)械臂,幫助蛋糕工廠實(shí)現(xiàn)無菌生產(chǎn);一個(gè)噴氣式的機(jī)械臂,能吹起餅干實(shí)現(xiàn)自動(dòng)翻面,幫助食品工廠節(jié)省人力……
這些產(chǎn)品都以軟硬一體的方式供給客戶,這可能是賈佳亞在騰訊學(xué)習(xí)到的“產(chǎn)品”思維——交付給客戶,開箱即用:“以前沒有辦法用機(jī)器替代,我們就找到痛點(diǎn)去做,痛點(diǎn)的解決方案是用AI,而不是純粹的數(shù)字化?!边@是賈佳亞結(jié)合了學(xué)術(shù)和產(chǎn)業(yè)界無數(shù)經(jīng)驗(yàn)后的獨(dú)特思考。
思謀的人真格基金總監(jiān)秦天一說:“市場變化很快,但這里面,最大的不變的點(diǎn)其實(shí)還是最優(yōu)秀的那一批人?!?/p>
科技的宿命永遠(yuǎn)是平衡技術(shù)的先進(jìn)與當(dāng)下的競爭。秦天一說:“當(dāng)你的性能可以吊打別人的時(shí)候,其實(shí)就不存在競爭。”
賈佳亞在18個(gè)月內(nèi)完成了四輪融資,思謀成為當(dāng)時(shí)最快晉級獨(dú)角獸的初創(chuàng)公司,它最后一次宣布融資消息是在2021年6月,獲得了由IDG資本、紅杉中國、聯(lián)想創(chuàng)投等聯(lián)投的2億美元。隨后,這家獨(dú)角獸在融資消息公布上選擇了低調(diào)。
2000年左右,機(jī)器學(xué)習(xí)被很多制造公司應(yīng)用,但隨著深度學(xué)習(xí)的出現(xiàn),以樣本學(xué)習(xí)為核心的機(jī)器學(xué)習(xí)已經(jīng)過時(shí)了。
以手機(jī)喇叭質(zhì)檢傳感器為例,以往機(jī)器學(xué)習(xí)用的方法是,讓機(jī)器首先看完100萬張手機(jī)喇叭的圖,或者學(xué)習(xí)100萬次或者10萬次的聲音才能分辨出,什么樣的是好喇叭,什么樣的是有瑕疵的喇叭。
“但它并不理解這是個(gè)什么東西,它只是理解你給我這個(gè)東西哪里好哪里壞,去做判別?!辟Z佳亞說。
人工智能技術(shù)路徑的發(fā)展是機(jī)器學(xué)習(xí)—深度學(xué)習(xí)—大模型。深度學(xué)習(xí)出現(xiàn)時(shí),賈佳亞團(tuán)隊(duì)是最早一批研究團(tuán)隊(duì)之一。待他2019年離開騰訊并創(chuàng)辦思謀時(shí),所有業(yè)務(wù)的技術(shù)基礎(chǔ)都是在深度學(xué)習(xí)之上開展,然而其時(shí)行業(yè)中依然不少公司和工廠沿用機(jī)器學(xué)習(xí)技術(shù)。
再之后,大模型來了,機(jī)器理解有了突破性進(jìn)展,它從“知其然”走到了“知其為所以然”的地步,智能工廠的爆發(fā)只差臨門一腳。
2022年,思謀科技開始研究大模型,2023年11月,發(fā)布了全球首個(gè)工業(yè)多模態(tài)大模型IndustryGPT,徹底打破工業(yè)領(lǐng)域大模型空白。賈佳亞的目標(biāo),是讓它不斷開發(fā)迭代并成為像人一樣具備思考、學(xué)習(xí)能力的智能體。
大模型技術(shù)提供了機(jī)器的思維以及學(xué)習(xí)能力,但人們在一件事情上爭論不休——究竟機(jī)械臂和機(jī)器人,哪個(gè)是智能工廠的最優(yōu)解?
2017年至2018年,特斯拉的Model 3遇到產(chǎn)能陷阱,馬斯克直接睡在內(nèi)華達(dá)州超級工廠里,親自查看流水線的每個(gè)環(huán)節(jié),在某個(gè)地方,他發(fā)現(xiàn)機(jī)械臂拖延了速度,他直接上手,換掉了機(jī)械臂,結(jié)果效率高多了。
馬斯克做對了一半,它將人視為效率生產(chǎn)的阻礙因素,所以大規(guī)模推行自動(dòng)化,但另一半?yún)s做錯(cuò)了,因?yàn)闄C(jī)械臂那時(shí)還做得不夠好。
自動(dòng)化看起來是個(gè)美妙的詞,但本質(zhì)上,這是一個(gè)高度計(jì)劃的程序,各個(gè)機(jī)械臂的活動(dòng)范圍被精準(zhǔn)到幾毫米,就算是機(jī)器人,它的路線運(yùn)行與活動(dòng)軌跡被嚴(yán)格規(guī)劃。
賈佳亞思考了好幾年,他總結(jié),智能制造重要的一個(gè)指標(biāo)就是靈活性,機(jī)器能自適應(yīng)工廠的各個(gè)流程,以機(jī)械臂抓取玻璃為例,編寫出的程序永遠(yuǎn)不能預(yù)測抓取玻璃該用什么力道,可能千分之一的力道變化,玻璃就碎了。
“人們總是高估硬件科技的發(fā)展,低估軟件的發(fā)展速度,ChatGPT到4.0再到5.0都不稀奇,它都會(huì)呈現(xiàn)出一個(gè)很聰明的狀態(tài),但如果將其放置到機(jī)器人當(dāng)中,那就太稀奇了?!辟Z佳亞表示。
對于機(jī)械臂與人形機(jī)器人的選擇,賈佳亞認(rèn)為是機(jī)械臂,他認(rèn)為,工廠生產(chǎn)最重要的考量是穩(wěn)定,而不是工具的先進(jìn)與否,“機(jī)器人投入沒個(gè)5年不會(huì)看到結(jié)果,不可能家用也不可能量產(chǎn),但機(jī)械臂已經(jīng)大規(guī)模開發(fā)了三四十年”。
更何況一個(gè)新事物進(jìn)入工廠的生產(chǎn)體系,可能要經(jīng)過10年之久,要經(jīng)歷機(jī)器融入、各個(gè)模塊對接以及機(jī)器之間的通訊協(xié)議、工廠各類信息的保密。
這樣一個(gè)場景的幕布在徐徐展開:在一個(gè)沒有光線,沒有人類痕跡與氧氣的廠房里,機(jī)器自主運(yùn)轉(zhuǎn),設(shè)備自主生產(chǎn),這是一個(gè)純粹物的世界。各類應(yīng)用以人或者非人的狀態(tài)存在,它們自由穿梭在各個(gè)產(chǎn)線、流程之間。
M6 米樂
“只有實(shí)現(xiàn)了大規(guī)模、無干預(yù)性的自動(dòng)化生產(chǎn),人類才能夠在社會(huì)的其他層次和領(lǐng)域,慢慢展現(xiàn)出自動(dòng)化性,所以人類家庭里出現(xiàn)這種自動(dòng)化沒有那么快?!辟Z佳亞說。未來的工廠是適應(yīng)機(jī)器生產(chǎn),而不是適應(yīng)人類生活的環(huán)境。
4月中旬,DV Lab發(fā)布了多模態(tài)模型Mini-Gemini,具有相當(dāng)能力的推理和圖片理解。Mini-Gemini提供了2B(20億)到34B(340億)參數(shù)的不同選擇。在多個(gè)指標(biāo)上,與Google Gemini Pro、GPT-4V毫不遜色。目前,Mini-Gemini從代碼、模型到數(shù)據(jù)全部開源了。
賈佳亞希望Mini-Gemini對未來開源大模型社區(qū)發(fā)展發(fā)揮積極推動(dòng)作用。
目前,賈佳亞還擔(dān)任著香港中文大學(xué)的教職,每周還給學(xué)生講課,他領(lǐng)導(dǎo)的DV Lab一半的人研究NLP,試圖讓大模型更聰明,另一半的人研究多模態(tài),也就是視覺、聽覺與大模型的結(jié)合體,大模型變得越來越像一個(gè)智能體。
商湯CEO徐立是賈佳亞的學(xué)生,思謀CEO沈小勇也是賈佳亞的學(xué)生。讀賈佳亞的博士,以能畢業(yè)為最高目標(biāo),原因在于他對學(xué)術(shù)的嚴(yán)苛。他告訴《中國企業(yè)家》,一個(gè)人寫出的論文要以有用為核心,有用才能解決問題,用于實(shí)際,興趣只是附著物。
在微軟研究院做學(xué)者以及香港中文大學(xué)任教時(shí),賈佳亞結(jié)識了前曠視科技首席科學(xué)家孫劍、商湯創(chuàng)始人湯曉鷗,孫劍和湯曉鷗先后在2022年和2023年去世,他還專門發(fā)文悼念,他稱湯曉鷗深刻影響了自己,“要做大的事情,要做頂尖團(tuán)隊(duì)的事情”。
對于賈佳亞、稚暉君、楊植麟來說,在AI上的探索,注定了是一趟孤獨(dú)之旅。楊植麟曾對媒體說,這是一種面對雪山徒步的感覺,技術(shù)未知,路徑未知。
看起來,包括賈佳亞在內(nèi),世界上最聰明的一批人正在踏上制造“聰明與智慧工廠”的冒險(xiǎn),而在這條路上,誰可以成為“福特”或者“瓦特”也許并沒那么重要。米樂 M6
電話:13644723777
傳 真:+86-173-4169
手 機(jī):13644723777
郵 箱:mile@nmgdp.net
地 址:內(nèi)蒙古包頭市昆區(qū)昆工路光彩商業(yè)街99號