米樂M6 M6米樂M6 米樂M6 米樂2022年11月30日,ChatGPT發(fā)布,全世界對這一全新AI技術(shù)充滿好奇的人,開始闖入ChatGPT世界。
即允許ChatGPT將我們與它對話過程中產(chǎn)生的數(shù)據(jù),用于它自己今后的模型優(yōu)化過程中。
或許你會覺得這沒什么所謂,畢竟在互聯(lián)網(wǎng)世界里,我們已經(jīng)習(xí)慣了交出數(shù)據(jù),換取服務(wù)。
然而,相較于之前基于關(guān)鍵詞匹配的互聯(lián)網(wǎng)搜索技術(shù),基于語料庫生成式的大模型技術(shù)天然擁有更高的“智慧”,這當(dāng)然也包括在構(gòu)建用戶畫像上。
在大模型收集到一個人足夠多的個人數(shù)據(jù)后,當(dāng)一位黑客提示大模型為這個人作出用戶畫像時,它甚至可以寫出一本,詳細(xì)地描繪出這個人所有的靜態(tài)和動態(tài)信息。
實際上,這并不是玩笑,在一些西方機構(gòu)中,不少人已經(jīng)開始通過這類技術(shù),分析初創(chuàng)公司的創(chuàng)始團隊,以評估相應(yīng)的項目是否值得。
2023年9月7日,美國《時代》周刊首次發(fā)布了全球百大AI人物(TIME100 AI),這將人工智能和大模型在全球關(guān)注度再次推向高潮。
而早在今年1月,美國另一本頗具影響力的商業(yè)雜志《財富》,更是旗幟鮮明地指出,大模型是人工智能的iPhone時刻。
知識圖譜是過去十幾年構(gòu)建人工智能推理能力、認(rèn)知能力的基礎(chǔ),也是傳統(tǒng)人工智能技術(shù)的重要范式。
在國內(nèi),復(fù)旦大學(xué)肖仰華教授是最早從事知識圖譜研究的人工智能專家之一,他指出:
知識圖譜是一種符號化的專業(yè)知識表達(dá),大模型則是一種參數(shù)化的通用知識容器。
「常識」能力是人類定義的,也是人類擅長的一種經(jīng)驗知識,以往的人工智能并不擅長處理「常識」問題,他們遇到「常識」問題,往往會變“笨”。
如果你在爐子里放入木頭,然后再把引火物扔到爐子里,一般來說,你是在做什么?
答案顯然是你要在爐子里點火,現(xiàn)在的ChatGPT已經(jīng)能夠很好地給出答案,甚至給出詳細(xì)的解釋。
然而,就在三年前,紐約大學(xué)心理學(xué)教授Gary Marcus(曾是Uber人工智能實驗室負(fù)責(zé)人)也曾向當(dāng)時還很不成熟的GPT-2問過同樣的問題,GPT-2給出的答案是:嘔吐。
所以,在大模型出現(xiàn)之前,人工智能領(lǐng)域普遍流傳著這樣一個似玩笑又非玩笑的尷尬自嘲:
正如機器人的終極形態(tài)是擁有雙手、雙腳,可以在人類定義的世界里執(zhí)行任務(wù)的人形機器人一樣,需要在人類世界里運轉(zhuǎn)的人工智能系統(tǒng),同樣需要有仿人的大腦。
在過往十幾年,甚至幾十年里,人工智能科學(xué)家都在思考如何模仿人類的神經(jīng)系統(tǒng),雖然因此在CNN、RNN等神經(jīng)網(wǎng)絡(luò)上取得了不少突破,但卻長期困于「常識」的漩渦。
現(xiàn)在的大模型其實做了另外一件事兒,另外一件模仿人類成長過程知識體系形成過程的事兒:
通過大量數(shù)據(jù)和參數(shù),花大力氣讓人工智能擁有「基礎(chǔ)認(rèn)知」,而非「專業(yè)知識」。
雖然大部分人類最終沒有成為科學(xué)家,也沒有從事基礎(chǔ)科學(xué)研究,但這些基礎(chǔ)知識讓我們在之后的生活中擁有了「常識」,這為我們從事更具象化的工作打下了基礎(chǔ)。
所以,九年義務(wù)教育或許沒有肉眼可見的實際價值,但它為我們建立了對世界運轉(zhuǎn)規(guī)律的基本認(rèn)知。
里,醫(yī)生在為病人診斷病情時,80%的時間是在排除健康因素,只有20%的情況是需要醫(yī)生干預(yù)并給出診斷方案的。
也就是說,一位醫(yī)生要想做好自己的工作,首先要知道人類身體在健康情況下是一個怎樣的運轉(zhuǎn)狀態(tài),而不僅僅要知道生病時是什么樣。
在大模型出現(xiàn)之前,人工智能專家要想為某個行業(yè)研發(fā)智能化解決方案,首先要把這個行業(yè)中所有數(shù)據(jù)收集起來,從而構(gòu)建一個行業(yè)數(shù)據(jù)驅(qū)動的智能化解決方案。
此前只會下圍棋,但卻轟動了全世界的AlphaGo,就是通過這種模式訓(xùn)練而來。
2015年年底,OpenAI創(chuàng)始人奧特曼帶著一群人工智能領(lǐng)域最聰明的人,用大量資源和萬億級參數(shù),開始訓(xùn)練人工智能看起來不怎么厲害的「常識」理解能力。
這時,AI有了理解傳統(tǒng)人工智能模型學(xué)習(xí)的“大學(xué)課程”背后的“為什么”的基礎(chǔ)。
奧特曼和他的團隊——世界上最聰明的一群人,花了大量的時間和精力做了很多不討巧、其他人不愿意做的事兒。
這才有了大模型,有了2022年年底發(fā)布的ChatGPT,有了人工智能突破認(rèn)知瓶頸的2023。
如非大模型,人工智能很可能會在2023年在資本的失望情緒下,再次進入低潮。
大模型來了,通用人工智能來了,AI和人一樣有了認(rèn)知世界的基礎(chǔ)知識了,是不是就能完美解決所有行業(yè)問題了?
大模型讓人工智能擁有了「常識」的同時,也帶來了一個與生俱來的嚴(yán)重問題是:“幻覺”現(xiàn)象,也就是我們在使用ChatGPT這類大模型過程中,它總是會“胡說八道”。
大模型之所以被稱為生成式AI,是因為它基于訓(xùn)練數(shù)據(jù),有了一定的創(chuàng)造性,這樣的創(chuàng)造性,在具體某一個垂直行業(yè)中,表現(xiàn)為對先驗知識缺乏足夠的“忠誠度”。
如果在醫(yī)療、工業(yè)等行業(yè)領(lǐng)域中,大模型遇到了一個它沒有學(xué)習(xí)到的知識,或者是一個開放性的問題,它發(fā)揮了自己的創(chuàng)造力,由此帶來的后果將難以想象。
在垂直行業(yè)場景中,引入人工智能技術(shù),首先需要它是一個可控、可編輯、可解釋、可防護的模型,這是基于知識圖譜的傳統(tǒng)人工智能模型的特性,也是為什么這類模型會先發(fā)展起來的一個主要原因。
當(dāng)傳統(tǒng)人工智能模型最終遇到瓶頸,人們發(fā)現(xiàn)大模型才是正道時,如何讓“創(chuàng)造力有余,專業(yè)力不足”的大模型擁有進入產(chǎn)業(yè)時所必須的,這些它本不擅長的能力,就成了如今的關(guān)鍵。
肖仰華認(rèn)為,通用大模型向行業(yè)大模型的適配、優(yōu)化,今天才剛剛開始,無論是從數(shù)據(jù)、知識、訓(xùn)練,還是模型架構(gòu)、評估體系、生態(tài)建設(shè)上,我們都還有很長的路要走。
例如,在長文本的理解能力、長短期記憶能力,甚至領(lǐng)域最基本的數(shù)學(xué)量綱、數(shù)量推理上,現(xiàn)在的大模型都還無法很好地做出正確的理解。
不過,我們能看到的是,在大模型發(fā)布還不到一年的時間里,各行各業(yè)都已經(jīng)迫不及待地嘗試將大模型引入各自領(lǐng)域中。
具體在進入垂直領(lǐng)域時,大模型往往會將需要執(zhí)行的任務(wù)分解為三個子任務(wù):提示、生成、評估,當(dāng)下大模型最擅長的,仍然是生成子任務(wù)。
因而,學(xué)術(shù)界和產(chǎn)業(yè)界都在為大模型補課,希望可以通過與數(shù)據(jù)庫、知識圖譜這些相關(guān)技術(shù)的協(xié)同,提升大模型的專業(yè)能力。
大模型欠下的專業(yè)課,都需要再修一遍,這其中,與專業(yè)能力更強的知識圖譜這類技術(shù)進行協(xié)同應(yīng)用,不失為一條不錯的捷徑。
在ChatGPT問世之前,沒有多少人相信大模型,就像云計算在國內(nèi)問世時,不少互聯(lián)網(wǎng)大佬都曾質(zhì)疑過云計算一樣。
甚至在ChatGPT問世不到一年的時間里,各行各業(yè)都展開了對大模型在垂直行業(yè)里的應(yīng)用探索,商業(yè)模式更清晰的行業(yè)大模型也成了一大競爭焦點。
來自全球知名咨詢機構(gòu)麥肯錫的預(yù)測數(shù)據(jù)顯示,生成式AI將為全球帶來至少9萬億美元的經(jīng)濟價值增量。
在這9萬億美元的經(jīng)濟增量中,排在前三的產(chǎn)業(yè)分別是高科技、零售、,預(yù)計產(chǎn)生的經(jīng)濟增量分別為2000億美元-4600億美元之間。
即便是在農(nóng)業(yè)這樣被視為最傳統(tǒng)的產(chǎn)業(yè)中,也將帶來至少400億美元的經(jīng)濟增量。
過去三十年里,全球GDP增長主引擎已經(jīng)由就業(yè)人口轉(zhuǎn)向生產(chǎn)力,而在過去十年里,生產(chǎn)力增速不斷放緩導(dǎo)致了全球經(jīng)濟減速。
他指出,在過去很長一段時間里,自動化始終無法替代的諸如互動、決策類工作,生成式AI帶來了新的替代可能。
此外,作為擅長用數(shù)據(jù)表達(dá)趨勢的咨詢機構(gòu),麥肯錫還給出了生成式AI對自動化的加速量化效果——當(dāng)前半數(shù)工作被自動化取代的時間,相較之前預(yù)測提前了10年。
這意味著,雖然大模型才剛開始從通用大模型轉(zhuǎn)向?qū)S么竽P停竽P蛯裨朴嬎阋粯宇嵏伯a(chǎn)業(yè)。
本文來自微信公眾號“鋅產(chǎn)業(yè)”(ID:xinchanye2021),作者:山竹,36氪經(jīng)授權(quán)發(fā)布。
2023年上半年扣非凈利潤-0.59億元,較上年同期下降170.56%。
電話:13644723777
傳 真:+86-173-4169
手 機:13644723777
郵 箱:mile@nmgdp.net
地 址:內(nèi)蒙古包頭市昆區(qū)昆工路光彩商業(yè)街99號