去年起,全球掀起以大模型為代表的生成式人工智能行業(yè)浪潮,人工智能邁向全面應(yīng)用新階段。國外以O(shè)penAI、微軟為代表,谷歌、Meta等巨頭一個(gè)不落,國內(nèi)頭部科技企業(yè)則悉數(shù)入場。
近日,國家數(shù)據(jù)局局長劉烈宏表示,中國10億參數(shù)規(guī)模以上的大模型數(shù)量已超100個(gè),行業(yè)大模型深度賦能電子信息、醫(yī)療、交通等領(lǐng)域,形成上百種應(yīng)用模式,賦能千行百業(yè)。
大模型技術(shù)日新月異,產(chǎn)業(yè)化腳步追星趕月。在這個(gè)熱鬧夾雜爭議的行業(yè),不同的技術(shù)路線和選擇正在延展開來。
360集團(tuán)董事長周鴻祎在關(guān)于2024大模型發(fā)展的十大趨勢判斷中明確表示,多模態(tài)將成為大模型標(biāo)配。未來,大模型不僅能聽會說,還能看懂圖片和視頻,更能識別理解。
中國科學(xué)院自動化研究所研究員劉靜在《GPT-4對多模態(tài)大模型在多模態(tài)理解、生成、交互上的啟發(fā)》一文中談到,模態(tài)是指表達(dá)或感知事物的方式,例如人類的聽覺、視覺、觸覺等。在人工智能領(lǐng)域,多模態(tài)是指利用多種模態(tài)的信息來進(jìn)行感知和理解。米樂 M6多模態(tài)技術(shù)可以讓機(jī)器同時(shí)接收并處理不同模態(tài)信息,如文本、圖像、音頻等,從而提高機(jī)器感知和理解能力。
劉靜進(jìn)一步解釋,相比傳統(tǒng)的單模態(tài)大模型,多模態(tài)大模型更加符合人類的多渠道認(rèn)知方式。它能將不同模態(tài)信息相互補(bǔ)充,提高信息的完整性和準(zhǔn)確性,從而更好地應(yīng)對復(fù)雜環(huán)境、場景和任務(wù)。如在語音識別中,多模態(tài)大模型可以結(jié)合語音和文本信息,讓機(jī)器更準(zhǔn)確地識別和理解語音內(nèi)容。在圖像識別中,圖像和文本信息的結(jié)合可以讓機(jī)器更深入地理解圖像內(nèi)容。
劉靜介紹,落實(shí)到應(yīng)用層面,多模態(tài)能使機(jī)器更好地理解人類的意圖和需求,提供精準(zhǔn)、個(gè)性化服務(wù)。例如,在目前智能技術(shù)已經(jīng)深入落地的客服領(lǐng)域,多模態(tài)大模型可以根據(jù)用戶的文本和語音信息,綜合理解用戶問題并提供解決方案。在智能家居領(lǐng)域,多模態(tài)大模型通過與智能家居設(shè)備的交互,可以根據(jù)用戶需求智能調(diào)整家居環(huán)境。在醫(yī)療領(lǐng)域,多模態(tài)大模型則可以融合醫(yī)學(xué)圖像、病歷文本等信息,輔助醫(yī)生進(jìn)行疾病診斷、制定治療方案。
結(jié)合國內(nèi)大模型產(chǎn)業(yè)布局,多模態(tài)大模型是近年主流廠商普遍選擇的發(fā)力方向。如“紫東太初”2.0全模態(tài)大模型可實(shí)現(xiàn)文本、圖片、語音、視頻、3D點(diǎn)云、傳感信號等不同模態(tài)的統(tǒng)一表征和學(xué)習(xí)。
為提升大模型性能、增進(jìn)用戶體驗(yàn),大模型正以肉眼可見的速度越來越“大”。開源模型的參數(shù)從幾百億增加到幾千億,閉源模型也在沿著尺度定律路徑不斷升級,在千億參數(shù)的基礎(chǔ)上向著萬億參數(shù)攀登。但與此同時(shí),人工智能產(chǎn)業(yè)算力吃緊,難以滿足大模型參數(shù)規(guī)模的指數(shù)級增長。
為加速大模型落地應(yīng)用,人工智能領(lǐng)域正嘗試對大模型進(jìn)行輕量化,通過打造更小型、更高效、成本更低的模型吸引行業(yè)客戶,讓模型在更廣泛的場景有更高應(yīng)用價(jià)值。
大模型輕量化通過降低模型的計(jì)算復(fù)雜度和內(nèi)存占用,實(shí)現(xiàn)模型性能與資源消耗的平衡。這不僅有助于提高計(jì)算效率,降低運(yùn)行時(shí)資源消耗,還可以減輕計(jì)算系統(tǒng)的硬件和軟件壓力,提高系統(tǒng)的可靠性和穩(wěn)定性。此外,輕量化還有助于提高模型部署的靈活性和可擴(kuò)展性,為模型在各種場景下的應(yīng)用提供更多可能性。
輕量化主要通過模型壓縮來實(shí)現(xiàn)。模型壓縮是指在不降低模型性能的前提下,減小模型的計(jì)算復(fù)雜度和內(nèi)存占用。模型壓縮的方法有很多,剪枝、低秩分解等是業(yè)界常用的方法。具體來看,剪枝是指刪除一些不必要或冗余的參數(shù),低秩分解是指將高維數(shù)據(jù)或高維模型分解為低維數(shù)據(jù)或低維模型。這些方法都是通過降低模型的復(fù)雜度,減少參數(shù)和計(jì)算量,來達(dá)到讓模型“更輕”的目的。
輕量化不僅有助于提高計(jì)算效率,降低運(yùn)行時(shí)資源消耗,還可以減輕計(jì)算系統(tǒng)的硬件和軟件壓力,提高系統(tǒng)的可靠性和穩(wěn)定性。
對于通用大模型服務(wù)垂直領(lǐng)域、行業(yè)大模型落地應(yīng)用來說,輕量化更是關(guān)鍵步驟——通過合理的數(shù)據(jù)準(zhǔn)備、模型選擇、超參數(shù)設(shè)置和訓(xùn)練驗(yàn)證過程,可以使模型更好地適應(yīng)特定領(lǐng)域,提高模型性能。
聯(lián)想集團(tuán)副總裁、聯(lián)想研究院技術(shù)戰(zhàn)略與創(chuàng)新平臺總經(jīng)理王茜鶯曾表示,用好大模型主要有三個(gè)要素,第一是場景化,第二是隱私化,第三是輕量化。輕量化不僅是將個(gè)人大模型進(jìn)行壓縮并部署到用戶設(shè)備上,還包括企業(yè)內(nèi)部的輕量化,甚至云端的輕量化。輕量化意味著使用成本的降低。
去年以來,大模型正逐步走向“智能終端側(cè)”,國內(nèi)外一些廠商紛紛宣布加速推進(jìn)大模型在移動終端的部署。端側(cè)大模型,正成為行業(yè)熱詞。
所謂端側(cè),是指模型服務(wù)不部署在云端,而直接存儲在終端內(nèi)部的芯片中,利用芯片算力生成結(jié)果。這樣的大模型服務(wù)不需要聯(lián)網(wǎng),數(shù)據(jù)也不需要被上傳到云端。
相比于云端大模型,端側(cè)大模型的優(yōu)勢主要在于:無需云端處理信息,安全隱私性更好;不消耗云成本,高頻使用下的成本更可控;弱網(wǎng)和無網(wǎng)環(huán)境下也可以使用,用戶無需擔(dān)心云端服務(wù)器宕機(jī),交互體驗(yàn)更穩(wěn)定。
中國工程院院士鄔賀銓表示,通過模型壓縮和定制人工智能芯片提升算力,將具有百億參數(shù)大模型的推理能力嵌入手機(jī),可以提供低成本、低時(shí)延、高安全的智能助手服務(wù)。
相比ChatGPT、Midjourney等人工智能應(yīng)用依賴云端服務(wù)器提供服務(wù),端側(cè)大模型主打在本地實(shí)現(xiàn)智能化。甚至有廠商提出,讓每個(gè)人在手機(jī)上都擁有“個(gè)人大模型”。
目前,在中國手機(jī)市場份額排名前五的企業(yè)中,除了蘋果公司,其余均已發(fā)布自有端側(cè)大模型產(chǎn)品。手機(jī)廠商提出的包括通話記錄自動生成、人工智能圖像處理等應(yīng)用場景,日漸成為消費(fèi)者的日常。
端側(cè)大模型同樣是個(gè)人電腦產(chǎn)品發(fā)布時(shí)的高頻詞。在相關(guān)宣傳中,端側(cè)大模型不僅能夠提升日常使用及辦公效率,還是保護(hù)隱私和數(shù)據(jù)安全的最優(yōu)解。
艾媒咨詢CEO兼首席分析師張毅表示,人工智能可能成為今年度的手機(jī)新賣點(diǎn),尤其是手機(jī)的社交價(jià)值功能呈現(xiàn)方面,將有更多故事可講。對于手機(jī)廠商而言,大模型是公認(rèn)的未來發(fā)展賽道和方向。盡管現(xiàn)在人工智能在智能手機(jī)終端的應(yīng)用仍較為初級,但未來的普及和推廣仍值得期待。
不過,現(xiàn)有技術(shù)條件下,要做好端側(cè)大模型并不容易。目前條件下,手機(jī)性能遠(yuǎn)遠(yuǎn)不足以支撐大模型運(yùn)行。對于大模型來說,參數(shù)量是模型能力的直觀體現(xiàn),如今云端大模型的參數(shù)量均在千億級別,而手機(jī)端最高參數(shù)規(guī)模則不過百億。
聯(lián)想集團(tuán)董事長兼CEO楊元慶認(rèn)為,未來十年是人工智能的十年,人工智能將改造所有業(yè)務(wù)。將來人人都會有自己的智能體,后者通過交互學(xué)習(xí)越來越懂用戶,最終成為每個(gè)人的“人工智能雙胞胎”。
但他也不諱言市場的不確定性。在他看來,內(nèi)置個(gè)人智能體需要更高配置,如果這些對用戶不是剛需,可能就不需要這么高配置。
國際數(shù)據(jù)公司認(rèn)為,未來人工智能終端將在創(chuàng)作與創(chuàng)意、游戲和虛擬世界、語音合成與轉(zhuǎn)換、視覺和圖像處理、聊天機(jī)器人等十大領(lǐng)域廣泛落地發(fā)展。(記者 崔 爽)
賦能未來,共創(chuàng)數(shù)智化新紀(jì)元:中國信息協(xié)會集團(tuán)企業(yè)數(shù)字化工作委員會正式成立
電話:13644723777
傳 真:+86-173-4169
手 機(jī):13644723777
郵 箱:mile@nmgdp.net
地 址:內(nèi)蒙古包頭市昆區(qū)昆工路光彩商業(yè)街99號