隨著大模型技術(shù)的成熟和應(yīng)用的深入,人工智能開始滲透到各行各業(yè),從制造業(yè)自動(dòng)化到服務(wù)業(yè)的個(gè)性化推薦,從醫(yī)療診斷到金融風(fēng)險(xiǎn)管理,AI應(yīng)用正在重塑傳統(tǒng)行業(yè)的面貌。
從現(xiàn)狀來看,大模型技術(shù)成熟度已經(jīng)很高,但產(chǎn)業(yè)應(yīng)用卻面臨著巨大鴻溝。與個(gè)人日常應(yīng)用相比,大模型在企業(yè)生產(chǎn)經(jīng)營中的應(yīng)用要廣泛得多,也復(fù)雜得多。而大模型在產(chǎn)業(yè)特別是企業(yè)中得到大規(guī)模深入推廣,將是大模型真正的星辰大海。
構(gòu)建產(chǎn)業(yè)生態(tài)體系
大模型在現(xiàn)實(shí)復(fù)雜場景中的應(yīng)用,主要難點(diǎn)在于構(gòu)建完整的產(chǎn)業(yè)生態(tài)體系,進(jìn)而打通大模型應(yīng)用的“最后一公里”。
在通用大模型基礎(chǔ)上,個(gè)人大模型和企業(yè)大模型快速得到應(yīng)用落地,行業(yè)大模型也在繼續(xù)發(fā)展,是大模型最有價(jià)值的商業(yè)化方向。現(xiàn)階段,以個(gè)人和企業(yè)為核心的大模型產(chǎn)業(yè)生態(tài)體系正在形成,但行業(yè)大模型發(fā)展面臨諸多挑戰(zhàn)。
目前,個(gè)人大模型的應(yīng)用軟件已經(jīng)如雨后春筍般出現(xiàn),在工作與生活場景中為用戶賦能。隨著大模型能力的增強(qiáng)和算力芯片的發(fā)展,嵌入大模型的個(gè)人AI終端產(chǎn)品也已誕生。個(gè)人大模型落地背后涉及硬件、軟件的技術(shù)革新,將個(gè)人終端產(chǎn)品拉入新的競爭賽道。
個(gè)人大模型的產(chǎn)業(yè)生態(tài)體系主要涉及數(shù)據(jù)供給、技術(shù)基礎(chǔ)設(shè)施供給、模型應(yīng)用、服務(wù)與產(chǎn)品供給、安全與隱私等多個(gè)方面。在模型應(yīng)用方面,個(gè)人大模型還可以提供個(gè)性化推薦、健康檢測、生產(chǎn)力工具等應(yīng)用;基于個(gè)人大模型,還有定制應(yīng)用、智能家居、智能攝像頭等產(chǎn)品服務(wù)。利用個(gè)人大模型,個(gè)人可以在學(xué)習(xí)、工作、生活、娛樂等多個(gè)方面提升體驗(yàn),實(shí)現(xiàn)個(gè)人生活的全方位升級和發(fā)展。
企業(yè)大模型的發(fā)展,為傳統(tǒng)行業(yè)帶來前所未有的轉(zhuǎn)型機(jī)遇。通過深度學(xué)習(xí)和大數(shù)據(jù)分析,企業(yè)能夠更精準(zhǔn)地洞察市場動(dòng)態(tài),優(yōu)化決策過程,提升運(yùn)營效率。在這個(gè)過程中,企業(yè)不僅能夠?qū)崿F(xiàn)成本降低和利潤增長,更能夠通過流程再造和價(jià)值再造,探索全新的商業(yè)模式和增長點(diǎn)。這種由內(nèi)而外的變革,正在重塑企業(yè)的核心競爭力。
企業(yè)大模型的產(chǎn)業(yè)生態(tài)體系,主要包括基礎(chǔ)層、應(yīng)用層和戰(zhàn)略層三大層面。基礎(chǔ)層包括數(shù)據(jù)供給、數(shù)據(jù)訓(xùn)練,以及算力集群、儲存服務(wù)器等硬件和大數(shù)據(jù)平臺、云計(jì)算工具等。
應(yīng)用層主要涉及市場與競爭、投資與財(cái)務(wù)、合作伙伴與生態(tài)系統(tǒng)、研發(fā)與創(chuàng)新、供應(yīng)鏈、用戶與客戶等多個(gè)領(lǐng)域。其中,通過組織戰(zhàn)略合作,可以構(gòu)建以企業(yè)大模型為基礎(chǔ)的生態(tài)系統(tǒng)。
戰(zhàn)略層主要涉及企業(yè)大模型的未來與發(fā)展、學(xué)習(xí)與優(yōu)化、安全與合規(guī)三個(gè)方面。通過規(guī)劃大模型的未來發(fā)展、持續(xù)改進(jìn)模型性能并保證過程安全合規(guī),推動(dòng)企業(yè)大模型的可持續(xù)發(fā)展。
行業(yè)大模型是針對特定行業(yè)領(lǐng)域應(yīng)用的預(yù)訓(xùn)練大模型。目前,制造、金融、醫(yī)療、游戲、法律、交通等行業(yè),均憑借各自獨(dú)特的場景需求,搭建了行業(yè)大模型。這些行業(yè)大模型的意義在于深入理解和滿足行業(yè)的特殊場景,為行業(yè)智能化、高效化發(fā)展提供有力支撐。
未來,隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的拓展,更多行業(yè)將構(gòu)建出符合自身發(fā)展需要的行業(yè)大模型。
然而,行業(yè)大模型的發(fā)展仍面臨著諸多嚴(yán)峻挑戰(zhàn)。
首要問題便是缺乏充足且高質(zhì)量的行業(yè)數(shù)據(jù)庫。對于已經(jīng)構(gòu)建行業(yè)大模型的行業(yè)而言,數(shù)據(jù)庫需要不斷得到補(bǔ)充和完善,以適應(yīng)行業(yè)的快速發(fā)展和變化。對于尚未構(gòu)建行業(yè)大模型的行業(yè),若無企業(yè)牽頭并提供豐富的行業(yè)經(jīng)驗(yàn)和資源,構(gòu)建符合行業(yè)需求的數(shù)據(jù)庫將變得尤為困難。
其次,由于行業(yè)大模型無法給出可靠、可控的輸出,這給那些需要精確、唯一數(shù)據(jù)的生產(chǎn)場景帶來了潛在風(fēng)險(xiǎn)。目前,大模型基于Transformer架構(gòu)尚無法根本解決這一問題,只能通過不斷優(yōu)化數(shù)據(jù)與訓(xùn)練方法,努力提高模型輸出的準(zhǔn)確性。
夯實(shí)關(guān)鍵要素支撐
數(shù)據(jù)、算力、算法和工具,是大模型應(yīng)用的基礎(chǔ)關(guān)鍵要素,它們共同構(gòu)成了大模型發(fā)展的基石。
數(shù)據(jù)的質(zhì)量直接影響著大模型訓(xùn)練的成本與結(jié)果。隨著市場對大模型能力要求的不斷增加,對高質(zhì)量、精細(xì)化、定制化的數(shù)據(jù)需求日益凸顯。對于文本類數(shù)據(jù)集與圖像數(shù)據(jù)集,基于分類、目標(biāo)檢測、語義分割、序列標(biāo)注等不同的任務(wù)也表現(xiàn)出不同樣態(tài)。AR、自動(dòng)駕駛等場景的出現(xiàn),實(shí)時(shí)圖像數(shù)據(jù)采集和數(shù)據(jù)自動(dòng)標(biāo)注的技術(shù)亦在快速發(fā)展。
大模型訓(xùn)練數(shù)據(jù)的來源愈發(fā)豐富,數(shù)據(jù)構(gòu)建的主體由大模型建設(shè)商、數(shù)據(jù)服務(wù)商逐漸向個(gè)人、企業(yè)、行業(yè)主體發(fā)展。數(shù)據(jù)構(gòu)建由通用向私域延伸,個(gè)人、企業(yè)、行業(yè)構(gòu)建私域數(shù)據(jù)集的意識加強(qiáng)。這些推動(dòng)了數(shù)據(jù)建設(shè)平臺的發(fā)展,數(shù)據(jù)傳輸、整理的工具軟件愈發(fā)豐富、便捷。
數(shù)據(jù)交易將推動(dòng)數(shù)據(jù)建設(shè)平臺與數(shù)據(jù)交易方式逐漸完善,數(shù)據(jù)版權(quán)化意識加強(qiáng),數(shù)據(jù)付費(fèi)成為未來趨勢,定制訓(xùn)練數(shù)據(jù)集的需求激增。根據(jù)Cognilytica數(shù)據(jù),2021年全球人工智能訓(xùn)練數(shù)據(jù)市場需求約為42億美元,預(yù)計(jì)到2027年將增長到220億美元。
推動(dòng)構(gòu)建高質(zhì)量數(shù)據(jù)的同時(shí),要加強(qiáng)數(shù)據(jù)治理。從企業(yè)來看,大部分企業(yè)的數(shù)據(jù)治理工作面臨著數(shù)據(jù)量龐大、數(shù)據(jù)種類繁多、數(shù)據(jù)管理效率低的挑戰(zhàn),目前尚未出現(xiàn)通用、可靠的數(shù)據(jù)管理工具,數(shù)據(jù)治理僅是企業(yè)的單兵作戰(zhàn)。同時(shí),加強(qiáng)數(shù)據(jù)治理也是保障國家安全、社會穩(wěn)定和公民權(quán)益的迫切需要。企業(yè)數(shù)據(jù)如何合理合規(guī),并能保障數(shù)據(jù)所有者的利益,將是未來行業(yè)大模型發(fā)展的關(guān)鍵。
算力是大模型落地的物質(zhì)基礎(chǔ)。據(jù)預(yù)測,2022——2027年,中國智能算力規(guī)模年復(fù)合增長率將達(dá)到33.9%,同期通用算力規(guī)模年復(fù)合增長率為16.6%。我國智能算力需求的增長速度遠(yuǎn)超過通用算力增加速度。
大模型落地應(yīng)用的前提是算力基礎(chǔ)設(shè)施的搭建。目前,企業(yè)應(yīng)用大模型,如果采用純自建算力設(shè)施的方式,將面臨軟硬件采購、機(jī)房搭建、系統(tǒng)運(yùn)維等困難,容易陷入投入高、回報(bào)低的困境。購買云算力,將成為企業(yè)突圍算力壁壘的有效途徑。
私有云在維護(hù)企業(yè)數(shù)據(jù)隱私和業(yè)務(wù)安全的技術(shù)上,能夠?yàn)槠髽I(yè)提供基本的計(jì)算服務(wù);公有云可以彌補(bǔ)私有云算力的不足,在通用的場景下進(jìn)一步滿足計(jì)算要求。以“私有云+公有云”的方式搭建自身混合算力將成為企業(yè)搭建算力的通用范式。
算法是大模型的骨架。當(dāng)前大模型的主流架構(gòu)仍是Transformer,未來融合檢索增強(qiáng)生成+知識圖譜的架構(gòu)或?qū)⒊蔀樾鲁绷鳌?
為了讓更多的企業(yè)、開發(fā)者可以便捷地將大模型應(yīng)用于自身業(yè)務(wù),大模型工具鏈應(yīng)運(yùn)而生。工具鏈包含大模型訓(xùn)練框架、模型社區(qū)、應(yīng)用開發(fā)工具、模型試驗(yàn)與評估、模型試驗(yàn)管理、數(shù)據(jù)標(biāo)注、模型部署、模型監(jiān)控與可監(jiān)控平臺、向量數(shù)據(jù)庫等,可以大致分為服務(wù)于模型開發(fā)者的模型訓(xùn)練工具、模型調(diào)用工具和服務(wù)于模型應(yīng)用者的一體化模型服務(wù)平臺。
大模型工具的不斷發(fā)展,將逐漸降低大模型訓(xùn)練和調(diào)優(yōu)的技術(shù)門檻,使得大模型訓(xùn)練、調(diào)優(yōu)流程愈發(fā)簡單。
典型場景應(yīng)用示范
智能經(jīng)營管理:某國有大型裝備制造企業(yè)成立AI團(tuán)隊(duì),按照“技術(shù)服務(wù)業(yè)務(wù)發(fā)展”的思路,做了深入的業(yè)務(wù)AI需求調(diào)研,總結(jié)出23個(gè)AI應(yīng)用場景,并快速展開市場調(diào)研與技術(shù)預(yù)研,最終以漸進(jìn)式的方式選擇提升整體AI形象的交互式人工智能數(shù)字人項(xiàng)目作為試點(diǎn),拉開了企業(yè)新型AI應(yīng)用的序幕。
智能設(shè)計(jì)研發(fā):國內(nèi)航空制造企業(yè)與第四范式在CAD工業(yè)軟件上進(jìn)行共創(chuàng),引入“式說”大模型,通過語音提問,找到所有與目標(biāo)設(shè)計(jì)相類似的三維數(shù)模零件,給出多種數(shù)模組裝方案,使傳統(tǒng)的開發(fā)形式向數(shù)字化轉(zhuǎn)型,提高了研發(fā)效率,縮短了研發(fā)設(shè)計(jì)實(shí)現(xiàn)周期。
智能供應(yīng)鏈管理:順豐通過大模型技術(shù),推出了多項(xiàng)智慧化服務(wù)應(yīng)用。順豐小哥服務(wù)中心集成了Agent能力,可以驅(qū)動(dòng)API調(diào)用和知識庫檢索,準(zhǔn)確提取收寄標(biāo)準(zhǔn)、運(yùn)費(fèi)標(biāo)準(zhǔn)、收派操作等問題中的關(guān)鍵信息,為快遞員生成簡單易懂的業(yè)務(wù)解決方式;其智能通系統(tǒng)從各國海關(guān)官網(wǎng)不間斷地爬取、整理、解讀最新的關(guān)務(wù)規(guī)則與收寄標(biāo)準(zhǔn),并自動(dòng)轉(zhuǎn)譯、分析和提煉,幫助員工快速理解和應(yīng)用復(fù)雜的國際貿(mào)易規(guī)則,顯著提升物流管理的效率和服務(wù)質(zhì)量。
智能生產(chǎn)制造:聯(lián)想在產(chǎn)品質(zhì)量檢測環(huán)節(jié),用大模型輔助自動(dòng)化光學(xué)檢測系統(tǒng)進(jìn)行光學(xué)檢測。如,通過大模型對捕捉到的屏幕圖像進(jìn)行處理,識別出屏幕缺陷,如劃痕、污漬、色差等,從而能達(dá)到每小時(shí)超過300臺筆記本電腦屏幕的檢測速度,識別更加準(zhǔn)確且大大節(jié)省人力成本,顯著提高生產(chǎn)效率。
工藝優(yōu)化:某省煙草制造工廠巧妙融入智能體技術(shù),實(shí)現(xiàn)從原料加工到成品產(chǎn)出的全流程智能化管理。該工廠開發(fā)了專屬的人工智能算法和智能體,并建立自己的算法管理平臺與智能知識庫,使制絲生產(chǎn)線上的設(shè)備實(shí)現(xiàn)自我監(jiān)測與調(diào)節(jié),并實(shí)現(xiàn)產(chǎn)線整線水分穩(wěn)態(tài)預(yù)測與控制,有效提升生產(chǎn)精度與效率。同時(shí),構(gòu)建工藝質(zhì)量智能管控系統(tǒng),結(jié)合大數(shù)據(jù)分析與機(jī)器學(xué)習(xí)算法,為產(chǎn)品質(zhì)量的持續(xù)優(yōu)化提供科學(xué)依據(jù)。
智慧醫(yī)療:成都某綜合三甲醫(yī)療機(jī)構(gòu),通過多款智能體和AI應(yīng)用,顯著提升服務(wù)品質(zhì)與管理效率。部署了營銷顧問智能體,對銷售流程對話的深度語音分析,精準(zhǔn)提煉交流精髓,生成階段性客戶畫像,為實(shí)施標(biāo)準(zhǔn)化、持續(xù)性的客戶關(guān)系管理提供了有力支持。客戶服務(wù)智能體通過智能分析客戶的情緒波動(dòng)、具體需求及潛在顧慮等信息,定制出更為貼心的診后服務(wù)方案。在醫(yī)生問診環(huán)節(jié),引入智能輔助系統(tǒng),能有效沉淀并提煉大量客戶交流信息,生成標(biāo)準(zhǔn)化的綜合診斷記錄,結(jié)合多維度的客戶畫像,智能輔助醫(yī)生進(jìn)行數(shù)據(jù)分析,不僅提高了問診效率,還顯著增強(qiáng)了診斷的專業(yè)性和精確度。
智慧教育:河南省某市教體局,通過AI智能體以及教育行業(yè)大模型,圍繞“教、學(xué)、評、管、測”五大業(yè)務(wù)類,實(shí)現(xiàn)18個(gè)大模型實(shí)踐場景。通過個(gè)性化教學(xué)和即時(shí)反饋,教師調(diào)整教學(xué)內(nèi)容,學(xué)生獲得個(gè)性化指導(dǎo),提高了學(xué)習(xí)效率和興趣。通過數(shù)據(jù)統(tǒng)計(jì)和分析支持科學(xué)決策,優(yōu)化了學(xué)校的管理流程,提升了整體教學(xué)質(zhì)量和管理水平。
(作者為國家工業(yè)信息安全發(fā)展研究中心標(biāo)準(zhǔn)所、全國兩化融合標(biāo)委會(TC573)、《數(shù)字化轉(zhuǎn)型》期刊和聯(lián)想集團(tuán)聯(lián)合課題組)
延長線:
生成式AI :指能夠生成新內(nèi)容的人工智能系統(tǒng),如文本、圖像、音頻、視頻等。當(dāng)前最先進(jìn)的生成式AI大多基于大模型實(shí)現(xiàn),但生成式AI也不必然依賴大模型,而大模型也可分為生成式和判別式。
數(shù)據(jù)標(biāo)注 :指對原始數(shù)據(jù)如文本、圖像、音頻、視頻等,添加標(biāo)簽、注釋或元數(shù)據(jù)的過程,使數(shù)據(jù)成為模型可理解和學(xué)習(xí)的“知識”。它是模型訓(xùn)練的關(guān)鍵前置步驟,直接影響模型的性能和準(zhǔn)確性。
預(yù)訓(xùn)練 :指在大規(guī)模未標(biāo)注的數(shù)據(jù)上進(jìn)行初步訓(xùn)練,以學(xué)習(xí)數(shù)據(jù)的通用特征和規(guī)律,可以節(jié)省時(shí)間和資源、提高泛化能力、快速適應(yīng)新任務(wù)能力等,是大模型核心技術(shù)之一。
微調(diào) :是在預(yù)訓(xùn)練的基礎(chǔ)上,通過少量標(biāo)注數(shù)據(jù)進(jìn)一步優(yōu)化模型,使其能夠更好地適應(yīng)特定任務(wù)的需求。
蒸餾 :是一種模型壓縮技術(shù),通過讓一個(gè)小模型(學(xué)生模型)模仿一個(gè)大模型(教師模型)的行為或知識,從而在保持較高性能的同時(shí),大幅減少模型的計(jì)算量和存儲需求。
基座:是指支撐模型開發(fā)、訓(xùn)練和部署的底層技術(shù)框架、硬件資源及配套工具,涵蓋硬件、軟件、算法和工程化能力的綜合體系。隨著模型規(guī)模持續(xù)擴(kuò)大,基座的優(yōu)化(如降低訓(xùn)練成本、提升能效比)將成為AI競爭的關(guān)鍵領(lǐng)域。
智能體(Agent):指能夠感知環(huán)境、自主決策并執(zhí)行動(dòng)作以實(shí)現(xiàn)目標(biāo)的實(shí)體。智能體可以是一個(gè)軟件程序、機(jī)器人,甚至是生物,通常利用大模型作為“大腦”,結(jié)合感知和執(zhí)行模塊,形成一個(gè)完整系統(tǒng)。