①我們身處何種時(shí)代?唯一不變的是變化本身 ②擁抱通用人工智能技術(shù)革命時(shí)代 ③百花齊放:大模型的場(chǎng)景與應(yīng)用 ④大模型的成本與價(jià)值 ⑤對(duì)策與路徑:如何實(shí)現(xiàn)大模型更好落地
財(cái)聯(lián)社12月26日訊(編輯 李夢(mèng)琪 王澤坤)我們顯然已經(jīng)進(jìn)入一個(gè)前所未有的技術(shù)加速度發(fā)展的創(chuàng)新時(shí)代。2023年以來,以ChatGPT為代表的大模型、人工智能等新技術(shù)突破為各行各業(yè)發(fā)展帶來新的前景。電商、醫(yī)療、教育等行業(yè)頭部企業(yè)都在積極探索AI+賦能產(chǎn)業(yè)發(fā)展的新路徑。
在這樣的時(shí)代背景下,大模型的場(chǎng)景與應(yīng)用是否真正如大家看到的那般,呈現(xiàn)百花齊放的格局與生態(tài)?我們推進(jìn)大模型應(yīng)用過程中,需要承擔(dān)哪些成本?又將能夠?yàn)槠髽I(yè)生產(chǎn)發(fā)展帶來怎樣的價(jià)值?以及大模型如何實(shí)現(xiàn)更好落地?
聚焦上述問題,復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授、博士生導(dǎo)師,上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華在“2023復(fù)旦管院科創(chuàng)周”之復(fù)旦科創(chuàng)先鋒年度論壇上以《走向千行百業(yè)的大模型》為主題分享了對(duì)大模型產(chǎn)業(yè)應(yīng)用的見解,他認(rèn)為生成式語言模型已經(jīng)逐步向多模態(tài)、具身化快速發(fā)展,這一系列的發(fā)展趨勢(shì)形成合力,將會(huì)為人們帶來一場(chǎng)前所未有的 “通用人工智能技術(shù)革命”。
今天,我們系統(tǒng)地整理了肖仰華的演講內(nèi)容,用萬字長(zhǎng)文解讀其對(duì)大模型的前沿分析,以下為分享內(nèi)容:
一、我們身處何種時(shí)代?唯一不變的是變化本身
我們所有的行業(yè)從業(yè)人員,自ChatGPT去年11月底上線以來,這一年是夢(mèng)幻般的一年,這一年里,我們看到ChatGPT在不到2個(gè)月的時(shí)間里突破了1億的月活,而此之前最快的TikTok實(shí)現(xiàn)1億月活的用戶為9個(gè)月,我們似乎一覺醒來就會(huì)見證了一些新的技術(shù)到來,我們IT研發(fā)人員,這一年每天早晨一開始都是一個(gè)新的開始,每天早晨最擔(dān)心的第一件事兒是不是又發(fā)生了什么新的技術(shù)變革,我們這個(gè)飯碗還能不能端得穩(wěn),很多新技術(shù)的名詞層出不窮,我們還沒有弄明白一個(gè)新概念是怎么回事兒,另外一個(gè)更新的技術(shù)又冒出來了,我們似乎處于前所未有的技術(shù)加速發(fā)展的時(shí)代,唯一不變的是變化本身。
這樣一個(gè)快速變化的技術(shù)世界帶來的是這個(gè)世界日益復(fù)雜。
以一輛整車為例,有將近2萬到3萬個(gè)零部件,每一個(gè)零部件需要經(jīng)歷數(shù)萬個(gè)零件組合而成的生產(chǎn)線,這樣的加工流程可能有700多道程序。所以我們整個(gè)人類社會(huì)日益變成了人、機(jī)、物融合的復(fù)雜系統(tǒng),這個(gè)系統(tǒng)的復(fù)雜性可以說是前所未有。實(shí)際上我們整個(gè)人類現(xiàn)代文明早就經(jīng)歷了早期的嬰童階段,而進(jìn)入當(dāng)下高度復(fù)雜的成熟階段,“復(fù)雜”往往是“成熟”另外一個(gè)同義詞。
快速發(fā)展的世界、日益復(fù)雜的世界帶來的是人類很多社會(huì)系統(tǒng)不確定性增加。我們看到所謂的“黑天鵝事件”“灰犀牛事件”高頻發(fā)生。我們又看到,當(dāng)下老齡化的趨勢(shì)加重,各種自然災(zāi)害頻發(fā),國(guó)際經(jīng)濟(jì)的競(jìng)爭(zhēng)形勢(shì)也在加劇,氣候、病毒等各種因素疊加在一起,給整個(gè)世界的發(fā)展帶來了巨大的不確定性。
在上世紀(jì)90年代,社會(huì)學(xué)家和經(jīng)濟(jì)學(xué)家已經(jīng)在警告我們,技術(shù)發(fā)展有可能帶來整個(gè)社會(huì)發(fā)展的失速,而帶來所謂的失控風(fēng)險(xiǎn)。可以說當(dāng)下我們?nèi)祟愖畲蟮膯栴}、命題是如何應(yīng)對(duì)日益失控的風(fēng)險(xiǎn),但是我們?nèi)俗鳛橐环N生物智能,我們每一個(gè)人的認(rèn)知能力是有限的,我們?cè)谧恳粋€(gè)人差不多10億個(gè)神經(jīng)元,1萬億左右神經(jīng)突觸參數(shù),而且今天的人類并不比1000年前的人類聰明多少。我經(jīng)常開個(gè)玩笑,如果大家真的穿越到古代1000年前的宮廷里,生存1個(gè)小時(shí)都是很困難的。這說明我們并不比古人聰明多少。這些事實(shí)說明我們?nèi)祟惖恼J(rèn)知受限于生物智能的本質(zhì),其能力是有限的,而我們有限的認(rèn)知能力難以認(rèn)知當(dāng)下快速變化、日益復(fù)雜、日益不確定性的世界,這是當(dāng)下人類最大的問題。我們一定要把認(rèn)知能力讓渡給機(jī)器,讓機(jī)器也一定程度上具備人的認(rèn)知能力,進(jìn)而開展人機(jī)協(xié)作的認(rèn)知,才有可能認(rèn)知日益加速變化、日益復(fù)雜的世界。
我們一旦把認(rèn)知能力賦予了機(jī)器,機(jī)器的認(rèn)知能力是可以隨著世界復(fù)雜性的增長(zhǎng)而增長(zhǎng)。我們看到現(xiàn)在機(jī)器智能,只要喂給它的數(shù)據(jù)越來越多,只要供養(yǎng)它的算力越來越多,它的智能仍然在持續(xù)增長(zhǎng),唯有機(jī)器形成認(rèn)知世界的能力,它才有可能跟世界復(fù)雜性的增長(zhǎng)同步。所以,未來的認(rèn)知模式一定是人機(jī)協(xié)作的認(rèn)知模式。
當(dāng)下很多技術(shù)的出現(xiàn),某種程度上是時(shí)代發(fā)展的必然,是時(shí)代發(fā)展到今天對(duì)技術(shù)所提出的必然要求,我們必須發(fā)展人機(jī)協(xié)作的認(rèn)知,人機(jī)協(xié)作的認(rèn)知結(jié)果就是大家熟知的ChatGPT這一類的大模型,大模型可以認(rèn)為是機(jī)器認(rèn)知這個(gè)世界的一個(gè)技術(shù)成果。
我們看到的大模型,嚴(yán)格來講是大規(guī)模的生成式語言模型,它已經(jīng)能夠在絕大部分人類所擅長(zhǎng)的認(rèn)知任務(wù)中,比如說自然語言處理、理解,超過人類的水平,甚至達(dá)到的專家的水平,可以說生成式大模型出現(xiàn)具有時(shí)代發(fā)展的歷史必然性,它是機(jī)器發(fā)展認(rèn)知智能的必然趨勢(shì)。
二、擁抱通用人工智能技術(shù)革命時(shí)代
而這樣一個(gè)趨勢(shì)在快速的發(fā)展中,我們看到不單單是機(jī)器人理解我們千行百業(yè)的文本,它又進(jìn)一步快速向多模態(tài)發(fā)展,可以理解圖像,理解我們現(xiàn)場(chǎng)的照片,并且做出非常精妙的回答,甚至可以像剛才說的機(jī)器人,它可以操控機(jī)械臂,完成一些只有人類才可以完成的復(fù)雜規(guī)劃任務(wù)。也就是說生成式語言模型已經(jīng)逐步向多模態(tài)、具身化快速發(fā)展,這一系列的發(fā)展趨勢(shì)形成合力,帶來的是一場(chǎng)前所未有的技術(shù)革命。我們把這場(chǎng)技術(shù)革命稱為“通用人工智能技術(shù)革命”,因?yàn)樗呀?jīng)讓一些機(jī)器具備了一般人的認(rèn)知能力,具備了開放世界的理解能力,而且這種通用人工智能技術(shù)革命絕不是傳統(tǒng)意義上的某一次技術(shù)革命所能比擬的。
我們所熟知的蒸汽革命、電氣革命,本質(zhì)上都是人類智能本身的產(chǎn)物,唯獨(dú)這一次的通用人工智能技術(shù)革命,革的是智能本身的命。大家想想看,人類社會(huì)生活、學(xué)習(xí)、工作中哪一個(gè)活動(dòng)不需要使用我們的智力呢?但凡將來用到我們?nèi)祟愔橇Φ乃谢顒?dòng),都有望被通用人工智能重新塑造??梢哉f通用人工智能將會(huì)滲透整個(gè)社會(huì)生產(chǎn)、生活中的每一個(gè)角落,將會(huì)滲透進(jìn)社會(huì)的每一根毛細(xì)血管,所以它對(duì)人類社會(huì)影響將是廣泛且深遠(yuǎn)的。所以我一直把通用技術(shù)革命視作是一場(chǎng)元革命,它不是某一次技術(shù)革命的地位所能比擬的。
這么一場(chǎng)技術(shù)革命,對(duì)于我們各行各業(yè)會(huì)產(chǎn)生什么樣的影響?各個(gè)行業(yè)為什么從戰(zhàn)略上如此高度重視這場(chǎng)技術(shù)革命?我們先來看認(rèn)識(shí)層面上一些思考。
所謂的千行百業(yè),大家所從事的行業(yè),本質(zhì)上都是某一個(gè)垂直行業(yè)。我們以前做人工智能,做了很多年各行各業(yè)的智能化解決方案,但是我們發(fā)現(xiàn)一直以來效果不好,直到后來ChatGPT出現(xiàn),我們?cè)偃ジ芏嘈袠I(yè)專家去聊,我們才發(fā)現(xiàn)通用人工智能、通用大模型的到來,實(shí)際上恰恰是發(fā)展領(lǐng)域智能不可或缺的。
我們知道通用大模型是通過通用語料煉制出來的,它看了很多互聯(lián)網(wǎng)上各種學(xué)科知識(shí),可以說它是一個(gè)通才。一個(gè)垂直領(lǐng)域智能化為什么需要通識(shí)能力?你跟醫(yī)生聊的時(shí)候,你發(fā)現(xiàn)一個(gè)醫(yī)生80%的情況會(huì)排除你是健康的情況,可能10個(gè)病人只有8個(gè)是健康的,只有2個(gè)是需要醫(yī)生干預(yù)的,也就是說它想了解什么是疾病,恰恰先要理解什么是健康。推而廣之,你不理解美怎么可能理解丑呢?所以你想理解某一個(gè)領(lǐng)域內(nèi)概念,恰恰要先了解領(lǐng)域外的概念。
所以我們這一波行業(yè)智能化解決方案,恰恰是先走通通用認(rèn)知能力,因?yàn)槲覀冎挥薪⑵鹜ㄗR(shí)能力才有可能發(fā)展專業(yè)認(rèn)知能力,通識(shí)是專識(shí)的基礎(chǔ)。
我們?nèi)祟惖慕逃彩沁@樣,我們先經(jīng)歷了K12的基礎(chǔ)教育,主要是完成通識(shí)教育,然后是大學(xué)的專業(yè)教育。所以沒有通識(shí)能力是不可能有垂直行業(yè)的領(lǐng)域認(rèn)知能力的。
我們這一波大模型本質(zhì)上帶來了什么新的能力?首先是帶來開放世界的理解能力。比如說這里有一個(gè)藥品說明書,顯示了各個(gè)年齡層次服用藥劑的方法,可是一般老百姓去問藥的時(shí)候,通常說“我今年23歲了,男性,我應(yīng)該怎么使用這個(gè)藥”。以前的人工智能技術(shù)很難理解這類開放性表達(dá),但是今天有了通用大模型能力,可以準(zhǔn)確理解23歲是成年男性,可以匹配文檔中相應(yīng)的劑量來做出準(zhǔn)確回答,本質(zhì)上這是通用人工智能的開放理解能力給我們帶來的效果。
現(xiàn)在的大模型又有著非常強(qiáng)大的組合創(chuàng)新能力,所謂的舉一反三,學(xué)會(huì)了解決A任務(wù)、B任務(wù)的能力,就可以泛化出解決A+B任務(wù)的能力。我們以前人工智能解決方案非常痛苦,要教機(jī)器A任務(wù)的能力、B任務(wù)的能力,可是實(shí)際的用戶往往給的真實(shí)任務(wù)是A+B任務(wù),我們的方案就不行了,但是今天大模型可以準(zhǔn)確泛化出新的組合任務(wù)的能力,這是大模型給我們帶來的新價(jià)值。大
模型的評(píng)估評(píng)價(jià)能力,第一次達(dá)到人類的專家水平。我們以前很多評(píng)價(jià)任務(wù)一定要交給人類去做,比如說習(xí)語翻譯,這是一個(gè)非常專業(yè)的成語翻譯任務(wù),通常需要找一個(gè)英語專業(yè)四級(jí)同學(xué)來標(biāo)注翻譯的好壞。今天使用超級(jí)大模型,比如說GPT4,我們只要能夠?qū)懗鲞@個(gè)任務(wù)的評(píng)價(jià)標(biāo)準(zhǔn),以及一步一步評(píng)價(jià)的過程,大模型就能夠像人類專家一樣來做非常專業(yè)工作的評(píng)估和評(píng)價(jià)。所以基本上我們很多專評(píng)估評(píng)價(jià)業(yè)工作都可以交給大模型。
大模型的復(fù)雜任務(wù)的規(guī)劃能力,使得很多知識(shí)工作自動(dòng)化得以可能。舉個(gè)管科同學(xué)經(jīng)常要做的數(shù)據(jù)分析的案例。比如,我要大模型幫我做個(gè)調(diào)研,對(duì)比分析上海和北京近十年來每年8月份的平均氣溫,并形成統(tǒng)計(jì)結(jié)論,并且做假設(shè)檢驗(yàn)。這樣一個(gè)活如果讓在座的研究生同學(xué)去做,可能要找數(shù)據(jù),找軟件,做分析,做統(tǒng)計(jì),做假設(shè)檢驗(yàn)分析,最后形成結(jié)論,我估計(jì)要花半天時(shí)間。但是今天我們借助大模型強(qiáng)大的規(guī)劃能力,只需要一秒鐘時(shí)間,就把你手工干的所有活全部自動(dòng)化干完。這是好事兒也是壞事兒,好事兒意味著你只要能夠熟練使用大模型就不用花這么多時(shí)間手工工作,壞事兒是你的常規(guī)數(shù)據(jù)分析工作有可能被機(jī)器所替代。隨之而來的,是在AGI大量應(yīng)用的未來,我們相對(duì)于機(jī)器的獨(dú)特價(jià)值是什么將會(huì)是我們需要日益深入思考的問題。
大模型另外一個(gè)非常重要的機(jī)遇在于它給我們提供了跨領(lǐng)域、跨專業(yè)知識(shí),尤其是跨系統(tǒng)邊界的知識(shí)。大模型是巨大的知識(shí)容器,尤其擅長(zhǎng)在一些跨學(xué)科邊界處的知識(shí),可能是人類所不具備的。
最近有一個(gè)新聞,他說一個(gè)小女孩兒得了個(gè)怪病,看了人類近14個(gè)??漆t(yī)生都搞不定,最后問ChatGPT,ChatGPT做出了正確診斷。我傾向認(rèn)為這個(gè)新聞是真實(shí)的,因?yàn)榇竽P蛯W(xué)會(huì)了各個(gè)學(xué)科的知識(shí),而且它在各個(gè)學(xué)科的知識(shí)專業(yè)水平比普通人顯著高出一截,我們每一個(gè)專科醫(yī)生往往在自己的??剖且蛔R(shí)的高峰,但是你很難在所有的??贫际且蛔R(shí)的高峰,大模型全域認(rèn)知水平線顯著提升之后,就能夠認(rèn)知兩個(gè)病種之間的盲區(qū),這是人類歷史上第一次有機(jī)會(huì)做到這件事,而我們每一個(gè)人類是難以做到這一點(diǎn)的,我們能夠擅長(zhǎng)某一個(gè)領(lǐng)域已經(jīng)非常不容易了,但是今天大模型很可能在很多系統(tǒng)邊界處有著非常強(qiáng)大的認(rèn)知能力。
管科的同學(xué)肯定都聽說過管理上難題有一些難度,我們一旦聽到跨部門、跨層級(jí)、跨專業(yè),有一個(gè)“跨”字基本上意味著難題所在,我們每一個(gè)人的認(rèn)知只能擅長(zhǎng)自己各自的小領(lǐng)域,而不同的部門、不同學(xué)科之間認(rèn)知往往是一個(gè)巨大的盲區(qū),這恰恰是大模型未來給我們帶來的重大機(jī)遇。大模型所能認(rèn)知的跨學(xué)科知識(shí),其很多內(nèi)容可能是人類從未探索或觸及的,所以大模型給我們帶來的機(jī)會(huì)有可能是前所未有的。
回到我們的千行百業(yè),正是因?yàn)榇竽P途邆溥@些能力,我傾向于認(rèn)為大模型這一次對(duì)于行業(yè)發(fā)展來講,對(duì)于to B行業(yè)發(fā)展來講,是一次全新的智能引擎升級(jí)。這就像一輛車,我們車發(fā)展了幾百年,這個(gè)車還是一個(gè)殼子、四個(gè)輪子,這個(gè)車到底變革的是什么?變的是它的引擎,從開始的馬力,到后來的蒸汽,再到后來的油氣,再到現(xiàn)在的電動(dòng),所以引擎一直在驅(qū)動(dòng)車的變革。
我們的信息化服務(wù)、數(shù)字化、智能化也發(fā)展了幾十年,從傳統(tǒng)的小模型發(fā)展,比如基于少數(shù)參與的回歸、分類模型、預(yù)測(cè),這些小模型的表達(dá)能力有限,難以表達(dá)復(fù)雜的現(xiàn)實(shí)世界。再到過去的知識(shí)工程,用專家知識(shí)來解決問題,但是專家知識(shí)一旦遇到開放問題就難以勝任,所以傳統(tǒng)的引擎多多少少有缺陷,我們今天把它革新為新的大模型引擎,用整個(gè)大模型驅(qū)動(dòng)to B的數(shù)字化和信息化過程當(dāng)中,一定要重視幾個(gè)問題:
1. 大模型是一次引擎的升級(jí),所以它一定要做到和現(xiàn)有流程的無縫融合;
2. 大模型仍然還需要和行業(yè)的從業(yè)人員進(jìn)行有效的協(xié)作;
3. 要往大模型里注入千行百業(yè)的知識(shí),才有可能解決大模型的所謂根本問題,叫“幻覺問題”。
我想強(qiáng)調(diào)的是toB行業(yè)應(yīng)用本質(zhì)是一類復(fù)雜、嚴(yán)肅的決策任務(wù),我們所熟知的ChatGPT最成功的應(yīng)用目前是聊天,但是這個(gè)聊天不是一個(gè)嚴(yán)肅應(yīng)用的場(chǎng)景,你不會(huì)因?yàn)樗奶斐鲥e(cuò)就認(rèn)為它聊得不好。,說嚴(yán)肅應(yīng)用場(chǎng)景像醫(yī)療決策、投資決策,這些都屬于復(fù)雜決策,需要有專業(yè)的知識(shí),更要有復(fù)雜的決策能力,比如說投資決策,一定要有宏觀態(tài)勢(shì)的研判能力,還要有綜合任務(wù)拆解能力、復(fù)雜約束的取舍能力(有那么多的約束要考慮)、未知事物的預(yù)見能力、不確定性場(chǎng)景的推斷能力等等,這都是我們做決策的時(shí)候所要具備的能力。從這些條件、要求來看現(xiàn)在的大模型,仍然還是有漫長(zhǎng)的路要走。
在這個(gè)過程中,大模型想在千行百業(yè)創(chuàng)造價(jià)值,首要解決的問題是它所謂的“幻覺問題”,也就是一本正經(jīng)的胡說八道,如果大家問它復(fù)旦的校訓(xùn),它一本正經(jīng)的給你回答,但是你仔細(xì)一看這個(gè)出處是編造出來的,而且大模型這種一本正經(jīng)的文風(fēng),實(shí)際上使得我們從中識(shí)別錯(cuò)誤異常困難。這是為什么很多嚴(yán)肅的場(chǎng)合大家不敢用大模型的一個(gè)很重要的原因。比如說醫(yī)療行業(yè),醫(yī)療寫病例或者什么,如果它一本正經(jīng)給你寫了一段病歷,結(jié)果有一個(gè)小數(shù)點(diǎn)的錯(cuò)誤都可能是致命的。所以這是大模型往行業(yè)里應(yīng)用的時(shí)候必須要解決的問題。
大模型往往還缺乏領(lǐng)域的忠實(shí)度,因?yàn)樗呀?jīng)在通用領(lǐng)域?qū)W到了很多通用知識(shí)。但是我們往行業(yè)去用的時(shí)候一定是希望大模型能夠根據(jù)行業(yè)的規(guī)范與知識(shí)去回答問題。但是它往往對(duì)于你行業(yè)所給的這些知識(shí),缺乏必要的忠實(shí)度,而傾向于用它所學(xué)到的一些通識(shí)知識(shí)來回答問題。這是所謂的缺乏忠實(shí)度給我們帶來的問題。
三、百花齊放:大模型的場(chǎng)景與應(yīng)用
回到今天,當(dāng)我們?nèi)タ创竽P屯袠I(yè)去用的時(shí)候,我們一定會(huì)去想我們?nèi)绾卧谛袠I(yè)創(chuàng)造大模型的價(jià)值,也就是說場(chǎng)景和應(yīng)用的問題。事實(shí)上很多人都在思考類似問題,經(jīng)常有人問我們中國(guó)的大模型應(yīng)該怎么去發(fā)展。事實(shí)上,我的一個(gè)基本的觀點(diǎn)認(rèn)為大模型的這個(gè)賽道是百花齊放,我們沒有必要都專注在通用大模型,雖然通用大模型很重要,我們還可以發(fā)展很多行業(yè)大模型,甚至可以發(fā)展很多垂直的場(chǎng)景化的大模型,還有很多科學(xué)大模型。這個(gè)賽道足夠?qū)拸V,我們每一個(gè)企業(yè)都可以發(fā)現(xiàn)你屬于自己獨(dú)特優(yōu)勢(shì)的競(jìng)爭(zhēng)機(jī)會(huì)。
尤其我想強(qiáng)調(diào)場(chǎng)景化大模型的重要性。大家有沒有發(fā)現(xiàn)人類有一種工作崗位,只需要通識(shí)能力再加上簡(jiǎn)單的崗位培訓(xùn)就可以勝任的,比如說客服、HR,你聽說過HR的工作崗位一定要招一個(gè)博士學(xué)歷的嗎?你聽說過客服一定要招博士學(xué)位的嗎?很少,但凡不需要博士學(xué)位的崗位都有一個(gè)特點(diǎn),那就是通識(shí)能力加上簡(jiǎn)單的工作崗位培訓(xùn)似乎就可以勝任,這一類崗位我把它稱之為“場(chǎng)景”,所有的行業(yè)都需要有HR,所有的行業(yè)可能都存在客服,再比如程序員、圖書管理員,這些行業(yè)有可能是大模型優(yōu)先代替的行業(yè),為什么?因?yàn)榇竽P陀型ㄗR(shí)能力,你再給它簡(jiǎn)單的崗位培訓(xùn),就足以勝任相應(yīng)的工作。
這些場(chǎng)景有什么特點(diǎn)?你會(huì)發(fā)現(xiàn)這些場(chǎng)景多是所謂的窗口性工作,很多崗位追求服務(wù)的標(biāo)準(zhǔn)與規(guī)范,不喜歡創(chuàng)新,必須按部就班,越是這種工作崗位將來越容易被大模型代替。所以你會(huì)看到這些場(chǎng)景商業(yè)機(jī)會(huì)巨大,我們不一定需要卷通用大模型賽道,我希望中國(guó)企業(yè)在這些細(xì)分賽道與場(chǎng)景進(jìn)行積極布局。
還有一類是可以競(jìng)爭(zhēng)的是專業(yè)大模型,我們經(jīng)常說如果我們做一個(gè)化工行業(yè)的大模型,必須要讓大模型首先理解什么是化學(xué)分子表達(dá)式,否則怎樣才能真正理解化學(xué)這個(gè)行業(yè)呢?所以像化學(xué)分子結(jié)構(gòu)這種專業(yè)大模型,還有比如說基因大模型、代碼這些大模型,將來都是我們可以積極作為的新賽道。
大模型應(yīng)用賽道有一個(gè)非常重要的產(chǎn)品形態(tài)是場(chǎng)景化的認(rèn)知智能體,剛才黃總說的機(jī)器人就可以認(rèn)為是一個(gè)智能體。當(dāng)我們說智能體的時(shí)候,強(qiáng)調(diào)的是實(shí)體機(jī)器人或者具備一定環(huán)境自適應(yīng)的自治能力,它能夠根據(jù)環(huán)境的反饋?zhàn)鞒鱿鄳?yīng)的動(dòng)作來適應(yīng)這個(gè)環(huán)境,所以我們把這種稱之為具備環(huán)境自適應(yīng)能力的“自治智能體”。
智能體并不是今天才有的概念,其實(shí)很早就有了,從人工智能早期誕生開始就有了,但是我們?cè)缙诘闹悄荏w僅限于跟物理環(huán)境做一些簡(jiǎn)單的交互,但是今天最大的機(jī)會(huì)在哪?大模型可以作為智能體的大腦,有了大腦后就可以跟環(huán)境做復(fù)雜交互。未來的機(jī)器絕不簡(jiǎn)單單只是跟環(huán)境做一些物理的交互。它可以跟環(huán)境做非常復(fù)雜的認(rèn)知交互,而成為“認(rèn)知”智能體。我們將來會(huì)有各種各樣的認(rèn)知智能體。比如說代替你個(gè)人,有著跟你一樣的言行和思維方式的智能體,它就可以代替你在網(wǎng)上聊天、閱讀新聞等等。
我們將來會(huì)看到各種各樣的認(rèn)知智能體的出現(xiàn)。比如說我們研發(fā)了一個(gè)叫Travel Agent,跟他講我過兩天要到加州,它就會(huì)給你去調(diào)用互聯(lián)網(wǎng)各種各樣的工具,比如說谷歌地圖、計(jì)算器、機(jī)票APP、酒店APP,給你制定一個(gè)會(huì)考慮各種各樣約束(比如你肯定不希望同一個(gè)景點(diǎn)玩兩次),并且充分考慮你的個(gè)人偏好的Travel Agent。這類Agent將來會(huì)在日常的生活中大量普及,這種大模型賦能千行百業(yè),一個(gè)非常重要的產(chǎn)品形態(tài)就是各種各樣場(chǎng)景化的Travel Agent。
你可以試圖想一下,你現(xiàn)在干的所有工作,將來都會(huì)變成若干個(gè)Agent,比如說行政助理定會(huì)議室,將來會(huì)演變成行政助理Agent,我們?nèi)肆Y源面試工作可以做HR Agent,我到網(wǎng)上查文獻(xiàn)可以做文獻(xiàn)檢索Agent。未來我們身邊會(huì)有各種各樣的Agent,來完成各類自動(dòng)化服務(wù)。對(duì)于to B企業(yè),我們企業(yè)現(xiàn)在可能已經(jīng)有自己的信息門戶,但是你們現(xiàn)在的信息門戶僅僅是一個(gè)信息集散地,它的交互方式還不夠智能,我們往往迷失在信息迷宮中找不到所要的信息、能夠解決特定問題的應(yīng)用或服務(wù)。未來的企業(yè)信息門戶一定是智能化的Agent形式,它能根據(jù)用戶的意圖和企業(yè)現(xiàn)有信息系統(tǒng)進(jìn)行打交道,并且能夠跨越不同的系統(tǒng)來幫你完成你想做的任務(wù)。
我最近正在組織同學(xué)幫我們復(fù)旦信息化做一個(gè)復(fù)旦信息門戶Agent,我們每一個(gè)同學(xué)將來想干的任何事情,比如說我現(xiàn)在想放松一下,打一小時(shí)球,它可以自動(dòng)去找各個(gè)校區(qū)哪里的體育館、羽毛球館還可以訂,推薦給你。而,現(xiàn)在,你若要完成干的這樣的事情,必須主動(dòng)去是需要查找各種APP,甚至你都不知道APP在哪,也往往很難制定準(zhǔn)確的關(guān)鍵字你也不知道怎么去查找。而Agent技術(shù),有望緩解當(dāng)下的這些尷尬。,將來它可以幫你干這個(gè)事情,這些將來都是會(huì)發(fā)生的事兒。
從應(yīng)用和場(chǎng)景的角度來講,大家一定要注重我國(guó)當(dāng)下正在發(fā)生的一個(gè)非常重大的事件,就是數(shù)字經(jīng)濟(jì)的發(fā)展,我們國(guó)家正在推動(dòng)數(shù)據(jù)要素的市場(chǎng)化。數(shù)據(jù)從靜態(tài)的變成流通的,變成可交易的,這個(gè)時(shí)候會(huì)創(chuàng)造非常多新的機(jī)會(huì)。在這個(gè)過程當(dāng)中,大家會(huì)發(fā)現(xiàn)我們目前的數(shù)據(jù)要素資產(chǎn)化過程并不流暢,因?yàn)槲覀內(nèi)狈χ悄芑侄危瑪?shù)據(jù)治理仍然是困難重重。但實(shí)際上,大模型已經(jīng)一定程度上具備了智能化的數(shù)據(jù)治理能力,可以利用大模型來推動(dòng)數(shù)據(jù)的智能自動(dòng)化的治理。比如我這里給了一個(gè)例子,給了它四行數(shù)據(jù),然后問大模型這個(gè)數(shù)據(jù)有什么問題,大模型已經(jīng)準(zhǔn)確識(shí)別出了這個(gè)數(shù)據(jù)里存在的問題,比如說張三是小明的父親,他出生年齡是1978年,小明出生年齡是1980年,父親是不可能只比孩子大兩歲的,以前我們數(shù)據(jù)中存在一些錯(cuò)誤,我們?nèi)斯と懸?guī)則很難覆蓋各種各樣的情況,今天用大模型基本上可以做到這一點(diǎn)。
四、大模型的成本與價(jià)值
所以大模型有可能成為今天數(shù)據(jù)要素釋放價(jià)值的一個(gè)非常重要的一個(gè)工具。但是我們推動(dòng)大模型往各行業(yè)用的時(shí)候,必須要去考慮一個(gè)成本和價(jià)值的問題。
首先,大模型降低了我們的成本。以前要想實(shí)現(xiàn)智能化,要去標(biāo)數(shù)據(jù),要去定義特征,這都需要成本。但是大模型它本質(zhì)上是zero-shot learner,它不需要或者只需要很少量標(biāo)注數(shù)據(jù),就能學(xué)到解決問題的能力。所以我們傳統(tǒng)的這些特征工程樣本標(biāo)注的代價(jià)就節(jié)約了。
但是我們一定要注重大模型本身的煉制和使用成本。首先是煉制成本,像GPT4這種規(guī)模的大模型一次訓(xùn)練需要6300萬美金。非但煉制成本不容忽視,大模型的使用成本更加值得關(guān)注,尤其是千行百業(yè)應(yīng)用大模型時(shí),其應(yīng)用成本十分突出。比如說一家公司每天要做100萬篇互聯(lián)網(wǎng)文檔內(nèi)容分析,如果用大模型,比如GPT4的API,一天下來大概要花26萬人民幣。而且大模型還有一個(gè)大家難以接受的成本,就是其生成過程需要時(shí)間,它把10026萬篇處理一遍的完整生成過程需要15天時(shí)間,也就是處理這些文檔的速度遠(yuǎn)遠(yuǎn)跟不上產(chǎn)生文檔的速度,所以這個(gè)時(shí)間成本是現(xiàn)實(shí)應(yīng)用難以接受的。
我想告訴大家的是,到今天各行各業(yè)擁抱大模型的時(shí)候,一定要注重它的成本問題,如何降低成本?首先是大小模型協(xié)同,我們并不需要在是任何場(chǎng)景都使用大模型,很多情形下時(shí)間我們用大模型的使用是殺雞用牛刀,其實(shí)小模型仍然有其用武之地,并沒有因此而失效,我們?yōu)槭裁床荒茉诤?jiǎn)單的情況下用使用傳統(tǒng)的小模型從而降低成本呢?只有在非必要的場(chǎng)合下用大模型呢?甚至我甚至提出一個(gè)原則叫“非必要不直接使用大模型”,否則這個(gè)成本怎么降低呢?
大家注意到GPT4-Turbo版本頒布發(fā)布的時(shí)候,成本降了三分之二,我們認(rèn)為背后也是用了大小模型協(xié)同,而且大小模型協(xié)同絕不單單是出于成本的考慮,也是出于效果的考慮。小模型在可控、可理解等方面是有大模型不可比擬優(yōu)勢(shì)的。大模型不可控,它學(xué)到了什么我們不知道,,所以這都是它很大的一個(gè)問題??梢哉f,未來商業(yè)價(jià)值取決于我們能不能把擅長(zhǎng)通識(shí)能力的大模型和擅長(zhǎng)專業(yè)能力的小模型協(xié)同,才有可能真正的創(chuàng)造我們的商業(yè)價(jià)值。
在這里面尤其要注重傳統(tǒng)知識(shí)庫(kù)的積累,知識(shí)圖譜的積累仍然十分重要,知識(shí)仍然是緩解大模型的幻覺,降低大模型的應(yīng)用成本的,這是非常重要的這個(gè)思路。我們實(shí)際上在大模型的應(yīng)用的各個(gè)階段,在大模型的提示階段、生成階段和評(píng)估階段,都要把先驗(yàn)知識(shí)用好,我們才能夠讓大模型廉價(jià)的、高效率的為我們服務(wù)。尤其還要注重大模型的小型化,真正在一線服務(wù)大家的往往是經(jīng)過壓縮的小模型,而不是真正意義上的大模型。還要注重時(shí)效性,馬斯克的大模型之所以受到關(guān)注,是因?yàn)樗虢鉀Q時(shí)效性問題。
五、對(duì)策與路徑:如何實(shí)現(xiàn)大模型更好落地
到底計(jì)算機(jī)要做那么什么事情才可以怎樣才能促進(jìn)大模型更好地落地?
第一,我們要把大模型整個(gè)煉制過程變成科學(xué),現(xiàn)在大模型的煉制非常像傳統(tǒng)的煉金術(shù)煉丹,把所有的數(shù)據(jù)準(zhǔn)備好往服務(wù)器一丟,祈禱它出好的效果,實(shí)際上整個(gè)過程是不透明的,我們要想把它變成透明、科學(xué)的,仍然需要努力,其中很重要的努力是對(duì)語料做精準(zhǔn)的刻畫,我們到底用什么樣的語料能夠練出什么樣的能力,我們要建立起其之間的因果關(guān)系,這樣才有可能真正把大模型從煉金術(shù)發(fā)展變成科學(xué),這個(gè)過程中跨學(xué)科研究尤為重要。大模型的能力發(fā)展跟人類的認(rèn)知發(fā)展理論存在著高度可映射的關(guān)系,人類認(rèn)知發(fā)展什么時(shí)候發(fā)展出了注意力,什么時(shí)候發(fā)展出了信念,什么時(shí)候發(fā)展出了欲望,人類認(rèn)知過程的大模型很多術(shù)語被大量地應(yīng)用在的在大模型訓(xùn)練中去使用。這種跨學(xué)科的研究視角對(duì)于推動(dòng)大模型訓(xùn)練工藝變成科學(xué)嚴(yán)謹(jǐn)?shù)倪^程可能非常重要。
做行業(yè)大模型的時(shí)候,尤其要注重?cái)?shù)據(jù)的選擇,不能盲目配比數(shù)據(jù)。到底把什么數(shù)據(jù)配給大模型,它才能夠具備金融從業(yè)人員的專業(yè)認(rèn)知水平,其實(shí)這個(gè)是非常有意思的問題,事實(shí)上你把一些金融行業(yè)的基礎(chǔ)數(shù)據(jù)讓它去訓(xùn)練是不夠的,你把一些非常細(xì)節(jié)的數(shù)據(jù)(比如每時(shí)每刻的股票交易價(jià)格)讓它去訓(xùn)練也是不必要的行的。我們可以多反思一下一個(gè)普通人是如何成長(zhǎng)為金融專業(yè)人員的,它是因?yàn)閷W(xué)到了什么知識(shí)才能夠成為金融從業(yè)人員的?我們可以通過回答類似的問題對(duì)大模型行業(yè)訓(xùn)練過程進(jìn)行指引。
大模型的煉制過程跟我們調(diào)教一個(gè)行業(yè)專家的過程已經(jīng)高度相似,整個(gè)過程中我們尤其要注重高質(zhì)量指令數(shù)據(jù)的收集,高質(zhì)量指令數(shù)據(jù)可以釋放底座大模型的價(jià)值,反之如果指令數(shù)據(jù)集質(zhì)量差,會(huì)傷害底座大模型的能力。所以行業(yè)大模型最終很大程度上取決于指令數(shù)據(jù)的質(zhì)量。
整個(gè)過程中我們還需要進(jìn)一步提升大模型的多模態(tài)認(rèn)知能力,比如說上傳一張票據(jù),問里面包含雞蛋的菜品一共有多少價(jià)格,像這種多模態(tài)認(rèn)知能力在行業(yè)應(yīng)用中非常有價(jià)值,比如大家拍一張亂七八糟網(wǎng)線的接頭照片,問哪里出了問題,像這樣的能力將來大模型一定程度上可以具備。這都是要去提升它的這個(gè)多模態(tài)認(rèn)知能力。
你要讓它成為金融專家,就必須要有金融行業(yè)的評(píng)測(cè),你需要發(fā)展面向知識(shí)的評(píng)測(cè),要去測(cè)試這個(gè)大模型是否掌握的金融知識(shí),更需要發(fā)展面向能力的評(píng)測(cè)。,注意有知識(shí)的不代表有能力,我們有太多高分低能的大模型。所以我們不單單要測(cè)評(píng)它是不是掌握了知識(shí),還要去測(cè)評(píng)他是不是像人一樣能夠具備解決實(shí)際問題的能力。還需要去測(cè)評(píng)他是不是有足夠的智商,需要測(cè)評(píng)是不是有足夠的情商。你跟很多大模型講,“我去藥店買藥了”,現(xiàn)在很多大模型的回復(fù)是“祝你購(gòu)物愉快”,這種情商很多人難以接受,但是如果你問GPT4你會(huì)發(fā)現(xiàn)還是不錯(cuò)的。所以情商、智商評(píng)測(cè)也很重要。
一個(gè)大模型的行業(yè)落地路徑跟行業(yè)專家的演進(jìn)路徑何其相像,一個(gè)醫(yī)生成為一個(gè)行業(yè)專家,首先要完成通識(shí)教育,現(xiàn)在的通用大模型就是幫我們完成通識(shí)階段的教育,然后要進(jìn)入醫(yī)學(xué)院學(xué)習(xí)專業(yè)知識(shí),這是專業(yè)大模型干的事兒,再進(jìn)一步使用各種各樣的工具,這就是讓大模型變成Agent,然后能夠在實(shí)踐中獲得反饋,這就是他變成實(shí)習(xí)醫(yī)生了,再然后經(jīng)過實(shí)踐的反饋,獲得行業(yè)的洞察,形成敏銳的行業(yè)直覺,變成真正意義上的專家。所以大模型在千行百業(yè)的應(yīng)用道路上本質(zhì)就是利用大模型實(shí)現(xiàn)專家水平的認(rèn)知智能的過程。
最后總結(jié)一下。我們推動(dòng)大模型往行業(yè)千行百業(yè)應(yīng)用的過程中,一定要合理定位、正確認(rèn)識(shí)、場(chǎng)景多元、積極開辟新賽道,注重大模型的成本和價(jià)值,促進(jìn)大模型和千行百業(yè)的深度融合,大模型絕不應(yīng)該只停留在煉金術(shù)階段,我們要推動(dòng)它變成科學(xué),大模型必須跟行業(yè)深度融合才有可能真正的可持續(xù)發(fā)展。