大(dà)模型的未來(lái)趨勢與挑戰

2023/11/27 16:06:33

來(lái)源：科協之聲

作(zuò)者：劉鋒

自(zì)2022年11月起，以ChatGPT爲典型代表的大(dà)模型在全球數字科技界引起了(le)極大(dà)關注。全球範圍内的大(dà)模型數量受其影響在不到(dào)一年的時(shí)間内就已超過一百種。

截至2023年10月，大(dà)模型技術已經步入了(le)快(kuài)速發展的階段。在中國，超過10種大(dà)模型已完成備案。其中，百度的文(wén)心大(dà)模型升級至4.0版本後，在理(lǐ)解、生成、邏輯和(hé)記憶等四項核心能(néng)力上(shàng)均實現(xiàn)了(le)顯著的提升。與此同時(shí)，OpenAI的ChatGPT也(yě)經曆了(le)一次重大(dà)升級，除了(le)多模态視(shì)覺能(néng)力、DALL·E 3以及語音(yīn)合成API的開(kāi)放(fàng)。最引人注目的升級是，爲每個用(yòng)戶提供了(le)一種名爲GPTS的工(gōng)具，使用(yòng)戶能(néng)夠構建專屬的GPT模型。

微軟公司創始人比爾·蓋茨公開(kāi)表示，自(zì)1980年首次看(kàn)到(dào)圖形用(yòng)戶界面以來(lái)，以GPT爲代表的大(dà)模型是他(tā)所見過的最具革命性的技術進步。對(duì)于大(dà)模型未來(lái)的産業發展趨勢和(hé)面臨的挑戰究竟如何，我們可以從(cóng)三個方面進行探讨。

未标題-2.jpg

其一，人類種群知(zhī)識庫從(cóng)外(wài)化、索引化到(dào)智能(néng)化的三部曲。

我們在《崛起的超級智能(néng)》一書中提出，生物的競争本質上(shàng)是種群知(zhī)識庫的競争。在過去的幾億年裏，恐龍因爲滅絕導緻種群知(zhī)識庫消失爲0，鲨魚一直保持在海洋中遊蕩，種群知(zhī)識庫沒有發生大(dà)的變化，熊貓因爲趨于滅絕從(cóng)而種群知(zhī)識庫不斷萎縮。

隻有人類在近200萬年裏，在知(zhī)識和(hé)智慧上(shàng)不斷擴展和(hé)加速，在最近數百年裏随着蒸汽機、工(gōng)業革命、核能(néng)的出現(xiàn)，人類種群知(zhī)識庫出現(xiàn)了(le)巨大(dà)的增長。特别是互聯網誕生後，第一次将人類的種群知(zhī)識庫外(wài)化成一個龐大(dà)的網絡知(zhī)識庫，通過萬維網的發明(míng)進一步促使人類種群知(zhī)識庫急劇(jù)擴容。表現(xiàn)在科技領域就是21世紀大(dà)量新科技新概念不斷湧現(xiàn)。

面對(duì)海量的互聯網公共知(zhī)識，如何索引就成了(le)人類必須解決的重要課題。20世紀90年代，搜索引擎出現(xiàn)了(le)蓬勃發展，其中優秀和(hé)典型的代表分别是谷歌和(hé)百度，它們成長背後的推動力也(yě)是人類種群知(zhī)識庫發展的必然要求。

互聯網知(zhī)識庫被索引之後，如何智能(néng)化也(yě)就成爲了(le)一個重要議(yì)題。在過去的近30年裏，以谷歌、百度爲代表的搜索引擎公司加大(dà)了(le)智能(néng)化的步伐，人工(gōng)智能(néng)的興起也(yě)與此有密切的關系。

2022年OpenAI的ChatGPT成功引發了(le)大(dà)模型的興起，标志着互聯網這(zhè)個外(wài)化的人類種群知(zhī)識庫完成了(le)從(cóng)索引化到(dào)智能(néng)化的轉變。但(dàn)不能(néng)忘記的是，OpenAI ChatGPT的成功離不開(kāi)谷歌提出的Transformer注意力機制模型，也(yě)離不開(kāi)微軟通過Bing搜索引擎提供的海量數據和(hé)巨大(dà)資金(jīn)支持。

從(cóng)搜索引擎的發展看(kàn)，通過激烈的競争，搜索引擎最終形成了(le)若幹個巨頭公司爲人類提供互聯網海量數據的索引服務，同樣我們認爲作(zuò)爲搜索引擎的升級版，人類社會(huì)也(yě)不需要很(hěn)多大(dà)模型提供同質的服務。我們判斷包括搜索引擎、大(dà)數據、社交網絡等領域擁有優質大(dà)數據、人工(gōng)智能(néng)技術積累和(hé)廣泛應用(yòng)場景的公司中，在未來(lái)的競争中會(huì)脫穎而出一家或若幹家爲人類提供集中統一的智能(néng)服務。

其二，行業垂直大(dà)模型建設思路：繼續提升通用(yòng)大(dà)模型智能(néng)水(shuǐ)平。

應該指出，當前人類社會(huì)對(duì)大(dà)模型充滿了(le)熱情，特别在中國，很(hěn)多人希望大(dà)模型能(néng)夠與金(jīn)融、法律、工(gōng)業、農(nóng)業、電力、建築等等行業領域結合，從(cóng)而實現(xiàn)快(kuài)速發展。

其實大(dà)模型的成功并不僅僅是參數量大(dà)，而是用(yòng)大(dà)規模預訓練+微調的方式，對(duì)海量的跨領域知(zhī)識進行學習時(shí)湧現(xiàn)出來(lái)新的能(néng)力，而且這(zhè)些(xiē)新的能(néng)力往往與創新有關，如翻譯、創作(zuò)文(wén)章、創作(zuò)圖像等，然而這(zhè)種創新能(néng)力并不穩定，會(huì)出現(xiàn)“幻覺”和(hé)胡編亂造的情況。同時(shí)由于神經網絡本身的特點，其可解釋性問題也(yě)一直沒有解決，因此對(duì)于需要精密控制或精确結果的産業領域，大(dà)模型并不是可靠的工(gōng)具和(hé)技術。

還有一個誤區(qū)是，認爲用(yòng)大(dà)模型的訓練方法加上(shàng)行業産業的大(dà)數據就可以形成高(gāo)質量的行業大(dà)模型。這(zhè)個觀點并不符合大(dà)模型湧現(xiàn)出創新能(néng)力的規律，過于單一領域的知(zhī)識反而會(huì)降低(dī)大(dà)模型湧現(xiàn)出新能(néng)力的水(shuǐ)平。因此應繼續提高(gāo)ChatGPT、文(wén)心一言、LLama等等通用(yòng)大(dà)模型的智能(néng)水(shuǐ)平，通過通用(yòng)大(dà)模型平台與其他(tā)可靠性高(gāo)的人工(gōng)智能(néng)技術協同工(gōng)作(zuò)，并與各個行業結合，這(zhè)種路徑要比建設專門(mén)的行業大(dà)模型更爲穩健和(hé)有效。

其三，值得期待的大(dà)模型未來(lái)。

大(dà)模型的不斷發展和(hé)與其他(tā)技術産品結合的過程将是持續探索和(hé)嘗試的過程。無論如何，大(dà)模型的出現(xiàn)的确是一個革命性的突破，有很(hěn)多科學家認同ChatGPT等大(dà)模型已經可以突破圖靈測試，未來(lái)在智能(néng)和(hé)意識的基礎原理(lǐ)上(shàng)也(yě)将帶來(lái)更多突破性的啓發。

在産業應用(yòng)上(shàng)，大(dà)模型與其他(tā)不同類型的人工(gōng)智能(néng)技術、網絡技術、大(dà)數據技術結合，與不同的辦公、學習、生産、生活結合會(huì)持續産生出具有非凡想象力的應用(yòng)。例如微軟辦公Office接入GPT-4，由AI驅動的 Microsoft 365 Copilot ，打破了(le)傳統辦公軟件辦公的方式，能(néng)自(zì)動生成文(wén)檔、電子郵件、PPT。百度的文(wén)心行業大(dà)模型的數量已經達到(dào)了(le) 11 個，覆蓋能(néng)源電力、金(jīn)融、航天、傳媒、影視(shì)、汽車、城(chéng)市管理(lǐ)等多個領域，OpenAI計(jì)劃再推出GPT商店(diàn)。這(zhè)将類似于蘋果的App Store，讓開(kāi)發者可以在商店(diàn)中上(shàng)架他(tā)們的自(zì)定義GPT，供其他(tā)用(yòng)戶購買和(hé)使用(yòng)。

雖然大(dà)模型有着令人驚歎的智能(néng)表現(xiàn)，但(dàn)我們還需要耐心等待大(dà)模型的持續發育和(hé)成長，如果從(cóng)以ChatGPT3.5爲代表的大(dà)模型大(dà)規模向人類提供服務算(suàn)起，畢竟它還是一個從(cóng)出生來(lái)到(dào)全人類面前還不到(dào)1年的嬰兒。

行業實踐

實踐項目返回列表

大(dà)模型的未來(lái)趨勢與挑戰

行業實踐

實踐項目 返回列表

大(dà)模型的未來(lái)趨勢與挑戰

實踐項目返回列表