專利分析視角下的ChatGPT創(chuàng)新路徑及對(duì)中國(guó)大模型技術(shù)發(fā)展的啟示

小飛俠cawdbof0 2023-06-19 發(fā)布于北京

展開全文

來源：三思派

作者：陟爽鹿藝馮璟艷

摘要

Open AI公司推出的ChatGPT以最快速度（5天）突破百萬用戶，并不斷更新迭代，2023年3月推出最新版本Chat GPT4.0，產(chǎn)生現(xiàn)象級(jí)效應(yīng)。本文基于專利視角分析ChatGPT相關(guān)技術(shù)創(chuàng)新路徑，闡述主要技術(shù)創(chuàng)新點(diǎn)，詳細(xì)分析國(guó)、內(nèi)外主要申請(qǐng)人的專利布局情況，探討專利分析角度下的GPT技術(shù)局限性，從而期望對(duì)國(guó)內(nèi)大模型技術(shù)發(fā)展有所啟示。

01 Open AI與ChatGPT

OpenAI成立于2015年，是由美國(guó)著名創(chuàng)業(yè)孵化器Y Combinator的總裁Sam Altman和特斯拉的CEO馬斯克（Elon Musk）發(fā)起的讓全人類受益的非盈利組織。OpenAI承諾開源所有技術(shù)，鼓勵(lì)研究人員公開發(fā)表工作成果，將專利（如果有的話）與全世界共享，避免使用危害人類或過度集中權(quán)力的AI或AGI（通用人工智能）。2018年，因公司經(jīng)營(yíng)理念問題，馬斯克與OpenAI分道揚(yáng)鑣。在研發(fā)AI模型的過程中，OpenAI面臨越來越大的經(jīng)濟(jì)壓力，最后不得不在2019年轉(zhuǎn)變?yōu)橛怨?，之后獲得了微軟10億美元的投資。2022年1月,路透社援引的Semafor報(bào)告稱，微軟正考慮投資100億美金給OpenAI（總估值290億美金）。

ChatGPT是OpenAI于2022年11月推出的人工智能聊天機(jī)器人程序，該程序是在GPT-3.5（一種自然語言預(yù)訓(xùn)練大模型）基礎(chǔ)內(nèi)核上使用監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練所得到的模型。在監(jiān)督學(xué)習(xí)過程中，ChatGPT收集了全新的人類對(duì)話語料，并將其與GPT-3.5的監(jiān)督學(xué)習(xí)語料合并。在強(qiáng)化學(xué)習(xí)過程中，ChatGPT首先訓(xùn)練了一個(gè)得分模型來對(duì)模型輸出進(jìn)行排序，然后用該得分模型來對(duì)生成模型輸出進(jìn)行反饋，并優(yōu)化該生成模型。最終由強(qiáng)化學(xué)習(xí)得到的模型即為ChatGPT。ChatGPT以文字方式互動(dòng)，可以實(shí)現(xiàn)與人類對(duì)話交互，還可以實(shí)現(xiàn)文本生成、自動(dòng)問答、自動(dòng)摘要等在內(nèi)的多種任務(wù)。

ChatGPT的成功來源于更早期發(fā)布的GPT-3模型以及對(duì)RLHF的優(yōu)化。GPT是Generative Pre-trained Transformer（生成型預(yù)訓(xùn)練變換模型）的縮寫。它是基于Transformer架構(gòu)（2017年由谷歌提出），GPT的主要優(yōu)勢(shì)在于它可以通過預(yù)訓(xùn)練大量語料數(shù)據(jù)來獲得對(duì)語言任務(wù)的預(yù)測(cè)能力，而不需要大量的人工標(biāo)注數(shù)據(jù)。它具有良好的語言生成能力，可以生成文本、回答問題、對(duì)話等多項(xiàng)語言任務(wù)。RLHF（Reinforcement Learning from Human Feedback人類反饋強(qiáng)化學(xué)習(xí)）是一項(xiàng)涉及多個(gè)模型和不同訓(xùn)練階段的復(fù)雜概念，包括以下三個(gè)步驟：預(yù)訓(xùn)練一個(gè)語言模型（LM）；聚合問答數(shù)據(jù)并訓(xùn)練一個(gè)獎(jiǎng)勵(lì)模型（Reward Model，RM）；用強(qiáng)化學(xué)習(xí)（RL）方式微調(diào)LM。

2023年3月15日，多模態(tài)預(yù)訓(xùn)練大模型GPT-4正式發(fā)布，能夠處理文本、圖像兩種模態(tài)以及25000個(gè)單詞的超長(zhǎng)文本輸入，并通過文本輸出。GPT-4能夠很好的支持圖像輸入，能夠理解圖片中的幽默之處，并且具備理解長(zhǎng)上下文的能力，在各種專業(yè)和學(xué)術(shù)基準(zhǔn)測(cè)試上表現(xiàn)出人類水平，包括通過模擬律師考試，分?jǐn)?shù)約為全體考生的前10%。相對(duì)于以前的GPT-3.5模型，GPT-4明顯減少了“幻覺”，在團(tuán)隊(duì)內(nèi)部對(duì)抗性設(shè)計(jì)的事實(shí)性評(píng)估中，GPT-4的得分比GPT-3.5高19個(gè)百分點(diǎn)。但是，考慮到GPT-4這樣的大模型的競(jìng)爭(zhēng)格局和安全影響，OpenAI并未公開有關(guān)架構(gòu)（包括模型大?。?、硬件、訓(xùn)練計(jì)算、數(shù)據(jù)集構(gòu)建、訓(xùn)練方法或類似內(nèi)容的更多詳細(xì)信息。目前，ChatGPTPlus版本已經(jīng)使用GPT-4模型。

智譜AI團(tuán)隊(duì)研究發(fā)布的《ChatGPT團(tuán)隊(duì)背景研究報(bào)告》稱，2023年2月，ChatGPT團(tuán)隊(duì)規(guī)模不足百人（共87人）。分析發(fā)現(xiàn)，其顯著特征是“年紀(jì)很輕”、“背景豪華”、“聚焦技術(shù)”、“積累深厚”、“崇尚創(chuàng)業(yè)”和“華人搶眼”。該團(tuán)隊(duì)平均年齡為32歲，“90后”是主力軍。他們引領(lǐng)的這一波大型語言模型技術(shù)風(fēng)潮，充分說明了那些經(jīng)常被認(rèn)為研發(fā)經(jīng)驗(yàn)不足的年輕人，完全有可能在前沿科技領(lǐng)域取得重大突破。團(tuán)隊(duì)成員絕大多數(shù)擁有名校學(xué)歷，且具有全球知名企業(yè)工作經(jīng)歷。華人學(xué)者歐陽(yáng)龍參與了與ChatGPT相關(guān)的7大技術(shù)項(xiàng)目中的4大項(xiàng)目的研發(fā)，他是InstructGPT論文的第一作者，是RLHF論文的第二作者，可見他是這兩個(gè)關(guān)鍵技術(shù)項(xiàng)目的核心人員。

02 專利視角下的ChatGPT相關(guān)技術(shù)創(chuàng)新路徑

1）OpenAI專利分析

在世界著名的DWPI摘要數(shù)據(jù)庫(kù)中，以申請(qǐng)人（OpenAI）、發(fā)明人（InstructGPT、GPT-3等技術(shù)對(duì)應(yīng)論文作者）、結(jié)合“NLP”、“語言”、“訓(xùn)練”等關(guān)鍵詞進(jìn)行檢索，發(fā)現(xiàn)OpenAI公司作為權(quán)利人的專利數(shù)量為零，同時(shí)采用多種商業(yè)數(shù)據(jù)庫(kù)進(jìn)行搜尋，均未發(fā)現(xiàn)OpenAI名下任何專利。

分析其原因，OpenAI在成立之初作為非盈利組織，期望開源所有技術(shù)，專利制度作為公開換保護(hù)的一種方式，申請(qǐng)專利對(duì)于非盈利組織不是必須的，而OpenAI轉(zhuǎn)變?yōu)橛怨竞螅紤]到ChatGPT、GPT-3、GPT-4屬于黑盒模型，且模型的訓(xùn)練花費(fèi)龐大，開發(fā)和部署都很復(fù)雜，對(duì)于其他公司或科研院所而言很難復(fù)現(xiàn)，不通過專利也能實(shí)現(xiàn)技術(shù)保護(hù)，通過商用API(Application Programming Interface,應(yīng)用程序編程接口）等方式即可獲利，另一方面，對(duì)于訓(xùn)練語料獲取、模型算法而言，可能會(huì)涉及專利不授權(quán)客體問題，不能進(jìn)行專利保護(hù)，而即使不涉及客體問題的，由于訓(xùn)練等步驟的不可見性，在專利授權(quán)后也很難進(jìn)行維權(quán)，因此OpenAI公司有可能通過商業(yè)秘密進(jìn)行技術(shù)保護(hù)。

根據(jù)OpenAI官網(wǎng)公開的ChatGPT技術(shù)原理圖分析得知，ChatGPT的訓(xùn)練過程分為以下三個(gè)階段：

圖1 ChatGPT技術(shù)原理圖

第一階段：訓(xùn)練監(jiān)督策略模型。首先會(huì)在數(shù)據(jù)集中隨機(jī)抽取問題，由標(biāo)注人員給出高質(zhì)量答案，然后用人工標(biāo)注好的數(shù)據(jù)來微調(diào)GPT-3.5模型，獲得SFT（Supervised Fine-Tuning）模型。

第二階段：訓(xùn)練獎(jiǎng)勵(lì)模型（Reward Model，RM）。在數(shù)據(jù)集中隨機(jī)抽取問題，使用第一階段生成的模型生成多個(gè)不同的回答。標(biāo)注人員對(duì)輸出進(jìn)行打分排序，使用排序結(jié)果數(shù)據(jù)來訓(xùn)練獎(jiǎng)勵(lì)模型。

第三階段：采用強(qiáng)化學(xué)習(xí)中的PPO（Proximal Policy Optimization，近端策略優(yōu)化）來優(yōu)化策略。首先使用第一階段中的初始權(quán)重構(gòu)造一個(gè)初始的PPO模型。針對(duì)在數(shù)據(jù)集中采樣的新的問題，使用PPO模型生成回答，并用第二階段訓(xùn)練好的RM模型給出回報(bào)分?jǐn)?shù)。PPO策略可以會(huì)通過回報(bào)分?jǐn)?shù)計(jì)算出策略梯度，并更新PPO模型參數(shù)。

2）國(guó)外主要申請(qǐng)人專利分析

隨著2017年谷歌Transformer模型的提出，預(yù)訓(xùn)練語言模型開始顯著發(fā)展，因此本文關(guān)于預(yù)訓(xùn)練語言模型技術(shù)的檢索主要針對(duì)2017年之后申請(qǐng)的專利。在DWPI摘要數(shù)據(jù)庫(kù)中，針對(duì)關(guān)鍵詞“l(fā)anguage model”、“train”、“fine-tune”進(jìn)行簡(jiǎn)單檢索，共有2600多篇專利文獻(xiàn)。檢索結(jié)果僅針對(duì)專利摘要進(jìn)行檢索，且為專利同族合并后的結(jié)果。

圖2 預(yù)訓(xùn)練語言模型技術(shù)申請(qǐng)人來源國(guó)家

在預(yù)訓(xùn)練語言模型領(lǐng)域，中國(guó)企業(yè)發(fā)展迅速。百度、阿里、騰訊、華為都是主要申請(qǐng)人，且均在海外展開布局，國(guó)外申請(qǐng)人主要集中在微軟、谷歌和三星。但是還應(yīng)注意到，國(guó)外一些公司針對(duì)神經(jīng)網(wǎng)絡(luò)、編解碼器結(jié)構(gòu)改進(jìn)的專利技術(shù)方案，在摘要中并沒有提到語言模型，但是神經(jīng)網(wǎng)絡(luò)等是可以應(yīng)用到語言模型中的，因此實(shí)際上關(guān)于預(yù)訓(xùn)練語言模型技術(shù)的申請(qǐng)量會(huì)更多。

為了更全面地了解國(guó)外申請(qǐng)人在中國(guó)的布局情況，針對(duì)全文數(shù)據(jù)再次檢索，并統(tǒng)計(jì)合并同族的結(jié)果。

圖3 國(guó)外申請(qǐng)人在中國(guó)的申請(qǐng)量

谷歌多年來陸續(xù)提出Transformer、BERT、T5等模型，目前針對(duì)Transformer申請(qǐng)相關(guān)美國(guó)專利（US2018341860A1，專利名“基于注意的序列轉(zhuǎn)換神經(jīng)網(wǎng)絡(luò)”），并在中美歐日韓等多個(gè)國(guó)家布局。BERT、T5雖未申請(qǐng)專利，但是我們經(jīng)檢索發(fā)現(xiàn)，其專利布局涵蓋了基于上述模型衍生的下游任務(wù)，在多語言翻譯、文本語音轉(zhuǎn)換、完型填空、稀疏表示、情感分類等領(lǐng)域有所技術(shù)改進(jìn)。2021年，谷歌提出了SwitchTransformer模型，采用了稀疏激活技術(shù)，擁有1.6萬億參數(shù)，相同資源情況下，訓(xùn)練速度比由谷歌開發(fā)的最大語言模型T5-XXL快了4倍，谷歌就該模型申請(qǐng)相關(guān)PCT國(guó)際專利申請(qǐng)WO2022150649A1（NEURALNETWORKSWITHSWITCHLAYERS），目前并未進(jìn)入任何國(guó)家階段。谷歌也在模型訓(xùn)練、微調(diào)等方面開展專利布局。

圖4 谷歌部分專利

基于BERT模型，微軟于2020年提出了DeBerta模型，并提交申請(qǐng)相關(guān)美國(guó)專利“具有解開注意力和多步解碼的高效變壓器語言模型”（US2021334475A1），利用多步解碼來更好地重建掩蔽標(biāo)記并改善預(yù)訓(xùn)練收斂來促進(jìn)預(yù)訓(xùn)練的自然語言模型的自訓(xùn)練。2021年提出的LORA模型主要涉及神經(jīng)網(wǎng)絡(luò)模型的低秩自適應(yīng)，凍結(jié)了預(yù)訓(xùn)練的模型權(quán)重（相關(guān)美國(guó)專利US2022383126A1）。此外，微軟也在下游任務(wù)進(jìn)行專利布局，例如其申請(qǐng)的PCT國(guó)際專利申請(qǐng)WO2022221045A1涉及多任務(wù)模型，包括例如共享編碼器、多個(gè)任務(wù)特定編碼器和用于多個(gè)任務(wù)的多個(gè)任務(wù)特定線性層等。

在Patentics的英文全文庫(kù)中以“DeepMind”（DeepMind為Google旗下前沿人工智能企業(yè)）作為申請(qǐng)人，language model作為關(guān)鍵詞進(jìn)行檢索，檢索結(jié)果為27篇。DeepMind側(cè)重于對(duì)神經(jīng)網(wǎng)絡(luò)的改進(jìn)。中國(guó)專利“針對(duì)使用對(duì)抗訓(xùn)練的表示學(xué)習(xí)的推理的大規(guī)模生成神經(jīng)網(wǎng)絡(luò)模型”（CN113795851A），訓(xùn)練可以是基于損失函數(shù)，該損失函數(shù)包括基于由鑒別器神經(jīng)網(wǎng)絡(luò)處理的輸入對(duì)的樣本部分和潛在部分的聯(lián)合鑒別器損失項(xiàng)和僅僅基于輸入對(duì)的樣本部分或潛在部分中的一個(gè)部分的至少一個(gè)單一鑒別器損失項(xiàng)，該專利在中美等國(guó)均有布局，根據(jù)英文庫(kù)中檢索得到的專利查找其中文同族，可以確定DeepMind在中國(guó)申請(qǐng)使用淵慧科技有限公司名稱。

圖5 DeepMind部分專利布局情況

由圖5可以看出，DeepMind在多模態(tài)方面也有所布局，涉及凍結(jié)語言模型的多模態(tài)少樣本學(xué)習(xí)以及使用多模態(tài)輸入選擇操作。多模態(tài)的語言模型是一種能夠同時(shí)處理不同類型的數(shù)據(jù)，如文本、圖像、音頻和視頻的人工智能技術(shù)。多模態(tài)語言模型的目標(biāo)是實(shí)現(xiàn)跨模態(tài)的理解、生成和交互，從而提高人機(jī)對(duì)話和信息檢索的效果。谷歌近期申請(qǐng)了基于UI的多模態(tài)模型，例如美國(guó)專利US2023031702A1通用用戶界面轉(zhuǎn)換器（VUT），處理三種類型的數(shù)據(jù)：圖像、結(jié)構(gòu)（視圖層次）和語言，并且執(zhí)行多個(gè)不同的任務(wù)，諸如UI對(duì)象檢測(cè)、自然語言處理、屏幕摘要、UI可敲擊性預(yù)測(cè)。微軟的PCT國(guó)際專利申請(qǐng)WO2022187063A1則公開了一種視覺與語言的跨模態(tài)加工方法，基于視覺語義特征集和文本特征集來訓(xùn)練目標(biāo)模型，以確定輸入文本和輸入圖像之間的關(guān)聯(lián)信息。

03 國(guó)內(nèi)相關(guān)技術(shù)發(fā)展情況

在Patentics的中文數(shù)據(jù)庫(kù)中，以“預(yù)訓(xùn)練”、“大規(guī)?！?、“語言模型”、“微調(diào)”、“零/少樣本”、“知識(shí)圖譜”等作為關(guān)鍵詞進(jìn)行簡(jiǎn)單檢索，共檢索出12292篇專利，我們可以看出國(guó)內(nèi)預(yù)訓(xùn)練大模型技術(shù)自2018年后開始迅速發(fā)展，鑒于目前21年、22年申請(qǐng)的專利未全部公開，實(shí)際上該領(lǐng)域的專利申請(qǐng)數(shù)量可能更多。

圖6 語言大模型技術(shù)中國(guó)專利申請(qǐng)量趨勢(shì)

圖7 人工智能大模型技術(shù)中國(guó)專利主要申請(qǐng)人

圖8 語言大模型技術(shù)中國(guó)申請(qǐng)人在美國(guó)的申請(qǐng)量

1）國(guó)內(nèi)語言模型相關(guān)專利

2019年3月，百度提出文心大模型ERNIE，隨后百度在知識(shí)圖譜、語言理解與生成技術(shù)、以及機(jī)器翻譯、對(duì)話系統(tǒng)、摘要生成、長(zhǎng)文本語義、文本糾錯(cuò)等領(lǐng)域都進(jìn)行布局。其中知識(shí)圖譜包括實(shí)體知識(shí)圖譜、行業(yè)知識(shí)圖譜、事件圖譜、關(guān)注點(diǎn)圖譜以及多模態(tài)圖譜。

華為與清華大學(xué)、哈爾濱工業(yè)大學(xué)、中國(guó)人民大學(xué)等高校均有合作，語言模型包括自回歸模型，并在模型訓(xùn)練方法、量子電路進(jìn)行模型復(fù)數(shù)運(yùn)算、降低訓(xùn)練PLM所需資源、文本向量等方向進(jìn)行專利布局。

圖9給出了國(guó)內(nèi)語言模型相關(guān)專利發(fā)展情況。其中，中國(guó)專利CN110717339A通過構(gòu)建詞語片段、句子以及文章三個(gè)不同層級(jí)的無監(jiān)督或弱監(jiān)督預(yù)訓(xùn)練任務(wù)，使得語義表示模型可以從海量數(shù)據(jù)中學(xué)習(xí)到詞語片段、句子以及文章不同層次的知識(shí)，增強(qiáng)了通用語義表示的能力，提升NLP任務(wù)的處理效果，百度公司的這項(xiàng)專利還獲得了第二十三屆2022中國(guó)專利獎(jiǎng)優(yōu)秀獎(jiǎng)。

圖9 國(guó)內(nèi)語言模型相關(guān)專利發(fā)展情況

針對(duì)多模態(tài)模型，百度的中國(guó)專利CN115374798A提出將跨語言預(yù)訓(xùn)練目標(biāo)和跨模態(tài)預(yù)訓(xùn)練目標(biāo)無縫地組合在統(tǒng)一的框架中，從可用的英文圖像字幕數(shù)據(jù)、單語語料庫(kù)和平行語料庫(kù)在聯(lián)合嵌入空間中學(xué)習(xí)圖像和文本。華為的中國(guó)專利CN115688937A將不同模態(tài)的數(shù)據(jù)的特征表示映射到同一個(gè)離散空間中，可以基于該離散空間對(duì)多模態(tài)的特征表示進(jìn)行建模，得到兼容多模態(tài)輸入數(shù)據(jù)的模型。

2）國(guó)內(nèi)人機(jī)交互應(yīng)用相關(guān)專利

而針對(duì)類似于ChatGPT的人機(jī)交互應(yīng)用，國(guó)內(nèi)申請(qǐng)人也有相應(yīng)的專利布局，但未進(jìn)行海外布局。

表1 國(guó)內(nèi)主要公司的技術(shù)布局情況

04 專利分析角度下的GPT技術(shù)局限性

目前免費(fèi)版ChatGPT使用GPT-3.5版本（以下稱為ChatGPT-3.5），具有出色的上下文對(duì)話能力，但是尚不能進(jìn)行多模態(tài)交互，缺乏解決數(shù)學(xué)問題的能力，并且對(duì)于一些專業(yè)領(lǐng)域缺少足夠的數(shù)據(jù)進(jìn)行訓(xùn)練，導(dǎo)致無法常常無法生成適當(dāng)回答。例如，筆者嘗試用ChatGPT-3.5闡述美國(guó)專利US2021334475A1的技術(shù)方案，它可以完整地描述出專利的發(fā)明名稱、技術(shù)方案等，但是這個(gè)專利文本實(shí)際上是微軟公司于2020年6月24日申請(qǐng)的名為“具有解開注意力和多步解碼的高效變壓器語言模型”，公開日為2021年10月28日，ChatGPT-3.5的回答完全文不對(duì)題。至少ChatGPT-3.5無法做到專利號(hào)和發(fā)明內(nèi)容的簡(jiǎn)單對(duì)應(yīng)，這可能是缺少相關(guān)專利語料造成的。

圖10 ChatGPT-3.5聊天截圖

鑒于微軟將GPT-4整合進(jìn)NewBing中，筆者通過NewBing的聊天功能搜索美國(guó)專利US2021334475A1。雖然它能夠完整的給出所有信息，但是除了發(fā)明名稱是正確的，申請(qǐng)日、公開日、申請(qǐng)人、發(fā)明人信息都是錯(cuò)誤的（見圖11）。就此次結(jié)果而言，New Bing更傾向于在搜索的基礎(chǔ)上對(duì)信息作出完整的補(bǔ)充，并不能保證真實(shí)性。

圖11 New Bing聊天功能截圖

需要注意的是，New Bing在多次嘗試后，也會(huì)給出錯(cuò)誤的答案（見圖12）。

圖12 New Bing聊天功能截圖

ChatGPT-3.5以及NewBing都不能完整的提供專利文件信息，那么針對(duì)法律條款是否能獲得較好效果呢？筆者分別向ChatGPT-3.5和NewBing詢問“專利的技術(shù)方案是無法實(shí)現(xiàn)的，需要用到中國(guó)專利法的哪個(gè)法條”，ChatGPT給出的答案類似于使用大量法律文獻(xiàn)訓(xùn)練模型的結(jié)果，雖然看似準(zhǔn)確，但涉及的條款及其規(guī)定都不是中國(guó)專利法的內(nèi)容，而NewBing則是搜索加工的結(jié)果，找到了適合的條款，但是法條規(guī)定的內(nèi)容與該條款毫無關(guān)系。因此，ChatGPT-3.5和NewBing都不能保證生成內(nèi)容的準(zhǔn)確性。

圖13 ChatGPT-3.5與New Bing聊天功能對(duì)比

探究其原因，GPT-3.5只是基于本地的語料庫(kù)進(jìn)行搜索，沒有聯(lián)網(wǎng)，所以對(duì)于很多無法獲取的信息會(huì)進(jìn)行杜撰，缺乏準(zhǔn)確性，但是GPT-4和New Bing是具有聯(lián)網(wǎng)形態(tài)的大語言模型，回答問題時(shí)會(huì)首先通過用戶的詢問在互聯(lián)網(wǎng)上搜索相關(guān)的語料進(jìn)行補(bǔ)充，所以可以杜絕部分杜撰的情況，但是對(duì)于非常見的問題，或者是信息缺失的情境下，還是會(huì)有編造的風(fēng)險(xiǎn)。

此外，ChatGPT的訓(xùn)練和部署都需要大量算力來支持，因此可能需要更輕量化的模型。對(duì)于國(guó)內(nèi)企業(yè)而言，需要通過加深國(guó)內(nèi)產(chǎn)學(xué)研合作方式推動(dòng)大模型發(fā)展。根據(jù)公開資料檢索發(fā)現(xiàn)，鵬城實(shí)驗(yàn)室與華為合作開發(fā)盤古大模型，與百度合作開發(fā)鵬城-百度·文心大模型；另一方面，華為把科研院所、產(chǎn)業(yè)廠商等結(jié)合起來，以期更好地讓大模型產(chǎn)業(yè)形成正向的閉環(huán)回路。

05 對(duì)國(guó)內(nèi)大模型技術(shù)發(fā)展的啟示

1）強(qiáng)調(diào)原始創(chuàng)新，發(fā)展大模型可持續(xù)演化

大模型的未來需要原始性創(chuàng)新,也需要自我生長(zhǎng),向可持續(xù)、可進(jìn)化的方向發(fā)展。人工智能技術(shù)近年來呈指數(shù)型發(fā)展趨勢(shì)，在當(dāng)今政治經(jīng)濟(jì)環(huán)境下，我們更應(yīng)強(qiáng)調(diào)原始創(chuàng)新的重要性，掌握根技術(shù)，但也不能拘泥于閉門造車，要求事事從零起步，要重視國(guó)際國(guó)內(nèi)合作交流，實(shí)現(xiàn)大模型的可持續(xù)演化。

2）建設(shè)大模型研發(fā)設(shè)施

如今的人工智能研究，已經(jīng)突破單兵作戰(zhàn)，“小作坊”式的埋頭鉆研無法在當(dāng)下競(jìng)爭(zhēng)日益激烈的環(huán)境中產(chǎn)出突破性科研成果。ChatGPT的橫空出世也是基于前期幾十億美金的投入，大成果的產(chǎn)出必須依托大平臺(tái)。國(guó)內(nèi)應(yīng)大力扶持高端科研平臺(tái)，從數(shù)據(jù)、算力、工程創(chuàng)新能力三方面，三位一體加快建設(shè)大科學(xué)設(shè)施集群。

3）人才隊(duì)伍培養(yǎng)

科技創(chuàng)新的競(jìng)爭(zhēng)本質(zhì)是科技人才的競(jìng)爭(zhēng)。從前文分析可知，OpenAI的成功除了大量算力的投入，更重要的是聚集了大量頂尖的科學(xué)家和工程師。面向全球吸引具備攻克技術(shù)難關(guān)能力的杰出人才，選拔具備國(guó)際影響力的領(lǐng)軍人才，培育具備較高發(fā)展?jié)摿Φ那嗄耆瞬牛瑢?huì)是國(guó)內(nèi)人工智能發(fā)展的重要手段。

4）差異化競(jìng)爭(zhēng)，安全倫理性加強(qiáng)

大模型技術(shù)的紅利期還很長(zhǎng)，ChatGPT的火爆出圈并不代表國(guó)內(nèi)完全喪失先機(jī)，只能做跟跑者。文本語言類大模型，OpenAI走在前列，但在多模態(tài)大模型領(lǐng)域，世界各國(guó)科學(xué)家還在攻克技術(shù)難題。國(guó)內(nèi)要想在新一輪人工智能科技創(chuàng)新中成為領(lǐng)跑者，就必須要學(xué)會(huì)差異化競(jìng)爭(zhēng)，做出中國(guó)特色。大模型技術(shù)的演化一定會(huì)越來越強(qiáng)調(diào)科技倫理治理、系統(tǒng)安全性，在安全倫理方面的建設(shè)，突出中國(guó)價(jià)值觀，也是我們需要關(guān)注的重點(diǎn)。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：小飛俠cawdbof0 > 《智能》

舉報(bào)/認(rèn)領(lǐng)