來(lái)源:北大青鳥(niǎo)總部 2025年04月17日 08:34
“AI大模型”這個(gè)詞越來(lái)越頻繁地出現(xiàn)在大眾的視野中。從ChatGPT到Sora,從圖像生成到語(yǔ)音識(shí)別,AI大模型的能力不斷刷新人們對(duì)人工智能的理解。但一個(gè)核心問(wèn)題也隨之浮現(xiàn):“AI大模型到底需要學(xué)什么,才能具備人類般的智能?”這個(gè)問(wèn)題不只是技術(shù)性的,更觸及哲學(xué)與認(rèn)知的深層結(jié)構(gòu)。
一、語(yǔ)言模型不僅學(xué)語(yǔ)言,更學(xué)語(yǔ)言背后的世界
很多人以為,AI大模型就是不停地學(xué)習(xí)海量的文字,理解上下文,然后自動(dòng)生成新文字。聽(tīng)起來(lái)好像是“熟讀唐詩(shī)三百首,不會(huì)作詩(shī)也會(huì)吟”。但事實(shí)遠(yuǎn)比這復(fù)雜。
語(yǔ)言,是人類用來(lái)表達(dá)認(rèn)知的工具。它并不是孤立存在的代碼,而是對(duì)世界理解的映射。因此,AI要真正理解語(yǔ)言,必須去“學(xué)習(xí)語(yǔ)言背后的世界”。
比如,當(dāng)人類說(shuō)“太陽(yáng)從東方升起”,這不僅僅是一句自然語(yǔ)言句子,而是對(duì)天文現(xiàn)象的認(rèn)知總結(jié)。AI如果只是“看多了這句話”,它也許能復(fù)述,但若它真的“理解”了這句話的本質(zhì),它就必須知道什么是太陽(yáng)、地球、旋轉(zhuǎn)、自轉(zhuǎn)、公轉(zhuǎn)、方向概念等。這是認(rèn)知深度的問(wèn)題。
換句話說(shuō),AI不僅要學(xué)語(yǔ)言,還要學(xué)語(yǔ)言背后的真實(shí)世界建模能力。
二、常識(shí)、邏輯與推理:AI模型通向“理解”的三把鑰匙
人類交流中最常用的是常識(shí)。這種常識(shí)并非教科書內(nèi)容,而是我們?cè)谏钪凶匀恍纬傻闹R(shí)體系,比如:
“水是濕的”;
“火會(huì)燒傷皮膚”;
“如果一個(gè)人餓了,他會(huì)想吃東西”。
這些看似簡(jiǎn)單的判斷,背后涉及的是邏輯、因果關(guān)系、推理鏈條。AI大模型如果要接近人類的智能水準(zhǔn),必須學(xué)習(xí)這些常識(shí),并能夠基于它們做出合理的推理判斷。
但問(wèn)題來(lái)了:常識(shí)本身并沒(méi)有標(biāo)準(zhǔn)化教材。人類是通過(guò)多年生活積累這些知識(shí)的,AI該如何“學(xué)”?目前的做法是訓(xùn)練模型在海量文本中學(xué)習(xí)這些模式,但效果有限。未來(lái)的發(fā)展方向,可能是讓AI在虛擬環(huán)境中“體驗(yàn)世界”來(lái)積累常識(shí)。
有趣的是,越來(lái)越多的研究者嘗試將AI訓(xùn)練成一個(gè)“思維體”,讓它在面對(duì)問(wèn)題時(shí)不是僅僅根據(jù)數(shù)據(jù)匹配,而是能做出有邏輯、有解釋力的推理過(guò)程。
例如,在回答“為什么冬天的白天比夏天短?”這個(gè)問(wèn)題時(shí),一個(gè)真正聰明的AI不應(yīng)只是“找到了答案”,而應(yīng)該能解釋出地軸傾斜、太陽(yáng)直射點(diǎn)變化等科學(xué)原理。這才是“理解”的體現(xiàn)。
三、跨模態(tài)學(xué)習(xí):語(yǔ)言、視覺(jué)與聲音的整合能力
未來(lái)的AI不可能只“看字”,它必須擁有跨模態(tài)的理解能力。
比如,當(dāng)一個(gè)人說(shuō)“我心情很好”,同時(shí)面帶笑容、語(yǔ)調(diào)輕快,一個(gè)真正聰明的AI應(yīng)能同時(shí)捕捉到語(yǔ)言、表情和語(yǔ)音信息,進(jìn)行融合判斷。
因此,AI大模型必須學(xué)習(xí):
視覺(jué)信息的識(shí)別與理解:識(shí)別圖像中的物體、動(dòng)作、場(chǎng)景;
聲音的情感分析與語(yǔ)義提取:從音調(diào)、語(yǔ)速中感知情緒;
多模態(tài)對(duì)齊:將不同來(lái)源的數(shù)據(jù)(文本、圖像、語(yǔ)音)整合成一個(gè)連貫的認(rèn)知場(chǎng)。
當(dāng)前如GPT-4V、Google Gemini等大模型,正在這條路上探索,但依然處于初級(jí)階段。真正實(shí)現(xiàn)“像人一樣理解世界”,還有很長(zhǎng)的路要走。
四、價(jià)值觀、倫理與情境判斷:AI的大腦也需要“心”
這是最難也最敏感的一部分。人類智能之所以不只是冰冷的計(jì)算器,是因?yàn)槲覀冇星楦小⒂袃r(jià)值觀、有倫理判斷。
AI是否也需要“價(jià)值判斷”?答案是肯定的,特別是在它介入人類生活越來(lái)越深入的今天。
試想一下,如果一個(gè)AI醫(yī)生在面對(duì)一個(gè)危重病人時(shí),只從統(tǒng)計(jì)學(xué)角度做出建議,而忽略了病人本人的情緒需求、家庭背景和心理狀態(tài),那它的建議是否真的“人性化”?
因此,AI大模型需要學(xué)的不只是數(shù)據(jù)和邏輯,也需要學(xué)習(xí)“人類如何看待這個(gè)世界”,并具備一定的情境理解與情感建模能力。
目前,一些語(yǔ)言模型開(kāi)始引入“人類反饋微調(diào)”(RLHF)機(jī)制,讓模型在訓(xùn)練中逐步形成符合人類社會(huì)期待的回答風(fēng)格。雖然還稱不上“有倫理”,但已是邁出關(guān)鍵一步。
五、自我學(xué)習(xí)能力:AI的終極目標(biāo)是“學(xué)會(huì)學(xué)習(xí)”
人類最大優(yōu)勢(shì)之一,是可以“學(xué)會(huì)學(xué)習(xí)”。我們可以從一次失敗中吸取教訓(xùn),可以主動(dòng)尋找信息去彌補(bǔ)知識(shí)空白。
AI如果要成為真正的“通用智能”,必須具備某種程度的元學(xué)習(xí)能力,也就是能夠自己發(fā)現(xiàn)不足、設(shè)定目標(biāo)、自主學(xué)習(xí)。
目前大多數(shù)AI模型還是“被動(dòng)學(xué)習(xí)”——由人類設(shè)定訓(xùn)練集、制定優(yōu)化目標(biāo)。而未來(lái)的AI,需要向“自我驅(qū)動(dòng)學(xué)習(xí)”轉(zhuǎn)型。這或許是通向AGI(通用人工智能)的關(guān)鍵門檻。
一個(gè)“會(huì)思考的AI”并不只是回應(yīng)指令,而是會(huì)對(duì)未知感到“好奇”、會(huì)對(duì)沖突產(chǎn)生“疑問(wèn)”、會(huì)對(duì)自己無(wú)法回答的問(wèn)題感到“焦慮”并主動(dòng)去尋找答案。這當(dāng)然是一種模擬的過(guò)程,但卻是極有潛力的一種路徑。
六、現(xiàn)實(shí)世界的反饋:不止停留在模型內(nèi)部的演繹
AI學(xué)習(xí)不僅限于語(yǔ)言、圖像等數(shù)據(jù)形式。它需要的是現(xiàn)實(shí)世界的交互式反饋。
就像一個(gè)人學(xué)騎自行車,單靠看視頻是學(xué)不會(huì)的,一定要上車、摔跤、重新上路,最終找到身體的平衡感。
同樣地,AI模型如果只是“看數(shù)據(jù)”,而不“做事情”,是難以真正理解行動(dòng)與結(jié)果之間的關(guān)聯(lián)性的。因此,未來(lái)的AI學(xué)習(xí)一定是“行為驅(qū)動(dòng)+反饋學(xué)習(xí)”的閉環(huán)系統(tǒng)。
目前,像OpenAI的AutoGPT、Meta的CICERO等嘗試,就是在構(gòu)建讓AI“在世界中行動(dòng)”的環(huán)境,讓它有機(jī)會(huì)做錯(cuò)、調(diào)整、學(xué)習(xí)。
總結(jié)
AI大模型需要學(xué)什么,并不是一個(gè)純技術(shù)問(wèn)題,而是一個(gè)社會(huì)共識(shí)問(wèn)題。
希望AI只是一個(gè)強(qiáng)大的工具?一個(gè)冷靜的分析者?一個(gè)可以共情的智能朋友?
每一個(gè)答案,都對(duì)應(yīng)著AI需要學(xué)習(xí)的內(nèi)容、方式和深度。