當OpenAI發佈了ChatGPT,那個月簡直不要太瘋狂。事實上,業內早有大型語言模型在測試中,但都等待著一個先行者。OpenAI勇敢地走在了前列,行業巨頭如谷歌都hold不住了,緊隨其後發佈了自家的Bard模型。
在Bard的示範中,它回答了這樣一個問題:“如何向我的9歲孩子解釋詹姆士·韋伯望遠鏡的某個發現?”Bard說:“韋伯望遠鏡拍下了第一張太陽系外行星的照片。”雖然聽起來感覺沒問題,但如果Bard讀過《星洲日報》的專欄,就會知道這是錯的。儘管韋伯望遠鏡主要用來研究太陽系外的行星和它們的大氣,並擁有高清成像功能,但首張行星照片的記錄其實是20年前的事。(20年前,“自適應光學”Adaptive Optics開始在天文領域流行,尤其應用在8-10公尺的大望遠鏡上。這技術為望遠鏡提供了“降噪”功能,通過調整鏡片消除大氣擾動,使我們能更清楚地觀測遠方的行星。)
ADVERTISEMENT
當Bard的這一錯誤被揭露後,資本市場對谷歌這類大模型的信心大受打擊,谷歌市值蒸發了千億。
深入機器學習:訓練大型語言模型的機制
那麼,為何Bard會犯下這種“幻想”(即一本正經胡說八道)的錯誤呢?要理解這一點,我們首先得了解這些模型的訓練機制。前文曾經提過,機器學習和傳統編程不同的地方在於:我們不再逐個給機器下命令,而是讓機器自己從數據中發現規律。
實際上,機器學習語言的方式跟我們小學的文字遊戲很像,即從網絡上的大量文本中挖掉一些詞,然後嘗試填補空白。例如,“(某某)是馬來西亞的第十任首相”,或“(某某)是馬來西亞的傳統美食”。在這過程中,每個句子裡的關鍵詞都有可能被隱藏,模型的任務就是要猜測這些空格的內容。有時候,一個空格可能有多個合適的答案,因此機器不僅要給出答案,還要給出各種答案的可能性。
看起來簡單,但是模型可以通過這種方式學習到很多東西。就像我們小時候在各種科目做的填空題,雖然填空,但每門課教給我們的東西是不同的,比如語文教我們語法;歷史教史實;數學教邏輯。同樣的,機器也在大量數據中努力學習,彷彿不停地刷題。
大型語言模型就像雲頂高原的老虎機,每次“搖動”都產生不同的輸出。通過大數據訓練,我們就像在老虎機上作弊,使得它的輸出更符合我們的預期。
超越ChatGPT:開源模型的多樣化應用
瞭解這個概念後,你就能明白為什麼Bard突然短路了。詹姆士·韋伯望遠鏡有很多“第一”,它確實重點研究太陽系外行星並擁有先進的成像技術,但把這些信息組合起來卻反而不對,這就像有人問你在馬來西亞應該吃什麼,你回答“Roti Canai夾榴槤配 Laksa。”
雖然當前的AI仍然會犯一些低級錯誤,但是大語言模型的應用不僅僅侷限於簡單地使用ChatGPT,要知道ChatGPT只是眾多大型語言模型中的其中一個。雖然OpenAI已經不再 Open(開源),但眾多模型包括臉書Meta的LLaMa模型系列仍是開源的,而這些開源的模型允許我們在這些訓練模型的基礎上進行微調,進而釋放更多潛力。
這好比你已經有一群優秀的大學畢業生,雖然他們不一定會有特定領域的專長,比如說天體物理的一些特定知識,但如果可以讓這些模型再“進修”,那麼它就可以發揮更大的能量。
這正是我的研究團隊正在探索的其中一個方向。
讓AI看懂30萬篇天文論文
最近我們的團隊對這些開源模型進行了微調,利用過去30年天文科學期刊發佈的大約30萬篇文章對其進行訓練,訓練方法和上述說的文字填空和接龍是一樣的。當然,這裡對於模型的訓練還包括我們的一些小巧思。比如說讓兩個語言模型“對戰”,其中一個模型扮演學生回答天文問題,另一個則扮演教授點評學生的答案,兩者互相競爭。(這裡就不談技術細節了)
其實我們一開始也沒底,就覺得可以試一試。模型的表現確實讓大家很震驚,比如說我們嘗試用AI生成天文學博士論文的研究方向,並請天文物理學家評分。評分結果顯示,AI生成的論文題目在專家眼中甚至優於一般天文物理博士生能夠提出的論文方向,一些同事不禁戲稱:“真的不能讓你繼續搞下去,不然我們都失業了。”
必須說明的是,我們的目標並非取代人類工作,但我們必須接受的是,在這個新的時代裡,AI生成的答案已儼然成為了評價的基線,只有超越AI的答案才被視為有價值。雖然這麼說感覺有點殘忍,但這未嘗不是好事,因為AI把所有人的基準能力都拔高了一個緯度。要知道每個人都有自己的特長,而這些特長大概率還是比目前的模型更好,但是模型卻可以補足每個人在其他方面的短板。
比方說,我以前覺得自己做研究還可以,但比較苦惱的是如果要我用英文寫期刊文章,我就覺得對我這種非英語母語的人特別吃虧。雖然現在的模型不見得能寫出媲美狄更生和王爾德的大作,但我卻可以享受著類似用母語寫作的暢快。
AI:平等的橋樑與公正的裁判
從宏觀角度來看,我樂觀地認為無論是回顧歷史還是展望未來,這些AI模型將促進人與人之間的平等,併為弱勢群體創造更多機會。
比如說,以前我們時常依賴某些指標,例如論文的被引用次數來評估一個人對於某個領域的貢獻,但學術界其實並非完全公正。有時候,一些普通的論文莫名火起來,而其他有價值的論文卻可能因為種種原因被埋沒,所以這些指標往往並不能很公平地去評斷一篇學術論文的價值。而我們的研究團隊正在研究的其中一個方向,就是用我們微調後的模型去讀遍所有論文,忽略人為的主觀評價,客觀地分析所有文章,從而找出任何一個能推進這個領域的真正先驅。
至於展望未來的部分,AI也只會讓科技更加平等與開放。以天體物理為例,這是一個高投資的研究領域,可惜絕大部分的人再有才識也可能只屈就於一些崗位上,找不到人去交流。但微調後的大型模型可以獨當一面,能力未必比各個領域的博士們差,可以成為弱勢研究者的研究夥伴,不讓個人際遇妨礙他們的成就。這也是我們團隊做這項研究的最大初衷,而我們的團隊也逐步在網上公開所有AI生成的天體物理博士論文方向。
還記得IBM的深藍嗎?
有人說,AI的出現是人類的消亡,可是要知道這種論述在歷史上從來沒有斷過,但是也從來沒有預言成真過。
還記得IBM的超級電腦深藍曾經擊敗國際象棋大師卡斯帕羅夫嗎?當時有人悲觀地認為國際象棋已經結束了,但在二十多年後的今天,人們反而可以在任何地方、任何時間和AI對弈及學習,我們看見的是國際象棋更加昌盛,在很多非傳統強國也是遍地開花。
更多相關文章: 【代碼之外】丁源森/做AI時代裡的 六邊形戰士 【代碼之外】丁源森/論AI的養成與黯然銷魂飯 【代碼之外】丁源森/AI、ChatGPT與我媽的掃地機器人
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT