編按:
還記得那位寫〈黑洞與鹹煎餅〉、〈聊一聊暗物質〉等文章的專欄作者丁源森嗎?他重返【新教育】執筆寫專欄啦!但他這次系列不聊天體物理,而是聊他的另一個研究興趣——機器學習或所謂的人工智能。
ADVERTISEMENT
丁源森是2023年TEDx Petaling Street講者之一,有關活動將於2023年10月14日 9AM到6PM在馬華大廈三春禮堂舉行。
報名詳情:www.facebook.com/TEDxPetalingStreet
上個月,我參加了夏威夷一個機器學習(即大家俗稱的AI)會議。有一天,我早早結束了當天的議程,找了家中餐館填填肚子。剛好,餐館裡只有我一個客人,與店家阿姨閒聊起來,她問我是不是來參加那個機器學習會議。我點點頭,她邊切菜邊半開玩笑地說:“你們這些年輕人做的AI,遲早會害死人類的。”
AI技術的光速前進
自ChatGPT火熱登場後,大家對AI和機器學習的關注度似乎瞬間飆升。作為其中一名機器學習的從業者,大家對於它的關注我是樂見其成的。必須說,現在的機器學習,尤其在語言方面是非常令人震撼的。而這背後有許多尚未解決的研究課題,也需要更多的年輕人投入其中。
這種關注是好的。
可是這種變化速度之快,使得許多人難以跟上,也帶來了很多的不安和擔憂。一是考慮到AI會取代很多崗位;二是類似於核能危機的隱憂,尤其現在在地緣政治的大環境下,大國們都在給AI瘋狂砸錢;三是例如餐廳阿姨的“終結者”臆想,即2023年為天網元年,天網獲得自我意識,阿諾.斯瓦辛格降臨人間,咻咻咻,人類滅絕。
當然對於這種擔憂,我不敢妄言是子虛烏有,主要因為機器學習的發展確實太快,作為一個從業人員,最近在這個領域是內捲成新高度,今天說不可能的事情,可能過三五年又換了一個新面目,然後我就被啪啪打臉了。
不過至少從目前情況來看,這種擔憂確實很大程度上可能被過度渲染。而在往後的兩個月裡,我也希望可以透過幾篇專欄和大家分享我所瞭解的機器學習的真實情況。也許瞭解真相的你會放下心中的那份恐懼。
我們今天先淺談關於AI與意識的擔憂。
機器學習的不同領域
首先,大部分從業者並不喜歡“AI”這個詞。AI指的是“Artificial Intelligence”,意為虛擬智能,但現在的技術既不“虛擬”,也不“智能”。在學界,我們更傾向於稱之為機器學習或“Machine Learning”。它的本質是讓機器通過大量數據學習規律。
而機器學習主要有3個方向——自然語言處理(Natural Language Processing),而大家現在比較熟悉的ChatGPT就屬於這個範疇。再者還有電腦視覺(Computer Vision),可能大家比較熟悉的人臉識別或汽車自動駕駛就屬於這一範疇。還有就是強化學習(Reinforcement Learning),大家可能比較熟悉的是前幾年下圍棋的AlphaGo,不過強化學習較大的用途還是在諸如機器人、機械臂等領域。
不過不管是以上哪一個類型,機器學習,如名字所示,其核心都是讓機器學習數據中的規律。而因為大部分訓練數據(如網絡上圖像,語言文檔等)是人類歷史的縮影,其實機器無非就是學習人類的規律。比如說自然語言處理,主要的任務是推算,在有前綴的情況下,這個句子的下一個字,乃至下一句話應該接什麼。
雖然有時會有人蹦出來說某個AI模型似乎展現出“人性”,但這種觀點在學界並不被廣泛接受。實際上,要學習機器學習的門檻不高(我們往後會再深聊),雖然我們不一定會有這麼龐大的計算機資源去“練丹”,不過機器學習的原理並不難理解——任何大學本科生只要好好學習,都可以把基本的原理弄懂,並造出自己的模型(這個和奧本海默的核炸彈非常不一樣)。
機器思維:真實還是幻覺
確實,體驗過ChatGPT的人會對其深感震撼。也不難理解為什麼有些人會懷疑現在的語言模型是不是有意識。但這裡我們可能有一個盲點,實際上語言模型就只是一個模型。
可能這裡的一個悖論在於,對許多人而言,語言是人類最寶貴的能力。確實我們的溝通和社會結構大部分都是基於語言,而複雜的語言也是我們可以區別於其他物種的一個分水嶺。所以當一個模型可以把話說得這麼像人的情況下,那種震撼可能遠比我們看見一個機器人的衝擊更大。
但實際上,要知道處理我們語言的大腦前額葉是在近百萬年中形成的。相比之下,我們的其他哺乳動物功能,如身體機能和視覺功能,其實早已形成。我們所知的最早的哺乳動物已有數億年的歷史,也就是說,如果我們將哺乳動物的演化過程想像為一天24小時,那麼語言最多也是在最後的15分鐘出現。
也恰恰因為語言是相對較新的功能,要機器學懂語言的規律,其實比我們身體的其他功能都要簡單得太多了,所以也不難理解為什麼在目前的機器學習領域裡,自然語言處理在泛化(即一學百通)的能力上,比電腦視覺和強化學習領先許多。而其他的機器學習的領域還是面臨很多困難的。
以電腦視覺為例,泛化仍然是一個巨大的挑戰。這就是為什麼自動駕駛技術到了現在仍難以廣泛實施,因為即使機器可以通過大量的數據學懂一個場景,環境的微小變化可能會導致其失靈。與人類的能力相比,這仍有很大的差距。
那機器離有意識還遠嗎?首先,這問題其實有點模糊,因為關於人類的意識本身就存在很多的爭論。哲學家和腦科學家們爭論了幾個世紀,至今仍沒有確切答案。機器能否有意識,也許更多地取決於我們如何定義“意識”。但退一步說,即使我們採納“鴨子論”——如果它看起來像鴨子,走路和叫聲都像鴨子,那它就是鴨子。計算機學習其實還是任重而道遠。
我們往往高估了語言的能力。儘管語言和邏輯緊密相關(這也是為什麼ChatGPT可以解數學題),但人的意識遠不止語言與邏輯這麼簡單。目前的機器學習最多隻掌握了那“24小時”中的最後幾分鐘。
某種程度上,ChatGPT的出現,更多是一種警醒。也許我們很多引以為傲的能力——邏輯、語言等,還不如我們動動一個手指頭、眨一眨眼睛困難。在夏威夷時,我和一位我們公認的一個在數學界冉冉升起的同事聊天。他說:“我確實不確定以現在機器學習的發展速度,我的工作(作為數學家)可以多大程度被語言模型取代。但我確信的是,我的工作肯定比一位掃地阿姨先被取代。”
都不要想阿諾哥了。正如我媽經常說的:“為什麼我的掃地機器人這麼不給力?”
作者簡介:
吉隆坡中華獨中畢業生,2017年美國哈佛大學畢業,2019年獲得美國NASA哈勃獎學金,於美國普林斯頓高級研究院(IAS)研究天體物理,現任澳洲國立大學電機系和天體物理系副教授,專注於利用機器學習技術研究天文大數據的統計推理。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT