发布: 7:30am 30/08/2023 2366点阅

【代码之外】丁源森／AI、ChatGPT与我妈的扫地机器人

作者: 丁源森

编按：

还记得那位写〈黑洞与咸煎饼〉、〈聊一聊暗物质〉等文章的专栏作者丁源森吗？他重返【新教育】执笔写专栏啦！但他这次系列不聊天体物理，而是聊他的另一个研究兴趣——机器学习或所谓的人工智能。

丁源森是2023年TEDx Petaling Street讲者之一，有关活动将于2023年10月14日 9AM到6PM在马华大厦三春礼堂举行。

报名详情：www.facebook.com/TEDxPetalingStreet

上个月，我参加了夏威夷一个机器学习（即大家俗称的AI）会议。有一天，我早早结束了当天的议程，找了家中餐馆填填肚子。刚好，餐馆里只有我一个客人，与店家阿姨闲聊起来，她问我是不是来参加那个机器学习会议。我点点头，她边切菜边半开玩笑地说：“你们这些年轻人做的AI，迟早会害死人类的。”

AI技术的光速前进

自ChatGPT火热登场后，大家对AI和机器学习的关注度似乎瞬间飙升。作为其中一名机器学习的从业者，大家对于它的关注我是乐见其成的。必须说，现在的机器学习，尤其在语言方面是非常令人震撼的。而这背后有许多尚未解决的研究课题，也需要更多的年轻人投入其中。

这种关注是好的。

可是这种变化速度之快，使得许多人难以跟上，也带来了很多的不安和担忧。一是考虑到AI会取代很多岗位；二是类似于核能危机的隐忧，尤其现在在地缘政治的大环境下，大国们都在给AI疯狂砸钱；三是例如餐厅阿姨的“终结者”臆想，即2023年为天网元年，天网获得自我意识，阿诺．斯瓦辛格降临人间，咻咻咻，人类灭绝。

当然对于这种担忧，我不敢妄言是子虚乌有，主要因为机器学习的发展确实太快，作为一个从业人员，最近在这个领域是内卷成新高度，今天说不可能的事情，可能过三五年又换了一个新面目，然后我就被啪啪打脸了。

不过至少从目前情况来看，这种担忧确实很大程度上可能被过度渲染。而在往后的两个月里，我也希望可以透过几篇专栏和大家分享我所了解的机器学习的真实情况。也许了解真相的你会放下心中的那份恐惧。

我们今天先浅谈关于AI与意识的担忧。

机器学习的不同领域

首先，大部分从业者并不喜欢“AI”这个词。AI指的是“Artificial Intelligence”，意为虚拟智能，但现在的技术既不“虚拟”，也不“智能”。在学界，我们更倾向于称之为机器学习或“Machine Learning”。它的本质是让机器通过大量数据学习规律。

而机器学习主要有3个方向——自然语言处理（Natural Language Processing），而大家现在比较熟悉的ChatGPT就属于这个范畴。再者还有电脑视觉（Computer Vision），可能大家比较熟悉的人脸识别或汽车自动驾驶就属于这一范畴。还有就是强化学习（Reinforcement Learning），大家可能比较熟悉的是前几年下围棋的AlphaGo，不过强化学习较大的用途还是在诸如机器人、机械臂等领域。

不过不管是以上哪一个类型，机器学习，如名字所示，其核心都是让机器学习数据中的规律。而因为大部分训练数据（如网络上图像，语言文档等）是人类历史的缩影，其实机器无非就是学习人类的规律。比如说自然语言处理，主要的任务是推算，在有前缀的情况下，这个句子的下一个字，乃至下一句话应该接什么。

虽然有时会有人蹦出来说某个AI模型似乎展现出“人性”，但这种观点在学界并不被广泛接受。实际上，要学习机器学习的门槛不高（我们往后会再深聊），虽然我们不一定会有这么庞大的计算机资源去“练丹”，不过机器学习的原理并不难理解——任何大学本科生只要好好学习，都可以把基本的原理弄懂，并造出自己的模型（这个和奥本海默的核炸弹非常不一样）。

机器思维：真实还是幻觉

确实，体验过ChatGPT的人会对其深感震撼。也不难理解为什么有些人会怀疑现在的语言模型是不是有意识。但这里我们可能有一个盲点，实际上语言模型就只是一个模型。

可能这里的一个悖论在于，对许多人而言，语言是人类最宝贵的能力。确实我们的沟通和社会结构大部分都是基于语言，而复杂的语言也是我们可以区别于其他物种的一个分水岭。所以当一个模型可以把话说得这么像人的情况下，那种震撼可能远比我们看见一个机器人的冲击更大。

但实际上，要知道处理我们语言的大脑前额叶是在近百万年中形成的。相比之下，我们的其他哺乳动物功能，如身体机能和视觉功能，其实早已形成。我们所知的最早的哺乳动物已有数亿年的历史，也就是说，如果我们将哺乳动物的演化过程想像为一天24小时，那么语言最多也是在最后的15分钟出现。

也恰恰因为语言是相对较新的功能，要机器学懂语言的规律，其实比我们身体的其他功能都要简单得太多了，所以也不难理解为什么在目前的机器学习领域里，自然语言处理在泛化（即一学百通）的能力上，比电脑视觉和强化学习领先许多。而其他的机器学习的领域还是面临很多困难的。

以电脑视觉为例，泛化仍然是一个巨大的挑战。这就是为什么自动驾驶技术到了现在仍难以广泛实施，因为即使机器可以通过大量的数据学懂一个场景，环境的微小变化可能会导致其失灵。与人类的能力相比，这仍有很大的差距。

那机器离有意识还远吗？首先，这问题其实有点模糊，因为关于人类的意识本身就存在很多的争论。哲学家和脑科学家们争论了几个世纪，至今仍没有确切答案。机器能否有意识，也许更多地取决于我们如何定义“意识”。但退一步说，即使我们采纳“鸭子论”——如果它看起来像鸭子，走路和叫声都像鸭子，那它就是鸭子。计算机学习其实还是任重而道远。

我们往往高估了语言的能力。尽管语言和逻辑紧密相关（这也是为什么ChatGPT可以解数学题），但人的意识远不止语言与逻辑这么简单。目前的机器学习最多只掌握了那“24小时”中的最后几分钟。

某种程度上，ChatGPT的出现，更多是一种警醒。也许我们很多引以为傲的能力——逻辑、语言等，还不如我们动动一个手指头、眨一眨眼睛困难。在夏威夷时，我和一位我们公认的一个在数学界冉冉升起的同事聊天。他说：“我确实不确定以现在机器学习的发展速度，我的工作（作为数学家）可以多大程度被语言模型取代。但我确信的是，我的工作肯定比一位扫地阿姨先被取代。”

都不要想阿诺哥了。正如我妈经常说的：“为什么我的扫地机器人这么不给力？”

作者简介：
吉隆坡中华独中毕业生，2017年美国哈佛大学毕业，2019年获得美国NASA哈勃奖学金，于美国普林斯顿高级研究院（IAS）研究天体物理，现任澳洲国立大学电机系和天体物理系副教授，专注于利用机器学习技术研究天文大数据的统计推理。

打开全文