前些时候和马来西亚华语辩论圈的友人吃饭时谈到在大数据(Big Data)、数据驱动决策(Data Driven Decision)以及人工智能(Artificial Intelligence)挂帅的年代,我们应该全然听信于机器或演算程式以大数据为基础所推导出的结论吗?我的看法如下:
(一)大数据和人工智能能精算出下一步决策布局的最佳选项,但无法准确精算出最终结果。因为现实世界是多原一果和多原多果的混沌生态;再加上这是光速年代,变数太多、变幻太快,我们很难以传统实验室里头的假定(如一些常态永不变化,一些条件不会对实验对象起作用),来准确区隔(isolate)现象、条件、成因和结果。
(二)世界知名对冲基金Bridgewater的创始人Ray Dalio提醒,当大多数人倚赖同一性质的人工智能系统来做市场投资决策时,市场的总体投资思维会趋同。这时基金经理需要反其道而行来出奇制胜。这是经典的逻辑悖论:你需要人工智能系统来了解它的最新推算结论和缺陷,然后做出超越机器逻辑运算盲点的决策。
(三)人类通过所采集和供给人工智能系统的数据,把自己的主观认知、偏好和偏见内置(build in)在人工智能的演算程序里。大数据驱动(Big data driven)的演算结论可能是逻辑架构最严谨和缜密的结构性偏瑕。它所造成的预设性偏见和歧视也可能最无远弗屆。
(四)业者、学者和科研人员迄今仍旧无法完全理解以机器学习和深度学习为主轴的人工智能之内在运作逻辑。人们只知道人工智能系统能够从数据中梳理出常人甚至是专家所无法轻易辨识出的模式,并以这些隐晦但遵循特定模式的方程式来预测市场走向、各种决策选项的利弊和执行结果。有学者因此倡议学术机构设立机器行为学学科,以类似研究动物行为和人类行为的社会科学框架,来观测和理解人工智能系统在不同客观条件下与周遭生态系统的互动。
有兴趣钻研或投资人工智能商业项目的朋友,务必理解它的局限性。现在市面上最火热的人工智能分支是深度学习 – Deep Learning(机器学习Machine Learning)。大概在30年前,当我们还没有这些时髦的名称时,我们称这项技术为人工神经网络(Neural Network)。
近年来,深度学习技术所促成的丰硕科研成果和商业应用,是建基于电脑处理器、数据存储载体等相关硬件的提升,以及数据数码化所带来的丰厚大数据 - 因此人工智能系统能够在极短的时间内演算出结果。
然而,在过去的30年里,人工神经网络科学原理本身,并没有太大的改变或呈质的飞跃。
人工智能科研人员坦诚,他们只能在事后下结论,人工智能的演算非常具有洞见、非常精准。但,科研人员无法完全推导出人工智能之所以精准的科学逻辑。
换句话说,迄今为止,由于人们只能靠人工智能来推断出数据的相关性,而非因果关系,我们并没有一百巴仙的把握来确定人工智能运算结果的准确性。
无论如何,我们不需要对人工智能当下的局限太过悲观。鉴于人工智能日益广泛的介入公共机关、私人企业以及个体户的日常决策,与其完全自外于人工智能的发展,不如积极跟进、掌握和介入它的演变趋势,并充分发挥它的强项、提防它的误区。安德森·霍洛维茨基金(Andreessen Horowitz VC Firm)合伙人陈风雷(Frank Chen)就提出了人工智能演算法与人类智慧互补、相互增强的协作模式。他举例,智能手机的拼音检查和语法纠错系统,确实帮助人们快速输入日常沟通字句并减少差错,然而,我们也不时遭遇到词不达意的错误输入建议,而不得不否决系统的提议。这个“人机互补”的日常个案充分刻画出了人类与人工智能协作所能带来的乘数效应。