为什么说算法不是人工智能的核心

问题这句话实际放在人工智能这一波浪潮里面是讲的通的,但放在每一个AI项目里,又似乎不太通了。懵了?我这里详细展开讲讲。

首先讲讲人工智能浪潮的核心

当然,这波浪潮,大数据和算力爆炸是基础,但算法依然是核心。

凭什么算法是核心,大数据和算力只能当基础?这算是一个语文问题。关于核心的理解,我是这么想得

  • 第一、所谓核心,就是处于一个非常重要地位,缺少它不行,但它不能单独发挥作用的部分。算法在这波浪潮里,就具有这个特征。你也许会说,大数据不也有这个特征吗?那我就要讲到第二个特征了。
  • 第二、核心连接一个系统的各部分,承上启下,使得各部分一起合力发挥作用。而算法,就是在这波浪潮里起了这么个作用。
  • 第三、核心的能力增强,对系统各组成部分的要求会提高;核心的能力削弱,系统各部分的能力就有冗余。

你也许好奇,咦,为啥是「这波」,之前还有吗?是的,其实是第三波了。当然,其实前两波浪潮也是以算法为核心。事实上,人工智能的研究从1956年就开始了,1956年在达特茅斯学院举行的一次会议上正式确立了人工智能的研究领域。这三波浪潮分别是[1]

第一波发生在1950年至1970年,当时的主要工作是计算机科学家在从事机器推理系统,同时发明了早期的神经网络和专家系统。这一时期的理论流派被称为符号主义。
第二波出现在1980年至2000年。我们现在讲的统计学派、机器学习和神经网络等概念,在这一阶段都已提出。此时的主流理论流派被称为联结主义。
第三波是在2006年之后,主要得益于大数据的推广。谷歌利用大数据成功地对流感进行预测,引起了卫生部门的关注,这是大数据和人工智能密切关联的一个重要例子。在这一波浪潮中,人工智能技术及应用有了很大的提高,以神经网络为中心的算法取得突破。

事实上,第一波开始,算法就成为人工智能的核心了。

不过你也许会疑问,为啥人工智能以前没进入大众视野,近些年才进入大众视野呢?

第一,技术的发展并不是一波浪潮就能完成的。

吴军博士在《见识》[2]一书中有个比喻——「第三眼美女」,这个比喻未必恰当,却比较容易记忆,对于很多产品,例如平板电脑,VR都适用。

第三眼美女当然是相对“第一眼美女”和“第二眼美女”而言。
第一眼美女有什么特点呢?首先。一眼看上很漂亮,但不属于大众范畴。这里面有很多原因,或者是因为他们本身就认为自己是精英人群而非主流人群,或者是因为这些人光芒四射,一般人想接近也接近不了他们。总之,大众只能在远距离去欣赏他们。其次,人有时会看走眼,咋一看很漂亮,接近以后如果发现没有内涵,看第二眼、第三眼时,未必还能有最初的印象。
第二眼美女未必有第一眼那么天生丽质,因此她们常常需要更懂得时尚细节才能周围人的眼光。但这样一来,和第二眼美女交往的成本就比较高,大众心里直痒痒,也未必得到;即使得到,第二眼美女脾气也未必好,因此双方蜜月期一过,可能就形同陌路了。
第三眼美女是属于大众范畴的,他们未必那么显眼,但是如果仔细观察,他们还是不错的。更重要的是,因为他们可能没有光线的外表,如果依然能够吸引人,那么必定有某种美德的价值。而对去欣赏这种美德或看重这种价值的人来讲,他们对第三眼美女的喜欢会持久很久,除非这种美德和价值不付存在。

一般一个新技术或者产品出现,都要经历三波浪潮得发展才能成熟并走入寻常百姓日常生活。

第二,核心走得太快,外部因素走得太慢。其实很多目前广泛应用的深度学习算法,是上个世纪提出得。例如目前自然语言处理领域广泛使用的LSTM,是Hochreiter和Schmidhuber于1997年提出的;图像领域常用CNN,前身是1980年 Kunihiko Fukushima 提出的neocognitron 。后经LeCun等人的研究,在20世纪 90 年代的确立了CNN的现代结构。那时候这些深度学习为啥没有被大家所认识?因为那时候算力和数据量都还不够,难以广泛应用。

为啥算法不是AI产品的核心

看到这个标题,你也许就懵了。前面说是核心,这里说不是核心,你这是不是乱说的?当然不是,听我慢慢细说。

做AI产品,很多公司很容易陷入一个误区:追求更新更强大的算法,而忽略和业务的吻合度、没认真考虑成本。

但做产品绝大多数情况下,都不是追求前沿技术。Product Market Fit才是最重要的。

如果你看我的主页,你会发现我是做AI反洗钱、金融风控的,你也许会认为我在应用最先进的算法来打击金融犯罪。事实上,为了Product Market Fit,包括蚂蚁金服等大公司在内的高科技公司,依然还会用Random Forest这种二十年前的算法。为啥?不就是Product Market Fit嘛

  • Product:最大限度的预测金融风险。
  • Market:出于监管要求,算法需要可解释性,不能黑箱子。
  • Fit:只好选Random Forest这种解释性还行的算法。

人工智能第三波浪潮的确是带来了先进得深度学习算法,把AI带入了大众视野,但不代表你就要用这一波浪潮里产生的算法,你可以用上一波浪潮的算法,来解决现在的问题。

在具体的AI产品中,算法就显得不那么核心了。原因:

  • 并非越先进越好。前面在Product Market Fit举了个例子了。
  • 可以被架空,替换。今天我不用Random Forest,还可以用XGBoost。
  • 在复杂化的产品里,花在算法上的时间越来越少了。在论文《Hidden Technical Debt in Machine Learning Systems》[3]里,有一张图非常好,解释了每个部分的占比。其中中间那个小到几乎看不到的黑色小方框就是机器学习代码,也就是算法。

总结

之所以说算法是AI浪潮里面的核心,但不是AI产品的核心,是因为算法发展直接推动浪潮往前发展,但并不能决定某个AI产品成功。

如果看到这里,你还是不能理解为啥算法在AI浪潮里是核心,但在AI产品中不是核心,没关系。如果你能从中学到,做AI产品,良好的工程实践实践(工程角度)以及Product Market Fit(产品设计角度)才是核心,那也算是帮到你了。

参考

  1. ^人工智能发展正迎来第三波浪潮 http://www.xinhuanet.com/tech/2019-07/30/c_1124813935.htm
  2. ^《见识》——吴军
  3. ^Hidden Techinical Debt in Machine Learning Systems https://papers.nips.cc/paper/2015/file/86df7dcfd896fcaf2674f757a2463eba-Paper.pdf

版权声明:本文为qq_35656655原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。