Local EPUB Text
第二波浪潮:商业智能化
第一波人工智能浪潮的基础是给互联网用户的浏览数据贴标签,而商用人工智能则是给传统公司数十年来积累的大量专业数据贴标签,如保险公司理赔事故中鉴别保险欺诈,银行核发贷款时记录还款率,医院保存医疗诊断记录及患者存活率等。这些活动产生了大量带有标签,即自带特征及含义的数据。但直到最近才有部分传统公司找到方法,更有效地利用这些数据。
商用人工智能从这些数据库中挖掘人类往往会忽视的隐性联系,参考以往的决策与结果,利用贴了标签的数据训练算法,最终使其超越经验最丰富的人类从业者。这是因为人类通常根据强特征(strong features)来做出预测,而与结果高度相关的数据,通常是直接的因果关系。例如在预测患糖尿病的可能性时,此人的身体质量指数(BMI)是强特征。而人工智能算法除了会把这些强特征纳入考虑,同时也不放过其他的弱特征(weak features)——这些数据点可能表面上和特定结果无关联性,但是把数千万个例子结合起来后,可以发现一些对预测结果有帮助的重要联系。这些细微的关联性往往没人能解释清因果,例如为何在星期三取得贷款的借款人往往能较快地偿还贷款。但是,使用人脑难以理解的复杂数学关系,把许多强特征和弱特征结合起来的算法,能在许多商业分析工作上胜过技术顶尖的人类。