c94ac1c9e751d1b0376f22229cb471b8.png人工智能的基础是数学,这一点毋庸置疑。数学基础知识蕴含着处理智能问题的基本思想与方法,也是理解复杂算法的必备要素。今天的种种人工智能技术归根到底都建立在数学模型之上,要了解人工智能,首先要掌握必备的数学基础知识,具体来说包括:
  • 线性代数:如何将研究对象形式化?

  • 概率论:如何描述统计规律?

  • 数理统计:如何以小见大?

  • 最优化理论:如何找到最优解?

  • 信息论:如何定量度量不确定性?

  • 形式逻辑:如何实现抽象推理?

1. 线性代数:如何将研究对象形式化?事实上,线性代数不仅仅是人工智能的基础,更是现代数学和以现代数学作为主要分析方法的众多学科的基础。线性代数是利用空间来投射和表征数据的基本工具,可以方便地对数据进行各种变换,从而让研究人员更加直观、清晰地探查到数据的主要特征和不同维度的所需信息,因此线性代数的核心基础地位不言而喻。在机器学习、数据分析中,线性代数到底可以解决哪些问题呢?我们一起来看几个例子:(1)  如何定量描述日程生活中的事物,如个体的不同属性、自然语言中的词语和句子等,来支撑我们所要进行的算法分析?(2)  如何将待处理的数据在不同维度的空间中进行变换处理,以寻找最佳的观测角度,使数据处理达到最好的效果?(3)  如何从采样的海量数据中提取主要特征成分,梳理出数据的主要脉络,从而协助我们对一个文本进行主题建模,并利用协同过滤技术,成功地给用户推荐他们感兴趣的东西?(4)  如何用数字表示图像,并且在不太影响观察效果的前提下,利用很小的存储空间就能近似地达到原有图像的视觉效果?(5)  如何对采集到的观测数据进行拟合,以帮助我们找到其中暗含的规律,对未知数据进行预测?383dc0a6c6433feff731269a890789ab.png总之,线性代数之于人工智能如同加法之于高等数学,是一个基础的工具集。2. 概率论:如何描述统计规律?除了线性代数之外,概率论也是人工智能研究中必备的数学基础。随着连接主义学派的兴起,概率统计已经取代了数理逻辑,成为人工智能研究的主流工具。在数据爆炸式增长和计算力指数化增强的今天,概率论已经在机器学习中扮演了核心角色。3199f3d724508952afbdd93f3537a566.png同线性代数一样,概率论也代表了一种看待世界的方式,其关注的焦点是无处不在的可能性。频率学派认为先验分布是固定的,模型参数要靠最大似然估计计算;贝叶斯学派认为先验分布是随机的,模型参数要靠后验概率最大化计算;正态分布是最重要的一种随机变量的分布。3. 数理统计:如何以小见大?在人工智能的研究中,数理统计同样不可或缺。基础的统计理论有助于对机器学习的算法和数据挖掘的结果做出解释,只有做出合理的解读,数据的价值才能够体现。数理统计根据观察或实验得到的数据来研究随机现象,并对研究对象的客观规律做出合理的估计和判断。虽然数理统计以概率论为理论基础,但两者之间存在方法上的本质区别。概率论作用的前提是随机变量的分布已知,根据已知的分布来分析随机变量的特征与规律;数理统计的研究对象则是未知分布的随机变量,研究方法是对随机变量进行独立重复的观察,根据得到的观察结果对原始分布做出推断。169b0f778ec9a6618cccd56300308bef.png用一句不严谨但直观的话讲:数理统计可以看成是逆向的概率论。 数理统计的任务是根据可观察的样本反过来推断总体的性质;推断的工具是统计量,统计量是样本的函数,是个随机变量;参数估计通过随机抽取的样本来估计总体分布的未知参数,包括点估计和区间估计;假设检验通过随机抽取的样本来接受或拒绝关于总体的某个判断,常用于估计机器学习模型的泛化错误率。4. 最优化理论:如何找到最优解?本质上讲,人工智能的目标就是最优化:在复杂环境与多体交互中做出最优决策。几乎所有的人工智能问题最后都会归结为一个优化问题的求解,因而最优化理论同样是人工智能必备的基础知识。最优化理论研究的问题是判定给定目标函数的最大值(最小值)是否存在,并找到令目标函数取到最大值 (最小值) 的数值。 如果把给定的目标函数看成一座山脉,最优化的过程就是判断顶峰的位置并找到到达顶峰路径的过程。130557abcbb73cda70d62dbd28b99239.png通常情况下,最优化问题是在无约束情况下求解给定目标函数的最小值;在线性搜索中,确定寻找最小值时的搜索方向需要使用目标函数的一阶导数和二阶导数;置信域算法的思想是先确定搜索步长,再确定搜索方向;以人工神经网络为代表的启发式算法是另外一类重要的优化方法。5. 信息论:如何定量度量不确定性?信息论使用“信息熵”的概念,对单个信源的信息量和通信中传递信息的数量与效率等问题做出了解释,并在世界的不确定性和信息的可测量性之间搭建起一座桥梁。总之,信息论处理的是客观世界中的不确定性;条件熵和信息增益是分类问题中的重要参数;KL 散度用于描述两个不同概率分布之间的差异;最大熵原理是分类问题汇总的常用准则。~福利专区~了解了这么多,如何才能把数学基础打牢呢?今天给大家推荐的这本书是《人工智能数学基础》, 面向学习数据科学与人工智能的读者,通俗地讲解每一个知识点,帮助读者快速打下数学基础。 

3358aa7c0d4a5de5f91979b4e73468b7.png

全书分为 4 篇,共 17 章,主要介绍了以下内容:
  • 第 1 篇为数学知识基础篇,主要讲述了高等数学基础、微积分、泰勒公式与拉格朗日乘子法;

  • 第 2 篇为数学知识核心篇,主要讲述了线性代数基础、特征值与矩阵分解、概率论基础、随机变量与概率估计;

  • 第 3 篇为数学知识提高篇,主要讲述了数据科学的几种分布、核函数变换、熵与激活函数;

  • 第 4 篇为数学知识应用篇,主要讲述了回归分析、假设检验、相关分析、方差分析、聚类分析、贝叶斯分析等内容。

数模君联合北京大学出版社一起来给大家送书啦!截至到2020年12月15日19点,我们会在文末评论区选择5位走心留言的小伙伴,免费赠予《人工智能数学基础》一书,获奖名单将于明天推文中公布,大家快来留言吧!(ps:之前领取到书的宝宝,请把机会留给其他同学哦)66a135a9733939d8600f1ef5082a98d5.png
Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐