数学不好,怎么办?这6大数学技能,AI “必备”


数学一直是任何当代科学学科的基础,包括所有的机器学习都有一些深刻的数学知识。

有些人会问,人工智能的数学基础知识有哪些?这其实是准备转行人工智能学习者的共同问题。

如果你在学习机器学习,深度学习的过程中遭遇挫折,多半是由于数学知识的阻碍。为了搞懂这个问题,小编到处搜索答案,最终找到知乎的这个回答最为切合,那些上来就是贝叶斯、凸优化、矩阵论的还是好高骛远了一些。


摘自知乎的回答


作者:者也


以上是个人读研以来感受用得最多的数学基础课,挂一漏万,大侠请补充指正


高等数学是基础中的基础,研究生以上级别的一切理工科都需要这个打底,数据挖掘、人工智能、模式识别此类跟数据打交道的又尤其需要多元微积分运算基础


线性代数很重要,一般来说线性模型是你最先要考虑的模型,加上很可能要处理多维数据,你需要用线性代数来简洁清晰的描述问题,为分析求解奠定基础


概率论、数理统计、随机过程更是少不了,涉及数据的问题,不确定性几乎是不可避免的,引入随机变量顺理成章,相关理论、方法、模型非常丰富(比如说问题里提到的贝叶斯网络),是个庞大的工具库,不可不会


再就是优化理论与算法,除非你的问题是像二元一次方程求根那样有现成的公式,否则你将不得不面对各种看起来无解但是要解的问题,优化将是你的GPS为你指路


有以上这些知识打底,就可以开拔了,针对具体应用再补充相关的知识与理论,比如说一些我觉得有帮助的是数值计算、图论、拓扑,更理论一点的还有实/复分析、测度论,偏工程类一点的还有信号处理、数据结构
人工智能 实际上是一个将数学、算法理论和工程实践紧密结合的领域。AI 扒开来看就是算法,也就是数学、概率论、统计学、各种数学理论的体现。

今天小七给大家整理了一份最基本的数学技能指南,帮助你更好的学习数学,一起来看看吧~~

1 函数、变量、方程、图

1.png


What:从基本的知识开始,如线的方程式到二项式定理及其性质。

• 对数、指数、多项式函数、有理数

• 基本几何和定理,三角恒等式

• 实数和复数的基本属性

• 级数、总和和不等式

• 图表和绘图、笛卡尔和极坐标系统、圆锥曲线

示例:如果想了解在排序后在百万项目数据库上搜索的运行速度,你将会遇到二进制搜索的概念。为了理解它的行为,需要理解对数和递推方程。或者是分析时间序列的话,可能会遇到周期函数和指数衰减等概念。

学习资源:

数据科学数学技能——Coursera

https://www.coursera.org/learn ... kills

代数简介——edX

https://www.edx.org/course/int ... rax-1

代数——可汗学院

https://www.khanacademy.org/math/algebra

2 统计

2.jpg


What:数理统计的研究对象则是未知分布的随机变量,研究方法是对随机变量进行独立重复的观察,根据得到的观察结果对原始分布做出推断。该领域的许多从业者实际上称经典机器学习(非神经网络)只是统计学习。该主题内容非常广泛,重点规划大多数的基本概念即可。

• 数据摘要和描述性统计、集中趋势、方差、协方差及相关性

• 基本概率:基本概念、期望、概率演算、贝叶斯定理、条件概率

• 概率分布函数:均匀、标准、二项式、卡方、学生t分布、中心极限定理、

• 采样、测量、错误、随机数生成

• 假设检验、A / B检验、置信区间、p值,

• 方差分析、t检验

• 线性回归,正则化

示例:在面试时,作为一名潜在的数据科学家,如果你能掌握上面提到的所有概念,你会很快地给对方留下深刻的印象。作为数据科学家,你几乎每天都会使用上述中的一些概念。

学习资源:

▪ R专业统计学——Coursera

https://www.coursera.org/speci ... stics

▪ 使用Python进行数据科学的统计和概率—— edX

https://courses.edx.org/course ... urse/

▪ 商业统计与分析专业—— Coursera

https://www.coursera.org/speci ... lysis

3 线性代数

3.png


What:社交网络软件上的朋友推荐、音乐APP中的歌曲推荐以及使用深度迁移学习将自拍照转换为其它风格的图像,这些都有用到线性代数的知识。线性代数是数学领域的一个重要分支,用于理解大多数机器学习算法如何在数据流上工作以创建洞察力。以下是要学习的基本内容:

• 矩阵和向量的基本属性——标量乘法、线性变换、转置、共轭、秩、行列式

• 内积外积、矩阵乘法法则和各种算法、逆矩阵

• 特殊矩阵——方阵、单位矩阵、三角矩阵、稀疏和密集矩阵、单位向量、对称矩阵、埃尔米特矩阵、斜埃尔米特矩阵和酉矩阵,

• 矩阵分解、高斯/高斯-若尔消除法,求解Ax = b方程的线性系统

• 矢量空间、基、跨度、正交性、线性最小二乘,

• 特征值、特征向量和对角化,奇异值分解(SVD)

示例:如果你使用过主成分分析(PCA)降维技术,那么你可能已经使用过奇异值分解来实现数据集的紧凑维度表示,使得参数更少。所有神经网络算法都使用线性代数技术来表示和处理网络结构和学习操作。

学习资源:

▪ 线性代数基础—— edX

https://courses.edx.org/course ... urse/

▪ 机器学习数学:线性代数——Coursera

https://www.coursera.org/learn ... rning

4 微积分

4.png


What:无论你在大学期间喜欢它还是讨厌它,在机器学习或数据科学领域的许多地方都会应用微积分的概念。它隐藏在线性回归中最小二乘问题的简单分析解决方案背后,或者嵌入到神经网络学习新模式的每个反向传播中。以下是要学习的内容:

• 单变量、极限、连续性和可微性的函数

• 中值定理、不确定性和洛必达法则

• 极大值和极小值

• 乘积和链式法则

• 泰勒级数、无穷级数求和/积

• 积分计算和中值定理、对有限和不正确积 分的评价,

• Beta和Gamma函数

• 多变量函数、极限、连续性、偏导数

• 普通和偏微分方程的基础知识

示例:如何实现逻辑回归算法,它很有可能使用一种称为“梯度下降”的方法来找到最小损失函数。要了解其如何工作,需要使用来自微积分的基本概念——梯度、导数、极限和链式法则。

学习资源:

▪ 大学前掌握的微积分——edX

https://www.edx.org/course/pre-university-calculus

▪ 可汗学院的微积分全部内容

https://www.khanacademy.org/math/calculus-home

▪ 机器学习数学:多变量微积分——Coursera

https://www.coursera.org/learn ... rning

5 离散数学

5.png


What:这部分内容通常是“数据科学数学”方案中较少讨论的主题,但事实是所有现代数据科学都是在计算系统的帮助下完成的,离散数学是这类系统的核心。要学习的内容:

• 集合、子集和幂集

• 计数函数、组合学、可数性

• 基本证明技术——归纳法、反证法

• 归纳、演绎和命题逻辑的基础知识

• 基本数据结构——堆栈、队列、图、数组、哈希表、树

• 图表属性——连接组件、度、最大流量/最小切割概念、图形着色

• 递归关系和方程

• 函数的增长和O(n)符号概念

示例:在任何社交网络分析中,你需要知道图的属性和快速算法以搜索和遍历整个网络。在选择任何算法时,都需要通过使用 O(n)表示法来了解时间和空间复杂度。

学习资源:

▪ 计算机科学专业的离散数学概论—— Coursera

https://www.coursera.org/speci ... atics

▪ 数学思维导论——Coursera

https://www.coursera.org/learn ... nking

▪ 掌握离散数学:集合、数学逻辑—— Udemy

https://www.udemy.com/master-discrete-mathematics/

6 最优化、运筹学

6.png


What:这些主题与应用数学中的传统话语没什么不同,因为它们在专业领域——理论计算机科学、控制理论或运筹学中最为相关和最广泛使用。实际上,每种机器学习算法旨在最小化受各种约束影响的某种估计误差,这就是优化问题。要学习的内容:

• 优化的基础——如何制定问题

• 最大值、最小值、凸函数、全局解

• 线性规划、单纯形算法

• 整数规划

• 约束编程、背包问题

示例:使用最小平方损失函数的简单线性回归问题通常具有精确的解析解,但逻辑回归问题却没有,要理解其中的原因,需要了解优化中凸性的概念,这也将阐明为什么我们必须对大多数机器学习问题中的“近似”解决方案能够满意。

学习资源:

业务分析中的优化方法 ——edX

https://courses.edx.org/course ... urse/

离散优化—— Coursera

https://www.coursera.org/learn ... ation

确定性优化 ——edX

https://www.edx.org/course/det ... ion-0

1 个评论

感谢小编码字

要回复文章请先登录注册

返回顶部