机器学习研究的是计算机怎样模拟人类的学习行为,以获取新的知识或技能,并重新组织已的知识结构使之不断改善自身。简而言之,就是计算机从数据中学习出规律和模式,以应用在新数据上做预测的任务。
数据(Data)、学习算法(Learning Algorithm)、模型(Model)是机器学习要素,机器学习的输入是数(Data),学到的结果叫模型(Model)。从数据中学得模型这个过程通过执行某个学习算法(Learning Algorithm)来完成。
机器学习流程:
1.数据预处理
2.机器学习、训练模型
3.模型评估
4.预测新数据
机器学习问题大致划分为监督学习、无监督学习、半监督学习和强化学习四大类:
监督学习:监督学习中的数据集是标签的,就是说对于给出的样本我们是知道答案的。如果机器学习的目标是通过建模样本的特征 x 和标签 y 之间的关系:f (x,θ)或p(y|x, θ),并且训练集中每个样本都有标签,那么这类机器学习称为监督学习。根据标签类型的不同,又可以将其分为分类问题和回归问题两类。前者是预测某一样东西所属的类别(离散的),比如给定一个人的身高、年龄、体重等信息,然后判断性别、是否健康等;后者则是预测某一样本所对应的实数输出(连续的),比如预测某一地区人的平均身高。我们大部分学到的模型都是属于监督学习,包括线性分类器、支持向量机等。常见的监督学习算法有:k-近邻算法(k-Nearest Neighbors,kNN)、决策树(Decision Trees)、朴素贝叶斯(Naive Bayesian)等。
无监督学习:训练样本没标注,常见的无监督学习算法包括:稀疏自编码(sparse auto-encoder)、主成分分析(PCA)、K-Means 算法、DBSCAN
算法(Density-Based Spatial Clustering of Applications with Noise)、 最大期望算法(Expectation-Maximization algorithm, EM)等。 利用无 监督学习可以 解决的问题可以分为关联分析、聚类问题和维度约减。
半监督学习:半监督学习是监督学习与无监督学习相结合的一种学习方法。半监督学习一般针对的问题是数据量大,但是有标签数据少或者说标签数据的获取很难很贵的情况,训练的时候有一部分是有标签的,而有一部分是没有的。与使用所有标签数据的模型相比,使用训练集的训练模型在训练时可以更为准确,而且训练成本更低。
强化学习:强化学习从动物学习、参数扰动自适应控制等理论发展而来,基本原理是:如果 Agent 的某个行为策略导致环境正的奖赏(强化信号),那么 Agent 以后产生这个行为策略的趋势便会加强。Agent 的目标是在每个离散状态发现最优策略以使期望的折扣奖赏和最大。 强化学习在机器人学科中被广泛应用。在与障碍物碰撞后,机器人通过传感器收到负面的反馈从而学会去避免冲突。在视频游戏中,可以通过反复试验采用一定的动作,获得更高的分数。Agent 能利用回报去理解玩家最优的状态和当前应该采取的动作。