机器学习开篇之机器学习的分类|全球新资讯

2023-05-24 21:32:53 来源:马士兵AI程序员

目录

1 引言


【资料图】

2 机器学习分类

2.1 监督学习(Supervised Learning)

2.1.1 传统监督学习

2.1.2 非监督学习

2.1.3 半监督学习

2.1.4 其它分类

2.2 强化学习(Reinforcement Learning)

3 总结

1 引言

首先,我们给出四个机器学习任务

教计算机下棋 垃圾邮件识别,判断是否是垃圾邮件 人脸识别,识别这个人是谁 无人驾驶,从一个地点到达另一个地点

以上四个任务,可以把它分成两类,你会怎么分呢?分类的标准又是什么呢?

我们可以将以上四个任务分为两类。仔细想想这四个任务,其实我们很容易想到1、4为一类,2、3为一类。那么我们的分类标准又是什么呢?根据我们上一节介绍的定义机器学习的三个量有任务T、性能指标P和经验E (见此篇文章的逻辑定义) 。在上面的三个量中,我们只能 根据经验E来进行分类。

2机器学习分类

2.1监督学习(Supervised Learning)

在任务2和3中,我们需要进行垃圾邮件识别和人脸识别,经验E即为垃圾邮件数据和人脸数据,而 这些数据都是通过 人工收集 的并输入到计算机中的。

在垃圾邮件识别中,我们需要收集大量的垃圾邮件和非垃圾邮件数据(我们所称的 训练数据 ),并告诉计算机这是垃圾邮件,这不是垃圾邮件,即给我们收集的 数据打标签 。最后再输入到计算机中。同样的,对于人脸识别,我们也需要大量人脸数据并告诉计算机这个人是谁(给数据打标签)最后在输入到计算机中。通过以上例子, 我们也可以得到经验E就是训练数据样本以及对应数据标签的合集。

我们把这类 由人工采集数据以及相应标签输入计算机 的机器学习方法称为 监督学习

对于监督学习,我们还可以 根据 数据标签是否存在 将其分为 传统监督学习 、 非监督学习 、 半监督学习 三类。

2.1.1 传统监督学习

每一个数据都有对应标签 ,即称为传统监督学习 。对于传统监督学习中,我们会学到的算法主要包括:

支持向量机(Support Vector Machine) 人工神经网络(Neural Networks) 深度神经网络(Deep Neural Networks)

但不仅仅局限于这几种算法。

2.1.2 非监督学习

所有的数据都没有对应的标签 ,即称为非监督学习。 为什么没有标签的数据也能进行分类呢?这里举一个简单的例子。

在一个二维空间中有一些样本点,我们不知道这些训练样本的数据类别,这里, 我们需要假设一个条件:在空间中相聚更近的点即为一类 ,如果这个假设成立我们就可以根据样本空间的信息,设计算法将其聚集为两类,从而实现没有标签的机器学习,即无监督学习。主要用到的算法有:

聚类算法(Clustering) EM算法(Expectation-Maximization) 主成分分析(Principle Component Analysis)

但不仅仅局限于这几种算法。

2.1.3半监督学习

一部分数据有标签,一部分数据没有标签 ,即称为半监督学习。 半监督学习的运用非常广泛,随着互联网的不断发展,数据量不断增大。进行数据标签的成本也越来越大。因此, 利用少量标注数据和大量没有标注的数据 训练一个更好的机器学习算法,成为了机器学习领域的热点之一。

2.1.4 其它分类

另外,我们还可以 根据标签的固有属性 将监督学习分为两类。

分类(Classification):标签是离散的值 回归(Regression):标签是连续的值

对于分类 ,例如在人脸识别中,我们把两张图片是同一个人记为1,不是同一个人记为0,这些标签就是由离散的0和1组成的,因此是分类问题。

对于回归 ,标签是连续的值。例如设计算法预测房价走势、股票走势、预测温度等等都属于回归问题。其实在某种情况下, 分类和回归的界限是非常模糊的,因为连续和离散之间的关系也是非常模糊的,它们二者可以相互转化。

2.2 强化学习(Reinforcement Learning)

在任务1和4中,经验E则不是人为进行数据收集获得的,而是 由计算机与外界环境进行互动获得的。 计算机随机的产生行为,同时获得改行为的结果,而我们的程序需要 通过定义这些行为的 收益函数 ,对行为进行奖励或者惩罚。 例如计算机下棋,如果下赢了,我们就进行奖励;如果下输了,我们就进行惩罚。同样的对于自动驾驶,如果到达终点,我们就进行奖励;如果没有到达终点或者中途出了事故,我们就进行惩罚。

同时,我们需要 设计算法让计算机自动的改变自己的行为模式来 最大化收益函数 ,完成机器学习任务的过程。即 通过计算机与环境的互动逐渐强化自己的行为模式达到一个最佳的效果 ,称之为 强化学习

3 总结

首先,根据任务 是否需要与外界交互获得经验E ,将机器学习分为两大类;一类是不需要与外界环境交互, 人工收集数据 的 监督学习 ,另一类是 需要与外界交互获得 的 强化学习

其次,我们对监督学习进行了细致的分类。根据训练样本是否有标签我们将其分为三类:

训练数据 全 部都 有 对应标签—— 传统 监督学习 训练数据 全 部都 没有 标签—— 非 监督学习 训练数据 一部分有 标签, 一部分没有 标签—— 半 监督学习

另外,监督学习还有另一种分类方法,根据标签是否是离散的可以分为两类:一类是训练数据对应标签,全部是 离散 的值,我们 称为 分类 ;另一类是其训练数据对应标签为 连续 的值,我们 称为 回归

如有不对,敬请指正

觉得好的小伙伴就点个赞吧~~

标签:

机器学习开篇之机器学习的分类|全球新资讯

目录1引言2机器学习分类2 1监督学习(SupervisedLearning)2 1 1传统监督学习2 1 2非监督学习2 1 3半监督学

2023-05-24 21:32:53

6比2大胜沧州雄狮 斯坦利暂时摆脱信任危机

京报体育|记者王洋5月23日晚,北京国安队坐镇主场新工体,凭借张稀哲、王子铭、姜祥佑、高天意和杨立瑜的进

2023-05-24 20:31:58

大连人vs浙江首发:37岁阎相闯、林良铭先发,穆谢奎出战-环球速讯

19点35分,中超第9轮,大连人主场迎战浙江队。大连人首发:1-张翀、2-林隆昌、4-劳烈斯、18-何宇鹏、14-黄

2023-05-24 19:15:20

安卓不再清后台 OPPO Reno10系列用上16GB大内存:48个月流畅

快科技5月24日消息,OPPO今天下午发布的Reno10系列不仅全系标配了长焦镜头,同时也升级了硬件配置,用上了1

2023-05-24 19:06:59

梧桐树保险是正规的保险公司吗 全球新资讯

梧桐树保险是正规的保险公司。梧桐树是一个正规的保险公司,旗下的各款保险也都正规靠谱,用户可以放心投保

2023-05-24 18:00:13

中海珑悦理即将入市

据介绍,中海珑悦理地处深圳北站超核片区核心位置,携城市漫步主义回应核中之核的焕新城市界面,为城市新贵

2023-05-24 17:39:35

山西10岁男孩失联身亡,嫌疑人系生母与继父 知情人:生母曾称是孩子偷钱挨打后跑了-天天新消息

5月24日,山西临猗县公安局通报:5月4日,临晋镇居民谢某某向临猗县公安局报案,称其10周岁的儿子张某某5月

2023-05-24 16:30:59

国泰航空行政总裁林绍波再次致歉:将成立跨部门小组改善服务

5月24日,国泰航空行政总裁林绍波在广州出席活动时,对国泰航班CX987歧视非英语乘客的事件再次致歉,他说:

2023-05-24 16:08:10

火影忍者忍术结印大全图片_火影忍者忍术结印大全

1、火遁*大火球之术:巳-未-申-亥-午-寅火遁*凤仙火之术:子-寅-戌-丑-卯-寅火遁*火龙炎弹:

2023-05-24 14:43:27

全球微头条丨淘宝买流量要验证码_淘宝买流量

1、是真实的,但有些也是假的,所以你去买的时候看下他的店铺。2、看有没有保证金哇,店铺评价,销量这些怎

2023-05-24 14:34:29
x 广告
x 广告

Copyright ©  2015-2022 北极经营网版权所有  备案号:浙ICP备2022016517号-19   联系邮箱:514 676 113@qq.com