机器学习基础笔记 | 1 – 机器学习的定义与分类

——以下内容整理自吴恩达机器学习

机器学习(Machine Learing)定义(在业界没有明确的定义):

不同的人对机器学习有不同的说法:

Sumuel:让计算机能自己学习的领域

(他让计算机跟自己下跳棋几万次,并且学习胜局的经验,最终锻炼出了一个跳棋程序)

Tom Mitchel:一个计算机程序从经验E中学习,去执行任务T,进行一些性能度量P;

通过P测定因为经验E从而在任务T中表现提升了。

机器学习分类

监督学习(Supervisor Learning):

给算法一个数据集,其中包含了正确答案,算法的目的是找出更多的正确答案

这又称之为回归计算。(就是统计学中的那个概念)

当我们给出了一系列数值对,比如一组用药浓度与康复数量的数据,

该算法就能预测其他用药浓度可能产生的康复数量的数据

并且算法可以处理包含更多的属性值与特征的数据(比如用药浓度,加受药者年龄,病情程度等)

实际上,监督学习能解决,拥有无穷多属性值与特征的上述问题,这也是该学习算法的最终目的。

无监督学习(Unsupervised Learning)以聚类算法为例:

与监督学习的差别是,所给算法的数据不再被加上标签。

比如上面的数据,算法能根据数据的某些特征,认为这些值可以被分为两个簇,无监督学习的一大使命,就是为数据进行区分

这里有一系列基因组,无监督学习可以自动区分出哪些基因可能属于同一个物种,这对生命科学有重要的意义。

另外还有一种算法,可以将一些混杂的数据根据某种共性进行提取

比如我在KTV唱歌的声音,与我弹吉他自弹自唱的声音,是可以被这种算法提取出来的

令人震惊的是,上述的算法仅用了一行代码就写出来了(这就是算法的魅力吗)

后面的内容需要一些线性回归和微积分的基础知识,由于我本人已经学过了,所以不再进行记录,有兴趣者可以自行去其他网站学习,这种资源应该相当的多。

发表评论