貌似有几天没有更新博文了,主要是最近事情比较多,要看论文,为开题做准备,并且本轴六需要和老师一起汇报,但是,对于机器学习等相关的事情我还是放不下,因此忙里抽闲,准备看一本电子书,书名《图解机器学习》 还是之前那个原则,我觉得博文看书记笔记特好,很方便,因此主要是为了给自己记笔记,如果我记得笔记对你也有用,那就最好不过了,好啦,咱们闲话少说,开始看书吧。
Standing on Shoulders of Gaints 机器学习领域是深不可测的吗?人工智能是天方夜谭吗?时至今日,机器学习研究的重要性与可行性已得到广泛承认,并在模式识别、通信、控制、金融、机器人、生物信息学等许多领域都有着广泛的应用。 大部分最新的机器学习算法们都是在最经典的算法——最小二乘法的基础上发展起来的。什么是机器学习? 机器学习就是计算机具有像人一样的学习能力的技术,是从堆积如山的数据(也称大数据)中寻找出有用知识的数据挖掘技术。通过运用机器学习技术,从视频数据库中寻找出自己喜欢的视频资料,或者根据用户的购买记录向用户推荐其他相关产品等成为现实。 1.1学习的种类 计算机的学习,根据所处理的数据种类的不同,可以分为监督学习、无监督学习和强化学习等几种类型。 监督学习: 是指有求知欲的学胜从老师那里获取知识、信息、老师提供对错指示、告知最终答案的学习过程。 根据学习过程中获得的经验、技能、对额=没有学习过的问题也可以左除正确解答,是计算机获得这种泛化能力,是监督学习的最终目标。 监督学习,在手写文字识别、声音处理、图像处理、垃圾右键分类与拦截、网页检索、基因诊断以及故篇预测等各个方面,都有着广泛的应用。 无监督学习,是指在没有老师的情况下,学生自学的过程,在机器学习里,基本上都是计算机在互联网中自动收集信息,并从中获取有用信息。
无监督学习不仅仅局限于解决像监督学习那样的有明确答案的问题,因此,它的学习目标可以不必十分明确。无监督学习在人造卫星故障争端、视频分析、社交网站解析和声音信号解析等方面大显身手。
强化学习,与监督学习类似,也以使计算机获得对没有学习过的问题作出正确解答的泛化能力为目标,但使在学习过程中,不设置老师提示对错、告知最终答案的环节。
在强化学习中经常会用到回归、分类、聚类和降维等各种各样的机器学习算法。
下面对回归、分类、异常检测、聚类和降维等作一一介绍。 1.回归 2.分类 分类,是指对于指定的模式进行是被的有监督的模型识别问题。 3.异常检测 在异常检测任务中,对于什么样的数据是异常的,什么样的数据是正常的,在实现是未知的。在这样的无监督的异常检测问题中,一般采用密度中心的数据作为异常数据。 4.聚类 聚类,与分类问题相同,也是模式识别问题,但是属于无监督学习的一种。 5.降维 降维,是指从高位度数据中提取关键信息,将其转换为易于计算的低纬度问题接入求解的方法。 降维,根据数据种类的不同,可以分为监督学习和无监督学习两种。 作为训练集的输入输出样本是已知的时候,属于监督学习。 如果只有输入样本是一致的话,就属于无监督学习。 1.3 统计概率和朴素贝叶斯 ————————————————— 3最小二乘学习法 最小二乘法是对模型的输出和训练集输出的平方误差。