Python机器学习应用课程报告.docx
《Python机器学习应用课程报告.docx》由会员分享,可在线阅读,更多相关《Python机器学习应用课程报告.docx(11页珍藏版)》请在第壹文秘上搜索。
1、Python机器学习应用课程报告论文(设计)题目:专亚:班级:学号:学生姓名:目录Py1.hon机盎学习应用1机器学习微论2机器学习的内容2.1 景类2.1.1 什么是聚类21.2聚类的目标321.3聚类方法好坏的判定32.1.4 常见的聚类算法22分类22.1什么是分类2.2.2分类有以下几种说法,但表达意思是相同的2.2.3聚类与分类的区别2.2.4常用的分类算法23回归23.1什么是回归52.3.2常用的回归算法63机台学习的趣义84总绐与感悟1机器学习概论机器学习是指一套工具、方法或程式,使到我们可以从现实世界的海量数据里提炼出有价值的知识,规则和模式,然后将它们反哺给前台应用系统,进
2、行预测,推荐等能产生直接经济价值的场景,给用户带来“机器具备人类般高智能”的震撼性体跄。对于数据越来越多,而人力成本又越来越高的大数据时代,机器学习能降低企业进行数据分析的成本,掌控有关技术,可以给企业和个人带来巨大的价值。本课程的受众主要是没有经过专业训练的IT专业人员,他们可能是程序员,运维,IT系统架构师等等,也适合没有经过科班训练的数据分析师。数据分析是一个业务+算法+IT的交叉领域,同时熟悉这三方面知识的人,可以玩转大数据,产生无穷无尽的花样,产生巨大的价值。但很无奈的情况是这种人才太少,T人员即使熟悉本公司的业务,但同时又熟悉算法的人极少。一般只能做一些简单的维度统计,指标计算等等
3、,如果说到开发更高智能的系统,知识上鞭长莫及。本课程的目标,正是要打破知识的鸿沟,向IT人员普及算法知识,并把这些知识用于实际项目,把中国的机器学习应用能力提高一个台阶。2机器学习的内容2.1 聚类2.1.1 什么是聚类聚类尝试在没有训练的条件下,对一些没有标签的数据进行归纳分类。根据相似性对数据进行分组,以便对数据进行概括。没有标签是指我们事先不知道任何样本的类别标号,希望通过某种算法把这一组位置类别的样本划分成若干类别,聚类的时候,并不关心某一类是什么,实现的只是将相似的东西聚在一起。总的来说,聚类就是对大量未知标注的数据集,按数据内在的相似性将数据集划分为多个类别,使类别内的数据相似度较
4、大而类别间的数据相似度较小。是无监督的分类方式。2.1.2 聚类的目标同一类中,类内对象是相似的(或是相关的);不同类中的对象是不同的(不相关的)。2.1.3 1.3聚类方法好坏的判定(1)产生高质量的聚类结果簇。簇内有高相似性,簇间有低的相似性。2)取决于聚类方法采用的相似性评估方法以及该方法的具体实现。(3)取决于聚类方法能否发现某些/所有的隐含模式。2.1.4常见的聚类算法(1)划分聚类:K-means算法、K-medoids算法、K-pototypes算法、C1.ARANS算法;(2)层次聚类:B1.RCH算法、CURE算法;(3)密度聚类:DBSCAN算法、(FnCS算法、DENC1
5、.UE算法(4)网格聚类:ST1.NG算法、C1.IQUE算法、WAVE-C1.USTER算法(5)混合聚类:高斯混合模型、C1.1.QUE(综合密度和网格的算法)22分类2.2.1什么是分类在机器学习中,分类属于监督分类的范畴,根据一些给定的已知类别的样本(即有标签的数据),使计算机能够未知类别的样本进行分类。分类要求必须事先明确知道各类别的信息,并且是一种对离散型随机变量建模或预测的监督学习算法。2.2.2分类有以下几种说法,但表达意思是相同的分类(c1.assification):分类任务就是通过学习得到一个目标函数f,把每个属性集X映射到一个预先定义的类别标号中去。分类是根据一些给定的
6、已知类别标号的样本,训练某种学习机器(即得到某种函数),使它能够对未知类别的样本进行分类。这属于supervised1.earning(监督学习)。分类:通过学习来得到样本属性与类标号之间的关系。用自己的话说,就是我们根据已知的一些样本(包括这些样本的类别Iabe1.与属性)来得到分类模型(即得到样本属性与Iabe1.之间的函数),然后通过这个目标函数来对只包含属性的样本数据进行分类。分类算法的局限分类作为一种监督学习,要求必须事先明确指导各个类别的信息,并且所有待分类样本都要有一个类别与之对应。但是很多时候这些条件并不能满足,尤其是在处理海量数据时,如果通过预处理使得数据满足分类算法的要求,
7、代价会非常大,这时候可以考虑使用聚类算法。2.2.3聚类与分类的区别首先呢,聚类是非监督学习,分类是监督学习。二者的本质区别就是对于聚类来说,是不知道样本的类别信息的,只能凭借样本在特征空间的分布来分析样本的属性;而对于分类来说,知道样本的类别信息是必要的,根据已知训练样本的类别信息,让计算机自己学着知道每个类别的特点,然后对未知类别的数据进行分类。2.2.4常用的分类算法决策树分类法基于规则的分类器朴素的贝叶斯分类算法(nativeBayesianc1.assifier)基于支持向量机(SVM)的分类器神经网络法k-最邻近法(K-nearestneighbor,KNN)模糊分类法2.3回归2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python 机器 学习 应用 课程 报告
