《数据挖掘100分.docx》由会员分享,可在线阅读,更多相关《数据挖掘100分.docx(8页珍藏版)》请在第壹文秘上搜索。
1、以下哪项不属于知识发现的过程?()r A、数据清理r B、数据挖掘r C、知识可视化表达r D、数据测试答案:D2、弹选,4分)以下哪些不属于数据挖掘的内容?()r A、分类r B、聚类C、离群点检测r D、递归分析答案:D3、(单选,4分)以下哪个不是常见的属性类型?()r A、A.标称属性r B、数值属性r C、高维属性r D、序数属性答案:C4、(单选,4分)以下哪个度量属于数据散度的描述?()A、均值r B、中位数r C、标准差r D、众数答案:C5、(单选,4分)以下哪个度量不属于数据中心趋势度描述?( D )r A、A.均值r B、中位数r C、众数r D、四分位数答案:D6、(单
2、选,4分)对数据进行数据清理、集成、变换、规约是数据挖掘哪个步骤的任务?()A、频繁模式挖掘B、分类和预测C、数据预处理D、噪声检测答案:C7、(单选,4分)聚类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法?()A、K-MeansB、 DBSCANC、SVMD、EM答案:C8、(单选,4分)建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪 一类任务?()r A、根据内容检索r B、建模描述r C、预测建模r D、寻觅模式和规则答案:C9、(单选,4分)当不知道数据所带标签时.可以使用哪种技术促使带同类标签的数据与带其他标签的数据 相分离?()r A、分
3、类r B、聚类C、关联分析D、隐马尔可夫链答案:B10、(单选,4分)在构造决策树时,以下哪种不是选择属性的度量的方法?()A、信息增益B、信息增益率C、基尼指数D、距离答案:D11、(单选,4分)知识发现流程最核心的步骤是什么?()A、数据挖掘B、数据预处理C、模式评估D、知识表示答案:A12、(单选,4分)将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()A、频繁模式挖掘B、分类和预测C、数据预处理D、数据流挖掘答案:C13、(单选,4分)以下哪个度量属于数据中心性的描述?()r A、均值r B、极差r C、众数r D、标准差答案:A类分析是数据挖掘的一种重要技术,以
4、下哪个算法不属于聚类算法?()A、K-Meansr B、 DBSCANr C、KNN。I D、EM答案:C15、(单选,4分)某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘 的哪种问题?()r A、关联规则发现r B、聚类pc、分类r D、自然语言处理答案:A16、(单选,4分)以下哪些算法是分类算法?()A、 DBSCANr B、C4.5r C、K-MeanD、EM答案:B17、(单选,4分)K-means算法的缺点不包括?()A、K必须是事先给定的r B、选择初始聚类中心C C、对于“噪声”和孤立点数据是敏感的r D、可伸缩、高效答案:D18、(单选,4分)
5、机器学习中,下面哪些方法不可以避免分类中的过拟合问题?() r A、增加样本数量r B、增加模型复杂度r C、去除噪声r D、正则化答案:B19、(单选,4分)下面那个不属于知识发现过程。()r A、数据清理与集成r B、数据统计r C、数据挖掘r D、模式评估和知识表示答案:B20、(单选,4分)在构造决策树时,以下那个不属于选择属性的度量?()r A、信息增益B、信息增益率C、基尼指数D、信息燃答案:D21、(单选,4分)关于频繁模式,下面哪一个陈述是正确的?()A、K项集频繁则K-1项则必然不频繁B、K项集频繁则K-1项则必然频繁C、K项集不频繁则K-1项则必然频繁D、以上都不正确答案:B22、(单选,4分)DBSCAN算法最大的挑战是?()A、确定聚类个数B、确定聚类形状C、确定半径及MINPTSD、确定评估指标答案:C23、(单选,4分)以下那个不属于分类算法?()A、KNNr B、朴素贝叶斯r C、K-MEANSD、SVM答案:C24、(单选,4分)以下哪些陈述是不正确的?()r A、聚类可以发现数据内部结构r B、聚类可以作为其他任务的预处理 C、聚类可以作为异常检测r D、聚类是一种监督学习方法答案:D25、(单选,4分)SVM通过什么实现线性不可分问题?()A、特征降维B、特征筛选C、基尼指数D、核函数答案:D