关于聚类算法论文范文资料与改进模糊K—Prototypes聚类算法在生培养质量评估中应用有关论文参考文献-论文写作网

《改进模糊K—Prototypes聚类算法在生培养质量评估中应用》：本文是一篇关于聚类算法论文范文，可作为相关选题参考,和写作参考文献。

[摘要] 研究生教育在从追求招生数量到重视培养质量的背景下,如何有效而准确地评估研究生培养质量,成为当前各高校面临的重要课题.文章提出一种改进的模糊K-Prototypes聚类算法,可准确分析研究生培养质量情况.该算法首先提取相应的研究生培养质量影响因素属性,构建研究生培养质量评估指标,从而形成分析数据集；其次,为了解决研究生培养数据密度不均的问题,提出改进算法；最后利用改进的聚类算法对分析数据集进行聚类分析.以一所具体高校为例,验证提出算法的有效性和改进后聚类效果,为科学有效的研究生培养质量评估提供辅助决策方法支持.

[关键词] 研究生教育；培养质量评估；模糊K-Prototypes聚类

doi ： 10 . 3969 / j . issn . 1673 - 0194 . 2018. 07. 077

[中图分类号] G647 [文献标识码] A [文章编号] 1673 - 0194（2018）07- 0185- 06

1 引言

提高研究生培养质量是高等教育改革最核心的任务[1],而如何对培养质量进行客观科学的评估则是任务的难点所在.一些学者进行了探索性研究,对高校研究生培养质量评估,采用了主成分分析方法、层次分析评价模型、模糊综合评价模型等传统方法,如Chen等人在文献[2]中提出了改进的层次分析方法构建的教育质量评价模型的理论和应用； Liu等人在文献[3]中采用层次分析及模糊的方法对研究生培养质量评估中学生综合职业能力方面的评价作了研究；Hu等人在文献中提出用主成分分析和Elman神经网络对研究生培养质量中关于教学质量方面的评估进行了研究.这些文献分别提出基于模糊综合评价的高等职业教育评价模型和基于模糊综合评价法的高等工程教育综合评估研究.上述方法有其积极有效的一面,但一般通过专家为评估对象打分,评估结果主观性较强,往往不能较好反映实际值.

针对研究生培养质量数据类型多样化及数据具有模糊边界特征的特点,将模糊K-Prototypes聚类算法应用于研究生培养质量评估中,同时,由于研究生培养质量数据呈现密度不均现象,提出了改进的模糊K-Prototypes聚类算法,采用密度和最大最小距离方法以及高密度点的方法,将数据集划分成不同的密度区域,从而得到数值属性和分类属性的初始聚类中心,以此提高聚类结果的准确性.以武汉理工大学2015级研究生培养质量相关的数据集为实验数据,对其进行聚类分析,获得关于影响研究生培养质量的主要因素,从而为研究生培养质量评估提供有效的决策支持方法.

2 研究生培养质量评估指标

武汉理工大学的研究生教育综合管理系统经过多年系统性建设,涵盖了研究生从入学到毕业整个培养过程信息,是研究生培养质量聚类分析的基础.该系统数据库包含了学生的学籍、课业、学术论文发表、科研、指导教师基本信息及其论文发表、科研项目、科研成果等详细数据,而不同属性之间又可能存在关联性,特征属性的选取,将直接影響聚类结果.考虑到本文的目标是对研究生培养质量数据进行聚类分析,参考已有文献研究成果,影响研究生培养质量的主要因素,包括研究生的分析能力、创造力、实践能力、综合能力、科研成果情况、学习成绩、学位论文情况、导师因素、学术氛围环境等.

基于上述特征属性集,结合武汉理工大学对于研究生培养质量评估的实际需求,本文构建了如下多因素多层次的研究生培养质量评估指标体系.

本文将基于改进模糊K-Prototypes聚类算法构建研究生培养质量聚类分析模型,本研究将所评估指标作为模型的输入变量,对研究生培养质量进行聚类分析,从中获取每类研究生培养质量的整体特征,进而发现影响研究生培养质量的主要影响因素.

3 模糊K-prototypes 聚类算法

假设混合属性数据集为X等于{X1,X2,等,Xn},其中有n个样本数据,每个样本数据有m个属性,则混合属性集合中的每个样本数据可以记为Xi等于{x■■x■■,等,x■■,x■■,等,x■■},前p个属性表示数值型数据,后m-p个属性表示分类型数据.

定义1相异度度量：假定X和Y表示两个样本,则数值属性的相异度和分类属性相异度计算公式分别为式（1）和式（3）.

对于数值型属性,采用传统的方法欧氏距离来计算,则两个样本相异度定义如下：

d1（Xi,Yj）等于■（c■■-x■■）2,1≤r≤p（1）

对于分类型属性,采用海明距离来计算两个样本的相异度定义为：

?啄（x■■-y■■）等于0,x■■等于y■■1,x■■≠y■■（2）

d2（Xi,Yj）等于■?啄（x■■-y■■）,p+1≤r≤m（3）

则每个样本数据间的相异度计算方法定义为：

d（X,Y）等于■（x■■-y■■）2+γ·■?啄（x■■-y■■）（4）