分类筛选
分类筛选:

关于关联规则论文范文资料 与基于关联规则Apriori算法的学生成绩分析有关论文参考文献

版权:原创标记原创 主题:关联规则范文 科目:职称论文 2024-01-19

《基于关联规则Apriori算法的学生成绩分析》:本文是一篇关于关联规则论文范文,可作为相关选题参考,和写作参考文献。

摘 要:关联规则挖掘是数据挖掘领域研究的热点问题,其中Apriori算法是经典的关联规则算法.将关联规则Apriori算法应用到学生成绩分析中,挖掘出课程与课程之间的相互关系,寻找各方面影响学生成绩的因素,发现隐藏在数据背后有价值的信息,从而为学生选课和教师教学以及教学管理工作等提供辅助性的建议与决策.

Abstract: Association rule mining is a hot topic in the field of data mining. Apriori algorithm is a classical association rule algorithm. This paper applies the association rule apriori algorithm to analyze student achievement data, digs out the relationship between the course and the curriculum, finds out the factors that affect the student achievement in all aspects, and finds the hidden information behind the data, so as to provide supplementary advice and decision-making for student course selection, teacher teaching and teaching management.

關键词:学生成绩分析;数据挖掘;关联规则技术;Apriori算法

Key words: student achievement analysis;data mining;association rule technique;Apriori algorithm

中图分类号:TP311.1 文献标识码:A 文章编号:1006-4311(2018)05-0171-03

0 引言

近年来随着信息技术的飞速发展,数据资源变做到越来越丰富,在高校的教学管理系统中存储了大量的学生成绩数据信息,但由于缺乏必要的技术手段,因此只能对这些数据信息进行简单的统计、备份和查询.隐藏在这些大量成绩数据背后的信息不能做到到有效的利用,不利于人才的培养和教学质量的提高,因而迫切需要有更新的技术方法对这些数据进行处理分析.

关联规则挖掘[1-2]就是一门从历史数据集中发现隐含模式,从海量数据集中发现潜在的有价值信息的技术方法,它反映了一个事件与其他事件直接依赖或关联的知识,这几年已经成为数据挖掘技术研究领域的热门话题[3].本文运用关联规则Apriori算法挖掘学生成绩数据,可以挖掘出课程与课程之间的相互关系、影响学生成绩的因素等一些有价值的信息,这些信息可为教学及管理工作提供支持性的建议,同时也为更加合理的制定人才培养方案和提高教育教学质量提供科学依据.

1 关联规则基本理论

2 关联规则挖掘算法

2.1 寻找频繁项目集

在对学生成绩数据进行关联规则分析时,这里采用了Apriori算法来寻找全部的频繁项目集.Apriori算法是一种重要的关联规则挖掘算法,它使用了一种被称为逐层搜索的迭代算法,k-项集用于搜索(k+1)-项集.首先需要扫描事物数据库,累积每个项的计数,然后收集满足最小支持度的项,从而找出频繁1-项目集的集合L1.L1用于寻找频繁2-项目集的集合L2,而L2用于寻找频繁3-项目集的集合L3,如此下去,直至不能找到频繁k-项目集Lk为止[4].

运用频繁k-项集用于搜索(k+1)-项集是Apriori算法的核心,该步骤分为连接步和剪枝步:

①连接步骤:为了寻找Lk,在k(k>1)次扫描数据库时,通过Lk-1与自身连接产生候选k-项集的集合Ck.

②剪枝步骤:由于Ck是Lk的超集,即Ck的成员可能是也可能不是频繁的.需要扫描全部的事务数据库,确定Ck中每个候选的计数,判断是否大于或者等于最小支持度计数,如果是,那么便认为该候选是频繁的.为了压缩Ck,可以运用Apriori性质:任何一个频繁项集的全部非空子集也一定是频繁的,若某个候选的非空子集不是频繁的,那么该候选项集肯定也不是频繁的,从而可以将其从Ck中删去.

Apriori算法描述如下[5-6]:

输入:数据库D;最小支持度min_Support

输出:D中的频繁项目集L

方法:

L1等于find_frequent_1-itemsets(D);;

for(k等于2;Lk-1≠Φ;k++){

Ck等于apriori_gen(Lk-1,min_Support)

for each transaction t∈D{

Ct等于subset(Ck,t);

for each candidate c∈Ct

c.count++;

}

Lk等于{c∈Ck|c.count?叟min_Support}

}

return L等于UkLk

2.2 生成强关联规则

对于上面做到到的每个频繁项目集L,生成强关联规则的步骤如下:

①生成L的所有非空子集;

②对于L的每个非空子集S,令R等于L-S.

如果有

?叟Min_Confidence

即S?圯R满足最小置信度阈值,那么输出关联规则S?圯R.又因为这个规则是从频繁项目集L中生成的,因此一定满足最小支持度阈值,所以这个规则为强关联规则.根据上面的两个步骤,就可以做到出事物数据库D的全部强关联规则.

关联规则论文参考资料:

文后参考文献著录规则

结论:基于关联规则Apriori算法的学生成绩分析为关于关联规则方面的论文题目、论文提纲、关联规则论文开题报告、文献综述、参考文献的相关大学硕士和本科毕业论文。

和你相关的