分类筛选
分类筛选:

关于BiLSTM论文范文资料 与基于BiLSTM数学主观题自动阅卷方法有关论文参考文献

版权:原创标记原创 主题:BiLSTM范文 科目:毕业论文 2024-01-21

《基于BiLSTM数学主观题自动阅卷方法》:该文是关于BiLSTM论文范文,为你的论文写作提供相关论文资料参考。

摘 要:数学主观题自动阅卷既无法直接采用长文本计算中的TF- IDF等统计方法,又因为缺少相关知识库而无法使用语料库、知识库、语言学等短文本的方法.本文根据数学主观题的特点,提出了一种将人工制定评分标准和双向长短时记忆神经网络相结合的数学主观题自动阅卷方法,在高二年级数学真实考题上进行实验,准确率达到83.17%.

关键词:数学主观题 自动阅卷 文本相似度 深度学习 Bi- LSTM

中图分类号:TP311 文献标识码:A

Bi- LSTM Based Automatic Marking Method for Mathematical Subjective Test

Liu Yixue1, Lu Yuxuan1, Ding Liang2, Wang Xingming1(1.Beijing National Day School, Beijing, 100039; 2. Institute of Scientific and Technical Information of China, Beijing, 100038)

Abstract:Mathematical subjective questions can not use directly long text similarity calculation methods, such as TFIDF. They lack relevant knowledge base and also can not utilize short text similarity calculation method, such as corpus methods, knowledge base methods and linguistic methods. This paper proposes a method of calculating the similarity by combining human marking standard and Bi-LSTM neural network. The result of experiment shows that Bi-LSTM based automatic marking method achieved the accuracy rate of 83.17% on real mathematics test in the 11th grade. Key words:Mathematical subjective questions Automatic marking Text similarity Deep learning Bi-LSTM

1 引言

考試是一种严格的知识水平的鉴定方法,是教师在教学过程中检测学生知识掌握情况的重要手段.在中小学的教学中,各个科目的考试通常是书面形式,类型包括客观题和主观题.客观题多为选择题、填空题或者判断题,其答案较为明确、缺少歧义,阅卷较为容易;而主观题多以简答题或者论述题的形式,人工阅卷的方式居多.两种题型中,主观题是比客观题更为重要的检测手段,然而由于考生人数通常较多、考试次数频繁,如果只依赖人工阅卷,教师的工作量非常繁重,阅卷质量极容易受人的主观因素影响.利用计算机技术实现主观题自动阅卷,可以缓解这种问题,至少能辅助教师快速而客观地给出得分,从而提高教学效率.

主观题自动阅卷属于自然语言处理的技术范围,主要目的是计算考生答案和试题标准答案之间的语义相似程度.相似度越高,考生得分越高.目前已有的文本相似度的计算方法将文本分为短文本和长文本.长文本相似度的计算通常在文档级别上,利用TF-IDF和V 等统计手段能够很好地表达文本的相似程度.短文本的相似度计算多为句子级别,和长文本不同之处在于短文本具有词语稀疏、语义离散等特点,无法直接使用长文本相似度计算的方法,多采用相同字符计算、语料库或者知识库、语言学等方法.

数学主观题的长度介于长文本和短文本之间,数学符号居多,语句较为单调,文本歧义较少,既无法直接采用长文本计算中的TF-IDF等统计方法,又缺少相关数据而无法使用语料库、知识库、语言学等短文本的方法,需要根据数学题目的具体特征制定针对性的文本相似度计算方法.

本文根据数学主观题的特点,分别从统计角度和语义角度,提出了一种基于双向长短时记忆(Bi-LSTM)神经网络方法,进行数学主观题自动阅卷,并在包括11道高二年级数学真实考题以及1018份学生答案的数据集上进行实验,采用自动阅卷和人工阅卷分数的偏差程度来衡量自动阅卷的质量,实验结果显示,基于Bi-LSTM的数学主观题自动阅卷准确率为83.17%.

2 相关工作

主观题阅卷的关键是文本的相似度计算.通常的文本相似度计算针对的是长文本或者文档,由多个段落组成.最直接的度量方式是计算文本间共现的字符串,区别在于不同的计算方式.针对字符串或者其拼音,寻找最长公共子序列、最小编辑距离等.这种方式简单有效,但是没有考虑文本的语义信息.更为复杂的方式是将文本内容的处理转化为向量空间中的向量运算,然后采用编辑距离、汉明距离、欧式距离、Jaccard相似性、余弦或者曼哈顿距离等来度量相似度.向量空间模型利用TF-IDF方法将文本内容的向量化 [1,2].隐性语义标引(LSI)将词频矩阵转化为奇异矩阵,通过奇异值分解,剔除较小的奇异值,将文档向量和查询向量映射到一个子空间中,在该空间中,来自文档矩阵的语义关系被保留,将文档特征空间变为文档概念空间.概念向量之间使用内积的夹角余弦相似度计算,比原来基于原文本向量的相似度计算更可靠.该方法的效果依赖于上下文信息,过于稀疏的语料不能很好地体现其潜在的语义[3].基于Hash方法是一种基于概率的高纬度数据的维度消减的方法.SimHash [4]为Google处理海量网页的采用的文本相似判定方法,它将高维的特征向量映射成f-bit的指纹,通过比较两篇文档指纹的汉明距离来表征文档重复或相似性.

BiLSTM论文参考资料:

结论:基于BiLSTM数学主观题自动阅卷方法为关于BiLSTM方面的论文题目、论文提纲、lstm论文开题报告、文献综述、参考文献的相关大学硕士和本科毕业论文。

相关免费毕业论文范文

热门有关优秀论文题目选题

和你相关的