分类筛选
分类筛选:

关于审计论文范文资料 与基于BS架构电子数据相似检测审计方法有关论文参考文献

版权:原创标记原创 主题:审计范文 科目:毕业论文 2024-03-26

《基于BS架构电子数据相似检测审计方法》:本文关于审计论文范文,可以做为相关论文参考文献,与写作提纲思路参考。

摘 要:在一个或者多个被审计数据源中可能存在相似重复实体,这些相似重复实体可能隐藏着审计项目中需要查找的疑点,笔者采用了基于B/S架构的软件开发方法分析并设计出相似检测审计方法.本文 绍了相似检测方法的定义和工作原理,并应用了审计案例数据对该方法的实用性进行了检验.

关键词:相似检测;电子数据审计;案例应用

中图分类号:TP31 文献识别码:A 文章编号:1001-828X(2017)003-0-02

在笔者研读文献和参和实践的过程中发现,一种用于数据清理的相似检测方法可以有效地适用于审计工作中.在一个或者多个被审计数据源中可能存在相似重复实体,这些相似重复实体可能隐藏着审计项目中需要查找的疑点.

一、相似检测方法的定义

审计数据中也常常出现冗余或有意重复的部分,通过应用相似检测方法,一方面可以提高电子审计数据的质量,另一方面审计人员在分析相似重复记录时也可能挖掘出新的审计线索.相似重复记录的产生通常发生在数据取得和传递过程中,审计人员需要结合审计数据本身的作用、来源等分析相似重复记录产生的情况是否可以合理解释,以及相似重复记录产生后是否会引起重大的后果.

二、相似检测方法的工作原理

(一)相似检测的参数设置

两条记录是否相似,常常是通过其具有代表性的属性值判断.因此计算相似度之前,首先需要选定判断相似的属性字段并分配字段权重.现实生活中,每个实体都有着多个属性,判断相似时,需要综合各个属性的相似情况.另外,每个属性的重要性也是有差别的,因此,对每一个属性需要设置权重来反映其在判定相似度的重要程度,权重的分配一般需要基于人员对数据属性的理解和需求来自主地确定.

(二)记录相似度的算法和度量

1.字符型字段的相似度计算方法

对于字符型字段,其匹配算法采用编辑距离算法,这种算法是计算一个字符串通过插入、替换、删除字符等编辑方式转换成另一个字符串所需要的最少的编辑次数,根据计算出的编辑距离,需要对应地给出一个介于0和1之间的小数表示其相似的程度(完全不同时为0,完全相同时为1),这个数值的确定方法可以根据操作人员的需要自行设定,汉字表述为主的数据通常适用这个算法.

2.数值型字段的相似度计算方法

对于数值型字段,可以通过计算数字间的相对差异取得其相似度:

其中a和b为数值型字段.值得注意的是,通常情况下S(a,b)的取值范围为[0,1],而当两个数值符号不同时,会导致S(a,b)≤0,在该情况下,相似度取值为0.

3.布尔型字段的相似度计算方法

对于布尔型字段,如果相同,则相似度为1,如果不同,则相似度为0.

计算完每个字段对应的相似度后,结合参数设置时确定的字段权重,计算出两条记录的整体相似度,这个相似度的值应当也介于0和1之间,数值越大代表其为相似记录的可能性也越大.

三、电子数据相似检测审计的应用

在多个被审计数据源中可能含有相似的内容,这些相似内容在某些情况下也许会成为审计問题的突破口.下文将以某审计案例数据为例介绍本系统的应用.

为了审计某省应取消的行政审批事项是否及时取消,审计人员搜集了国务院取消行政审批事项的发文,并让省法制办公室提供该省行政审批事项的清单.审计人员的审计方法是将国务院发文中每项取消的事项带入该省行政审批事项清单中查找是否存在应取消的审批事项,随时将可疑的审批事项记录下来.然而,2013年以来,国务院通过取消和下放行政审批事项共618项,进行完所有的查找至少需要一个小时.

如果使用本系统的相似检测审计方法,只需要简单的几步操作,具体如下:

1.将待对比的两个文件转换为数据库文件的格式.具体操作过程为:打开Access并新建“空白桌面数据库”,选择从外部获取数据,在对应类型下选择数据文件导入即可.本案例中的文档应当是国务院取消行政审批事项的发文和该省行政审批事项的清单.

2.在网页界面中,选择进行匹配的数据库文件,将数据库文件上传到系统指定的目录下,并界面中显示出两个文件中的内容,同时,左侧的“表一字段”和“表二字段”下方的下拉菜单直接获取表头的字段名.

3.根据审计的需要,首先选择需要进行相似检测的字段,并根据字段的数据类型选择相应的相似检测算法,再设置每对字段在此次匹配中的权重,接着设置“字段间阈值”和“记录阈值”,用于判断字段相似度和记录相似度是否满足审计人员认定的相似程度.本案例中,两张表的对应字段为:表一的“项目名称”和表二的“权力名称”相对应,表一的“审批部门”和表二的“行使主体”相对应.其中,“权力名称”的相似比“部门”的相似更重要,所以暂且设置“权力名称”的权重为0.7,“权力名称”的权重为0.3,假设将字段阈值控制在0.3,记录阈值为0.4,执行命令后获得了两组记录(详细内容见图1),这两组数据可以作为审计线索进行下一步审计工作.

四、结语

上述案例中,使用本系统的相似检测审计方法得到的结果和审计人员得到的结果是一致的,因此,使用相似检测审计系统能够更加便于审计人员发现更多的审计线索,提高审计工作的效率和效果.

参考文献:

[1]陈伟.大数据环境下基于模糊匹配的审计方法[J].中国注册会计师,2016(11):84-88+3.

[2]殷秀叶.大数据环境下的相似重复记录检测方法[J].武汉工程大学学报,2014(09):66-69.

基金项目:本文系2016年南京审计大学研究生科研创新计划项目(项目编号:MZ2016001)的研究成果之一.

审计论文参考资料:

内部审计论文

审计学论文

审计期刊

审计论文题目

审计论文选题

审计杂志

结论:基于BS架构电子数据相似检测审计方法为适合审计论文写作的大学硕士及相关本科毕业论文,相关审计是干什么的开题报告范文和学术职称论文参考文献下载。

和你相关的