分类筛选
分类筛选:

关于数据分析论文范文资料 与大数据环境下基于文本挖掘审计数据分析框架有关论文参考文献

版权:原创标记原创 主题:数据分析范文 科目:职称论文 2024-03-04

《大数据环境下基于文本挖掘审计数据分析框架》:本文是一篇关于数据分析论文范文,可作为相关选题参考,和写作参考文献。

【摘 要】 大数据的浪潮推动着审计技术的变革,给审计模式和审计方法都带来了巨大的改变.传统的审计数据分析方法不能对半结构化以及非结构化数据进行分析,也无法满足大数据环境下审计信息化发展的要求,亟须提出新的审计数据分析思路和方法.在此背景下,文章提出了基于文本挖掘的审计数据分析框架,并阐述了采集与存储、挖掘与分析、总结与发布详细的审计数据分析流程.通过利用文本挖掘技术对采集的非结构化原始审计数据进行挖掘,根据明确的审计需求建立不同的文本挖掘模型,对审计数据进行分析,进而发现审计疑点,最终形成可理解的审计证据和审计线索.该框架的构建旨在为大数据审计提供新的思路,以降低大数据审计风险,提高审计质量.

【关键词】 大数据; 文本挖掘; 审计数据分析

【中图分类号】 F239.1 【文献标识码】 A 【文章编号】 1004-5937(2017)16-0117-04

引 言

大數据引发了审计领域的创新和变革,海量的数据中结构化数据难以代表整体,非结构化数据已经成为大数据的关键组成部分.如何对这些非结构化数据进行分析是推动大数据审计开展的重要内容.我国当前在审计领域对非结构化数据还未形成全面系统研究.以文本挖掘为代表的数据挖掘技术在大数据审计中占有举足轻重的地位,它不再仅仅以结构化的审计数据为分析对象,可以深入地对大量非结构化数据进行挖掘分析和利用.所以本文提出了基于文本挖掘的审计数据分析框架,这将为大数据审计研究提供全新的分析思路.

一、文献综述

国外学者在研究大数据给审计带来的影响中讨论到,大数据能够改变和影响审计师所做出的决定和收集审计证据的方式[1].Gray et al.[2]认为采用数据挖掘方法能提高审计程序的效率和有效性.国内学者对大数据审计的研究始于2013年.阮哈建等[3]分析了大数据对财政审计、金融审计带来的挑战与机遇.吕劲松等[4]提出并构建了金融审计数据分析平台,为金融审计提供了新的思路.秦荣生[5]指出大数据环境下审计模式、审计观念、事物之间的关系将发生转变.之后,学者开始对大数据环境下审计技术方法进行研究,顾洪菲[6]对大数据环境下的审计数据分析方法进行初步探索,提出了对NoSQL、机器学习的需求.鲍朔望[7]探讨了聚类分析、异常分析及演化分析等数据挖掘方法在政府采购中的运用.羌雨[8]探索了R语言在大数据审计分析中的优势及可行性.国外学者提出的审计数据分析方法有聚类[9]、随机森林[10]、语言分析[11]和粗糙集.

纵观国内外学者的研究,大部分研究主要还是局限于对结构化审计数据进行分析,在这种相对封闭的环境下研究了大数据对审计的影响以及具体的审计方法,并且大多研究着重于从大数据对审计的影响和审计技术方法这两个方面进行探讨,鲜有学者针对非结构化审计数据进行深入研究,而且也很少研究提出关于如何构建大数据环境下的审计数据分析框架,对于大数据审计还未形成完整的研究成果.所以,本文提出并构建大数据环境下基于文本挖掘的审计数据分析框架,研究该框架下文本挖掘的详细流程.

二、传统的审计数据分析

审计人员如何将采集的原始数据转化为审计证据,这将直接影响到审计目标的实现.从采集到获取证据的过程中,审计人员最应该关注的问题是能否挖掘出有价值的数据进行审计数据分析,这对审计项目的质量和审计成果的体现都起着重要的作用.所以,在审计工作中最关键的步骤是进行审计数据分析.

目前,审计人员在审计工作中经常采用的审计数据分析方法以及计算机辅助审计工具(CAATS)有账户分析、经济指标比率分析、趋势分析、统计分析、Excel数据分析、Access、SQL、AO审计软件等.Excel数据分析和针对会计账表的审计软件被事务所熟用;SQL语句查询、AO审计以及审计数据采集与分析等审计软件常常被用于政府部门和事业单位的内部审计工作中;对于企业的内部审计,大型企业采用专门的审计平台或在ERP中嵌入内部审计模块,中小企业比较依赖Excel和Access进行审计数据分析.但大数据时代的来临,使得海量和多元异构的数据极大地拓展了大数据审计的范围,传统的审计方法和辅助审计工具已显得力不从心,无法对非结构化数据进行采集和分析.

三、大数据环境下的审计数据分析

在国际数据公司(IDC)发布的一项报告中显示,企业中最多只有5%的数据为结构化数据,其余大都是非结构化数据,并且88%的企业管理者认为这些存储在数据库以外的非结构化数据,才是他们接触和了解企业的最佳选择目标.数据是审计分析的核心,采用文本挖掘技术对非结构化审计数据进行挖掘分析,将会给审计领域带来一个新的技术应用潮流.这将有助于审计人员在大数据模式下对被审计单位进行内部控制、舞弊识别、违法违规等方面的评估.

(一)非结构化数据

顾名思义,非结构化数据没有固定的结构,不能通过一般的数据库二维逻辑表结构来表达,也不能将其标准化和完全数字化.按照格式可以分为文本文档、图片、音视频等.

(二)审计数据分析范围

随着“云计算—物联网—大数据—智慧城市”的快速发展,数据信息将实现共享,数据量将以难以想象的速度爆发式增长.一方面,审计数据分析的对象将发生变化,审计对象不再局限于和被审计单位财务相关的信息,而被审计单位内部的规章制度、会议记录、合同、通知等非财务信息也将是审计的重点对象.与被审计单位相关的外部数据也显得尤为重要,比如新闻文章、股吧评论、论坛发布等.另一方面,海量的数据必然会产生多样的数据格式,审计数据类型从传统的结构化数据转向多元异构的大数据.审计范围的重点转为对非结构化的数据进行分析,可以全面有效地对被审计单位的内部控制、违法违规行为、重大经济决策等内容进行评估.

(三)审计数据分析思维

审计数据分析思维由单一的“因果分析”模式向“因果分析与关联分析”共存的思维模式发生转变.因果分析是分析事件因和果这两者之间存在的必然关系,据因找果或者溯果撷因.然而,在海量的数据中,数据之间可能存在一因多果,或是一果多因的复杂关系,如果深入分析因果关系“为什么”和“是什么”需要耗费审计人员大量的时间和精力.所以,为了高效地开展审计工作,审计人员应该更加注重数据间的相关关系.若一种现象的发生通常伴随另一现象的出现,那么可以推断A和B经常是一起发生的,进一步对两者之间的相关关系进行仔细的研究,从而确定关联规则.经济学中最成功的营销案例——啤酒与尿布,就是把关联分析思想运用到大数据分析中的典型例子.同样在审计数据分析中运用相关关系分析的思维,挖掘审计数据之间的潜在关系,建立明确的关联规则,可以增加审计证据的效力.

数据分析论文参考资料:

毕业论文数据怎么找

统计学数据分析论文

大数据杂志

论文数据

有关大数据的论文

数据挖掘论文

结论:大数据环境下基于文本挖掘审计数据分析框架为关于对不知道怎么写数据分析论文范文课题研究的大学硕士、相关本科毕业论文数据分析方法五种论文开题报告范文和文献综述及职称论文的作为参考文献资料下载。

和你相关的