会计变量、舞弊和一袋词:评估检测欺诈的工具外文翻译资料
2021-12-29 23:01:21
英语原文共 31 页,剩余内容已隐藏,支付完成后下载完整资料
会计变量、舞弊和一袋词:评估检测欺诈的工具
1.简介
安永会计师事务所(Ernst&Young,2010)最近的一项调查显示,在金融危机后的几年里,舞弊活动有所增加,但与此同时,用来对抗舞弊的资源却减少了。因此,负责检测舞弊行为的人员,包括审计师,监管机构和投资者,必须合理地选择具有成本效益的工具来帮助他们完成这项任务。在本文中,我们通过开发一种统计方法,其增加舞弊检测工具,该方法用于分析管理层在讨论和分析企业年度和季度报告中使用的语言。虽然我们认为这个方法能有效地预测舞弊,但本文的贡献远不止开发了这一工具。我们工作的一个主要目标是通过提供基于语言的财务和非财务舞弊检测工具的全面评估,告知并协助决策者在可供替代的舞弊检测技术中进行选择。我们的目标不仅是确定哪些方法能有效的预测舞弊,而且还提供各种方法之间的相关性,以便决策者有一些基础可以在各种工具中进行选择,并可以消除那些不必要地增加的成本或重复的工作。
我们开发的基于语言的工具依靠数据来识别什么是舞弊的重要指标。与Li(2010a)用于对报告基调进行分类的统计方法类似,这种方法要求我们“训练”工具以识别舞弊和事实。为此,我们构建了一个由公司发布的季度和年度报告样本,其中至少有一个会计和审计执行发布(AAER)主张的舞弊。由于我们之前没有假设什么是舞弊的指标,因此我们使用这些发布的样本来定义舞弊性与真实性报告,并依赖这些报告来生成舞弊指标。我们通过使用决策树的方法,从管理层讨论与分析部分建立排序顺序的单词列表,这些单词最能够区分舞弊性和真实性报告。基于此列表中的前200个单词,我们使用支持向量机(SVM),如Antweiler和Frank(2004),Cecchini,Aytug,Koehler和Pathak(2010),以及Humphreys,Mo ffi t,Burns,Burgoon和Felix (2011)预测每份报告的状态并计算真实概率。这种方法的一个优点是我们不需要任何可能构成可疑单词的知识,并且根据新报告可以轻松更新,从而回答周和卡普尔(2011)呼吁的关于自适应和进化舞弊检测技术。在此样本的所有报告中,我们发现正确分类的比率约为82%。
2.现代会计研究
在确定我们的数据生成方法可以单独产生大量有效的分类结果之后,接着我们在许多样本中将其与其他舞弊检测工具进行比较。我们检验的特定舞弊检测方法是:Dechow,Ge,Larson和Sloan(2011)的F-计分法; 能力差异表明收入增长与企业资源使用之间的不匹配(Brazel,Jones和Zimbelman 2009); 不明原因的审计费用(Hribar,Kravet和Wilson 2010); 参与并购(M&A)活动; 以及与欺骗,消极,不确定和诉讼相关的四种预定语言词典。我们之所以选择这些方法,是因为它们代表了各种财务和非财务的检测方法,并且在之前的工作中已经证明它们既是有效的又相互之间至关重要(例如,Brazel等人2009; Price,Sharp,and Wood 2011)。
我们依照之前Cecchini(2010),Goel,Gangolly,Faerman和Uzuner(2010),Humphreys(2011)和其他人的研究,通过选取舞弊性和真实年度报告的横截面样本,对舞弊检测方法进行比较。在证明仅关注年度报告的合理性时,Brazel等人(2009)强调有必要与其他研究保持一致,中期报告的未经审计性质会导致披露的差异,以及财务报告差异在较短的季度时间范围内出现的可能性降低。然而,我们注意到,当不考虑季度报告中存在的舞弊时,Brazel(2009)等人的研究中观察到的舞弊行为减少了24%,而Dechow(2011)等人的研究中减少了17%。显然,季度报告中含有大量的舞弊,识别季度报告中的舞弊对于审计师和投资者来说都很重要。
我们认为,语言分析可能更适合识别财务报告中较短的季度时间范围内的出现异常差异,这与Goel和Gangolly(2012,76)的建议一致,即“包含冗余信息的定量财务数据在公司正在进行舞弊时不会变化,但是用于传达财务信息的写作风格和表现方式发生了变化。”因此,我们检测了五种我们所研究的基于语言的方法的有效性,这些方法通过在由季度和年度报告组成的时间序列样本中识别舞弊,对于任何检测工具而言,这是具有挑战性的,因为从一个时期到另一个时期的企业报告风格的相似性以及可能使用了标准化或样板化的语言(Brown and Tucker 2011)。然而,这正是会计专业人员在确定公司何时从真实报告转变为虚假陈述和舞弊时所处的环境。
在比较我们的数据生成单词列表与10-Q和10-K报告的时间序列样本上的其他预定单词列表的性能时,我们做出了两个额外的贡献。首先,我们证明可以有效地使用语言来识别包含临时报告的时间序列设置中的舞弊。 鉴于Kaminski,Wetzel和Guan(2004)以及Dechow等人(2011)发现公司的财务数据在舞弊时期与周围的真实相比几乎没有显着差异,因此知道单词选择可能引发舞弊尤为重要。尽管缺乏差异,Abbassi,Albrecht,Vance和Hansen(2012)发现,样本中包含季度财务比率可以提高舞弊检测率,超出单独检查年度数据所能达到的水平,我们的结果也证实了中期报告在基于语言的方法中的有用性。
关于包含季度报告的第二个显著作用是将公司以前报告中使用的语言作为重要的基准,用来识别该特定公司的舞弊行为。我们发现,从舞弊之前的那个季度到第一个舞弊性报告,公司报告的真实性可能会有显著地下降。度量一个季度到下一个季度可能性变量的变化,为识别企业的舞弊时提供增量预测能力。换句话说,将真实性的概率保持在给定水平,了解先前报告的变化程度和方向都为审计人员提供了额外的预测能力。这些结果回应了先前通过包括使用时间成分跟踪语言来扩展文献的呼吁(例如,Cecchini等人,2010; Li,2010b),并且表明,正如审计人员依赖于公司之前的财务绩效趋势来识别偏离规范,基于语言的工具也将受益于使用特定基准测试。
在本文的下一部分,我们概述了有关文本分析的现有文献,重点介绍了以前关于舞弊检测的工作。 我们强调以前的工作与我们自己的相似和不同之处。 本文的第3部分描述了我们的数据生成舞弊检测方法,并概述了其结果。 第4节介绍了替代舞弊检测方法,并对各种10-K报告样本的有效性和相关性进行了比较。 第5节研究了使用基于语言的工具来检测年度和中期报告中的舞弊行为。 第6节总结了我们工作的主要贡献及其对会计专业的影响。
3.公司信息披露和舞弊识别的文本分析
文本分析已成为检查公司披露信息内容的一种越来越流行的工具。基于语言的工具已用于检查执行电话会议(Larcker和Zakolyukina 2012),收益新闻稿(Davis,Piger和Sedor 2012),当然还有年度报告(Loughran和McDonald 2011; Li 2008,2010a; Brown)和塔克2011)。随着将文本分析应用于会计和财务环境的学术文献不断增长,也有与实践者相关的迹象。在融资方面,有几家公司推出了分析公司披露的语言,出版社和社交媒体推出用于跟踪市场情绪的语言.在会计方面,四大审计公司中安永最近制定了舞弊行为监控软件,能够搜索员工电子邮件中使用的语言,寻找企业渎职行为的迹象(Donahue 2013),同时美国证券交易委员会正在开发软件,以检查财务报告中的语言使用情况,以了解舞弊迹象(Eaglesham 2013)。
在年度报告中使用的语言分析中,大量研究专注于MD&A部分(Feldman,Govindaraj,Livnat和Segal 2010; Cecchini等人2010; Humphreys等人2011)。 MD&A已被指定为特别相关,因为它为投资者提供了通过管理层的眼光看待公司业绩和前景的机会。 Humphreys等人(2011年,587)表明,MD&A是年度报告中读取最多的部分,对文本分析特别有用,因为它“确实允许比10-K的其他部分更多样化和更少规定的语言”。
从实践的角度来看,MD&A的相关性可以从“萨班斯 - 奥克斯利法案”带来的变化中看出,这些变化要求在这财务报告中提高管理层讨论的比例(Li 2010b)。 在这些变化之后,美国证券交易委员会发布了2003年版本,为起草MD&A部分提供了详细的指导,并针对Kmart的高管提出了2005年的民事诉讼,声称他们的MD&A不足。美国证券交易委员会目前正在制定的语言分析工具尤其针对 MD&A部分。外部审计师也更加关注这一部分,如加拿大公共责任委员会2012年的一份报告所示,该报告建议增强与MD&A.部分相关的审计员的担保。
如Li(2010b)对文献的调查所述,分析公司报告中使用的语言的研究通常采用两种方法中的一种。 第一种方法在很大程度上依赖于以前在语言学和心理学方面的工作,并依赖于预先确定的单词列表(“词袋”),这些和消极性,乐观性,欺骗性或不确定性等特定情绪相关联。 正如Loughran和McDonald(2011)强调的那样,在日常演讲中捕捉这些情绪的单词列表可能不完全适用于商业文件。他们表明,通过使单词列表适应财务背景,可以找到这些词的出现与股票价格变动之间的关联。 在财务报表虚假陈述的背景下,他们发现了他们的Fin-Negative,Fin-Uncertain和Fin-Litigious单词列表与舞弊事件之间的关联。
其他依靠“词袋”方法来检测舞弊的研究包括Larcker和Zakolyukina(2012)对词类别的检查,表明由语言调查和字数统计词典定义的愤怒、焦虑和否定(Pennebaker,Chung,Ireland,Gonzales,and Booth 2007)。 作为他们分析的一部分,Goel等人(2010)基于对应于不确定,正面和负面单词列表的数字来区分真实性和舞弊性报告。 Humphreys等人(2011)也通过检查报告中使用的模态动词的比例来寻找不确定性,假设在欺骗性和真实性陈述中,指示不确定性的词语明显更高。
用于分析语言的第二种方法依赖于统计方法,以允许数据识别什么是有趣的单词或什么不是有趣的单词。 虽然这种方法起源于计算机科学,但它已经进入商业研究,使用这些方法对互联网帖子的特点进行分类(Antweiler和Frank 2004)以及10-K和10-Q报告中的前瞻性陈述(李2010a)。 Li(2010b)认为,这种方法比单词方法有几个优点,包括不需要适应商务环境的事实。
鉴于其优势,统计方法已用于检测包括Goel(2010)等人、Cecchini(2010)等人、Humphreys (2011年)等人、Glancy和Yadav(2011年)、Goel和Gangolly(2012年)在内的几位研究人员的舞弊性财务报表。在所有这些研究中,创建了一个匹配的舞弊性和非舞弊性年度报告样本,除了Goel等人(2010)的研究,都提取的MD&A部分。在这些论文中,Cecchini等人(2010)和Goel等人(2010)最接近我们的工作;然而,它们以非常不同的方式与我们相似。Goel等人(2010)检查了许多不同的语言特征作为舞弊的预测因素,但和我们相似的是,相较于单独考虑舞弊期,他们也将舞弊公司年度报告中舞弊期前后的时间包含进来。我们的论文通过在时间序列中包括舞弊企业的季度和年度报告来扩展此分析,目标是将企业基准风格中的偏差识别为舞弊的可能指标。 Goel等人(2010)承认季度报告的缺失限制了他们的工作,而Cecchini等人(2010,174)更广泛地谈论与纯粹的横断面语言分析相关的局限性。他们非常明确地指出“可以补充的方法是包含一个时间部分来跟踪个别企业的文本结构随时间的变化。这样的扩展将使研究人员能够更好地理解财务文本中的公司变化。”
而Cecchini等人(2010)没有审查报告的时间序列,他们的工作与我们的相似,他们将基于语言的舞弊检测方法与审计师和其他从业者更常用的财务分析工具进行比较。他们的比较是由Beneish(1999)确定的比率确定为舞弊指标,而我们比较了Dechow等人的(2011)F-score,能力差异(Brazel等人,2009)和不明原因的审计费用( Hribar et al.2010)这几个指标,并参与并购活动以完成基于语言的指标。因此,我们的工作旨在扩大定性和定量舞弊检测工具的比较,并检测在识别财务错报时从一个报告期到下一个报告期突出公司语言使用变化的可能带来的好处。
为了建立能够从事始终识别舞弊的数据生成单词列表,我们参考美国证券交易委员会的AAER公告来识别具有财务失实陈述的公司。 我们搜索1999年10月至2009年3月期间发布的每个公告(公告编号1190至2762)中的“舞弊”,“舞弊的”,“反舞弊”等字样。在对结果样本的人工审查中,我们发现美国证券交易委员会对这些词语的使用非常直接,我们的方法提供了一个有效的筛选。公告中的短语示例包括“舞弊性地决定消除”(版本2108)和“上述每一个财务报表都是舞弊性的”(版本1422)。 在这两种情况下,美国证券交易委员会继续将行为描述为舞弊行为,尽管收到并接受了受访者的解决方案,既没有承认也没有否认公告。
在从融资行业中移除企业以及在COMPUSTAT数据库中没有覆盖的企业之后,我们留下了240家公司,这些公司在AAER公告其中至少有一份舞弊行为。对于这些公司,我们记录了SEC确定为舞弊性的精确季度和财务报告,并在1994年至2006年期间下载EDGAR数据库上所有可用的10-Q和10-K报告。我们从1994年开始,因为这与EDGAR的推出大致相同,并证明是第一年提供可靠数量的电子报告。我们以2006年结束,因为我们的样本中发生舞弊和发布相关AAER公告之间的平均季度数是13.4或三年。因此,我们在2009年(样本期结束时)收集的AAER公告通常是指2006年或之前的财务年度中发生的虚假陈述。由此产生的数据集包括4,895份10-K和10-Q报告,其中约23%是舞弊性的。
对于每个样本报告,我们提取MD&A
全文共6181字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[2961]