大数据审计研究

您所在的位置:网站首页 大数据审计概念股票 大数据审计研究

大数据审计研究

2024-07-07 16:41:46| 来源: 网络整理| 查看: 265

 

大数据审计研究——基于地方审计实践之思考

(本文获浙江省审计厅2018至2019年度优秀审计论文一等奖)

(责任单位:杭州市审计局  课题组成员:王  坚、唐志豪、王丁贵、左  鼎、韩  伟、俞东进、张海平、李万青、韩建平) 

【摘要】大数据时代下,大数据审计是我国各级审计机关践行“科技强审”战略,推动审计事业高质量发展的重要途径。课题组通过研究大数据审计的概念、特征和发展现状,试着从审计工作实务及实践需要出发,提出“不以项目为载体的大数据综合分析”和“以项目为载体的大数据审计项目开展”两种大数据审计组织形式;从国家审计署和地方审计机关两个视角,提出各自的组织架构和工作重点等,重点阐述了我国开展大数据审计的工作目标、重点领域、工作流程、方法体系、质量控制和“组织、技术、安全”三维保障体系等;并在地方审计机关实践中积极开展重要民生保障、政策措施落实、重大投资项目、自然资源资产和领导经济责任等五大重点领域的大数据审计实例和标准化研究。

【关键词】大数据审计 重点领域 工作流程 方法体系 保障体系

 

 

 

 

 

目  录

绪 论-------------------------------------------------------- 1(一)大数据审计研究背景------------------------------------- 11.大数据审计的外部环境正逐渐形成--------------------------------- 12.大数据审计的内在要求明确而迫切--------------------------------- 1(二)大数据审计发展现状------------------------------------- 11.国外大数据审计发展现状----------------------------------------- 22.国内大数据审计发展现状----------------------------------------- 3(三)大数据审计研究现状------------------------------------- 51.大数据审计技术方法--------------------------------------------- 52.大数据审计信息系统--------------------------------------------- 63.大数据审计工作模式--------------------------------------------- 6(四)研究思路与方法---------------------------------------- 71.研究思路------------------------------------------------------- 72.研究方法------------------------------------------------------- 8一、大数据审计的概念和特征------------------------------------ 9(一)大数据审计的概念-------------------------------------- 9(二)大数据审计的特征-------------------------------------- 9二、大数据审计的流程和规范----------------------------------- 11(一)大数据审计的工作目标---------------------------------- 11(二)大数据审计的重点领域---------------------------------- 11(三)大数据审计的工作流程---------------------------------- 151.大数据审计工作先决条件---------------------------------------- 152.大数据综合分析工作流程---------------------------------------- 173.大数据审计项目开展工作流程------------------------------------ 22(四)大数据审计的方法体系---------------------------------- 251.大数据审计技术体系架构---------------------------------------- 252.大数据审计技术方法-------------------------------------------- 28(1)云计算技术---------------------------------------------- 28(2)数据分布式存储及计算引擎技术---------------------------- 29(3)人工智能技术-------------------------------------------- 30(4)可视化技术---------------------------------------------- 323.大数据审计分析方法-------------------------------------------- 33(1)常规审计数据分析方法------------------------------------ 33(2)数据挖掘分析方法---------------------------------------- 35(3)交叉融合分析方法---------------------------------------- 37(五)大数据审计的质量控制---------------------------------- 39三、大数据审计面临的困难和应对-------------------------------- 42(一)大数据审计面临的困难---------------------------------- 421.组织保障不力-------------------------------------------------- 422.技术支撑滞后-------------------------------------------------- 433.安全防护缺乏-------------------------------------------------- 43(二)构建大数据审计“三维”保障体系------------------------ 441.组织保障——注重人才统筹,构建新型大数据审计组织体系---------- 442.技术保障——注重平台建设,创建大数据审计作业系统-------------- 453.安全保障——注重安全防范,构建大数据审计安全保障体系---------- 48四、大数据审计的实例探索------------------------------------- 51(一)民生保障类大数据审计——以H市医疗保险基金审计项目为例--- 51(二)政策落实类大数据审计——以H市产业发展政策执行绩效审计调查项目为例 57(三)重大投资项目类大数据审计——以M区政府投资工程建设项目招投标情况审计项目为例  61(四)自然资源(资产)类大数据审计——以X市长江经济带生态环境保护审计项目为例  65(五)地方党政领导经济责任类大数据审计——以A市党政领导经济责任审计项目为例 70结论与展望-------------------------------------------------- 75参考文献---------------------------------------------------- 78附录:地方五大重点领域大数据审计标准表------------------------ 81附录1——民生保障(医疗保险)类大数据审计项目审计标准表--------- 81附录2——政策落实类大数据审计项目审计标准表-------------------- 84附录3——重大投资项目类大数据审计项目审计标准表---------------- 86附录4——自然资源(资产)类大数据审计项目审计标准表------------ 90附录5——地方党政领导经济责任类大数据审计项目审计标准表--------- 94

 

 

绪 论

研究机构Gartner认为“大数据”是一类需要应用新处理模式才能具有更强决策力、洞察发现力和流程优化能力的信息资产。在大数据时代,国家审计工作也需要建立新型大数据审计工作模式,编制大数据审计业务规范,对审计大数据进行专业化处理,以掌握和利用庞大的数据信息,提高对数据的“审计应用能力”,通过“审计应用”实现审计数据的“增值”。

(一)大数据审计研究背景

1.大数据审计的外部环境正逐渐形成。2015年,国务院发布《促进大数据发展行动纲要》,首次提出“国家大数据战略”。2016年,国务院印发《政务信息资源共享管理暂行办法》。同年,《大数据产业发展规划(2016-2020年)》(工信部规〔2016〕412号)正式实施,明确要建设国家政府数据统一开放平台。2018年,全国网络安全和信息化工作会议对大数据产业发展战略进行全面部署。政务信息系统和大数据相关技术的不断发展,为大数据审计创造了现实条件,适合大数据审计的外部环境正逐渐形成。

2.大数据审计的内在要求明确而迫切。大数据审计已成为当前国家审计改革和高质量发展的必由之路。2015年以来中办、国办多次发文要求“构建大数据审计工作模式,实行审计全覆盖”。2018年1月,胡泽君审计长在全国审计工作会议上指出“要扎实开展大数据审计”。2018年3月,胡泽君审计长在全国人大会议上接受记者提问时再次强调要“积极推进大数据审计,坚持科技强审,通过信息化、数字化,努力提高审计监督的质量和效益”。2018年5月,习近平总书记在中央审计委员会第一次会议上又一次明确提出“要坚持科技强审,加强审计信息化建设”的要求。

(二)大数据审计发展现状

1.国外大数据审计发展现状

(1)美国审计总署。美国审计总署(Government Accountability Office,GAO)是一个独立机构,负责检查纳税人的资金支出情况,帮助政府节省资金并提高工作效率。美国审计总署2016年建立了增强分析中心以应对不断增长的数据分析任务。它在大数据审计中注重专业领域知识、数据分析手段和先进技术支撑。通常美国审计总署的审计团队由业务审计人员、数据分析人员和相关专家组成,主要通过分析政府机构及其它接受政府资金资助的社会机构数据(社会保障的死亡数据、医疗保健数据、邮政地址数据库、人事和薪资数据、人口普查数据、税务数据,以及挖掘得到的网页数据等),发现审计线索,形成审计结论,以便对潜在问题提前实施干预,如在审计中利用地理信息技术评估地震风险等。

(2)英国国家审计署。英国国家审计署(National Audit Office, NAO)是直属于议会的专司机构,主要审查议会的公共支出,对政府工作问责并帮助政府改善公共服务。英国国家审计署的大数据审计工作主要采用统计分析、机器学习、文本挖掘和可视化等技术,使用R语言、IDEA、Shiny、GIT和Tableau等技术工具,设计审计框架、数据模型,提出解决方案和实施分析程序。除政府机构数据以外,英国国家审计署还从网页及社交网络获取公开信息,通过文本建模、无监督机器学习等技术实现自动化的审计模式,并以可视化方式呈现。英国国家审计署还成立了由审计专家和数据科学家共同组成的数据分析研究团队,利用外部力量来保证工作的创新。

(3)奥地利审计院。奥地利审计院(Austrian Court of Audit, ACA)是独立于联邦政府的机构,凡使用联邦资金的政府所有机构,包括联邦政府投资占50%以上的企业,均属审计院审计范围。奥地利审计院在大数据工作中大力推广R语言,并建立了R工作组及R辅导计划,R工作组主要负责审计数据分析工作,并及时跟踪报告R语言的新发展。R辅导计划由经验丰富的R语言用户负责辅导,以持续提高R工作组人员的技术水平。奥地利审计院在具体的审计实践中取得了一些成效,如在社保审计中通过数据分析得出精神病人最先联系的是全科医生,因此提出了对全科医生开展精神医疗卫生知识培训的建议。

(4)印度主计长兼审计长公署。印度主计长兼审计长公署(Comptroller and Auditor General of India,CAG)是独立于政府的机构,代表议会对政府公共开支进行审核,监督政府运作。印度主计长兼审计长公署通过制订大数据管理政策,建立独立的数据管理和分析中心,配备最新的分析工具和基础设施,通过建立数据管理协议和提供数据分析能力,协助和指导全国所有CAG审计数据分析小组。印度主计长兼审计长公署着手从数据采集准备、数据分析建模、审计计划、审计实施和审计报告等5个阶段制定大数据审计指南,并从数据整合(内部、被审计单位、第三方)、统计分析、可视化技术应用、数据仓库创建、能力建设等方面,通过实施标准模型、特定审计分析技术、试点项目等手段对中央政府部门和不同邦州产生的大量数据开展大数据审计工作,使最高审计机关能够得出更加精确的审计结果。例如,通过研究印度历史和当前的电力消费模式,用于改善电力部门的治理;通过处理处方和检验结果等大量非结构化和结构化医保数据集,有效地提升最后一英里的医保管理,并通过部署自动化的预测分析系统,为印度农村人口提供负担得起的医疗保健服务。

2.国内大数据审计发展现状

相比世界上其他主要国家的审计组织,我国的大数据审计工作起步较早,是世界审计组织内公认的大数据审计领军者。中国国家审计署是世界审计组织大数据审计工作组主席,副主席由美国审计总署担任。

中国国家审计署设立了电子数据审计司负责开展大数据审计工作。通过总结大数据审计的“多来源、多模式、多关系、多工具、多视角”特点,将大数据审计工作总结为“三个集成、五个关联”。“三个集成”即数据、分析、审计工作的集成,“五个关联”即中央到省市的纵向关联,一级、二级预算单位的横向关联,财政、金融、企业的数据关联,财政与其他多部门、多行业的数据关联,财政数据与业务数据、宏观经济数据的关联。审计署在获取各类大数据基础上,运用云计算、智能挖掘、社交网络、自然语言理解、可视化、词云分析和地理信息技术等大数据分析技术,在提高审计监督质量和效率,扩大审计监督覆盖面;提升国家审计对经济社会风险预警能力,维护国家安全;提高国家审计履职层次和水平,促进实现可持续发展等方面发挥着巨大作用。

除审计署外,一些地方审计机关大数据审计的发展也十分迅速:

(1)湖北省审计厅。湖北省审计厅在地方审计机关中率先开展大数据审计,从2012年开始,该厅在省级部门预算执行审计和省市县三级财政审计等领域探索开展大数据审计,初步形成了“一体化指挥平台、一体化数据、一体化审计业务、一体化审计保障”的大数据审计工作模式。

(2)山东省审计厅。山东省审计厅率先在降低大数据审计技术门槛方面开展了探索和实践。2015年,该厅基于大数据环境开发了“审计百度”搜索系统,审计人员通过输入关键词即可从审计数据中心中获取财政、地税、社保、工商、金融等行业相关信息,实现了对海量数据的自动批量筛查,破除审计数据分析障碍。

(3)天津市审计局。天津市审计局运用“制度+科技”的办法,积极构建审计实时监督“一张网”,与市本级50个行政部门、40家国有企业和16个区县实现了数据联网采集,实现审计监督的全覆盖、常态化和关口前移,在大数据跟踪审计方面走在了全国前列。

(4)重庆市审计局。重庆市审计局在大数据审计组织方式上做到“八个统一”,即统一编制审计通知书、统一数据采集、统一编制审计方案、统一召开项目进点会议、统一处理处罚意见、统一审计结果通知书格式、统一撰写汇总报告,统一通报审计结果。

(5)成都市审计局。成都市审计局从2015年开始与市财政局、天府新区管委会等3部门联合开发大数据审计监管平台,审计人员不需要编写SQL语句即可开展审计数据查询分析,降低审计人员使用数据的技术门槛。该局探索开展全市计算机审计人员统筹管理,联合下属区(县市)审计局的计算机专业人员和业务人员按照重点审计行业领域划分,组建5人左右的行业数据分析团队,各自负责行业数据的采集、整理、规划和分析工作,并提出和不断完善行业审计分析模型,促进审计经验的积累和传承。

(三)大数据审计研究现状

目前,国内外对大数据审计的研究主要集中在大数据审计技术方法、大数据审计信息系统、大数据审计工作模式等领域,但相对都处于起步阶段,对大数据审计尚缺乏全面系统的研究。

1.大数据审计技术方法

隋学深在2013年针对大数据的多元异构、跨领域关联基本特征,并就如何在国家审计中应用大数据技术给出了政策建议。

Rupali在2014年提出利用Hadoop新兴技术来推动数据挖掘,获取、管理和分析大数据,以提高审计效率。

Mona等在2014年提出在大数据审计中应用可视化技术。

张兆信在2015年通过大数据技术在审计中的应用研究,对大数据给审计带来的向“全量审计”和“持续审计”的变化进行了分析探讨。

张书慧在2016年从分析大数据和审计技术的交集入手,介绍了大数据条件下的审计技术创新路径,即数据联接、数据挖掘、数据追踪和数据归类。

陕西省审计厅课题组在2017年提出了新审计模式——人机分层审计,该模式将审计数据分析的过程分为机器分析层和人工决策分析层,促进了传统审计方法向数字化、自动化与智能化的方向发展。

2.大数据审计信息系统

王欢、许暖、沈波等在2014年提出选择Solr和Hadoop技术与审计管理平台整合,重构传统的审计平台,提升审计效率。

Miklos在2014年提出开发了一套新审计数据标准,并探索开发半自动到全自动的大数据审计工具的方法。

隋杰等在 2015年从规则库和数据的完整性检测两个方面分析了审计预警模式的关键技术,提出了如何推进在线审计预警。

蔡华林等在2016年提出在审计信息化建设实施的过程中要依托企业管理大数据平台,根据业务管理流程,构建多元化、跨领域的审计大数据资源体系架构。

刘国城在2017年探索大数据审计平台建设,将其拆分为采集、预处理、分析和可视化四个子平台,结合了过程建模、Hadoop平台、图像处理等多种技术方法工具,为大数据审计实践提供了新思路。

3.大数据审计工作模式

杨凯茜在2014年以审计署对中石油的审计结果为例,分析了传统审计的不足和大数据审计的特点,并设想了如何实现大数据审计。

Tammy在2014年提出审计要考虑如何利用大数据技术来审核财务数据,并提出数据标准化技术,建立总分类账和应收账款的标准表。

Miklos等在2015年提出了会计大数据的整体框架,讨论了大数据与传统数据源的相互作用,以及大数据对审计判断和行为研究的影响。

韩强在2015年提出大数据审计应该致力于解决审计工具问题,解决人员问题和提高大数据审计能力。

董芳全在2015年提出审计机关应顺应大数据审计需要,构建国家审计数据系统和数字化审计平台,积极运用大数据技术,提高运用信息化技术查核问题、评价判断、宏观分析的能力,扩大审计监督的广度和深度,并初步提出了构建以数据为主导的审计工作模式的新理念。

审计署审计科研所在2016年系统分析了大数据环境下数据采集与整理、数据分析及结果运用、数据安全等方面审计风险,并提出建立健全数据入口的审核机制、建立大数据分析方法复核机制和责任追究机制、加强数据访问权限控制等审计风险防范建议。

张宜平等在2017年提出推行“数据归集、集中分析、锁定疑点、分组核查”的大数据审计模式,主张在实践中积极摸索,探索改进审计方法。

(四)研究思路与方法

1.研究思路

本课题定位侧重大数据审计实务研究,试从大数据审计概念和特征出发,探寻我国开展大数据审计的工作目标、重点领域、工作流程、方法体系、质量控制和保障体系等,并从地方审计机关的角度探索实施“五大领域”的大数据审计项目,尝试编制相应的大数据审计标准表,作为附录供审计机关交流、借鉴。

图1 课题总体研究思路框架图

如图1所示,本课题研究的主要思路是:

从审计署和地方两个视角,提出在审计署层面,大数据审计可突出防范化解重大风险、精准脱贫、污染防治等“三大攻坚战”领域;在地方层面,大数据审计可聚焦民生保障、政策跟踪、重大工程、自然资源资产、经济责任等五大领域。

从审计工作实务及实践经验出发,提出构建大数据审计“不以项目为载体的大数据综合分析、以项目为载体的大数据审计项目开展”两种组织形式,并从规范化、标准化需求出发,提出要针对大数据综合分析和大数据审计项目开展两种组织形式建立不同的工作流程。

从大数据技术生命周期和审计实践应用角度出发,把大数据技术架构分为“云计算平台及数据源层、数据采集层、存储计算层、数据分析层和数据应用层”等五个层级,并着重探讨了与大数据审计切合度较高的云平台技术、数据分布式计算引擎及存储技术、人工智能技术、可视化技术等大数据技术和常规数据审计分析方法、数据挖掘方法、交叉融合分析方法等大数据分析方法。

以防范审计风险为导向,提出应采取大数据审计“真实性验证、一致性验证、复核性验证、抽样性验证、确认性验证”等五大质量控制措施。

以应对大数据审计工作面临的困难为目的,提出要建立“组织、技术、安全”三大保障体系。

2.研究方法

本课题的主要研究方法包括文献研究法和实践验证法。首先通过研究国内外大数据审计相关文献资料,然后结合课题组成员参与大数据审计工作的实践经验,总结提炼出大数据审计的组织机构、组织方式、业务流程、技术方法等相关理论,最后再将相关理论在大数据审计工作中进行实践验证,总结实践过程中的困难和应对措施,并对相关理论进行验证、修改和完善。

 

 

一、大数据审计的概念和特征

(一)大数据审计的概念

本课题研究的大数据审计,狭义上是指“国家审计机关组织,由计算机审计人员和业务审计人员依据国家法律法规、条例、审计准则等,运用云计算、数据挖掘、人工智能等大数据审计技术,对与审计事项相关的跨地区、跨行业、跨领域、跨年度的巨量电子数据进行采集、整理和关联分析挖掘,从中把握总体情况,判断发展趋势,发现审计线索,获取审计证据,揭示审计问题的独立经济监督活动”。

广义上,还应包括与审计事项实施相关的制度建设、组织架构、系统建设、质量控制和安全防范等一系列相关审计工作。

(二)大数据审计的特征

与传统审计相比,大数据审计至少具备以下六个方面的特征:

1.审计数据体量“更大”。审计数据不仅包含被审计单位的财务数据、业务数据,还包括从其它渠道获取的外部数据,以及审计过程自身形成的内部数据等,数据量从 TB 向 PB 甚至ZB 级发展,审计数据的体量变得更大。

2.审计技术要求“更高”。快速检索、综合分析和可视化是大数据审计最基本的需求,这些需求有赖于分布式系统、可视化、云计算等大数据技术,涉及计算机科学、统计学、经济学、信息论、认知科学等多门类学科,对大数据审计技术提出了更高的要求。

3.综合分析能力“更强”。审计人员要对数据进行深层次分析和研究,揭示其本来的特征和内在的联系,使它们转化为更直接、更有价值的信息。

4.审计覆盖范围“更广”。大数据时代背景下,审计逐步从“钓鱼”式的抽样审计向“一网打尽”式的全面审计转变,审计覆盖率大大提高;审计范围也不再局限于某个部门、某个系统,而是紧密围绕审计事项,尽可能地获取相关渠道的全部数据展开分析,审计范围得到了前所未有的拓展。

5.审计监督端口“更靠前”。随着审计云与审计信息系统、审计数据中心、审计指挥中心等审计信息资源和人工智能等技术的运用,审计监督端口不断前移,审计的事中监管、事前预警预防作用日渐显现。

6.审计溢出效应“更明显”。审计全覆盖将使大数据审计效果发生质的飞跃,审计公信力将得到进一步增强,同质同类、屡查屡犯的顽症也将逐步得到根治。大数据审计的成果不再局限于具体项目形成的审计报告,还可以通过大数据综合分析找出被审计单位(行业)内部管理等方面隐藏的内在规律、共性问题和发展趋势,为被审计单位提高管理水平提供审计建议,为行业领域发展提供经济预警,为政府部门精准施政提供科学指引,审计过程中产生的有价值信息也可为审计机关开展其他审计项目提供有用资讯。

 

 

 

二、大数据审计的流程和规范

(一)大数据审计的工作目标

大数据审计将有利于促进传统审计方式向现代审计方式的转变,极大提升审计资源的配置效能、审计范围的准确性和审计质量,同时会倒逼被审计单位在数据质量、数据格式、数据库及数据接口、数据运行机制、数据平台建设等标准的统一和规范。

1.促进审计范围从部分行业重点覆盖向所有行业全面覆盖转变。传统审计由于受数据分析处理能力的限制,只能将主战场落在财政、社保等重点领域,采取所谓抓大放小的方式进行监督,而大数据审计的优势在于强大的数据处理能力,为审计从仅关注重点领域向全面关注各领域转变提供了可能。

2.促进审计数据分析手段从单一系统分析向跨部门、跨行业、跨系统、跨地域的关联分析转变。大数据审计能对不同来源、不同类型的海量数据信息进行关联分析,能充分满足审计人员跨部门、跨行业、跨系统、跨地域的数据查询分析需求。

3.促进审计方法从抽样审计向全面审计转变。抽样审计的前提是数据量大,无法一一审核。大数据审计强大的信息处理能力,使这一前提不再理所当然,全面分析成为可能,从而有效降低抽样审计风险,显著提高审计结论的公信力。

4.促进审计效率从费时费人向高效、高附加值转变。传统审计由于缺乏大数据支撑,往往采取赴被审计单位和相关单位现场审计一两个月甚至数月,不仅费时而且效果不佳。大数据审计既能事前进行数据采集和集中分析,实行“总体分析和分散核查”,又能处理海量数据,实现“价值挖掘和快速响应”。从而更加有利于审计重点和疑点梳理,必将大大提高工作效率。

(二)大数据审计的重点领域

近年来,审计机关逐渐掌握较全面、较系统的财务及业务数据,大数据审计的目标越来越明确、领域越来越宽广、成效越来越明显。审计署和地方审计机关由于各自的审计对象、审计视野、职能作用不同,其大数据审计在实践中发挥作用的重点领域也应有区别。

1.从审计署层面看,大数据审计除了与地方审计机关一样在财政、金融、民生等数据量巨大、数据关系复杂的重要领域发挥作用之外,更需要在研判宏观经济、跟踪国家政策、防范重大风险等领域方面发挥独特的作用,在重大问题发生或扩散之前提出审计预警,促使政府提前防范或干预,推动国家审计在国家治理中充分发挥“免疫系统”功能。

(1)推动国家治理体系现代化,发挥大数据审计在领导决策分析上的关键作用。

一是开展宏观经济决策大数据审计。关注宏观决策的科学性、前瞻性和协调性,利用大数据审计综合相关行业数据对宏观经济决策进行全面、深入分析,判断决策制定是否符合经济发展的客观规律,考察宏观经济是否达到理想的政策预期效果,总结宏观经济决策对国家发展的影响等等,从而促进政府完善经济体制,加强宏观调控职能,实现经济结构转型升级。

二是开展经济风险隐患大数据审计。持续追踪国家及各级政府在债务、金融、项目投资、社会保障等方面重大政策的制定和执行,通过人工智能、数据挖掘等大数据分析技术,分析经济发展趋势,发现资源配置矛盾、体制创新力不够等现象,揭示经济社会运行中各类风险隐患,提出机制体制改革建议,促进公共经济政策的调整和完善,推动全面深化改革,实现国家长治久安。

(2)围绕“三大攻坚战”的目标,发挥大数据审计在监督制度执行上的关键作用。

一是实施重大风险领域大数据审计。定期对政府债务、金融资本运营、国家重要基金运作等情况进行分析,动态监管各级政府偿债风险,精准打击违法违规金融活动,及早揭示违规放贷、理财产品风险失控、基金错配爆雷等问题,打好防范化解重大风险攻坚战,促进形成政府与企业、政府与银行、金融与实体经济、金融与房地产、基金与群众以及金融体系内部的良好循环模式。

二是实施扶贫脱贫政策大数据审计。精准识别贫困人口,定期核查扶贫覆盖面、扶贫政策适用性、贫困受助人员身份真实性,跟踪审计扶贫政策落地情况,着力揭示扶贫政策与实际需求脱节问题、扶贫工作不细致不扎实问题,打好精准脱贫攻坚战,促进民生保障帮扶资金管理到位,为全面实现小康社会保驾护航。

三是实施污染防治情况大数据审计。比对全国各地同期气候、土壤、水资源等环境污染的改善状况,专题分析专项资金的项目绩效,揭示机制体制问题,打好污染防治攻坚战,促进中央调控政策和措施落实到位,促进调整产业结构、能源结构和运输结构,淘汰落后产能,守住生态保护红线。

2.从地方审计机关层面看,大数据审计可以为有限时间、有限人力情况下实现审计全覆盖提供有力支撑。而地方审计机关的年度工作一般围绕地方政府的中心工作和自身工作特点展开,因此大数据审计的关注点可以集中在民生保障审计、政策落实审计、重大投资项目跟踪审计、自然资源资产审计和经济责任审计等地方政府重点关注的领域上,并不断做纵横的延伸和深化。

(1)开展重要民生保障大数据审计。围绕社会保险、保障性住房、文化教育、食品安全、养老残疾、公共服务设施、为民办实事项目等众多民生领域实施大数据审计,重点关注因申报审核过程涉及部门众多、管理机构分散而导致的信息不对称情况,关注监管体制机制建设的完善,关注保障对象的真实性、保障额度的合理性、保障政策的覆盖面,揭示民生资金管理使用过程中存在的损失浪费、虚报冒领、管理薄弱等问题,促进民生保障精准到位。

(2)开展政策措施落实大数据审计。围绕政策措施执行情况实施大数据审计,重点关注政策执行预期完成情况、政策配套措施可行性、政策资金保障情况、政策落实对相关产业的带动效应、政策宣传推广情况,揭示政策执行不力问题,为党委、政府决策提供客观公正的信息,促进政策得到全面、持续、有效执行。

(3)开展重大投资项目大数据审计。围绕地方政府实施的重点工程项目,结合行政审批、工商、税务、地理信息等外部数据,对招投标、现场管理、竣工验收、资金支付等重点环节开展大数据跟踪审计,重点关注重大投资项目资金投入情况、项目建设进展情况、项目完成后移交情况、项目绩效情况等,揭示围标串标、资质挂靠、违规变更、管理失控等违法违规问题,推动重大项目落地到位。同时推进政府投资审计转型。

(4)开展自然资源资产大数据审计。围绕矿产、水、土地(基本农田)、森林、滩涂湿地等自然资源资产开展大数据审计,重点关注相关管理部门政策完善情况、监测数据真实性、违规及举报问题处理处罚情况,揭示当地自然资源发展变化的趋势及可能存在的无序开采、资源浪费、管理混乱等问题,促进政府对资源资产加强保护、合理有序使用。

(5)开展领导干部经济责任大数据审计。围绕地方党政领导干部权力运行轨迹、重大资金资产管理使用、重要工程推进等情况开展大数据审计,还可延展至国有企业、人事编制、民生保障、干部管理等事项,重点关注资金资产违规使用、决策程序不规范、项目实施监管不严等情况,揭示领导干部在政策制定、政策执行、廉政纪律、干部管理等方面存在的问题,实现经责审计不仅有“面”上的全覆盖,更有“点”上的全覆盖,推动审计内容横向到边、审计深度纵向到底,促进经责审计覆盖到位。

(三)大数据审计的工作流程

结合工作实际,课题组认为大数据审计工作的组织形式可根据实施载体的不同,分不以审计项目为载体的大数据综合分析(不依托具体审计项目独立开展,以下简称“大数据综合分析”)和以特定审计项目为载体的大数据审计项目开展(依托具体审计项目开展,以下简称“大数据审计项目开展”)两种。

在审计实践中,大数据综合分析与大数据审计项目开展两者并非是两种完全割裂独立的大数据审计组织形式,大数据综合分析中发现的审计疑点可以为大数据审计项目开展立项提供依据,大数据审计项目开展中发现的暂时无法查证的苗头性问题,可以通过大数据综合分析持续跟踪,两者相辅相成、互相促进。大数据审计一般工作流程详见图2:

图2 大数据审计工作流程示意图

1.大数据审计工作先决条件

(1)做好制度准备----建立大数据审计常态化制度。

方向是行动指南,以制度指明工作方向,大数据审计才能有更有效的行动。

审计署层面,按照习近平总书记“科技强审”的总要求,以《审计法》《审计法实施条例》《国家审计准则》修订为契机,充分体现大数据时代审计工作的新特征、新发展、新要求,为大数据审计的审计程序、审计文书等提供法律依据,为大数据审计综合分析处理违纪、违法、违规问题线索扫清体制机制障碍。

地方层面,按照审计署统一要求,结合各地实际,制定大数据审计“工作规划”,明确大数据审计工作的指导思想、总体要求和主要任务等,确立适合当地工作实际的大数据审计发展方向;制定《大数据审计工作操作规程》,规范各部门大数据审计职责、工作内容,确定大数据审计审前调查、数据采集、数据分析、成果提炼、质量管理、安全保密等关键环节的工作要求,制订必要的文书格式和工作表格,将大数据审计工作落到实处。

(2)做好数据准备----建立审计数据常态化管理方案。

大数据审计的核心是数据,数据的价值在于应用。“兵马未动,粮草先行”,数据准备是大数据审计的前置环节和必经程序。

一要建立审计电子数据采集报送及标准化工作机制。对内,要加强业务人员与计算机人员的配合,在对相关信息系统进行充分调查的基础上,提出明确、全面的数据采集需求;对外,要建立畅通、高效的沟通渠道,约定数据采集的方式、频率、内容以及报送标准、格式等。要利用部分政府数字化转型示范试点的有利时机,建立常用审计电子数据定期采集报送和数据标准化工作机制,做好审计数据采集、规划、整理和存储等工作,解决好审计数据“采进来”的问题。

二是建立审计电子数据“集中管理、分级共享”机制。考虑人力物力限制、资源集约节约利用等因素,建议有条件的地市级以上审计机关对其管辖范围内的所有审计数据进行集中管理,按归属地区、所属行业、敏感程度等对数据进行分类,各审计机关(业务部门)按需申请使用数据,打破数据应用壁垒,解决好大数据“用起来”的问题。

(3)做好环境准备----建设大数据审计常用工作环境。

大数据审计是一个系统工程,审计机关应建设审计数据分析室、审计综合分析平台、专用数据分析网络等大数据审计常用工作环境,为大数据审计工作打好基础。

物理环境----审计数据分析室。审计数据分析室是大数据审计工作的集中办公场所,通过配置数据分析工作站、独立敏感数据使用区和专用输入输出设备向审计人员提供高性能、安全可靠的数据分析环境以及方便专业的交流共享环境。

分析环境----审计综合分析平台。审计综合分析平台是大数据审计的拓展应用工具。构建审计综合分析平台,提供易用高效的数据关联分析工具,可降低大数据审计技术门槛,为审计人员开展大数据审计工作提供数据支撑和应用支撑。

网络环境----专用数据分析网络。专用数据分析网络是连通审计数据分析室和审计综合分析平台的专用网络,确保只有指定设备、指定应用、指定人员才能访问审计数据。在不具备逻辑隔离防护能力或数据敏感程度较高的情况下,可搭建与其它网络物理隔绝的专用数据分析网络。此外,为满足现场审计大数据分析的需要,构建基于VPN技术的移动数据分析网络也十分必要。

(4)做好计划准备----建立大数据审计计划管理机制。

年初,在制订年度审计项目计划的同时,要同步开展大数据审计工作计划的谋划。大数据审计牵头部门应与各业务部门进行有效对接,根据审计对象的信息化程度和数据关联程度确定年度大数据综合分析任务,明确专题和人员;确定大数据审计项目,并按重要性原则确定重点大数据审计项目和一般大数据审计项目,并据此给予不同力度的计算机审计专业人员支持。

2.大数据综合分析工作流程

大数据综合分析是不以具体审计项目为载体开展工作的,因此,审计机关大数据综合分析可以选择重点关注事项,确定具体工作目标,组织实施相关数据分析,掌握事项的总体情况、最新动态及发展趋势,实现对审计目标的跟踪、预测、预警。

(1)选定工作主题。

大数据综合分析工作应以摸清家底和趋势为导向,工作主题选择要体现适合性、全面性、时效性等原则,要紧紧围绕党委政府的中心工作、社会热点焦点难点问题,体现地方特色和时代特征。开展对巨量数据及其关联数据的总体分析,特别是要注重对其数据审计事项相关数据的总体分析和主题分析,摸清底数,掌握发展趋势,揭示可能存在的管理机制、体制层面的问题,为下一步核查提供有价值数据。

当大数据综合分析工作主题数量较多时,可以按照重要性原则构建大数据综合分析事项库,事项库实行动态管理,审计机关组织人员定期对事项库的工作主题进行梳理和评估,必要时可参照年度审计项目计划制定年度大数据综合分析工作计划。

(2)组建工作团队。

大数据综合分析工作团队应以审计机关承担大数据审计工作的内设机构为主体,其他各部门和人员为辅助来开展。大数据综合分析工作团队应是一个常态化工作组,工作组下设重点领域专题审计小组、重大事项跟踪审计小组、重要资金实时审计小组、审计数据保障小组等若干工作小组,实行“总分负责制”,在工作组负责人的统一领导下,各小组和审计人员按照各自职责分工协作,共同完成大数据审计分析工作,具体来说:

工作组负责人负责大数据综合分析的组织、领导和协调工作,主要包括协调其他部门开展数据采集整理工作,确定大数据综合分析工作方案,明确工作组人员责任分工,最终复核和确认数据分析结果等。

重点领域专题分析小组主要由数据分析员、数据复核员、相关业务审计人员和外部专家组成,负责结合本地区实际情况和审计数据的支撑情况,梳理适合开展大数据专题审计(分析)的当前社会关注热点和政府重点领域,制定重点领域专题审计(分析)实施方案,组织开展分析和结果复核,撰写重点领域专题分析报告。

重大事项跟踪分析小组主要由数据分析员、数据复核员、相关业务审计人员和外部专家组成,负责收集国家(地方)重大经济政策和调控措施的相关制度文件,结合本地区实际情况和审计数据的支撑情况,梳理适合开展大数据跟踪审计(分析)的重大事项,制定重大事项跟踪审计(分析)实施方案,组织开展重大事项跟踪审计分析和结果复核,撰写重大事项跟踪分析报告。

重要资金实时分析小组主要由数据分析员、数据复核员组成,负责结合审计数据的实时联网情况,梳理适合大数据实时审计的重点事项及其单位和资金,制定重要资金实时审计(分析)实施方案,应用联网审计系统,组织开展重要资金实时监测和结果复核,撰写重要资金联网实时监控疑点报告。

审计数据保障小组主要由数据管理员组成,负责审计数据的采集、整理、更新以及审计数据权限管理和安全防护工作。

(3)制定工作方案。

常态化大数据综合分析工作开展前,工作组应在信息系统调查和政策法规梳理的基础上,根据常态化大数据分析工作目标,确定审计内容和工作方式,制定大数据综合分析工作实施方案。除审计范围、工作要求等基本要素外,常态化大数据综合分析工作方案应凸显以下几个要素:

大数据分析工作目标----大数据审计分析以分析审计对象(事项)的状态为导向,主要围绕摸清总体情况、分析发展趋势、梳理业务流程、发现疑点线索等目标,为政府科学决策、精准施政提供参考,为审计机关后续审计项目开展提供选题依据和审计思路。

相关审计数据基本情况----所需审计数据的来源单位、信息系统、大小、存储格式、主要内容、时间范围、地区范围、采集更新状况等基本情况。

新增审计数据采集整理----大数据综合分析工作还需要采集的审计数据种类及其采集方式,数据标准表、转换方式和验证方法等。

数据分析的重点和措施----大数据综合分析的内容、重点,运用的数据分析方法以及注意事项等,明确数据分析结果复核、疑点线索延伸核查的反馈机制,提高数据分析成效。

审计数据的安全保障要求----对于采集的数据及分析利用数据,要按照保密法律法规和审计电子业务数据管理办法要求,做好数据的安全保密工作。

(4)开展主题分析。

开展大数据综合分析应在对核心审计数据进行真实性、完整性、有效性验证的基础上,根据审计目标和内容,运用大数据技术开展审计分析工作,主要是:

一是重点领域专题分析。对环保、教育、养老等当前社会关注热点、政府重点工作等重点领域进行大数据专题分析时,首先评估已有审计数据对专题分析的支撑情况,采集和更新相关审计数据,然后通过对重点领域的专题数据与财政、统计、金融、税收、企业、社保等相关基础数据的关联分析,重点理清重点领域在财政支出、税收收入、人员就业、关联企业、资金流向、生产能耗、土地利用等方面的总体情况和发展现状,剖析其存在的重大风险隐患、体制机制缺陷等问题。

二是重大事项跟踪审计。对“供给侧改革”、“淘汰落后产能”、“五水共治”等国家(地方)重大经济政策和调控措施贯彻落实情况、重大工程项目的建设情况等进行大数据专题分析时,首先评估已有审计数据对专题分析的支撑情况,采集和更新相关审计数据,然后通过对经济政策、调控措施与相关的财政数据、项目数据、统计数据等进行综合关联分析,重点理清重大政策措施配套资金的规模、结构、来源及去向,梳理重大政府投资项目审批、实施的关键节点,关注能够充分反映政策执行效果的相关经济指标变化情况,定期分析、判断政策执行或项目建设等效果。

三是重要资金实时监测。对低保救助资金、征迁补助资金、政府采购资金、“三公经费”等财政资金,关系国计民生的重要公共资金,国有企业和政府性投资项目资金等进行大数据专题分析时,首先评估实时联网的审计数据对专题分析的支撑情况,依托联网审计平台采集和更新相关审计数据,然后通过对政府资金的预算、审批、支付等流程数据的实时抓取和分析,实现政府性资金支出的动态监测、自动预警和跟踪分析,抓住资金实际支付这个关键点,通过设置预警阈值,实现对政府性资金的实时审计,达到实时联网监督的目的。这项工作需要联网审计平台支持。

四是关切问题持续观测。对审计工作中发现的重大审计线索等审计关切问题进行大数据专题分析时,首先评估已有审计数据对专题分析的支撑情况,采集和更新相关审计数据,然后通过对该问题相关审计数据进行关联分析,设置持续观测点,或根据审计机关新采集的相关数据,分析审计关切问题的发展现状、变化趋势,分析影响其发展的关键因素,查找其中隐含的违法违纪线索。

(5)体现工作成果。

审计小组应该在数据分析过程中做好工作记录,视情况出具重点领域分析报告、重大事项跟踪报告、实时监督疑点报告、关切问题线索报告等常态化大数据审计分析报告。分析报告的内容主要包括:

数据分析的基本情况,一般包括数据分析中所用数据的范围、内容、来源等相关情况,数据分析中采用的主要技术方法,数据分析中做出分析结论的主要依据,其他数据分析情况的说明;

数据分析情况和结果,一般包括所需的数据、采用的方法和步骤、对分析结果的判断依据和结论、延伸审计建议。

3.大数据审计项目开展工作流程

大数据审计项目是以审计项目为载体开展相关工作的,因此,它主要围绕特定审计项目的审计目标和审计内容,采集相关审计数据,通过大数据技术开展深度分析,挖掘隐藏的审计问题线索。

(1)精准选择大数据审计项目。

课题组认为,大数据审计项目选择,应以揭示问题为导向,以数据为基础,从基本特征、项目类型、审计事项等层面来选题。

一是基本特征层面。大数据审计宜选择审计内容综合性强、审计范围覆盖面广、涉及关联数据多的审计项目来开展。大数据审计项目的核心是对数据的价值发掘利用,而利用数据最主要的是项目有数据且能为审计所用。

二是项目类型层面。大型综合类审计项目的数据量大、数据种类广、可能的关联关系数据多,便于开展大数据审计。一类是数据内容及审计目标相对固定的常规大型综合类审计项目,如财政同级审、党政领导干部经济责任审计、预算执行审计等。另一类是业务不固定、切入点灵活、内外部关联多的非常规大型综合类审计项目,如某些专项审计、绩效审计等。

三是审计事项层面。涉及行政许可和财政奖补罚条件核查类、大型考核绩效类、地理区域核查类等审计事项的项目,可作为大数据审计备选项目,开展诸如财政资金流向审查、低保救助核查、环境与农田保护勘察核实等大数据审计。

(2)合理组建大数据审计团队。

大数据审计项目的人员组成不再局限于某个审计业务部门的业务审计人员,而应根据审计项目、审计事项以及审计人员的知识结构、专业特长等因素,充分发挥审计数据在大数据审计项目中的主导作用,促进审计业务和计算机技术的融合。审计组应揉合计算机和业务两类人员,必要时还可以聘请外部专家加入。课题组认为,审计组可实行业务主审和计算机主审的“双主审制”,审计组下设数据分析组和业务审计组,审计组成员分工协作,共同推进大数据审计项目开展。

一是实行项目“双主审制”(计算机主审和业务主审)。大数据审计项目审计组实行“双主审制”,计算机主审负责编制审计数据分析实施方案,组织审计数据采集、整理、分析以及数据分析结果复核验证等工作。业务主审负责协助审计组长履行传统审计主审职责外,还要加强与计算机主审的沟通协作,组织开展审计分析结果的现场核查、问题研究和成果提炼等工作。随着大数据审计工作的持续推进,业务审计人员可以借助大数据审计信息化系统提升大数据分析能力,一般计算机审计人员通过参与大数据审计项目经验提高业务审计能力,使越来越多的审计人员成长为复合型大数据审计人员,届时大数据审计项目组可实行“大数据主审制”,由大数据审计人员直接担任项目主审,充分发挥大数据的价值,更好地提升审计质量。

二是组建项目“混合团队”(数据分析和业务审计)。数据分析人员负责协助计算机主审编制审计数据分析实施方案,实施数据采集、整理、分析和复核,撰写数据分析报告。数据分析组成员按工作职责可分为数据分析员、数据复核员和数据管理员。数据分析员主要负责开展大数据审计分析,撰写数据分析报告。数据复核员主要负责大数据审计分析结果的复核和确认。数据管理员负责审计项目期间电子数据的需求沟通,开展数据采集,搭建数据分析工作环境等,并在审计项目期间协助主审进行数据安全管理,考虑到数据的敏感性和安全需求,一般由审计单位在职人员担任数据管理员。业务审计人员主要负责收集整理相关法律法规、业务规范等规章制度,提出具体审计思路,与数据分析人员共同确定大数据审计目标及重点事项,核实疑点问题,作出专业判断,形成审计意见。

(3)科学制定项目实施方案。

根据审计项目确定的审计目标和审计内容,结合大数据审计工作相关的信息系统、数据、人员等,制定可操作性强、责权明确的审计实施方案。大数据审计项目实施方案除了需具备一般审计项目实施方案的基本要素外,要重点突出“大数据”特色。一是审计内容上。注重被审计单位相关信息系统的审查,使信息系统审计成为具备信息化背景的大数据审计项目的前置环节和必经程序,一方面可以确保数据的完整性、有效性、准确性,另一方面将审计对象业务问题与信息系统风险控制结合起来进行分析,挖掘审计问题产生的深层次原因,使审计反映的问题更具普遍性,提出的审计建议更具建设性;细化审计措施的应用,要较为详细地描述大数据分析过程,指导数据分析人员实际操作。二是审计数据上。注重掌握被审计单位及相关单位的电子数据情况,大数据分析手段“能用尽用”,确保审计事项疑点的全覆盖。三是人员分工上。明确“双主审”的各自职责,明确数据分析人员和审计业务人员的分工合作。

(4)开展核心系统信息系统审计。

项目现场实施前,应结合审计机关以往对被审计单位掌握的情况,了解被审计单位所使用的信息系统、主要业务流程及其对信息系统的依赖程度,以及与信息系统有关的管理机构及管理方式等情况。并收集、记录被审计单位信息系统所使用的操作系统、数据库管理系统、应用软件的名称及版本、运行环境硬件配置、对外输出数据的方式及可输出数据的类型等信息。采集审计相关的电子数据,并对核心信息系统开展必要的信息系统审计。一方面通过信息系统审计对信息系统数据的真实性、完整性、准确性进行审计评价,防止数据审计“假数真审”;另一方面将数据纳入信息系统审计的范畴,按照业务流程和风险防控点对数据进行分析,验证信息系统的内部程序控制是否到位,反映信息系统本身所蕴含的控制风险和安全风险,进而评价信息系统本身的有效性、完整性和安全性。

(5)重点开展数字化审计方式。

大数据审计项目应按审计署的要求积极探索“总体分析、发现疑点、分散核查、系统研究”的新型数字化审计方式。

一是现场审计前。利用大数据的关联综合分析,重点排查审计事项的疑点问题,根据重要性程度,将疑点“分类化”管理,重要疑点交由现场组核查,一般疑点交由被审计单位自查,其它疑点少量抽查或不查,初步锁定现场审计的重点方向。

二是现场审计中。有的放矢,重点落实问题取证,缩短现场审计时间,提高审计效率。建立“分析-核查-分析”的内部循环模式,数据分析人员及时将重要疑点交由审计业务人员或数据复核人员做进一步的核查,核查人员通过核查发现的疑点线索或审计思路及时反馈数据分析人员,以便对以前的分析算法、参数作进一步修正,如此往返直至疑点落实。

三是现场审计后。进一步做好对查证问题的系统研究,挖掘数据问题背后存在的体制机制、政策制度等宏观层面问题,达到拓展审计深度、提升审计价值的目的。

(6)酌情出具大数据审计报告。

根据项目需要,大数据审计报告既可以单独出具,也可以与业务审计综合出具一个审计报告。如可将审计结果“表格化”,对于涉及多个被审计单位的大数据审计项目,可向当地政府或主管部门出具统一的汇总报告,让被审计单位通过表格形式查看问题,着眼于就问题说问题,一目了然。

(四)大数据审计的方法体系

1.大数据审计技术体系架构

大数据审计技术体系架构是基于信息安全前提下的审计数据分析和挖掘技术汇总,涉及审计数据采集、集成、存储、处理、分析、评估、预测等全生命周期管理过程。数据来源上,它既包括来自被审计单位信息系统的财务业务数据、相关支撑资料,也包括来自互联网的交互数据;数据类型上,它既包括结构化数据,也包括文档、音频、视频、图像等等非结构化数据。

大数据审计技术应用需解决两大基本问题:一是如何存储海量的审计数据;二是如何计算海量的审计数据。

图3 大数据审计技术体系架构

如图3所示,从生命周期和技术应用角度出发,可以把大数据审计技术架构分为大数据审计技术核心层、审计安全保障体系及数据管理体系建设,大数据审计技术核心层分别为大数据审计云计算平台及数据源层、数据采集层、数据存储计算层(即数据存储及计算引擎层)、数据分析层和数据应用层。审计安全保障体系及数据管理体系建设主要包含:完善云计算安全审计技术标准、规范等保障体系,建立统一完善的审计数据管理和使用制度,明确数据使用和管理责任,从数据的采集、管理、使用、销毁,形成系统化数据管理体系。

大数据审计技术主要包括:云计算平台技术、数据采集技术、数据存储技术、数据计算引擎技术、数据分析技术、数据可视化技术、数据安全技术等。

大数据审计技术核心层主要包含的相关技术如表1所示。

表1 大数据审计平台分层技术描述

架构层

相关大数据技术

数据应用层

可视化、行为分析、趋势预测、风险态势感知等技术

数据分析层

数据挖掘、机器学习等各类人工智能技术

存储计算层

MapReduce、Storm、MPP(Massive Parallel Processor)数据库、HDFS+HBase/Hive等工具或技术

数据采集层

Sqoop、Kettle等批量采集技术或工具

云计算平台及数据源层

云计算技术,结构化数据、半结构化数据和非结构化数据相关技术

云计算平台及数据源层主要为大数据审计提供基础平台,为多源数据采集提供联系通道。主要提供审计所需要的硬件资源(如虚拟机等)以及系统软件资源(如分布式文件、处理系统等),主要关键技术有:虚拟化、分布式文件系统、分布式数据库、多源数据管理、能耗管理等技术。

数据采集层主要是为大数据审计基础平台提供数据,需要尽可能多地搜集与审计相关的数据。由于被审计单位信息系统的布局、云平台架构、系统结构等方面各不相同,因此对不同的单位应采取不同的数据采集方式。审计数据采集往往是多领域、多行业、多层级获取数据。从数据类型角度看,可分为结构化数据、半结构化数据和非结构化数据;从采集源角度看,可分为设备类、流量类和情报类数据。通过制定相关的数据标准和接口建设,把收集的数据简单处理,即数据清洗和预处理,过滤掉脏数据,为后续的大数据处理及应用提供数据基础。大数据采集工具及技术有:Sqoop、Kettle、Flume、Kafka等。

存储计算层主要是为大数据审计平台提供不同分析需求的数据存储、全套计算引擎支撑服务。传统的审计方法往往是“边审计边计算”,即在审计的过程中对相关聚集值进行计算,但是,在大数据环境下这种方式很可能因为过大的数据量而产生审计任务延迟完成的问题,所以采用预处理结果直接进行聚集值的查询,即将思路由“边审计边计算”转变为“先计算后审计”,在审计过程中只需对计算以后的结果进行查询即可,避免了计算过程,从而大大提升审计效率。主要工具及技术有:MapReduce、Storm、MPP(Massive Parallel Processor)数据库、HBase/Hive、Spark等。

数据分析层利用关联规则、分类、聚类等数据挖掘算法,实现数据的深度挖掘与分析,为各类审计数据挖掘、机器学习的算法提供支撑,从而发现审计线索。按照审计分析不同的需求,提供临时性审计分析服务、常规专业审计项目分析服务、定制的特殊审计分析服务等基于审计数据中心的分析服务,发现审计线索,收集审计证据。主要工具及技术有:机器学习、自然语言处理、模式识别等人工智能技术。

数据应用层为用户利用可视化技术对审计数据进行行为分析、趋势预测、风险态势感知等,主要包括审计管理和审计业务可视化两方面。审计管理方面包括构建可视化审计数据中心管控平台和在审计指挥中心应用可视化技术;审计业务方面包括数据分析的可视化研究和构建大数据的可视化数据挖掘平台。常用可视化建模工具有:Grapheur、Spotfire、TableauDesktop等。

2.大数据审计技术方法

随着大数据审计工作的持续推进,越来越多的大数据技术在审计工作中得到有效应用。本课题着重介绍与大数据审计关联度较高的云计算、分布式存储及计算、人工智能、可视化等实用技术。

(1)云计算技术。

云计算是一种基于网络连接的、统一管理和调度软硬件资源、构建计算池按需向审计人员提供服务的技术。云计算服务主要有三种模式:软件即服务(SaaS)、平台即服务(PaaS)和基础设施即服务(IaaS),三种服务模式运用于云审计系统,可以单独采用,也可以混合采用。基础设施层IaaS为审计机关提供了统一的基础设施服务,下级审计机关不需要管理、控制和维护任何云审计基础设施,也无需购买和建设服务器等基础设施。系统服务层PaaS 为审计机关提供审计与其他综合服务,包括资源服务中的信息共享、专家经验库的上传和下载审计案例经验、对资源进行调度和安排,实现对各种资源的高效利用。系统应用层SaaS是审计云平台的中心,主要部署审计实施系统、审计管理系统、审计决策支持系统和审计数据中心。在公有云安全性无法得到保障的情况下,基于政务云的云计算技术逐渐成为地方审计机关大数据审计应用的首选。以审计业务需求为导向,利用云计算技术,使软硬件资源得到充分优化利用,最终形成各级审计机关硬件、软件资源和服务共享的审计云平台。

(2)数据分布式存储及计算引擎技术。

分布式存储系统就是将大量的普通服务器,通过网络互联,对外作为一个整体提供存储服务。从数据类型看,可以分成三类:结构化数据(如可用二维表结构来逻辑表达的凭证数据)、非结构化数据(如文本、图像、声音、影视等)和半结构化数据(如HTML文档等)。分布式计算就是将大量的数据分割成多个小块,由多台计算机(也叫集群)分工计算,然后将结果汇总。Hadoop是一个专为离线和大规模数据分析而设计的,开源且可运行于大规模集群上的分布式文件系统和运行处理基础框架,能实现审计数据的个性化推荐、日志处理、审计对象细分特征建模等功能。

一是分布式存储技术。针对不同的存储需求,分布式存储系统分为四种:分布式数据库系统、分布式文件系统、分布式键值系统、分布式表格系统。一般来说,可采用不同存储技术混搭的存储方式来提高分析查询效率。分布式文件系统存储Blob对象(图片、文字、照片和视频等各种非结构化的数据对象)、定长块以及大文件;分布式键值系统用于存储关系简单的半结构化数据;分布式表格系统用于存储关系比较复杂的半结构化数据,以表格为单位组织数据;分布式数据库系统是从单机关系型数据库扩展而来,用于存储结构化数据。

二是分布式计算引擎。分布式数据计算引擎提供全套计算引擎支撑服务,在不同的审计应用场景,大数据分布式计算的性能需求不尽相同:审计分布式集群:在精确查找、基础分析等“常用、简单”的应用场景,审计人员更加关注数据计算结果的实时性。此时可采用实时流式数据分析,由分布式集群(如阿里云ADS)完成实时计算分析,并将结果存储到数据仓库,实现秒级快速响应。审计分布式并行计算框架:在模糊匹配、关联分析等“超大、复杂”的数据分析场景,审计人员更加注重数据计算处理的最大容量。此时可采用分布式数据计算引擎提供大数据计算支撑服务,离线数据由分布式并行计算框架(如阿里云ODPS)实现计算能力,并具备优先级调度策略、负载均衡机制、集群资源管配、作业执行时间预测、抽象调度单元、各角色各时段的失败重试机制功能,以实现TB级甚至PB级巨量数据的分布式计算。

(3)人工智能技术。

随着大数据、云计算、物联网等信息技术的发展,以深度神经网络为代表的人工智能技术得到了快速发展。从可应用性看,人工智能大体可分为通用人工智能和专用人工智能。面向特定任务(比如下围棋)的专用人工智能由于应用边界清晰、领域知识丰富、任务单一、需求明确、建模相对简单,形成了人工智能领域突破,在某些特定单项测试中甚至超越了人类智能。当前,专用人工智能已取得重要突破,通用人工智能尚处于起步阶段。人的大脑是一个通用的智能系统,能举一反三、融会贯通,可处理视觉、听觉、判断、推理、学习、思考、规划、设计等各类问题,可谓“一脑万用”。真正意义上完备的人工智能系统应该是一个通用的智能系统。

如今,审计领域利用人工智能技术主要集中在专用人工智能技术。比如,利用机器学习等技术,审计可以收集、审查更多类型和数量的审计证据,甚至是全部的数据。审计人员利用自身优势从更高层面、更广范围、更加综合的视角出发,搜集、挖掘、归纳、分析及应用相关海量数据,可以提供更具前瞻性的审计建议。通用人工智能系统在审计领域的运用尚有局限性,与人类智慧还相差甚远。

一是基于深度学习的智能审计数据分析模型构建。一般来说,某种识别模型的构建依赖于现有模式中相关特征的提取。深度学习提出了自动学习模式特征的方法,并将特征学习融入到了建立模型的过程中,从而减少了人为设计特征易造成的非完整性,以及人工提取特征的非精确性。通过对审计项目文本内容的自动提取,利用历史审计项目标注数据的深度学习网络,逐层抽象特征,降低特征维数,从审计数据中提取可疑数据,并判断是否“符合目标”,流程如图4所示。用训练的深度学习网络方法分析输入数据,标识输入层所代表的特征,赋值和反馈隐含中间层,最终形成输出层,从而能够对原始输入数据做出更好地解释,比如声音、文本或图像。

图4利用深度学习网络构建智能审计数据分析模型

对于深度学习在大数据审计中的应用来说,最大的难点是对已完成审计项目的数据进行标注。审计数据是人工智能审计的基石,数据标注是人工智能进行模型训练必不可少的一环。将最原始的数据变成算法可用数据的过程是:原始数据一般通过数据采集获得,随后的数据标注相当于对数据进行加工,然后输送到人工智能算法和模型里进行调用。

二是基于深度语义的数据查询。审计过程中,通常需要查询大量的文档资料,即在大量文档库中检索需要的信息,以获得理想的检索准确度。由于用户进行检索时表达不够准确、输入的查询词较少,容易出现“词不匹配”的问题,用深度学习的方法对文档集进行训练,把文档中的词看成向量,通过计算词之间的语义相似度,筛选出与查询词相似度高且具有深度语义关系的词语,这些更多的语义相似词会对用户的查询意图有着更准确的阐释,能更好地提升检索质量。例如,利用非结构化搜索软件,将被审计单位的上级政府常务会议纪要、专题会议纪要等决策事项采集到服务器,与被审计单位的职责履行、上级会议决定的落实情况等进行比对分析,将执行情况作为领导干部履职和实绩评价的重要依据,突出被审计干部的职责履行实绩。

(4)可视化技术。

可视化技术是利用计算机图形学及图像处理技术,将审计分析数据转换为图形或图像形式显示到屏幕上,对数据进行直观的可视表达以增强认知,并允许用户对数据进行交互处理,以便于人们接受、理解原始数据或信息的理论、方法和技术。涉及数据表示、数据处理、决策分析等领域的综合技术。其主要特点有:交互性、多维性、可视性。可视化技术在审计中主要应用场景有:

一是运用计算机辅助设计软件,开展可视化业务审计。通过采用计算机辅助设计软件提供的绘图功能、工程核算功能等,审计人员仅需要进行基本的输入,软件即可以绘制出对应的图形和精确地计算出工程的面积、体积等。对工程建设、矿业资源、土地利用等相关审计项目,可将可视化技术与地理信息技术相结合,直接将电子图纸等导入合适的可视化软件,或进行相应工程的建模,执行所需的工程量核算,历史图片对比等操作,减轻户外实地测量等的工作量,提高审计质量。经济责任审计中涉及到环境污染治理方面的,如空气污染治理、水污染治理等可以仿照气象部门的可视化应用思路,将相关指标进行可视化展示,使审计人员一目了然的进行分析判断,进而得出审计结论。

二是利用可视化技术,构建审计管控平台。基于现有的审计数据资源,以三维可视化技术将各种分散的信息和数据进行深度整合,将各个子系统,各个层面的信息清晰准确地展示出来,通过物理的设备可以知道当前的监控状态,通过一条监控数据可以了解物理设备情况,各种肉眼无法看到的信息,如通风路线、电力负荷、温湿度、承重分布、容量剩余等,都以不同的颜色或视图加以表达,便于及时观察情况发现问题。可以建立培训仿真实验室,替代组织审计人员集中进行业务培训的方式,实行上机仿真培训。

三是利用可视化技术,建设可视审计指挥图。缩放一定比例的空间地理信息数据图,实现审计指挥可视化,将可视化技术应用到审计指挥中心。在指挥图上按设定的可视化模式将审计资源信息、多媒体信号、音频信号、指挥决策数据、现场审计情景、计算机信息等按设定的流程进行有序推送,实现审计的信息展示、感知功能,提高领导的分析决策速度,有助于提高审计的效率和质量。

3.大数据审计分析方法

大数据审计涉及的数据具有体量大、类型多、线索分散等特点,这就需要审计人员科学使用大数据审计分析方法,快速、精准、高效地挖掘审计大数据中隐藏的价值。主要有:

(1)常规审计数据分析方法。

本课题所说的“常规审计数据分析方法”是指审计在处理常规数据时所运用的并且在处理大数据时仍然有效的分析方法,例如关联分析、对比分析、多维分析等。常规审计数据分析方法要求审计人员对于数据的特征、数据之间的关系等都是确定和熟悉的。

一是关联分析方法。将不同的数据按一定的主体进行关联,进而将归属同一主体但分散在不同数据中的信息集中展现给审计人员,使审计人员可以了解该主体的全貌。比较常用的有以企业法人、自然人、财政指标、财政专项资金、财政补助项目等为主体,将相关信息进行关联并生成数据集合。如,以企业法人为主体,将工商、税务、社保、电力等相关数据关联起来,使审计人员可以比较全面地了解一个企业法人的经营状况。

二是对比分析方法。指利用不同来源的数据进行复算、比较和核对,对真实性、合理性等进行验证,从而发现问题。不同来源数据既包括被审计单位不同出处的内部数据,也包括被审计单位以外的外部数据,而外部数据往往比内部数据更为可靠。以医疗困难救助审计为例,可享受医疗困难救助的持证人员主要有《特困人员救助供养证》《残疾人证》等证件持有者,上述证件的认定和发放机构为民政部门和残联,而医疗困难救助的管理部门为医保经办机构。在审计中,通过将医保经办机构的内部数据(医保信息系统中关于上述证件的信息)与民政部门、残联等单位的外部数据(发证信息)进行比对,核实医疗困难救助信息的合理性,从中发现民政部门和残联已注销证件但医保经办机构未及时更新数据,导致不符合资格的人员继续享受医疗困难救助的疑点。

三是多维分析方法。指从多个角度(或称多个维度)对原始数据进行处理,进而转化成可真实反映数据多维特性信息的方法。多维分析方法的核心是“维”,“维”可以是时间维、地区维或其它维等,适用于对有多个分类层次的数据进行分析。通过把数据放到一个两维以上的坐标中,从不同的审计视角分析数据内容,从而发现审计疑点,找出审计思路。常用的多维分析方法有上卷、旋转、切片、切块和下钻等。如利用下钻分析方法对财政指标管理情况进行分析,对指标管理按“指标”这一维度可以分为总指标、分口指标、分单位指标等不同层次,从总指标下钻一层可以得到单个总指标分解而成的分口指标,从分口指标下钻一层可以得到单个分口指标分解而成的分单位指标,从中可以分析出在分解过程中未完全下达的指标。

(2)数据挖掘分析方法。

在大数据审计过程中,我们往往会碰到一些数据特征比较模糊或者数据之间关系不确定的数据,在这种情况下,光靠常规审计数据分析方法显然是不够的,往往需要用到数据挖掘分析方法。数据挖掘就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中、人们事先不知、但又有潜在价值的信息或知识的过程。在审计中常用的数据挖掘分析方法主要有聚类、分类、回归、“智能挖掘”等等。

一是聚类(Clustering)。聚类分析方法就是依据样本特征,将事例分到多个簇中,使得同一个簇中的事例尽可能“相似”,而与其他簇中的事例尽可能“不相似”。事例就是被挖掘的实体,可以是一个项目,也可以是一笔资金。在审计数据挖掘中,不属于任何簇或者事例较少的簇,往往就是审计疑点。比较常用的聚类算法有K均值、期望最大化、凝聚层次聚类、基于密度的聚类等。以A集团资产审计应用为例,企业以非正常价格购入或转出资产是关注的重点,要发现这一疑点,可以设置“支付价/账面价”“支付价/评估价”“评估价/账面价”等三个指标,运用K均值算法进行聚类分析。从聚类结果得到A集团各子公司被划分到5个簇,大部分公司被划分到簇0,而簇1到4中的公司则很少,因此簇1到4中的公司可被视为异常公司,如簇1表现出支付价/评估价比值过高的异常特征。根据聚类结果,将异常公司视为疑点作进一步核查。

二是分类(Classification)。分类分析方法就是将事例映射到给定类别集合中某一类别的分析过程。在实施映射之前,要利用一定的分类算法,针对选取的样本数据进行训练学习,得到一定的分类规则;接着,根据该规则对需要分组的事例进行类别划分。分类分析方法的应用关键要选取合适的分类算法和圈定可靠的训练集。分类与聚类的区别在于,分类是通过事先训练学习确定好分类规则,而聚类则没有事先预定的分类规则,类别数不确定。在审计数据挖掘中,分类算法得出的分类结果和实际分类结果不一致的,往往就是审计疑点。较常用的分类算法有决策树(Decision Trees)、贝叶斯(Bayes)、人工神经网络(ANN)、K-最近邻(KNN)、支持向量机(SVM)等。以银行贷款五级分类真实性审计应用为例,审计组要对H市商业银行贷款五级分类的真实性进行核实,查找把应归为不良的贷款划归至正常贷款的疑点,针对贷款记录海量、分类规则复杂这一情况,审计组运用了决策树分类算法。首先,审计组将3年以前8年以内这五年的贷款记录圈定为训练集,在五年的贷款记录中提取正常类贷款且已正常结清的贷款、不良类贷款且已产生风险的贷款,将这两类贷款记录合并为真正的训练集;其次,应用决策树分类算法模型从训练集学习分类规则;接着,将近三年的贷款记录作为可疑贷款事例,并使用学习所得的分类规则对其进行分类;最后,将算法分类结果与实际分类不一致的贷款记录作为审计疑点进行核实。

三是回归(Regression)。回归分析方法是研究因变量(Y)与一个或一组自变量(Xi)之间关系的统计分析方法,通过分析一系列已知的因变量与自变量之间的关系,建立变量之间的回归算法模型,然后针对新的自变量,依据回归算法模型得出因变量。在审计数据挖掘中,回归分析方法主要用于预测判断,通过回归算法得到的因变量拟合值与实际值相差较大的,往往是审计疑点。常用的回归分析方法有简单线性回归、多元线性回归、多项式回归、Logistic回归、神经网络回归、支持向量回归等。以判断企业是否少缴企业所得税为例,首先,审计组从资产负债表、利润表、现金流量表中提取出一系列与企业所得税相关程度较高的指标作为自变量,将企业所得税作为应变量,审计组假设应变量和自变量之间存在多元线性回归关系;接着,审计组运用多元线性回归分析方法得到最佳拟合的算法模型;最后,运用算法模型针对被审计企业的相关财务指标(自变量)计算出企业所得税的拟合值(应变量),将拟合值与实际值相差较大的企业作为审计疑点进行核实。

四是“智能挖掘”。“智能挖掘”方法是将机器学习和人工智能等技术应用于数据挖掘工作。以基于机器学习的合同相似性检测研究为例,实现合同相似性检测的主要目的就是针对不同合同进行相互比对,度量两个合同文本之间的相似度,并用数值予以量化。相似度越高,表示这两个合同文本中类同的内容越多,合同相似的可能性就越大,反之亦然。要实现合同相似性检测,首先,要提取出合同文本中的主要内容,并切分出文本内容中的关键词,将有效的关键词作为合同的特征项;然后,计算出这些特征项的权重,并利用信息模型领域广泛使用的向量空间来表示文本的内容,每个文本被表示成文本特征项及相应权重所组成的一个向量;最后,通过向量间距离的计算就可以求得两个文本之间的相似性。

需要注意的是,在设计数据挖掘模型时,需要对挖掘算法的参数进行设置,而参数的优劣直接影响模型的应用价值。因此在应用数据挖掘模型时,需要对算法参数进行调优,在理解算法工作原理的基础上,先依判断设定一个初始参数,并向正反两个方向试探性地增长或减小参数,并与数据挖掘工具提供的评价度量进行比较,选定方向后继续调优参数,直到收敛为止。

(3)交叉融合分析方法。

交叉融合分析方法是指将信息学等其他学科的理论、方法等与计算机、审计等学科相互交叉结合,并运用到大数据审计中的分析方法。图灵奖得主姚期智曾指出:多学科交叉融合是信息技术发展的关键;当不同的学科、理论相互交叉结合,一种新技术达到成熟的时候,往往会出现理论上的突破和技术上的创新。同样的,随着大数据审计工作的推进和发展,将其他学科的知识与大数据审计技术交叉融合也是大数据审计不断发展的关键。

一是运用信息论相关知识进行分析。信息论是一门用数理统计方法来研究信息的度量、传递和变换规律的科学,其中信息论关于度量信息的方法可以较好地应用到大数据审计中。以信息熵在大数据审计中的应用为例,熵在信息论中表示随机变量不确定度的度量,信息熵有三大特性:单调性,即发生概率越高的事件所携带的信息熵越低;非负性,即信息熵不能为负;累加性,即多随机事件同时发生存在的总不确定性的量度是可以表示为各事件不确定性的量度之和。审计人员可利用熵的单调性这一特性,在医保审计中对刷医保卡套现行为进行核实。即:用信息熵来表示人员购药行为的不确定度,从常理来说,一个病人不会到很多家药店买药,而且每次买药的金额应有所不同;而参保人如果存在刷医保卡套现行为,则往往会在多家药店刷卡,且每次购买金额较为接近(接近控制线)。从上述分析可以得出,信息熵越大的人员,存在刷卡套现的可能性也越大。审计人员将熵值较大的人群圈定为疑点人群,筛选他们全部刷卡记录,进行深度分析,从中发现刷卡套现的线索。

二是运用统计学相关知识进行分析。在分析无显著个体特征的大数据时,对其数据统计特征进行分析常常能取得较好的效果,可以及时识别潜在的风险违规点,快速定位疑点数据,提高审计工作效率。从某种程度上讲,数据挖掘分析方法已经大量运用了统计学相关知识,这里所说的运用统计学相关知识进行分析,是指运用SQL语句和函数,对大数据的统计特征进行分析,如方差特征、假设检验、离群点发现和数据分布特征等,进而发现审计疑点。以应用Benford定律来判断所取得的大数据是否被人为篡改为例。概括地说,Benford定律是指数字及数字序列在一个数据集中遵循一个可预测的规律;简单来讲就是在不同种类的统计数据中,首位数字出现较小数字的可能性比出现较大数字的可能性大。这就意味着,在一个没有指定规则的十进制数据集中,首位数字的概率分布从1到9依次变小。利用Benford定律的这一原则,可以对会计金额等数据集进行统计分析,查看金额的首位数字概率分布情况是否符合Benford定律,来初步判断数据集是否经过人为篡改。

三是运用地理信息相关技术进行分析。随着自然资源资产审计重要性的逐渐凸显,大数据审计在该领域的应用研究也逐渐兴起。与常规大数据审计不同的是,在自然资源资产审计中面对的大数据不仅仅是常规的数值数据、文本数据等,它面对的更多是矢量数据、影像数据等。因此,在自然资源资产审计中需要大量运用地理信息相关技术,如对所采集的数据进行矢量化、坐标投影转换等处理,使其达到可进行空间比对分析要求,再运用图层叠加、求交等方法进行比对分析,查找疑点。常用的地理信息软件工具有ArcGIS、MapInfo、Google Earth等。以地理信息相关技术在侵占公益林核查审计中应用为例,首先,通过ArcGIS软件中的图层转换工具将公益林的矢量图转为KML文件并输出;接着,将输出的KML文件直接通过Google Earth软件打开,并利用Google Earth提供的“历史图像”的功能找到疑点图斑;最后,将疑点图斑再转为KML文件并输出,导入到ArcGIS软件中计算侵占的面积等,最终发现公益林被违法侵占的事实。

(五)大数据审计的质量控制

数据质量不高和分析思路或技术路径不正确是影响大数据审计质量的两大主要因素。大数据审计结果要真实、完整、准确地反映被审计单位的实际情况,其质量有赖于审计数据“真实可信”、分析过程“逻辑正确”和审计结果“可以逆查”,三者缺一不可。为防止假数真审、假账真查和结果误导等情况的发生,大数据审计应履行好审前信息系统测试,审中抽样验证,审后事实确认等环节,确保大数据审计结果真实(与被审计单位实际情况相符)、完整(全面反映没有遗漏)、准确(与系统原始数据相一致)。

1.开展系统数据的真实性验证。由于被审计单位自身信息系统内部控制不健全,如信息系统校验、核对措施不足,缺乏对误操作的预防,不能及时纠正录入错误等,造成其提供的数据错误率较高,容易造成假数真审、数据分析结果偏离事实的问题。因此,审计分析前,需要对大数据审计涉及的相关被审计单位及相关单位的信息系统进行必要的控制性测试,按照业务流程和风险防控点对系统进行分析,验证信息系统本身运行的有效性和产出数据的可靠性,确定信息系统运行产生的数据是否与被审计单位及相关单位实际工作台账、业务档案等实际情况相吻合,确定系统数据信息是否得到及时、完整录入,相关信息是否得到及时更新,逻辑关系是否正确。通过上述审前系统测试,一方面可让审计人员加快了解被审计单位相关业务流程、信息系统功能和电子数据构成,提高审计效率,另一方面可事前发现、揭示信息系统原始数据可能存在的不真实、不完整、不准确的情况。

2.开展导出数据的一致性验证。审计人员因对被审计单位业务不熟悉,或对信息系统的调查不深入,或对审计目标把握不精,造成采集审计数据时未能明确审计所需的数据内容、时间范围和辅助资料,造成数据采集不够全面,影响大数据审计结果。因此,对系统导出数据与系统实际产生的原始数据进行比对,验证审计采集数据的是否完整、一致,以确定审计采集数据的准确性。

3.开展数据分析的复核性验证。对数据分析方法或分析结果缺少必要的复核程序,是导致分析结果质量不高或结果无效的主要原因。因此,应由大数据审计主审或其他专人对各大数据分析(挖掘)过程和结果进行复核,验证其分析所依据的逻辑关系、关联关系是否正确,以确保数据分析的准确性。

4.开展样本数据的抽样性验证。数据分析结果必须保证与审计查证的事实相吻合。因此,需要对大数据审计分析挖掘所产生的审计数据分析结果进行分类排列,从中选取一定比例的重要的、有代表性的样本进行现场核实,验证样本结果与实际事实是否相符,确定样本与总体的偏差程度和可信程度,确保审计数据分析结果可信赖程度符合大数据审计工作预期要求。

5.开展数据事实的确认性验证。数据分析结果最终需要被审计单位的认可。因此,审计人员应编制《大数据审计取证单》,描述分析过程、分析语句和汇总结果,附上相关证明材料,由被审计单位相关业务人员和技术人员共同对审计数据分析结果进行签证,确定数据分析结果真实、正确,规避大数据审计可能带来的失实风险。

 

 

三、大数据审计面临的困难和应对

课题组认为,当前各级审计机关要按照第二部分提出的大数据审计业务流程和工作规范开展大数据审计工作,还普遍面临组织保障不力、技术支撑滞后和安全防护缺乏等三个方面的困难。各级审计机关必须正视这些挑战,建立健全“人才、平台、安全”三维保障体系,才能把握住大数据审计这个历史性的机遇,推动审计工作持续稳定和高质量发展。

(一)大数据审计面临的困难

1.组织保障不力

(1)传统审计组织模式限制大数据审计实施。新时代背景下大数据审计项目往往是数据量大、涉及资金和被审计单位多的项目,需要更多的审计人力支撑,因此往往需要多部门多专业人员协同作战共同参与,大数据审计的审计对象也不再是单一的被审计单位,而是逐步转型成资金、事项和数据等,审计小组的人员构成需要审计机关内部统一调度协调组成。但传统审计组织机构中,上下级审计机关、审计机关内部各部门间各自为政,审计职能部门化,审计对象固定化,审计力量碎片化,以审计业务部门为单位的人员结构设置阻碍了大数据审计工作的开展和深入,既不利于审计资源的综合利用,也不利于审计人员的统筹使用。

(2)大数据审计专业人才匮乏。相比其他审计,大数据审计对审计人员的知识面、专业技能和综合素质等方面要求更高。目前,各级审计机关均存在大数据审计专业人才匮乏的问题。专业人才占全市审计人员比重低,既懂计算机又懂业务的复合型人才更加缺乏。从实际情况来看,目前许多审计机关年龄较大的审计人员占多数,且审计、会计等传统专业占的比例较大,计算机等大数据相关专业人员较少,对审计机关整体业务素质提升造成很大障碍。从某省审计厅2016年发布的审计人员统计表来看,该省具有计算机专业背景的审计人员为190人,仅占审计队伍的5.83%(具有大数据专业背景的更少),全省每个审计机关有计算机专业背景的审计人员平均不到2人,严重影响大数据分析技术在审计机关内的推广和应用,大数据审计工作开展也受到很大影响。

2.技术支撑滞后

(1)被审计单位数据多元化。由于各被审计单位信息系统数据库平台的推行标准不同,忽视了协同共享的需求,使得各层级部门之间业务系统的数据交换和传递不畅。比如各级行政单位所使用财务软件都不尽相同,有新中大、中科财务、中科一体化以及用友A++集中财务软件等多个不同类型的数据管理分析平台,数据备份文件分bak与dmp等格式,业务数据类型更加多样。由于大部分数据库系统没有有效的审计接口,审计机关的系统平台无法直接获取到相关数据进行审计分析,需要通过其他途径进行系统备份数据的采集,审计数据的时效性滞后;后期审计数据清洗工作量大,加工转换难度高、过程繁琐,一旦出现数据错误,有可能导致所采集的审计数据失去真实有效性,严重阻碍大数据审计的发展步伐。

(2)大数据综合分析平台缺乏。审计数据管理部门化(信息孤岛),分析系统建设碎片化,造成现有大多数审计数据分析系统的系统功能和技术水平已不能满足审计全覆盖和大数据审计的需求。目前部分审计机关先行先试,构建了审计数据中心和大数据应用平台,但仍存在汇聚数据不多、系统功能有限等问题。各地各级的审计数据分析平台发展情况也不均衡,绝大部分基层审计机关没有可供使用的大数据分析平台,缺乏大数据分析机构,导致基层审计机关审计信息孤岛现象特别严重。

3.安全防护缺乏

大数据审计环境下,数据安全防护与应用便捷性的矛盾日益突出:一方面,从开展大数据审计工作的便捷性考虑,需要尽可能的开放共享,让审计人员在各种审计场合都能较为便捷地使用审计数据资源。而另一方面,审计获取的被审计单位的财务业务电子数据往往包含多个行业的敏感信息,其信息安全保密工作不容忽视,一旦发生数据失密、泄密等,不仅会给被审计单位造成不利影响,还会产生严重的审计风险。也就是说大数据在包含巨大价值的同时也包含巨大的安全风险,审计数据越集中,数据的集合体越敏感,对数据的安全防护要求越高。目前,各级审计机关特别是基层审计局对数据安全的防护意识和措施均还不够,如何找到安全性和便捷性之间的平衡点,有效解决数据安全防护与应用便捷性的矛盾将成为破除大数据审计制约因素的关键。

(二)构建大数据审计“三维”保障体系

1.组织保障——注重人才统筹,构建新型大数据审计组织体系

大数据审计涉及的范围广、部门多,扎实推进大数据审计,亟需优化传统体制机制格局,打破机构、部门限制,实施扁平化管理,形成上下联动、内外结合、左右协同的新局面。

(1)中央和国家审计署层面,探索构建统一高效、上下联动的大数据审计扁平化组织机构。在中央审计委员会基础上成立大数据审计工作委员会,审计署相应成立大数据审计工作委员会办公室(设在电子数据审计司),横向突破各省部委办的割据,纵向突破审计系统上下级的界限,编制全国统一的大数据审计工作规划,整合全国的人力、财力和物力,统筹开展审计数据采集、规划和分析等大数据审计相关工作。

(2)地方审计机关层面,探索组建分工负责、左右协同的大数据审计指挥协调机构。组建大数据审计指挥中心,为大数据审计工作提档升级,构建审计机关与其他单位、审计机关与内部机构的大数据审计工作沟通桥梁,打破部门间的数据垄断和数据壁垒,充分发挥各部门的优势,更好地推动大数据审计服务党委政府的中心工作。

(3)探索组建统一、专业的数据管理团队。统筹大数据审计人才资源,组建由主要领导直接分管的数据管理团队,将数据管理工作制度化、规范化,明确工作目标、具体措施和考核标准。对内做好基础数据采集、数据标准化、数据资源共享等工作,对外做好与数据提供者以及数据资源管理机构的沟通衔接。

(4)探索培养分层次的大数据审计人才队伍。一是对非专业审计人员开展大数据普及培训,分类型、分层次、分专题抓好培训,重点开展大数据审计思维在审计案例中的应用培训,特别加大对审计机关各部门负责人大数据素养培养力度。二是加大中高级人才培训力度。采取一次系统化长期专业培训和多次短期强化培训相结合的方式,重点开展高级分析技术培训,通过学习掌握统计学、数据处理与数据分析等方面的知识,为开展大数据综合分析利用打下基础。三是建立以智库机构、科研院所行业专家为主的咨询团队,包括数据科学家、经济学家、技术专家等,协助审计部门培养一批能够准确高效把握国家宏观政策,全面分析各类风险隐患,为国家相关体制机制建设提供精准建议的高级大数据审计分析人才。

2.技术保障——注重平台建设,创建大数据审计作业系统

大数据审计作业系统的最终建设目标是满足各类审计人员开展数据分析的需求,其核心建设内容是审计数据中心和大数据审计综合分析平台。

(1)构建“集约化、共享型”审计数据中心,夯实大数据审计基础。按照数据广覆盖、连续性的原则,建立汇集一定行政区域内被审计单位数据、审计结果数据、第三方信息数据于一体的区域审计数据中心。

一是数据存储——建立数据分类存储体系。根据数据涉密情况和敏感程度,按照“安全、便捷”原则,将数据划分为涉密数据、敏感数据和非敏感数据。对涉密数据严格按照相关保密要求存储;对包含被审计单位商业秘密和个人隐私等敏感数据存储到与互联网物理隔绝的专用存储服务器;其他审计数据存储到政务云的审计专有云。

二是数据展示——构建审计数据资源目录。构建“清晰、明了”的审计数据资源目录,实现审计数据资源的快捷查询和检索。数据资源库包括审计标准表数据、被审计单位原始数据、审计项目数据以及审计知识库数据(含历年大数据审计案例和审计方法)等数据资源,描述上述资源的元数据的集合形成数据资源目录。

三是数据关联——建设审计主题库。梳理数据间的业务逻辑关系和关联关系,形成大数据审计常用的法人、自然人、资金、资产、审批等审计主题库。

四是数据共享——开发数据交互系统。依托政务网建设审计数据交互系统,实现审计机关与审计联动部门之间的数据交换;依托审计专网建设审计机关数据交互系统,以审计资源目录为载体,实现区域内各审计机关之间的数据交换和资源共享。

(2)建设“智慧型、一体化”大数据审计综合分析平台,抓住大数据审计核心。对集中的海量数据信息进行深度应用和关联分析实现跨领域、跨部门、跨地区、跨年度的数据综合分析。针对不同计算机技术水平的审计人员,开发适用的大数据综合应用功能,以满足不同层次审计人员对大数据分析的需求。

一是开发智慧搜索、基础查询、常用审计分析模型等功能模块,提供简便、易用的搜索功能模块,提供无需用户编写查询语句的单库、跨库查询功能模块,提供行业数据常用、实用的基本审计方法模型,以满足普通审计人员的数据分析需求。

二是开发向导式查询、高级SQL编辑器,提供易操作、界面友好、稳定性高的审计分析环境和工具,满足掌握一定计算机技能审计人员的进一步数据分析需求。

三是提供大数据挖掘工具突破固有的SQL分析方法,通过数据挖掘算法从无强关联关系数据中构建数据挖掘模型,提取有价值的、隐含在数据内部的信息,满足审计分析发散性思维的需求。

四是提供可视化分析工具,利用多维图表完整展示数据分析的过程和数据链结构,通过简单的离散、聚合等关系直观的发现审计重点、疑点。

通过上述开发建设,最终实现“五个智慧”:一是智慧搜索。通过构建审计数据仓库,实现审计数据资源目录的多维展示,使审计人员能够直观地知道“有什么数据”,便捷地找到“所需要的数据”。总之,要以“审计百度”的形式快速、准确地查找审计数据资源。二是智慧分析。总结提炼财政、社保、公积金等行业审计基础分析方法,构建行业审计常用分析模型,实现行业审计常用分析模型的批量智能分析。同时,系统能支持填空式、拖拽式的自由查询比对功能模块,实现数据标准表、审计中间表、外部导入的临时表之间的自由查询。三是智慧关联。有序做好数据关联关系库,探索利用机器学习等技术,使平台能根据已有审计数据资源,自动挖掘数据间隐藏的关联关系,“向导式”提示审计人员可关联的相关数据名称及其字段。四是智慧计算。通过云计算和数据库优化等技术实现巨量数据的智能计算和快速响应,提高分析效率。五是智慧管理。通过建设用户管理系统对原始数据、标准数据、分析结果数据等审计数据使用的审批和数据权限的自动发放与回收;建设运行监控系统实现对各种设备、数据库、平台应用程序的监控和预警;建设数据采集管理系统实现数据采集、恢复、存储、验证、使用等各个流程的计划、进度等查询和管理。

(3)构建“高级版、自动化”审计机器学习系统,提升大数据审计价值。在大数据审计平台中引入机器学习,一方面可以通过演绎学习、类比学习发现不被审计人员掌握的关联关系;另一方面通过归纳学习,总结审计人员的数据分析操作规律,并以适当方式展示给其他审计人员,实现经验的分享和传承。

一是利用机器学习和AI来做数据挖掘工作。随着海量数据的出现,传统的数据分析方式一般无法处理看似不相关的数据,因此需要数据挖掘技术使用大量机器学习的算法去提取各种数据和变量之间的相互关系,将这些信息合并来发现传统审计方法难以发现的内在关联关系。

二是自然语言处理(NLP)。对于半结构化、非结构化的数据,因其自身的复杂性,较难通过传统的大数据、云计算技术处理,可以引入NLP 技术,依靠机器学习来自动学习这些规则来处理海量非结构数据。利用NLP提取、解析和分析数据,从“文档”等非结构化数据中自动提取信息。

3.安全保障----注重安全防范,构建大数据审计安全保障体系

大数据应用通常具有数据频繁跨界流动(流入流出)、参与数据处理角色多元化、应用边界模糊等特点。而审计大数据区别于其他行业大数据的特征是“多方采集、静态存储、角色固定、有限共享”。

大数据审计意味着一定行政管辖范围内的政务数据资源在审计部门高度集中,数据集中化存储程度越高,安全风险越大。大数据环境下的信息安全风险防范,核心应聚焦于数据完整性、保密性、可用性上。

对大数据审计而言,安全威胁主要来自于系统、数据非授权访问,以及数据窃取、篡改等。因此课题组提出以“非指定设备进不来、非指定应用看不见、非审批流程拿不走、非证书用户用不了”为目标,根据所采集数据的安全等级,建立安全可靠的数据采集和传输加密通道,满足电子数据的正确性、及时性、安全性等需求;建立以数据为中心,贯穿数据从采集、存储、传输到应用全过程的安全保障体系。

基于信息安全驱动下的大数据审计安全保障体系具体分以下四个方面:

(1)基础设施安全防护。

大数据依赖云计算技术的支撑,伴随分布式存储、分布式并行计算架构以及虚拟化技术的应用,安全防护更加复杂。

以H市政务云架构为例,对于政务云用户来说,虚拟化政务云主机(ECS)资源通过虚拟专用区域(VPC)同其他用户的云主机资源之间逻辑隔离;多个用户的数据则通过区分实例的方式存储于共享云数据库;而计算资源则通过用户鉴权的方式进行隔离使用。这种架构下,底层的基础设施安全防护,包括物理安全、网络安全、虚拟化安全等,由云服务提供方统一保障。

这种政务云的架构解决了政务资源共享利用,节约投入成本、提高资源效率的需求,尤其是统一规划建设基础设施安全架构,由专业团队提供基础安全保障以及可定制的安全策略,使整体安全防护能力更有保障。但同时也存在云内部安全边界模糊、安全责任多方共担等带来的安全风险,必须建立一套与之适应的安全管理机制,明确各方安全职责,互相监督以保障不会出现安全防护的空白地带。

(2)平台运行安全防护。

在基础设施安全之上,对大数据平台运行安全保障的主要目标是系统平台服务功能的可靠性以及数据完整性,侧重于数据中心、数据分析平台的业务稳定、持续运行能力。

传输交换安全防护:保障审计采集外部数据的安全,主要包括前置机采集方式下的数据接口鉴权、前端数据采集保护、传输加密、采集数据存储安全等。

存储安全防护:对各类采集数据以及本地业务数据的集中(或分布式)存储建立可靠的备份恢复机制,结合数据库快照、云灾备、异地灾备等技术,保障系统和数据的故障恢复能力。

计算安全防护:计算安全防护是指对调用计算服务资源分析处理数据,必须经过有效的合法性认证管理,通过平台的角色、用户、认证管理机制等,对用户权限进行有效管控。

平台管理安全防护:大数据云计算平台的复杂性对平台自身安全管理提出了更高要求,包括平台组件配置、资源调度、漏洞补丁升级、应用部署以及安全审计等的安全管理。平台应当建立一个系统的综合性安全管理子平台,用于统筹管理上述安全需求。

(3)审计数据安全防护。

针对数据防泄露、防篡改等安全目标,建立数据安全管理体系,在数据采集、存储、分析、共享各个环节,通过数据隔离、数据加密、防泄漏等技术,保障数据合规使用,避免数据被非法使用、滥用、恶意篡改以及数据泄露等造成的危害。

数据分级管理:建立数据分级管理机制,确定数据对应的安全防护等级。对基础数据中个人隐私、商业秘密、工作秘密等相关数据(户籍信息、婚姻信息、不动产登记信息、个人银行账户信息、个税信息、残疾人信息、机动车登记信息等)作为敏感数据进行管理。

数据隔离与访问控制管理:通过授权访问控制用户对数据和分析结果的可见性,使“数据可用不可见”;在数据可控的前提下,对分析结果进行共享利用。

(4)安全管理制度。

围绕“数据怎么来、数据怎么管、数据怎么用”这一思路,制定适应大数据审计模式的信息安全管理制度,确立数据保护的原则、数据处理的分工协同机制,以及明确分工协作中的各方在数据管理及使用上的安全管理权责等,保障大数据审计安全管理常态化、制度化。

 

 

四、大数据审计的实例探索

在大数据审计研究过程中,课题组围绕地方大数据审计开展相对较多的重要民生保障、政策措施落实、重大投资项目、自然资源资产和领导经济责任等五大领域,总结、提炼了H市审计机关的大数据审计实践做法,供各级审计机关参考、借鉴。

(一)民生保障类大数据审计——以H市医疗保险基金审计项目为例

1.项目背景

(1)社保行业信息化应用程度相对较高。自人力资源部门实施“金保工程”以来,社会保障行业信息化建设取得了突破性进展,数据集中、系统应用、机制创新已成为当前“金保工程”建设的新特点,这给审计部门开展大数据应用提供了良好的外部环境。

(2)Z省社保审计应用较为成熟。2017年9月,Z省审计厅编制了大数据审计实务公告第3号——《社会保险基金大数据审计数据规划》,为全省社保大数据审计工作的开展提供了数据基础。

基于上述社保行业的内外部环境优势,2017-2018年H市持续开展了对部分城区医疗保险基金运行管理情况审计,同时延伸审计部分医院。审计采集了社保管理系统以及其他相关单位的业务数据,将其转换为符合数据规划的标准表,仅社保管理系统的数据量就高达2TB。

2.审计重点

(1)医疗机构确定。医保业务复杂、数量巨大,涉及的定点医疗机构多,如何快速、合理确定延伸审计对象,是审计面临的困境。如截至2017年底,仅H市F区纳入医保定点范围的医疗机构就多达75家,如果仅凭抽查的传统审计手段,不仅大大降低审计效率,查出违规违法问题的概率也将大幅降低。审计提出以下3种大数据分析思路,来确定重点延伸定点医疗机构:一是年度收入增长异常(特别是使用医保基金增速较大)的医院,比如,大数据分析得出X区某医院医保总费用从2016年的2937万元,增长到2017年的6232万元,增长率为112%,此类医院可以作为重点延伸医院。二是存在单项收费项目依赖度较高情况的医院,比如F区某医院连续3年“温针”项目单项收费均占全部收费项目的30%以上,很有可疑。三是运用以往审计建立的模型,对所有医院进行分析、筛选,疑点较多的医院作为重点延伸审计对象。若某医院符合上述3个条件,则作为首选延伸审计对象。

(2)骗保疑点筛选。一是弄清业务流程,找到风险点(即可能的舞弊骗保节点)。二是弄清数据流(即数据之间的关系),找到关联点。比如某医院通过虚假销售药品(或器械)骗取医保基金:业务流程上,医院首先需要采购药品,然后销售给病人;数据流上,医院采购药品时需要将其入库,销售时,医院需要将药品出库,并计入医院结算数据(部分向社保基金报销结算)。因此,针对具体医院,一是以药品为关联点,比对入库总量(加年初数)与销售结算总量。如果入库少,销售结算多,可能存在虚假销售骗取医保行为;如果入库多,销售结算少,可能利用此药窜换其他非医保项目行为。二是以药品、医保病人为关联点,比对出库数据和销售结算数据,如果无出库数据,有销售结算数据,说明此此药的销售为虚假销售。

(3)医院运营分析。一是利用医院和医院之间的数据进行关联分析。各家医院信息系统均自行运维,因此我们选用医疗就诊数据结合《医疗服务价格手册》、《药品目录》等来确定关联数据。患者就诊时有自己的属性代码身份证号码,医疗服务有医疗服务代码,药品有药品代码,这些代码均需上传医保,均有统一标准,所以同一个医疗服务或同一个药品在医保系统必然有相同的代码实现统一对应。选用这些关键数据,我们可以对医院之间的数据进行关联分析。二是利用医保和医院之间的大数据进行分析。医保数据由各医疗机构按照医保数据要求上传,因此医保信息系统有医疗机构代码标识数据来源;有结算单号码标识医保报销数据对应具体医疗业务收入。通过医疗机构代码和结算单号码,我们就可以对医保数据和医院数据进行关联分析。

3.审计方法

医疗保险基金审计项目涉及的审计方法较多,最具代表性的方法有:

(1)多样化数据分析,医疗骗保行为无处遁形。

一是信息熵相似性度量,发现药店异常刷卡行为。审计经验告诉我们,在审计中发现的骗取医保基金的行为基本存在以下特征:一是时间集中,即短时间内对多张医保卡进行多次结算,且多集中在早上或者晚上人少的时候。二是诊断、项目类似,由于时间较短,作假时无法充分考虑,往往在诊断和所结算的项目上会有很大相似性。三是结算金额适中,不会过大也不会过小,过大会增加被发现成本,过小则无法得到足够利益,因此只考虑结算金额大于200元的数据。

基于以上特征,可引入信息熵概念,对每个医疗行为进行量化分析,从中发现骗保行为。以定点医疗机构一个小时作为观察区间,在一小时内,有若干笔结算信息,当空刷、盗刷医保卡骗取医保基金的行为发生在这一小时内,则这一小时内的结算数据就会集中,且存在极大地相似性,相应的信息熵就会偏高,当结算数据完全相同,信息熵达到最大值。

在医疗保险基金审计中,审计组通过上述分析方法,按医疗机构对每笔医疗行为的信息熵求和,确定数值较高的医疗机构为延伸审计单位,最终发现某中医门诊部存在用虚假医疗项目冲抵现金支付的情况。

二是多系统数据比对,发现骗取医保基金行为。在医保业务中,主要涉及到3大类数据:医保部门管理系统数据、医院HIS系统数据、医院设备管理系统数据。通过上述3类数据的对比分析,往往有意想不到的效果。

——分析逻辑矛盾点,发现骗取医保基金嫌疑。以医疗项目为主线,统计分析一定时期内结算总量,与医疗业务上需要用到的辅助医疗耗材对比分析,发现矛盾点。如通过数据分析发现,某医养结合医院“鼻导管吸氧”项目,其医保结算数量与医院自身拥有制氧机的数量严重不对等,存在骗取医保基金疑点。移送公安机关后查实,该医院通过虚开“鼻导管吸氧”项目,骗取医保基金200余万元,抓获犯罪份子9人。又如,H市某医院“温针”项目,其医保结算数量与医院购买一次性针灸针的数量严重不对等,存在骗取医保基金疑点。进一步查实后发现,该医院长期通过“温针”项目,将原本不能报销的非医保项目纳入医保报销范围,移送社保部门处理后,追回医保基金100余万元,同时该医院被社保管理部门取消定点医疗资格。

——医院自身数据显真相,骗取基金行为露马脚。以医疗项目为主线,统计分析一定时期内结算总量,与对应医疗设备上的记录数据进行对比分析,医院虚报冒领、骗取社保基金行为将显露无遗。如通过数据分析发现,某康复医院“数字化摄影(DR)”项目,其结算数量与医院设备管理系统中记载的记录数量相差极大,且根据身份证关联发现,部分已结算人员在检查设备中没有相应记录。经审计组核实发现,该院通过虚开此项目涉嫌骗取医保基金约100余万元。又如,某区2家医院的“B超”、“磁共振”等检查项均不同程度的与检查设备中记载的数据有明显差异,经审计人员核实发现,上述医院长期存在虚开检查项目多收费,或借用他人医保卡就诊等违规行为。

(2)多行业数据对比,评价家庭医生签约绩效情况。

上级主管部门对家庭医生签约覆盖率的要求逐渐提高,为完成上级考核,部分社区卫生服务中心或签约医生可能存在盲目签约、虚假签约的冲动。因此,可以对签约数据的合理性、真实性进行重点关注。

一是签约人员地理位置分布分析,评价家庭医生签约绩效情况。利用百度地图API功能,通过地址定位GPS坐标,再编写代码计算两个GPS坐标之间距离。因此,利用签约人员数据和签约机构信息,分别获取地址,然后可以实现批量计算签约人员家庭地址和签约机构之间的距离,从而评价签约的合理性。同时利用百度地图API提供热点图功能,可直观显示签约机构的签约人员数量和分布情况。

二是签约人员有效性检查。相关操作规定,非医保参保人员通过办理自费健康卡进行插卡签约,而根据调查了解,只要掌握身份证信息,街道社区卫生服务中心可以自制自费健康卡,这里就存在一个医生虚假制作自费健康卡进行签约的漏洞。利用身份证号码将市卫计委的签约人员和市医保局的参保人员进行关联分析,筛选出参加了市医保但使用自费健康卡进行签约的数据。重点对这些数据进行核实,发现部分社区医院为完成考核,存在虚假签约、重复签约等情况,审计进而提出完善制度、促进医养护一体化签约服务发展的建议,获得市领导和相关部门的重视。

(3)大数据精准分析,剖析“看病贵”问题及成因。

一是比对医院采购数据与政府集中采购目录信息,揭示违规线下采购行为。通过比对医院药械耗材的入库信息与省市集中采购目录药械耗材平台中的相关信息,可以发现医院纳入省市集中采购目录的药械耗材,是否由集中采购平台中有配送资质的供货商配送,采购价格是否与平台中的采购价格一致等情况。如,某中医院2013年-2015年HIS系统中有88种药品的采购信息与省药械采购平台上的采购信息不一致,未通过全省药品采购平台采购,共涉及采购金额400余万元;部分纳入省市集中采购目录的医用耗材未选用目录对应型号,规避省市采购平台集中采购,涉及采购金额800余万元。

二是比对医院采购数据与海关数据,直击医疗成本。从源头着眼,获取海关相关进口药品、耗材、试剂的进价数据,再对比医院的最终售价,计算价格差,了解进口药品、耗材、试剂的整个流通和加价情况,并把其中价差大的药品、耗材、试剂作为重点延伸审计内容。如某中医院通过海关进口的药品有32种、耗材有10种、试剂有14种。其中进口药品从海关报关单价到医院采购价格加价率平均在154.25%,其中27种在100%以上;进口耗材从海关报关单价到医院采购价格加价率平均在167.64%,其中8种在100%以上;进口试剂从海关报关单价到医院采购价格加价率平均在89.56%,其中7种在100%以上,并揭示了每个流通环节中加价情况,分析了进口药品、耗材、试剂的成因,提出了建设性审计建议。

三是中草药采购扣率和加价分析。目前,医院中草药采购一般按照农副产品来界定,中草药采购未走网上统一采购流程,医院间采购价格不透明、信息不对称,导致目前医院间采购价格不一致,中草药质量层次不齐,中草药销售加价率普遍过高。公立医院一般通过确定扣率的方法,来确定中草药的采购价格,因此分析中草药的扣率,可以判断医院是否严格执行确定的扣率采购。通过医院药品入库单明细数据,可以分析计算中草药的实际扣率(进价/批发价);关联销售结算数据,可以分析计算中草药的实际加价率(销售结算价/进价-1)。通过数据分析发现,某中医院2015-2017年有114种中草药没有按照纪要规定的扣率采购,涉及金额1000余万元,最高扣率为100.68%,高于规定65%扣率的中草药有57种;该医院2015-2017年共计1311种药材,平均加价率为82.13%,其中大于100%的药材有200种,最高达222.80%。

4. 主要成效

(1)项目直接成果。项目发现问题金额高达114.89亿元,反映了城区保险费收入增速趋缓、支出增长快速,医保基金支付能力将大幅下降等政策层面的问题,促进出台或修订制度14个;移送了药店、中医门诊部涉嫌空刷医保卡、上传虚假医保费用骗取医保基金等违法犯罪线索5起,2人被判刑,2家医院被取消医保定点服务资格。

(2)总结提炼成果。审计报告得到常务副市长的批示,撰写审计专报或信息3篇,被2名副省长、2名副市长批示。审计项目被评选为2018年“审计署优秀审计项目”。

(二)政策落实类大数据审计——以H市产业发展政策执行绩效审计调查项目为例

1.项目背景

(1)产业政策分支多、补助项目庞大。产业发展政策涵盖工业、服务业、商业、农业等诸多行业,补助项目主要可分为工业和科技专项、现代服务业专项、商务发展专项、农业发展及农村建设专项四大类,专项资金下拨及业务审核过程涉及所有下属区、县(市)以及发改委、经信委、市科委等11个市本级业务主管部门。如工信专项资金重点项目又分技术改造、机器人、物联网等多个类别,延展到F区一级就产生1200多个补助项目,补助量非常大,人工核实企业申报信息的难度很大。

(2)涉及业务数据种类多、结构复杂。一是产业发展专项政策本身的预算申拨及支出数据条目多,如本案例获取的申拨预算数据4500多条,专项资金支出数据9400多条,根据各业务主管部门拨付文件所收集的专项资金拨付数据3万多条。二是产业发展政策涉及地税、社保等行业数据和培训机构培训人员基本情况等企业业务数据,不仅数据量庞大,而且数据种类与数据结构复杂。因此,必须打破传统审计模式,借助大数据分析技术手段,提升审计覆盖面,提高审计效率和精准度。

(3)大数据审计分析平台提供强大支撑。H市审计局建设的智慧审计系统数据中心提供了该项目分析过程中所需的工商数据、税收数据、社保数据、财政供养人员数据和公积金数据等外部数据,为实现跨地区、跨部门、跨行业的大数据审计关联分析,多层次反映产业发展政策执行情况提供了有力的数据支撑。

基于上述三点,H市审计局运用大数据分析方法,紧扣“建立质效兼优的产业新体系”、“发展1+6产业集群”等产业发展目标,围绕配套政策制定、政策执行、预算安排、资金管理和使用、项目绩效等方面进行审计,促进产业发展类政策不断完善和有效执行,促进产业融合发展和产业结构战略调整。

2.审计重点

(1)政策补助执行情况。补助名单是此类大数据项目的分析重点,通常可以从政策符合度、名单重复度、名单真实性等方面进行深入的大数据分析。一是关注补助对象是否符合政策要求,例如对新引进人才发放补助则补助对象应当在该地无工作不缴纳社保,通过社保数据可以轻松印证。二是关注补助对象的真实性、可靠性,例如对补助申报企业通过信用平台查询可以得出补助对象是否纠纷缠身的低信用企业。三是关注补助金额的合规性,例如项目补助是否在政策标准之内,有无超标准补助情况。四是关注补助审批过程的漏洞,例如有些申报单位利用审批单位信息化审核程度不高,伪造、使用假发票或虚构培训信息骗取资金,同一项目经过包装在多部门或不同项目间申报骗取资金。

(2)配套资金执行情况。专项资金配套到位是拉动产业政策落地的重要杠杆之一。产业类专项补助涉及项目众多,因此资金拨付条目较其它补助几何级增长,如该项目中专项资金通过直接拨付、转移拨付所产生的记录达3万多条,根本无法凭手工比对进行全覆盖审查。一是可以关注资金拨付的时间跨度来分析区、县(市)的执行情况,将超出规定时间的条目列为疑点;二是可以关注项目资金的实际使用金额来分析区、县(市)是否按要求及时、足额对项目进行配套。

3.审计方法

本项目主要通过多维分析(OLAP)、聚类分析和数据相似度监测等手段来分析数据之间的关联关系,找到最重要、最关键的风险点。主要大数据审计方法有:

(1)开展市县两级间的财政数据跨地区关联分析。H市专项资金管理办法规定“市级财政拨付区、县(市)的专项资金,需在一个月内拨付至使用单位且应当进行相应比例的配套”,但在实际执行过程中由于各种主、客观原因,通常存在延期及配套不到位的情况。因此,审计组从智慧审计系统数据中心中获取各级财政数据,对市级财政拨付区、县(市)资金与区、县(市)实际使用专项资金数据展开远程联网聚类分析。审计发现,市级财政资金已拨付补助单位,但区、县(市)资金未配套拨付的情况,其中2015年至2017年各区、县(市)未及时拨付专项资金6.7亿元,并收回两年以上的资金700万元。同样,通过市级财政拨付区、县(市)资金与区、县(市)实际使用专项资金数据关联比对,精准锁定工业和科技专项中部分项目区、县(市)共有3752.75万元配套资金未落实的问题。

(2)开展主管部门间产业扶持数据跨部门关联分析。个别受补助企业利用市级财政及相关业务部门在发放补助资金过程的漏洞获取超额补助,以常规关联分析等方法难以发现不合理补助的疑点。审计组引入数据挖掘理念,借助SPSS统计分析软件进行聚类分析。具体过程如下:首先将技术改造、机器人等重点项目专项资金依补助标准分别设置函数;然后在SPSS统计分析软件中进行聚类分析,即把一组补助项目按照相似性归成若干类别,使得同一类别的个体之间的距离尽可能地小,而不同类别的个体间的距离尽可能地大。

通过以上方法,审计人员精确锁定某公司的技术改造项目偏离正常,延伸核实该补助资金确为超标准补助,并于审计期间收回超额资助资金170余万元。

(3)开展产业数据与外部数据间跨行业关联分析。政策执行审计中,经常会遇到有些数据在其所在的那个业务环境中是符合规范的,但当关联其它部门其它行业的数据时,它的真实性就可能出现疑点,多维分析的方法有助于大数据审计人员快速找到疑点。例如,审计组了解到大学生人才实训补助由H市人社局牵头,市经信委、市商委等多个部门落实,培训机构一手包办其中多个环节,补助人员数据真实性存在较大风险。由于涉补人员众多,数据量较大,因此审计组运用了内部与外部比对相结合的方式来确定疑点。首先,对经信委和商委3年补助信息进行总体分析,初步获取疑似重复补助人员。然后,进行跨行业关联对比,将疑点人员的社保参保情况梳理出来。最后,从时间维度将培训人员参保时间与申报培训时间进行比对,筛选出实际不符合补助规定的疑点人员表。

审计组经延伸核实,发现5家单位培训机构骗取政府补助近500万元,部分培训人员在同一就业单位多年申请补助或在不同就业单位、培训机构申请补助,还有些则在经信委和市商委同时申请补助。

(4)开展数据内部多维度关联分析。H市产业发展类专项补助的业务主管部门达11个之多,补助拨付又分为直接拨付和转移支付,根据以往审计经验,在多部门补助多层次审核过程中最易出现重复补助、以假发票骗取资金等情况。例如,对于可能发生的重复补助情况,采用数据挖掘的思维,建立相似项目查询函数,使审计疑点自动浮现。首先,汇总所有补助企业及相应的项目信息;然后,从受助企业和受助项目两个维度出发,对上述信息进行分类汇总,总体分析;最后,以项目名称相似度建立查询函数,获得高相似度的疑点企业。

审计组通过延伸核实,发现部分项目确为重复申报项目或重复列支投资额,涉及金额900多万元。

4. 主要成效

H市产业发展政策绩效审计调查项目通过采用聚类分析、建立审计模型、关联分析比对等大数据审计技术方法,最终发现的通过重复申报、发票及信息造假等手段获取财政补助的违法金额共计1500余万元;未及时拨付和配套等管理不规范资金达7个多亿元;对1家房地产开发公司、5家培训机构的造假骗补线索进行了移送,公安机关受理并立案处理。

该项目实施过程中,审计组共总结提炼了20篇信息和专报,全面、精准的反映了审计发现问题。中国审计报、审计署网站、省政府办公厅每日要情均有采用;反映的“万名大学生创业实训工程”政策欠完善问题得到H市主要领导的批示,引起省、市级领导及政府部门的广泛关注。

(三)重大投资项目类大数据审计——以M区政府投资工程建设项目招投标情况审计项目为例

1.项目背景

近年来,随着政府固定资产投资额逐步加大,工程招标制度在降低政府投资成本、提高工程质量等方面曾经发挥过较大的作用。但越来越多的“形式招标”、围标串标等违纪违规违法问题频发,使其成为适合开展大数据审计的重要领域之一。

图5 -政府投资项目年度优惠率走势图

2017年度,M区政府投资工程建设项目招投标审计中,审计人员探索开展“总体分析,发现疑点,分散核查,系统研究”的新型数字化审计方式,采集了全区多种数据格式的招投标管理备份数据,开展综合分析,发现2014-2016年三年全区公开招标的政府建设项目,工程预算总价逐年上升,项目总体优惠率却逐年下降(具体见图5)。发现这一现象后,审计以专报的形式报区委区政府,建议进一步完善政府的招投标制度,防止围串标引起政府资金的损失,区主要领导在专报上要求审计进一步查明原因并提出相应的完善建议。

2.审计重点

(1)投标、开标及评标阶段审查。

一是收集所有投标单位的投标文件及相关投标资料,包括工程项目基本信息、标书制作锁号、工程量清单计价表等相互比对,检查是否有相互围标嫌疑。二是重点分析开标、评标,检查会议签到、专家评审资格及是否执行“回避制度”等情况,查看开标是否规范,评标过程是否科学合理,是否严格按照招标文件执行。三是重点分析投标文件响应情况和评委评分情况,查看评标过程是否客观公正,商务评分、技术评分是否合理有效,结果是否存在异常等。四是审查专家评分是否异常,是否存在多名评委对同一投标人评出分数完全一致的情况,有无操控整个评分的过程,达到指定中标人的目的。

(2)资格预审或招标公告阶段审查。

一是查看招标人在公共交易平台上发布的资格预审公告或招标公告,检查公告的信息是否一致、完整等。二是重点审核资格预审是否客观、公平公正,投标邀请书是否按时发放。三是重点分析招标控制价编制的合理性,是否存在哄抬报价、高估冒算的情况。

(3)招标文件和投标文件审查。

在招标文件审查方面,重点查看有无设定限制性、排他性条款及特殊技术指标,建设单位委托的招标代理机构是否具备相应资质,投标信息是否按规定在公开媒体上发布,其内容是否合法、合规等;在投标文件审查方面,重点查看不同投标人的投标文件是否异常一致或者投标报价呈规律性差异。重点对电子标中预算书的工程项目清单计价、综合单价情况、主要材料及价差进行比对分析,查找是否存在工程量雷同及材料数量、人工工日、费用成规律性差异等情况,从而揭露围串标行为线索。

(4)中标结果、中标通知书及合同文件审查。

一是收集招标人在公开媒体上发布的中标结果公示,检查公示时间是否合规。二是检查中标结果、中标通知书是否与评标结果一致,若不一致,了解其原因并分析其合理合法性。三是合同金额是否与中标人投标金额一致,若不一致,了解其原因并作为审计重点。四是掌握中标通知书、合同文件发布签订时间是否符合相关规定,与施工资料中的时间逻辑进行比对,分析是否存在虚假招标、先施工后招标的情况。

3.审计方法

(1)采取内查外调法,查找保证金的来源账户。

由于投标单位缴纳保证金的账户较多,选取本地容易查询的银行账户,查询确认是否存在同一时间段同一账户对投标企业进行转账且转账金额等于保证金的账户,同时查询该账户是否存在将保证金转给第三方,第三方再将保证金转给投标企业的情况。具体如图6。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

图6 投标保证金资金流向图

 

根据结果发现有多个个人和企业给不同的投标单位进行转账的记录,初步认定存在围串标的线索,再进一步重点分析交易对手为蒋某的账号。审计发现,蒋某在评标前将资金转给第三方来某,来某收到资金后转账给投标企业,综合以上基本认定蒋某存在操纵串标围标的嫌疑。审计人员进一步取证后将该案件进行移送处理。

(2)采用比对分析法,查证标书编制、投递过程中是否存在围串标嫌疑。

标书编制:一是同一项目多份标书为同一人编制。将投标信息表项目名称和标书编制人进行分类汇总,统计同个项目同个标书编制人大于2次以上的记录。同时还可以通过查看电子标书中的电子签名作者是否一致,发现一个标书编制人为同一个项目的多个投标单位编制标书的疑点。二是同一项目多份标书投标价呈一定比例的增减。将同一项目投标报价中的单价进行类比分析,发现多个投标单位的报价总价及材料单项报价呈固定比例,如投标公司B的所有单项报价均为投标公司A报价的1.05倍,投标公司C的所有单项报价均为投标公司A报价的1.08倍,这些投标公司间存在较大的围串标嫌疑。

标书投递:同一项目多个公司投标渠道一致。在投标单位或投标代理单位用专业软件制作投标文件时,每一次软件打开时,软件会记录本次开启时电脑的外网端口IP地址和硬盘号。每一次使用计价锁制作投标文件的商务标时,软件会记录计价锁的唯一编号。每一次使用CA锁制作投标文件的技术标时,软件会记录CA锁的唯一编号。审计发现,M区有64个项目IP地址相同,11个项目计价锁号相同,21个项目CA锁号相同,13个项目硬盘号相同。

(3)采用核查法,判断专家是否违反评标管理规则。

一是评标专家未严格执行“回避”制度。从社保信息中获取评标专家的工作单位,并与其评标项目的投标公司相匹配,发现个别评标专家未严格执行“回避”制度。如:在周某担任评标专家的某安置房建安工程项目中,其占股40%的公司是投标公司之一。二是资源交易中心未按规定随机抽取评标专家。通过对不同项目的评标专家进行核查发现,同一天进行的多个招标项目评审的专家组成员高度重合。如A工程和B工程,专家评标时间均为2015年12月30日,两个项目组成评标委员会的5位评标专家完全一致。

4.主要成效

通过大数据审计,M区政府投资工程建设项目招投标审计项目向纪委移送多起工程建设项目围串标案件线索,促进M区政府投资工程建设项目平均核减率提高3%左右,年节约资金约1.5亿,审计报告引起区主要领导的高度重视。专报被采用1篇,发表审计信息5篇,促使相关部门完善了政府投资工程建设项目管理制度1个,同时该审计项目被省审计厅评为2018年度优秀审计项目,计算机审计案例入选省厅优秀计算机案例。同时对其他区县同类政府投资招投标审计项目起到了较好的引导、示范作用。

(四)自然资源(资产)类大数据审计——以X市长江经济带生态环境保护审计项目为例

1.项目背景

(1)自然资源类数据丰富。审计涉及国土、环保、农业、林业等多部门的各类自然资源数据,各种自然资源的资产信息分散、管理不集中、标准不统一、模型不准确,且多以地理信息类数据为主,运用“3S”地理信息技术对X市长江经济带生态环境保护情况进行审计,不仅可以获取X市自然资源的关键参数,如质量、数量、位置、年度等变化情况,还可以通过信息化软件为审计工作提供数据及技术支撑,避免审计人员在面对各类繁杂、陌生的数据时出现无从下手的情况。

(2)传统审计方法的不足。在面对大范围的资源资产审计时,通过通过传统的翻阅资料、图表等审计方式无法对存在疑点的位置进行准确定位,也无法还原疑点位置原时间点的状态。利用地理信息技术对自然资源资产类数据进行比对分析,可将不同时点、区域范围的数据进行全覆盖处理,精准定位坐标,极大地减少审计成本、提高审计效率,有效破解审计工作中地域范围“覆盖难”问题。

2.审计重点

    以长江经济带发展规划纲要执行为主线,通过对自然资源资产类数据进行分析,揭示X市在生态破坏、环境污染方面的突出问题和风险隐患。

(1)生态保护红线划定落实情况。根据《生态保护红线划定指南》(环办生态〔2017〕48号)中的相关要求,将生态红线矢量数据与各类国家级和省级禁止开发区域,以及其他有必要严格保护的各类保护地矢量数据进行比对分析,查看生态保护红线范围是否涵盖上述区域。

(2)未利用地开发管理情况。根据省《环境功能区划》,调查区划范围内未利用地开发管理情况,是否存在自然生态红线区内未利用地强制性保护不到位、生态功能保障区内未利用地开发用途和开发强度不符合要求等问题。

(3)土地整治项目开发管理情况。根据省《土地整治条例》,通过对国土、林业、水利、农业部门提供的矢量数据等大数据进行比对分析,重点关注立项选址是否合规。

(4)土壤环境监测管理情况。调查了解农用地监测点位、农用地深层监测点位、农产品监测点位、省级以上重金属重点防控区和重点工业园区(产业集聚区)监测点位等的布设情况,被审计地区是否按要求确定国控监测点位、是否根据地方实际补充点位,是否按规定做好有关监测工作;点位的布设是否到位,是否存在应设未设的情况。了解国土、农业、环保部门有关土壤污染监测网络的统一规划和整合优化情况。

3.审计方法

在X市生态环境保护情况专项审计中,审计组积极探索以地理信息系统(GIS)、遥感(RS)和全球定位系统(GPS)为核心内容的“3S”地理信息技术的在生态环境保护审计中的应用。利用ArcGIS软件、Google Earth软件以及两步路APP等地理信息软件工具,对测绘、国土、环保、林业、农业和水利等部门提供的地理信息影像数据、矢量数据和文本数据等(详见表2)进行整理转换,叠加分析,以提高审计的精准度和工作效率。

表2 地理信息数据清单

序号

数据名称

数据提供部门

数据类型

1

地理国情普查矢量数据

测绘部门

GDB

2

土地质量监测点位数据

国土部门

EXCEL

3

土地利用变更调查矢量数据

国土部门

SHP

4

土地利用总体规划矢量数据

国土部门

SHP

5

土地整治项目矢量数据

国土部门

DWG

6

基本农田矢量数据

国土部门

SHP

7

遥感影像数据

国土部门

IMG

8

农转用矢量数据

国土部门

SHP

9

采矿权数据表

国土部门

EXCEL

10

生态保护红线矢量数据

环保部门

SHP

11

饮用水水源地保护区矢量数据

环保部门

SHP

12

环境功能区划矢量数据

环保部门

SHP

13

排污口位置信息表

环保部门

EXCEL

14

省级以上湿地公园矢量数据

林业部门

SHP

15

公益林矢量数据

林业部门

GDB

16

自然保护区矢量数据

林业部门

SHP

17

森林资源二类调查矢量数据

林业部门

SHP

18

土壤污染监测点位数据

农业部门

EXCEL

19

饮用水水源保护范围矢量数据

水利部门

SHP

(1)生态保护红线应划未划情况审计。将生态保护红线矢量数据分别与饮用水水源地一级保护矢量数据、湿地公园矢量数据、国家级公益林矢量数据进行叠加分析。首先利用ArcGIS软件的空间校正工具将湿地公园矢量数据坐标系转换为和生态红线矢量数据相一致,然后利用“叠加分析”功能,将变换后的湿地公园矢量数据、水源地保护矢量数据、国家级公益林矢量数据分别与生态红线矢量数据进行叠加比对,找出生态保护红线应划未划疑点图斑,并利用ArcGIS软件“计算几何”功能对疑点区域的面积进行测算,发现840公顷区域范围应划入实际未划入生态红线,其中湿地保育区600公顷,恢复重建区150公顷,一级水域保护区90公顷。

(2)未利用地被违规开发情况审计。将未利用地矢量数据与生态功能保障区、自然生态红线区数据进行叠加分析。首先利用ArcGIS软件根据未利用地对应的标号与类别,在土地利用变更调查数据库中提取未利用地图层,分别与环境功能区划数据中提取出生态功能保障区与自然生态红线区两个图层分别叠加求交,获取生态功能保障区与自然生态红线区内未利用地的分布,最后通过叠加卫星遥感影像和实地拍照取证,发现5公顷未利用地被某历史遗迹保护区违规占用建设成配套景观、0.7公顷未利用地被某农业开发有限公司违规占用经营餐饮等问题。

(3)土地整治项目违规立项情况审计。将土地整治项目红线数据与省级以上公益林等矢量数据进行叠加分析。首先利用AutoCAD软件将国土部门提供的土地整治项目红线数据统一转换为shape格式的矢量数据,然后利用ArcGIS软件中的“叠加分析-相交”功能,将饮用水水源地一级保护区矢量数据、农村饮用水水源保护范围矢量数据、自然保护区矢量数据、森林公园矢量数据、全市省级以上公益林矢量数据分别与转换后的土地整治项目红线矢量数据进行叠加分析,发现部分土地整治项目在项目选址时,未严格执行项目立项管理要求,在饮用水源地一级保护区、自然保护区、省级以上公益林等文件禁止区域内进行土地资源开发的问题。

(4)土壤污染监测点位分布不合理情况审计。将国土部门和农业部门的土壤污染监测点位进行叠加分析,寻找土壤污染监测点位分布不合理的问题疑点。首先利用ArcGIS软件将以EXCEL格式存放的土地质量监测点、土壤污染常规监测点、土壤污染综合监测点坐标数据转换为点状的矢量数据。同时叠加遥感影像获得监测点在空间上的分布。然后利用ArcGIS软件对土地质量监测点数据进行缓冲区分析,设置缓冲区距离为1000米,将综合监测点和常规监测点数据与获得的缓冲区数据相交,发现在土地质量检测点周围1000米内重复布置了综合监测点和常规监测点。审计人员还可以通过ArcGIS软件自带的测距工具测量缓冲区内监测点间的距离。

图7 土地质量监测点和土壤污染常规监测点重复布置情况图

4.主要成效

(1)审计项目成果。本次审计撰写的3篇审计专报均被省政府每日要情采用。其中《审计发现某市辖部分区域污染治理工作亟待加强》专报得到省市主要领导的批示;审计报告中10个方面的相关内容被审计署特派办《长江经济带生态环境保护审计项目报告》采用,并得到省长批示;审计报告中的相关内容作为省厅一季度政策跟踪报告的部分内容得到常务副省长批示;审计报告得到了X市市领导的批示。

(2)总结提炼成果。本次审计的审计报告被省厅评为2018年度优秀审计报告,撰写的两篇大数据案例《巧用地理信息技术 破解环保审计难题》《利用地理信息软件工具助力资源环境审计》入选省厅计算机审计成果案例集。

(五)地方党政领导经济责任类大数据审计——以A市党政领导经济责任审计项目为例

1.项目背景

(1)地方党政领导经济责任审计是天然适合开展大数据审计的项目。地方党政领导经济责任审计关注的财政管理、民生保障、资源保护、工程建设等领域的信息化程度相对都比较高,相关信息系统的数据能够较为完整地反映政府主管部门在财政支付和业务管理等方面的基本情况,当不同地区、不同行业、不同部门、不同年度的数据在地方党政领导经济责任审计项目中汇聚时,突破地区、行业、部门、年度的数据关联分析也就成了可能,构成了大数据审计的外在条件。此外,地方党政领导经济责任审计是所有类型的审计项目中涉及面最广、综合性最强的一类审计项目,地区的行政级别越高,审计涉及的事项也就越多,“人少事多”的矛盾尤为突出,此类审计项目迫切需要大数审计精确制导,帮助审计人员抓住审计重点,缩小核查范围,构成了大数据审计的内在需求。因此,课题组认为地方党政领导经济责任审计项目是天然适合开展大数据审计的。

(2)A市党政领导经济责任审计具有一定的典型性。A市是东部某经济发达省份的欠发达地区,一二三产业的发展相对均衡,既具有相当的经济体量,又存在一些相对贫困地区,该市正处于经济转型升级和脱贫攻坚的关键时期,也正是财政管理、招商引资、工程建设、环境保护、扶贫脱贫等领域矛盾突出、问题频发的时期,H市审计组在A市发现的一系列问题放在全国范围内也具有一定的代表性,因此选择A市党政领导经济责任审计为大数据审计项目研究探索的重点审计项目,对各级审计机关开展同类审计项目有一定的借鉴意义。

2.审计重点

A市党政领导经济责任大数据审计以“数据”为基础,重点围绕地方党政领导权力运行的“人、财、事”三要素展开。

一是审“人”,主要包括机构编制审计、干部管理事项审计和公职人员经商情况审计等。

二是审“财”,主要包括财政审计、政府债务审计、国资审计、地方金融机构审计等。

三是审“事”,主要包括任期内贯彻落实中央、省、市重大政策措施执行情况情况审计、民生保障审计、环境保护审计、政府投资工程审计等。

3.审计方法

在A市党政领导经济责任审计项目中,审计组通过组建“数据分析团队”,搭建项目“审计数据中心”,充分发挥数据在大数据审计中的核心支撑作用,通过计算机人员和业务审计人员的“强强联合”共同完成了精准扶贫、红顶商人、超编超岗、招商引资、资源保护等专题大数据分析,较好地发挥了大数据审计全面覆盖、精准定位的优势。

(1)“精准扶贫”大数据审计方法。以低保人员为主体,以身份证号为关联字段(详见图8),一是将低保人员信息与公安部门户籍信息进行关联分析,分析是否存在主管部门或人员虚增低保人员的情况,核实低保人员的真实性。二是将低保人员信息与财政部门供养人员信息、组织部门村干部信息、殡仪馆死亡人员信息进行关联分析,分析是否存在低保人员或家属是财政供养人员、村干部,是否存在向死亡人员发放保障资金等情况,核实低保人员的社会背景身份。三是将低保人员信息与社保部门社保征缴信息、公积金中心公积金征缴信息和税务部门个税信息关联分析,查看低保人员及其家属的社保缴费基数、公积金缴费基数、个税申报基数,核实低保人员的真实收入水平。四是将低保人员信息与国土部门的不动产登记信息、公安部门的车辆登记信息关联分析,分析低保人员及其家属是否拥有高档住宅或高档车辆,核实低保人员的真实生存状况。五是将低保人员信息与工商部门企业登记信息关联分析,核实低保人员及其家属的商业投资情况。通过专题分析,审计发现在A市有43名不符合条件人员领取低保救助资金,其中:7人家属为财政供养人员、村干部;21人经商办企业或担任企业高管、股东;15人家属购置了商品房。

图8 “精准扶贫”大数据审计思路图

(2)“红顶商人”大数据审计方法。以财政供养人员为主体,关联分析财政供养人员数据、企业工商登记数据和领导干部个人事项申报数据、财政补助数据。一是将财政供养人员数据与企业工商登记数据通过身份证号关联,分析财政供养人在企业中担任法人、股东和高管情况,审计发现A市多名领导干部“违规经商办企业”,个别财政供养人员甚至专职经商,“在编不在岗”。二是将上述企业名单与财政补助资金的收款单位进行关联分析,分析财政供养人员关联企业获取财政补助资金的情况,进一步发现公职人员利用职权违规为关联企业发放财政补助的疑点线索。三是将领导干部经商办企业的情况与领导干部个人事项申报情况比对,发现部分领导干部漏报、瞒报个人经商事项,个人事项申报不实等问题。

(3)“超编超岗”大数据审计方法。分析市编办编制核定数据、市财政局工资统发数据、市人社局人员登记数据之间的差异。一是分析A市各单位实有人数和干部数是否超过市编办核定的人员编制数和领导职数配备干部。二是分析A市实有人数和干部总数是否超过上级组织部门核定的编制数。审计发现A市存在超权限设置机构、超职数配备干部等问题线索。

(4)“招商引资”大数据分析方法。将A市招商引资的企业信息、项目信息分别与建设部门的项目审批监管数据及税收数据、社保数据关联分析,分析A市新设立的工业园区招商引资引入企业的项目投资规模和建设进度是否与招商引资设定的一致。二是通过税务数据和社保数据反映招商引资引入企业对当地经济的贡献情况以及对当地就业的促进情况,最终发现A市个别重点工业项目建设进度不佳等问题线索。

(5)“资源保护”大数据分析方法。本项目还聘请第三方专业机构利用ArcGIS等先进地理信息技术对国土、规划、林地、耕地等规划矢量图斑数据和地理影像数据进行叠加比对分析,发现了土地利用总体规划与生态环境功能区规划冲突、部分建设项目超规划建设、违规挤占生态公益林、土地复垦进度缓慢等问题线索。

4.项目成效

在A市党政领导经济责任审计中,H市审计局紧紧把握大数据审计的特点,积极探索新型数字化审计方式,开展审前数据分析,现场审计仅用5周时间(相比以往同类项目缩短时间近40%),不仅对该地区的重大决策部署、重点财政资金和重要工程项目进行了全面审计,还对国有企业、人事编制、民生保障、干部管理等事项进行了重点审计,审计效率和质量都得到了全面提升。

(1)直接成效显著。在A市党政领导经济责任审计中,审计组通过大数据审计发现问题金额30多亿元,移送各类案件线索8件,移送处理人员375人,收缴违纪款40万元,审计组撰写的反映耕地“非粮化”现象的审计专报得到省领导的批示,引起省市领导的高度重视。

(2)间接成效突出。一是项目审计报告获评省厅优秀审计报告。二是根据项目大数据审计情况总结提炼的《“精准扶贫”大数据审计》和《运用多行业数据关联分析技术开展”红顶商人“大数据审计》等2篇案例入选省厅大数据审计成果案例集,被印刷成册,在全省推广。

 

 

 

结论与展望

大数据审计是现代审计发展的必由之路,是国家审计机关推进“两统筹”、实现审计全覆盖和审计事业高质量发展的关键举措,是促进国家治理体系和治理能力现代化的重要保障。

(一)本课题的主要结论和观点

1.大数据审计是大数据时代的必然选择。目前,适合大数据审计的外部环境逐渐形成,大数据审计的内在要求明确而迫切,大数据审计是践行“科技强审”、推进审计事业高质量发展的重要途径。

2.与传统审计相比,大数据审计具有审计数据体量“更大”、审计技术要求“更高”、综合分析能力“更强”、审计覆盖面“更广”、审计监督端口“更靠前”和审计溢出效应(审计价值)“更明显”等主要特征。

3.大数据审计领域应各有侧重。从审计署视角看,大数据审计可重点围绕“三大攻坚战”的目标,发挥大数据审计在化解风险、促进改革等方面的关键作用。从地方审计机关视角看,大数据审计业务可重点围绕地方政府的中心工作,将关注点集中在民生审计、政策审计、重大工程审计、经济责任审计、自然资产资源审计等领域上。

4.大数据审计方法体系,结合审计应用场景,分“大数据审计技术方法”和“大数据审计分析方法”两类。其中:大数据审计技术方法可重点应用“云计算、云存储、人工智能和可视化”等一些与大数据审计工作相对密切的技术;大数据审计分析方法可重点应用“常规审计数据分析方法”、“数据挖掘分析方法”以及“交叉融合分析方法”。

5.大数据审计工作的先决条件,建议事先做好“制度、数据、环境、计划”等四项准备。

6.大数据审计的组织方式,分不以项目为载体的大数据综合分析(不依托具体审计项目独立开展)和以项目为载体的大数据审计项目开展(依托具体审计项目开展)两种。大数据综合分析以摸清底数、掌握趋势、防范风险为目标,围绕党和政府的中心工作、社会热点焦点难点开展工作;大数据审计项目开展以挖掘线索、揭示问题为目标,围绕特定审计项目的审计内容,深度分析挖掘问题及问题背后存在的体制机制管理等缺陷,最终实现项目审计目标。

7.大数据综合分析工作,其工作主题要紧紧围绕当地党委政府的中心工作、社会热点焦点难点问题,体现地方特色和时代特征,核心要围绕“重点领域专题分析,重大事项跟踪审计,重要资金实时监测和关切问题持续观测”四个主题展开。

8.大数据审计项目开展,在审计选题上,应“精准选题”,从“基本特征、项目类型、审计事项”三个层面着眼,选择审计内容综合性强、审计范围覆盖面广、涉及关联数据多的审计项目以及行政许可和财政奖补罚条件核查类、大型考核绩效类、地理区域核查类等审计事项。在审计组组成上,宜实行业务主审和计算机主审的“双主审制”。在审计方式上,应按照“总体分析、发现疑点、分散核查、系统研究”的新型数字化审计方式的要求开展大数据审计。

9.大数据审计必须重视审计质量控制,大数据审计分析应以数据“真实可信”为前提,重点开展原始数据的真实性验证、审计数据的一致性验证、数据分析的复核性验证、样本数据的抽样性验证以及数据事实的确认性验证等工作。

10.构建“组织、技术、安全”三维保障体系是大数据审计工作的重要支撑。开展大数据审计要注重人才统筹,构建新型大数据审计组织体系;注重平台建设,创建大数据审计作业系统;注重安全防范,构建大数据安全保障体系。

(二)下一步研究设想

1.大数据审计信息系统如何深度融合人工智能技术。本课题对云计算、云存储、人工智能和数据可视化等大数据技术在审计中的应用做了相对系统的研究,云计算、云存储、可视化等技术在课题研究软件成果中实现了具体应用,但还有诸如基于深度学习的智能审计数据分析模型构建、深度语义分析等人工智能技术目前仍仅仅停留在理论研究分析阶段,未能在大数据审计实践中开展实质性应用。需要进一步深入研究如何在智慧审计系统中应用人工智能技术,提升智慧审计系统的智慧性,让普通业务审计人员更加便利地应用大数据技术开展审计工作。

2.地方审计机关如何深入实践“大数据综合分析”。本课题研究主要基于地方审计机关实践视角,对大数据审计项目开展的研究相对比较充分,但限于人才资源和数据资源的限制,地方审计机关尤其是市县级审计机关开展大数据综合分析的条件还不成熟,因此本课题对大数据综合分析的研究主要是在审计项目审前大数据分析的实践经验总结基础上开展的,尚需进一步深入研究计算机专业人才和数据资源、技术水平相对欠缺的地方审计机关参与开展大数据综合分析的方式,并探索开展相关实践活动。

 

 

 

 

 

 

 

参考文献

[1]董芳全. 2015.大数据审计工作模式探索研究[N].审计署网站.

[2]傅祖芸.2007.信息论[M].北京:电子工业出版社.

[3]方涛.2014.商业银行数据式审计模式探析[J].金融经济(3):77-79.

[4]冯铁成. 2009.新农村建设背景下经济责任审计模式研究[D].河南大学硕士学位论文.

[5]韩强.2015.大数据环境下审计模式创新研究[J].创新科技(6):64-65.

[6]姜晓依.2019.基于社会网络的新型审计方法研究[J].市场周刊(1):68-69.

[7]李培培.2015.审计管理的可视化技术应用[J].审计月刊(1):21-23.

[8]李培培.2016.大数据环境下的审计风险及其防范政策建议[R].审计署科研所审计研究报告(31).

[9]刘星,牛艳芳,唐志豪.2017.关于推进大数据审计工作的几点思考[J].《审计研究》(9):3-7.

[10]刘誉泽.2016.非现场审计理念及实现路径研究[R].审计署科研所审计研究报告(36).

[11]孟春艳.2009.基于联网审计系统组网与安全的审计与研究[D].山东大学硕士学位论文.

[12]邵峰晶,于忠清.2003.数据挖掘原理与算法[M].北京:中国水利水电出版社.

[13]隋学深.2013.国家审计领域大数据技术应用及其影响展望[R].审计署科研所审计研究报告(13).

[14]孙凌云.2017.基于云计算环境的大数据审计研究——以ABC国家审计项目为例[D].重庆理工大学硕士学位论文.

[15]谭铁牛.2019.人工智能的历史、现状和未来[J].智慧中国(Z1):10.

[16]王欢,许暖,沈波.2014.基于大数据的智能审计平台研究[J].中国移动网络与信息安全专题(12):19-22.

[17]王坚,左鼎,王丁贵.2017.以“数据”为主导,探索大数据审计模式[J].浙江审计(8):39-41.

[18]王胜.2018.基于深度语义的查询扩展研究[D].昆明理工大学硕士论文.

[19]魏祥健.2015.云计算环境下的云审计系统设计与风险控制[J].会计之友(1):101-105.

[20]徐超.2017.浅析各国大数据审计工作现状——基于世界审计组织大数据工作组第一次会议的研讨结果[N].审计署网站.

[21]杨凯茜.2015.浅谈大数据审计的特点及实现——以审计署对2012年中石油的审计结果为例[J].财经界(18):315-316.

[22]杨胜松.2016.基于多维联机分析的分布式审计系统的设计与实现[D].东南大学硕士论文.

[23]虞安军,皱龙赣,石锦红.2011.联网审计系统数据安全性关键技术研究.交通企业管理(21):165-167.

[24]张炳功,崔振龙.2012.审计项目组织模式创新研究[R].审计署科研所审计研究报告(10).

[25]Deniz Appelbaum.2016.Securing Big Data Provenance for Auditors The Big Data Provenance Black Box[C].12th International Conference ON Information & Technologymanagement:3400-3412

[26]Gopika Mangalassery.2015.Big data privacy-preserved public auditing for shared data in cloud[J].International Journal of Emerging Trends & Technology in Computer Science (IJETTCS)(4):61-64

[27]Ms.Rupali Chikhale.2014.Data Mining Exploring Big Data Analytics, Hadoop and Mapreduce[C].International Journal of Engineering Sciences & Research Technology:541-545

[28]Omar Al-Hujran.2015.Big Data Opportunities and Challenges[C].The Fifth International Conference on Business Intelligence and Technology:73-79

[29]Surapriya Swain,Prof.Saurabh Gupta.2013.Authorized Auditing of Big Data Stored on Cloud with Auditability Aware Data Scheduling[J].International Journal of Science and Research (IJSR):336-340

 

 

附录:地方五大重点领域大数据审计标准表

附录1--民生保障(医疗保险)类大数据审计项目审计标准表

以前面撰写的医保审计案例为基础,适当扩充相关审计内容,制定以下适合医疗保险大数据审计的标准表。由于医保审计的方法及案例较多,无法一一列举和涵盖,下表根据我市探索实践及常用的审计方法编写而成,仅供参考。

审计目标

一级审计内容

二级审计内容

主要审计程序和方法描述

确保医保基金安全运行

医保基金征缴

征缴基本情况分析

缴费比例、缴费趋势等方面的分析。

多征、少征、欠缴保险费

利用工商企业登记数据与医保缴费数据对比,有无正常运行的企业未参加缴纳医疗保险的情况。

医保基金管理

参保覆盖率分析

利用公安户籍数据,分析有无适龄公民未参加医疗保险(含各类医保)的情况。

重复参保审查

对比两种(或以上)医疗险种,分析是否存在同时参保的情况。

个人账户管理不规范

参保人员是否全部建立个人账户。

医保基金支付

支付基本情况分析

按医院、分年度、分医疗项目(药品或检查项目)进行分类汇总,既能分析趋势,也可以分析异常。

1.对医保结算数据进行group by分类汇总;

2.对医院的各年度、各种医疗项目进行趋势分析。

骗保行为分析-信息熵

利用信息熵,可以发现药店异常刷卡线索。

1.获取同一医疗机构同一小时结算病人超过2个且结算金额大于200元的医保结算和明细数据;

2.定义医疗行为“信息熵”。将一个观察区间即一小时看成1,

这一小时内的每笔结算金额/总结算金额则视为pi。

利用熵计算公式

 

计算每个医疗机构每个小时的信息熵;

3.利用信息熵计算结果,进行二次分析;

4.对信息熵总和特别异常的医疗机构进行延伸审计,结合监控,

查看信息熵特别高的小时内有无病人刷卡。

骗保行为分析-多数据对比发现

通过各类数据的关联比对,利用逻辑矛盾,可以发现骗保行为线索,如:

1.将医疗项目结算数据与该项目所需材料进行对比分析,发现矛盾点。如根据针灸项目“一针一穴”的规定,可以发现多开针灸项目的情况;

2.将医疗项目结算数据与该项目所需设备进行对比分析,发现矛盾点。如根据鼻导管吸氧的结算数据,对比制氧机的最大制氧量,可以发现多开鼻导管吸氧项目的情况;

3.将医疗项目结算数据与该项目设备管理数据记录进行对比分析,可以发现虚开检查项目的情况。如医疗结算中B超数量与超声设备中B超数量对比,可以发现虚开B超的情况。

骗保行为分析-个人购药频次分析

通过对个人每月购药额频次统计,发现异常数据(空刷情况),特别是可能存在通过频繁刷卡来拉低均次费用。

1.统计每个人在各家医疗机构的购药频次;

2.筛选异常频次(在同一医疗机构每月6次以上);

3.统计每家医疗机构异常购药频次人员数量,筛选较多进行异常频次购药的医疗机构,重点延伸。

多收费(基金多支付)情况

医院业务复杂,普通老百姓不易弄清,医院存在多收费、不按规定收费的可能,如:

1.彩色多普勒超声检查未按规定上限次数收费。按照规定,彩超一次做2个部位,收费120元,医院实际在收费过程中,存在按每个部位收费的情况,筛选查询是否有同一病人同一天彩超检查(一个部位)收费次数大于2次的情况;

2.CT检查未按规定收费。与上述问题类似;

3.以“人次”为计价单位超规定收费。根据规定,一个服务项目在同一时间多次操作完成,按一次计价。通过对数据分析计算,审查是否存在同一病人在同一天以“人次”为计价单位收费次数大于1次的收费项目。

其他

“看病贵”剖析

医疗费居高不下,看病贵始终没能得到有效解决,利用大数据分析,可以深入剖析成因。

1. 违规线下采购。通过比对医院入库信息与市级医用耗材平台数据,可以发现医院采购的药品不属于药械平台招标目录的情况;

2. 解密医疗成本。通过医院采购数据与海关数据的比对分析,可以从源头上解密真实医疗成本(进口药);

3.中草药采购扣率和加价分析。通过医院药品入库单明细数据,计算中草药的实际扣率,查看是否存在与规定不符的情况。

家庭医生签约绩效评价

家庭医生签约绩效评价可以从以下二个方面入手:

1.签约人员地理位置分布分析.利用百度地图,可以实现批量计算签约人员家庭地址和签约机构之间的距离,分析是否存在距离过远的情况;

2.重复签约、虚假签约分析。利用市卫计委的签约人员数据和市医保局的参保人员数据,筛选参加医保但使用自费健康卡进行签约的数据,发现重复签约、虚假签约情况。

 

附录2--政策落实类大数据审计项目审计标准表

以产业发展政策案例为基础,适当扩展政策类审计的通用流程及内容,制定以下适合大数据审计的标准表。由于政策类别和信息化程度千差万别,审计目标和重点可能相差较大,无法一一列举。下表根据我市大数据审计探索实践以及常用的审计方法编写而成,仅供参考。

审计目标

一级审计内容

二级审计内容

主要审计程序和方法描述

确保政策措施管理有序、执行规范、落实到位

政策措施制定程序及条款合理性

政策制定程序审计

通过收集、查看会议纪要、请示批复、征求意见、公告公示等信息,审查政策措施制定过程是否民主、公开、透明,是否经过严格的多方论证。

政策条款合理性审计

运用多维分析方法从受助时间、受助人、受助条件等方面进行分析,审查政策惠及单位或个人是否存在独享性、是否存在合规不合理的重复享受等,从而评价政策措施条款制定的科学性、合理性、严谨性。

同类政策相斥性审计

1.运用OCR文字识别技术,将非结构化的政策符合条件转变为可进行大数据比对的结构化数据;

2.通过关联模糊比对部门内部、部门外部的同类政策条款,审查是否存在下位法违背上位法、同级不同部门补助重复的情况。

政策落实资金保障力度

资金拨付时效性审计

运用关联分析方法,以项目为关联因素,对各级财政拨付资金展开分析,反映拨付及时性。

配套资金落实情况审计

运用关联分析方法,以项目为关联因素,对实际投入的项目资金量展开分析,反映各级政府是否按要求配套资金。

资金结余情况审计

运用下钻分析方法,对项目资金拨付情况进行追踪,分析下拨资金结余情况。

政策措施执行规范性、精准度、排他性

补助审批过程合规性审计

1.收集申报单位、筛选过程、最终名单等各个环节数据;

2.编写SQL语句,对比分析补助审批是否按环节进行,是否存在直接补助等违反程序的情况。

政策执行精准、合规性审计

1.收集项目资金补助数据;

2.运用模糊匹配等技术对补助单位进行分类统计;

3.运用对比分析方法,比对行业占比与资金补助占比,审查政策导向是否符合实际情况,导向是否正确。

补助对象真实性、可靠性审计

1.分析政策补助显现的、隐藏的限制性条件;

2.运用关联或对比分析方法,将补助数据与工商、社保、税务、信用平台、处罚信息等外部数据进行比对,验证政策受益者是否合规。

应补未补情况审计

1.编写SQL语句设置政策条件,形成合规补助对象库;

2.关联死亡数据,按合规时间对比,筛选更精准的受助对象;

3.与资金补助对象进行对比,得出应补助未补助的疑点对象。

重复补助、多头补助情况审计

运用关联、对比或数据挖掘分析方法:

1.比对同一政策不同批次的受益者情况;

2.比对同一时间段内不同政策的受益者重复情况。

补助对象固定化审计

以时间为维度对某一项目补助情况进行“下钻”,分析是否存在补助对象较为固定的情况。

同类补助重合性审计

1.收集同类补助项目相关数据;

2.按受助单位进行统计分析;

3.关联税务等外部数据,总体分析政策补助总额是否存在超纳税额等不合理情况。

政策措施落实绩效

目标完成度审计

1.将政策目标结构化;

2.从政策面上统计实施结果;

3.通过编写SQL语句比对目标与实施结果的差异,从总体上分析政策目标完成程度。

指标达标情况审计

某些政策对受助对象有一定的绩效要求,若不达标,应当收回补助。以此为出发点,可以进行政策实施绩效的审查。

1.编辑政策补助指标条件,如商品配送率要达到70%以上;

2.编辑SQL语句,运用对比分析方式,结合各项指标综合分析政策实施前后的绩效情况。

受助对象后续运营情况审计

1.获取受助对象明细情况、补助收回明细表;

2.关联税务、处罚、信用平台等外部数据,分析是否存在受助后注销企业、被处罚等情况;

3.将疑点对象与补助收回明细表进行关联比对,确定应收回未收回的疑点表。

政策落实部门权力运行、内外部监管有效性审计

1.获取相关信息,对政策涉及的各个部门进行权力运行审计,反映个别部门不作为、乱作为的现象;

2.比对分析政策覆盖范围有无交叉、重叠;

3.审查内部监管、外部监督体系是否完善、到位,运行是否有效。

 

附录3--重大投资项目类大数据审计项目审计标准表

本表以H市重点政府投资建设项目大数据审计实践为蓝本编制而成。由于各地的政府投资建设政策和具体要求、信息化程度等存在一定差异,重大投资项目类大数据审计目标、重点和方法可能有所不同。下表根据H市大数据审计探索实际以及常用的审计方法编写而成,仅供参考。

 

审计目标

一级审计内容

二级审计内容

主要审计程序和方法描述

分析项目前期管理方面的规范性

工程建设项目前期管理程序性审计

立项环节前期管理情况审计

1.比对分析工程建设项目名称是否在发改部门立项审批通过的项目库中,分析工程项目是否存在未立项,或未批先建的情况;

2.分析500万以上(各地规定的金额各不相同)的工程建设项目名称是否在发改部门可研审批的项目库中,分析重大工程项目是否存在未按要求进行可研分析的情况;

3.分析工程建设项目名称是否在发改部门初步设计审批通过的项目库中,分析工程项目是否存在项目设计未报批,或未批先建的情况;

4.通过对发改部门在政府投资项目前期的立项、可研、初设的审批情况的核查,发现是否存在重大政府投资项目建设部门立项、可研等应该分开报批,发改部门违规合并审批的问题。

环评环节前期管理情况审计

1.比对分析工程建设项目名称是否在环保部门环评审批项目库汇总,通过对环保部门在政府投资项目前期环保测评情况的核查,发现政府投资项目是否缺乏合理的环境资源要素保障,是否存在政府投资项目未获得环保部门环保许可的问题;

2.重点关注经多次审批才通过的工程项目的环保测评情况是否达标,对已建好的工程项目经多次环评审批的要列入现场审计重点核查对象。

规划环节前期管理情况审计

1.比对分析工程建设项目名称是否在规划部门的规划许可审批项目库汇总,通过对规划部门在政府投资项目前期规划审批情况的核查,政府投资项目是否按规定进行规划审批环节的问题;

2.可利用Arcgis等专业工具,进一步将工程建设项目的规划与城市建设的总体规划置于同一坐标系中叠加分析,发现政府投资项目可能存在的项目局部规划与整体规划不符的情况。

工程项目用地环节前期管理情况审计

1.比对分析工程建设项目名称是否在土地资源管理部门的土地利用审批项目库中,通过对土地资源管理部门在政府投资项目前期国有土地使用审批情况的核查,发现政府投资工程项目是否按规定进行土地利用审批的问题;

2.进一步分析土地利用审批情况,发现政府投资项目前期管理是否存在项目投资与年度用地计划、用地规划不符,政府投资项目是否缺乏合理的土地资源保障的问题。

工程项目资金保障情况审计

通过对政府投资项目资金来源情况的核查,揭示项目投资与政府财力的匹配情况,根据政府投资项目中政府性资金的占比情况分析是否存在政府投资项目缺乏合理政府投入保障的问题。

分析项目招投标管理方面的规范性、合法性

工程建设项目招标规范性审计

工程项目应招未招情况审计

1.将建设部门的工程建设数据中的工程建设项目清单与公共资源交易中心招标项目清单比对,审查工程项目的类别和招标金额;

2.分析是否有超过200万元的施工类项目没有按照规定实行公开招投标的情况;

3.分析是否有超过50万元的设备材料类项目没有按照规定实行公开招投标的情况;

4.分析是否有超过50万以上的咨询服务类项目没有按照规定实行公开招投标的情况。(注意具体金额各地、各时期可能各有不同)

工程建设项目投标合规性审计

工程项目投标保证金审计

1.将招标项目按月和年进行汇总,分析所有项目优惠率走势,核查优惠率较低的重大项目作为下一步审计分析的重点;

2.采取内查外调法,查找保证金的来源账户;

3.根据采集到的保证金数据,选取本地容易查取的银行账户,通过关联分析查找在一定时间内转账金额等于保证金金额的同一账户对各投标企业进行转账,再调取该账户的交易流水,查找是否存在其将保证金转账给第三方,第三方再将保证金转给投标企业的情况。

工程项目投标单位关联关系审计

1.将投标单位名称与工商登记数据关联分析;

2.分析同一工程项目的多个投标单位是否存在法人代表一致的情况;

3.分析同一工程项目的多个投标单位是否存在企业高管一致的情况;

4.分析同一工程项目的多个投标单位是否存在企业投资人(实际控制人)一致的情况。若存在上述情况的,则存在较大的围串标嫌疑。

工程项目电子标书制作情况审计

1.将招标项目按月和年进行汇总,分析所有项目优惠率走势,核查优惠率较低的重大项目作为下一步审计分析的重点。

2.分析采集电子标书的报价情况,选择其中报价较为接近的投标单位的投标电子数据;

3.将同一项目投标报价中的单价进行类比分析,是否存在多个投标单位的报价总价及材料单项报价呈固定比例增减,筛选出可能存在围串标嫌疑的投标单位名单。

 

工程项目电子标书投递情况审计

1.采集投标电子数据,在投标单位或投标代理机构用专业软件制作投标文件时,每一次软件打开时,软件会记录本次开启时电脑的外网端口IP地址和硬盘号;每一次使用计价锁制作投标文件的商务标时,软件会记录计价锁的唯一编号;每一次使用CA锁制作投标文件的技术标时,软件会记录CA锁的唯一编号。获取相关数据信息;

2.采集招投标数据,将项目名称和标书编制人进行分类汇总,查询同个项目同个标书编制人大于2次以上的记录;

3.分析电子标书中的电子签名是否一致,有无一个标书编制人为同一个项目的多个投标单位编制标书的疑点线索;

4.分析电子标书投递的IP地址是否一致;

5.分析电子标书投递时的硬盘号是否一致。

6.进一步分析上述同一项目多个投标人特征信息一致的情况,锁定围串标嫌疑。

政府投资工程建设项目评标规范性审计

工程项目投标资质挂靠情况审计

1.分析代表投标单位前来投标的项目经理(或核心施工人员)的基本信息;

2.查询同一项目经理(或核心施工人员)代表不同单位、不同项目参与投标的情况;

3.进一步延伸项目实际实施的人员情况,若投标公司不参与的,则为项目经理(或核心施工人员)借用投标公司的公司资质;若项目经理(或核心施工人员)不参与的,则为投标公司借用项目经理(或核心施工人员)的个人专业资质。

工程项目评标专家随机抽取情况审计

1.分析专家库的各位专家被随机抽取参与评标的情况,分析是否存在个别专家参加评标次数很多,或从未参加评标的情况,审查专家随机抽取功能是否具备相当的随机性;

2.将招标系统抽取专家信息与甲方指定专家数据比对,是否有甲方指定情况;

3.分析同一天进行的多个同类招标项目的评标专家构成,是否存在多个项目专家高度一致的情况,是否存在采购部门私自简化流程,是否只进行一次专家随机抽取,评审多个项目的情况。

评审专家回避制度执行情况审计

1.采集评标专家数据、社保数据及工商数据进行关联分析;

2.从社保信息中获取评标专家的工作单位,进一步分析是否存在评审专家所在工作单位参与投标,评审专家未回避的情况;

3.进一步分析投标单位的公司登记数据,关注投标单位的公司名称发生变更,而评标专家的信息更新不及时,导致评审专家未回避的情况;

4.将评审专家与企业工商登记数据关联分析,查找评审专家担任法人、高管或股东的企业是否参与投标,评审专家未回避的情况。

分析项目实施的过程管理和风险控制有效性

政府投资建设项目实施管理有效性审计

工程项目变更情况审计

1.收集施工现场的大型原材料或施工项目的信息;

2.将上述信息与原始合同、招标信息比对,查找其中金额、数量出入较大的记录;

3.查看工程变更记录,及其审批情况,分析可能存在的工程随意变更、变更未履行相关程序的情况。

工程项目资金支付情况审计

1.将资金支付数据与资金支付审批数据比对分析,分析工程项目资金支付的审批情况,是否存在未经批准支付的情况,是否存在未按照审批的金额和方式支付的情况;

2.抓取合同分期支付信息,将资金支付数据与合同约定的支付数据比对分析,分析工程项目资金支付是否严格按照合同约定的条件和金额执行,是否存在超额支付、超进度支付的情况。

工程项目转分包情况审计

1.采集施工现场项目经理、工程监理以及施工人员的信息;

2.将收集的人员数据关联社保数据、公积金数据等,分析相关人员的工作单位是否与中标单位一致,大面积的人员工作单位与中标单位不一致则存在转分包的可能;

3.进一步分析施工单位的资金流向,查看施工单位是否将大额资金转移至其他同类型施工单位,查找可能存在的工程转分包情况。

工程项目工料及价格合理性审计

1.收集施工单位的工料机单价明细数据;

2.将单价明细数据与项目实施时对应的相关部门发布的市场信息价(控制价)进行比对,分析超过市场信息价(控制价)的情况;

3.将单价明细数据与其他同一时间同类项目的工料机单价进行比对,分析差异较大的情况;

4.涉及到工作量和数量较大的情况,审计人员需现场勘察核实。

工程建设项目超范围施工情况审计

1.将工程建设项目的现场施工图与合同约定的施工范围进行比较,发现可能存在的超过合同约定施工范围施工,或私自减少施工范围的情况;

2.将工程建设项目的现场施工图与相关职能部门审批的规划图进行比对分析,发现可能存在的超范围、超红线施工的情况。

 

附录4--自然资源(资产)类大数据审计项目审计标准表

以生态环境保护审计案例为基础,适当扩展其他自然资源类审计内容,制定自然资源资产类大数据审计标准表。由于各地的自然资源禀赋特点不同,标准表根据我市常见的几类自然资源及大数据审计实践编写而成,各地要结合当地实际,有选择性、针对性的开展自然资源资产审计。

审计目标

一级审计内容

二级审计内容

主要审计程序和方法描述

保障水资源合理开发利用和保护

审查饮用水水源保护情况

核查饮用水水源地保护区内是否存在排污口的问题

1.将含有经纬度信息的排污口位置信息表转换为矢量数据;

2.将饮用水水源地保护区矢量数据与排污口矢量数据叠加比对;

3.找出在饮用水水源地保护区内设置排污口的问题。

核查饮用水水源地保护区内是否存在与保护水源无关的建设项目的问题

1.从地理国情普查矢量数据中提取加油站、水厂、电厂、污水处理厂等工矿企业分布点状矢量数据;

2.将饮用水水源地保护区矢量数据与工矿企业分布点状矢量数据叠加比对;

3.找出在饮用水水源地保护区内存在排放污染物的问题。

核查饮用水水源地的一级保护区是否存在未划入生态保护红线的问题

1.从饮用水源保护区矢量数据中提取一级保护区水域和一级保护区陆域矢量数据;

2.将生态保护红线矢量数据与一级保护区水域和陆域矢量数据叠加比对;

3.找出饮用水水源地的一级保护区未划入生态红线的问题。

保障土地资源合理开发利用和保护

审查建设用地开发利用情况

核查不同规划之间是否存在禁建区划分不一致的问题

1.将县域总体规划矢量数据分别与生态环境功能区划矢量数据、土地利用总体规划矢量数据等其他规划叠加比对;

2.筛选出在县域总体规划中是禁建区而在其他规划中属于非禁止类区域的问题。

核查是否存在在县域总体规划禁建区内建设的问题

1.对县域总体规划禁建区、供地图斑、农转用图斑进行叠加比对;

2.筛选出在县域总体规划禁建区内的供地项目或农转用项目;

3.通过叠加历年的遥感影像,进一步确认在县域总体规划禁建区内开发建设的问题。

核查是否存在在生态环境功能区划禁止准入区内建设的问题

1.对生态环境功能区划禁止准入区、供地图斑、农转用图斑进行叠加比对;

2.筛选出在生态环境功能区划禁止准入区内的供地项目或农转用项目;

3.通过叠加历年的遥感影像,进一步确认在生态环境功能区划禁止准入区开发建设的问题。

核查是否存在在土地利用总体规划禁止建设区内建设的问题

1.对土地利用总体规划禁止建设区、供地图斑、农转用图斑进行叠加比对;

2.筛选出在土地利用总体规划禁止建设区内的供地项目或农转用项目;

3.通过叠加历年的遥感影像,进一步确认在土地利用总体规划禁止建设区开发建设的问题。

核查是否存在供地后闲置用地的问题

1.将供地矢量数据与地表覆盖数据进行叠加比对;

2.筛选出供地数据中不是房屋建筑区、构筑物的图斑;

3.通过叠加历年的遥感影像,进一步确认供地后未进行开发建设的问题。

审查基本农田保护情况

核查基本农田是否存在非耕化的问题

1.将基本农田矢量数据与地表覆盖数据进行叠加比对;

2.提取出基本农田内现状为房屋建筑区、构筑物、荒漠与裸露地表、人工堆掘地、林地、水面、园地等非耕地总体情况,形成范围A;

3.提取范围A中的房屋建筑区、人工堆掘地,扣除土地变更调查中的建设用地,扣除供地、农转用,形成非法占用情况;

4.将范围A中的房屋建筑区、人工堆掘地与供地矢量数据叠加,重叠区域即为基本农田用于“非耕”的情况;

5.将范围A中的房屋建筑区、人工堆掘地与农转用矢量数据叠加,重叠区域即为将基本农田“农转用”的情况。

核查基本农田是否存在闲置/荒芜的问题

1.将基本农田矢量数据与地表覆盖数据叠加比对;

2.提取基本农田内现状为荒漠与裸露地表、草地,形成基本农田闲置、荒芜情况表;

3.通过叠加历年的遥感影像,进一步确认非种植区的现状情况。

核查是否存在将工业、采矿、仓储等建设用地划为基本农田的问题

1.将土地利用变更调查矢量数据中的工业、采矿、仓储用地等建设用地数据与基本农田矢量数据叠加对比;

2.筛选出将建设用地划为基本农田的问题。

核查是否存在将沙地、沼泽地、裸地等未利用地划为基本农田的问题

1.将土地利用变更调查矢量数据中的沙地、沼泽地、裸地等未利用地数据与基本农田矢量数据叠加对比;

2.筛选出将未利用地划为基本农田的问题。

审查未利用地开发管理情况

核查自然生态红线区内是否存在未利用地强制性保护不到位的问题

1.从土地利用变更调查矢量数据中提取未利用地图层;

2.从环境功能区划矢量数据中提取自然生态红线区图层;

3.将未利用地图层与自然生态红线区图层叠加比对,找出在自然生态红线区内的未利用地;

4.通过叠加历年的遥感影像,找出自然生态红线区内未利用地被破坏的问题。

核查生态功能保障区内是否存在未利用地开发用途和开发强度不符合要求的问题

1.从土地利用变更调查矢量数据中提取未利用地图层;

2.从环境功能区划矢量数据中提取生态功能保障区图层;

3.将未利用地图层与生态功能保障区图层叠加比对,找出在生态功能保障区内的未利用地;

4.通过叠加历年的遥感影像,找出生态功能保障区内未利用地被违规开发的问题。

审查土地整治项目开发管理情况

核查土地整治项目是否在二十五度以上的陡坡地选址的问题

1.将土地整治项目红线矢量数据与森林资源二类调查矢量数据叠加比对;

2.通过森林资源二类调查矢量数据的属性表筛选出坡度超过25度的数据;

3.找出坡度超过25度的土地整治项目。

核查土地整治项目是否在饮用水水源一级保护区和农村饮用水水源保护范围内选址的问题

1.从饮用水源保护区矢量数据中提取一级保护区水域和一级保护区陆域矢量数据;

2.将土地整治项目红线矢量数据分别与饮用水水源一级保护区、农村饮用水水源保护范围矢量数据叠加比对;

3.找出在饮用水水源一级保护区和农村饮用水水源保护范围内选址的土地整治项目。

核查土地整治项目是否在自然保护区和自然保护小区内选址的问题

1.将土地整治项目红线矢量数据分别与自然保护区、自然保护小区矢量数据叠加比对;

2.找出在自然保护区和自然保护小区内选址的土地整治项目。

核查土地整治项目是否在省级以上公益林内选址的问题

1.从公益林矢量数据中提取出省级公益林和国家级公益林矢量数据;

2.将土地整治项目红线矢量数据分别与省级公益林、国家级公益林矢量数据叠加比对;

3.找出在省级以上公益林内选址的土地整治项目。

核查土地整治项目是否在省级以上森林公园内选址的问题

1.从森林公园矢量数据中提取出省级森林公园和国家级森林公园矢量数据;

2.将土地整治项目红线矢量数据分别与省级森林公园、国家级森林公园矢量数据叠加比对;

3.找出在省级以上森林公园内选址的土地整治项目。

保障矿产资源合理开发利用和保护

审查矿产资源开发合规性

核查矿产资源开发是否存在越界开采、非法开采的问题

1.将矿产资源规划矢量数据与地表覆盖数据露天采掘场数据进行比对;

2.筛选差异部分。进一步筛选出矿产资源规划禁采区内违法供地开采情况;

3.差异部分与采矿权证四至范围叠加分析;

4.超出部分可能为越界开采;没有采矿权证四至范围可能为非法开采;以前有采矿权证的可能为“未及时治理”情况。

核查矿产资源开发是否存在占用公益林的问题

1.将公益林矢量数据与地表覆盖露天采掘场数据进行叠加分析,筛选出落在公益林范围内的采掘场;

2.将公益林矢量数据分别与采矿权矢量数据进行叠加分析,筛选出落在公益林范围内的采矿厂;

3.通过叠加历年的遥感影像,找出在公益林内违规开矿的问题。

保障森林资源合理开发利用和保护

审查生态公益林保护情况

核查相关建设项目是否破坏公益林的问题

1.将公益林矢量数据转换成kml格式;

2.将土地整治项目、小城镇环境综合整治项目以及其它建设类项目的矢量数据转换成kml格式;

3.在Google Earth中通过历年影像图观察公益林变化情况,找出建设项目破坏公益林的问题。

核查国家级公益林是否存在未划入生态保护红线的问题

1.从公益林矢量数据中提取出国家级公益林矢量数据;

2.将生态保护红线矢量数据与国家级公益林矢量数据叠加比对;

3.找出国家级公益林未划入生态红线的部分。

 

 

附录5--地方党政领导经济责任类大数据审计项目审计标准表

地方党政领导经济责任大数据审计应围绕领导干部权力运行,在面上总体把握的基础上,紧扣人(决策者、执行者)、财(公共资金、政务债务和国有资产)、事(重大政策落实、重大工程项目、重要民生保障和重大工作职责)等重大事项,重点开展机构编制审计、公职人员兼职审计、国有企业审计、政府债务审计、财政奖励补助资金审计、招商引资审计、工程项目招投标审计、民生保障审计、规划审计、国有资源审计等大数据专题审计。由于各地资源资产、发展重点、营商环境、信息化环境等差异较大,地方党政领导经济责任大数据审计要结合当地实际,有的放矢。

审计目标

一级审计内容

二级审计内容

三级审计内容

主要审计程序和方法描述

分析地方主要党政领导在对与“人”相关的重大管理事项的决策准确性和管理的有效性

对“人”的审计

人事编制审计

超编超岗情况审计

1.财政局在职人员工资名单与编委办行政事业实名人员名单对比,得出财政供养超编人数;

2.编委办机构数与三定方案核定机构数,得出超编机构数;

3.编委办编制核定数与实有人数对比,得出超编人数;

4.编委办干部职数与组织部实际干部任命数,得出干部超职位数。

财政供养人员“吃空饷”审计

1.分析财政局的统发工资中只发基本工资没有考核奖励金额的名单,确定在编不在岗问题或吃空饷问题;

2.分析人社局统发工资名单与编委办实有人员所在单位不一致的人员名单,确认在编不在岗问题;

3.分析人社局统发工资和财政局统发工资人员名单差异,确认是编外人员还是吃空饷问题。

干部监督情况审计

财政供养人员经商办企业情况审计

1.将财政供养人员与工商登记企业法人代表和个人股东及民政局社团登记信息相匹配;

2.完全一致的为公职人员经商办企业或在国有企业兼职;

3.取得当地组织部有关干部任免文件;

4.有正式任职文件在国有企业、社团的查看是否兼职兼薪;

5.没有任职文件在国有企业、社团的作为下一步审计重点:一是个人收入是否违规;二是单位业务是否违规;三是单位财务是否混乱;

6.公职人员经商办企业的,重点审查:一是利用职权影响垄断经营,取得非法收入;二是与财政补助资金进行关联分析,发现骗取财政补助奖励的情况。

分析地方主要党政领导在对与“财”相关的重大资金管理使用的决策准确性和管理的有效性

对“财”的审计

国有企业审计

国有产权未纳入监管情况审计

1.查询工商登记确定国有全资企业和国有控股企业名单即注册登记企业性质为国有全资或国有控股(或在企业登记信息中查询股东为当地财政局、国资委等机关事业单位的企业名单);

2.查询国有企业为股东或第一步骤查出企业为股东的所有企业;

3.将企业法人代表与行政事业单位在职人员名单相匹配,查询企业法人是否属当地党委政府下属部门单位的领导;

4.核对企业是否纳入国资办管理、考核和监督。

国有产权未登记情况审计

1.导出所有企业财务数据,重点是产权未登记的企业;

2.关注企业货币资金、对外投资、固定资产、在建工程、无形资产、大额往来款、短期贷款、长期借款等科目清单;

3.重点关注业务经营、资产管理、大额资金去向、工资福利和利润分配。

国有资源审计

土地资产收储情况审计

1.查询国土局土地储备计划表及土地收储、国资公司土地回购情况;

2.查询国土局地籍登记注销和变更土地情况;

3.以土地宗地号关联,对比收购价和重新出让价格,确认收购损失;

4.以土地宗地号关联,确认收储、回购土地闲置情况。

政府债务审计

政府通过国有企业或投融资平台举债情况审计

1.工商登记确定国有全资企业和国有控股企业名单,即注册登记企业性质为国有全资或国有控股;

2.查询国有企业为股东或第一步骤查出企业为股东的所有企业;

3.统计企业短期借款、长期借款等科目清单,与政府债务管理系统中的每个企业债务余额匹配对比分析;

4.要求差额单位提供债务明细和贷款合同;

5.汇总上述数据重新统计任期初和任期末政府性债务。

财政资金审计

财政补助资金审计

1.财政集中支付系统查询“企业”,取得发放企业补助奖励清单,与财政局提供的企业补助清单比对,发现是否存在企业补助奖励情况被漏报瞒报的情况;

2.将公职人员经商办企业名单与补助奖励企业名单匹配,审查匹配一致的企业补助奖励档案,审查公职人员经商办企业补助奖励问题;

3.统计企业补助资金总额,审查补助奖励排名前十大户企业档案,是否弄虚作假;

4.查询分析获取补助奖励企业的税务数据,审查奖励补助金额大于税收贡献的企业;

5.查询税务系统中的企业财务报表,分析审查是否存在长期经营亏损企业获得财政补助的情况。

分析地方主要党政领导在对与“事”相关的重大管理事项的决策准确性和管理的有效性

对“事”的审计

民生保障审计

民生资金投入情况审计

1.分析财政局预算指标有关民生支出安排;

2.分析公共财政支出决算中民生支出相关的功能分类和部门经济分类汇总统计;

3.关注12月和13月会计调整分录,即年终调整支出结构;

4.关注民生资金以拨代支调整进入专户资金问题;

5.财政调剂民生分类指标的资金真实去向和用途。

精准扶贫情况审计

1.将低保人员信息与公安部门户籍信息关联分析,分析是否存在主管部门或人员虚增低保人员的情况,核实低保人员的真实性;

2.将低保人员信息与财政部门供养人员信息、组织部门村干部信息、火葬场死亡人员信息关联分析,分析是否存在低保人员或家属是财政供养人员、村干部,是否存在向死亡人员发放保障资金等情况,核实低保人员的社会背景身份;

3.将低保人员信息与社保部门社保征缴信息、公积金中心公积金征缴信息和税务部门个税信息关联分析,查看低保人员及其较少的社保缴费基数、公积金缴费基数、个税申报基数,核实低保人员的真实收入水平;

4.将低保人员信息与国土部门的不动产登记信息、公安部门的车辆登记信息关联分析,分析低保人员及其家属是否拥有高档住宅或高档车辆,核实低保人员的真实生存状况;

5.将低保人员信息与工商部门企业登记信息关联分析,核实低保人员及其家属的对外投资情况。

招商引资审计

 

虚假招商骗取财政补助资金审计

1.从财政支出数据中得到招商引资奖励记录;

2.根据招商引资政策审查奖励金额是否合规;

3.将招商引资的项目(内资、外资)与招商局招商引资项目进度统计表相核对,分析是否存在部分招商引资项目未落实的情况,是否存在虚假招商引资项目。

招商引资土地政策落实情况审计

1.将招商引资的项目的企业名称与国土局土地出让项目和土地出让金收缴返还数据相核对,分析招商引资项目的土地优惠政策执行情况和土地出让金免交、缓交问题;

2.将招商引资的项目相关企业与土地批后监管系统项目和遥感卫星图斑数据相核对,分析招商引资土地闲置和土地收购问题。

招商引资项目落地情况审计

1.将招商引资的项目与发改局项目备案,与住建局的用地规划许可、工程规划许可、施工许可项目单位相核对,关注招商引资项目落地情况;

2.将招商引资的项目相关企业与工商局工商登记相核对,分析招商引资项目的落地执行进度;

3.将招商引资的项目相关企业与税务局税务登记、年度税收相核对,分析招商引资的绩效。

招商引资经费使用情况审计

1.分析招商引资经费直接支付到相关企业的情况;

2.分析招商引资经费到公职人员个人账户的情况;

3.分析招商引资“三公”经费有无违反八项规定的情况,关注经费的支出科目和摘要等。

自然资产资源管理情况审计

自然资产资源管理情况审计

通过对多行业规划数据和土地利用现状数据进行关联比对分析,重点审查:

1.多规合一,规划布局不一致问题;

2.以租代征使用土地;

3.将其他用地划为基本农田;

4.基本农田处于闲置、荒芜状态;

5.占用基本农田挖塘造湖、种植林果、建绿色通道等;

6.开发地块为林地;

7.开发地块坡度在25度及以上;

8.土地开发项目违规占用公益林。

具体审计程序与方法参见附录4-自然资源(资产)类大数据审计项目审计标准表

政府投资项目审计

 

前期管理情况审计

发改、环保、规划、国土、财政等部门前期管理合规性检查。

具体审计程序与方法参见附录2-重大投资项目类大数据审计项目审计标准表

招投标管理制度执行情况审计

具体审计程序与方法参见附录2-重大投资项目类大数据审计项目审计标准表

 

围串标审计

 

 

 

 

 



【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭