剑客
关注科技互联网

税务大数据的时代真的来了?

营改增:实现“数目字管理”的前提

正如黄仁宇所著《万历十五年》中的一段话“中国落后的原因无关道德和个人因素,而在于技术上不能实现‘数目字管理’。”黄仁宇提出,美国人之所以最近一两百年发展非常快,原因在于具备数目字管理的传统,而我们不具备。

清华大学博士后研究员鲁钰峰认为, 数目字管理这种情况将有所改变,这种改变也意味着税务大数据的时代真的到来了 。这种说法有迹可循:

税务大数据的时代真的来了?

(图)清华大学博士后研究员鲁钰峰

今年3月,财政部、国家税务总局公布了自5月1日起将在全国范围内全面推进的营业税改征增值税改革方案细则,细则包含这些信息: 营改增后的第一步是开好票,要纳入每个行业;第二步是报好税,就是发票这一块有税务问题;第三步是分析好 ,“分析好”赋予了整个经济或者是社会管理层更深的含义。

数目字管理中很重要的一点是,社会资源是可以量化的,且可以做理性的定量分配,这就涉及到是否有能力采集数据。“营业税改增值税以后,基本上所有行业都纳入到增值税行业,这意味着可以采集到国民经济每一根毛细血管的数据。”鲁钰峰认为,这是我国具备数目字管理的重要前提。

“在这一点上,美国等西方国家都很羡慕我们。西方国家在税收管理时只能管到资金流,通过资金进行判断;现在我们不仅可以通过资金进行判断,还可以通过信息、产品和价值做大量分析。”鲁钰峰说。 大数据 的价值:具备跨数据源视角

鲁钰峰指出,营改增实行后,所有行业都可以开具增值税普通发票和专用发票,因此,数据已经非常全了。开票环节都符合业务环节,但开票之外的事情就需要借助大数据。

鲁钰峰举了一个典型的真实案例:前不久,某个产业发生一起欺诈案,其中有一位关键人物,他注册了多家公司,且每家公司都正常开票,从增值税或专用发票上分析没有任何瑕疵,然后通过这点去骗贷。大家也会认为这家公司没有问题。但是,经查证,该公司对外标榜的都是同一个产品,甚至连产品都没有。

“针对这家公司,涉及到税务虚开;放射到社会,涉及到存在金融风险。”鲁钰峰指出,这些问题不能从增值税专用发票的链条分析出来,而需要通过仓单数据、运输费用数据和资金数据等其他数据。如仓单数据包含公司货物在仓库里面是否流转等;再如运输费用数据包含是否搬运了产品。

大数据的价值在于具备跨数据源的视角,即从信息流的角度,跨数据源来解决问题。 ”鲁钰峰说。 税务大数据应用状况如何?

甲骨文公司售前咨询总监闵文杰介绍说,税务中重要的业务系统是金税三期核心征管系统,其中的数据对税务大数据非常有用。金税三期全面采用Oracle的数据库。近年Oracle与国家税务总局和各地方的税务、国税的合作非常多,深度参与他们的税务建设,因此,比较了解信息化的整体结构和业务。多省对于Oracle的大数据也非常感兴趣,希望有更多的合作。

“国家税务总局金税三期建设完以后,肯定会有全国统一的数据平台和大数据平台,这些数据更多是跨省、跨税种、跨业务的场景。将来各省将有自己的 数据分析平台 和大数据平台,解决自身的一些业务应用问题。”鲁钰峰说。

鲁钰峰认为, 将来,税务大数据不一定是完全大而统一的大数据平台,很可能是分层式,并保证数据的一致性和可访问。 目前,金税三期也是按这种方式规划。

“罗格数据主要挖掘税务大数据的价值,从模型的角度,关注中观和宏观产业、区域、行业、价值链和供应链等。”鲁钰峰介绍了公司的关注点。 税务的价值要反哺社会

“大数据要构建价值双通道或价值双网络。”鲁钰峰认为这一点很重要。国家税务总局当下也提出,税收要服务地方经济、社会综合治理,也就是税务的价值要反哺社会。从另外一个角度看,也存在全社会协税的过程,因为 税务大数据不仅是税务部门的数据,而是全社会的数据

将来,税务部门将拥有核心数据,也可能和政府部门、 企业 、个人或第三方平台等,共同围绕税务大数据创造价值,这才是比较理想的税务大数据生态体系。这些数据不仅可以服务税务管理,还可以服务地方经济,甚至宏观决策或产业决策。

闵文杰介绍说,现在,税收大数据中有一些好的应用,网上办税平台“银税互动”就是一个很好的案例。现在,国家鼓励“大众创业,万众创新”,但一些小微企业因为信贷风险很难获取银行贷款。推广“银税互动”平台后,银行可以综合多方面的数据,包括税后数据、工商数据和民政数据等,就能知道企业的信用状况。因此,“银税互动”给银行贷款带来了极大的方便。现在,很多银行都开始利用税务大数据做贷款发放服务。

鲁钰峰认为,国家推动“银税互动”的最终目的是“ 让税务部门以大数据的方式服务地方经济和小微企业 。” 大数据将替代传统BI?

鲁钰峰强调,大数据不能替代以前的BI。原因在于:数据分为大数据和小数据,传统BI的小数据是放在关系型数据库中,而大数据更多地是关注大量、快速、异构的数据。两者之间不可替代,鲁钰峰认为,小数据关注的是因果关系,大数据关注的是关联关系,这两种关系需要整合。而且在不同的场景下,它们会产生更大的价值,不存在替换的关系。

鲁钰峰认为, 小数据不必往大数据搬家,大数据也不能以小数据的方式实现,最好的方式是整合。 接下来的大数据架构需要打通大数据和小数据,Oracle在这方面有明显的优势。

鲁钰峰表示,传统的BI与大数据的区别主要体现在两个方面:

传统的BI使用较多的是分布式关系型数据库,把小数据搬到MPP中;而大数据的价值不同于用于做决策的传统数据,其价值体现在支撑工作流、日常管理,实现智能化,包括给纳税人提供智能化。如,Oracle Big Data SQL可跨传统的DB和大数据平台做统一组合,是一个比较优化的架构实现方式。虽然这用MPP也可以实现,但实施过程会比较痛苦。

传统的BI关注的是数据资源,这涉及到如何把可获取的数据资源给拿过来,并通过数据模型的方式建立起数据间的关系,再通过这些关系推导出应用场景。大数据很难做到这一点。第一个原因是大数据的量非常大,且边界、数据源都不确定;第二个原因是数据间的关系不可能直接做模型表述;第三个原因是每条数据的价值,包括文本、影像和其他价值,不能直接通过数据解读,而必须要找到关联关系。

鲁钰峰指出,大数据应用的场景是以业务价值、而不是以数据资源作为导向。首先,要知道数据的业务价值在哪里,如分析某个行业的税收流失;其次,要根据价值设计具体的业务场景,如要在什么阶段分析,支撑的是领导的决策还是一线人员的智能化管理;再次,根据场景组织数据源。

由此可见,大数据和传统BI的最大区别在于,大数据不是由数据资源、而是由业务价值驱动。因此,“大数据不一定要追求大而全,有时还要考虑小而美。”

作者丨王盈


税务大数据的时代真的来了?

责任编辑:王培

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址