第三方数据采集分析系统
发挥这些数据作用,需要一个自动与地税征管系统产生数据比对关联的系统,并展示差异,提示工作人员业务疑点。
企业自报信息
税收收入预测数据报送
企业年度财务报表、审计报告报送
企业所得税核定征收鉴定报告
综合治税信息
从国税局、国土房管局、工商局、供电局、公安局、人社局等20多个单位采集企业涉税信息。
互联网信息
包括但不限于电商、房产、土地、商演、企业经营、行业监管、金融、本地生活、采购等涉税信息。
互联网采集技术:
网络爬虫
由任务调度控制器统一调度WEB信息采集任务;
提供控制台管理采集任务执行对象、执行时间及频率,并可跟踪执行状态;
支持分布式或采用并行处理实施信息抓取;
任务执行对象基于统一的接口实现。
自然语言处理系统
由任务调度控制器统一调试自然语言处理系统,完成非结构化信息向结构化数据的转换工作;
支持分布式或采用并行处理执行自然语言的处理及结构化数据的转换及持久化工作;
支持中英文及数字混合的文本处理;
处理过程记录日志。