编者按:日前,全网担保网科技数字金融事业群副总裁娄小健署名文章《监管“一表通”数据集市的应用研究——某银行建设“一表通”数据集市实践》在《银行家》杂志2024年7月刊发表。文章通过扎实的数据分析和独到的见解,为行业提供了有价值的参考和启示。
以下是全文实录:
导语:近年来,中央与地方密集出台与数据监管相关的政策,对数据的监管也日趋严格,商业银行面临着业务发展与合规经营的双重压力,如何找到一条既能够在底层保障数据安全合规,又能持续为业务创新带来活力的发展路径,是每个银行都要面对的重要课题。某银行与全网担保网科技共同规划建设“一表通”数据集市,打通数据业务化壁垒,构建满足数字化智能时代的数据能力,达成向国家金融监督管理总局报送顺畅的目标,满足提升报送质量的要求,并对行内明细数据形成比较全面的治理架构,提升该银行的核心竞争力。
在我国资本市场发展早期,市场地方性的特征较为明显,监管格局以中国人民银行为主,国家计委等多部门和地方政府实施分散管理。自1997年国家逐步建立全国统一的监管体系后,一个统一有序的全国期货监管体系随之逐步确立完善。现阶段我国已建立起宏观审慎管理与微观审慎监管规则体系,并不断完善行为监管规则体系。
当前,金融数字化转型浙入深水区,为了持续拓展金融开放的广度和深度,2022年1月,中国人民银行印发的《金融科技发展规划(2022-2025)》指出要加快监管科技的全方位应用,强化数字化监管能力建设,对金融科技创新实施穿透式监管,筑牢金融与科技的风险防火墙。2023年4月,原中国银保监会在《中国银保监会2022年法治政府建设年度报告》也提出“强化监管科技信息化建设,试行一表通监管数据采集平台”的要求。
“一表通”是国家金融监督管理总局研究搭建一套由金融机构向监管机构提报完整的明细级、标准化的金融数据体系,要求在银行端建设监管数据可信区,构建面向银行的监管统计数据采集、审核、应用流程,探索实现一个高效安全用数环境,满足监管对数据报送规范性、及时性和灵活性及基础环境建设的要求。面对监管“一表通”监管数据透明化、报送时效缩短化、数据采集集约化、规范化和统计分析能力智能化的改革需求,某银行积极响应国家政策,对监管“一表通”进行深入探索与研究,搭建“一表通”数据集市提升监管效能,保障监控业务运营合理规范,支持核心业务开展,支撑商业银行数字化水平有序规范地提升。
“一表通”数据集市建设思路
在数据创新中的建设目标
监管“一表通”数据集市的设计,是在主流信创大数据、图计算和AI技术体系基础上,建设完全符合监管新标准要求的数据体系,包含了如下创新目标:一是支持快速精准的数据报送,有效地保证报送数据合规性和时效性;二是实现对异动指标的预测、预警,为数据治理和业务合规提供智能化解决方案,提升报送数据的质量;三是对监管政策条文和监管处罚条文进行解读,并对行内的数据报送指标进行监控,形成运转高效、全程监控的管理闭环机制,大大提高行内合规运营的层次。同时,还须充分考虑在新旧监管报送中数据的快速平滑切换,在“一表通”的银行端可信区系统之前的集市中,建设完全符合监管标准的主题业务视图及其相关应用,保证银行在数据体系升级时业务的连续性。“一表通”总体架构如图1所示。
银行数据体系与“一表通”的融合思路
以往的监管指标计算,都是在银行内部的数据体系内加工完成,银行能查看自身所有数据;“一表通”则创新性地在银行内部局域网建设“监管一表通可信区系统”,明细数据被银行导入至可信区的明细数据区,再通过内置规则自动生成监管指标,可信区内的数据通过“一表通”的接口服务提供给监管机构检视,且不建议银行业务人员登录查看。这表明原有银行在自身数据体系内监管指标加工的链路以及指标之间的关联检核将被透明化,银行必须在“一表通”可信区之前的自身数据体系内构建监管数据集市,才能适应这种监管模式的变化。
有别于传统按月报送的监管报送模式,“一表通”要求报送时效达到“T+1”。监管时效的大幅缩短,也要求银行的数据流转体系本身必须具备在业务发生时的“T+1”内,且快速进行该业务明细对监管指标影响度的测算,有效地保证合规运营。这就需要建立从业务发生明细到监管指标的数据要素链路图谱,明确地展现数据加工链路。
金融监管力度的持续加大已成为不争的事实,银行需要对监管制度条文和监管处罚条文进行解读,提炼具体对应的指标和检核规则,并对不合规范的业务行为和报送数据进行事前预警、事中监控和事后自动归因分析,形成运营过程和结果的闭环机制,提高银行的合规运营能力。
针对当前监管改革的特点,若在国家金融监督管理总局发布政策后,银行再开始新报送方案的建设,那么在要求期限内可能难以达到监管政策的要求,因此某银行计划在“一表通”可信区之前的银行数据体系内搭建“一表通”数据集市。通过构建统一的监管数据模型,对标准化监管数据的报送口径进行统一,并建立长效的监管数据质量提升机制,实现由明细到指标全程直达的数据加工链路,并在监管数据透明的模式下,依据监管指标要求,继续完成原有的业务预警、指导和关联检核工作,保证“T+1”的报送时效,全面提升监管水平,高质量快速落实各项政策法规,做到不违规、不越位、长期稳定的合规运营。
随着“一表通”政策执行的持续深入,多头报送的多种数据标准,也将逐步统一成金融行业的数据标准甚至是国家标准。未来,“一表通”数据集市可将行内的数据体系转化成符合国家和行业标准的企业级数据标准体系,持续提升监管效能和数据安全,而“一表通”的数据也将变为银行数据底座中数据量最大和最主要的部分,在银行今后升级企业级数据体系时,直接从“一表通”数据集市的数据架构进行拓展即可。
“一表通”标准集市搭建规划
为完善行内监管体系,“一表通”数据集市以“数据要素图谱”为基础,从通数据、览进度、算结果的业务过程,层层递进,依照业务流程结合图计算和AI技术进行归纳提炼,构建基于“监管数据指标图谱”的计算引擎和自动归因模型,及时监控和预警银行报送数据的合规性,并引入“大模型应用”进行监管知识的沉淀和提供更好的人机交互,构建人机互动的银行智慧监管,协助监管人员便捷、透明地将政策落地。“一表通”数据集市逻辑架构图见图2。
为保证数据精准报送,“一表通”数据集市数据层先从数据源抽取业务系统的明细数据进入“监管明细区”,在“监管明细区”将数据按监管数据元标准要求进行标准化,一方面将“监管明细区”数据送入“一表通报送区”的10类明细表中,并按监管口径计算出监管比对区的数据;另一方面,将“监管明细区”的数据送入“监管指标区”计算出监管指标,再按监管接口标准生成“监管报送区”的指标。
目前,“一表通”的明细是以EAST和客户风险两类报送系统为原型,部分指标以1104为主,随着原有几十种监管报送系统逐步纳入“一表通”报送模式,“一表通”的数据范围将覆盖银行的大部分数据。由于这是一个逐步替换的长期过程,在这个过程中,存在多个原报送系统与“一表通”报送模式的并行期。为此,将“一表通报送区”的数据,按监管口径计算出“比对区”数据,这些数据用于在并行期间,进行数据的检核比对,以确保报送模式切换到“一表通”后报送数据的准确性和连续性。
为高效地对集市的数据和组件进行管理,数据集市设计了包含数据资产目录和数据资产台账卡片的“数据资产区”,同时接入用户已有的元数据和数据标准信息,并在“数据资产区”构建出完整的“数据资产关联图谱”,直观体现“一表通”数据集市中数据、加工口径、计算组件之间的关联。同时也构建了“规则库”,收集整理出涵盖业务、技术的检核规则47571条(见图3)。
为实现数据快速报送,研发团队对“一表通”可信区业务领域进行分析后,再基于图数据库,按照业务属性,以结算的最基本业务粒度——账户、借据、卡片和交易为基础,结合各种会计口径(会计分录、统计口径等)构建监管数据指标主图,并在此基础上,构建和可信区业务领域对应的子图,全链路表达业务全流程,保证今后能顺畅及时地报送数据(见图4)。
通过数据要素图谱,“一表通”数据集市在应用层构建了从数据转换、数据检核到数据报送的快速流程:在配置完需要转化的数据和转换规则后,每天报送时只需使用“一键转换”功能,即可将数据从银行现有的数据体系(数据湖、数据仓库、数据集市等)转换进“一表通报送区”,并审核转换结果报告;进入“一表通报送区”的数据,在检核工具和检核规则的支持下,通过“一键检核”,不仅可以实现报送数据的合规性检核和关联检核,还能在新旧报送并行期间,在数据层“比对区”完成新旧系统的数据比对,并生成报告,同时依据数据要素图谱和AI技术,完成比对结果的归因分析;在检核成功后,通过“一键报送”将合规的数据从数据层的“报送区”发送至“监管一表通可信区系统”。
为保证监管报送的质量,应用层还提供了“监管管理”功能,即将某银行和全网担保网科技在以往监管报送中积累的相关工具整合到系统中,同时提供对监管报送过程和监管数据资产(数据字典、指标、模型、处理组件等)的全面管理。
在拥有贯穿监管数据加工链路的全过程图谱后,“一表通”数据集市不仅能提供按明细数据对主要关键指标的预测计算,用于次日明细限额的估算;还能同时设置指标的预警阀值,当明细数据造成指标数值超过阀值时,对指标直接进行预警;除此之外,通过结合监管数据指标图谱进行饱和式校验,“一表通”数据集市还能全面发现监管报送数据合规问题,并利用专家的知识体系和机器学习训练模型,构建监管指标异动问题自动归因分析模型,对即将进入一表通可信区的数据进行预校验,有效避免报送错误数据的发生;同时,利用知识图谱体系和智能分析模型,高效解决数据问题,提升报送数据质量,从而提升银行的监管合规性(见图5)。
对监管条文的解读是银行安全运营的关键,数据集市必须对监管文件有全面的数据储备,“数据要素图谱区”收集整理了904部监管法规和近几年监管机构的罚单42607份,并结合数据资产的数据,用图数据库技术构建了“政策指标关联图谱”和“处罚指标关联图谱”,并在此基础上完成了“监管要素主图”和“监管要素子图”的建设。
“一表通”数据集市通过对监管机构下发的文件进行分析,解读出文件条文对应的指标,在数据层构建“政策指标关联图谱”,报送人员可通过应用层的“政策指标视图”直观查看监管条文与监管指标之间的关联;同时,研究分析处罚文书,在数据层构建“处罚指标关联图谱”,报送人员可以通过应用层的“罚单指标视图”直观查看罚单与监管指标之间的关联,提高监管报送的质量,降低银行遭到处罚的可能性。“政策指标关联图谱”和“处罚指标关联图谱”也是监管质量归因分析的基础。目前,“一表通”数据集市已梳理出906条政策指标关联和42610条处罚指标关联。在此基础上,某银行可依据“政策指标关联子图”分析出政策变化涉及的指标及其涉及的其他政策和处罚案例,快速制定数据转换策略,并通过“转换数据配置”和“转换规则配置”快速适应报送制度的升级。
在监管“一表通”的应用上使用的“探易问道”大模型,是国内率先针对监管一表通研发的大模型,在“探易问道”强大的搜索和分析能力加持下,通过人机交互,直接联网获取最新政策要求和处罚公告并提取关键政策和处罚数据项,再通过专家经验和机器学习生成监管自动归因模型,得出归因结论,之后由专家和大模型协同生成归因分析报告,不仅能快速高效地响应监管要求,还能生成结合提问场景的报告,形成监管知识库,有效提升业务管理与运营的合规性和效率。目前,各方也正着手将“政策指标关联子图”和“处罚指标关联子图”的数据,用于“金融监管语料库”的模型训练,以提高“一表通”数据集市的智能化程度,减少报送系统升级的时间和成本(见图6)。
“一表通”的建设意义与未来展望
从国家持续加大对金融监管力度的政策动向来看,报送制度的升级已是常态,且频率逐渐加快。一方面,监管部门对金融机构是否保质保量地完成各项监管要求进行有效监督,另一方面,监管机构也将在跨机构甚至跨区域范围内通过数据关联和计算,发现集团化、体系化的金融风险。可以预见,监管部门还将持续升级完善监管报送数据内容,监管报送系统也需要不断适应最新的金融发展要求和金融监管规则。
同时可以看到,在金融IT的发展实践过程中,国内金融机构通过过去几十年的建设已基本完成业务数据化的过程,但数据业务化的过程却还处于起步阶段,“一表通”数据集市通过对金融机构数字化转型过程的持续深度参与,将对推动该阶段的进程发挥积极作用。未来,“数据要素图谱”“数据资产区”和大模型语料库的内容将不断丰富完善,监管明细区和监管指标区的数据也逐步上升到企业级层面,通过银行上下游数据的图谱关联,达到数据在业务场景中的穿透应用,可以构建诸如企业运营/盈利/偿债能力、基于指标图谱的归因分析与决策、流动性风险全流程监控、资金流动性缺口情况预测等直接体现数据价值的业务模型,真正实现“数据业务化”,助力银行完成数字化转型。
对金融机构自身来说,更重要的是在进行监管智能化建设的同时,秉持操守、规范行为,又快又好地落实各项政策法规,构建更加标准化、精准化的合规治理流程,确保有序推进各项业务,做到长期稳定的合规运营,从而满足市场需求,推动金融业的发展,维护国家经济安全和社会稳定,同时也为中国银行业未来在国际舞台上发挥重要作用打下基础。
结 语
在新形势下,商业银行要想建立核心竞争优势,保持持续发展,还需要调整自身发展战略,紧跟时代与科技发展趋势,不断完善技术及产品创新机制,建立高效完整的数据体系,在确保业务发展与合规经营之间平衡的同时,进一步提升专业能力,快速响应市场需求,实现银行高质量、可持续的发展。
“一表通”数据集市的建立,在帮助金融机构建立自身竞争优势的同时,也在打通各个金融机构数据壁垒、统一监管标准上具有重大意义,不仅能为金融创新提供便利和支持,促进金融机构提高服务质量和效率,维护国内金融体系健康稳定运行,也有望为将来我国银行在国际贸易中的跨国合作,推动全球金融市场的稳定和健康发展提供坚实的数据基础。
* 部分图片来源:《银行家》2024年7月刊