金融研究

充分发掘数据价值
发布日期:2017-01-22


一、数据价值和应用级别简介

数据无处不在,充斥于日常生活当中,随着信息化时代的到来,数据已成为企业的一项重要资产。当前,企业级数据应用级别主要有大数据、数据仓库和操作型数据库,其原理都是通过对数据的收集、整合、挖掘、预测,为使用人提供服务。其中数据库和数据仓库偏重数据存储方式,而当前最为流行的大数据处理则注重解决需求,基于该项特征,其价值密度也最低。

目前一般银行对数据的使用还主要集中在数据仓库层面,对大数据的应用基本还在理念+探索阶段,主要原因还是数据源限制、技术成熟性,以及大数据的投资巨大、价值密度较低等原因。而数据仓库因为技术和平台已较为成熟,开发应用则较为广泛。

二、我行数据使用现状

我行数据日常管理使用数据仓库为主、手工管理为辅。对大部分已结构化的数据,使用时都可通过数据仓库完成数据的分析重组和导出,部分未录入系统的数据仍以手工方式整理。数据仓库的源数据主要来自省联社数据下发平台,当前已接入的源表共726张。前端,在数据仓库基础上完成固化开发的报表有240张。这些数据仓库中报表和数据用于以下日常业务:

1.监管信息报送

监管信息报送主要是向银监会、人民银行、政府等机构报送用于日常监督管理数据,其中包括银监推动的1104工程和EAST系统。目前系统自动生成的数量占日常需要报送的报表总量比率较小,部分临时性报送用的报表,都要根据需求由后台手工生成导出。

2.经营分析

当前在数据仓库上固化开发的大多数报表,都用于各业务部门的经营、分析决策。其中,报表按数据域分,分为存款、贷款、卡业务、中间业务、结算业务、国际业务、资金业务、财务等;按管理条线分,分为财务会计、电子银行、个私业务、公司业务、风险合规、审计、国际业务、金融同业、OCR、经营机构等。报表的分类和设计还需进一步细化。

3.风险挖掘

数据仓库专门用于风险挖掘的报表不多,目前12个专项风险报表,主要用于监控贷款到期、逾期情况。而在外围系统中,包括审计、OCR风险预警系统中都有专门的风险模型,通过自动或手工方式运行来监测风险数据。

4.为其他系统供数

目前数据仓库系统还为管理会计系统、客户经理绩效考核系统提供源数据和经过预处理的过程数据。

三、有待挖掘的数据价值领域

淘宝团队利用自己掌握的数据,为全国互联网消费者建立了完整的信用体系。这种大数据模式,我们是否也能借鉴?跟互联网行业不同,金融行业的数据来源相对单一,应从现有类型的数据出发,充分挖掘数据中的价值。

1.区域客户画像

相对于其他企业,银行业的数据集中性强,可利用性也较强。特别是区域性业务比重较大的农商银行,可尝试设计这样一个模型:从多项已掌握的数据中汇总融合个人、企业的交易特征,为每个客户进行信用画像,并通过数据的补充分析,逐步让画像越来越清晰。如通过中间业务平台代发工资交易数据的分析可以获取企业的员工规模、个人(员工)的工作单位、个人(员工)的主业收入情况、个人(员工)收入主要来源卡号等多个信息点。如通过对企业的交易明细的分析,可以获取企业相关产业链的上下游关系或与之相关的关联企业、企业的财务销售信息、业务淡旺季情况等信息。利用逐步完整的客户画像,建立客户信息标签,可应用于微贷、信用卡、贷款客户信息综合预审,以及金融需求走访、电子产品营销等多个业务方面。

2.风险导向建模

利用掌握的数据,业务部门可关联自身业务特点,可设计有针对性的风险导向模型,通过数据变化监测客户动态变化信息,如监测代发工资业务、水电费波动情况分析企业的开停工状态,如分析企业交易流水,同时关联企业账户和贷款余额情况,通过借助数据信息分析判断企业的经营状态变化情况等,从而及早发现风险苗头。

3.开展精准营销

利用掌握的数据,还可以进行金融创新尝试,如通过收集的用户信息,分析用户消费金融产品的偏好、营销的空白点或潜在的需求,并针对不同的用户,提供定制化、个性化的产品,联动邮件、短信、微信等渠道准确推送信息服务,还可供柜员、大堂经理、客户经理查询,以有针对性地开展主动营销。

四、发挥数据资源的最大价值

1.加强数据治理

数据治理的目的是确保银行经营层方便、安全、快速、可靠地利用数据开展经营分析和参考决策。当前我行主要业务数据由省联社提供,并且数据治理工作也大都由省联社统一完成。但部分数据,主要是支行报送至总行,或由业务部门单独报送至银监等管理部门的,很多还为手工整理,无法通过系统自动生成导出。如在周期性上报的53张报表中,只有18张能自动生成导出,主要原因是数据未完整结构化和部分录入至业务系统中的数据不准确。需要科技与业务部门共同协作,对数据源做统一规划,把信息一次性准确录入或标注至数据仓库中,解决报表数据源不完整、不准确、无法开发利用的问题。

2.规划数据报表

当前,部分报表需求只满足一次性数据提取需要,缺乏前瞻性和综合性,虽然已开发完成的报表很多,但很多日常数据报表还需要手工处理。主要原因一是设计的报表字段不全或分散于多张报表,无法直接导出使用;二是报表数据固化,无法应对业务变化需求。因此,业务部门需要综合考虑日常所需的数据,联合科技统一规划整合,设计生成覆盖信息较为全面并且查询条件可灵活变化的报表。

3.整合优化数据源

我行数据仓库集中了省联社下发的各个业务系统数据,可以进一步扩充数据源,把部署于本地的计算机应用系统、重要系统的重要表单接入数据仓库中,通过数据整合,解决不同系统信息不共享的问题。如浙江农信大信贷平台和我行自建的信贷风险管理平台数据无法在前台实现共享共用,但可以在日终通过数据仓库整合数据,方便后续报表的开发和数据挖掘使用。

数据中蕴含的规律和价值通常不直观,需要深度挖掘才能转化为效益。只有各管理部门发挥特长,从各自业务领域出发,与科技部门协手合作,才能充分发掘数据隐含的巨大价值,为我行的业务发展提供更加有力的支撑。

(科技部  范里)