登录 注册 下载

李礼辉:大数据技术与普惠金融

954 views

0

本文基于信用建设的根本,分析了大数据的本质含义,指出中国金融业在大数据使用方面存在的问题与短板,认为解决问题既要有技术措施,更需要有体制保障,并建议金融业大数据应用应实现可控、可信、可靠,运用大数据技术解决信息不对称的问题,让市场变得透明,通过共建、共享、共管的可行路线,促进普惠金融发展。

信用是金融的根基,信用普及是普惠金融的前提,如何应用大数据技术,实现信用普及,实现信用增值,从而推进金融转型升级,发展普惠金融,是一个重要的课题。

市场经济环境下的信用建立在契约原则的基础上。信用形成的传统模式是基于共同的规则,通过可信任的中央节点验证信息、执行规则、积累信任。这种模式具有明显的局限性,由于信任需要积累,因而信用的建立需要较长的周期,信用形成的成本高;且由于必须经过可信任的中央节点,小范围的社会行为或经济行为难以成为被普遍认可的信用记录,信用可及的范围小。然而在现有的技术环境下,信息不对称比比皆是,市场主体之间的信息不对称,政府与市场之间的信息不对称,这就容易产生数据造假、信息造假、信用造假的问题,进一步损害了信用环境,扭曲了信用的社会价值和商业价值。可以说,多少年以来一直存在,又一直难以解决的融资难、融资贵问题,制度性的原因在于信用形成的模式,技术性的原因则在于信息不对称。信用形成的传统模式加上信息不对称,在很大程度上造成信用狭窄、信用封闭,小微企业的大部分金融需求因信用不够普及而无法得到满足,这是中国的痛点。随着金融科技的飞速发展,互联网企业引领的大数据技术应用为解决这个痛点提供了可行选择,即利用大数据技术创造信用、普及信用,在发掘普罗大众的信用价值的同时提升企业自身的价值。

那么,什么是大数据?

现代社会每时每刻都在产生海量信息,当信息以数字形式被收集和记录时,就形成数据。然而,并非所有的数据都是大数据。IBM早就提出大数据的5V特点:Volume大量,Velocity高速,Variety多样性,Value价值,Veracity真实性。作为全球最有影响力的科技巨头,IBM对大数据显然侧重于技术性解读,而且难得凑够了5个V打头的有意义的英文词汇。从金融的视角来分析,大数据的如下一些特征也许更加重要。

一是具体的真实性。数据来自具体的主体:可以是个人,也可以是家庭;可以是企业,也可以是行业;可以是金融机构,也可以是政府部门。数据来自真实的行为:可以是商品交易,也可以是金融服务;可以是劳动就业,也可以是薪酬福利;可以是法定税收,也可以是行政收费。

二是足够的延展性。数据具有时间空间两个维度足够的延展性,才可能具备统计学的意义。无论是时间维度还是空间维度,必要的数据长度和密度一般与数据主体的规格正相关。如果是个人或家庭,只要有12个月以上并具备一定密度的数据,就能揭示个人及家庭的消费倾向和支付能力;如果是大大小小的企业以及个体经营者,那就需要按经营范围、服务对象区分的数据集合,才能分析和比较不同企业的市场竞争力和盈利能力;如果是特定类别的产品或行业,那就可能需要一整个经济周期甚至更长时间的数据,才能准确反映特定产品、特定行业的市场需求和生命周期变化趋势。

三是可靠的一致性。数据的一致性要求,与数据的应用范围正相关。金融场景数据应用的范围通常更大,对数据的一致性质量要求更高,对数据的可靠性、安全性要求也更高。在一定的数据应用范围内,数据采集的标准和方法必须一致,数据存储的结构和路径也必须一致。当然,一个企业、一个社区的数据,如果不打算纳入更大范围的数据应用,完全可以自立门户、自定标准,但那就未必能够成为大数据。

可以说,具体的真实性、足够的延展性、可靠的一致性决定了数据的品质。建立以数据为基础的信用体系,必须有信得过、靠得住、用得上的数据。但目前中国大数据技术深度应用所需的技术环境、法律环境都有待完善。应用大数据技术促进信用普及,推进金融业转型升级,还必须解决当前存在的一些问题。

一是一致性不足,数据不够大。据波士顿咨询公司测算的信用体系的覆盖率,美国高达92%,而中国大约只有35%。直接的原因在于信用数据不一致,征信系统不一致。在中国,涉及营利法人的信用数据,分散在银行、工商行政管理、税务、海关等不同部门的征信系统中,标准不尽相同,口径不尽相同。上市企业信息披露要求严格,财务透明度较高,容易建立信用。但大多数小微企业和个体经营者的商业行为记录湮没在市场的海洋里,没有信用标记,无法积累信用,也就不能产生信用的价值。对于小微企业和个体经营者来说,这是与生俱来的缺陷;对于市场经济和商业社会来说,这就是经济制度的缺陷。

二是可靠性不足,数据不够安全。信息可以区分为共享信息、专有信息、私密信息。共享信息的价值在于真实,必须维护其权威性;专有信息的价值在于归属,必须维护其知识产权;私密信息的价值在于可靠,必须维护其安全。但在目前的数据结构下,往往难以证明共享信息的真伪,难以确认专有信息的所有权,难以保护私密信息的安全。“e租宝”伪造共享信息,以假项目、假承租、假担保手段非法集资700多亿元。网络诈骗盗用个人私密信息,将黑手伸向老人、病人、学生。数据信息可靠性不足、安全性偏低,消耗信任,消耗信用,在很大程度上影响了普惠金融的发展。

三是合规性不足,法律不够完善。大数据技术正在将越来越多的信息,包括个人信息、法人信息,纳入各式各样的数据库,与此同时个人信息滥用屡禁不止,包括过度收集个人信息,擅自披露个人信息,甚至非法买卖个人信息,这引起了人们对于隐私保护的深切担忧,也影响了人们对大数据技术应用的信心。值得高兴的是,有关个人信息保护的法律建设有了新进展。2017年6月起施行的《网络安全法》规定:“网络产品、服务具有收集用户信息功能的,其提供者应当向用户明示并取得同意;网络运营者不得泄露、篡改、毁损其收集的个人信息;未经被收集者同意,不得向他人提供个人信息。”将于2017年10月起施行的《民法总则》明确“自然人的个人信息受法律保护,规定任何组织和个人需要获取他人个人信息的,应当依法取得并确保信息安全,不得非法收集、使用、加工、传输他人个人信息,不得非法买卖、提供或者公开他人个人信息。”这些新的法律条文有的放矢,十分重要,不过落实到位还需要一个过程,且一些具体的法律规范仍需要进一步明确。例如,互联网电商平台、移动通信运营商、连锁商场连锁超市连锁酒店、品牌房地产商和物业管理企业、航空公司高铁公司物流公司、学校医院等等都拥有大量的个人信息数据。对于个人信息的商业利用,包括利用这些数据库的个人信息进行信用分级并用于金融服务,进行消费倾向分析并用于商业营销,是否应当事先得到个人信息主体许可,应有必要制定明确的法律规范。

解决上述问题,需要有技术措施,更需要有体制保障;需要有市场主体的创新行动,更需要有政府的政策扶持。充分应用大数据技术,扩大信用体系覆盖面,推进信用普及,发展普惠金融,需要做的事情很多,应该抓住重点,统筹行动,持之以恒,务求实效。

可控可信可靠,成就大数据

并非所有的数据信息都可以采集和记录,也并非所有的数据都具备应用的价值。数据的采集、记录和应用必须遵循基本的准则,这就是可控、可信、可靠。

首先,数据采集、记录和应用应当依法合规,有效管控。要加快法律建设,完善数据采集、记录和应用的法律法规。对商业应用的数据信息,应制定明确的规范,限定应用范围,防止企业和个人的私密信息被滥用。在信用信息系统中,只应允许采集有效的、必要的、与信用评价相关的各维度的用户数据。涉及个人隐私的数据信息,包括家庭住址、行动轨迹、电子信件、朋友圈等,即使是国家权力机构,也只能在法定范围内调取和使用。任何机构、任何企业、任何个人都不能侵犯个人隐私,都负有保护个人隐私的责任,都不能将涉及个人隐私的数据信息用于商业目的,用于商业性质的行为分析和信用评价。对泄露、出售、盗用私密信息、侵犯个人隐私的犯罪行为,必须依法严厉惩处,如果确认这类行为与诈骗案有关联,则应按照金融诈骗罪、诈骗罪对犯罪嫌疑人定罪量刑。

其次,应该建立数据运营商、数据库准入门槛,严格进行资格核准和行为监管。数据运营商、数据库必须依法制定具体的筛选标准、取舍规则和操作流程,执行到位,管控到位,切实保护数据信息主体的权益。

再次,数据采集、记录和应用应当采用先进的技术,防止数据失真,提高数据质量,保证数据的可信度。原始数据源包含大量低质量信息,需要正确判断、正确选择,建立过滤标准,采取正确的技术手段,过滤无效数据和干扰数据。

另外,值得注意的是,数据安全和数据系统可靠性是大数据技术应用的底线。数据系统不可靠,不仅可能损害数据信息主体的权益,而且可能危害国家的信息安全。数据安全保障应该依托安全可靠的操作系统,应该覆盖从数据源头采集到数据存储、数据应用的全过程、各环节,应该建立具体的制度、流程和规范。任何数据库都可能面临数据攻击,要重新审视安全定义,确保数据安全。一是应该发展我国自主可控的操作系统,改变计算机桌面操作系统普遍采用Windows的格局。二是安全技术和制度应该与时俱进,适应新的数据技术环境。随着技术创新发展,数据存储越来越多地采取分布式、“数据云”的结构,数据世界不再只是单一中心的计算机系统和网络,而是多元复合的结构体系。新技术势必带来新风险,成功运用于传统的大集中数据库的安全技术和管理制度,未必能够适应新的数据世界。应该抓紧研究,采取有效的技术手段和管控措施,维护数据安全。应该积极尝试利用新技术加强数据信息保护。例如利用区块链的非对称加密技术、时间戳功能保护数据信息的私密性和完整性。

共建共享共管,成就大信用

唯有大数据,才有大信用。运用大数据技术解决信息不对称的问题,可以让市场变得透明,普遍降低信用成本。一般来说,数据覆盖面越广、一致性越高,数据应用的范围就越大,数据创造的价值也越大。建立具有高度一致性、可靠性的大数据、大信用系统,可行的路径是共建、共享、共管。

在国家层级,重点是统筹规划大数据基础设施建设,加快政府数据资源整合,实现政府数据统一,推进公共数据资源开放共享。有必要对分散的、自成体系的政府部门数据系统进行整合,实现关键领域的数据统一。例如,应该建立标准统一的金融统计制度,建立集中统一的金融数据库,建立互联共享的金融数据应用系统,实现金融“一本账”,形成能够支持金融宏观审慎监管、微观审慎监管和综合监管的基础设施。又如,整合银行、工商行政管理、税务、海关等部门的征信系统,共建全国统一的中小微企业征信系统,采取统一标准和口径,收集中小微企业的金融业务、工商登记、税费缴纳、国际贸易、市场诚信等信息,积累信用记录,给予信用标记,促进中小微企业信用增值。国家也应该促进企业层级数据资源的整合。

市场层面,市场主体应按照共建共享、互惠互利的原则进行整合。通过整合,一方面扩大数据的覆盖面,达成数据的一致性,提升数据库的可靠性和安全性,提升数据应用的价值;另一方面,形成以数据资源共享为支撑的供应链和信用链,降低链内交易成本,促进信用的普及,提升信用的价值。企业自身应该加强数据管理,通过有效的数据管理提升企业核心竞争力和市场信用度,从战略规划设计到战略执行评价,从投入产出测算到经营效益分析,从市场需求调查到产品服务升级换代,都可以应用大数据技术。

与此同时,必须构建市场参与者共同管理、共同维护市场信用的格局,联合抵制数据造假、信息造假、信用造假,共同创造良好信用环境,提升信用的社会价值和商业价值。对守信者给予鼓励,对失信者给予惩戒。例如,在融资金额及利率、信用担保及保证金、商品定价及手续费等方面给予守信者优惠,体现信用的价值。

2017年贵阳数博会上BAT齐聚一堂,就“未来的时代什么最重要”这一话题,马云、李彦宏、马化腾每人给了一个答案。马云认为未来一切产品将数据化,数据最重要,如果离开了数据,任何组织的创新都基本上是空壳。李彦宏认为,数据不是根本,真正推动时代进步的是技术创新。马化腾提出,“场景”是最重要的要素,有了应用场景就有了市场,数据自然会产生,也会驱动技术发展。这里的关键词是“数据”“技术创新”“应用场景”,把这三个关键词用于金融业,那就是:持续推进技术创新,深化金融场景大数据技术应用,从而实现信用普及,驱动金融业转型升级,促进惠普金融发展。这也是大家共同期待的愿景。

(李礼辉为全国人大财经委员会委员、中国互联网金融协会金融科技发展与研究工作组总顾问、中国银行前行长。本文编辑/王蕾)

分享到:0
^
激活兑换码
关闭
请输入您的兑换码:
姓名:
单位:
职位:
邮箱:
手机号:
地址:
验证码:
激活
提示:
1、您的订阅周期将从兑换码被激活的当日开始计算。
2、同时激活多个兑换码,订阅期限会自动向后叠加。
3、如果您不想立即使用兑换码,可以在稍后任意时间激活,订阅码可赠予他人,但只能激活一次。
4、兑换码激活后,所绑定的授权用户仅限一人使用,不可多人分享账号。若发现违规使用,官方将做销号处理。