高新民副理事长:信息开放不等于数据开放 数据开放促进社会化增值
中国互联网协会副理事长高新民发表主题演讲
以下是文字实录:
国信办和我们宣传部门在03年起草了一个中央34号文件。34号文件的题目是关于加强信息资源开发利用。这个文件当初国信办的专家被邀请参加起草后,不仅对国际上和国内的一些理论和法律问题,做了一些非常深入的调研,其中还专门到欧洲、欧盟进行访问考察。当时欧盟正在起草"信息再利用"指令,后来在03年欧盟的议会上年底通过。到现在为止,欧盟仍在利用在这个指令在做事,去年我到欧洲去的时候,很多欧盟国家还在用这个指令。
34号文件里面开门的第一句话是这么说的,信息资源作为生产要素、无形资产和社会财富,与能源、材料资源同等重要,在经济社会资源结构中具有不可替代的地位,已成为经济全球化背景下国际竞争的一个重点。
这是当时03年起草的中央文件,第一段话就是这么说的。尽管现在信息资源不是都是大的,小的信息资源也是有的,而且大数据实际上也不是越大越好,而是越有用越有价值越好,不管它大,还是中,还是小。
2014年2月习总书记在中央网络安全和信息化大会上讲过一段话,信息资源日益成为重要生产要素和社会财富,信息掌握的多寡成为国家软实力和竞争力的重要标志。这段话讲的还是非常工整,非常精要的。
奥巴马曾讲过:"未来数据将会如土地、石油和资本一样,成为经济运行的根本性资源。"但是,任何存在变为资源必须有两个条件:一是有技术手段。过去大数据也是客观存在的,但是没有技术手段作用它。互联网在没有大数据产生之后,这样的话是实现不了的。另外它本身成为资源产生之后,要能够被包装,被利用,能够成为需求的导向,产生价值。大数据发展目前必须具备这些条件,像维基百科里面定义的,大数据就是原来技术,处理的技术,分析的技术,成熟的技术。处理不了的,或者说有限时间内、一定时间范围内,无限时间范围内处理不了的数据,也叫大数据。
大数据的挑战离不开标准化建设和技术发展
我认为大数据要从资源、观念、技术、价值这四个方面来全面认识。从观念上来说,我认为最重要的对大数据的认识,就是信息的资源确实要去用像资产这样,能够产生价值的资产这样去管理,去认识。而且能够利用大数据的规律或者技术,来改变目前我们认知事务的方法。
其实数据不仅仅是产生,特别是大数据,在产生当中,在互联网上的整改,尤其像物联网的整改,是一个增长的过程。但是更重要的是分解,其实大数据的存储、处理、管理和分析的技术是最关键的。现在分析有描述性分析、有预知性分析、还有指导性分析等好几种分析。描述性分析就是把事物中大数据它是事实的,就是说我们在做公共营销,分析网络用户习惯、搜索习惯。现在大家在网上买东西,不管是在京东也好,淘宝也好,都会给你发过来,就是你关心过什么事,实际上你买都没买,只要你关心过,你了解过,比如你想买好看的衣服,什么颜色,这就是精准销售的苗头,就是用数据分析这类描述性的东西。当然涉及到某些预测,就像我们现在在讲北京雾霾,APEC开会天蓝不蓝,污染严重还是不严重,都涉及到数据分析。
现在我们对大数据的挑战,不是说技术还没发展而是数据汇聚。数据汇聚的两种机制,一种是共享机制,一种是标准机制,没有这两种机制,数据是没有办法汇聚的。当然还有标准,数据的标准有很多。在未来由于标准而标准化和技术的发展,使这个大数据和数据开发,所以最近这几年,利用数据技术在大数据领域经常遇着最最现实的问题,使得大数据技术能够替普通百姓来预测,如预测可能性疾病的发生。但是这个前提是什么,是数据要汇聚。汇聚要有共享和交流机制,共享和交流机制怎么来产生呢,数据怎么来汇聚呢,这本身就需要管理。这个管理就是我们说的信息资源的资产化管理。
信息的资产化管理是指使资源变成资产,就是有价值的东西。信息资源作为资产管理,到底有些什么问题。目前首先说信息资源基本特征,信息资源既是商品又有公共品特性,尤其是在互联网背景下,要力求信息资源在市场化、商品化和信息资源公共和共享之间找到一个平衡。过度的商品化也不对,但是完全不讲商品化也不对。这里面包括政府的信息资源,要注意生产化不等于商品化,没有资产化汇聚,也很难说。所以这里面的原因,就是要保护资源开发者的积极性,同时要有利于社会共享,发挥数据的价值。
信息首先是资源,那怎么变成资产?资产需要有3个条件,包括有形资产、无形资产都在内的。首先它有特定的主体拥有或控制,拥有主权或者说是控制权,第二个是它能为拥有者带来经济效应,是有价值的,第三它通过交易或服务能实现它的价值。
无形资产的属性,第一个它是无形的,没有实体形态,但是没有实体形态的资产,货币,电子货币,是非货币的。第二个它虽然没有实体形态,但是又要有辨识性,要有边际。它有辨识性,可以被分离和出售、转让、许可、租赁或者交换。控制主体和经济效益,就像刚才讲的资产是完全一样的。
信息资源作为无形资产,它的特殊性主要表现在:第一,有相对高的初始投资,就是第一次使用的东西,成本比较高。但是接下来通过复制资产,它的成本比较低。第二个它不会有消耗,它使用的边际成本相对比较低。第三个是供应方规模经济,生产得越多,用得人越多,效益越好。另外,它是可以多个人,多个流程共同使用的,就是可以共享的。还有它是不能完全替代的,在你可辨识性里面,如果把这个产品,把这个信息资源建立起来,这是可辨识性里面的效益,还有的就是网络效应,随着使用它的人增加,资产的价值也会增加。
信息开放不等于数据开放
其实整个信息资源可以分为以下几类,和政府相关的叫做政务信息资源,涉及公益的叫做公益性信息服务,还有就是商业化信息服务。这三块实际上里面可以互相转换的,政府信息化开放以后,与商业相结合,就变成商业化的东西。
那么政府信息资源这一块,我们当时分成四类:一类叫做机构内部自用信息,第二类是政府内部部门之间的共享信息;第三类是政府法定公开信息;第四类数据开放。现在政府把信息开放和数据开放混为一体,我认为这个不是很合理。我们在34号文件里面就完全不是这么写的。后来国务院曾经发布过一个叫信息公开条例,当时征求意见的时候,我还提过一个建议,"它没有非常地清晰明确信息公开和社会化政治开放率的关系",因为34号文件在它之后,普通公开和依申请公开,依申请公开和数据开放是由交叉的,这就是我们说的四个方面。
下面再说中央34号文件,对具有经济和社会价值、允许加工利用的政务信息资源(前面有两个定义,有价值的,再一个它是允许的),应鼓励社会力量进行增值开发利用。有关部门要按照公平、公正、公开的原则,制定政策措施和管理办法,授权申请者使用相关政务信息资源,规范政务信息资源使用行为和社会化增值开发利用工作。这是34号文件专门提出来的,这一条也是我们当时考察研究非常有感悟的一点。现在看看,这对开放数据仍然是有针对性的。
其实,开放数据也就可以等于社会化增值开发利用也等于政务信息资源再利用。那么这里面为什么要区分政务信息开放和开放数据呢,信息公开和开放数据要如何区分。区分的原则是什么,意思就是说,信息公开是政府的,是政府提供的,而政府开放数据的主体是社会,而且政府是根据需求,你是一部分的信息,当社会上有这样的需求的时候,可以申请。但是开放数据这一块,是根据社会上的需求以及除了与政府工作内容保密无关的,一般的都应该开放。
我刚提到在欧盟2003年年底通过的政府公共信息资源再利用这个指令规定,"政府的开放数据作为默认,不是战争情况下,是必须要开放的。"
数据开放促进社会化增值
社会化增值开发利用概念的界定,政府以外主体可以是个人、企业或社会其他;再利用的目的可以是商业性目的或者是公益性目的;可以是直接传播,也可以是增值加工后,形成更有使用价值或更容易使用的信息产品。这就是增值开发的概念。政府信息资源社会化增值开发利用和政府信息公开是既有联系又有区别的一个范畴。两者在信息利用主体、目的和运作机制等方面是有差别的。
目前讲的数据开放和当时讲的社会化增值开发利用我们认为有这些意义,第一个就是反过来有利于促进政务信息公开;第二个就是促进社会信息共享和信息增值;第三个就是有利于支持发展信息内容产业;还有一个就是增强企业的竞争力,促进经济增长质量;最后就是提高电子政务的实效,促进法治、透明,提高政府效率。
最后我们讲要资产化管理,目前为什么要提高资产化管理,因为只有资产化管理才能真正促进生产。财政部在做一个项目,钱都是由财政部出,去买一个汽车,甚至是买一个桌椅板凳都要资产确认登记,都有一个账户,板凳坏了扔掉都要登记,我们现在讲计算机存储,现在出来软件,但唯一是信息资源为什么不能做,怎么管理,怎么建设,怎么估价。很多东西没有,即使有容灾,有备份,整个公司垮掉以后,这些公司都归为0。这个问题在美国引起了非常大的重视。所以为什么最近几年对资产化管理非常重视,就是从那时候开始,从一个企业资产负债表里面,怎么能够在资本这一栏评价他们拥有的信息,怎么估价,怎么交易。当他们确定以后,如果是政府,它也有这样的设定,加上本身的管理,想法,是资产化管理。实际上这些问题到现在为止,我们当时提的10个基础问题,我今天就念下题目,可以和大家说,很遗憾,尽管我们现在有大数据交流中心、交流平台,但是这些问题到现在为止仍然没有明确的边界,形成规范,仍然有待于我们解决问题。
首先是政府这一块,政府信息资源管理机构,政府管理机构的主体是谁,是财政部门还是信息保障部门,这个不是很清楚;第二政府信息资源开发的预算,这个问题也不是很清晰;第三政府信息增值利用的主体和客体,怎么来界定,谁有权作为它的主体,而且主客体又不是完全绝对的;另一个是政府信息增值利用目录体系,这个目录体系和我们现在讲的数据目录不一样,他们不完全一样,因为它里面有明确的资产变动,有可识别的边际和估价潜在的产生效应、评估等等;还有就是定价原则,即使是政府数据公开也不是完全不能定价的,上次做十三五规划,你拿数据用政府可以收费;还有是政府信息化收费标准及管理,是不是有两条线;政府信息服务的税收;中介机构,机构的标准机制等怎么界定;政府信息资源开发利用工作的监督,怎么监管;最后就是政府信息增值服务中的保密性和开放性。由于时间的关系不一一展开,我认为这10个问题还是值得进一步研究的。