【中国信息通信研究院总工程师敖立】:尊敬的郭锡文副省长、梅宏院士,尊敬的各位领导、各位来宾、各位朋友们,大家上午好!非常高兴在这万木峥嵘、绿意盎然、生机勃发的美好季节,我们如期相约在“爽爽的”贵阳,共同迎来2023数博会“数据要素流通与价值化论坛”的召开,我谨代表中国信息通信研究院,对各位领导和嘉宾的到来,表示热烈的欢迎!
去年12月底,中共中央、国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》,提出了构建数据产权、流通交易、收益分配、安全治理等制度,共计20条政策措施,初步形成了我国数据基础制度的“四梁八柱”。此次“数据二十条”的出台,标志着我国数据要素市场进入规范性探索阶段,数据要素市场有望迎来井喷式发展。
在数字经济时代,数据已经成为重要生产要素。通过数据的流通与应用,企业可以更好地发挥自身优势,提升自身竞争力,实现更大价值。但是,在实践中,数据的流通面临数据隐私、数据安全、数据质量等多方面的挑战。在本论坛中,我们有幸邀请了多位业内专家来分享他们在数据要素流通和价值化方面的经验和见解。同时,我们也希望通过本论坛,能够搭建一个交流平台,为推动数据要素市场建设提供更多的思路和方案。
下面,我来介绍出席本次大会的重要领导和嘉宾。
他们是:
贵州省人民政府副省长郭锡文先生
中国科学院院士、中国计算机学会理事长梅宏先生
海南省大数据管理局局长董学耕先生
中国社会科学院数量经济与技术经济研究所党委书记李海舰先生
贵州省大数据发展管理局局长景亚萍女士
广东省政务服务数据管理局副局长熊雄先生
浙江省大数据发展管理局副局长蒋汝忠先生
四川省大数据中心副主任何雨先生
参加本次大会的还有:
贵州省司法厅副厅长胡勇女士
贵州贵安新区党工委委员、管委会副主任许谦先生
清华大学社会科学学院经济学研究所所长汤珂先生
数字中国研究院副院长宋志刚先生
中国移动通信有限公司研究院副院长魏晨光女士
贵州移动副总经理李伟先生
北京零点有数数据科技股份有限公司董事长袁岳先生
北京思特奇信息技术股份有限公司董事长吴飞舟先生
奇安信集团副总裁罗海龙先生
华为公司数据总架构师马运先生
贵州数据宝网络科技有限公司董事长汤寒林先生
福建省大数据集团副董事长陈荣辉先生
福建大数据交易有限公司董事长徐晓清先生
广州数据交易所有限公司总经理魏东先生
豫信电子科技集团总经理何航校先生
因时间关系,其他嘉宾我就不一一介绍,让我们再次以热烈的掌声,欢迎各位领导和嘉宾的到来!
下面,首先有请贵州省人民政府副省长郭锡文先生致辞,有请郭省长,大家欢迎!
【贵州省人民政府副省长郭锡文】:尊敬的梅宏院士,各位来宾,女士们,先生们,大家上午好!值此2023数博会召开之际,我们相聚多彩贵州,爽爽贵阳,相约数据要素流通与价值化高端对话,共享数据价值,共商合作发展,共谋数字未来。在此,我谨代表贵州省人民政府向各位嘉宾的到来表示热烈欢迎,向大家长期以来对贵州经济社会,特别是大数据事业发展的关心支持表示衷心地感谢!
数据是数据经济的基础和核心要素,国家明确把数据与土地、劳动、资本、技术等要素一起列为生产要素。当前以数据要素为驱动的数字经济正加速演进,激活数据要素潜能已经成为做大做强数字经济的新动能,成为推动经济社会高质量发展的新引擎。近年来,贵州省深入贯彻落实习总书记在实施数据经济战略上抢新机的指示要求,全力推进国家大数据综合试验区和数字经济发展创新区建设,大胆探索,先行先试,持续深化数据要素市场配置改革,推进数据价值释放。
一是创新组织管理模式。组建贵州省数据流通交易服务中心,重组贵阳大数据交易所,构建“一中心+一公司”的新体系构架。
二是搭建流通交易平台。建成全省统一的数据流通交易平台,为市场主体提供低成本、高效率、可信赖的流通交易环境。
三是培育产业发展生态。培育了600多家行业性产业化数据商和一批第三方数据中介机构,为数据交易双方提供数据产品开发、发布、承销和数据资产合规化、标准化、政治化的服务。
四是完善相关制度规则。率先开通数据流通交易地方探索,制定数据流通交易管理办法,发布全国首套数据流通交易规则体系。近年来,贵阳大数据交易所的交易额已经超过10亿元。
各位来宾,各位朋友,随着高质量发展成为时代主题,以数据为关键要素的数字经济迎来新的时代机遇,我们将加速推进政用、商用、民用数据共享、流通、开放,加快构建产权制度完善,流通交易规范,数据供给有序,市场主体活跃,激励政策有效,安全治理有力的数据要素市场体系,着力打造国家数据生产要素流通核心枢纽,充分释放数据要素潜能,助推数字经济高质量发展。
热诚欢迎广大企业家和各界朋友到贵州投资兴业,深挖数据钻石矿,共拓数据新蓝海,我们将用心用情做好服务,让大家在贵州投资放心,创业顺心,发展放心,生活舒心,最后预祝本次论坛取得圆满成功,祝各位来宾身体健康,工作顺利,谢谢!
【中国信息通信研究院总工程师敖立】:感谢郭省长的精彩致辞。接下来是主旨演讲环节。我们非常荣幸的邀请到了中国科学院院士、中国计算机学会理事长梅宏院士,他将为我们带来“数据要素化十问”的主旨演讲。大家掌声有请梅院士!
【中国科学院院士、中国计算机学会理事长梅宏先生】:尊敬的郭省长,各位在座的我看前台都是数据管理局的领导还有业界的同仁们,大家上午好!
非常高兴有这样一个机会和大家分享我对数据要素化的一些思考。在这之前我想做一些思考,十问,数据要素化是国家的战略选择,现在各地都在开展实践,但是我们也都知道大家对数字经济内涵外延的定义还没有完全形成,要素化怎么做还有很多问题。我觉得这些探索、创新都是很有必要的,现在很多东西还不能说对与不对,我的“十问”大概分为三类,一类是对现有的一些问题我自己的一些疑惑,还有一些我想不通的地方。
第二类是对现在的做法我可能有所保留,但是也没有很好的解决方案,这些做法当中可能的一些问题,我们还有没有别的途径去弥补,去寻求更好的途径。第三类谈谈我们对更远的未来我们的技术展望。所以说今天我选择在贵州,在我的家乡说这个话,这是我第一次系统性的谈“十问”。
前期有一些东西可能在我陆陆续续的报告里面,但是不是在这么大的场合,所以也恳请在座的媒体不要断章取义,我只是从一个学者的角度提问题,各位领导,各个企业家在你们现有的领域所做出的尝试,我认为都是值得鼓励的,我们就是要创新。因为现在你没有一个人能够说清楚它到底是什么,我先做一个解释,我就怕有的话说敏感了不好弄。
首先大背景,数字经济时代正在开启。我们国家要实施国家大数据战略,从2015年开始建设“数字中国”,今年出了数字中国总体的布局规划,数字经济是全国上下都在讲的一件事情,我们也有数字经济的“十四五”规划。数据20条去年年底迈出了关键一步,这是今年初我在经济日报的一篇文章,标题不是我写的,是记者用的“迈出关键一步”,后来我觉得这个题目也很好。
发展数字经济刚才省长也说了就是要素,要素培育和形成,我们数字经济交易最核心的要素,它怎么去促进生产发展最重要的东西就是数据。我们从2019年明确把数据列为生产要素开始,我们就有党中央国务院的要素市场配置改革的总体部署,到初步建立数据要素市场,这是去年的年初要素市场一直到去年底“20条”迈出了关键一步。
怎么去理解数据要素市场或者要素化,我们讲“化”就是一个过程,所谓的数据要素化我要给它下一个定义的话,就是我们需要把数据确立为重要的生产要素,实际这件事情是中国的首创。我们把数据确定为重要生产要素,并且通过各种的手段让数据参与到社会生产经营活动的过程。我理解把它分成三个递进的层次,第一个就是认识数据的资源属性。这件事没有问题,我们称之为资源化,我们从大数据热潮开始就知道大数据是重要的战略资源,大家都有共识,我们也欢迎大家到贵州来挖“钻石矿”,这也成为贵州欢迎社会各界的响亮的口号。完成资源化能够存起来了,这是我们释放数据价值的基本前提。
第二部分就是确立数据的资产属性,就是资产化。所谓的确立一定是法律上确立它的资产属性,它能不能成为不动产一样可以入表的资产,我以为是要素价值的法律保障。
第三部分就是资本化,我们要进一步在这个基础上实现它的资本属性。资本化要使得数据的价值可度量、可交换,成为可以经营的产品或者商品。这是要素价值得以释放,并创造新价值的途径。这是三个层次、三个步骤要这么走。实际上我们的要素化面临很多障碍,我们国家把它明确为要素,但是还处于起步探索阶段,包括资产地位,我们现在法律上没有确立,权属和确权、流通和交易,利益分配、安全隐私等等都有很多障碍,这些都是我们“20条”涉及到的重要的几个方面。
如果我们来看围绕资源化、资产化、资本化的过程,资产地位没有确立,我们还没有任何一个法律说数据就可以作为资产,没有法律就没法弄。包括有没有产权,实际上“20条”已经把产权淡化掉。业界专家一直在争吵,法律有法律的说法,经济有经济的做法,技术也有技术的套路,流通交易没有规则。还有一个很重要的,利益分配也缺少基础。当然整体横向来讲安全问题、隐私问题也很突出。
围绕这些问题,我问十个问题:
一、能否以及如何将数据列为资产?
资产是指什么?是指过去交易或者事项所形成的由你实际拥有或者控制的,可以给企业带来经济利益的资源。我们看传统资产包括无形资产,它有几个性质还是比较明确的,现实性,可控数据就来了,你怎么控?权属都界定不了。经济性没有问题,数据我们都知道都有经济价值,但是不是一定能带来经济价值是不确定的,带来多少也不确定的,可计量,计量性都有问题,能不能划分出来,还有可辨识,可辨识缺少依据。
我们对照传统的数据资产来讲有这几个方面还是值得深究的。如果资产化延用传统的模式,不仅中国,国际上也没有上位法,把数据作为资产。但是我们又看到发展数字经济,数据资产化就是自然需求,如果说不这样它不行,或者是必然需求,这就需要探索新的途径,这件事情是我比较困惑的一件事情,怎么去实现这个东西。
二、如何理解数据权属性质,如何确权?
我们怎么理解数据权属的性质,怎么样确权,让数据的权属本质,我们从法律视角来看,它是不是可以产生可以确认的产权,可确认的收益。权益归属于谁?我们看看有这么多数据,非竞争性、非排他性、非稀缺性、非耗竭性。场景是多样的,观点是复杂的。逆势定律,一个是动力,一个是独立,动力就是你的产权,我拥有它才可能产生这个东西,实际上是失效的。数据权属的复杂,大部分都与所有权相关,怎么解决这个问题。
不同类型的权属问题,比如说个人数据一定和我本身生物特征、财产特征关联的,能不能和人格权关联等同呢?我自己所有的东西产权。另外讲公共数据,它的资源归属范围如何界定,特别是我们国家来讲,公共数据是全民所有,企业数据是否构建新型的民事权力体系,解决企业所有,还有数据权力的指向问题,这个权有物权、所有权,甚至还有知识产权的成分,数据产品有的是涉及到你的智力劳动,可以呈现你的IP,还是说中间有个人权力,还是说可以发明一种全新的权力,现在创造了很多权,把所有权搁置。
权力还有权利的归属,是否可以构建一个多元权力并存,共享呢。我们搁置争议,先往前探索是非常好的举措。权属确认实际上是全球的难题,因为没有很好的技术方案。现在世界各国现行的全国性的法律,都没有立法,现在采用的是法案进行个案的判,涉及到数据侵权的判例,基本上都是用的责任规则而不是财产规则,而是用的责任规则来判。我们现在面临着如何构建适应数据要素本质的签署体系和确权机制,这个大家都在探索。
三、如何度量评估数据价值?
实际上我们直觉的想,我们在座不同行业的人,可能对同一个数据的需求就是不一样的,有的人愿意花高价买,有的人你送我都不要。我们有各种评估的方式,有成本法、收益法、市场法,数据评估就不一样,落后元主体,成本不容易区分。市场法不是特别适合到目前来讲,我们把数据定价的问题来看,作为一个新兴的商品一定有它的特点,成本构成的特殊性,高生产成本,低边际成本,需求多样,估值有困难,由于不同的需求,真实性难验证,隐私权难界定,还有复制运用,偷偷用了就很难防范。商品售卖的形式是什么,套利行为怎么防范,隐私信息怎么保护,还有真实性的验证等等。本身这种东西定价供需双方在市场上本身有一种博弈活动的行为来产生。
所以说传统的资产评估方法现在看来是难以直接用于数据资产评估的,价值评估没有统一规则,参与的主体需求各异,也很难形成统一的价格标准。现在我们目前的会计核算方法还没有办法把数据估值定价,为数据估值定价提供依据,就算想入账怎么入,会计的核算方法都不支持。
四、什么是数据要素的基本度量单位?
如果数据作为要素交易,它的基本度量单位是什么?我们看看传统的要素,土地按平方米,按亩,总归有一个说法,劳动力的时间,货币有统一的度量。只有技术和企业家能力这两块比较难度量,通常的要素里面会不会谈到,他作为生产要素的促进者,是生产效益提升角度,他不是直接按照这个去度量的。现在数据的问题就来了,我们按数据本身的规模,就是我们自己基本单元,一个G,一个T,一个T就肯定比一个G值钱吗,肯定不是这样。如果按表还是按照操作系统的一个文件来,都是不好说的,因为这是两个维度的事情。
我前天在论坛上谈到数联网,用DOA体系,把现实物理数据数字化变成一个对象以后,我能不能用它来度量,这是我的一个问题,能不能做到进一步的尝试,所谓DOA把现实数据和资源进行建模,变成数字对象,然后联网变成数联网,也许是一个做法,至少没有度量单位。所以说度量单位和价值是正交的二维,属于形式或者技术维度,但是你的数据给我的形式是一张表还是什么,民间的黑市交易很清楚了,按照行来数,偷偷卖个人信息的,手机数据的,家庭数字那是黑市交易,那个是按照条数来算的,其他还有什么办法?数据价值我理解在很大程度上取决于它所表征的物理世界对象,在物理延伸的数据是有的,但是如果没有表征物理世界的基础数据延伸不了,也许我们把DOA作为物理数字对象,作为数字孪生能不能作为度量单元,我是想找几个人琢磨琢磨开展这个研究来做这个事。
五、如何构建高效数据流通交易体系?
我们讲数据交易,以数据产品和数据交易目标的交易行为,广益范畴下可能涉及到数据价值深度挖掘等数据交易产业链相关交易与技术服务,这是广益的交易的定义,但我是认可的。我们现在谈的数据交易模式,基本上全世界都是这样,一个是平台。我们有一些交易参与的平台,供给方和需求方的交易,包括三方,四方各种模式都有。还有直接交易,比如说需方和供方的直接交易,黑市交易就属于直接交易,还有一种数据包,我们两个商量好了,我一包数据给你这是没有问题的。
还有API,很多平台企业API经济已经成为数据交易里面非常活跃的成分,民间已经产生了。国际上的交易平台已经有很多,但是国际的平台基本上还是企业在做的,类型也是多样的,有很多也涉及到服务。国内的平台从2014年构建开始到现在已经50多家数据交易所,大多数是政府主导的。这里面就有一个问题,我们总是喜欢用交易所这个概念来命名这些东西。交易所是工业社会的产物,我去查了交易所的定义是交易某种信息或者物品的信息平台或者场所。这基本的特点:交易物权清晰,交易所属于抽佣中介性质,准入制和市场化结合。
比如说传统交易所主要是证券交易和商品大宗交易,可以是现货也可以是期货,世界上第一个交易所是阿姆斯特丹的一个交易所,数据交易一定要和信息服务区分开,数据交易是不同主体之间,我针对数据不管是有偿的,无偿的一种交换行为,交换对象可以是原始数据也可以是加工后的数据产品。信息服务是在已有的信息数据基础之上分析之后形成的服务产品,他给你直接提供信息,提供支持,服务方要承担责任的,如果提错了,这是我们交易所不能解决的。现行的交易所各地的探索是很好的尝试,但是也面临着在权属不清晰的情况之下你的规则完善的问题,交易所到底能不能交易,就是交易使用权,交易加工以后的东西,如果说交易所也提供数据的信息服务,可能就会带来问题,你交易所要承担责任。
你提供的服务这个质量不够那我就会找你,你就变成一个数据信息的服务商。咱们50多个交易所了,中国的特点我一直探讨,中央20条明确数量要控制,交易所会不会成为各地流通障碍。当地政府一声令下本地企业必须本地交易,全国市场怎么建?显然是不符合,现在数据还要追求全球交易、跨境交易,这肯定是不符合。还有的交易所政府主导的,我以为还是要允许场外交易,怎么去规范,怎么去兼容市场化的交易方式,这是多元的交易体制还是需要的,这个东西要有效还要高效,现在我们要积极的探索。
六、如何合理分配数据收益?
价值的利益分配,我需要保障数据基本权利的情况下使各方的收益最大化。如果纯粹靠市场机制现在似乎是有问题。我们想前几年靠市场机制实现这种东西,我们每一个个体的数据,贡献的每一个平台,但是个人是没有收益的,但是我得到了服务,换取了方便。市场初期规则不完善,监管也缺失,前几年政府没有监管的,所以现有的收益分配明显有太多的不合理之处。分配就是政府介入监管之后的分配怎么分,我们看到已经有很多的研究实践,比如说欧洲为代表的数据税就是非常重要的一个方向。
到2021年10月,G20和联合国世界经合组织136个辖区已经对数字经济税收挑战形成了一种共识,但是好像明确开始收税的,研究的多,收税的还没有。这里我也提出一个问题,数据税是国家收的,收完之后能不能够普惠到每个个体,我们有没有一种方式探讨所谓的数据费,是指个人的数据能够获取。现在我们谈到技术发展趋势有一个3.0的出现,强调我的数据我作主。
图灵奖获得者这及一直在推他的个人数据为考虑的数据,每个人有自己的数据空间,谁用我的数据空间,你象征性的给我一分钱也行,也算是我的收益。因为数据费还是另外一个方面,所以二者是不是可以探讨兼顾的,要允许个人,现在国际上已经有人在做,个人数据汇聚到中间,作为信托作用。
我觉得还是要充分考虑在未来的世界,每个个人的数据能不能获益。因为毕竟是未来数字世界最基本的数据的贡献者,我们应该考虑,特别是我们国家更应该考虑。再一个是公共数据,是全民所有特性,他能不能参与利益分配,我一直存疑的。谁代表他去参与分配,如果参与分配怎么体现公平性公正性,公共数据面临的一个难题。所以按照20条的讲法,体现原则,促进公平,这是没有问题的,这是我们追求的基本原则。
现在也在追求多元化数据要素的数据分配,市场评价贡献、按贡献决定报酬的机制,这件事情说起来容易,后边还是很难的。还有政府对要素收益进行调节机制,这件事情目前也没有章法,这两件事情各自都没有解决,再加到一块具体的路径在哪里,我们还得需要加紧探索,哪怕是试错也要探索。
七、如何实现公共数据的真正开放?
所谓的数据开放就是提供方无偿的提供数据,单项提供数据,没有其他的介入的。国内数据开放,我们从2022年截止到去年10月,有208个省级和城市地方政府上线了开放平台,我们330个地级行政区建成了公共数据开放平台,已经占了全国的58%。国际上也在开放,开放都是公共数据,国外的数据开放主要的模式政府主导的,民众主导的,行业协方主导的,2009年美国是第一个全球开放政府数据门户网站涉及到农业、制造、天气、教育、能源等方面。
2023年5月已聚集25万多个数据集。DATA.GOV的最大特点是开放政府网站的应用接口API,并统一数据格式。我们国家也在做,但是公共数据的质量和数量还不久,还需要进一步的提升。我一直觉得公共数据的真正开放应该是原始数据的开放。现在20条规定是可用不可建,是授权开放,反正不管怎么样已经很好的走出一步了,我觉得挺好,但是还是应该是原始数据开放。为什么这么说?
公共数据取之于民,理应用之于民,我们把敏感数据剔除掉以后,来进行运用。很多数据应用的创新绝不是坐在办公室想出来的,是民间需求刺激。我们看到很多民间依托数据去创新运用的例子,还有很长的路要走。
八、如何平衡发展与安全?
我们可以看到这期间我们的安全和隐私问题非常突出,数据泄漏事件频发,网络诈骗行为猖獗,还有数据的滥用、误用也严重。我们国家这几年一直在加强数据安全的法律法规建设,这是我列举从2015年开始的各种各样的动作,字很小,大家不一定看得很清楚,我也不详细解释。
数据安全,隐私保护,还有法律、行政法规和部门规章的,这二者非常重要。按照总书记在网信会议上的讲话,安全是发展的前提,发展是安全的保障,发展是最大的安全。我们现在数据应用需要数据要素化这件事情,一定要强化安全意识和底线意识,但是我们不应该设置过低的安全底线,没有绝对安全,所以你的安全底线设置过低了,那就别做,不用可能是最好的安全。因此我一直的观点是发展先行,安全跟进,用发展保安全。毕竟这一轮信息化是我们中华民族千载难逢的机遇,所以我们一定要抓住。
九、如何为数据要素化提供技术支撑?
我们发展数字经济离不开数字基础设施,也离不开物理基础设施的数字化,离不开信息技术,特别是涉及到数据的全生命周期的大数据技术的支撑。我把大数据技术分成四大板块:管理、处理、分析和治理。我这里列了大数据五个方面的挑战,以数据为中心的计算体系怎么构建,满足大数据高效处理,实现数据和应用的完全解耦支撑跨越的数据管理,实现多源异构大数据的多模态融合分析与可解释性分析,还有如何形成系统化大数据治理框架与关键技术。
尤其是第五个是要治理框架和治理体系,这件事情我们在研究,从基本理论到框架,还有贵州实践。怎么支撑数据的汇聚融合,技术上怎么去保障它的质量,技术上的隐私和安全保护,怎么去促进开放融通,怎么构建相应的技术标准,构建相应的生态,这些都是技术问题。所以数据要素化是一项系统工程,制度建设是最关键的东西,但是同时也是一项技术性很强的工作,需要高效有效的技术提供支撑。因此数据治理相关技术的研发将是大数据技术体系发展的重要方向之一。我们一切要围绕包括数据要素化整个过程提供相应的有效的技术支撑。
十、数据要素如何加入生产函数?
我们知道传统工业世界是讲生产函数,我就想知道数据作为要素加入之后,生产函数的位置是什么,所谓的生产函数是描述了一定技术条件下投入与产出之间的关系,即生产要素投入量和产品产出量之间的函数关系,体现了企业将一定的投入转变成产出的能力。这里面通常来讲土地、资本、劳动力的投入是直接的变量,而通过把企业家的才能和技术作为效率提升的工具,同样的东西给一个有名的企业家和给一个新手可能产生的结果就不一样。
所以技术和管理是作为效率提升的东西。我看了有很多短期生产函数、长期生产函数各种各样的东西。我们还要看到数字技术发展之后带来的一个很重要的东西,很多事情边际成本趋为零,特别很多技术如果实现了把边际成本转化成固定成本的时候,就会带来很重要的产业拐点。传统的生产函数把劳动、资本、土地的要素作为有形的可以量化的投入,属于函数的自变量,而技术企业家不列入在里面。数据好像两边都有,它作为物理世界因为对应是可以直接投,但是数据有技术含量的时候,它也会提升这个东西。所以我想看看哪些经济学家能够在生产函数里面把数据的位置描述出来,我们找到实际的案例做这件事情。
这就是我讲的十个问题,我坚决支持大家在现实世界所有的探索和创新,顶层设计和很重要,创新探索更重要,但是我刚才提出的问题是希望获取更多的思考。
前面的问题我解决不了的情况之下,我想不通的情况之下,最后形成一个终极疑问:数字经济到底是工业革命的一个新的阶段还是一个全新的阶段?我们发现很多比如说我们谈工业革命,现在我们谈第四次比较多,但是历史上大家查过吗,没有第三次,第四次的出现就是工业4.0以后,全世界都在喊,特别是中国喊的第四次工业革命。
2012年的时候趋势血钾杰里米·里夫金出了一本书《第三次工业革命》,我们作为工业革命的第五阶段是没有问题的,逻辑上是说得通的,从五次变革过程中的,我们都是用工业经济的概念和数据在诠释在描述数字经济。用传统生产要素的属性来描述我的数据要素,这样你就找到了很多的问题,它不适应。
所以说会不会这一轮就像工业革命颠覆农业社会一样,它可能是颠覆工业社会的新形态。我没有答案,我只提出一个问题,我们可以看到九十年代中期互联网大量进入商用以后带来的革命,我以为是颠覆性,在广度、深度上都是空前的,特别是ChatGPT的出现,变化太大了,很多方面已经远远超出我们在工业社会形成的常识和认知。
这个意义而言,数字经济可能就是农业、工业之后的一种全新的经济。当前数字经济研究实践当中已经面临很多没有办法用工业经济理论解释和直到得问题,比如谈到数据要素化在它的特征、价值、分配等方面的争议和难题,数字平台带来的数据虹吸、市场垄断、税收侵蚀等问题很难用工业经济时代的反垄断规则进行规制。工业社会形成的国际治理规则和体系也难以适应当前数字化转型的需要。如果说我们认为认可数字化转型是对传统行业的颠覆,是一场社会经济“革命”的话,也许用工业时代的思维去推进和研究数字经济也许并不完全妥当。
有没有新的路径来探讨,现行的市场监管法律法规能不能直接用于数字经济?用工业时代的框架和术语解释数字经济,仅仅在传统名词、术语前冠以数字或者数据,能否触及数字经济的实质、刻画数字经济全貌。经济学界能不能认可,我实际上很希望更多的经济学家来探讨,我自己是一个技术专家,不懂经济,很多东西是外行的话,隐隐约约感觉到是一次天翻地覆的东西。
所以我们站在人类历史长河和全球大格局层面进行大跨度的审视,我们可以看到,数字经济这一新经济形态对人类社会结构、甚至人类文明都将带来长远和深刻的影响。当然我们现在也经常在用数字文明,但是没有把数字文明真正和农业文明、工业文明完全对应。徐麟书记在开幕式致辞也提到这个,但是如果我们真正谈到数字文明是和农业文明、工业文明并列的文明的话,也许我们现在就站在了数字文明的门口。谢谢大家!
【主持人】:感谢梅院士的精彩演讲,数据经济时代,数据要素化,从数据的权属到收益,到我们的流通,到最后的这些技术、安全等等方面提了十个对于从政府政策规定制定者到产业界的实践者等方面,都需要我们深思的几个问题。我们现在休息3分钟,3分钟之后再回来。
【主持人】:欢迎各位来宾、各位朋友回到大会,我们继续下面的议程。数据作为数字经济核心生产要素,正发挥着越来越重要的作用。近年来,中国信通院持续开展数据要素流通与价值化研究,发布了系列数据要素相关报告。下面由我来代表中国信通院数据要素市场研究团队发布最新研究成果《数据价值化与数据要素市场发展报告》。
当前,党和国家高度重视数据要素发展,我国是全球首个从生产要素高度推动数据价值化的国家。2022年12月份,中共中央国务院印发了“数据二十条”,提出构建数据产权、流通交易、收益分配、安全治理等制度,初步形成我国数据基础制度的“四梁八柱”。
在党和国家谋篇布局下,我国地方也开展数据要素市场化探索。例如,北京建立数据特区,发布金融、交通、空间等领域的公共数据专区,开展公共数据专区授权运营,推动公共数据有条件开放和社会化应用;上海重视要素融合和生态构建,打造“一核三园两港”空间布局,构建高水平的数据要素产业集聚区;深圳发挥先行示范区优势,开展首席数据官、数据生产要素统计核算、数据产权登记、数据资产入表等试点工作,打造数据要素市场制度创新高地。
在各方努力下,数据驱动经济发展的能力初步显现。我院调研显示,从企均数据存储量来看,第二产业企均存储数据最多,为222TB/企业;第一产业相对较少,为157TB/企业。从数据密度来看(数据密度指的是相关从业人员人均数据存储量)第三产业的数据密度较高,是第一产业的3.5倍,未来,第二产业数据价值释放空间较大。
最后,我们对数据经济贡献度进行了测算,2021年我国第一产业中数据的经济贡献度为0.07%,也就是说,每一万块GDP中有7块由数据贡献,第二产业0.16%、第三产业1.07%,与我们2021年数字经济对GDP占比的39.8%相比,还有很大差距。因此,数据要素价值释放进入初级阶段,但数据赋能产业发展仍有较大潜力。
为进一步推动数据价值化,我们认为有两个发展逻辑:演进形式来看,通过数据资源化、数据资产化、数据资本化的“三化”过程,实现数据经济价值及社会价值;推进方式来看,释放数据要素价值需要技术、市场和制度等多重力量的共同推动。
下面我们聚焦数据资源化、资产化、资本化,看我国数据要素发展情况:
——数据资源化包括数据采集、整理、聚合、分析及应用过程。我国已经形成基于数据全生命周期管理的产业链。其中,数据采集由人工采集向自动采集进一步转化,数据标注产业围绕北京、长三角、成渝地区向外扩散。预计到2023年,我国全球数据采集和标注市场规模将达到2.67亿美元,占全球11%。此外,自动化数据分析成为发展趋势,推动数据分析与物联网相结合,数据存储也由端点存储向边缘存储以及云数据中心流动,云数据中心成为新的企业首选数据存储库。
——数据资产化是数据及数据产品进行流通交易的过程。我国数据流通交易以场外交易为主,场内交易加速推进。目前,我国场内交易中实际运营的数据交易所共计约26家。数据交易所职能定位向数据流通交易的生态构建者发展,交易内容从单纯的数据集交易趋向包含数据产品、数据服务、算力等的综合交易;场外交易中,根据数据类型主要有三类:基于数据集的数据交易如万方数据、基于API接口提供的数据服务如聚合数据,以及数据服务商提供的专业数据服务如数据堂等。
——数据资本化主要包括数据信贷融资与数据证券化。其中数据信贷融资是用数据资产作为信用担保获得融通资金的一种方式,数据信贷融资已经成为解决小微企业融资难的有效办法。例如,在广州发改委指导下,广州信易贷依托全国信用信息共享平台查询涉企数据,为企业画像,开发信用金融产品,推动银行向小微企业放贷。此外,数据信托、数据银行等也加速发展,数据信托成为激活数据要素潜能的高效数据管理方式,数据银行成为助力数据要素流通重要基础设施。
数据定价与确权是数据价值化与要素市场建设过程中面临的两大核心难点,本报告针对这两部分进行深入研究。
——数据确权方面,我们认为应当建立数据分类分级确权框架,先对数据分类,区分公共数据、原始数据和数据产品。应当明确公共数据的公有性质,通过授权运营等方式实现公共数据的数据产品经营权、数据加工使用权转移;原始数据应当强化司法保护,突出知情同意权和被遗忘权两大权利,完善授权机制。如通过数据信托方式将数据资源持有权、数据产品经营权授予数据信托方,数据使用者则进行数据开发和增值服务,获得数据加工使用权;数据产品确权应坚持产权分离原则,通过突出数据加工使用权实现数据收益共享。我们最终给出图中数据确权路径图。
——数据定价方面,我们认为现有数据要素市场没有规范的定价依据,应当分两步走:一是形成公允价值,我们根据数据要素属性,构建了数据资产评估指标体系,包含4个一级指标,即为数据基础价格、数据增值价值、数据异质性价值及风险溢价,并在此基础上细化成10个二级指标,及21个三级指标,依托数据定价模型DCAPM得到公允价值,可以作为政府/数据交易所指导价。二是形成价格,数据价值具有高度的场景依赖性,评估数据是一个复杂的过程,数据价格由市场供求关系来决定,且价格围绕数据公允价值上下波动。
女士们,先生们:
未来五年,是我国推动数据价值化、构建数据要素市场的关键时期。一方面,建议构建多类型、多层级、多样化数据要素市场体系。推动数据分类分级,明晰L0-L5级数据等认定标准,区分公共数据、企业数据、个人数据等开展数据产品分类分级标准建设。构建数据三级市场,一级市场登记授权,二级市场流通交易,三级市场开展数据质押融资、数据信托等数据资本化交易活动,推动数据资源持有权、数据加工使用权、数据产品经营权等权利分置。在三级市场建设的基础上,分为场内交易市场和场外交易市场,市场主体根据自身需要自由选择在何处交易。
另一方面,推动数据基础制度落地,形成“1+N”制度体系。在“数据二十条”这一顶层文件基础上,中央、各部委、各行业、各地方等逐步推进实施N个政策文件。具体来说,数据产权制度是制度基础,应在法律层面确立数据资源持有权、数据加工使用权和数据产品经营权“三权分置”数据产权运行制度,明确不同权利的属性、边界、主体以及权利和义务,完善实施确权授权制度。此外,逐步出台政策细则、试点示范,丰富和落地数据交易制度、数据分配制度、数据治理制度等,为做大做强数字经济提供强大支撑。
谢谢大家!
【主持人】:接下来是主题发言环节,我们很高兴的邀请到了各领域专家,分别就数据基础设施、数据交易、数据安全、数据应用等方面开展分享和交流。
2022年,国发2号文件明确贵州建设数字经济发展创新区的战略定位,近年来,贵州以建设大数据综合试验区为抓手,围绕数据“从哪里来,放在哪里,如何使用”,勇做“数据要素价值释放”的“排头兵”,积极培育壮大数据要素市场。下面有请贵州省大数据发展管理局局长景亚萍女士分享贵州数据要素市场化配置改革探索与实践。
【贵州省大数据发展管理局局长景亚萍】:首先今天专门邀请了梅院士给我们提出十个问题,我们在实际工作中怎么去解答这些问题。当时在讨论的时候,这个论坛叫讨论会或者头脑风暴会或者叫我们前进中需要一起去努力的会,所以今天我也是放开的,不按照套路来讲我们的演讲。
我的PPT可能是套路,但是有时候和大家聊的不一定是套路。今天在座的前面的同志们都是我的同行,都是一起在大数据领域推动这项工作。我们专门这次请到贵州省司法厅的胡厅长专门过来,因为我们正在立法,还有专门的研究机构,包括社科院的,实际上这里面不仅仅是技术方面的,更多还有经济层面的,社会领域还有我们具体践行的企业。今天我们是想通过这样一个论坛,把我们的一些困惑逐步逐步的,当然不可能理清,我们通过一些观点让我们思考我们下一步应该怎么做,特别是我们数据局的同志们我们现在应该怎么做,我们也在困惑这个阶段。
所以我今天和大家分享的是贵州数据要素市场化配置改革探索与实践。这些实践有可能是贵州省的,有些东西是我自己思考的,也不是官方的,都是我们讨论的,所以不代表贵州省是这么做的,或者贵州省未来会怎么做,我们只是探讨。
贵州发展大数据,我们一直走来磕磕碰碰,从2014年举这个旗的时候,谁都说贵州搞大数据可能吗?我觉得不管可不可能,我记得一个专家讲你只要深入干你就是专家,你只要深入做你就能够干成。2014年做的时候,大家觉得贵州大数据确实你能做什么,是高聚集人才的时候,也是高端产业你能做吗,我觉得不管能不能做,你做了就好。
2015年当时习近平总书记到贵州来的时候,他说贵州发展大数据确实有道理,你们应该继续坚持做。我们做了还是不断在出现问题,而且现在各个兄弟省份改革力度也很大,成效非常好,对贵州来说又是一个新的困惑。所以在2021年我们在怎么转型的时候,习近平总书记来了以后就给贵州提出来在数字经济战略上抢新机。原来是我们抢先机,你举了这个旗,新机在哪。我们一直找,而数据就是一个新的新机。
这是“数据二十条”,大家都清楚我就不说了。我要说的是成立国家数据局,数据局上面除了有发改委管理这11个字以外,我把和数字中国框架做起来,马上数据局要成立了,我们的职能是什么?第一个是基础制度的建设。刚才梅院士讲的过程中,最关键的是基础制度怎么讲。第二数据资源整合共享个开发利用。
我们从2017年就开始在做数据资源整合共享,现在还在做,前面没有加“政府”的定语,就数据资源整合。我们可能擅长政府数据资源整合,行业数据怎么整合?由谁来整合?第三句话,统筹推进数字中国、数字经济、数字社会规划和建设。我这边提了一个数字中国“2252”,数字中国是大于数字经济、数字社会的。两个底座、两个支撑赋能我们的整个数据,但是数字中国当时拿到以后我是困惑的,统筹数字中国又把数字经济和数字社会放进来,一个规划和建设,那是什么呀?统筹数字中国整个由统筹规划。还有数字经济和数字社会放在大数据局里面,我们要管什么?你要管数字经济和数字社会的建设,而其他的几个是协同,也就是说是由人家厅局为主,我们是做统筹。
我们反过来看,我们大数据局现在各局的职能在哪?这三句话就是下一步大数据的职能。我们大数据局的职能是什么对我们非常关键,怎么推动数字经济发展,这个职能也很关键。从这个角度来说,不管怎么样制度建设要做,后面是应用,数据要管。
所以大数据局不是管信息化局,大数据局是管数据的局,所以这样的体制下我们怎么思考大数据的发展。从去年开始我们就在研究贵州省数据要素市场化配置改革,从去年4月份就成立了专班,在研究的过程中,我们经常被前面的一个问题刚刚研究通了,第二个问题研究的时候第一个问题又不知道怎么弄。我们弄不清楚的时候先走起来,所以一直到去年11月份我们过了省政府常务会,今年4月份已经过了深改委会。这个文件我们的领导们是经过几道关,每个会上都是争论得非常激烈,过三关斩六将,先是各个厅局来讨论,然后是分管省长不知道讨论了多少次,又是省长开专题会,省政府常务会,讨论一次我们就进步一次,不要怕人提问题,提问题是好事。
我们又开展了调研,我们做了什么调研呢?我们在企业里面发觉有些问题。
数据能不能交易,数据怎么交易,数据交易什么?政府监管民营资本运营公信力不足,今天有民营资本,在贵州得了这个教训,贵州贵阳大数据交易所是2015年就成立的,最早的一个大数据交易所,这个交易所方向完全正确,但是我们发现那个时候不在风口浪尖上,第二是民营资本去整合数据的能力不足。
第三个,民营资本在运营数据的时候还有可信度也受到影响。所以出现了一些现象,我们就进行整合,整合就成立了国有资本,国有资本不是运营二级市场,是运营一级数据的管理。所以第二个是数据怎么交易,规则的问题,怎么到场内交易他放心,他在你这边来,我们发觉企业包括平台型企业,他不是不想被监管,他想被监管,只是说你不要不好监管就把它关掉,关掉企业就死了。但是你政府应该做什么事,应该去研究怎么监管。所以我们觉得因为监管不足,所以觉得我对进场交易不放心。
第三个数据交易什么?按照这个思路去解决什么样的问题。路径刚才梅院士讲了,资源化资产化、资本化,这是路径。这个路径我们就按照这个路径去做,怎么做?我觉得叫做矩阵式推进立法,这是胡厅长创造的,不是一个政策就可以解决的。我为什么讲矩阵式,我们2016年推进的立法是推动大数据发展,刚才梅院士的一个核心讲的就是让它先发展,安全跟进。主要就是怎么样推进发展,但是比较原则,定位的是让各个厅局你怎么样去推动我们的发展,不是对社会,是让各方面来推动发展。我们又发现问题,还是要把底线守牢,所以我们就做了大数据安全立法,我们做了安全责任监管。
紧接着我们又做了一个事,就是把数据放出来,《数据共享条例》从政府开始,当时我们和司法厅也有争论,大家认为这是你政府自己内部的事情,不应该立法,最后我们强烈认为需要立法,数据释放出去,一旦数据被关掉了,人家下游企业全部死掉了。所以我们坚持立法,当时胡厅长在的时候,我们说政府数据一定要立法。最后我们也是通过不断的讨论,最后形成这个法律条文。
去年我们又做了一个《贵州省信息基础设施条例》,2016年就已经做了,我们发现信息基础设施发生变化,新的信息基础设施一定不是原来的基础设施,所以我们对信息基础设施进行了修订,修订以后加了新的信息基础设施,同时我们把数据交易是作为基础设施的一个关键部分。有了基础设施这个环节以后,我们现在正在做的就是《数据流通交易规则促进条例》,现在正在走程序。我们在讨论的时候,从上午讨论到下午,最后讨论不通了,就决定出去调研,到了浙江、广东,都去做调研,希望从同事们那里找出路径,去了以后心里面当时是拔凉拔凉的,但是调研完了以后,回来以后路径清楚了。所以我们第一个抓的就是立法,从法律上去保障,但是立法是不是一定就完善呢,我觉得不一定。我们条例在修订,我们先通过运行再来修订,所以首先叫矩阵式立法来推动工作。
有了立法以后,我们体制机制怎么做?我们分析了40多家交易所,交易所的组成要么完全是国有企业,要么就是混合资本,要么是民营企业。我们觉得各有各的探索,我们贵州怎么做的呢?国家不能缺失,监管不能缺失,所以由省大数据局和金融监管局进行监管,当时为什么要金融监管局?因为我们有证券交易属性,所以作为行业来监管,我们是做行业指导。行业指导要有一个部门专门来做行业指导,所以我们就成立了数据流通交易服务中心,一个就是对交易所进行指导和管理,规则的制定、生态的培育,你政府要做政府的事,就是做这样的工作。规则制定、生态培育由流通交易所服务中心来做,服务中心是大数据局下面的一类事业单位,专门来对交易所的工作进行指导,同时也是委托交易。
贵阳大数据交易所就是公司,他来进行运营,我特别认同梅院士今天讲的一句话,你不能既是运动员又是裁判员,交易所就是管理场所,就是促进这方面的发展。现在问题来了,金融监管局不由地方管,直接垂类到上面。大数据局行业不仅仅是管理,监管也要归口。所以我们现在也在调整。数据要素市场化配置改革,我们提出来建立“六位一体”的实施路径,我们是以问题为导向来推动数据要素市场化改革。
第二就是数据产权制度。数据产权制度从一开始2019年在海南有一次全国的讨论,做东数西算工程的时候,我在那个会上就讲,数据一定不能够讲所有权,贵州一直在做“三权分置”,我们叫做归属权、使用权和管理权。所以这次20条最大的一个体会就是三权分置,持有权、经营权和使用权。我们一直认为你知道没有所有权的时候,我们绕开这条跑道来走,国家的20条没有提出数据所有权,如果提出数据所有权那我们死掉了。
因为按照现行的法律,按照所有权是走不通的,数据流动是不可能的。那我们怎么样做?做这个工作我们也是探索,只是实践,我们通过发各种凭证,数据商凭证、数据中介凭证、数据要素登记凭证、数据信托登记凭证、数据用益凭证来进行授权。我们建立全国首个数据要素登记OID行业结点。在流通的过程中,我们面向所有的数据开展登记授权的服务。
最核心的是要培育流通生态,这个生态我是从这几个方面来思考,就是要建立制度。这个制度就是数据资源化、数据资产化和数据资本化的过程。我们首先把政府数据管理办法进行修订。因为考虑不清楚其他的,我先把政府资源数据管理办法,修订增加了政府数据要授权运用,你不能释放出政府的价值。第二数据要进行调度,我们进行了修订。因为原来的数据资源管理,当时我记得国家改革委来的时候问我,国家要出台数据治理制度,最应该出什么制度?
我说需要出数据资源管理。但是怎么管?我说政府数据优化,找一两个行业进行突破,来做政府资源的管理。我们贵州省正在做行业数据的管理的突破。我们就出台数据流通交易管理办法,明确交易主体、明确交易标的、明确交易的流程。出台了一系列的交易规则,去年我们发布了贵州省数据流通交易一系列的规则。建立数据流通交易平台,让我的交易低成本、高效的环境上进行交易。
最后,我们刚才讲的贵州省不是固定价格,实际上还是磋商,只是说做这个产品有一个参考价,在参考价上大家去磋商。所以我们做了一个在国家发改委价格监测中心指导下,我们做了“数据产品价格计算器”,这个计算器实际上就是建立了多因子修正的成本模型,来输出一个价格,最后供大家参考,然后进行撮合。当时我们和普华永道一起对价格成本进行研究,这个很复杂,我们建了一个基本模型,但只是开始。
紧接着要做的就是数据资产化,如果数据不资产化你不可能走到资本化的程度。现在我们和财政部也在进行交流,我们现在只在贵阳市试点,首先对数据要素企业进行认定,对它的数据资产,进行入表的试验,我们指定贵阳的几家银行,对它的资产可以进行融资抵押。我们先探索这样一条路来进行推动我们的发展。
我们现在聚集了市场主体589家,其中省内的52家,省外的48家。我们主要就是通过这样一个颁证的形式,给大家营造一个推动数字化要素配置改革的一种生态。
刚才梅院士讲的一个问题,大数据发展一定要有数据,怎么样把供给单做实,我认为在我们目前来说还是要做场景,一场景一申请、一需求一审核、一场景一授权、一模型一审定。我们交易的是数据场景,目前还没有对原始数据进行交易,目前还是规定范围内你提出模型,通过输送我们的结果来决定,是按照这样的申请模式,对公共数据进行申请。同时我们建立了几个专区,电力、气象、时空大数据专区,电力大数据有这么大的市场,它的数据一上架以后,两个月就有一个亿的交易,而且也对它的企业转型带来了新的思路。
气象局这边也是,原来他下面有一个事业单位,他下面也有公司,也对他的公司也找出了新的生存方向。所以昨天南网的董事长也谈到下一步怎么样推动他们的数字价值化。同时我们也做了其他专区,关键是供给侧有了,需求侧现在找不到。我们现在通过场景大赛来挖掘需求,今天下午就是场景大赛的结尾。我们通过找出各种市场需求,通过大家都来去找市场需求来做,这个工作我们持续要做,我们省委省政府要求我们还要加大力度,我们还要开放更多的政府数据,让大家去挖掘,带来你们政府的数据和企业数据的融合,形成新的业态,这才是我们最终的目的。
我们上架交易产品1017个,累计完成交易776笔,累计交易额达13.87亿元。我不在乎交易额,我在乎走完这个流程,交易额那是后面的事情。
我们贵州反过来讲,我们贵州的机遇在哪?数字中国“2252”,两个底座一个是算力,一个是数据。所以贵州紧紧抓住数据这个核心生产要素和算力这个生产力,因为我们贵州做数据中心。全国八大枢纽,其中四个枢纽是面向全国提供算力服务。所以算力我们已经有核心能力,我们要抢抓数据归集和数据价值释放的机会,提供更多的应用场景,为数据中国提供我们自己的智慧。
谢谢大家!
【主持人】:谢谢景局的热情洋溢的演讲,要发挥数据市场化,政府不能退后一步,必须前进一步,因为政府、市场和技术三者缺一不可。贵州在这方面做了很多的工作,也取得了很多的成绩。
2021年,广东率先推出了《广东省公共数据管理办法》,明确将公共服务供给方数据纳入公共数据范畴,在省级规章制度层面真正落实了“一数一源”,并对公共数据的共享开发利用作出了明确规定。下面有请广东省政务服务数据管理局副局长熊雄先生分享广东数据要素市场体系建设实践。
【广东省政务服务数据管理局副局长熊雄】:尊敬的各位领导,各位嘉宾,各界朋友,大家好!很高兴参加数博会数据要素流通与价值化论坛。按照景局的要求在闭门会上和大家开诚布公交流一下广东在数据要素市场体系建设的一些实践,与其说实践不如说是实战,理论上、体系上肯定是不完善的,姿势上也肯定是不优美的。我们想在守住安全这个底线,尤其是个人敏感隐私数据和国家安全数据这两条红线的基础上,我们为了高质量发展先去闯一闯,干一干。
2019年10月,十九届四中全会首次提出将数据作为传统生产要素并列的生产要素,去年中央二十条进一步为推动数据要素市场化配置最大化释放数据要素的价值也指明了方向。广东是2021年7月印发了全省数据要素市场化配置改革的行动方案,到今天接近2年的时间。2年来,全省一盘棋,省市一体化推动数据要素市场体系的建设,主要有三点做法向大家汇报一下。
一、与数字政府建设深度融合,加快公共数据流通。
数字政府建设是建设网络强国、数字中国的基础性和先导性工程。2017年广东启动数字政府建设,分为两个阶段,从2017年到2022年的前5年,集中力量解决集约化建设的问题,是打基础、优服务的阶段。从2022年开始进入到高质量发展2.0的阶段。这个2.0阶段最重要的特征就是和数据要素市场化配置改革紧密结合。在1.0阶段,广东一是强化组织领导。省委、省政府将数字政府改革作为改革的1号工程,高起点谋划、高标准推动。
二是创新体制机制。在2018年下半年到2019年初在省市县三级同步统一组建了政务服务数据管理局,牵头数字政府的建设,也牵头公共数据体系的建设。三是统一建设运营。探索政企合作、管运分离的模式,引入国内信息技术龙头企业的资源逐渐了数字广东公司。四是坚持集约建设,建成一体化的云网和省市两级大数据中心,省级倾斜投入,对相对欠发达的地市,政务信息基础设施大力支持。五是强化整体安全。建立数字政府网络安全多部门的协同联动机制,初步建成一体化的网络安全防护体系。
从2022年以来2.0阶段,一是推动政务服务从快办迈向“好办”,事项的网办率达到96.4%,最多跑一此绿色99.8%。零跑动率92.9%。6694项高频服务实现泛珠三角区域。粤省事实名用户超过1.81亿。二是政府运行从信息化迈向智能化。三是省域治理从数字化迈向智慧化。基本建成了经济运行、生态换把、水利等专题。四是数据要素从资源向资产加快转变。全省4083个政务部门通过平台发布的数据类13万个,汇聚数据近千亿条。省市一体化的视频和物联感知平台,开放数据方面超过10亿条数据。数字政府建设的成果和公共数据资源体系形成是一体推进的。
经过六年的工作,公共数据的资源化初步形成了,因为相对集中,而且是可用性是比较有保障的。它的资源资产的权属也是基本明确的,因为在数字政府平台上的公共数据,甚至可以说是政务数据,权属基本明确的。但是有关手续方面还不完善,主要是登记,我们认为公共数据要变成一个资产还是要有一个必备的登记的手续。
因为我们认为如果说资源是客观形成的,以及是主观的认识,如果要变成资产,应该是法律要确定的,要成为社会的共识。所以资源和资产还是有不同的。广东数字政府从1.0向2.0发展过程中,最重要的创新要素就是数据,尤其是公共数据的流通,在有效市场和有为政府之间发挥了穿针引线的重要作用,通过公共数据价值的释放,广东数字政府在2.0阶段获得了新的动力机制,从而实现了四个提升,也就是由数字政府建设向引领经济社会全面数字化发展的提升。由数字化、信息化向智能化、智慧化的提升,由侧重政务服务向治理与服务并重,由数据资源管理向数据资产开发利用提升。
二、两级市场体系设计,推进数据资源资产化
市场化改革配置行动方案是1+2+3+X的改革思路,2是实践中的核心,规划了两级数据要素市场体系,一级市场是行政主导,主要发生的数据的流通的行为是共享,二级市场是以市场竞争为主的市场,主要发生的流通行为是交易。当然还有交换,还有开放等等,我们认为是共享和交易之间的形式。我们设计和定义了几个角色,包括规范公共数据运营机构,主要是开展数据资产合规登记,释放公共数据价值。
定义了数据交易所,是二级市场的核心枢纽,广州数据交易所、深圳数据交易所分别成立了。明确提出数据经济人这个角色的设置,可能广东是一个首创。还有数据第三方专业服务机构等等。在制度建设方面,地方法规方面制订了7个条例,目前按照20条的要求正在编制数据条例。规章制度方面已经印发了广东省数据流通交易管理办法、开放暂行办法,还有广东深圳各个地市也有一些探索。
在打造创造性应用场景方面,我们打造了个人和法人的维度进行汇聚。以上这些工作都是将数据这一生产资料通过汇聚成为数据资源,通过确权成为数据资产,通过定价成为数据资本,打通数据要素价值链。我们为了帮助自己在探索中,在行动中不会迷失方向,能够保持一个战略定力。
三、全力培育市场主体,全面激活有效市场。
我们出台了今年的工作要点,里面明确提出要培育不少于20家数据经纪人,建立3个以上交易配套服务基地,建设3-5个数据要素集聚发展区,授权2-3家机构开展市场运营,培育市场主体,激活有效市场破局,让市场要效率,向市场要效益。这个时代在数据要素领域,能不能激活有效市场,就是对有为政府最大的考量。
5月10日最新上线的集算力+交易+场景于一体的算力资源共享发布平台,覆盖16个重点行业的数据产品。还有广东数据交易所(佛山)服务基地也会成立,在这个进程中,我们更热切地期望与贵州和全国同行密切合作,携手前行,立足大湾区深厚底蕴,以数据要素流通为牵引,服务带动经济社会的更加全面的高质量的发展。
以上就是我的一些分享和交流,不当之处也请大家批评指正,也借此宝贵机会,向大家一直以来对广东的支持和帮助表示衷心地感谢,也欢迎大家常到广东来指导工作,最后预祝本次论坛圆满成功,谢谢!
【主持人】:感谢熊局长的精彩发言,广东省是全国经济发达的省份,敢为天下先是广东精神的精髓所在,在发布数据要素市场化、价值化方面,广东省做了很多的实践探索,刚才熊局长也从三个方面提到了广东在实践方面做了很多的一些探索和工作。
接下来有请中国移动通信有限公司研究院副院长魏晨光女士就我国数据流通基础设施的相关情况和趋势做报告,他发言的题目是《构建数据流通基础设施助力要素价值高效释放》,有请。
【中国移动通信有限公司研究院副院长魏晨光】:各位领导,各位专家,大家上午好!非常感谢主办方给我们这样一个发言的机会,跟大家交流和探讨。前面来自研究机构、学术界以及政府主管部门的各位专家们都做了非常精彩的发言。我们作为产业界,作为运营上我们也想借这样一个机会分享一下我们对于数据流通方面的一些想法。
数据和算力对于发展数字经济的重要作用不言而喻,大家都非常清楚。数据大家普遍认为是数字经济的核心的生产要素,同时也是推动数字经济发展的引擎的动力。这个数据能够发挥它作为引擎的作用,其实也离不开算力和算法的支持。算力不仅仅是数字经济的核心生产力,同时和算法一起共同构成了数据真正发挥作用的一个基石。
让数据能够更好的发挥作用,我们想它面临很多的挑战。从去年年底发布的“数据二十条”,其实国家也给出了政策的指引,构建集约高效的数据流通基础设施,包括数据可信流通体系,以及数据流通基础设施和构建多层次的场外交易体系等多个部分。即便要构建数据流通的基础设施,我们认为要实现数据流通也面临着很多的挑战。刚才梅宏院士的十个问题,以及敖立总他们发布的报告当中,对于数据流通面临的无论是制度层面、市场层面、技术层面的问题都做了非常系统的总结。我们认为今天重点探讨的从企业的角度来看,是想从技术层面看看我们怎么能够实现数据流通做一些事情。
我们试图提供网络化的数据连接即储即用的算力支持,实现安全可信的流通服务,当然前提是在政府合规的机制保障下来完成的。如何实现数据要素流通体系,我们提出一个设想。数据要素市场是全国统一的大市场,需要全国有一个数据流通的全国统一的网络。这个网络我们认为有三部分组成,算力网络基础设施是实现数据流通的基础设施,即储即用的算力,以及通达各个数据方连接的能力,是实现数据流通基础。
在这上面是数据流通的两级网络,最上面是国家级的数据流通网络,由一级的数据流通中心组成。除此之外是负责整个国家跨区域的数据的调度以及跨国境的数据流通的一个连接。在一级数据流通中心下面分行业和区域两种类型的数据交流中心。这个区域的交流中心可以是若干个省组成的大区形式的数据交易中心,也可以是以省为单位的数据交易中心。
有很多行业内部本身存在数据流通的需求,可以以行业为基础,构建整个全行业的数据流通网络。当然政府是比较特殊的一类行业客户,我们把它放在和行业以及区域级的数据流通是并列的。我们所设想的全国一张网的构想。
如何实现全国一张网?中国移动也是创新提出了DSSN的理念或者解决方案。重点是依托中国移动的连接算力和信息服务体系,为数据提供方、数据需求方、参与数据交易的交易提供方,以及政府监管的各个单位来提供服务。
通过DSSN以及下面的网络共同构建数据流通的基础设施。DSSN重点解决安全、合规这样一些数据流通的需要。算力网络重点解决连接的需求,通过DSSN共同助力国家来构建跨行业、跨区域以及跨不同主体的集约高效的数据流通基础设施。
DSSN的总体加工不复杂,主要系统组成有三个功能模块,一个是平台,因为整个架构就是平台+节点,平台是指数据共享平台,重点实现的是数字拴法以及资源调度,分布式的调度以及服务节点和需求节点的接入管理、数据的交付和交付的管理,数据的流通全链路管控等功能。数据服务节点,部署于数据提供方,提供数据源对接,DSSN专网接入、数据安全计算等核心功能。数据需求节点,部署于数据需求方,实现业务系统对接、DSSN专网接入、可视化开发、数据安全计算等核心功能。整个系统的开发也是聚焦四大核心技术,包括数算网络融合、大规模分布式协同计算,网格化可信隐私结算,以及全链路数据流通等等。
我们研究院按照总体的技术设想已经完成了技术验证工作,并且开发出1.0的信息系统,目前已经具备了试点能力。
1.0的系统产品功能就是刚才体的围绕着平台以及两类节点来实现,同时另外实现了数据交易服务平台的功能,因为下面中国移动提供算网设施,DSN提供数据服务,交易服务的提供。还有数据交易的功能,为了试点的方便我们也一并实现了。我们实现了整套的系统有几方面的特点,第一是多节点网络化数据连接功能。重点实现了标准化的数据接入协议,节点统一编码和路由寻址,以及节点的认证与风险控制。
第二,算网资源按需申请与调度。包括一站式资源的申请、开通、编排以及时延和质量保证等等。第三数据可信端到端交付。满足中、高、低密数据的交付需求,中高密数据交付数据可用不可见的交付能力,低密数据交付,数据可用可见可控的交付能力。第四,安全合规全链路管控,我们和区块链技术相结合,实现应用合规性审核认证,关键信息存证可追溯、交付过程的监控,以及第三方监管机构合规审核等等功能。
DSSN的应用场景,我们通过走访各类客户,包括政府数据主管部门,大数据交易所,以及行业客户等等,我们总结出来目前主要有三类场景:第一类就是服务政府数据的协同。包括刚才景局长讲到的数据的的整合。我们理解整合不是最终的目的,整合的目的是真正实现数据的协同和拉通,让数据能够实现1+1>2的效果,我们DSSN可以实现数据可用不可见,数据不需要集中在通一组服务器上,通过分布式的,可以存放在原有的系统当中,通过DSSN来拉通这些数据,从而实现公共数据服务,最终助力我们电子政务的提质增效。
对于交易机构来讲,在DSSN系统架构当中,数据交易的提供方,我们DSSN可以为他们提供交易撮合,数据交付等等一站式的服务。
对于行业客户来讲,行业客户不同的厂家之间,不同的企业之间,他们的数据怎么能够打通。现在大家也都非常关注大模型,那天李彦宏在中关村论坛上还讲大模型出现以后,我们所有的应用都要重新做一遍,可能很多人也看了他的讲话,每个行业都需要自己的大模型,这种大模型的构建离不开优质高效的大数据。所以对于行业客户来讲,怎么能够集整个行业的优质数据,打造行业的大模型,我们认为DSSN可以提供一个很好的基础。
今年4月份发布了《数联网(DSSN)白皮书》,同时创建数联网(DSSN)协同创新实验室,诚挚的希望与产业界各方合作伙伴一起,通力合作,共同推动数据要素流通,技术的法产业的成熟,助力数字经济的发展。
最后,再次感谢大会主办方,祝这次论坛圆满成功,谢谢。
【主持人】:谢谢魏院长的精彩发言。下面有请零点有数董事长袁岳先生给我们带来主题发言,他的发言题目是《以算法模型发育作为数据交易发展新动力》,有请袁总。
【零点有数董事长袁岳】:感谢会议主办方的邀请,有机会来和大家分享我们的一些观点和想法。前面的嘉宾很大程度上是强调了算量和算力,在智慧产业智能化的发展和人工智能的产业中间,其实始终是三个要素,但是为什么我们强调的一般都是那两个要素,包括数据交易本身实际上,包括现在有些交易所已经把算力交易放到这个里面。
依然是讲两个要素,我给大家一个形容,我们西部,包括贵州农产品和发达,大白菜中心约等于大数据中心,但是一个国家食品业的发展由什么决定,做出什么食品和做出什么样的菜,菜和食品约相当于菜谱、食品配方,约相当于怎么做法,约相当于算法。算力就是锅具、餐桌,老百姓满意吗?不满意,但是没有菜,算法对于数据交易的推动,食品业大发展的时候,这个地方本来没有做菜,菜再远都会买来。东南亚跟我们交易的时候,我们与东南亚的自贸联盟,很多菜都是从东南亚过来的,而且零关税,交易就会很发达。因为中国人爱吃,中国人要做,中国人食品的发达。这是算法模型的发展才会给整个市场带来巨大的推动。
这张图我把算法放在整个思考问题的中心,把数据作为原料供应来支撑它,算力是保障你的整个算法的运行和数据被运用而形成的一个支撑。我30年以前创业就做数据分析,我每年现在能够做到1500个左右的客户,用数据的,但是用传统的数据分析方法每年要0.5P的算力,但是我用了小模型,2014年我们开始探索用算法模型为客户提供自动化的分析。
用了小模型之后,我们需要2.5P的算力,但是从前年开始,像ChatGPT才是大模型,刚才大家讲的行业大模型,不存在行业大模型,行业只存在中模型,通用性才是大模型,我们国家没有大模型,百度能干的只能覆盖少数的领域,盘古大模型,华为的金融,医疗它也只有少数领域,只能覆盖少数领域的叫做中模型。
一旦我们干出了这个模型之后,我们再发展政务的中模型和供应链智能管理的中模型。中模型需要100P的算力,今天我要干100P我可以干1/5的使用,模型的使用我巨量的改变对数据需要的量,对算力的需要量不同。只有我们改变了吃菜的方法,改变使用食品的方式,才会改变对原料的使用模式和使用量,和对生产资源的产能的需要。
我们假定,我们每个人都有一个脑子,比如说贵阳也是智慧城市,我们现在为止都讲了很多的数据,我问一个问题,贵阳有多少个政务算法模型,上海是我们国家用得比较早的,你有多少个政务算法模型?约相当于你有多少颗脑细胞,你干了好多遍智慧城市了,怎么会没有脑细胞呢,所以本质上是一个脑壳,没有脑子。没有脑细胞你的信息输进去没有反应,有脑细胞才有脑壳的反应能力。所以一个企业说是智慧工厂,我说你有多少个工业算法,如果你现在是医疗的,你说是智慧医疗,你有多少个医疗算法,无论是修图还是智能手术的。
我们不限于说大模型,大发展,我们国家连小模型都没有,我们是服务于常模的建模技术,算智商的时候那个模型叫常模,我们以前做的统计分析,那个是常模,今天的模型是为一个特定的场景而专门建设的特有模型,那个就是大规模建模能力。我们连小模型都没有,ChatGPT大模型怎么来的?首先要做大量的运行链,就是建设大量的小模型。这个也不奇怪在什么地方,我们一个省政府,一个市政府干了那么多智慧产业,他的预算全部在算力和算量上。
一个企业干的投入,只干了系统,但是没有关于工业算法模型的投入,怎么会产生模型呢?所以今天我们讲的甲方购买了大量的算力和算量,就算有的话能构成交易,但是因为没有买脑子,所以它的产业还会保持在较低的水平。我非常欣赏各个地方要培育市场,其中算法模型的发展是一个非常重要的方面。今天我们来看大部分地方的中心开始有了新的概念,叫算力中心,以前叫数据中心,请问有算法中心吗?
因为三个中心中间,只要没有这个中心你就是大白菜中心,再加上灶台中心和餐桌中心,没有菜的中心。让顾客点菜的时候,顾客是点菜的。这是我们中间很重要的差异,今天我们借用场景这个概念,场景是提出问题,模型是回答问题地数据是为回答问题的答案所提供的原料中心。所以我们衡量一个地方,智慧化、产业化,包括将来需要更多量的数据和数据量的活跃,跟算法和模型发育有巨大的关系。
其实我非常喜欢梅宏院士提出的十个问题,我也提出了十个问题,但是每个问题非常关键。第一,如果常模与建模的分野。第二,大中小模型关联。以我们现在对模型的投入水平,大家要知道那个ChatGPT到现在投资116亿美金中间,大约80亿美金用于模型建设,560亿人民币。请问有一个地方投过5000人民币干过模型吗?我们只有小模型,我们在某一个领域建设了中模型的能力,才会对大模型的运作方式,包括未来生成的可能性,所有都建立在小模型的基础上,所以这是一个基础建设。
第三,一二三层楼模型支持机制。我们是干小模型出生,所以过去美国的互联网大厂和软件大厂,他们已经建设了一层楼,我们叫做基础模型。GPT解决了二层楼通用模型,我们是干三层楼应用模型,过去二层楼自己建,现在我们可以在二层楼基础上盖三层楼效率就高得多。比如说复旦大学、清华大学发布的模型也有帮助。第四,平台与内容加载。现在有很多先进的模型在15年以前的模型上都可以加载使用。很多西部地区从食品业里收一点税去干一些没有意义的平台。第五,算法与算力匹配。贵阳提的算力支撑还很有价值。
第六,业务因素与技术因素的建模价值。大家不是说只有技术部门和干IT的才能,其实新型模型的发展跟业务要素发展非常关联的。未来业务经验和业务要素的提炼是数字化,是把这个东西化,不是一个搞数字人专门在那里念。
第七,TOP-DOWN与DOWN-TOP路线。场景需要什么,所以我们提出来的,而且类似的场景全国各地都会发生,为什么一个地方按照行政区划来做呢,这可能都是问题。第八,模型流动性与数据流通性。第九,工作量与预算。第十,模型建设与模型人才培养。这十个问题对我们推动算法模型的大发展很有用。
我的基本看法,算法模型决定了数据类型、规模、特征的价值,决定数据调取、调度、调查的意义,所需数据的状态、特征和质量,数据使用的效率、效益和优化指南。
算法模型的可交易性大于数据,算法模型流动性限制小于数据,但算法模型可交易量有限,所以价值比较有限。未来数据交易的深化,是以算法为驱动的,再进一步推动数据的应用,在数据安全架构下面,算力支撑下面,使得数据交易达到更大的规模和更好的发展,谢谢大家!
【主持人】:感谢袁总的精彩发言!下面有请广州数据交易所总经理魏东先生给我们带来主题发言,他的发言题目是《数据要素市场赋能产业高质量发展》,有请魏总。
【广州数据交易所总经理魏东】:各位领导,各位专家,我尽量挑重点给大家汇报。汇报题目是:数据要素市场赋能产业高质量发展。广州数据交易所在去年9月30日揭牌开始运营,在大的政策背景下面有一些运行的基础。接下来重点从五个方面讲讲目前运营的情况。首先是保规范。我们之前有全省的管理办法,以及中间出台了规则规范。广东数据交易所的运营过程中,出台了若干补充细则,包括交易的工作指引、行业平台的交易指引,另外一些文件,涵盖了重点项目,交易服务基地的管理办法。
我们佛山的服务基地面向制造业为主的基地出台。整个运行的规则体系,首先讲讲合规,分为四个步骤,同时在统一建设的登记平台下面开展合规工作,首先是登记主体对作证材料进行提交。第二交易所来组织相关机构进行前置审核工作。然后数据资产委员会进行终审工作,然后进行公示颁发凭证。怎么样在合规的情况下怎么保证效率的问题。普通程序和简易程序的分支,有些可以走简易程序,提高合规审查的效率。
这是广东数据交易所的平台体系,重点上是沿着“1+2+3+X”的体系来做的,广东省数字政府的基础设施,不重复建设,提高效率。同时依托两级市场的设计,一级市场主要是以政府主导的数据资产的供给市场。二级市场是以交易所为枢纽的交易的平台,一个流通交易的市场。一级市场整个合规登记的过程,重点是面向公共数据和商业数据。交易平台是由数据交易所承建的。有一所多基地多平台的设计,5月10号发布了服务基地,把交易所之外的一些服务工作拓展到广东省的21个地市,区域的基地从物理空间上把服务延伸出去。
另外是多平台,是行业平台。我们在二级市场里面,交易所建立的是普适性的,通用性的服务平台,面向不同行业在实体经济发展过程中,随着数据要素基础工作的推进,他们已经取得了一些基础性的事实上的数据要素流通交易所支撑的平台。我们在这个过程中结合行业平台的基础,把广州数据交易所,把要素流通体系规则植入进去进行升级。这是从深度上推进行业的发展。在这两个服务的设计的基础上,我们支撑了相关一些行业,像水产、陶瓷等等行业。全省建立了统一监管平台,这个平台体系里面有两级市场,三个平台,一个是登记平台,第二个监管平台,第三个是交易平台。
我们建平台的时候有一个平台体系,有别于同行的做法,首先对接数据资产的登记平台,未来还会建交付管理的平台,我们会对交付过程进行全流程的管控。
另外对于基地服务、行业服务的平台要对接。同时还做了一些创新应用的平台。交易标的我就不再展开,主要是四类:、数据产品、数据服务、数据能力、数字资产。
这是场景,我们也在5月10号进行了发布,光都数据交易所的数据情况,目前300多家会员,1200项交易标的,交易额突破10亿。涉及的这些行业最后有一个例子简单跟大家分享一下。这里面是我们5月10号发布的一些数据产品,在公众号上有材料,大家可以关注。我们做数据交易的时候还是培育阶段,我们重点做构生态的工作。我们严格坚持一条红线,作为交易场所是服务平台,绝不做产品本身的开发。
所以我们围绕着第一个维度,在构建数据交易全链条的生态,从数据供需方,到广东省首创的数据经纪人到第三方的专业服务机构,让利于各方,让大家积极进场来交易。第二个维度打造前省跨地区协同的统一交易服务平台。第三建立数据交易所可信互认的生态,连接区域、融合行业。近期我们会在特定行业做一些尝试。
守安全,促进安全合规,交易高效规范。从交易、系统、产品、生态安全等方面做安全的保证。
最后讲一个典型案例,5月10号发布了这个产品,陶瓷交易证据链证书,数据二十条的专家我们再次走进现场进行调研,也非常有特点的一个数据产品,通过数据要素的流通来赋能或者是支撑数据实体产业的工作。它的整个背景是这样的,大家知道广东陶瓷产业全国比较发达,主要集中在佛山,佛山大概有30几家陶瓷的厂商,出资设立了一个陶瓷的平台,本身这个平台不做陶瓷,是做供应链的工作,把上游的集中采购拉进来。
所有瓷砖上游的原材料是参差不齐的,配方非常多种,没有实现标准化。所以第二步做了标准化,在标准化的基础上面把整个物流,从商流到信息流到物流建立起来,这个产品最开始是管理,沙泥在上游很难界定成本的,所以下一步规范经营的终端厂商在交付的时候,税收的成本是非常高的,因为是进项不能很好的确定。
2018年税务总局出台了20号文,产品依据这个文,通过交易证据链的信息,来反推交易成本,来实现税前的抵扣这个依据。我们看起来也是整个生产过程中本身产生的数据,最后物流环节的上下游去采购它的数据产品,然后来支撑相关的税收抵扣的产品。这块还是数据要素流通中真正能够实现对数据实体产业的支撑工作,以上就是我的分享,谢谢大家!
【主持人】:感谢魏总的精彩发言!接下来有请华为公司数据总架构师马运先生以《华为数据要素流通探索与实践》做主题发言,有请马总。
【华为公司数据总架构师马运】:很高兴今天有机会和各位领导专家一起探讨一下数据流通领域的问题,我们是站在企业视角对这个问题进行探讨。我们先看一下数据流通的几种模式,最简单的模式就是系统跟系统集成对接,是数据IT的一部分。第二个比较流行的方式是数据汇聚,数据汇聚到中台然后再共享出去,这在企业内部是非常流行的。随着数据成为生产要素是有价值的,这时候就不能随便共享了,就走到了数据交换,数据交换一定是有合约的。这是三个大的阶段。
从华为整个数据工作的历程来讲也跟这个相匹配的,华为第一阶段做的是数据清洁,为了让主业务能够打通,你在这个系统中定义的数据跟另外系统中定义的数据能够通,财务报表才能准确。我们从2014年做到2017年基本完成了。
第二个阶段做数字化转型,打破数据的部门墙,把数据汇聚到数据底座再分享出去。
到了一定的程度走不下去了,平时我把数据拿给你用我还承担很多责任,到了这个时候到第三个阶段,建立数据空间,使数据能够可控的交换,使数据成为企业高质量发展的核心竞争力,这是我们三个阶段。
第一个阶段数据清洁,关键是要建一套体系,能够保证你的数据从定义到使用都是按照一定的规则进行的。我们公司有总纲,有架构标准、有组织、有流程、有IT。
第二个阶段,在业务数字化的基础上,数据散落在各个交易系统中,华为有3000多个系统,这时候把重要的业务数据入到数据湖里,然后再加工做个服务开放出去,这是我们做的第二阶段,做了五年,这里面有事关时的数据湖,有T+N的。在华为的数据之道这本书里面有介绍。
第三阶段,范围扩大了,不光是企业内部的共享,要跟供应商、客户、其他组织进行交换,华为这么大的一个企业全球经营,我们内部也有各种数据交换,也有主体,一定要解决数据清算和交换的问题。怎么解决呢?我们认为数据流通、数据交换最关键的一个问题就是要解决数据的两个特征,一个是非排他性,其他生产要素都是可以排他的,你可以用,他也可以用,第二数据的复制是零成本,你不解决非排他性和零成本复制的问题,数据流通做不起来,我不愿意把数据给出去,给出去了数据价值一下就没了。我们在可信可控可证的基础上建立企业数据空间EDS的生态。
我们有几个关键设计,第一个关键设计是数据的使用控制技术。第二个整个交易对象。第三个怎么清算,最后是怎么保证安全。我非常快速的把六个关键设计给大家讲一下。第一个是使用控制。要做到谁在什么时间,用什么APP,在什么地点,使用几次,做什么事情都能够控制,而且在程序上控制,不是在签约上控制,这是第一个非常关键的,做不到这个数据流通会受到限制。
第二个在整个数据交换过程中,它跟一般的集成不一样,首先有数据交换的资源。资源对数据进行切片,然后分装,按照一定的格式转换,变成数据交换的单元。交换单元是传输、验收、清算的最小单元,几个交换单元合起来,再加上使用控制,比如你的数据可以使用一个月,这时候再加上我的定价。然后再是合约,合约就是两方,咱们商定好这个数据,然后用什么交付方式,怎么验收,怎么支付,这是一个完整的过程。
第三就是清算,清算是一定要清算方要注册,然后我在不同的数据流通方式,我都要上报,上报了以后就可以对它进行统计核对,这时候每个主体都能够清楚知道,我持有什么数据,获得什么数据,加工了什么数据,我给了别人什么数据,这是一个清算。第四,查证追溯:所有的交易过程都有探针。
第五,安全可信连接器设计,这个使用控制,我是通过一个壳控制的,通过数据连接器,有不通的安全等级,最简单的我是在应用层控制。第二个环境级的,Trust的连接器,我还能对环境进行控制。第三个是硬件级的,我的使用控制不光在应用层,我可以在系统操作层,在存储层可以删掉,这个数据不出集群,我在存储层控制,它出不去。不同的业务需求可以有不同的安全连接器。
第六,消费APP可控接入设计:针对不同类型的数据增值APP,提供三种差异化的APP接入能力。如果说就是一般的工具就布进去一般的算法。本身一个APP是带存储的我们也有方法做一些改造,让它受我的控制策略的影响,最难的就是SaaS这种APP,它本身是一个平台,这时候我们要用虚拟内存的方式进行对接。这样我们就能够控制数据的使用。
我们设计的这一套是去中心化的数据空间,一定要有一个标准的框架。你清算的标准、使用控制的标准、资源的描述、接入认证等等需要互认,互操作,这时候我们积极参与,信通院也非常有研究的,信通院组织的国家标准的制定,还有欧盟的IDS、GAIA-X这些标准制定,我们争取做到在底层是能够互认互通的。
我们的愿景是:保护数据主权,消除数据孤岛,促进数据流通,释放数据价值。袁董事长提的白菜,餐桌、厨具做饭的问题,我们相当于建一条冷链,一般的货物运输是常温下的,你的货物我需要保鲜,这时候有冷藏冷冻,我要建一整套冷链,这个冷链我这个数据非常重要,我要对它的进行使用控制,咱们在冷链里面传输。为什么我们的算法开展得不广泛呢?因为没有数据,企业不愿意把数据拿出来,企业拿出来就失控了,如果有冷链,你再好的厨师如果没有冷链把所有的货物送到全国各地,那也不行。
我们等于是建一套冷链系统,如果一般的数据就走一般的集成方式,如果这个数据你觉得非常重要,你要想可控那就进入冷链系统。冷链系统所有的环节我们都是可控的。在这个基础上,我们有不同的存储能力,因为冷链的仓库跟一般的仓库是不一样的,所以我们有先进的数据的存力,实际上有算力、存力,存力也是很重要的,尤其是拉开数据的形势下,这样我们就能够支撑这么一个数据空间的生态,能够繁荣我们的数据的要素的市场。
给大家汇报一下建设和应用的情况,我们内部已经开通了39个连接器,用户2000多人,有1万多个资产上架交换。具体场景有内部高密数据互相的传输共享,我们有生态,鲲鹏生态和OEM厂商全是用这个在交换,因为我要做到数据可控。
对外华为云已经把EDS作为云服务,6月份要发布,同时存储产品线也有针对EDS的专门的存储,如果你要求控制得高可控的情况下,我们有硬件级的解决方案。这是华为EDS建设和运用的情况,时间有限我今天就快速讲一讲,谢谢大家!
【主持人】:谢谢马总,接下来有请奇安信集团副总裁罗海龙先生以《完善数据安全基础设施建设促进数据要素流通与价值化》做主题发言,有请罗总。
【奇安信集团副总裁罗海龙】:各位领导,嘉宾,大家下午好!很荣幸来到爽爽的贵阳,给大家讲讲。刚才很多专家讲到的内容,给我们带来一些挑战,我们做数据交换过程中怎么保证交易安全性,因为交易意味着流通,交易就意味着有了产值,有了估值。这种估值到底怎么保证安全,实际上是非常大的一个挑战。
在数据要素这部分内容里面,第一部分我们做了数据资产化,做了数据资产资本化等等内容。每个阶段里面我们都有非常多的问题,而这些问题我们怎么去解决,怎么能保证数据安全性,我们面临一个非常大的挑战。到底在这个过程中我们面临哪些风险呢?我们经常提到数据被盗了,被勒索了,这是大家经常看到的问题,最重要的是数据被滥用了。
我们曾经去某一个大型的互联网公司,数据泄漏了,造成敲诈事件,公安部立案,让他责令整改。我们跟他们聊天的时候,问了三个问题,业务分布在哪里,存储哪些数据,数据流转怎么实现的?这三个问题说完了以后,大家基本上没法回答,后来一个多小时时间画了一个大致的图,这个问题怎么去解决?
不提供这样的内容我们没法解决的,所以数据要素流通和价值评估,以及交易的内容能够帮助大家去解决问题,安全的问题依然存在,最终怎么解决?我们用了非常规的方法,在所有业务程序里面注了一个木马程序,用木马程序抓到了内鬼,解决了这个问题。讲这个故事我想告诉大家一个什么问题,作为一个互联网公司在IT层面已经很先进的情况下,对业务数据的流转和交换他都搞不清楚的情况下,对我们国家来说数据的安全问题其实是一个非常大的挑战,也是一个极大的空白。
我们老是忽略了一点,说数据安全就是数据安全,老是忽略了网络安全。数据安全是在网络安全的基础上的,如果你下面的物理设备,操作系统漏洞百出的情况下,你再去做数据安全一定有很多缺失,所以我们谈数据安全的时候不要把网络安全忽视掉,应该在网络安全基础上加强数据安全的建设,这才是核心。这个过程中会出现非常多的问题产生。举个例子,我们曾经在某省的大型的云厂商,他在下面跑了很多业务系统,每个大型业务系统里面有1300多个API接口。
我们所有业务的系统里都是API的接口,大家知道哪些API接口是使用的,哪些是没有健全的,哪些API要传很多敏感数据的,大家清楚吗?95%的人回答不了这个问题。我们曾经做过一个测试,整个API接口里面,75%的API不具备健全能力的,认证都没有,直接访问拿数据了。60%左右的API全部都要传敏感数据产生,35%的API接口是不使用状态。
在数据里面,未来API接口是非常重要的环节,我们有管控吗?我们有对它的权限控制吗,传输内容你有考虑吗?完全没有。这种情况下我们做数据交易是非常危险的。我们到底怎么保护这件事情?经常提三个词可视、可控、可管,太难了。
我们要做数据的分类分级,真正能把数据的分级分类做到完整的哪些企业能实现?在这种情况下我们怎么进行可控可管,这是巨大的挑战。第一件事情做到可视。我们国家有多少数据流往国外,我们做的一些测试,某大型的医疗机构在向德国传送所有的就诊信息,我们拿到这个数据以后,找到大型医疗机构的领导之后,他说不知道。
我们有很多制造性的企业,我们到底知不知道网络里面流的哪些敏感数据,流到国外去了。这些事情我们解决不了。
我们到底怎么实现可视,在数据传输过程中都能够发现里边传输数据的情况和每一个接口安全性的评估都要实现。用户端是什么样子,终端设备是什么样子,网络传输过程中使用什么内容,应用侧、数据侧每一侧里面都能看到相关的内容。
刚才举了一个网络侧跨境的例子,一个API的例子,再举一个,大家知道你的里面有多少个特权账号吗?这种特权账号你有管理吗,你有哪些僵尸的特权账号,新建了哪些,哪些是真正使用,哪些是该授权,不该授权的,95%的人不清楚,你怎么考虑数据安全的问题。可视在每个环节都能够看到的内容。
第二部分数据交易可控的内容。我们交易数据是需要原始数据吗?不需要,你都做脱敏给他了,数据交易过程中,我们要强调一点使用方使用的数据可能是你原始数据加工以后他要的结果而已,并不需要你的原始数据。这种情况下,我们可以做到你在交易的过程中,不看到原始数据,拿到少量的数据就可以了。这是数据可用不可见的理论,这个技术完全可以实现的。如果大部分数据可以这样交易,我们是不是可以考虑采取这种模式。
再一个是可管,我们能够看到,能够控制的前提下才能建立数据流通的模型。整个过程我们都需要监控体系才能实现。说句真心话要达到可管这个概念,数据安全建设任重而道远。
我们到底怎么实现这部分内容?可视、可控、可管,在数据领域里面没有泄密关系,强调以零信任的构建的架构和零信任的理念,我们对数据管理者是零容忍的状态,可能这一分钟具备数据访问权限,但是下一分钟就可以关闭,因为我觉得你有很多风险和问题。
所以基于零信任的数据资产访问才是我们在可控里面最核心的环节。这里面就强调了主体、客体的访问内容,左边是主体,右边是客体,就是数据,要到整个数据架构,数据模式、数据字段等等每个细节都要考虑清楚。我们在中间加一个动态访问体系,只要实现这种理念,我们的控制点可以放在API、应用上,可以放在防火墙上,可以放在任何终端上,落脚点和执行点是可以变的,但是动态调整是不变的。所以要建立零信任的体系。
前期推出这个理论以后,我们推出数据安全保护系统,包括数据的检测、危险的检测以及全时境的监管。首先要看清数据,到底在流什么数据,怎么流的数据。然后是控,最重要是基于零信任的理念来实现。最后是管,把数据安全情况,监测结果,运维情况统一控制在平台里面,才能实现总体的可控、可管、可视。
数据安全对于我们国家来说任重而道远,我们先看清楚自己网络中流传着什么数据,再去看怎么去看,怎么去管,怎么去控,谢谢大家!
【主持人】:谢谢马总的精彩发言。下面有请云上贵州大数据产业发展有限公司副总经理黄明峰先生做主题发言,发言题目是《数据互联网体系构建与探索》,有请黄总。
【云上贵州大数据产业发展有限公司副总经理黄明峰】:各位嘉宾,大家好!我代表我的团队贵州在数据流通交易方面的探索实践,包括我们的一些思考分享一下。今天景局的交流更多是政府的体制建设,我们偏重于技术层面的思考,有些是探索,有些是尝试,有些已经用起来了。
我们认为为什么数据交易难?它跟数据流通是什么关系,行业的冰点什么时候破?我认为都是目前困扰我们的一些难点和要点。定价难、确权难、开发利用难,数据交易构建的前提是什么呢?我们两年多的实践和探索里面,我们认为流通体系的构建是破解数据交易难的关键标的。同时数据流通体系是来构建我们供需双方有效供给的一个非常重要的关键基础设施。
数据怎么提供?提供给谁,怎么去发现,交易所和数据提供者是什么关系,我们的数据的流通,我们数据的原始提供者、流通环节、服务环节和交易环节、应用环节怎么打通,我们认为都是在推动当中的一个难题,我们认为破解这个难题的根本是在于构建这样一个网络体系。因为定价难的问题,从技术团队的角度来讲,实际上我是有意回避这个问题,为什么回避它?
因为我们知道商品经济最早实现的时候,是等到一般等价物出现的时候,才有了定价这个事情的出现,才有了价格矛盾的事情出现。我的技术团队认为,现阶段要破解一般等价物的出现是很难的。靠什么来实现呢?你靠流通,在流通过程中让我们的市场主体去找到数据的一般等价物,所以我的技术团队,因为贵州我们有两个团队,一个是交易团队,我负责流通团队,我的观点就是通过构建流通的广谱的互联体系把大家连在一起,推动流通以后解决场内和场外交易的问题,解决供给双方还有服务方多方的难题,来盘活市场。
从前年开始我们一直在做这件事,我们当时提出《省域数据流通的自治白皮书》,我们提出多方的参与,云上拉开数据,人工智能、区块链等等混合构建的共享的安全体系来数据全域的治理,安全可信、公平交易和可持续化的数据生命周期的治理体系。我们也不断的按照这个体系在构建,我们认为在构建整个价值互联网的体系里面有一个非常重要的概念,叫做自治的概念,域的概念,这个域既是一个技术的概念,也是一个组织的概念,也是一个空间的概念。比如省域是一个概念,行业是一个概念,个人机构也是概念。
我们推崇的治理体系应该是法律、技术、伦理、制度,自治的自我约束以后进入到交易云平台里面,来推动我们的广谱的互联和广泛的数据流通积极性的构建体系。在这个过程中其实最难的,魏院长也好还是其他人也好,观点我都非常认同。
我们的着力点不太一样,我们在构建资源体系过程中,我们发现难的不是计算体系的构建,难的不是资源体系目录的构建,难自是怎么样基于我们的自治的体系下,让大家去发现你存在的价值,这个是很难的一件事,包括不管是在政府的数据交换体系下,还是在组织间的数据交换,你怎么样懂得别人数据的描述,怎么样去发现在这么一个广泛的网络体系里面数据价值,我们认为这才是构建这张数据互联网的最难的地方。
就像我们的数据交换,我打了一个比方,现在还是属于人工交换阶段,你要什么东西给你配个API,但是实际上这种能满足我们互联网的交换模式吗?不能。所以现在它是朝着半自动交换的方法去走,朝着全自动的方法去走,这里面就有很多关键技术和关键领域。除了技术体系资源标准的下面,我们的跨模型的技术,还是数据自有流通的关键技术所在。
这是我们从2021年到现在,我们在面对怎么破解流通难的体系里面我们的一个变化,最早1.0提出省域构建的市场体系,目前省域和全国的体系不太一样,我们提出跨域互联,提出数据互联网的概念。
从实际情况来讲,算力、数据和算法在整个现实流通当中不可能分割,当前的技术也好、法律也好是不可能分割的。所以我们认为应该构建这么一个体系,算力、算法和数据的体系来做这个事情。同时我们提出一个数据网络的协议的一个模型,这样我们来构建一个很重要的观点,多元异构的跨域的流通体系里面,需要大家去构建边、中心、网络、应用的技术架构。
通过这个模式我们认为推动数据交易所,还有场内交易和场外交易体系的构建,它是一种广泛的互联在一起。同时应该充分的把WEB3.0的观念和域的观念仅仅结合在一起,推动广义上的数据的互联体系的构建。我们也提议,通过这种方式以后,通过场景基础设施的构建,通过构建生态体系来促进繁荣。
最后感谢我的团队,因为我们做的市花了2年多的时间,我们和华为一起,马总一起,私底下做了很多的观点碰撞,同时数据互联网也是开放的概念,也希望通过这个平台,大家联系在一起,多多交流,多多为破解行业流通难的焦点多做贡献和努力,谢谢大家!
【主持人】:谢谢黄总从技术层面的理念和架构的实践。上午的主题交流环节就结束了,还有一个圆桌讨论的环节,本环节由中国信通院政策与经济研究所副所长孙克先生主持。现在我把主持人位置交给孙克副所长,有请孙所。
【中国信息通信研究院政策与经济研究所副所长孙克】:感谢敖总,非常感谢大家坚持到最后一个环节。有请今天最后的重量级的嘉宾,他们是海南省大数据管理局局长董学耕先生浙江省大数据发展管理局副局长蒋汝忠先生,北京思特奇信息技术股份有限公司董事长吴飞舟先生,贵州数据宝网络科技有限公司董事长汤寒林先生,清华大学社会科学学院经济学研究所所长汤珂先生,深圳数据交易所产品总监张帅先生。
数据要素这个话题,在十九届中央政治局学习的时候,总书记明确提出以数据观念要素的数字经济。另外去年6月22号中央深改委的会提出了要求,数据产权、流通和安全治理,这是我们的背景。前期国家的文件,“数据二十条”里面我们也遇到了一些困惑,现在并作一轮提问,每个领导只有3分钟的时间来回答。
第一个问题,政府在数据流通环节中的实践、政策和想法。这个问题提给董局和蒋局。
【海南省大数据管理局局长董学耕】:要做好这项工作,最重要的是要理清概念,公共数据的概念大家是混用的,公共部门采集的数据,一会儿是公共的数据跟企业经营没有关系的数据。要解决这个问题,首先看“数据二十条”,大家一看很兴奋,有三权分置,但是大家没有注意在“数据二十条”的第六、第七条里面还有两个概念,一个是数据处理者,一个叫做数据来源者。大家注意数据来源者,回到个人信息保护法里边讲数据来源者也是个人,他对个人数据拥有知情权、决定权,这个决定权高于数据处理者的三权。
我们现在大量讲的数据是涉公数据,公共数据不是大量的公共数据,大量的企业数据。我们作为数据标的的产品基本上是涉公数据,涉私数据怎么办,我们政府管理,大量的数据能够无条件共享的百分之八九十都是有条件共享,就是涉私数据,涉及个人隐私,涉及企业的数据。所有的涉私数据都是不能出域的,要想使这些数据能够交流融合,能够组合产生新化学反应怎么办?扩大安全域,怎么扩大?
由政府背书,在电子政务外网来扩大,公共数据在里面,公共采集的数据在里面,还有各类数据可以进到这里面进行融合,产生化学反应,最后怎么确权产生数据产品。更大安全域里面是数据不出域,形成数据产品以后,在场景使用环节下,由这些涉私的关联对象,就是数据来源者叫关联对象,个人也好,企业也好,在授权的同时使数据能够激活,这样就能够把数据产品的经营权落实到开发者头上,形成数据的确权、数据的交易,形成这样一个大的安全,我们海南叫做数据产品超市,第一它是一个生产环境,第二是一个交易流通平台,它和我们现在所说的现成的数据交易所不通。第三是一个安全使用的环境,只有在安全使用环境下才能够授权,授权的同时实时激活。最后场景驱动,总的来讲就是各种各样的算法融到里面来,场景、算法、应用。
【浙江省大数据管理局副局长蒋汝忠】:我们浙江疫情这几年刚好是浙江全力推进数字化改革的两三年,跟外街交流得很少,基本上埋头在干浙江的数字化改革。浙江数字化改革,我们大数据局干的最重要的一件事情是一体化、智能化公共数据平台,建了省市县三级,100多个节点,跨全省的一个政务外网的数据域,我们就像魏晨光院长讲的数联网,相当于省域范围内公共机构的一个数联网。这是我们干的第一件事情。
第二件事情,我们要把浙江省公共数据到底有什么,把这个资产摸清楚,我相信在座很多局长可能不清楚你全省有多少套系统。浙江省全省有的应用系统15199套,今天刚刚的数据。浙江省的数据项,公共数据项有多少,凡是在浙江的国家机关还有供电、供气,公共交通数据全是公共数据,省级的数据项13014条,每天都在变化。全省的数据项就很多重叠的,刚才袁总说浙江模型有多少,我们没有专门统计模型,我们统计组件,除了数据的API接口之外,组件能够服务多少,994个。所以是把数据资产模型出来。
第三个推进全省的数据共享。我们建立的一体化的数字资源的管理系统,我们把应用、云资源,就是算力,把组件就是这些模型,把数据全部资产搞清楚以后,全部在一个系统里面管理,我每天最主要的工作就是审批全省的数据共享,这是2021年10月份上线的,到现在为止,我审批通过的浙江省全省的数据共享3万多件,组件共享2000多件。
所以这是我们整个数联网在公共领域里面共享,面向社会的开放,我们的数据开放应该是全国省级政府里面开放数据量比较大的。我刚才看了广东10亿条,我们110亿条,我们开放数据量还是很大的。第二个我们每年开数据开放大赛,每年大概1000支队伍参加比赛。今年马上又要开,所谓开放共享的推动。
至于交易所,交易中心这块,刚刚贵州用“冰点这个词还是比较恰当的。我们浙江也有一个大数据交易中心,杭州、温州都在做试点,有些成效,但是成效并不是很显著,场外交易还是比较少。我们也在推动浙江省公共数据授权运营,省人大有个条例,浙江省公共数据条例里面,规定公共数据要授权运营,而且是免费,抛出算力成本之外,数据是要免费的。
数据共享里面的授权里面,要达成部门的共识很难,我们文件都已经搞定了,最后要发了,在发的最后一个环节,因为我参加过省政府的很多讨论讨,讨论公共数据条例的时候,各个部门,各个省领导之间意见分歧最大的,所以这个工作要达到全社会的共识现在还需要不断的努力。
【孙克】:感谢两位处长,前期做政策研究,包括浙江、海南、广东都是我们学习调研的前期的范例。我们刚才协调从政策层面、政府层面我们做了一些思考或者解读。下面第二个问题提给汤教授,从学界去认识,尤其数据要素流通的政策或者法律层面,我们请汤教授给我们一些政策建议。
【清华大学社会科学学院经济学研究所所长汤珂】:我们考虑政策的时候,肯定要有基本经济学原理的。政策的出台应该和推动数字经济发展的基本目的和方式或者是基本的目的是相符的。在整个数字经济发展的过程中,我们看到数据是数字经济发展血液。
所以我们也能看到“数据二十条”里面,我觉得一个很大的创新是产权制度的创新。因为当时大家一直在讨论的过程中,一直觉得实际上过度的强调所有权是不太容易促进数据的流转的。因为在这个时候数据的所有是比较难以确定很多的时候,它牵扯到很多方,更多的时候我们应该考虑到数据将来的流通,所以要从财产权的角度,财产确定的角度创设出数据新的权力。刚才梅宏院士也讲到这个东西其他国家没有,我们要创设性的权力,通过这个来推动数字经济的发展。
同时大家看到最近一些新的人工智能的科技革命,它的基础都是数据的量的大小,所以我们应该是通过市场的手段,这是第一个原则。第二个手段是财产保护的角度出发,然后来推动整个数据的流转,同时相对来说根据数据分级分类来进行事前事中和事后的监管。
【孙克】:感谢汤教授,原来在“数据二十条”制定里面全程参与我们原来在讨论的时候,包括一旦确权,市场就自动形成,后来所有权和确定的情况下,数据资源持有权和经营权,我们落地的时候一直在思考,比如持有权的问题,国家法律里面没有持有权。
地方在落地,其实我们还关心另外一个层面,产业怎么落地,针对于数据确权的问题,要素流通和价值分配的问题,三个问题分别提给三个企业家,第一个问题想吴总跟我们分享,整个数据要素流通过程中,对企业,产业链有怎样的价值的影响?
【北京思特奇信息技术股份游戏那公司董事长吴飞舟】:如果半年前回答的答案不是这样的,但是今天我们有一些新的认知和实践。什么是数据,什么是要素?理论上是经济学的说法,什么是市场,因为我们从国家战略来讲还是希望数据要素市场对应的产业,如果能够成为第二个房地产,是大家愿意看到的。我们肯定要从这个方面去努力。
所以要回到基本的概念里面,什么是市场。如果现有的经济学理论能不能支持数据要素市场,其实是要打问号的。我不是学经济的我不知道,法律上也是这样,刚才说确权是对应的一个法律体系的问题,物理世界都有了,房子是我的,公证处盖章就知道了,房产证拿到就可以了,但是在数字世界可能没有那么容易。
对产业的同事来讲,有些问题不能只是从数据技术本身出发去考虑这个问题,是要考虑到业务出发或者市场出发,你反过来推,你在这里面起什么作用,其实讨论数据要素市场,最重要的是律师参加很少,经济学界参加的很少,但是我不知道,有可能很多,孤陋寡闻而已。这个层面反着推的话,可能就不是IT驱动,本身是市场驱动,市场在哪,又是另外一个问题。
所以其实市场这个问题,其实理论是无处不在的,只是你能不能找到你的需求和提供满足需求供给方一个两个,实际上交易所肯定是有用的,但是交易所背后的那些确权,我五年前,三年前公司内部其实对数据的认知我们一直在打交道,我搞了一个研发叫数据生命周期管理。我是从数据的产生到数据的存储,到数据的流通,我们从IT的角度叫传输,传输完了再存,存了以后可能有人提需求,我把你的需求转换成可以满足你需求的产品,因为市场一定是有交易的逻辑在里面,否则数据是没有意义的。
市场是什么,其实现在我不认为有共识答案,因为都在探索,没有标准答案。对产业界来讲只能去探索,从技术层面,我研究的数据生命周期管理平台,我的那套逻辑是把数据的产生到消亡,或者到最后存,数据也分热、温、冷,有的冷的东西就不用了。那看市场的需求了,市场本身在交易所层面我们认为最重要的是解决错误的问题,你现在能说清楚哪个数据有用吗?你能在后台加工一个产品说这就是你要的,不可能的。
股票交易市场它是一个撮合的问题,假设我是一个制药企业,我现在有一个新药,我想找一些人的健康档案,我不可能找医院拿,我找交易所拿,交易所配套法律,配套市场公证的话,那我是安全的。双方撮合到一定程度,数据产品和商品的形成才能有效的支持数据交易市场的健康发展。你买卖,先不说钱多少,没有买卖其实市场就瞎掰。我们鼓励交易所应该学股票市场,它是一个撮合的概念,至于撮成什么样不知道,需求方,供给方,数据产品你不要去研究,你只要把数据说清楚。技术现在不是问题,不管是隐私计算这些东西,都不是成为影响数据交易市场繁荣发展关键要素,而是建立什么样的法律机制、市场机制去解决这个问题。说的不对,请大家批评指正。
【孙克】:感谢吴总,第二个问题提给数据宝的汤总,数据流通领域有哪些典型案例?
【贵州数据宝网络科技有限公司董事长汤寒林】:首先你问的问题是数据,我们自己很少提,数据宝提的是数据产品的流通。我们在六七年前数据宝刚成立的时候,定位是做国有数据的代运营。当时为什么提代运营,因为当时还没有“数据二十条”,也还没有《数据安全法》,也没有《网络安全法》。我们作为一线的企业其实我们是很认准一个道理,就是中央的政策导向到底是什么。
中央的导向其实一直是明确的,就是要在国家安全,数据安全核心是国家安全,排第一的是国家安全。在国家安全基础上面怎么样去发展,产业的发展,在产业发展基础上面去保安全。所以数据宝提出来的六七年前我们提出来数据流通的方案,就叫国有数据代运营,数据是不出库的,我数据宝里面一条数据没有,我帮国有数据方干苦力活。我们提出一个理论,叫数据要素市场化,“新四化”建设理论,数据治理智能化、建模加工产品化、场景运营商业化、流通交易合规化。
我们在实战过程中我们数据宝刚开始是做国有数据的代运营,我们会有很多产品出来,产品的形态很明确的,今天我们必须来的是模型,其实我们现在是小模型,不是大模型。其实很多场景的解决是由无数个小模型拼装出来的,我们去搞一个大模型做不了的。跟数据流通,其实是市场导向的,我们不会强求去做一个拟市场的事情,因为我是一个企业,我除了数据宝之外,其实我还有一个身份,我是华东江苏大数据交易中心的总经理,2019年华东数交把我请过去让我做总经理,我来运营华东数交的时候我汇报,我们不会做拟市场的事情。为什么企业要去参劾官方的交易场所,我们认准两个理,第一个很多人会问交易场所要不要,今天我们开了这么久的会,很多人没有想清楚为什么要搞大数据交易所,不搞行不行,不搞也行,不搞也在做这个事情。
那我为什么要去做,我做的原因,第一是国有数据属于新兴国有资产,按照我国现行法律规定,国有资产的流通必须要走产权交易所进行招拍挂。所以国有数据资产必须要到新兴的交易场所里面进行定价、评估,所以我们官方交易场所存在的第一个价值。否则你没有理由,你搞不出来的,市场不承认的。
第二是一个产业要起来,实际上不是某一个环节做了就OK掉了,你说把交易所搞得多好,人家为什么来交易,其实整个产业,整个生态就起来了,就像义乌的小商品市场,义乌什么条件都不具备,但是生态起来了,我们发现交易就非常活跃。所以我们为什么要做官方交易平台,做的第一件事情就是做生态,只有生态起来了,自然而然人家就来了,你生态没有,你不活跃,你说我要搞交易所没用的。所以我们这么去做。另一个问题,数据流通交易,我认为是场内场外交易相结合,全国性的交易场所跟区域性的交易场所跟行业性的交易场所一定会相结合。
【孙克】:感谢汤总,最后一个问题请张总,深圳交易所还是非常活跃的交易场所,您在数据产品交易过程中,你遇到了哪些需要解决的问题和挑战?
【深圳数据交易所产品总监张帅】:我快一点表达我的见解,我们深圳数据交易所对于整个交易所的支撑定位,我们是从合规保障、流通支撑,这是从内部的一种支撑,到外部的供需撮合以及生态发展,形成四个大的方向,我们去支撑交易所的运营,以及赋能整个数据产业链条交易过程的赋能。我们在整个交易过程中也会跟各大数商进行联系,去探讨到底大家需要交易所为大家解决什么样的问题,这其实就是我们存在的价值。我们是公平公正公开的交易性的平台,无论是从需求还是供给,我们一起探讨,其实今天会议之前多次提到了这些点,第一个点我们数据主体的隐私和数据传输过程中的安全,包括网站,数据使用时如何保证数据输出主体的价值安全,这是我们目前交易所在探讨的一个话题。
之前谈到的安全隐私计算环境,或者可信空间的搭建,我们想不仅我们要引导数商把交易从场外转到场内进行交易,我们也想把整个数据加工制作过程也能给大家提供一个环境,从场外加工转到场内加工,从输出侧开始就得到了合规的安全的保障。
第二点,对于数据产品质量存在统一的度量衡,不同的金融机构,不同的主体对数据质量标准评估都不一样,导致我们数据对接销售过程中会频繁解释沟通,企业会进行频繁的数据测试,其实周期非常长,成本也非常大。我们引导大家能不能形成一套普遍的标准化数据的一些评估质量体系的建议出来,来让大家达成一种共识。
第三,我们在整个流通过程中会遇到的问题,数据标准不统一,各数商企业生产的数据,可能它的存储方式、输出方式、代码方式全都不一样,导致使用企业对接的时候会重复进行开发,重复进行评估,这也是我们看看能不能引导大家,鼓励大家,建议大家达成一套比如说我们的行标,一套可以达到共识的一种标准的数据加工体系。
第四,数据价格问题,其实一直是一个很难解决的问题,现在我们的交易一般采用撮合定价,磋商定价的标准,其实无论是对于数据提供方还是使用方,一是他的资金成本预算难度会增加。二是对信息不透明化加深了,我不知道这个数据相同的数据有人卖1毛,有人卖5毛,但是会用得更好吗,还是遵循经济成本来考量我的采购。
交易所不可能制定大量的规则,这是我们政府领导去帮助我们去落实的一项政策方面的内容。我们联合市场上的需求去推进和促进这样的相关体系的形成,我们在撮合同时,比如说有大模型的建议,形成一些基础性的标准,包括对产品交易过程中的披露性质的一些服务,这都是我们所面临的所我们想协同市场想解决的一些问题。
【孙克】:感谢张总,最后一个环节之前我还转了一圈,我们这个会场是最后还在开的。我们上午的真是饕餮盛宴,意犹未尽,从数据本身的特征,你到底数据要素还是数据资源,这种特征很多特点有去解读,比如我们在回顾的时候说到数据的很多特征,边际成本为零,但是数据本身不是边际成本为零的,为什么不愿意分享数据了,数据背后逻辑的分享。国家有“三权”,数据资源持有权、数据加工使用权、数据产品经营权。刚才唐总纠正我的观点非常有道理,我们并没有数据经营权,我们有的是数据产品经营权,所以我们讲的是数据产品的经营。第三个定价,“数据二十条”里面有未来公共政府的数据指导价,但是解决不了数据公允的问题,第二个计量单位的问题,还有分配,包括我们的安全和治理等等各个方面,今天上午收获满满,非常感谢这个机会。
再一个提个请求,目前我们也在支撑国家“数据二十条”落地的工作,后面请求各位政界、学界、产业界的给我们调研的机会。最后感谢在座的坚持到现在,今天真的不容易,坚持到这个场合,非常感谢大家!今天整个会议到此结束,也祝大家身体健康,未来工作顺利,谢谢大家!