长江大数据交易所(郭福卿 胡纾旻|生产要素流动视角下的数据利益厘定与权属配置)
郭福卿 华东政法大学法律学院民商法硕士研究生,互联网法治研究院(杭州)兼职研究员
胡纾旻 华东政法大学法律学院智能法硕士研究生,上海互联网司法研究中心兼职研究员
内容摘要:数据流通是数据价值发挥的重要环节,数据交易实践催生了赋权的现实需求。数据作为以比特形式对特定对象的数字化描述,其兼具财产属性、人格属性及国家主权属性。海量数据的挖掘应用带来了巨大的经济利益,进而证成了数据作为生产必备要素的基础性地位,其财产属性尤为突出。数据并非天然存在,而是基于直接或间接劳动被生产出的,数据产权的配置应以生产者的使用及许可权能为核心,基于合法交易而取得数据控制的主体亦应受到一定的产权保护。人格属性显著的敏感个人数据产权应受一定程度限制,对于提供底层原料的数据来源者所贡献的固有价值,可通过数据红利分配制度的设置进行保障。
随着人工智能技术的迅速发展与传感设备的普遍应用,海量数据汇集在一起便可分析事物发展的普遍趋势,从而获得更多关于个人和社会的知识及智慧。由大数据驱动的智能时代到来是科技高速发展的必然结果,也是社会发展的必然阶段。数据是人类作为个体交流中的副产品,其已然构成信息时代中的新型生产要素。作为“挖不完的钻石矿”,数据是人类社会维系和运转中不可替代的元素,也是当今国家之间争夺的发展资源。较自然科学中技术层面的数据而言,人文科学对数据概念及其配套制度的研究才刚刚兴起。数据进入法学家的视野不过短短几年,具体的数据生产和流通规则尚未建构。数据在过去一直处于在实践中摸索并发展的状态下,近些年随着网络安全法、个人信息保护法等陆续出台,数据才逐渐被纳入法律的监管之中。要想让数据法体系更加完备,法学研究就必须以架构有关数据活动的一系列规则,并对利益相关方提供必要救济为重要任务。借助“卡—梅分析框架”这一主导范式,要想规范相关利益的保护路径,需要首先解决赋权问题。数据赋权问题本质上是对利益优先性的规定,即在数据生产与流通过程中发生利益冲突时,何者的利益为先。在此范式下,数据相关规范的研究需从数据的权利定位出发,以数据的权益归属为核心进行展开。本文以立法及实践对数据赋权的实际需求为起点,以数据上所承载的权益分析为基础,寻求数据要素的产权定位,厘清数据的产权归属,以期为市场经济下的数据产权配置及其配套制度的构建提供一种具体化思路。
一、数据要素流通下的赋权必要性判断
数据作为物质生产所必需的要素之一,其畅通流通构成智能时代发展进步的关键动能。但若将数据置于公共领域,使其成为任何人均可任意利用的公共资源,则可能会催生哈丁所担忧的“公地悲剧”。因社会成本远大于个人承担的成本,最终将产生累积效应,导致社会资源的枯竭殆尽。为防止“公地悲剧”出现,数据赋权显得尤为重要。法律必须明确其权益保护路径,以充分发挥其财产价值。数据赋权是时代发展的必经之路,是当前社会制度与社会生活必要环节,是法律研究必须解决的一个现实问题。
(一)数据立法的空白之处
2012年《关于加强网络信息保护的决定》开启了我国数据立法之门,个人信息保护法、数据安全法等多部立法的颁布施行逐渐构建起我国的数据保护与利用体系。立法采行为规制的路径来平衡各方利益主体关系,对数据的权属配置几乎从未涉及。为避免草率立法而对此问题予以回避具备一定合理性,但大数据技术的发展使立法空白问题愈发凸显。
数据发展初期的纠纷可通过传统法律部门解决。碍于客观技术条件限制,古罗马法及近现代民法均没有在法律体系里留出数据的立法空间及有关的理论基础。在传统法律框架下,对数据的保护是通过解决民法领域内的网络纠纷来实现的。在网络纠纷产生的前期,法律工作者常常致力于在传统民法体系的定义中找寻数据的影子,尝试着将数据作为某些定义的外延而囊括进去。这个发展过程在学界虽充满了学说争议,但在实际纠纷解决的过程中并未产生过大的问题。从司法实践角度观察,不难发现法律工作者将纠纷的焦点限定在财产权或人格权的角度,倾向于将对网络纠纷中的数据侵权视为对当事人的一种肖像、名誉、隐私等权益的侵犯,在此意义上,网络就只是充当了侵权行为中的工具而已。在当时的语境下,数据区别于信息,数据蕴含的内容可能受到法律的保护,但原始数据在大部分情况下都未被纳入法律的保护之下。数据认为是任何人可以自由获取的,是处在公共领域内的资源。无需立法进行干预,任何人均可基于事实上的控制而对其分析利用,获取收益并促进整体社会经济的发展。但受技术发展限制,大部分纠纷均可通过传统法律部门化解,数据的理论研究及司法需求呈现平稳上升的趋势。
智能社会产生了数据独立赋权的立法需求。鉴于大数据分析技术发展,数据生产及流通利用的社会基础已然发生了重大变革,亟需立法设置配套的制度对其进行规制。人工智能技术使数据的价值被无限放大,改变了仅在小数据范围内对特定群体的分析,海量数据的分析处理使人们获得了在一定程度上预测未来的能力。对数据越来越广泛的开发和利用也带来了许多问题,如对个人信息的滥用,个人隐私的泄露、大数据产品侵权等。结合如今数据对于国家、社会与个人的影响来看,因数据资源引发的各种纠纷,尤其是数据生产及流通产生的各种纠纷,难以进入传统法律体系寻求解决。
第一,传统民法教义学框架无法解决数据引发的诸多纠纷。民法起源于由公社制度向国家演进的古罗马时期,在其缓慢演变及发展中形成了较为稳定的法教义学结构。民法制度的设计建立在主体地位平等的前提下,但数据涉及的各方主体间处于明显的信息能力不平等地位,许多纠纷不能再以传统民法视角观察。即便在民法极为发达的德国,其数据保护及纠纷解决也无法通过民法完全解决,因而才有了德国联邦数据法的产生。因数据上涉及生产者利益、描述对象利益及公共利益,数据的权属配置无法用民法中所有权制度来调整。
第二,经济法、知识产权法的专业性导致其调整范围有限。就著作权保护数据的进路而言,其要求数据必须具备独创性及可版权性。就某些数据如原创的软件、代码等可以纳入著作权保护范畴,但对于大多数数据因欠缺独创性,无法通过著作权予以保护。如通过收集并按时间顺序排列而成的汇编作品,因编排方式不具特殊性,无法纳入著作权范畴。就商业秘密保护而言,其需满足秘密性要件。因数据易于流通,伴随着商业主体间的交流合作及OpenAPI的应用,其秘密性要件很难得以满足。就竞争法保护而言,一般条款仅能在具备竞争关系的市场主体中适用,这大大限制了数据产品的保护范围,使得发生在不具有竞争关系的经营者之间的数据产品纠纷无法得到有效的保护。
第三,刑法的补充性及谦抑性致使其仅能调整涉公共利益的数据纠纷。从我国数据保护的发展来看,刑法以国家强制的形式最先介入。仅严重侵害数据的行为并由立法者进行犯罪化探讨,并纳入刑法明文规定的行为,才应受刑法的规制。因个人数据的窃取、滥用等行为会产生较大的社会危害性,刑法及两高相关解释将满足一定的数量或程度要求的此类行为纳入犯罪的范畴。至于其他类型数据及相关侵害行为,因欠缺明确的赋权性规范,其原则上无法寻求刑法保护。
法律的滞后性导致其难以适应迅速发展的社会现状,因此而形成了立法的空白。传统民法、经济法、知识产权法及刑法等各个法律部门仅能在有限范围内调整部分涉数据侵害行为,数据领域独有的问题,如数据生产、流通利用等问题,则需要专门的数据立法来解决。当然,近年来我国制定了数据相关立法,逐渐加强了对数据尤其是个人数据的保护。但从生产要素的自由流动及数据驱动经济发展的角度观察,数据的财产化问题成为数据经济制度构建的关键,相关制度的缺失与缺位阻碍了数据的流通利用,亟需制定有关数据赋权的立法。
(二)数据交易的现实需求
虽然我国数据产业还处于探索阶段,但对于如此庞大的市场需求及其不可估量的发展潜能,数据产权问题亟需国家层面进行统一规定并付诸执行。数据市场构成市场经济的重要组成部分,数据赋权则是数据流通利用的前提,也是数据分析识别价值发挥的基础。
首先,数据交易已成为市场经济发展的必然需求。2013年,大数据时代的突然到来让世界范围内的数据呈指数式增长。认识到数据带来的经济价值之后,大数据交易随即产生并迅速发展。为引导并保障数据交易的有序进行,大数据开放交易平台应运而生。以美国Factual公司为代表,该公司按浮动价格向不同的软件开发商提供数据。日本的富士通公司在2013年也建立了自己的大数据交易市场即DataPlaza。我国数据交易平台的建设虽起步较晚,但由于我国的人口资源与国家经济制度优势,大数据相关行业发展尤为迅速,历经初创期、成长期、过渡期,我国数据交易已然成为机遇风险并存的蓝海。2014年,首个数据交易平台即中关村数海大数据交易平台成立。次年,武汉长江大数据交易所、贵阳大数据交易所挂牌。贵阳大数据交易所作为全国示范性大数据产业发展试点,首批大数据交易金额达十万,在第三届中国大数据交易高峰论坛期间公布的流水则突破1亿元。上海数据交易所则于2021年揭牌成立,国家电网、移动、电信、联通、东航、京东及高德等多家企业挂牌参加交易。数据巨大的挖掘利用价值催生了数据交易,公平的数据交易需求及国家对交易秩序的管控则催生了数据交易平台,大数据交易平台的建立和交易市场的扩大则推动着数据交易的进行,促进了信息的公平有效分享利用。
其次,数据赋权已成为数据交易合法化的必然需求。厘清数据权属是数据交易的前提,如果不具备流通利用的权能,即便对数据进行事实上控制,其交易行为也不具备合法性。我国现行立法甚至是交易所的条例均未对数据权属做明确的规定,在数据交易的具体实践中,面临着统一定价困难、缺乏总体监管、难以保证公平及数据安全等一系列法律风险。数据交易作为新兴产业,解决纠纷的相关司法裁判十分有限,且法律滞后性较强。我国数据交易实践显著超前于制度设计,现行产权规则无法适应数据要素市场建设。将数据的部分或全部权益明确赋予某一方或多方主体,能够明晰各方可为什么行为及如何为该行为,从而驱动数据的生产,为数据的合法有序流通提供基础要件。此外,原始数据的赋权还是判断衍生数据及数据集的生产、交易合法性的基础。数据集及衍生数据的赋权则直接影响数据的分析利用价值的实现。
总而言之,法律体系的空白、实践交易的模糊,都限制了数据经济的健康发展。数据赋权是新时代社会发展的迫切需要,但研究赋权问题,不仅需思考其必要性,还要关注其可行性及合理性。数据赋权不是也不应是将数据权益简单粗暴地赋予某一方主体,其必须兼顾数据上承载的多方利益,在厘清数据权益的基础上方能设计出最优的解决方案。
二、数据上的权益拆解与赋权进路
数据权益性质取决于数据上所承载的利益属性,不同利益对应不同程度及方式的保护与限制。数据具有描述特定对象的天然属性,其描述对象可能为个人,因而可能涉及到个人的隐私、社会评价及行为自由。基于DIKW结构,数据作为信息载体,其是存储知识,获取智慧的原材料,作为一种稀缺物品,其具有一定的财产价值。随着网络的普及,数据的地理位置属性逐渐被淡化,其能够轻易实现跨境流通。数据上承载的国家主权及安全利益催生了数据主权概念,数据的主权属性逐渐被各国立法所重视。数据权益为“理一分殊”的权利块,构成兼具人格、财产及国家主权的多属性集合体,其具备多样的赋权可能性。
(一)数据的人格属性剖析
人格权本质上属于受他人、社会及国家尊重的权利,这种尊重体现在精神层面,如同人身一般是固有的存在。人格尊严受宪法保护,数据保护规范尊崇母法的立法精神,注意到了数据对人格塑造的重要价值。这种人格属性主要体现与数据所描述的主体,对用数据描述人、物或组织的主体也有一定程度的体现。
其一,数据与其所描述主体的人格直接关联。大数据时代,一切客观存在的事物均可用数据来描述,数据所描述的对象可能是人、物或其他组织,因而形成了关于自然人的数据、关于物的数据及关于组织的数据。在数据生产的逻辑中,当人作为数据所描述的对象时,其应属客观的范畴,但我们却常称之为数据主体。原因在于,数据作为人类交流的副产品,所产生的各类信息很大程度上能直接或间接地联系到特定个人,尤其是经过数据处理,形成特定数据集后,其较容易识别特定个人,并被他人知晓。这其中尤其是能直接识别特定个人的数据,一旦其遭受他人的侵扰,便会对所描述的个人造成人身、财产等多方面的威胁。从国际数据立法角度观察,无论是欧洲基于人格尊严的保护,还是美国基于人格自由的保护,其都体现出对数据人格属性的认同。在数据权益分析过程中,不能忽视其中蕴含的人格属性,不能轻易将数据权利完全定义成商业模式下的权利,使个人在数据上的利益处于法律保护的空白之中。
其二,数据与用其描述对象的主体的人格间接关联。财产是人格形成和发展的契机,因而各国宪法通过财产权制度的设计,为人的平等发展、生存及自由创设物质前提。从人格的起源来看,罗马法通过人格制度赋予自然人不同的身份,其主要目的是对社会层级进行划分,但在层级内部则体现了追寻私法上地位平等的价值取向。随着人格制度的发展,享有“人格”的主体不限于自然人,通过赋予一些组织独立人格,避免了个人责任的泛滥,推动了经济活动发展。个人或组织基于一定目的而使用数据描述记录特定的对象,可看出数据不是自然产生的,而是一定主体所生产出来的。数据作为生产要素之一,其有序流动为经济发展持续注入动能。对数据的生产者而言,数据是其正常生产经营的前提基础,甚至对一些行业而言,数据分析就是其主要经营手段。无论数据生产者是自然人还是组织,数据对其均属于一种必要资源。数据虽然与生产者平等、自由等人格没有直接关联,但却会对之生存、生产经营间接造成影响,是数据权益人格属性的具体体现。
数据对其所描述对象及用其描述对象的主体而言均具有人格属性,合理合法地保护数据中蕴含的人格利益是大数据时代数据生产流通制度构建的必然选择,也是保障数据经济有序发展的现实需要。在数据产权的配置过程中,必须要对数据主体及生产者的人格权益予以充分保护,在此基础上促进数据的有序利用。
(二)数据的财产属性证成
“财产”一词既可以表示具有经济利益的权利集合,也可以指代财产性权利客体。就后者而言,其重要特征是具备经济价值及可交易性,通过交易可获得一定的经济利益。支配性并非财产的必备特征,认可数据的财产属性并不等同于承认数据是一种绝对排他的支配权。例如对企业而言,其机器设备、土地使用权、债权等均可构成法律意义上的财产。数据的财产属性并非基于数据处理者的事实控制,而是基于数据的社会效用、稀缺性及可流通性而产生。
其一,数据具有经济价值。经济价值的产生体现于社会效用及稀缺性,对人和社会具有经济意义是经济价值产生的前提,稀缺性是经济价值的必要条件,不同主体可能对是否有效用及是否稀缺的理解不同,应当在客观角度进行分析。财产的重要特征便是能够独立成为人的生活资料,无法满足人的独立生活需要时将无法构成法律意义上的财产。数据基于获取、汇集、清洗、排列组合等行为,能够用于发现及预测事物的客观规律,处理者基于此规律作出决策,从而带来商业利益或其他利益,其具备社会效用。资源是有限的,但人的需求是无限的。以数据方式描述特定对象需要付出一定的人力及技术成本,在生产数据之后的存储过程需要支出安全保障成本。hiQ诉LinkedIn等纠纷体现出对数据进行独占会使控制者获得商业利益,数据是人们争相使用的重要资源。因数据供给小于人们分析决策的需求,因此数据具有稀缺性。此外,大数据交易实践也揭示了数据的经济价值,各交易平台将大数据资产作为交易对象,明确了数据具有交换价值,证成了数据的经济属性。数据并非天然产生的,其生产、存储等各生命周期均需付出成本并可获得相应收益,数据对人和社会而言具有经济价值。
其二,数据具有可交易性。数据的可交易性体现于事实及法律两个层面,事实上具有可交易性并不能当然证成法律上的可交易性。在事实层面,数据的可交易性体现为技术上的可控制性及可流通性。数据以比特流样态存储于一定的物理介质之上,其可以为人们所控制;基于网络的互联互通,人们可借助API接口及网络传输等技术传递数据或向他人为访问许可,从而实现数据的流通共享。在法律层面,数据上承载了多方利益,允许数据交易主要考虑的是个人利益与处理者利益、社会整体利益的平衡。如果数据上存在的个人利益高于数据处理方的利益时,此时数据的流通性就被制约,数据原则上不能被允许交易;如果在对个人利益进行充分保障的基础上,几乎所有数据均具备交易的可能性,原始数据及数据集因常脱离所描述对象的控制,而由数据控制者实际掌握,在满足法定和约定的条件且不会出现其他侵犯或风险的情况下,数据可被允许用于交易。此外,有的数据交易平台可进行底层数据流通,有的则仅涉及清洗加工后的数据,虽然各平台交易的数据种类各异,但其足以证成数据在经济生活中存在交易可能性。
基于数据的社会效用、稀缺性及事实上的可交易性,其毫无疑问具有财产属性。但是,在法律层面允许数据流通交易需要以财产权益的合理配置为前提。数据生产者为数据的产生付出了劳动成本,应当给予其一定财产权益保护;对数据的描述对象而言,其作为原材料提供者,也应为其分配一定的财产利益。具言之,当被数据描述对象为物时,可能涉及到物之所有者、使用者的利益;当被数据描述对象为组织时,则需考虑所涉组织的利益;当被数据描述对象为人时,则应考虑对个人的保护并使个人享有一定财产利益。
(三)数据的国家主权属性分析
数据作为一种新兴资源,由于其具备分析利用的潜能,能够带来巨大的经济价值,靠数据建造的网络空间成为国家间争夺的一个新的战场。此外,掌握他国数据的国家可分析出他国的人口分布、年龄状况、政策实施等情况,甚至会涉及他国的社会稳定、军事机密及国家安全,数据与国家主权及安全的关联性不断增强,逐渐催生了数据主权概念。
首先,数据主权脱胎于国家主权。数据资源在国家构成中处于基础性地位,其属于一国的主权范畴。16世纪,法国学者博丹首次明确提出国家主权理论,其将国家主权阐释为一种凌驾于法律的至高权力。国家主权的产生之初是为君主专制服务的,当君主制度被推翻后,国家主权得以演变。受资产阶级尼德兰革命影响,荷兰学者格劳秀斯对其进行重述,将之阐释为国家内部事务不受他国干涉。在数字经济的时代,对数据的收集与控制,不仅能巩固政治经济等领域的发展,也能推动文化、生态等各方面的良好发展。如今其在国防安全方面的作用也日益凸显,国家安全数据的控制能力已成为一个国家军事能力的又一衡量元素。《网络行动国际法塔林手册2.0版》将网络活动国际管辖权对象扩大到数据,首次肯定了国家数据主权。数据主权成为一个政治或国际法概念,其主要内容是主权国家对本国境内的数据进行管控和保护,而不受外国势力侵扰或干涉的权利。
其次,数据主权经历了由被初步认识到系统性法律保障的发展过程。数据积累到一定程度时,其价值会随之膨胀,以至于影响国家的主权及安全。从域外角度观察,欧美曾历经多次数据主权的博弈。欧洲在数据跨境流通过程中逐渐认识到数据对国家安全的重要意义,为保障欧盟的数据主权及国家安全,欧美曾签订《安全港协议》《隐私盾协议》及《跨大西洋数据隐私框架》。SchremsI案推动了欧洲法院对《安全港协议》的审查,最终宣布其无效。为继续数据跨境流动,欧美随即订立《隐私盾协议》,但美国通过的外国情报监视法以保护其国家安全为由,对国内国外采取双重标准,在SchremsⅡ案中,欧洲最终判令该协议无效。欧洲“私生活的胜利”并未持续太久,基于数据流通带来的巨大经济增长,欧美经新一轮磋商,最终于对《跨大西洋数据隐私框架》达成协议。美国虽比较重视数据的自由流通,但近年来也开始关注数据主权,其未通过的第2889号提案即国家安全和个人数据保护法(草案)及已颁布的《澄清境外数据合法使用法案》等均体现了美国对数据主权的重视。随着数据安全事件的发生以及国际范围内关于数据保护的呼声迭起,世界上诸多国家与地区已经意识到了数据相关制度架构的重要性,并启动了相应的建设与管理,增强国家的数据保障能力。数据主权不再是单一方面的权力,而是会对国内国际两个环境同时起到决定性影响的国家能力。
从我国角度观察,我国作为数据创造第一大国,科技发展先行的同时,制度构建亦不应落后。网络安全法、数据安全法、个人信息保护法及其他管理条例的陆续出台,多角度、多层次地规定了数据活动的相关规则,保证了数据在合理合法的规范模式下运行,对向境外移转的、涉密的或有可能危害国家安全的等的存在风险的数据,都设置了严格的程序来限制。一是重视了数据本地化存储问题,对关系到国计民生掌握大量数据的企业,要求其必须将数据存储于境内。二是重视了数据的跨境流通问题,需要向境外提供数据的企业,其必须经过强制认证、订立经认可的标准合同等方式。三是重视了数据跨境流动的国际合作,积极利用“一带一路”平台推动建立双边或多边数据流通合作机制,推动有关国家的标准互认。可见我国已经认识到了数据权利中的国家主权属性,将数据的安全防护提升到了国家战略的层面,并设置诸多制度维护本国数据主权,尊重他国数据主权。
总而言之,数据权益本质上是多属性集合体,其包含了数据生产者、处理者及数据来源者的人格及财产权益,也包含了一国的国家主权及安全利益。在数据保护制度及数据产权制度的建构过程中,必须考虑到各方利益的位阶及平衡。在充分保障国家主权及个人人格权益的基础之上,合理配置数据产权,助力数据经济的迭代发展。
三、数据产权的定性及其内容阐释
数据产权制度的构建需明确其在法律体系中的具体权属定位,不同的权益类型会对应不同的保护模式。针对这一根本性问题,不同部门法的学者对数据的权属存在不同的判断倾向,并提倡在此基础上构建起数据的权益保护及利用制度。学术界的主流观点大致有知识产权说、商业秘密说、非客体说。各个学说各有利弊,在对各学说进行分析研究的基础上,结合数据的权益属性及权益层级,方可选择适合现行社会背景及技术条件下的数据产权构造。
(一)传统学说有其固有的局限性
第一,“知识产权说”主张应以独创性作为数据类型划分的标准,对有独创性的数据编排将被囊括进著作权的保护体系之中;而对于不存在明确独创性或创作主体难以认定的人工智能创作物,可将其归入邻接权的保护路径。就人工智能生成的各种成果而言,即便其具有一定的独创性,因其不具备主体地位无法获得版权保护,而应采取邻接权的保护路径。该学说似乎能够解决数据的权利配置问题,对于人以智力劳动生产的数据,可对其享有著作权;对于以人工智能方式获取的数据,可认为人工智能的发明者或拥有者享有邻接权。几乎所有被生产出的数据均可归属于某一权利主体,并赋予该主体垄断性支配的权利,从而解决了数据权益配置的问题。
但知识产权说存在无法克服的弊端。首先,数据的独创性并不取决于搜集或编排数据时付出的成本,付出成本可能取得回报,但付出成本并不等同于独特创造。换言之,并不是任何付出成本的产物都受著作权保护,仅有智力创造的成果方能取得著作权。其次,对绝大部分数据来说,其仅涉及对客观对象的描述,且这种描述是采用机器或算法的方式自动生成,并不涉及人的干预,其无法满足独创性要件。再次,借由邻接权的解释虽能对数据能够起到一定的保护作用,但这种邻接权变通保护的不是独创性,而是人的付出,其不属于真正意义的邻接权。最后,无论是著作权保护还是邻接权保护,其可适用的范围十分狭窄,个人数据上承载了个人的尊严及自由,其不应被数据的“创作者”排他性垄断。
事实上,在数字经济时代,数据权属配置关注的不单是数据的生产环节,还应包含数据的流通环节。数据的价值并不是来自于其主体能动性产生的数据内容,而是由特定的数据处理者将大量的数据汇集成数据集,再经过分析处理从而产生不可低估的价值。数据的保护不应着眼于其编排的独创性,其内容并不是价值的决定性因素。数据的保护应该是源于足够数量与范围的数据集里蕴藏的商业开发可能性。将数据以著作权或邻接权等形式赋权给数据生产者,会忽视数据上蕴含了个人利益及国家主权等利益。将数据定性为一种排他性的知识产权,将与数据的流通及识别利用属性相冲突。知识产权说的保护目的与数据保护宗旨相偏离,其仅能适用于以数据形式表达传统知识产权的特定领域,难以支撑整个数据相关产业的发展。
第二,“商业秘密说”认为数据的一些特质让其可被作为商业秘密保护。首先,单个数据最初常常都是以秘密的数据形态所存在的。对于机器所采集的有关特定个人的相关数据、特定机构所收集到的特定个人的记录等数据,其在理论上都是被认为是带有个人隐私信息的秘密数据,数据收集者收集与传输都是以相对保密的渠道进行,使得未经处理的底层数据具有秘密性。其次,经过数据处理的数据集也大多具有秘密性。数据处理者将数据收集处理后,将其以集合的形式存储在私人空间中,由保密措施守护着其费时费力产出的数据集成果。数据处理者的处理行为都是具有成本的,其处理的数据并不希望被第三方直接获取,也不会直接对外公开。数据具有秘密性,不付出代价将难以甚至无法直接获取。将数据作为商业秘密对其进行保护与规制似乎具有一定的可操作性。
商业秘密说与大数据时代的数据互联互通不再契合。我们不能否认数据的特质使其具有一定的秘密性,但数据与商业秘密属于交叉关系,并非所有数据都能且适宜纳入商业秘密的范畴。商业秘密以事实状态受保护,一旦脱离支配即丧失保护基础,将数据简单地放置于商业秘密的领域中保护,会出现保护不足的情况。商业秘密保护强调数据的独占与限制使用,这与大数据时代数据的流通特性相违背。在数据的许可使用中,若被许可人数一旦增长至某个临界值,这些允许使用的数据即成为事实上的开放数据,其将丧失秘密性而难以进行认定。大数据背景下,商业秘密面临认定模糊、举证困难困境、容易泄露等困境,对交易具有迫切需求的数据制度设置无法立基于商业秘密之上。
第三,“非民事客体说”认为数据并非民法意义上的法律客体,数据权益实现于数据服务合同的权利义务约定,数据纠纷则应区分虚拟性及工具性分别处理。因数据常处于变动不居的状态,其缺乏民事客体所要求的确定性、独立性,且无法构成“无形物”,也难以实现客体的实体权利表彰功能。首先,数据无法被排他性控制,容易发生多主体的同时享有,且基于数据的流动性,数据客体会随机灭失,其与客体的确定性要件并不相符。其次,数据是存储在诸如电脑终端或存储设备等载体里,需通过代码得以显现,可见数据是无法脱离载体而存在、无法离开介质实现可视化的,这也不符合客体独立性的要求。智力成果依靠的是其富有独创性的内容来实现权利主体对该成果享有的专属性和垄断性,而数据则是依靠其存储的形态及其潜藏的流通价值。数据作为网络技术的产物,其主要为民事主体的法律行为所服务,其本身并不能创设法律关系。易言之,数据本身不具有任何意义,只有被人们赋予内容后,其才能找到自己的定位。
以合同的方式配置权利义务关系并不符合双方间信息能力不对称的地位,也无法为数据交易明确提供合法性依据。数据的工具中立性决定了其只服从于代码,代码才是网络空间的法律。但是,这并不意味着于数据无需法律规制,也不等同于法律无法对数据进行规制。基于技术、人力、财力等差异,涉数据的相关主体间并非处于完全平等的地位。大数据处理技术之下,仅强调以合同方式配置双方的权利义务关系,容易使合同成为侵害权益以掠夺资源的工具。传统民法体系难以应对信息时代的新挑战,数据的保护必须转向公法与私法的协同发展。此外,民法典虽未明确数据的权益属性,但已然承认了其客体地位,非客体说与现行立法趋势并不契合。
(二)新型财产权定位具有正当性
莱斯格在《代码和网络中的其他法律》中系统性阐释了数据的财产化进路,其认为若要解决传统法律框架下的绝对权保护模式与数据流通间的冲突,则需赋予数据以财产权。要取得数据财产,必须经过事先协商。数据虽具有一定的财产属性,但基于其无形性及易变性等特征,很难被划进传统财产权范畴,因而有观点认为应将其定性为一种新类型财产权利。数据产权配置在某种方面可借鉴著作权的规范构造,因为数据产权强调的就是需要权利人付出劳动对数据进行收集、处理,这种财力精力的成本就近似于著作权中权利人付出脑力体力劳动获得此种权利,两者的权利构造相仿,可比较来发展数据权利的规范。
财产权自始仅为手段,绝非目的。数据能够作为一种新型财产权被证成。第一,数据具有财产属性。数据的生产需要付出一定的人力及技术成本,底层数据经过专门的清洗加工能够进行流通使用,数据的社会效用、稀缺性及可交易性证成数据的财产属性。第二,数据生产利用实践需要产权作为合法性支撑。从数据的交易实践及其对经济发展的作用来看,立法需要承认某主体对数据享有使用收益的权能,从而激励人们生产数据,促进数据流通及价值实现。第三,赋予数据财产权并不意味着忽视数据的其他权益属性。根据传统观点,人格权以精神利益为保护对象,从而保障人的尊严价值,任何人将其物化为交易客体。但判例学说历经多年的发展,逐渐承认人格权所保护的利益不仅限于精神利益,还包括经济利益,从而支持了人格权商品化。这证明权益的人格属性与财产属性并非泾渭分明且相互排斥的,完全可以通过消费者法及公法制度的设计使数据中人格利益得到充分保护。至于数据的国家主权属性,其主要体现在跨境数据流通与交易领域,应由专门的数据出境制度来调整。此外,赋予数据财产权并不会与数据主权相违背。第四,承认数据为新型财产权并不等同于承认数据为绝对排他的支配权。有观点以传统物理财产权具有专有性、排他性为基础,认为数据不应被赋予财产权而应被赋予使用权。这与本文观点并不相悖,正如债权亦属于传统范畴的财产权,其并不具备排他性。至于新型财产权的权属如何配置,本文后续将进行阐释。
四、以生产者为核心的数据产权配置
根据科斯定理,若交易成本近乎为零,无论如何配置产权,均能通过市场交易实现利益最大化。对于引发的外部性而言,可以通过当事人自由协商来消除。就数据而言,其交易成本虽低,但很难认为其为零,其产权配置应当综合实践需求、数据权益及社会效益综合进行考量。目前对数据产权配置主要存在以下几种观点:其一,根据成本—收益的框架分析,如果将数据利益划给企业,便能通过较小成本获得较大收益,数据权利应归企业所有;其二,个人作为数据的来源,为使个人能够支配其信息蕴含的商业价值,应赋予个人数据财产权;其三,以敏感性为划分标准,将具有敏感性的数据产权划归个人,将不具有敏感性的数据产权配置给企业与个人共同共有。数据权属的配置不能仅局限于成本收益的考量,还应充分考虑各方在数据上享有的权益。
(一)基于合法生产行为取得数据产权
数据并非天然存在,而是处理者付出劳动生产出来的。数据是由谁生产出来的,其便应拥有什么样的权利。为保障数据收益最大化,激励数据的生产、加工及利用,以助力市场经济发展,数据生产者的权益配置构成了数据产权配置的核心。
1.劳动赋权分析
根据洛克所提出的“财产权劳动说”,共有、劳动及需求构成其三大要素。共有是财产私有的前提性假设,劳动是在共有财产中划分出私人财产的驱动力,需求则是财产权私有的限制要件。结合该理论提出的时代背景,财产由全人类所共有主要指一种消极共有,即财产不归属任何人,任何人均可自由使用。结合西方学者对数据的观点,其近乎可满足这一前提要件。生产者用数据描述特定对象的过程必然经过劳动,虽然该劳动常借助机器设备完成,未直接出现个人的干预,但编程者、使用者等付出了间接劳动,其具备从公有领域划入私人领域的必备要素。数据作为一种弥足珍贵的资源,对处理者而言,其具备生产使用数据的需求,这种需求足够支撑其在一定范围内对数据享有排他利用的权益。此外,财产权辛勤劳作的合理报酬,劳动促进了社会整体福利,其值得以产权作为回报。对数据而言亦是如此,有必要赋予通过劳动生产数据之人数据财产权,以使其获得一定程度地排他支配。
2.激励理论分析
赋权是激励数据生产流通的关键所在。从知识产权角度观察,赋权可激励人们投入资源进行创新和创造。从效用角度来看,免费允许人们使用能够避免资源的浪费。但此时会致使人们不愿创作生产,不利于社会的创新进步。通过立法创设一定程度的排他性,能够避免对创造活动能动性的损害。当然,这种激励并不必然要采取赋权的方式,给予生产者一定的物质性奖励亦能达到激励的效果。但问题在于此种物质性奖励的来源何在,以政府财政供给此种激励措施是不现实的。从现行行业实践来看,绝大部分数据无法满足公共属性要件,企业对数据具有事实上的支配力,其可以通过合同方式实现数据价值,无需赋权这一激励措施。但是,事实上的支配并不能构成数据流通利用的合法基础,其以基于事实控制便可获取数据交换利益作为前提,推导出赋权不是激励数据创造生产的措施,其对前提新问题未予证成。
3.成本-收益分析
根据波斯纳定理,为降低交易成本,实现社会整体利益最优,应当将权利应交由对其最珍视之人。数据生产者多具备一定的技术及经济条件,具备商业主体的优势地位。数据生产者基于正常经营活动生产了大量数据,基于海量数据的分析预测价值从中汲取收益,在具体的交易行为中,其也能利用其平台及技术优势大幅缩减交易成本。个人数据中的数据所描述个人常处于消费者地位,即便对其进行数据赋权,其也无法获取数据所带来的收益。首先,大数据价值发挥依赖于海量数据的分析预测,单个数据的价值极其微小,无法发挥其经济价值。其次,个人不具备数据交易的资金、技术等要件,其若要进行数据交易将支付巨大的成本,与其所获得的收益不成比例。最后,因成本与收益的显著失衡,个人欠缺数据流通利用的动力,数据流通利用价值将无法实现。将数据权益配置给生产者,使其负担交易成本并获取相应利益,能够更加高效地促进数据价值实现。
无论是未经处理的底层数据还是经过清洗加工的数据集,其均属于数据生产者劳动的产物,从劳动赋权及激励理论的角度而言,应承认数据生产者对数据享有分析利用及许可使用的权利,此时也能够实现成本与收益的平衡。但须注意的是,上述论证建立在合法的数据生产行为之上,基于非法目的或手段所生产的数据不应被法律所认可。在数据领域,立法多通过行为规范的方式对人们提供指引,通过设置合法性基础、赋予数据主体处理过程中的权利、配置处理者处理中过程中的义务以构建数据合法使用的框架。非法生产行为所获取的数据应当立即被删除,即便生产者对数据存在事实上的控制,立法也不应赋予其使用或许可使用的权利。
(二)基于合法交易行为继受数据产权
生产数据不是数据生产者的最终目的,其最终目的是基于数据分析作出决策。数据的价值在于使用,使用即意味着流通。数据在流通过程中很难保持其独立性,但在某个时间节点,我们还是可以认定特定主体对数据的在一定程度上的控制,所以只要法律承认数据处理者在某一阶段内合法控制了数据,那么便可以基于此构建数据流通秩序。基于专业职能的划分,未参与数据生产的主体可能也需要数据以分析并预测未来。数据生产者许可他人使用自己所生产的数据,由此产生了数据控制权的移转。目前存在数据交易的现实需求,但法律尚未明确规定数据接收者或购买方是否拥有数据产权。数据接收者的合理预期值得保护,因此对其享有的数据权属应予明确。
数据接收者可以基于合法的交易行为取得数据产权。基于上述分析,数据生产者享有数据产权,只要不违反相应的禁止性规范,其不仅可以自己使用数据,也可许可他人使用数据。数据接收方基于合法的交易行为,其能够承继数据生产者的权益,对数据进行分析利用以实现其交易目的。此外,为促进数据流通,原则上数据接收方还享有许可他人使用的权益。但其应遵守一定的交易规则,且其取得的数据权益应受一定限制。其一,数据接收方对数据来源合法性负形式审查义务。为避免以数据交易的形式通过非法数据生产获利,数据接收方应当对所购买数据的合法性负一定程度的审查义务。因对数据来源的追溯需要付出巨大成本,此种审查义务不应过于严苛。数据控制者也难以拿出证明文件证明数据的清洁性。其仅需要对数据的敏感程度、数据提供方的交易资质及责任承担能力等负审查义务。其二,数据接收方的行为应受数据交易合同的限制。数据交易的双方间处于平等关系,其所订立的合同应严格履行。当合同文本对数据使用范围、方式等作出约定时,接收方应严格在约定范围内实施数据处理。基于数据一定程度上的垄断价值,当明确约定接收方仅能使用而不能许可给他人使用时,接收方便不享有许可他人使用的权能。其三,数据接收方应依法保障其所控制数据的安全,避免数据泄露、窃取或未经授权的访问。
数据接收方可对经清洗、加工、分析等所获得的结论性数据享有数据产权。原始数据经分析处理后的得出的结论性数据的过程,本质也属于数据的生产。此时数据接收方演变为数据生产者,其经直接或间接劳动而获得的数据应受法律保护。原则上来说,其可以将该数据许可他人使用。但是,当原始数据的交易合同中明确载明不得将衍生数据用于交易的,应当尊重当事人的意思自治。
(三)通过产权限制及数据红利分配制度保障数据来源者权
数据是对特定对象的数字化描述,提供原材料的数据来源者的利益应受一定程度保护。数据所描述的对象可能是个人、机器或组织。其一,当机器或组织作为数据来源时,需要观察生产者与该机器或组织的关系。若生产者即为机器所有者或组织本身,其可径行取得数据产权。若数据生产者与机器所有者或被描述的组织并非同一主体时,则要考虑与被描述对象间的利益分配问题。有约定时原则上应当遵从,无约定时数据权益原则上配置给生产者。其二,当个人作为数据来源时,因个人数据的人格属性极为明显,对其利益分配需要特别考量。若数据生产者本身即为被描述的个人时,因不存在利益争夺,数据产权配置不会存在争议。实践中多数个人数据是商业主体所生产,对个人而言可能因其主动提供而形成,也可能是被动记录所形成。对前者而言,大多情形下,个人主动提供的仅是信息,数据的形成仍有赖于生产者的技术,个人并不能构成数据生产者。结合上述分析,将数据产权配置给生产者能够实现整体利益的最大化。但个人数据上的人格权益及基于人格而衍生出的商业化利益如何保障需要通过其他制度予以保护。
首先,通过敏感信息的产权限制保障数据主体的人格权益。自数据保护立法发展之初便存在对数据敏感性的区分,如德国人口普查案判决中便区分了一般数据与家庭、宗教信仰等数据。敏感信息与个人的人格关联性较强,人格属性较为明显。数据生产权益应让位于个人权益的保障,其数据产权应受一定程度的限制。我国立法并未采欧盟《一般数据保护条例》的原则禁止模式,根据现行立法规定,处理者可以在法定范围内对该信息进行分析处理,仅是要遵循个人信息保护法第28条相较于一般信息更为严格的要件。但是,现行立法对敏感信息仅做了“概括+列举”,评价标准具有模糊性,影响了敏感信息规则的具体适用。需要对敏感个人信息的概念进一步阐明,并对其判断要素进行明确,以明确对数据生产者权的限制范围,保护数据主体的人格发展。对于此类数据,生产者仅能根据处理目的而分析利用,原则上不享有许可流通的权能。
其次,通过数据红利的分配制度保障数据主体的财产权益。不同于数据生产者通过其劳动获取相应利益,个人作为数据的原料提供者,应就其提供的数据的固有价值获得有限的财产权益。理论上,这种利益可以通过个人与数据生产者之间的协议确定。但从实践角度观察,单个数据的价值有限,也难以用金钱进行衡量。此外,基于数据生产者的优势地位,二者间很难达成财产利益分配的约定。在具体的收集处理行为中为个人配置财产权益几乎难以实现,构建系统的数据红利分配制度是保障数据主体财产利益公平实现的关键所在。为促进数据价值在数据处理过程中的合理分配,加利福尼亚州长Gavin Newsom曾提出“新数据红利”计划,提议Facebook、Alphabet、Google等大型科技公司向消费者分享其依靠用户数据创造的巨额利润。Berggruen机构根据上述计划,制定了“数据红利白皮书”,阐释了一系列分配数据红利的方案。政府应设置专门的机构统筹管理数据资源的配置,协调数据红利的分配工作。通过征收数据税的方式,将税款用于公共基础设施的建设,以使个人真正享有数据发展带来的巨大利润。
结论
数据作为生产活动的必备要件,其已然成为推动市场经济持续发展的重要动力。数据流通是数据价值发挥的重要环节,数据交易实践催生了数据赋权现实需求,立法的空白之处亟需被填补。数据承载了生产者、使用者、个人、社会及国家等多方利益,具备人格属性、财产属性及国家主权属性,数据赋权必须充分考虑各主体利益的保护与平衡。不同法律部门对数据权属持不同态度,主要存在知识产权说、商业秘密说、非客体说等学说,基于数据有限的排他性与独占性,其应被定义为一种新型财产权,以财产权范式为基础构建数据产权制度。智能社会的数据产权配置应当以数据生产者权为核心进行展开,数据是生产者经劳动产出的有价值的资源,应赋予其对数据的分析利用及许可使用的权能。数据接收者基于数据交易合同取得数据的控制,应赋予其保有并使用数据的权能,为促进数据的分析识别价值实现,原则上数据接收者还享有许可使用的权能。数据接收者经合法数据交易取得数据产权后,其可利用该数据所分析得出衍生数据,在此过程中其处于数据生产者地位,享有与数据生产者相同的权能。基于对数据来源者的保护,对敏感信息的产权应作出一定限制。为公平实现数据原料的固有财产价值,应构建数据红利分配制度对大数据红利进行分配。通过合理的数据产权配置,能够促进数据流通,避免数据孤岛,推动数据经济繁荣。