编者按:随着新质生产力的提出,再一次将数字与数据科学推导了前沿。高志亮等学者认为数字是新质生产力的内核,数据是数字经济的内核。自2023年10月,国家正式挂牌成立了国家数据局以来,各省市自治区和大型国企也纷纷响应,积极落实国家《数据二十条》,出现了一场轰轰烈烈的 “数据革命”,让数据科学与数字经济学等研究大放异彩,数据市场空前活跃。 然而,作为专门研究数字与数据长达30年的长安大学高志亮教授有点着急了,这就是目前出现的很多对数字、数据概念不清,数据要素名词模糊,而且很多专著、论文,甚至重要文件和制度,也存在理念不清、概念不明、表述不准、实操方向有很大风险等。高志亮深感问题之严重。今天摘取了高志亮教授数据十论中的有关概念和表述区别的研究篇段,以对数字与数据及其相关要素概念、表述和操作的讨论,以飨读者。同时也号召广大数字、数据和数据要素、数字经济学研究的学者们积极开展数字与数据科学研究,让数字与数据科学概念更加规范,让数字经济健康发展。
数据十论——有关概念、名词及表述的节选 数字与数据,既是一个基础研究与专业化的科学前沿,又是影响和改变国家经济政治的现实。作为前沿数字与数据已成为国家主权,作为现实数字与数据已成为国家一种治权。我们国家既是数字与数据的生产大国,又将数字与数据作为强国战略,还开启10年的全民数字素养普及教育活动,提高全民数字与数据意识。于是,让全民对数字与数据概念有一个准确的理解与认知,是非常重要的。为此,在这里我将以数据十论为题,节选了我对数字与数据以及因数字与数据而形成的一些相关概念、词语与表述做点讨论,希望数字与数据更加专业化、科学化和精准化: 第一,数字与数据论。数字是由数值与数量构成的一种关联关系,其来源于信号,即信号是数字之母。我们平常口语或一般表述的数字,即为“数文字”的概念,叫数字。它起源于文字的发明、书写和印刷。数字的重要特征是:没有书写符号;没有具体形态;不可量化计算。但数字却是一个客观存在,因为,数字它反映了物质、事物的真实面貌。 数据,是由信号、数值、数量生成、转换构成的一张结构化关系表,人们便将其定义为“数据”。现在数据还包括音频、视频和图件等,称之为非结构化数据。数据的特征是,有源、有痕、又有形,还可计算其量。但数据能够更加深刻地反映物质、事物的本质内涵。所以,数据又是物质、事物信息的基,或者说是“以电子或其他方式对信息的记录”。 为此,数字与数据,不是一回事,从专业角度来讲,决不能混为一谈。平时已约定俗成,一时半会很难纠正。然而,作为重要文件与专业,一定要严格的区别开来。 数字与数据的作用与功能,在于数字内涵动力学系统,于是,称为数字生产力。而在今天的新质生产力中,数字是其内核,从而数字可以改变世界,形成了数字理论。而数据可以成就科学技术与社会,大凡科学技术的成就无一不是数据所为,这就是以数为据。于是,数据是科学技术和数字经济的内核,称为数据原理。 人类社会已走进了数字化的崭新时代和全新的数据世界,未来超人创造、幸福生活与美好社会是三大基石,这就是人们将以数字理论与数据原理而完成第四次工业革命的使命。 第二,数据权属论。所谓数据权属,是指数据的属性地位与权利归属。通常人们称之为数据“三权”,即数据资源所有权;数据加工使用权;数据产品经营权。然而,人们忘掉了数据的来源或生产,数据权属认定要从数据的源头上做起。客观上讲数据是“六权”,除了以上“三权”外,还有“登记权、生产权、收益权”。这就从源头上、利益分配上和安全责任上认定清楚了,不存在模糊的边界了。 所以,“数权”是数据资产认定的关键,数据权属划分是数据资源、数据资产和数据入表的源头;数据权属是数字经济统计和确认的源头,没有数据权属的认定,数据界限模糊,数据鸿沟就会加深,数字经济统计十分的困难。 需要强调的是,还有一种“数权”,是数据内涵与外延的一种分配权,这里暂不讨论。 第三,数据要素论。数据要素与数据生产要素,是两个不同的概念。数据要素,是指将数据作为一个单一性的因素认定,无论数据量有多大,种类有多少,数据仅仅是社会生产要素集成中一个因素,属于最小单元的因素,即数据要素为“颗粒”。 数据生产要素,是将数据作为一种生产资料,同土地、技术、资金和劳动力一样并构成了社会生产资料,可开发、可利用,是一种资源性要素。 目前,人们对数据要素与数据生产要素,在概念上问题比较多,性质很严重,包括:概念不清、作用不明、表述不准。在很多数据文献中出现了将数据要素与数据生产要素混为一谈,如重要文件、法律制度文本、领导重要讲话和相关论文著作等,均存在严重问题。 所以,严格区分数据要素与数据生产要素十分重要,它们二者的区别在于:数据要素仅作为单一因素可参与同技术、算法、算力、业务等的科学配置,通过配置数据作为重要角色参与解决科学难题突破与政府、企业管理决策及生产运行过程控制等。 而数据生产要素作为生产资料,重在可开发、可挖掘、可利用生成数字经济,属于资源型要素,人们通过还数于民,为民致富。社会、单位与个人完成数据+,数据x,让数据生产要素发挥更大的作用。 所以,数据要素与数据生产要素,它们是完全不同的概念与内涵,必须严格区分,搞清楚,弄明白,不能出现混乱。 第四,数字资产与数据资产论。首先,数字,本身不能成为资产,但数字产品是可以成为资产的,这是一个重要概念。有人将加密货币、NFT、元宇宙虚拟化等都认为是数字资产,并通过引导、宣传、吸引了大量的投资商和创业者涌入,这是一种误导性的概念,非常危险。但数字产品可以成为资产,如比特币确实是一种数字技术生成的产品,而不是数字本身。但经过社会流通和交易,成为一种通证经济形态。但需要高度地警惕,不能大力倡导。 其次,数据资产,这是由数据资源形成的资产。数据,是由企业、政府与个人在业务过程生产、加工、经营获得的数据资源,包括结构化与非结构化数据,然后可以形成资产并数据入表。所以,我们应该大力倡导这样的资产成为价值。 再次,数据资源性资产和数字产品资产,都能给企业带来正向现金流。原因是:(1)数据作为原始资源,支撑企业内部决策和运营;(2)当数据具备变现能力时,它转变为可识别的资产;(3)数据资产的最终形态是进入资本市场,通过增信、转让、质押融资等方式,实现数据资本化。但数字产品资产需要严格的法律界定和慎重运作。 但是,要严格、准确地理解数字与数据,不能用数字资产来误导民众。 第五,数据入表论。“数据入表”属于数据财务术语,是指将数据作为资产计入账务系统的一个过程。而数据入表是一个新生事物,是在数字化时代数据上市交易过程中凸显的一个财务问题。 在财务技术上,“数据入表”,使得原本以费用形式计入损益表的数据相关支出,可以转化为资本化处理,进而列示于资产负债表中。这一变化意味着,数据资产化使得企业能够将数据相关的支出转变为长期资产,从而在财务报表上反映出数据的价值和企业利润。 但是,数据入表并不是那么容易,主要问题有三点:第一,从数据本身上来说,存在着数据确权难题,如果数据的权属不清,数据入表存在着很大的危险性。第二,从财务会计制度上来说,主要是数据资产的确认和地位问题,包括计量需要遵循严格的会计准则等。我个人反对将数字经济称作“虚拟经济”,也不同意在数据财务记账中作为“无形资产”科目下的列支,这是不科学的做法。第三,从国家上来说,数据作为资产,会大量地增加单位和国家总资产,将会带来巨大的风险。 所以,数据入表,需要国家高度地重视,做好宏观上的指导,微观上的控制。 第六,数能转化定律论。这是数字与数据理论的一个重大发现,也是发挥数字与数据作用的基本理论思想。数能转换定律中的数,包含着数字、数据和大数据,它们都来源于物质,事物形成的“数据域”并具有强大的能量,其基本模型为:
E=D*Xin+N
其中E代表能量;D代表数字、数据和大数据,总为数;*以后为数据要素x和数据价值乘数作用系统。用一句话概括,即为:数字的要素越小,其能量越大,如信号;数据量越大,其能量也大。第一,数能转换定理,目前还属概念性的,它需要进行严格地数学推导和实践验证。第二,数能转换定理,反映了数可形成能的基本原理,这就是“数即万物”和“天地交、万物通”“上下交,志同道合”的底层逻辑与深刻内涵。第三,数能转换定律,揭示了数字与数据的基本规律,将是数字化时代从事科学技术研究与社会治理应遵循的基本原则。也就是说,现实世界中的所有行为都要遵循这一规律,才能取得科学技术的成就和社会治理的进步。
所以,数能转换定律,有可能成为未来物理学大统一和科学技术大一统最重要的指导思想。 第七,数字经济形成论。数字经济是一种技术与价值型的新兴经济形态。数字经济的形成过程是起源于数字化;发展于智能化,成熟于“无人化”。数字经济的基本特征是:时间短,崛起快,能量、体量大,发展迅猛,在国民经济中占比高。 数字经济包括“三驾马车”说和“四位一体”说。“三驾马车”指数字产业化、产业数字化、数字化服务业;“四位一体”指数字产业化、产业数字化、数字化服务和数据治理。 其实,两种说法都少了一个跨境数字贸易,这是数字经济非常重要的一个组成部分,不能少。它还承担着跨境数据流通的重要任务与使命,也是完成跨境数字经济建设的重要途径。 这里需要强调的是,高志亮认为数字经济不包括数据治理。数据治理确实存在于数字产业化、产业数字化、数字化服务以及跨境数字贸易的数字经济全过程。但数据治理是一个技术工程过程,属于数据快速反应的系统工程,需要长期来做,如果作为数字经济的一个组成内容,将会误导政府、企业大量地投资与投入而仅在做数据“倒腾”,浪费国家财政,不可提倡。 当然,数据治理非常重要,需要一定的投资和投入长期来做,但我认为它不能作为数字经济建设的组成部分。 第八,跨境数据流动论。跨境数据流动是让数据能在国际上相互使用,实现共享,产生价值和利润,从而构建数字经济跨境成果,是“双循环”的一个重要机制。 然而,跨境数据流通遇到最大的困难,不是数字与数据技术问题,而是“数据主权”问题。数据主权,是指一个国家生产的数据相当于这个国家在国际上的主权,神圣不可侵犯。所以,数据跨境流动不仅仅是数据安全与泄密那么简单,而是数据主权问题。 那么,数据跨境流通应该怎么做?首先,我认为做好跨境数字贸易,这里需要很大的智慧,做好顶层设计;其次,以跨境数字贸易为契机带动跨境数据流通,即必须依靠跨境数字贸易来实现,而单一从事跨境数据流通会带有很大的风险性;第三,国家、政府应该高度地认识到跨境数字经济的重要性,应全力推动跨境数字贸易发展,数据跨境流通就可以实现。 所以,跨境数据流通、跨境数字贸易、跨境数字经济是一个完整的统一体,它们之间相互关联、相互依存,目前在国内外无先例可借鉴,只有创新。当然具有很大的难度。未来利用数字化跨境贸易和数字经济建设与发展来带动数据跨境流通是唯一的办法,其潜力巨大。 第九,“数权”锚定物论。这是数字与数据的一个重要功能。此数权,非彼数权,即不同于数据权属的数权。随着数字货币的快速发展与实践以及人民币走向国际化在不断提上日程,就会现出一个重要问题,即用什么来做人民币的锚定物? 有学者建议采用物价指数作为数字人民币的锚定物,但我认为存在着很多不确定性。根据对数字与数据的研究与推演,将数据中的存在的“数权”,即分配权,作为人民币的锚定物具有很大的可能性。因为,数据的地位在不断地提升,数权通过严格的技术处理后成为一种数权通证,在国家严格控制下构成稀缺资源与价值,很容易成为通证便于控制,成为人民币的锚定物。 将数权作为人民币的锚定物,有利于打破美元霸权的一家独大局面;有利于被全世界各国所接受;有利于发展数字经济。更重要的是我国是数据生产大国和发展成为数据强国,有条件和资格率先认定以“数权”作为“通证”成为数字人民币的锚定物,使得人民币成为了数字化时代第一个有数字锚的数字货币,人民币就可以快速走向世界。 所以,数字经济发展会更加稳健,我国的世界数据强国战略地位就会快速确立,以迎接世界科学技术中心的转移和到来。 第十,数据立法论。通过多年研究,我国需要尽快建立一部《中华人民共和国数据法》(下简称《数据法》),然后与其他相关法律构成数据法律体系。欧盟最近刚刚通过了《人工智能法》,规定“禁止某些人工智能实践”,就是不允许超出道德范围与伤害人类的一些行为。国家也刚刚发布了国家级《数据安全技术 数据分类分级规则》。但还是需要一部国家《数据法》。 《数据法》要为数据以确定的法律地位,要为数据生产要素和数据入表等确定的法律地位;要解放数据,以释放价值,让数据活起来。同时也要对数字化时代人们的数据行为和人工智能行为规范,将数字要素普及教育法制化。为此, 我建议要在《数据法》中明确规定“一切数据归国家所有”;明确规定“谁登记,谁生产;谁生产,谁拥有;谁拥有,谁收益;谁收益,谁负责安全”;明确规定“数据为民所有,造福人类”。这样数据确权就有了依据,数据就会“活”起来了。 所以,构建国家以《数据法》为核心的中国数据法律体系已刻不容缓,《数据法》将是我国数据强国战略的一大重器。有了《数据法》,数据要素、数据生产要素、数字产品要素、数据入表等就有法可依,构建一个规范、成熟的数据大市场,让数字域数据能发挥重要作用,在数据市场中就会做到政府作为,市场有效,法律有保障。 以上仅从当前数据革命活动中出现的一些数字与数据概念、表述中出现的问题以及数字与数据科学研究中发现的一些重要思想、理念提出了看法。没有做过多的阐述与论证,期望人们能够专业化地、准确地理解和认识数字与数据,提高人们的数字与数据素养,然后对以数字与数据为核心引申出来的数字与数据现象与科学能够准确地表述,形成我们国家独有的数字与数据科学,然后科学、合理地发展数字经济,确实把我国数字经济“做强做优做大”。 编后:数字,是新质生产力的内核;数据,是数字经济的内核,中国数字经济建设与发展,必须要准确地理解和认知数字与数据,精准地表述和应用数字与数据概念,对于我国数字经济建设与发展至关重要,这是高志亮教授的坚定信念。他说坚信数字与数据科学基础理论研究在中国一定会出现最伟大的成果;坚信中国式的人民数字经济在数字和数据基础理论指导下一定会在国民经济占主导地位;坚信中国式数字经济的发展一定会促使全国人民走向共同富裕,实现中华民族伟的大复兴和中国梦。我国从数据生产大国走向数据强国迎来世界科学技术中心的转移。(文/王超)
责任编辑:赵娜