公共资源交易中产生的数据虽不能被出售但可以资产化,其资产化的过程实质上是模型化的过程。未来,数据资产化将成为公共资源交易平台竞争的核心,谁先形成以公共资源数据为基础的公共资源大模型资产,谁将率先打破现有市场格局,重塑市场秩序,成为公共资源领域的大平台。
提出问题
——公共资源交易平台的数据现状。在探索如何实现公共资源交易平台数据资产化之前,先回归到公共资源交易平台的现状中来。无论是2013年《电子招标投标办法》的实施,还是2015年《整合建立统一的公共资源交易平台工作方案》的颁布,其中都蕴含着一个核心概念,即通过对电子招标投标、公共资源交易平台的整合,将公共资源交易数据进行整合与集聚。但经过多年发展,公共资源交易平台的数据整合与集聚仍存在一些重要问题:公共资源交易数据的价值、性质、属性、用途均不明晰。
——公共资源交易数据空间的表达困境。有别于传统交易方式,公共资源交易平台的特别之处在于其在数据场的作用下会形成数据空间。对于数据空间,必然需要回答如下问题:数据空间的数据结构是什么样的?数据之间的关系是什么样的?历史数据和当前数据是什么关系?数据怎么发挥作用?通过对这些问题的探索我们发现,此前我们对公共资源交易数据空间的表达存在困境,当我们谈论数据时,一定要将其结构化或半结构化,如此一来,所有对数据的理解只能限制在数据库的预先设定中,数据库里的数据以及数据关系都是由技术人员预先定义好的,我们很难从数据中再挖掘出更有价值的东西。
给出解题工具
——神经网络结构与GPT方法。直到ChatGPT(全称:Chat Generative Pre-trained Transformer,译为聊天机器人程序)的问世,解决了上述困境。在ChatGPT中,GPT可以被视为一个处理数据的方法论,GPT的基础是人工神经网络。神经网络的结构包括输入层、隐藏层和输出层。输入层负责接收外部的信号,将外部的信号转换为神经网络能够处理的信号。隐藏层是神经网络的核心,负责处理输入层接收到的信号,将其转换为输出层可以处理的信号。输出层是神经网络的最后一步,负责将隐藏层处理的信号转换为有效输出,以满足外部需求。
神经网络由许多个互相连接的神经元组成,每个神经元都是一个“输入—输出”结构,它由一个线性函数和一个激活函数构成。线性函数的一般形式为:y=ax。在交易平台网络中,我们可以认为a(权重)是产品价格,x是采购的产品。激活函数又称为决策函数,它是非线性的,即领导决策(每一次激活都可以看成是一次交易选择)。根据以上内容,我们可以将GPT在交易中的作用拆分理解为:T是由许多厂商和交易构成的交易市场,即神经元网络;P是企业构建供应链的过程,即神经网络训练过程;G是基于供应链的生产过程即模型生成结果。在前述认知的基础上,可以得出如下结论:神经网络与交易市场关系同构。具体表现为,现实中的生产单元与神经网络中的神经元相对应,现实中各种交易的可能性与神经元之间的连接相对应,整个交易市场与数据空间相对应,交易市场数字化的过程与神经网络训练过程相对应。这样的一个同构关系实际上是非虚拟的,它是由软件、硬件、算法和数据形成的一个实体网络。
——用GPT模型解释公共资源交易数据。在上述理解的基础上,我们很容易借助GPT模型解释公共资源交易数据:公共资源交易十多年来形成的历史数据实际上就是公共资源建设的经验表示;数据形成的模型就是对公共资源历史经验的总结;在总结历史经验时形成的一套科学方法就是GPT方法;通过GPT方法,让公共资源交易历史数据发挥作用后,数据就成为了资产。数据资产的表达形式不是原始数据而是模型。因此,可以得出历史数据产生模型这一结论。此后,新的数据输入模型产出新的输出,产生新的价值(数据资产的价值)。以上逻辑就是对公共资源数据理解的完整表达。
指导答题思路
——公共资源交易平台数据资产输出。公共资源交易平台数据资产具体该如何输出?答案是要利用公共资源历史数据训练公共资源GPT大模型。历史数据包括:交易数据、招标文件数据、投标文件数据、评标数据、履约数据。大模型是指基于公共资源交易平台或招投标交易平台的数据形成的专业垂直业务模型。每当一个新的项目输入到这个模型中,都会输出产生价值,这个价值即为数据资产价值。
公共资源交易平台的数据可以形成一些模型:
第一,公共投资项目决策模型。公共投资的决策包括3个层次的决策,第一个层次是规划决策,它属于政府决策的一部分。第二个层次是根据规划形成的项目决策,它也属于政府决策的一部分。在这一层次中,政府会有项目优先项的排序。在未建立公共资源数据模型前,项目优先项的确定通常采取“拍脑袋法”或“综合平衡法”。建立公共资源数据模型后,要根据大模型通过算法形成公共项目的边际投资模型,既可按照一个地区的整个政府项目投资的边际效应最大化进行项目排序,也可按照一个行业的整个政府项目投资的边际效应最大化进行项目排序。第三个层次是在项目排序确定后所进行的具体采购过程。在这个层次,公共资源交易平台可借助历史数据训练公共投资项目供应链模型,优化公共项目服务、优化地区项目供应链以及构建特定目的供应链。
第二,公共服务优化模型。公共资源交易活动主要包括能源、交通、通信、城市建设等在内的新建、改建、扩建及其相关的装修、拆除、修缮等工程建设项目。由于这些行业属于垄断行业,其服务效率都有巨大的优化空间和价值,比如,优化能源系统、优化交通设施、优化网络系统、优化通信设施、优化城市基础设施等,而它优化的价值就是公共资源交易平台中数据的价值。
第三,公共服务创新模型。公共资源交易平台数据空间具有知识涌现能力和价值涌现能力。首先,一些在实体空间无法感知的模式可以在平台数据空间被发掘出来,构成新的知识。其次,来自实体空间的数据是抽象的。数据空间通过对这些数据的处理,实现对实体空间业务的优化和创新,进而引导形成在实体空间的实际操作知识。最后,在交易平台数据空间中的数据之间发生新的组合和聚合的概率大大提高,新的产品、服务产生的概率也大大提高了。在这种新的环境下,许多实体空间无法想象的新产品和新服务就出现了。
第四,公共应急服务模型。应急处理依赖于公共资源,但目前在应急管理层面中,公共资源交易数据的作用还没充分发挥。要建立公共资源应急冗余模型,做好应急资源的库存和调配,从容应对突发事件的发生。
——三级模型可形成以公共资源数据为基础的公共资源大模型资产。第一级模型是以ChatGPT为代表的基于公共数据的大模型。第二级模型是以ChatGPT为代表的基于专业数据的专业模型。第三级模型是以ChatGPT为代表的基于深度数据的私域模型。各个公共资源交易平台可立足于训练自己独特专业的大模型,训练完成后,公共资源交易中的数据作用会进一步凸显。比如,在制造业的生产方式变革中发挥作用、实现数据驱动决策、优化管理、推动新产业变革。