概况

中国数字经济创新创业指数是一套能够科学评估各地区数字经济发展水平的指数体系,聚焦于企业主体的创新创业行为,关注数字经济四个核心产业的企业创新创业活动,利用北京大学企业大数据研究中心整合的企业大数据库,从企业进入、投资行为与创新产出三方面评估地区数字经济发展水平,描绘了我国数字经济领域的创新创业活力版图。

具体而言,指数基于大数据思维,从新建企业数量、吸引外来投资、吸引风险投资、专利授权数量、商标注册数量和软件著作权登记数量六个维度共计八个指标测度了2010-2020年我国各地区(省、市)数字经济领域的创新创业活动强度,对各地区数字经济创新创业绩效做出了精准评估。

指数体系


数据来源

指数在构建过程中结合大数据思维与技术,围绕企业这一核心市场主体,将全国工商企业注册数据、企业股东数据库、VCPE数据库、专利数据库、商标数据库和软件著作权数据库有机结合,对各地区(省、市)企业创建行为、投资活动、创新产出三方面的表现进行评估,测度地区数字经济行业的创新创业活力。

构建背景

国家统计局于2021年5月公布《数字经济及核心产业统计分类(2021)》,该分类将数字经济产业范围确定为:数字产品制造业、数字产品服务业、数字技术应用业、数字要素驱动业和数字化效率提升业五个大类,其中前四大类为数字产业化部分,属于数字经济核心产业;第五大类为产业数字化部分,是数字技术与实体经济的融合。

指数在构建过程中保留数字经济的四大核心产业,即数字产品制造业、数字产品服务业、数字技术应用业和数字要素驱动业的企业数据,由于目前缺乏测度各行业数字化改革程度的指标,故指数在计算过程中暂未包含数字化效率提升业内部企业。此外,由于数字要素驱动业大类中信息基础设施建设、数据资源与产权交易、其他数字要素驱动业三个中类内部混杂了一些无法归类的传统行业企业,同时上述三个中类行业在数据中占比较小,为确保指数的准确性,在计算过程中暂时将属于上述三个分类的企业样本剔除。

数据来源

指数计算基于北京大学企业大数据研究中心整合的企业大数据库。企业大数据库整合了全国工商企业注册数据库、VCPE投资数据库、专利数据库、商标注册库及软件著作权库数据库,囊括了1990年至今所有在中国境内注册的企业单位,记录了企业的注册信息及其变动、法人投资行为等基本信息、同时也记录了企业专利、商标与软件著作权等创新成果。

指数在计算过程中将企业的国民经济行业代码(2017)与国家统计局《数字经济及核心产业统计分类(2021)》代码相对应,精准识别出各地区的企业在数字经济领域的创新活动与创新成果。


指数构建

指数在构建过程中使用新建企业数量、吸引外来投资、吸引风险投资、专利授权数量、商标注册数量和软件著作权登记数量六个维度共计八个指标评估了各地区数字经济创新创业绩效,指数的权重分配如表1所示。

计算方法

北京大学企业大数据研究中心整合的企业大数据库提供了指数计算所需的省级、市级六个维度共计八个指标的原始数值。在计算过程中,首先按照公式(1)将各个子指标对应的年份t-地区i层面的原始值取自然对数,使其近似服从正态分布。

上式中,{indicator}_{ijkt}indicatorijkt表示在第t年第i地区(省份或城市)第j维度的第k指标的对数值。

在获得指标年份-区域层面的对数值后,对各个子指标进行公式(2)所示的标准化处理(Z-score)。

上式中,{SD}_{jk}\left({indicator}_{ijkt}\right)SDjk(indicatorijkt)表示对第j维度第k指标计算标准差,\SigmaΣ表示加总因子。I代表总的地区数目,T代表总的时间跨度。进行标准化后可以计算出第j个维度第k个子指标的每个年份t-地区i所在的分位数,将分位数乘以100得到每个年份t-地区i维度j的指数得分。对于专利授权维度,按照表1所示的权重(5:2:1)对三个子指标得分进行加总,得到专利授权子维度指数得分。

按照公式(3),我们将6个维度共计8个指标经标准化处理后的取值按照表1所示的权重进行加总,得到第i地区第t年总量指数的标准值。

最后,按照公式(4),计算出每个年份t-地区i的加权数字创新指数所在的分位数,将其乘以100,最终得到取值区间为0-100的每个年份t-地区i的数字创新指数得分,指数得分越高,说明该地区该年的创新创业绩效越好。

根据上述方法,基于年份-省份层面和年份-城市层面加总得到的原始数据,本报告分别计算出省份层面和城市层面的中国数字经济创新创业指数。