概况

“中国区域创新创业指数”(简称“区域创新指数”)由北京大学企业大数据研究中心编制,从2015年开始实行年度发布制度。区域创新指数覆盖了自1990年至今中国大陆境内全量企业工商注册数据,以企业为核心,立足于企业家、资本与技术三大核心要素,从新建企业数量、吸引外来投资、吸引风险投资、专利授权数量和商标注册数量5个维度,运用客观性产出类指标,实现对中国各地区(省、地三级)创新创业活力更加真实的度量。

区域创新指数形同一个“全景图”,有助于全面系统研判各地区创新创业的绩效、特征以及潜力。区域创新指数类似一个“诊断单”,能够及时诊断出各地区创新创业进程中存在的问题,为创业者、投资人、地方政府提供决策支持和现实依据。

指数体系

数据来源

区域创新指数在构建过程中结合大数据思维与技术,围绕企业这一核心市场主体,将全国工商企业注册数据、VCPE数据库、专利数据库与商标数据库有机结合,对各地区(省级、地级)企业创建行为、投资活动、创新产出三方面的表现进行评估,测度地区创新创业活力。


指数构建

区域创新指数在构建过程中使用新建企业数量、吸引外来投资、吸引风险投资、专利授权数量、商标注册数量五个维度共计七个指标评估了各地区创新创业绩效。指数的权重分配如表1所示。


计算方法

北京大学企业大数据研究中心整合的企业大数据库提供了区域创新指数计算所需的省级、地级五个维度共计七个指标的原始数值。

由于区域创新指数涉及到的原始数据分布并不服从正态分布,如果直接进行标准化处理,会降低其有效性。因此,先将指数的 7个指标取值取以10为底的对数,使各变量的分布近似服从正态分布。

上式中,i表示第i个地区,j代表第j个维度,k代表第k个指标,t代表第t年。

接下来,我们将各个基础指标转化为可比的相对值。具体方法是进行组内的标准化(Z-score)处理,获得各个基础指标的标准化值。

上式中,{standard\_deviation}_{jk}({indicator}_{ijkt})standard_deviationjk(indicatorijkt)表示对第k个指标计算标准差,表示加总因子。\SigmaΣ代表总的地区数目,T代表总的年份数目。由于Z-score后的值近似满足标准正态分布,我们直接按照公式(4)计算对于第jk个基础指标的每个年份-地区it所在的分位数,乘以100得到每个年份-地区的各维度指标创新指数得分。对于专利授权维度,按照5:3:2的权重对发明专利、实用新型专利和外观设计专利三个基础指标得分进行加总,得到专利授权维度指数得分。

随后,利用各个基础指标的标准化值,我们可以将5个维度共计7个基础指标进行加总。第i个地区在第t年的加权区域创新指数,如公式(3)所示:

最后,根据公式(4)我们可以计算每个年份-地区的加权区域创新指数所在的分位数并乘以100,从而得到标准的区间为0-100的区域创新指数,指数数值越大,说明该地区对应年份的创新创业绩效越好。

根据上述方法,基于年份-省份层面加总得到的原始数据和年份-城市层面的原始数据,分别得到省份层面和城市层面的区域创新指数。