发展战略实施的核心主体,更要求注重创新的“提质增量”。具体筛选步骤如下:参考《高
技术产业(制造业)分类2017》,在所有沪深 A 股上市的制造业企业筛选高技术制造业,剔
除ST、*ST以及2016—2021年间变量缺失的企业,最终获得1515个观测值。
(二)变量定义
1.被解释变量
创新质量:借鉴张杰等的研究[28],本文采用专利知识宽度测量企业创新质量。专利
知识宽度指专利所覆盖知识的复杂程度,可以从技术和价值两个维度来体现创新质量:一
方面,专利所涵盖的知识越丰富,专利越不易被模仿改进,在短期内被取代的可能性较低;
另一方面,知识越复杂的专利,其相关替代品越少,企业更容易获得创新产品的垄断价值。
本文使用智慧芽专利数据库中企业的发明专利和实用新型专利的IPC分类号数量测量
专利的知识宽度,公式如下:
Patent_Knowledge=1- ∑α2。
其中Patent_Knowledge表示专利的知识宽度,α 表示专利号中每个大组的比重。考虑
到企业专利存在极端值,本文采用中位数的方法将专利知识宽度信息加总到企业层面。
创新数量:参考陈强远等的做法[29],采用企业当年发明、实用新型与外观专利申请合
计数作为创新数量的代理变量,相关数据来源于 CNRDS数据库。
2.解释变量
企业数字化转型:参考吴非等所构建的词库[30]对企业数字化转型进行文本分析。通
过在上市公司年报中挖掘并统计关键词词频并进行标准化处理,最终作为企业数字化转
型的代理变量。
政府数字化治理:政府工作报告集中反映了各级政府的施政方针以及工作重点,其中
工作回顾性总结成为评测政府职能履行情况以及政府治理的重要依据。因此本文借鉴邓
雪琳的研究[31],以政府工作报告中的回顾与总结为文本分析对象,运用 Python软件展开
文本挖掘。具体构造方法如下:第一,下载样本企业所在地级市共计606份政府工作报
告,将其转换为txt格式。第二,参考赛迪顾问的《2021数字经济城市发展百强榜》抽取典
型政府样本。第三,利用 Python的Jieba中文分词功能处理上述典型样本,分词之后统
计词频,筛选数字化治理高频关键词,形成初级词库。第四,缩小关键词范围,挖掘种子词
汇的前后文本,并提取出现频率较高的文本组合;运用 Python对政府工作报告原文进行
抽样并人工回溯,通过复检文本以及阅读相关文献[32-34],优化数字化治理关键词词库。
第五,基于数字化治理总词库,利用Jieba功能对所有研究样本进行分词处理,统计总词
库中的关键词词频并标准化。
3.中介变量
管理性交易成本:参考金环等的研究[35],选择管理费用占资产总额的比重作为企业
管理性交易成本的代理变量,并取相反数进行正向化处理,即指标越大,企业的管理性交
易成本越低。
信息不对称性:参考于蔚等的研究[36],采用微观企业日频交易数据作为企业信息不
对称性的代理变量。具体的指标构建为:提取流动性比率、非流动性比率以及收益率反转
三个指标中第一主成分构建信息不对称性的综合指标,并取相反数进行正向化处理,即指
标越大,企业的信息不对称性越小,信息透明度越高。
46