分享自:

数字与现实融合如何驱动企业双元创新平衡?

期刊:Journal of Innovation & KnowledgeDOI:10.1016/j.jik.2025.100870

数字-实体经济融合对企业双元创新平衡的驱动作用研究:基于LDA模型的文本分析

作者及机构
该研究由北京工业大学经济与管理学院的Qianqian Shi、Yuanlei Deng、Tingli Liu和Xiaojun Liu(通讯作者)合作完成,发表于*Journal of Innovation & Knowledge*第11卷(2026年),DOI:10.1016/j.jik.2025.100870。


一、学术背景

研究领域与动机
本研究属于数字经济与企业创新管理的交叉领域,聚焦数字-实体经济融合(digital-real integration)双元创新平衡(ambidextrous innovation balance)的关系。中国“十四五”数字经济规划强调“创新驱动与融合发展”原则,但企业在资源约束下常陷入“探索式创新(exploratory innovation)”与“利用式创新(exploitative innovation)”的悖论(即“双元性悖论”)。传统静态指标(如专利数量、研发支出)难以捕捉创新平衡的动态性。因此,作者提出基于分析师报告的文本挖掘方法,量化双元创新平衡,并揭示数字-实体经济融合的作用机制。

理论框架
研究整合动态能力理论(dynamic capabilities theory)资源分配理论,提出数字技术通过重构企业管理效率和要素配置,推动双元创新协同演化。


二、研究流程与创新方法

1. 数据收集与样本构建

  • 研究对象:2007-2023年中国A股非金融类上市公司,最终面板数据涵盖53,309个企业-年度观测值。
  • 数据来源
    • 专利数据:从中国国家知识产权局(CNIPA)提取发明专利IPC分类代码,剔除实用新型和外观设计专利。
    • 分析师报告:来自CSMAR数据库的22万份报告,经去重和情感分析筛选正面评价内容。
    • 企业财务数据:包括ROA、ROE、董事会规模等10项控制变量。

2. 核心变量构建

(1)双元创新平衡(因变量)

采用LDA主题模型(Latent Dirichlet Allocation)分析分析师报告文本,步骤如下:
1. 主题提取:将报告文本分词后,生成“探索式”(如“研发”“智能化”)与“利用式”(如“产能优化”“成本控制”)两类创新关键词库。
2. 相对熵筛选:通过Kullback-Leibler散度计算主题词分布与基准文本(如《牛津创新手册》)的相似性,确定创新类型权重。
3. 平衡指标合成:以探索式与利用式创新得分的乘积衡量平衡性(Cao et al., 2009),并通过加和指标进行稳健性检验。

(2)数字-实体经济融合(自变量)

基于Tao et al. (2023)的三级映射体系(数字核心产业分类DEIC-国民经济行业分类SIC4-专利分类IPC),识别企业数字技术发明专利中“数字技术”与“实体经济技术”的共现IPC代码,构建企业-年度层面的融合指数。

3. 计量模型与内生性处理

采用固定效应模型(模型3):
math dual\_innovation_{it} = α_0 + α_1 digtech_{it} + ∑β_n contvars_{it} + μ_i + γ_t + ε_{it}
- 内生性处理
- 工具变量法(2SLS):使用同规模企业群组的数字融合水平均值作为IV,Kleibergen-Paap检验拒绝弱工具变量假设(p<0.01)。
- PSM-DID:将多次数字化融合的企业作为处理组,匹配未融合企业,验证政策效应。

4. 机制与异质性分析

  • 中介变量
    • 管理效率(eff):主营业务收入与行政销售费用之比。
    • 要素配置效率(labor):人均营业收入。
  • 异质性分组
    • 融资约束(WW指数分组)
    • 行业竞争度(HHI指数)
    • 区域数字基础设施(互联网宽带普及率)

三、主要发现

1. 基准回归结果

数字-实体经济融合(digtech)对双元创新平衡(dual_innovation)的系数为0.0627(p<0.01),且在控制企业固定效应与年份效应后仍显著(表3)。

2. 机制验证

  • 管理效率路径:数字融合提升信息处理精度,降低决策成本(系数0.463,p<0.01),促进资源向探索式创新倾斜(表6)。
  • 要素配置路径:数据驱动的智能优化缩短创新周期,劳动生产率的提升显著(系数0.0319,p<0.01)。

3. 异质性分析

  • 低融资约束企业:融合效应更强(交互项系数-0.0699,p<0.01),资源充裕企业更易实现创新协同(表7)。
  • 高竞争行业:市场压力倒逼企业通过数字技术优化创新资源配置(HHI交互项0.0367,p<0.01)。
  • 高数字基础设施区域:技术扩散加速知识重组(net_level交互项0.0649,p<0.01)。

四、结论与价值

理论贡献
1. 方法论创新:首次将LDA模型与相对熵结合,构建动态文本指标,突破传统专利/R&D静态度量的局限。
2. 机制揭示:提出“管理效率-要素配置”双路径模型,阐明数字融合如何通过动态能力重构双元创新平衡。
3. 理论拓展:将数字-实体经济关系视为双向共演过程,修正了单向数字化转型的研究范式。

实践意义
- 政策建议:政府需针对融资约束企业提供数字转型补贴,并完善跨行业数据共享标准。
- 企业策略:嵌入数字技术至研发-生产全流程,建立“虚拟-物理”协同创新环境(如数字孪生)。


五、研究亮点

  1. 数据颗粒度:基于22万份分析师报告的文本分析,覆盖创新战略、技术趋势等多维动态信息。
  2. 跨学科融合:整合计量经济学、自然语言处理与创新管理理论。
  3. 政策普适性:结论对欧盟“数字欧洲计划”等国际政策具有参考价值。

局限与展望
未来可引入模糊集定性比较分析(fsQCA)探讨多因素耦合效应,并扩展至不同经济体的比较研究。

(全文约2000字)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com