2022-2000年上市公司企业数字化转型指标数据(袁淳老师版本)
1.资料名称:2022-2000年上市公司企业数字化转型指标数据:
2.测算方式:参考《中国工业经济》袁淳(2021)老师的做法
借助数字经济相关的国家政策语义表述,建立一个相对完备的数字化词典,并利用基于机器学习的文本分析法,构建一个较为全面反映中国上市企业数字化程度的指标。 具体步骤
如下:
第一步,构建企业数字化术语词典。 由于缺乏专门的数字经济领域的术语词典,本文以国家政策语义体系为基础构建企业数字化术语词典。 借鉴何帆和刘红霞(2019)等的研究,通过对中央人民政府、工业和信息化部网站进行检索,人工筛选得到 2000—2022 年期间发布的重要的国家层面数字经济相关政策文件以用于提取企业数字化相关的关键词。经 Python 分词处理及人工识别,最终筛选得到 197 个频率大于等于 5 次的企业数字化相关词汇, 这些词汇构成了本文的企业数字化术语词典。
第二步, 对年报相关语段进行文本分析。 本文把上述数字化术语词典中的 197 个词汇扩充到Python 软件包的“jieba”中文分词库,然后基于机器学习的方法对上市公司年报“管理层讨论与分析”(MD&A)部分进行文本分析,统计得到 197 个与企业数字化相关词汇在年报中出现的频率。
第三步,企业数字化程度指标的构建。 考虑到年报 MD&A 部分文本长度的差异,在提取得到每家上市公司每年年报中各个关键词的出现频率后, 本文采用企业数字化相关词汇频数总和除以年报 MD&A 语段长度衡量微观企业数字化程度(Digital)。 为了表述方便,本文将该指标乘以 100。Digital 指标数值越大,表示企业数字化程度越高。
3.资料范围:包括原始数据、python代码、计算代码和最终计算结果,最终计算结果为dig和Dig, dig乘以100为Dig
4.参考文献:
袁淳,肖土盛,耿春晓等.数字化转型与企业分工:专业化还是纵向一体化[J].中国工业经济,2021,No.402(09):137-155.DOI:10.19581/j.cnki.ciejournal.2021.09.007.
微信截图_20230615091425.jpg (179.41 KB, 下载次数: 0)
微信截图_20230615092134.jpg (89.78 KB, 下载次数: 0)
微信截图_20230615092245.jpg (80.75 KB, 下载次数: 0)
复制这个链接下载
https://www.caomeikeyan.com/forum.php?mod=viewthread&tid=2551
(出处: 草莓科研服务网——中国专业社科交流平台)