大数据时代下社会科学研究方法的拓展(南开管理评论2022)
题目:大数据时代下社会科学研究方法的拓展——基于词嵌入技术的文本分析的应用
摘要:在大数据时代的背景下,基于大数据的分析处理技术为以“数据驱动”的社会科学研究创造了新的发展契机。其中,词嵌入(Word Embeddings)技术借势大数据浪潮,以其高效的词表征能力和强大的迁移学习能力在文本分析领域受到越来越多的关注。不同于传统的文本分析路径,词嵌入技术不仅实现了对非结构化文本数据的表征,还保留了丰富的语义信息,可以实现对跨时间、跨文化文本中深层次文化信息的挖掘,极大丰富了传统的社会科学实证的研究方法。文章总结了词嵌入技术的基本原理及特点,系统地梳理了词嵌入技术的六大应用主题:社会偏见、概念联想、语义演变、组织关系、文本情感和个体决策机制。随后,文章归纳了词嵌入技术的基本应用流程。词嵌入技术还面临文本数据的选择、中文文本的分词处理、单词语义信息的表征层次三种挑战,文章归纳了相应的应对思路与方法。最后,基于词嵌入技术的强大适应能力,未来研究可以进一步关注该技术在管理领域的应用前景,包括政策效应评估、用户推荐系统、品牌管理、企业关系管理、组织内部管理、中国传统智慧与管理问题六个方面。