社会科学中的文本挖掘———计算文本分析在社会学中的现状与未来

安娜·马卡诺维奇 著,朱凤霞 译

PDF(2895 KB)
智能社会研究 ›› 2025, Vol. 4 ›› Issue (1) : 182-216.
前沿动态与会议综述

社会科学中的文本挖掘———计算文本分析在社会学中的现状与未来

  • 安娜·马卡诺维奇 著,朱凤霞 译
作者信息 +

Text Mining for Social Science: The State & the Future of Computational Text Analysis in Sociology

  • written by Ana Macanovic; trans. by Zhu Fengxia
Author information +
History +

摘要

大数据与计算工具的出现,为社会学研究中大规模文本资源 的利用带来了新的可能。 近年来,文化社会学、科学社会学以及经济社 会学的研究表明,计算文本分析可用于理论构建与检验。 本文首先回顾 了社会学中计算机辅助文本分析的历史,然后探讨了当代研究中使用的 五种计算方法。 通过典型研究案例,本文展示了词典法、语义和网络文 本分析、语言表示、无监督文本聚类分析和监督文本分类如何帮助社会 学家完成不同的分析任务。 在介绍最新方法论进展的基础上,本文总结 了使用大规模数据集与计算方法推导文本复杂含义的若干重要启示。 最后,作者呼吁来自不同方法论传统的研究者在采用文本挖掘工具时, 仍应谨记从传统数据与方法中汲取的经验教训。

Abstract

The emergence of big data and computational tools has introduced new possibilities for using large-scale textual sources in sociological research. Recent work in sociology of culture, science, and economic sociology has shown how computational text analysis can be used in theory building and testing. This review starts with an introduction of the history of computer-assisted text analysis in sociology and then proceeds to discuss five families of computational methods used in contemporary research. Using exemplary studies, it shows how dictionary methods, semantic and network analysis tools, language models, unsupervised, and supervised machine learning can assist sociologists with different analytical tasks. After presenting recent methodological developments, this review summarizes several important implications of using large datasets and computational methods to infer complex meaning in texts. Finally, it calls researchers from different methodological traditions to adopt text mining tools while remaining mindful of lessons learned from working with conventional data and methods.

关键词

文本挖掘 / 文本分析 / 内容分析 / 机器学习 / 自然语言处理 / 大数据

Key words

text mining, text analysis, content analysis, machine learning, natural language processing, big data

引用本文

导出引用
安娜·马卡诺维奇 著,朱凤霞 译. 社会科学中的文本挖掘———计算文本分析在社会学中的现状与未来. 智能社会研究. 2025, 4(1): 182-216
written by Ana Macanovic; trans. by Zhu Fengxia. Text Mining for Social Science: The State & the Future of Computational Text Analysis in Sociology. Journal of Intelligent Society. 2025, 4(1): 182-216

参考文献

PDF(2895 KB)

79

Accesses

0

Citation

Detail

段落导航
相关文章

/