金展旭,蔡天骥
智能社会研究. 2025, 4(2): 202-224.
摘要 (
)
PDF全文 (
)
可视化
收藏
生成式人工智能(GAI)在文本编码领域的应用,正逐步成为社会科学研究的关键工具。特别是在非结构化文本处理和复杂标签任务方面,它展现出了显著优势。本文以审判文书文本编码为例,深入探究生成式模型在法律文本分析中的应用成效。研究通过对比DeepSeekQwen 以及传统监督学习模型(SML)发现,生成式模型在预测前科分类变量的任务中表现卓越。其中,DeepSeek 在多任务模式下表现最佳。Qwen在单独预测模式下准确率相对较高(0.8709),不过其平衡准确率和一致性指标提升有限,且在多任务场景下效率欠佳。相比之下,SML方法在处理类别不平衡问题时表现不佳,准确率和一致性均不尽如人意。研究结果显示,生成式人工智能在裁判文书文本编码任务中具备较高的准确性和一致性,尤其在复杂任务中表现出色。然而,在不同任务场景下,如何平衡准确性与效率,仍是未来研究的重要方向。