语料库团队于2025年3月25日下午举办了第145期语料库沙龙,主题为“大模型时代的语料库建设再思考”。本次讲座由许家金教授主讲。许教授围绕当前人工智能发展的背景,提出了五个关键问题:在大模型时代是否仍需建设语料库?平行语料库是否还有存在的必要?大模型生成文本能否作为建库对象?语料数据是否应由非结构化文本转为结构化格式(如JSON、CSV)?多模态语料是否应成为未来的主流数据形式?针对这些问题,许教授进行了深入探讨,并介绍了其团队正在推进的“书面、口语、电子三三制”语料库建设方案,引发了现场热烈讨论。