语料库沙龙第145期:大模型时代的语料库建设再思考

作者: 时间:2025-04-24 点击数:

语料库团队于2025325日下午举办了第145期语料库沙龙,主题为“大模型时代的语料库建设再思考”。本次讲座由许家金教授主讲。许教授围绕当前人工智能发展的背景,提出了五个关键问题:在大模型时代是否仍需建设语料库?平行语料库是否还有存在的必要?大模型生成文本能否作为建库对象?语料数据是否应由非结构化文本转为结构化格式(如JSONCSV)?多模态语料是否应成为未来的主流数据形式?针对这些问题,许教授进行了深入探讨,并介绍了其团队正在推进的“书面、口语、电子三三制”语料库建设方案,引发了现场热烈讨论。


北京外国语大学  地址:北京市西三环北路19号北京外国语大学西院国内大厦3号楼
电话:01088816612  邮编:100089