供图、供稿:盛尧 编辑:于洁莹
2025年11月13日下午,应北京理工大学研究生院及语言工程与认知计算工信部重点实验室邀请,东北大学计算机学院人工智能系主任肖桐教授为学院师生作了题为「大语言模型时代的机器翻译:前沿技术、挑战与机遇」的学术讲座。本次讲座由外国语学院英语系李洪政副教授主持,刘芳教授及外国语言文学专业博士后、博士生、硕士生等参与了本次讲座。

我们通常将使用计算机模拟人类学习或智能特征的尝试统称为“人工智能”。其中,可以理解上下文涵义,并基于理解生成相关信息的模型称为“语言模型”。近年来的语言模型通常基于神经网络架构,经过海量文本数据训练,具有生成与理解语言的能力,能够执行多种语言任务。因此,这样的语言模型也被称为“大语言模型”。肖教授指出,经过近70年的技术积累,当今人工智能已进入高速发展期:数学推理、代码生成、艺术创作等困难问题已经得到初步解决,AI智能体在工作中得到了广泛应用。而通用人工智能(AGI)不再局限于某一特定领域,可以使用单个智能体同时解决多个问题,是人工智能未来的发展目标之一。语言是人类思维的载体,而使用计算机解决语言问题的“自然语言处理”技术,是实现通用人工智能过程中的关键。
对于大语言模型,肖教授指出,语言模型在预训练阶段,通过大量无标注数据学习生成自然语言的基本规律,积累丰富的语言知识。此后,模型在后训练阶段通过人工标注数据,习得对话、推理等能力,并与人类价值观对齐。在翻译领域,大语言模型也取得了相当程度的进展。与传统神经网络机器翻译相比,其在复杂语境、创造性文本的翻译上有着更加优异的表现。然而,目前大语言模型仍然存在着“部署成本高”、“幻觉现象导致严谨性下降”等问题。同时,由于缺乏足够的训练语料,在低资源语言场景下,大语言模型的表现仍然不及人类水平。

在随后的问答环节,针对新时代语言研究如何与大模型结合的问题。肖教授指出,语言学研究者可以充分发挥长处,为大模型提供高质量标注数据,同时还可参与模型的提示词编写及对齐工作。此外,还可以进一步探索模型在语言教育等领域的应用。肖教授的讲座启发了在座师生,为大语言模型时代的语言学研究提供了新的视角与方向。

(审核:赵满、徐嘉)