为促进语言数据与资源共建共享,推动语料库学科的发展和创新,5月19日,由外国语学院主办的“语言数据与资源共享论坛”在拉斯维加斯官网举行。来自国内多所高校的知名专家出席论坛并做主旨发言,外国语学院副院长王清杰主持开幕式,院长刘国兵致开幕词。
刘国兵向与会专家学者表示热烈欢迎,并对学院语料库平台建设与发展现状做了介绍。他指出,此次论坛的召开,为语言数据与资源共享搭建了一个高层次交流平台,对进一步发掘跨学科研究潜力,推动语言数据与资源共享,以及发展新质生产力培养创新型人才具有重要意义。他希望通过举办此次论坛,学院能够与语言数据领域的专家建立更加紧密的联系,进而开展多层次、宽口径、全方位的合作与交流。
论坛以主旨报告方式进行。上海外国语大学校长助理、语料库研究院院长、教育部国家重大人才计划特聘教授、国家社科基金重大项目首席专家、教育部黄大年式教师团队负责人、教育部长江学者特聘教授胡开宝作了题为“大语言模型背景下翻译研究的发展:问题与前景”的主旨发言。他指出,大语言模型给翻译实践和翻译研究带来了巨大的历史机遇和挑战,大语言模型在翻译实践中的应用不仅使得作为翻译研究对象的翻译主体以及翻译文本的属性发生变化,翻译研究因而面临翻译伦理、译者主体性、译者风格和翻译中的意识形态等方面的问题,而且也使得翻译研究方法发生变化,翻译研究趋于数据化、可视化。因此,大语言模型背景下翻译研究应关注翻译伦理研究、翻译文本研究、译者研究、翻译与意识形态研究、翻译批评研究以及翻译教学研究等领域。
曲阜师范大学外国语学院院长、博士生导师秦洪武教授作了题为“平行语料用于翻译精调模型:设想和设计”的主旨发言。他强调,在生成式人工智能时代,外语人才依旧不可或缺,在提供多语数据尤其是平行语料方面担当重要角色,因为学习数据质量直接决定着多语LLMs的应用质量和适用范围。除了为模型训练提供学习数据外,平行语料还有其特殊功用,能在既有预训练模型基础上构建精调翻译模型,服务于专门领域的翻译。精调模型训练在技术上可能并不复杂,但需要高算力支持,更需要高质量语料保证训练质量。
南京理工大学外国语学院院长杨蔚教授作了题为“基于语料库的军区科技话语特征研究”的主旨发言。她指出,新文科建设中提出的建设光耀世界的中国文化,需要建立当代的中国话语体系,以提升中国在国际上的话语权力和话语能力。她基于军工科技话语语料库的建设,开展垂直领域语料库的话语特征研究,探索了建构中国特色的军工科技话语体系的路径与方法。
西南财经大学全智和刘霞教授作了题为“财经专门语料库的设计、建设与应用:理念、方向与尝试”的主旨发言。他们指出,在当今信息化迅速发展的时代背景下,财经专门语料库的建设对于推动垂直领域的语言研究和实际应用具有十分重要意义。他们简要介绍了西南财经大学商务英语语料库研究中心的发展情况和一亿词次以上的公司年报语料库的设计与建设。在应用层面,他们还展示了如何运用该语料库研究语用学中的mitigation问题。
外国语学院院长、博士生导师刘国兵教授作了题为“教育语料库的设计与创建”的主旨发言。他介绍了教育学专门语料库的主要建库过程,包括建库目的、建库设计、语料收集、元信息标注、语料库应用与展望等。他指出,教育学学术汉语语料库的采集遵循专业性、权威性、代表性以及时效性四个标准,根据十个二级学科分类,共选择43个CSSCI来源教育学中文期刊中的论文和书评作为语料来源。他还详细说明了教育学专门语料库的文件命名、文本清理、元信息标注在内的详细操作等,以期为教育信息化提供基础数据和技术支持。
刘国兵最后作总结发言,他指出,今年是推进学院“十四五”规划目标任务的关键一年,本次论坛的举行点燃了外国语言文学学科交叉融合发展的助推器,为语料库语言学起高峰注入了科研新动能。今后,学院将站在师大百年新起点,进一步强化顶层设计,加强中长期研究领域建设和重大项目、重大平台培育,主动对接服务国家重大战略需求,进一步提升外语学科建设水平和社会服务能力,为发展新质生产力提供智力支持。
本次论坛聚焦“语言数据与资源共享”研究领域,汇聚了语料库语言学方向众多专家学者的群体智慧,是一场高层次的跨学科对话。各位专家畅所欲言,为推动语言数据与资源共享把脉问诊、建言献策,达到了思想碰撞和互学互鉴的效果,并在此过程中增进了友谊和共识,有效促进了语言数据与资源共建共享。
论坛开始前,与会专家学者在外语楼A306召开了“语言大数据平台建设协调会”。会上,各位专家就大数据平台的建设进度进行了汇报,并对下一步做好平台运行工作进行了安排部署。
外国语学院 刘予辉