查看原文
其他

41年攻关!304种语言互译!东大科技助力北京冬奥会!

东北大学 2021-09-21

精益求精 百炼成钢

机器翻译产学研

自主创新走行业最前沿

助力2022北京冬奥会

在41年里厚积薄发


捐资助学

回报国家 回报社会 回报母校

始记社会责与家国情

从东北大学走出来的小牛翻译

一直在书写他们的光荣与梦想

“距离2022北京冬奥会开幕还有一年时间,但各项筹备工作都在紧锣密鼓地进行中……习近平总书记关于办好北京2022年冬奥会的重要讲话更是让我们深感工作使命光荣、意义重大。”参与承担科大讯飞总负责的科技部“科技冬奥”专项中多语种机器翻译关键技术研究课题的小牛翻译创始人朱靖波教授表示,“我们团队已成功完成机器翻译内核技术的研发,正在对技术成果进行系统集成及应用测试,研究成果将应用到冬奥会智能办公系统、机器同传系统、赛事转播系统、以及语音智能设备和多语言智能问答设备当中,助力北京冬奥会办成一届精彩卓越的国际体育盛事。” 

在东北大学的大力支持下,小牛翻译已经发展成为国内规模最大的机器翻译产学研团队,始终坚持自主创新,通过在机器翻译前沿技术攻关和科研优秀团队培养上狠下功夫,使重大科技项目研发和科技成果转化应用进入“快车道”。

小牛翻译是目前世界上支持语种最多的机器翻译系统,能够支持中文与304种语言互译,包括英日韩俄法西等主流语种、“一带一路”沿线所有国家的官方语言和联合国所有成员国官方语言翻译。2020年以来,小牛翻译团队持续加大科研投入力度,通过定向攻关、过程落实、成果转化取得了良好成效,创造了较好的经济效益。

朱靖波表示,“基于实验室41年机器翻译技术的研究积累,团队坚持自主研发,不断创新突破,研发世界最好机器翻译系统,为全世界用户提供机器翻译服务,正在我们手中一点点变成现实。”

41年积淀

小牛翻译夯实了发展基础

1980年姚天顺教授和王宝库教授创建了东北大学自然语言处理实验室,开创了我校计算语言学(自然语言处理)研究方向,成为国内最早开展相关研究工作的研究团队之一。朱靖波在1992年大二念书的时候加入实验室,师从姚天顺教授和王宝库教授,开始接触机器翻译研究,1999年博士毕业留校,继续领导实验室从事机器翻译研究工作。

2009年实验室第一次使用统计机器翻译技术参加国内规模最大、历史最长的机器翻译比赛—CWMT评测,取得了汉英新闻翻译系统第二名的成绩,仅以微弱的差距落后于微软亚洲研究院的参赛系统。在这次评测大会上,朱靖波注意到,绝大多数参赛单位都在使用英国爱丁堡大学的Moses开源统计机器翻译系统做优化,但是系统并没有针对以中文为核心的翻译任务进行调优,造成许多参赛单位的比赛结果并不理想。朱靖波在会上郑重地宣布,要开发自己的开源机器翻译系统,让全世界的科研人员都可以在东北大学的机器翻译开源平台上开展研究。

为了鼓舞士气,朱靖波给这个系统起了一个很有内涵的名字—NiuTrans。朱靖波说:“NIU蕴含着东北大学(NEU)、新(New)和老黄牛精神(牛)三重含义,Trans是translation的缩写,两个部分合起来,表达了团队要发扬老黄牛的精神,勇于创新,积极进取,努力打造出最牛的机器翻译系统。

实验室的每个人都秉持着“精益求精、百炼成钢”的精神,努力在以中文为核心的自然语言处理领域不懈奋斗。小牛翻译系统的主要技术负责人、朱靖波教授的博士开门大弟子、实验室现任第三代掌门人和计算机学院人工智能系主任肖桐教授说,“当时正是8月份,沈阳天气炎热。我们的系统开发和实验需要在多个服务器上进行,由于天气太热,服务器所在的机房经常跳闸,我们就需要守在服务器旁,忍受着巨大的噪音和高温,有时从早上7:00一直要实验到晚上11:00,直到信息学馆闭馆,被打更老大爷撵了几次才离开。功夫不负有心人,经过近两个月的工作,我们终于完成了整个参赛系统的开发。”

2011年7月,团队正式发布了NiuTrans的第一个开源版本,得到了非常多的关注。又经过一年的努力,团队把包括短语、层次短语、树到串、串到树、树到树的五个模型都集成到了NiuTrans系统中,形成了一个属于中国人自己的、完整的统计机器翻译系统,这也是世界上能够支持五个主流模型的两套翻译系统之一。在随后的国际大赛中,NiuTrans连获佳绩,在日本东京举办的国际汉英专利翻译评测中系统取得第二名、国内CWMT机器翻译评测中多次共获得8项冠军和国际最知名的机器翻译评测WMT上多次共获得13项世界冠军。东北大学开源机器翻译系统NiuTrans曾被ACL2012选择为参会的演示系统,引起国际学术界的关注。

作为世界上支持机器翻译模型最多的开源系统之一,NiuTrans开源机器翻译系统已被全球70多个国家的3000多个研究机构下载使用。鉴于在机器翻译技术上的重要创新与突出贡献,小牛翻译在2016年荣获国内自然语言处理领域最高科学技术奖—钱伟长中文信息处理科学技术奖一等奖,成为国内首次获得该奖的机器翻译研发团队2018年小牛翻译作为唯一的机器翻译基础服务平台入选了国家工信部首批人工智能与实体经济深度融合创新项目,全国共106个项目入选,其中辽宁省共四家入选(小牛翻译、东软集团、新松机器人和中科院自动化所)。2019年小牛翻译获批辽宁省科技厅语言智能技术创新中心和沈阳市科技局语言智能协同创新中心,在两者基础上成立了小牛新技术创新中心(NiuTrans Research),深入开展机器翻译创新性研究工作。

机器翻译产学研

小牛翻译走上了行业的最前沿

跟随“一带一路”国家战略,跨境电商、跨境旅游、跨境金融等行业的快速发展,多语种语言信息的快速处理成为必须跨越的障碍。而这一问题,人工翻译无法快速、准确、低成本地解决,被认为是自然语言处理领域“皇冠上的明珠”的机器翻译成为必然选择。为此,国际知名科技巨头纷纷投身于机器翻译发展领域,机器翻译是实现多语种大数据翻译实时翻译的唯一解决方案。

面对机器翻译行业及市场的迅猛发展,手握“明珠”的朱靖波看到了希望,雄心勃勃地走出实验室,开启了机器翻译产学研一体化发展的创业之旅。

基于自主研发的神经机器翻译技术,小牛翻译团队构建了机器翻译云平台,采用线上线下结合的方式,面向企业级大数据的翻译需求提供机器翻译服务解决方案,与华为、腾讯、科大讯飞、京东、小米、金山、中国联通、国家知识产权局、东软集团、SYSTRAN等国内外百余家行业标杆企业以及多个政府部门建立了合作关系,同时已经进入日本、韩国和欧洲多个国家的本地机器翻译应用市场,为全球用户提供高品质多语种机器翻译服务。

朱靖波自信地表示,“现在的机器翻译市场竞争激烈,与很多人交流时,对方经常问的第一句话是与同类翻译软件相比,小牛翻译的性能如何?当用户自己体验完小牛翻译的优秀品质后,用户才会关心我们的水平有多高,比如论文、获奖、样板合作等等。看到我们强大的机器翻译研发能力,完全能够满足用户的需求,合作就很顺利了。”

目前,小牛翻译团队已经成为国内机器翻译产学研领军团队。小牛翻译技术负责人肖桐表示,团队已经自主研发推出了一套深层的编码器,可以很好地表达像中文这种复杂语言的一些语言现象,能够很好地完成300多种语言的翻译任务。展望未来,小牛翻译团队将继续坚持“机器翻译,让世界语言交流无障碍”的信仰和梦想,让机器翻译技术服务社会、造福人类。

捐资助学

用行动回报国家、回报社会、回报母校

2020年11月13日,朱靖波得知软件学院学生罹患白血病、需骨髓移植的消息后,立即表示团队愿意在张学良教育基金会捐资100万元设立东北大学“小牛翻译”大病救助基金,专项用于救助罹患重病的东北大学在籍学子,强调本项基金将支持患病学生个人及家庭难以负担的手术治疗费用,剩余资金将用来资助类似的患病同学。

自2016年开始,“小牛翻译”多次捐资设立“小牛翻译”基金、小牛奖学金、小牛翻译奖教金、小牛翻译自强之星助学金等,支持东北大学计算机学院师资队伍建设、学生指导服务中心“自强之星”评选表彰工作,已累计捐资250万元。

小牛翻译还与外国语学院签署实习基地合作协议,为学院培养翻译人才、锻炼学生的语言应用能力提供舞台,为学校的学科发展与人才培养工作贡献力量。

朱靖波表示,“小牛翻译”扎实科研、稳步发展所取得的成绩离不开母校——东北大学的支持。未来将秉持初心,培养优秀人才,产出优秀的科研成果,以实际行动为国家教育事业发展和学校“双一流”建设贡献力量。

秉初心 育人才 潜科研

专耕机器翻译产学研

在“研发路”上孜孜不倦

在“产品路”上精益求精

在“强国路”上勇往直前


面向未来

小牛翻译

继续大步向前!


文字丨张广宏

编辑 | 杨丽媛

责编 | 管珊珊 段亚巍

往期回顾

东大!开学!

周一见!


分享

点赞

在看

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存