立即登录

机器辅助翻译 国创展 | 机器翻译辅助外语文本阅读平台

03/15 01:37:42

机器辅助翻译 国创展 | 机器翻译辅助外语文本阅读平台

北京语言大学从2012年5月开始实施本计划。2018年5月,确立了29个项目成为2018年度“国家级大学生创新创业训练计划”项目。各相关学部(院)认真组织了项目的立项和建设,以及结项、验收;各项目的指导教师认真参与并指导了项目的开展;学院管理人员做了大量保障和服务工作,保证了项目的顺利进行。参与国创项目的同学结合所学专业领域的特点开展项目,既有深刻的思考和研究,也有广泛的考察和调研,不乏学科专业领域的前沿研究和热点探讨。国创项目的实施对学生进一步增强专业学习兴趣,牢固专业知识辅助卡盟,提高创新创业能力具有实际意义。

“北语教务”公众号将陆续刊出在2018年度国创项目中获得优秀项目称号的项目展示。希望通过这些项目的展示,能对广大同学有所启发。

教务处

项目名称:机器翻译辅助外语文本阅读平台

项目负责人:刘文韬(16翻译(本地化))

项目组成员:周琦凡(16翻译(本地化))、周楚婷(16翻译(本地化))、李聪媛(16翻译(本地化))、季薇璐(16翻译(本地化))

指导教师:韩林涛老师

项目简介:

本项目由翻译专业学生对计算机辅助翻译的需求出发,开发一款基于HTML与PHP,可在本地服务器运行的计算机辅助翻译工具。结合网页爬虫,帮助翻译专业学生在外语文本搜集与翻译练习上提高效率。

项目整体可以分为两部分,分别是“基于行块分布函数的网页正文提取程序”与“基于HTML的计算机辅助翻译平台”。

通过此次科研创新实践活动,项目组成员成功开发出一款适合翻译专业学生的计算机辅助翻译工具,可在学院内进行初步推广。项目组成员亦在实践过程中加深了对翻译技术与网页设计与开发技术的认知。

机器辅助天赋加点图s4_s6新版辅助机器人出装顺序_机器辅助翻译

项目创新点:

该项目创新点在于,项目组成员从翻译与语言类专业学生的实际需求出发,自行设计并开发出一款机器翻译辅助阅读与翻译平台。在计算机辅助翻译软件普遍价格昂贵的市场下,制造出符合学生译者及外语学生需求的工具。

项目团队的收获:

本项目自2018年4月立项以来,经历了近一年的时间。在项目组成员的共同努力下,完成了任务。

项目一开始就经历了一次重大变化,原定的项目,因为市场上已经有了太多同类产品,导致项目失去了原有的创新性。在组内成员的讨论下,我们换角度思考,由我们自身,即翻译专业学生的需求角度出发,认识到了计算机辅助翻译工具对于学生的重要性。而市面上大型计算机辅助翻译软件动辄成千上万元一套,非翻译团队无法负担得起。在这样的需求驱动下,组内成员找到了行动的目标。

同时我们也认识到,原项目计划中的网页正文提取(爬虫)可以保留。虽然是一个简单的爬虫,但是实践过程中逐渐发现了不同正文提取方法的局限性,从而促使项目组成员寻找新方法。最终通过文献,利用Python程序设计语言写出了基于行块分布函数的网页正文抽取方法。

这次的项目是对我们的学习能力、知识运用能力与实践操作能力的重大挑战。一方面,利用网页设计的知识打造一个能够实际应用的工具,于我们是一次重大的成就。另一方面,我们也认识到网页正文提取这么一个简单的概念,背后竟然云集众多的方法与知识。通过这次实践,我们打开了新知识的大门,也完成了对自己的一次挑战。

s6新版辅助机器人出装顺序_机器辅助翻译_机器辅助天赋加点图s4

行块分布函数示例

s6新版辅助机器人出装顺序_机器辅助翻译_机器辅助天赋加点图s4

基于行块分布函数所获取的中文网页正文

机器辅助天赋加点图s4_s6新版辅助机器人出装顺序_机器辅助翻译

翻译与阅读平台术语(词汇)管理页面

项目各成员的心得和体会

1

刘文韬

这次是我第二次参加“大创”项目,从原来的项目组成员到这次的负责人。这次项目对我的很多素质都做出了考验,比如市场需求分析能力——我们从身边的需求出发设计并完成了一个平台;统筹规划能力——我带领团队,分工安排工作到记录项目进度;代码设计能力——我与另一位成员一同设计了一个Python爬虫脚本。这对我们来说是个人学习能力的一次测试。

翻译是语言服务行业的一环,所谓服务就有一个与客户(需求)、与市场互动的过程。忽视需求而闭门造车,就会造成与现实需求脱节。这也是此次项目给予我最大的经验与启示。

2

周琦凡

这是大学以来我第二次参加大创项目。之前担任的工作相对比较轻松,而这次却是需要负责更为核心的工作,这既给了我压力,也给了我动力,锻炼了我多方面的能力。本次项目对我们来说,既是一次对课堂所学知识的回顾,也是对我们活学活用能力的考验。在项目过程中,我学会了如何高效利用时间,平衡项目与学业。团队精神也是此次项目中另一个重要的收获,一个项目的完成不能靠一个人单打独斗,离不开小组内每个人的努力。

3

周楚婷

这是我第二年参加大创项目,去年的时候是学姐带我们,今年是我们带学弟学妹,我们要给学弟学妹一些正确的指引,让他们有所收获。我们这次做的项目是非常有本地化特色的一个项目,将翻译技术运用到实际生活中,帮助大家提高外语文本的阅读体验。通过这次的实践,我们很好的将自己的所学与生活联系起来,对自己所学有了一个具象的认识。做项目的过程中,有很多知识是需要自己去学习与摸索的,如何引入API,如何分词分句,课堂知识为我提供了基础,更多的是要自己去探索,所以这也提高了我的自学与思考能力。

4

李聪媛

又是一年大创,这次我变成了项目里的学姐,要带着学弟学妹们来完成项目。我们的项目负责人刘文韬同学尽职尽责,不论是从项目开始的筹划阶段,还是中期实施,以及各种项目的人员、经费问题,负责人都一一完美解决。另一方面,我在项目的进行过程中也认识到了自己的很多不足,十分感谢一起参与项目的其他同学对我的支持和帮助。在这次项目当中,我们遇到过很多预料外的困难,重要的还是我们老师和组员之间的合作与沟通,让很多看起来难以解决的问题都一一得到了解决。

5

季薇璐

这个不是完美的作品,但它是我们用心制作的能够真正面向用户,具有实用功能的项目。很感激有这次的经历,让我对翻译辅助工具有了切身的体会机器辅助翻译,高效的翻译不仅仅需要优质语言的转化,还需要一些工具,像术语库、语料库的支撑,而这些工具的搭建也是一个必需耐心和时间的过程。我们要知道到底要表达什么,要对对方提什么要求,能够用最简洁的语言阐述我们的想法和理念,这次都需要足够的锻炼。想法每个人都有,但是努力把它变成现实就需要不懈的努力和坚持。创新还建立在实用性上,所以每一次创新的过程都应该从产品本身、便利用户的角度出发。

指导教师

从结项报告中可以看出,这个小组的同学从至少三门专业主干课程中汲取了营养,分别是网站设计与开发、数据库原理和高级编程,在网站设计与开发、数据库原理这两门课程中,学生了解了基本的存储、管理、编辑双语翻译文本的方法,并且开发出了一个可以在网页端进行在线翻译的平台;在高级编程课上了解的爬虫知识帮助他们了解了如何去获取一个网页中的文本。而这个小组又创新性的引入了行块分布函数,虽然这个方法并非他们首创,但这种方法却能起到非常好的效果,他们也证明了这种方法在其项目中的应用。

综合多门课程的学习成果,该小组产出了一个非常有意思的平台,确实让人觉得眼前一亮。希望这样的工具能够在更多同学的电脑中出现,帮助大家更好得使用机器翻译。

在此次项目中,刘文韬同学分工有序机器辅助翻译,作为项目负责人带领大家一同前进同时他非常注重市场与项目的创新性,是他带领组员分析需求,设计产品。周琦凡和刘文韬负责了爬虫的设计,展现出很强的学习能力与代码设计能力。周楚婷与李聪媛同学设计了平台的前端页面,在我的指导下历经多次修改,不怕苦不怕累。季薇璐同学在平台后端代码上贡献很大,在连接数据库时耗费不少工夫,坚持不懈。总而言之,五位同学均在此次项目中付出了心血,这一成果来之不易,值得珍惜。

机器翻译的出现并不是外语专业或翻译专业的终结,而是一个新的跨学科专业的契机,我相信高翻学院翻译专业(本地化方向)的同学能够再接再厉,做出更多有意思的东西,既把翻译做好,又能熟悉技术的应用。

来源:【九爱网址导航www.fuzhukm.com】 免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

最新资讯