《圣经 · 旧约 · 创世纪》第 11 章宣称,当时人类联合起来兴建希望能通往天堂的高塔——巴别塔,高塔直插云霄,似乎要与天公一比高低;此举惊动了上帝,为了阻止人类的计划,上帝改变并区别开了人类的语言,使人类因语言不通而分散各处,人类的巴别塔计划半途而废了,于是世界上有了不同的语言和种族。
那么,在那个语言多元化的时代,谁是历史上最早的翻译官?中国本身是一个多民族的国家,各地语言不一,谁又是中国的第一个翻译官呢?
也许人类在迁徙和民族语言分化的过程中自然产生了一批双语者;据《礼记 · 王制》记载,我国最早的翻译出现在周朝;到了汉武帝时期很多使者出使西域,这个过程中就诞生了很多早期的翻译官;到底谁才是第一个翻译官我们早已无从查证;有学者称我国的外语翻译始于东汉盛于隋唐,佛教翻译家玄奘开创了直译和意译为一体的佛经翻译时代。
尽管翻译第一人众说纷纭,无从考证,但历史却实实在在的将我们带到了文明快速发展融合的今天,今天的人工翻译是指通过人工的方式将一种语言转化成另一种语言的行为,是一种人为控制翻译质量的方式。最近极受大家追捧的、坐在总理身边的美女翻译张璐就曾说过,成为一名优秀的外交翻译没有捷径可走,只有不断练习、练习、再练习;无论做多长时间的翻译,永远都怀着一颗敬畏的心。康茂峰的一众美女翻译人员都把张璐视为楷模榜样,每天都在不断的学习、总结,力求传达出更加专业、严谨的翻译效果。
信息化时代的来临,翻译技术发展迅猛,极大缓解了传统人工翻译模式与日益剧增的翻译需求之间的矛盾。那么机器翻译又源于何时?推出了哪些令人惊叹的落地应用呢?
机器翻译是一个复杂的系统工程,涉及人工智能、数学、语言学、计算语言学、语音识别和语音合成等多学科和技术。一个完整的机器翻译过程,首先输入源语言的句子,经过形态分析得出句子中每个单词的形态信息和其他信息,再进行句法分析。1946 年,第一台数字电子计算机诞生;1949 年,机器翻译思想正式提出,Warren Weaver 发表《翻译》备忘录,这被视为机器翻译初始阶段的第一件标志性事件;此后很长一段时间,全球各国大力支持机器翻译项目,机器翻译研究的高潮就此形成。
1956 年,中国就将计算机翻译技术纳入了全国科学工作发展规划;1966 年,美国语言自动处理咨询委员会(ALPAC)报告称,从速度、质量、花费、需求等各个角度,机器翻译的译文质量明显远低于人工翻译,使机器翻译出现了空前的萧条局面;直至 20 世纪 80 年代末,微处理器的出现,计算机能力获得了突飞猛进的发展,机器翻译这一学科开始被人们重新提起;到了 90 年代,计算机的普及和 Internet 的普遍应用,让机器翻译又迎来了一个新的发展机遇。
众所周知,用词丰富是语言使用的基本原则。机器翻译只是句法结构和词汇的机械对应,对源语言的分析只是求解句法关系,并不能像人工翻译一样从整篇文章的意义上去理解,尤其是带有文化色彩的语句,如果都使用机器翻译,那么大量的文化信息有可能会在翻译过程中遗失。因此,要提高机器翻译的质量首先要解决语言本身的问题而不是程序设计的问题。在这种情况下,计算机辅助翻译应运而生。计算机辅助翻译的思想可以追溯到 20 世纪 70 年代,当时有人提出了“翻译记忆”的概念。即把以前的翻译结果存储在计算机中,以后在翻译相同或类似的文本时可以重复利用。
2014 年,Cho et. al [3] 和 Sutskever et al. [4] 提出了Encoder-Decoder 架构的神经网络机器翻译系统。2016 年, Google 官方将全产品线的翻译算法换成了基于神经网络的机器翻译系统,深度神经网络采用的是端到端学习, 即跳过中间各种 NLP(自然语言处理)算法步骤,用深层的网络结构去直接学习拟合源语言到目标语言的概率。
计算机辅助翻译与机器翻译不同之处在于,机器翻译旨在用机器完全代替人工劳动;而计算机辅助翻译主要支持技术是翻译记忆和术语库,即人工译员的翻译结果被软件所记忆,译员下次再碰到相同或类似的翻译文本时,软件会从以前的翻译案例中自动匹配符合的译文供译员选择,且译员可通过建立术语库来规范翻译项目中的术语,从而保证同一个项目中译文术语的一致性。
截止目前,计算机辅助翻译技术的应用可以说已经有很长的历史了,我们耳熟能详的翻译软件包括 Trados、 Déjà vu、 Memoq 等等;北京康茂峰科技有限公司是国内最早拥有正版 Trados GroupShare 服务器版翻译软件的公司,据康茂峰总经理樊为国介绍:“Trados GroupShare 实现了翻译的实时共享,解决了翻译工作量大需要多人协作翻译时的用词、语气不一致的问题。CAT 的接入也让我们更从容的应对多人协同翻译,在翻译效率和一致性等方面均得到了大幅提升。”
现在的机器辅助翻译技术大部分都基于大数据的支持。据樊为国先生介绍说:“基于神经网络机器翻译引擎的问世,对于机器翻译的输出质量产生了巨大的影响。我们从 2009 年就已经在使用 Trados GroupShare (CAT) 翻译软件,使用 CAT 进行翻译的过程中积累了大量的双语语料库。2017 年,我们与东北大学自然语言实验室的小牛翻译团队合作,将他们针对中文进行了优化的神经网络技术与我们近十年的专业、庞大语料数据储备相结合,训练出了康茂峰专用的医学机器翻译模型,这使我们在后来的翻译过程中节省了大量的时间;同时又很好地解决了大批量文件需要多人协作翻译时的用词一致性问题,让我们的译文无论是效率上还是质量上都得到巨大的提升。”
中国现今已成为全球医药研发的主要国家之一,中国的医药翻译市场产值也在逐年递增,正是在这种强劲的市场需求下,更需要翻译效率与质量的提升,将稿件通篇交由机器辅助翻译是不可能的,还需要人工译员进行查漏、校对与润色等等。樊为国先生表示,未来,人机结合的翻译模式将会是翻译行业发展的必然趋势。
据樊为国先生介绍,康茂峰特有的医学辅助翻译引擎更多的是针对原文的初步翻译、语序的调整、确保术语一致性等这些具有重复性的翻译工作;而译员们则把更多精力放在译文风格是否与原文一致、译文的可读性是否符合受众的应用场景和用词的精准性等方面。因此,对译员的翻译和语言能力要求会更高,广大译者需要做的是加强自身的文字功底、阅历以及提高业务水平,才能让自己立于不败之地。
作为国内最先采用新技术的医学翻译公司,康茂峰率先采用计算机辅助翻译与人工翻译融合创新的翻译模式,人机共同协作,相辅相成,既能节省翻译时间,又能交付高标准的译文。相信科技与人工的融合将是机器翻译与人工翻译的未来发展趋势和方向,也是提升翻译质量和翻译效率的必经之路,我们期待康茂峰引领医学翻译行业攀登下一个高峰!