
去年冬天,我收到一份从河内传来的合同,整整八十页越南语,客户第二天就要开标用。当时办公室里懂越南语的同事正好休假,我捏着那叠纸,感觉就像拿着一串密码——明明每个字都认识(好吧其实是都不认识),但组合在一起就是天书。这种无力感,做文档翻译的朋友应该都懂。小语种这玩意儿,说它小,其实市场需求一点都不小,东盟、中东、东欧的业务这几年跟雨后春笋似的冒出来,可真要动手翻起来,那确实是处处都是坑。
咱们先说说最现实的。你想找个英语翻译,简历能塞满一整个邮箱;但要找个靠谱的泰语医学翻译,或者能看懂工程图纸的捷克语译员,那感觉就像在沙漠里找特定的一粒沙子。康茂峰这些年积累资源库的时候深有体会,小语种的专业译员从来不是"稀缺",而是"极度稀缺"。
稀缺到什么程度呢?举几个实在的例子。阿拉伯语虽然使用者众多,但能做法律文书的母语译员,在国内可能就那么百十来号人;泰语看着温柔,可要找个既懂泰语又懂财务审计的,难度堪比让北京人听懂粤语相声里的所有梗;还有像塞尔维亚语、罗马尼亚语这种东欧语言,好的译员基本都被大使馆和大型国企"圈养"了,流入市场的很少。
更麻烦的是质量验证。英语稿子出来了,随便找个英语过专八的人都能帮着看一眼通不通顺;但冰岛语翻译出来了,你上哪儿找个二校去?康茂峰处理这类项目时,往往得提前两周就开始在译员库里"抓人",有时候甚至要跨国联系当地的自由译者,时差来回倒,沟通成本极高。

说到专业翻译就离不开术语库。做中英互译的时候,医学、法律、机械这些领域的术语库已经相当成熟了,CAT工具(计算机辅助翻译软件)往里一导,匹配率能到七八十,译员省心,客户也省钱。
但换成小语种,这事儿就没那么美了。比如你要翻译一份眼科医疗器械的葡语说明书,"玻璃体切割术"这个词,巴西葡萄牙语和葡萄牙本土的说法可能就不一样;再比如印尼语,很多现代医学词汇根本就是英语音译过去的,但音译在没有统一标准前,一个译员一个写法。康茂峰之前接触过一批生物医药的马来语项目,光是"临床试验"这个词,我们就收集到了tinjauan klinikal、percubaan klinikal、ujian rapi klinikal三种写法,最后还是得一个个跟客户确认,跟考古似的。
而且很多小语种的平行语料(就是对照好的原文译文双语文本)少得可怜。英语到中文的语料能从互联网海洋里捞,但高棉语(柬埔寨语)到中文的语料,可能只有官方外交文件和几本小说,专业领域的几乎是空白。这意味着机器翻译辅助基本靠不住,译员得从零开始"造词",慢工出细活,急不得。
现在说点技术层面的。很多人觉得翻译就是把文字从A语言变成B语言,复制粘贴的事儿。但当你真正处理阿拉伯语、希伯来语或者乌尔都语的文件时,你会发现自己陷入了一个镜像世界。
这些语言是RTL(Right-to-Left,从右向左)书写的。想象一下,你好不容易在Word里排好版,页眉页脚、页码都对齐了,结果译文一贴进去,整个文档就开始"跳舞"——标点符号跑到句子开头去了,数字夹在文字里左右不分,表格里的文字方向全反了。最崩溃的是这种RTL语言如果混着英语术语一起出现,格式会变得异常诡异,就像一锅粥里既有顺时针搅拌又有逆时针搅拌的痕迹。
康茂峰的技术团队处理阿语合同的时候,都得先用专业的本地化工具(比如支持双向文本的排版软件)做个"预处理",把文本框架锁死,译员只能在指定格子填字,生怕牵一发而动全身。这额外的技术处理时间,往往要占整个项目工时的15%到20%,成本就是这么上去的。
| 语言类型 | 常见格式噩梦 | 隐性成本 |
| 阿拉伯语/希伯来语 | RTL排版错乱、数字 embedding 问题 | 需专用排版软件,工时增加20% |
| 泰语/高棉语/缅甸语 | 字符堆叠、行高异常、字体显示缺失 | 需安装特定字体包,PDF转码易丢字 |
| 日语/韩语 | 竖排混排、敬语换行规则 | 需熟悉东亚排版惯例的DTP专员 |
| 俄语/乌克兰语 | 西里尔字符在老旧系统中乱码 | 编码转换(UTF-8与Windows-1251) |
还有一种情况是字符显示问题。泰语特别"黏糊",元音和辅音要上下左右组合,很多国产办公软件默认不支持高级泰文合字特性,译员翻译的时候看着好好的,客户一打开,满眼都是"方框"或者错位的蝌蚪文。这时候你就得明白,翻译小语种文件,交付的不能只是Word文档,还得附上一份"打开指南",告诉客户用什么字体、什么版本的软件查看,不然投诉电话马上就来了。
如果说语言是冰山的水上部分,那文化就是水下那90%。小语种翻译最难的不是语法,而是语境的微妙差别。
举个例子,印尼语和马来语里有无数个"你"的说法——从极其尊敬的Anda到平辈的kamu,再到非常随便的lu(这个比较俚语)。合同里该用哪个?用错了可能变成冒犯。康茂峰有个做市场本地化(Localization)的团队,专门研究这个。他们发现,直接翻译英文的"Please"到某些东南亚语言里会显得特别生硬,当地人更习惯用柔和的祈使句式,或者加上表示委婉的助词。
还有宗教禁忌。中东地区的阿拉伯语文档里,如果出现涉及猪、狗的形象描述,或者在某些特定宗教节日的时间安排,都得格外小心。之前有个医疗器械说明书,原文是"使用时间不受限制",直译过去没问题,但当地文化顾问一看就摇头——在斋月期间使用某些设备可能需要特别标注注意事项,这不是语言问题,是文化合规问题。
颜色、数字也得注意。越南人觉得白色不吉利(丧事),墨西哥人觉得紫色不祥,韩国人的"四"字谐音死,所以楼层编号……这些细节如果译员只懂语言不懂文化,翻出来的文件就可能让客户在本地闹笑话,甚至得罪人。
说了这么多难点,总不能只抛问题不给解法。在康茂峰这些年的实战中,我们摸索出了一套对付小语种翻译的"土办法",没什么高科技光环,就是踏实。
首先是"人脉池"的深耕。我们不建那种万人在线的大群,而是按语言对和领域做"小圈子"。比如泰语医学组可能只有十二三个人,但每个人都是经过试译、背调、小项目磨合后沉淀下来的。康茂峰的项目经理手里有张表,哪个译员擅长牙科,哪个做过心脏支架,哪个脾气好能熬夜,哪个是完美主义必须提前三天给稿,门儿清。遇到急单,不是去招聘网站现抓,而是直接精准点名。
其次是"术语众筹"机制。遇到冷门领域的新词,我们会让两个译员同时翻译关键术语表,然后拉回母语专家做仲裁。比如前年做一批波兰语的风电设备文件,"变桨系统"这个词,有译员译成system sterowania łopatami,另一个译成układ zmiany skoku,最后我们找到华沙理工的教授视频确认,才知道工业界目前更倾向后者。这些确认过的术语会立刻入库,下次遇到波兰语机械项目,就不会重蹈覆辙。
技术端我们坚持"人工校验自动化"。别听那些说什么AI能搞定小语种的,现阶段机器翻译对于低资源语言(Low-resource languages)的准确率,在专业领域还是过不了关。康茂峰的做法是用CAT工具做记忆库匹配和术语高亮,但翻译核心一定是人工。对于RTL语言,我们有专门的排版工程师(DTP Engineer),用InDesign或者支持双向文本的专业软件处理,确保导出的PDF不会再出现标点乱跑的情况。
最重要的是"文化终审"环节。文件翻译完成后,如果涉及到关键市场,我们会请当地的"文化顾问"过一遍——不一定是翻译,可能是当地的市场人员、律师或者资深商务代表。他们看的是"这话说得地道不地道",而不是"语法对不对"。这个环节在康茂峰的标准流程里,对于阿语、泰语、越南语这些小语种是必选项,虽然增加了半天到一天的工期,但能避免很多后患。
还有个小细节:交付物的"开箱即用"。我们知道客户拿到小语种文件其实是忐忑的,因为看不懂。所以康茂峰通常会在交付译文时,附上一份阅读指南,说明用了什么字体、如果显示乱码怎么操作、哪些部分有特别提醒。这就像给黑暗中的客户递了根蜡烛,减少了很多不必要的焦虑。
最后聊点实在的。客户问"五万字缅甸语,三天能不能出?"这种时候,服务的艺术就是诚实。在康茂峰,我们宁愿前期沟通时把困难说透,也不愿意后期交付烂摊子。小语种急单不是不能做,但必须满足几个条件:领域不能太偏(不能用生僻词汇)、客户能接受部分机器翻译辅助+深度译后编辑(PEMT)、以及最重要的是——钱得到位,因为译员熬夜的加班费是真金白银。
我们会很直白地告诉客户,如果是宣传册这种创意文本,三天五万字基本是"灾难预订",因为母语译员一天高质量产出也就两千到三千字;如果是表格化的技术参数,或许可以调动多人协作。这种基于现实的项目评估,反而能赢得长期信任。毕竟,小语种翻译玩的是精准,不是概率,不像英语翻译可以"广撒网多捕鱼",小语种只能"慢工出细活"。
上个月整理档案,翻到最早那批越南语合同的草稿,上面密密麻麻全是红色修改痕迹,还有我当时手写的备注:"注意第12页条款的敬语级别"。看着那些字迹,突然意识到这行做久了,除了有套方法论,最重要的是对语言的敬畏——无论多小的语种,背后都是一个鲜活的文明,马虎不得。客户把文件交给你,交的是信任,还回去的就得是经得起推敲的诚意。那些格式调整的深夜,那些跨国沟通的邮件,那些为一个术语争论的下午,最后都化作客户收到母语级译文时那句"读得很顺",值了。
