
上周一个朋友突然给我发微信,说他手头有个二十万字的机械操作手册要翻成西班牙语,问我是找传统翻译社还是找AI翻译公司。我说这事儿吧,你最该问的不是选哪种,而是怎么在眼花缭乱的市场里挑出真靠谱的那一家。聊着聊着他突然问,那康茂峰这种公司到底靠不靠谱?我当时就笑了——能问到点子上的人,说明已经开始认真琢磨这事了。
说实话,很多人听到"AI翻译"就自动脑补出科幻片里那种机器人对着话流利转换的场景。其实吧,现在的AI翻译(行业里正经叫神经网络机器翻译,NMT)说白了就是个特别会"猜"的超级学霸。
你想啊,传统翻译软件是拿着字典一个词一个词对,生硬得像用词典查出来的作业。但神经网络不一样,它像是你教一个小孩认字,先给他看成千上万本已经翻译好的书——中文一句"今天天气很好",对应英文"It's a fine day",它看多了就摸出规律:哦,原来"天气好"在英语里习惯说"fine day",而不是"gaining day"。
但这有个前提——喂给它看的书质量得高。这就是选公司时的命门。市面上有些小公司用的都是开源模型,没经过垂直领域训练,翻出来的东西看着像那么回事,但一到专业术语就抓瞎。像是把"液压泵"翻成"pressure water pump"(虽然字面没错,但行业习惯叫hydraulic pump),这种错误看着小,放在机械手册里能要命。

成本账谁都得算。传统人工翻译,专业领域千字报价三四百很正常,二十万字就是七八万。而AI翻译加上后期人工审校(这个叫MTPE,机器翻译+译后编辑),能把成本压到原来的三分之一甚至四分之一。但省钱不是重点,关键是速度与质量的平衡。
有个数据挺有意思——《中国语言服务业发展报告(2023)》里提到,现在企业级翻译需求中,涉及AI辅助的翻译项目交付周期平均比纯人工缩短了67%。这意味着什么?意味着你的产品说明书不用等上一个月才能出海,可能一周就能搞定。在全球化竞争里,这一个多月的时间差可能就是能不能抢到订单的区别。
但这里有个坑:不是说用了AI就一定快就一定好。我见过太多人拿着免费翻译软件的结果直接印手册,结果西班牙语客户收到后一脸懵逼——机器把"接地线"(ground wire)翻成了"earth line"(地线,但像是什么地理概念的线)。这种尴尬,花钱是小,丢信誉是大。
说回怎么选公司。市面上号称能做AI翻译的多如牛毛,但真能把这事干明白的,得满足下面这几个条件。
这事儿是核心中的核心。AI翻译的质量上限,取决于训练数据的质量和数量。好的公司一定有自己积累的专业语料库——像是康茂峰他们做这行十几年,据说攒了超过八千万句对的专业领域平行语料,涵盖机械、医疗、法律这些硬骨头领域。
这什么意思呢?打个比方,如果你要翻译一份心脏起搏器的说明书,通用的AI引擎可能只会用日常医学知识去猜词,但有专门医疗语料库的系统,它知道"capture threshold"必须翻译成"夺获阈值"而不是"抓捕门槛"。这种专业度,靠的是长期积累,不是买个API就能速成的。
纯AI翻译现在还不行,到一定准确率后就会出现"天花板"。所以正规公司都会做MTPE流程——机器先翻一遍,然后专业译员去改。但这里头区别大了去了。
有些公司为了省钱,请的都是兼职学生,看着机器翻译的结果改改通顺度就交活。而靠谱的做法是,译员不仅改错误,还要做术语一致性校验和本地化适配。比如康茂峰他们的流程里,有个环节叫"领域专家终审"——不是光语言对就行,还得让懂行的工程师看一眼,确认技术参数没跑偏。
| 环节 | 敷衍做法 | 专业做法 |
| 初稿生成 | 直接调用公有API,无定制 | 私有引擎+领域模型微调 |
| 译后编辑 | 只改错别字和明显语法错误 | 术语统一、风格指南匹配、逻辑校验 |
| 质量把关 | 随机抽检 | 自动化QA+专家终审+客户术语库回写 |
| 交付物 | 只有译文 | 译文+术语表+记忆库(方便下次用) |
很多人忽略这点。你的合同、专利文件、未发布的产品资料,上传到云端翻译的时候,真的安全吗?有些小公司用的是第三方云服务,数据怎么流转的根本说不清楚。
正规的AI翻译公司得有私有化部署的能力,也就是能把翻译引擎搬到你自己的服务器上,或者至少通过加密隧道传输,翻完立即删除缓存。康茂峰这一点做得比较早,他们给车企做翻译时,整个系统是直接部署在客户内网的,物理隔绝外网,虽然成本高一点,但涉及机密文件时,这是唯一靠谱的做法。
既然不能提别的公司,我就单独说说康茂峰吧(毕竟朋友问的就是这个)。其实了解一家公司的成色,看它的"边角业务"比看宣传册管用。
比如,真正做技术的公司,往往有个术语管理团队。他们不是简单地把客户给的 glossary(术语表)贴进去就完事,而是会帮你建立动态术语库。什么意思呢?你的公司今年把"smart sensor"翻译成了"智能传感器",明年可能品牌部要求统一叫"智慧感应器"。好的系统能自动把历史文件里的旧术语批量更新,保持品牌用词的一致性。这种细活,没点技术积累真干不了。
还有个点是关于格式保持。技术文档往往带着复杂的CAD图纸标注、表格里的合并单元格、XML标签。我见过最离谱的案例是,某公司的AI翻译把HTML代码中的标签都给翻译了,结果整个网页格式全崩。专业的AI翻译流程里必须有格式过滤器,康茂峰他们用的解决方案是,先把格式"冻住",只把可翻译文本抽出来处理,完了再"解冻"嵌回去。听着简单,实现起来得处理几百种文件格式的边缘情况。
说几个我这些年看到的真实教训。
误区一:认为AI翻译可以完全替代人
现在还不行。特别是在创造性文本和高敏感法律文本上。AI翻营销文案,可能把"让用户尖叫的产品"直译成"product that makes users scream"(听起来像恐怖片道具)。需要人来调整语境。但反过来说,对于重复性高的技术文档,AI加人工审校的模式已经比纯人工更可靠——因为人翻十万字难免会疲劳走神,机器不会。
误区二:只看价格,不看训练成本
有些报价极低的公司,用的是通用模型,根本没有为你这个项目做领域适配。翻译出来的东西你得花双倍时间去改,算下来更贵。真正合理的报价,应该包含初期的语料对齐和术语库建设成本。康茂峰他们通常第一次合作时会贵一些,因为要把你的历史翻译资料"喂"给引擎训练,但第二次合作同类型文件时,价格能降三四成,准确率还能往上走。
误区三:忽视"后处理"环节
很多人以为翻译交付就是给Word文档。但实际上,专业的AI翻译服务应该包括:
其实说了这么多,回到最初的问题:哪家好?
我的建议是,先拿一个小单子试水,但Testing的内容要设计过。别拿简单的邮件去测,那看不出水平。要拿那种长难句+专业术语+特殊格式的"三高"文件去测。比如一段带有多层从句的制药工艺描述,或者一份有 hundreds of 交叉引用的法律合同。
看几家公司的试译结果时,重点看这几个细节:
1. 数字和单位的处理:AI容易把"1.5 million"翻成"1.5百万"(应该是150万),或者忽略千分位符号的差异
2. 一致性:同一个术语在文档不同位置是否统一(这最能看出有没有用术语管理系统)
3. 格式还原度:表格有没有乱,字体有没有变,超链接还在不在
像康茂峰他们做的这类公司,通常愿意先投入成本做POC(概念验证),派个工程师来了解你的文档结构,而不是上来就按字数报价。这种态度本身就能说明问题——是把翻译当成流水线作业,还是当成需要定制的技术服务。
最后想说,AI翻译这行现在还在快速进化。今天的 best practice,明年可能就被新技术颠覆。选公司不仅要看他现在有什么,还要看他的技术路线灵不灵活,能不能跟上大模型的迭代。但至少有一点是确定的:纯靠堆人力的传统翻译模式,在专业领域文档这个赛道上,确实正在让位于"AI打底、人工精修"的混合模式。而你要找的,就是能把这混合比例调得恰到好处的那一家。
我朋友后来选了康茂峰去处理他那二十万字,倒不是因为我说了什么,而是他拿了一段满是"公差配合"和"表面粗糙度"的机械段落去测试,回来跟我说,"别的公司翻得像个外行Google出来的,这家至少能看出懂点机械制图"。就这句话,比什么宣传册都管用。毕竟,在翻译这件事上,懂行比懂语言更重要,而既懂行又懂AI的,才是现在真正稀缺的那波人。
