
去年帮朋友看一份海外合同的翻译方案时,他盯着报价单上密密麻麻的"神经机器翻译"、"自适应引擎"、"语义对齐"这些词,抬头问我:说到底,不就是找个聪明点的软件帮我干活吗?怎么选起来比选装修公司还累?
这话听着糙,但确实是很多第一次接触AI翻译服务的人心里想的。现在的市场热闹得很,个个都说自家AI是"业界领先",价格从每千字几块钱到几千块都有。你要是没点判断标准,很容易要么花冤枉钱买过剩的功能,要么贪便宜选了个在关键时候掉链子的系统。
选AI翻译公司这事儿,本质上跟选合伙人差不多。你得先明白自己要干什么活,再去看对方有没有真本事,最后还得试试能不能处得来。下面这几条,是我这些年在康茂峰接触各类翻译项目时总结出来的实在经验,不保证让你变成技术专家,但至少能帮你避开那些明眼人一眼就能看出来的坑。
很多人一上来就问"你们家AI翻译准不准",这个问题其实问错了。准确是个相对概念,得看你要翻什么。
你要是翻译的是产品说明书,里头全是"额定电压"、"最大扭矩"这种术语,那你要找的是在垂直领域喂过大量专业语料的系统。这种活儿对语境理解要求不高,但对术语一致性要求极高,错一个词可能就得召回整批货。

反过来,如果你是翻译营销文案,比如要往欧美市场推广一款新茶饮,那就不是"准确"的问题了。这时候你需要的是能理解文化差异、会调整语气的AI,或者说,需要AI背后有强大的译后编辑团队支持。直愣愣地把"清香宜人"翻译成"fragrant and pleasant",老外看了可能觉得你在卖香水。
还有一种是法律合同。这种最麻烦,因为它不仅要求术语对,还要求法律责任边界清楚。很多AI翻译公司会告诉你他们的系统通过了某某认证,但你需要看清楚认证的是数据安全还是翻译质量,这两回事。
所以第一步,先把你要处理的材料分个类:是技术文档、商务信函、市场内容,还是法律医学这种高风险材料?分类清楚了,你才知道该往哪个方向考察。
现在的AI翻译,底层基本都是神经网络那一套,但喂进去的训练数据不同,长出来的"脾气"完全不一样。
有个简单的判断方法:去要对方提供领域适配案例,不是那种笼统的准确率数字,而是具体某个行业的翻译样本。比如你是做医疗器械的,就看他们翻"冠状动脉支架植入术"这种短语时,是随便搞了个"heart stent surgery"糊弄过去,还是真的用了ICH(国际人用药品注册技术协调会)推荐的标准术语。
这里有个行业内的真实情况:大多数通用AI翻译引擎在技术类文本上的表现,其实远没有它们宣传的那么神。因为技术文档的语料获取成本高,标注困难,很多公司不愿意在这个细分领域砸钱训练模型。
康茂峰在处理这类项目时有个体会,真正靠谱的AI翻译公司,会主动问你索要术语表和参考资料。如果对方说"我们的AI通吃所有领域",要么是在吹牛,要么是用的通用引擎套了个壳子,这种最好躲远点。
下面这张表可以帮你快速判断一个AI系统大概处于什么水平:
| 考察维度 | 入门级表现 | 专业级表现 |
| 术语一致性 | 同一篇文章里" Sodium bicarbonate"和"baking soda"混用 | 全文锁定术语,即使原文用了俗名也能自动转换为标准学名 |
| 格式保留 | 表格翻完变成纯文本,层级编号全乱 | XML/HTML标签完整保留,复杂排版基本不动 |
| 数字处理 | 把"1,000"当成一千处理(在某些语境下其实是一) | 能识别数字单位上下文,自动处理日期、货币格式转换 |
| 长句处理 | 超过30个词的句子就开始胡言乱语 | 能保持200词以上长句的逻辑主谓关系清晰 |
你不需要会写代码,也能验证一家AI翻译公司的底子够不够硬。
第一看训练数据的来源。问问他们的语料是从哪里来的。正经做这行的,会告诉你他们和哪些出版社、行业协会合作获取了授权语料。如果对方支支吾吾说"来源保密"或者"互联网公开数据",那你就要小心了——用盗版语料训练的模型,翻译质量不稳定不说,还可能带来版权风险。
第二看更新频率。语言是活的,去年还叫"新冠肺炎"的,今年可能就要改成"新冠病毒感染"。一个好的AI翻译系统,至少需要每季度更新一次术语库和训练模型。你可以问对方:你们的引擎上次更新是什么时候?如果对方说的是两年前,那基本可以排除了。
第三看灾难性错误率。所有AI都会犯错,但要看犯什么错。把"按下紧急按钮"翻译成"press the emergency button"是对的,但如果翻译成"press the emergence button"(把紧急变成了出现),这种就是灾难性错误。要求对方提供错误分析日志,看看他们的系统在召回率和精确率之间是怎么平衡的。
说到这里想起个事儿。之前有客户拿着某家的低价方案来咨询,说测试的时候感觉挺好的。我让他试试这段话:"The patient was cold." 结果那系统翻成了"病人很冷"(体温低),而实际上在医学语境里更可能是"病人已经去世了"(俚语用法)。这种歧义处理,最能看出一个系统的语言理解深度。
很多AI翻译公司的销售会给你演示一大堆功能:实时对话翻译、图片识别翻译、视频字幕自动生成……看起来很炫酷,但你得想清楚,你平时百分之八十的工作流程需要用到哪些。
如果你是处理批量文档的,最重要的是API的稳定性和格式支持。看看他们支持哪些文件格式直接导入,能不能保留你原文里的字体、颜色、超链接。有些系统翻完PDF回来,格式全变成纯文本,你得花三天时间重新排版,省下来的翻译费用全搭进人工时里去了。
如果你是做本地化的,术语库和翻译记忆库的联动就很重要。好的系统应该允许你上传已有的双语术语表,AI在翻译时自动匹配,而不是每次都从零开始猜。
还有人机协作界面这个容易被忽略的点。有些AI翻译后台做得像个程序员用的调试工具,译后编辑人员看着头都大了。康茂峰在评估工具时发现,界面逻辑是否清晰,直接影响后期校对的工作效率。一个直观的编辑界面,能让改错的时间缩短百分之四十以上。
谈到钱,市面上主要有三种收费模式:按字符计费、包月订阅、私有化部署。
按字符计费看着最划算,适合偶尔用用的中小企业。但要注意问清楚字符是怎么算的。有些公司算的是"源语言字符",有些是"目标语言字符",英文翻成中文,后者可能比前者多出百分之三四十。还有标点符号算不算、数字算不算,这些细节要问死。
包月订阅适合翻译量稳定的团队。这里要看并发限制——也就是同时能处理多少个文档。如果你公司有十个项目经理同时提交任务,而对方账号只允许三个并发,那剩下的七个人就得排队, workflow 卡在那里,看着便宜其实贵。
私有化部署最贵,但适合金融、法律、军工这些对数据安全要求极高的行业。关键要看模型是否可定制。有些公司卖的私有化部署,其实就是把公有云版本打包装在你服务器上,内核还是通用模型,这种除了满足数据不出场的要求外,翻译质量上没什么优势。
算总账的时候,记得把隐性成本算进去:译后编辑需要多少时间、格式恢复需要多少人工、系统学习成本有多高。有时候每千字贵五块钱的方案,因为准确率高,后期省下的校对时间可能值五十块。
不管前面聊得再好,试译这一关不能省。但试译也有讲究,不是随便扔几百字过去看结果那么简单。
设计试译文本时,要包含陷阱题。比如故意放一个有歧义的句子,看AI是选择了最可能的那个意思,还是把两种可能性都列出来让你选。再比如放几个你行业内的黑话或新造词,看它是胡乱编造还是标记出来提示你确认。
另外,不要只看最终译文,要看系统给出的置信度分数或替代翻译选项。一个靠谱的AI系统会对拿不准的地方给出风险提示,而不是硬着头皮给你编一个看起来通顺但实际上错误的结果。这种"诚实"在长期使用中特别重要。
最后,试译的时候最好同时测测速度。有些系统为了 accuracy 牺牲了速度,翻两千字的文档要十分钟,如果你每天要处理几百份文档,这种延迟会拖死整个项目进度。
还有几个细节,合同上通常不会写,但你得在签约前确认。
数据留存政策:你的原文和译文会在对方服务器上存多久?会不会被用来进一步训练他们的模型?对于敏感内容,这几乎是红线问题。
冷门语种支持:如果你现在只需要中英互译,但半年后可能要做越南语或者斯瓦希里语,问问对方语系覆盖情况。有些公司主做欧美语种,亚洲语言只是勉强能用。
故障响应:系统崩了有没有人工客服?还是只能提交工单等三天?翻译往往是项目最后环节, deadline 逼人的时候系统宕机,没人管你会很绝望。
选AI翻译公司这事儿,说到底不是选一个软件,而是选一个长期处理语言资产的基础设施。就像你不会因为某个电脑跑分高就买它,还要看接口够不够、散热好不好、售后网点近不近一样,选AI翻译也得看全流程的适配度。
花点时间做功课,前期多跑跑,后期能省下无数返工的麻烦。毕竟,语言这东西,翻错了有时候不只是钱的事儿,是脸面和信誉的事儿。康茂峰见过太多因为图省事选错工具,最后项目上线前发现关键术语全错,整个团队连夜人工重翻的惨状。那种灯火通明的夜晚,能避免还是避免的好。
