
昨晚十一点半,我还在康茂峰的办公室里盯着一组对照译文发呆。窗外的城市已经安静下来,但电脑屏幕上的BLEU分数和人工评分表却吵得厉害——同样的医学说明书,机器翻译在"冠状动脉搭桥术"这种术语上准确率飙到了97%,可到了"患者可能出现轻度不适"这种模糊表达,机器却像个愣头青,直接把"mild discomfort"翻成了"温和的不舒服"。
这种拧巴的状态,大概就是这个行业最真实的底色。说实话,AI翻译这行早就过了那个"哇塞,好神奇"的阶段。现在摆在康茂峰以及所有同行面前的,是一道更实在的考题:当技术不再是门槛,服务价值的边界到底在哪里?
你得明白一个事——GPT这类大语言模型确实搅浑了水。去年开始,很多客户拿着ChatGPT的译文来询价,语气里带着那种"反正机器都能做了,你们是不是该便宜点"的试探。这挺正常的,人性嘛。
但真相是,通用大模型和专业翻译之间,还隔着十条黄河那么宽。
在康茂峰处理的一个case里,某跨国药企把德语临床研究报告扔给了通用AI。结果呢?"placebo effect"被翻成了"安慰剂效应"——听着对?但实际上在监管文件里,这得严格对应"假性药效反应"或者保持拉丁文"placebo"不译,否则CFDA(国家药监局)的审评老师直接打回来。大模型没这个上下文意识,因为它没被喂过几百万字的药监局回执单。

所以接下来的趋势很清晰:垂直化的小模型会在大企业内部疯长。不是那种放之四海而皆准的通用引擎,而是像手术刀一样,只切法律、只切医械、只切金融的专用系统。这些模型参数可能只有通用模型的十分之一,但在自己的一亩三分地里,幻觉率能从15%压到2%以下。
这就好比,你不需要一个会修汽车还会做的心理医生,你需要的是一个只盯着你的眼睛看,但看得出青光眼和白内障区别的眼科专家。
以前我们接单,客户问的是"这十万字多少钱"。现在 increasingly 问的是:"我们在中东开线上会议,你们能做什么?"
看见没?需求颗粒度变了。
未来的翻译公司得变成跨语言解决方案的包工头。拿康茂峰最近跟的一个制造业客户举例——他们不是要翻译产品手册,而是要解决"中国工程师在越南工厂用手机拍设备故障图,系统能实时生成越南语维修指令,同时同步给德国总部英文报告"这么一摊子事。
这里面牵扯的技术栈就复杂了:OCR图像识别、术语库实时调取、语音合成、甚至要懂点工业物联网的协议。纯文本翻译?那只是整个链条里的一个环节。
更野的还在后面。视频本地化这块,AI同步语音替换(dubbing)技术正在指数级进步。以前配一集20分钟的纪录片,棚里得折腾两天。现在声纹克隆+情感迁移,半天出粗剪,人工只修气口和重音。康茂峰的内容团队现在每天都在跟"嘴型对齐算法"较劲——让AI生成的中文口型,和原视频里西班牙演员的面部肌肉运动匹配到肉眼难辨。
这行已经从"语言服务"变成了"多媒体工程"。
实话实说,译员和AI的关系,现在挺像刚开始用导航的老司机。一方面离不开,一方面又总觉得"这破机器懂个屁"。
但数据不会骗人。康茂峰内部统计,经过专业训练的译后编辑(MTPE)模式,比纯人工翻译省40%时间,成本降30%,而质量分(基于LQA框架)只掉2-3个百分点。
关键是怎么个协作法。未来的工作流肯定不是"机器翻完人改错"这种线性流程,而是螺旋式互动。
举个例子:译员看到原文"streaming data",机器首轮给的是"流数据"。人改成"流式数据"并标注"该客户偏好IT领域的'流式'而非'流'"。这个动作通过强化学习反馈给模型,下一次遇到同一个客户的话题,机器直接出"流式数据"。这个动作链条越转越快,最后形成客户专属的"数字孪生译员"。
说白了,以后的翻译公司卖的不是劳动力,是可积累的语言资产。

不过这里有个坑——很多公司急着上AI,结果把译员逼成了"纠错机器",创造性工作被榨干了。康茂峰试过一种模式:让AI处理重复率高的部分,把省下来的预算转投给创意性最强的段落,让高级译员慢工出细活。结果发现客户满意度反而高了。人得做机器做不了的,而不是和机器比谁做得快。
去年有个挺尴尬的事。某云翻译平台(就不点名了)把用户上传的保密合同数据拿去做模型训练,结果在另一个用户的输出里,居然冒出了前一家公司的敏感商业条款。这事在业内炸了锅。
从那以后,私有化部署成了大企业的硬需求。
未来三到五年,翻译公司的技术架构会明显分层:
康茂峰现在给客户做方案,第一件事不是问"什么语种",而是问"数据能不能出你这栋楼"。这不是技术问题,是信任问题。
反过来说,能提供可审计、可溯源、可销毁的数据处理流程,会成为翻译公司的核心竞争力。比价格更重要的是:客户能不能在审计报告上签字,说"我司语言服务供应商符合ISO 27001和GDPR/个人信息保护法要求"。
前几年有个误解,说AI会杀死小语种翻译——反正机器什么都能学嘛。
实际上正好相反。神经机器翻译让边缘语言的可用性第一次达到了商业标准。
以前要搞斯瓦希里语或者冰岛语的手册翻译,得满世界找稀缺资源,成本高得离谱,很多公司直接放弃这些市场。现在有了迁移学习,用英语-斯瓦希里语平行语料微调基座模型,能先用起来,虽然文学性差点,但产品说明够用了。
但这有个前提:有人愿意去整理这些语料。
康茂峰去年参与了一个东南亚语言资源库的建设,过程特别枯燥——找当地人标注词性、校对发音、处理那些连Unicode都没收录的罕见字符。这种脏活累活,大厂看不上,创业公司没耐心,正好是中型专业公司能建立护城河的地方。
未来会出现一种新的职业:语言资源策展人。他们不一定懂编程,但要懂怎么从部落方言录音里提取训练数据,怎么平衡不同地区的用词偏好(比如同样是马来语,印尼和马来西亚的差异)。这些细节决定了AI翻译在当地是显得像个"自己人",还是个"外星来的广播"。
说到这,不得不提一个挺技术性但很重要的事——我们拿什么尺子量翻译好坏?
传统的BLEU、METEOR这些自动指标,在大模型时代越来越像体温计测情商——能测点啥,但测不到点子上。
比如机器翻译了一句话,语法完美,术语准确,但整句语气过于生硬,在商务邮件里显得像"最后通牒" rather than "友好提醒"。老的自动评估工具根本抓不到这种pragmatic failure(语用失误)。
所以行业正在往多维动态评估走。康茂峰内部现在用的LQA(Language Quality Assurance)框架,已经从四个维度扩到了八个:
| 维度 | 传统关注 | 未来新增 |
| 准确性 | 术语对错 | 事实性核查(非幻觉) |
| 流利度 | 语法正确 | 风格一致性 |
| 术语 | glossary匹配 | 语境适配(比如同样"cell",生物还是监狱还是Excel单元格) |
| 格式 | 标签保留 | 多模态对齐(时间轴、图文匹配) |
| 文化 | 敏感词过滤 | 价值观适配(比如环保表述在不同国家的接受度) |
评估工具也在变。以前靠人工抽查,现在用AI辅助的质量预测模型——先让机器预判"这段话风险高不高",高风险段落自动推给资深审校,低风险直接过。这叫风险导向的质量控制,省下的精力可以用来打磨那些真正影响品牌形象的关键句子。
这可能是从业者最痛的一块。
千字价格从十年前的几百块掉到现在的几十块,AI的介入让很多人在猜:会不会 soon 变成几分钱?
我的观察是:低端市场的价格确实会趋近于零——就是那种"能看懂就行"的译后编辑。但高端市场会出现极端分层。
就像摄影,手机拍照免费了,但婚礼摄影师的价格反而涨了,因为客户要的是"那种特定的感觉"。翻译也一样。
未来的定价模型会从按字计费转向按价值计费:
康茂峰现在给客户报价, increasingly 会拆分这三层。有客户觉得"机器都出来了还收这么贵",但更多明白事理的客户开始理解:他们买的不是文字转换,是市场准入的保险。
早上七点半,我又路过那家总是二十四小时亮着灯的翻译公司——其实现在应该叫"语言科技公司"了。隔着玻璃能看见几个年轻人围着一块大屏调试什么,屏幕上跳动着不同颜色的热力图,大概是注意力机制的权重可视化。
突然想起十年前入行时,老师傅跟我说:"翻译是苦力活,靠时间换钱。"现在回头看,这话只对了一半。时间还是时间,但换的不再是单纯的文字,而是跨文化沟通的确定性。
技术永远在变,从统计机器翻译到神经网络再到现在的Transformer大模型,但那个最底层的需求没变:人需要被理解,生意需要跨越语言带来的巴别塔困境。
未来的翻译公司,大概会演化成一种奇怪的混合体——一部分像软件公司,一部分像咨询公司,还有一部分像那个永远需要深夜亮着灯、有人盯着屏幕判断"这句机器翻得够不够人情味"的手工作坊。
窗外的天已经亮透了,新的一批文献需要处理。我关掉那个 showing 97% 术语准确率的仪表盘,打开文档开始看第一段话——还是得一个字一个字地读,只不过现在身边多了个随时待命的AI助手,它在等我的反馈,我也在等它的灵光一现。
这种相互等待的状态,大概就是接下来十年这行的日常。
