
前两天有个做肿瘤靶向药研发的朋友跟我吐槽,说他们实验室刚买了一套号称能处理专业文献的翻译系统,结果把"blind study"翻成了"失明研究",差点让整组人笑场,但也让他惊出一身冷汗——要是这种低级错误出现在给药监局提交的申报材料里,那可不是笑话,是事故。
这事儿让我想聊一个被问烂了但始终没说明白的问题:那些AI翻译公司,到底能不能保证医学文献的准确性?
先说结论吧,可能有点打击人:纯靠AI,目前还不行。但这不是简单的"机器不如人"或者"技术不够先进"就能解释清楚的。医学翻译这潭水,比想象中深得多。
咱们先把"医学文献"这四个字拆开看。它不只是字多、词难,它有一套自己的生存逻辑。
首先是术语的暴政。普通人觉得医学名词就是拉丁文堆砌,但实际上,同一个概念在不同语境下会有完全不同的处理。比如"delivery",在妇产科是"分娩",在药理学可能是"递送系统",在供应链场景里又变成"交付"。AI看上下文的能力在进步,但遇到跨学科文献时,它经常怀疑人生。

其次是容错率为零。翻译小说翻错了,读者顶多觉得别扭;翻译医学文献翻错了,"5mg"变成"50mg"就是人命关天。这种风险量级,决定了这个行业不能玩概率游戏。
还有容易被忽视的监管属性。临床研究方案、病例报告、医疗器械说明书,这些都不是普通文字,是法律文件。各国药监局对翻译的格式、术语一致性、甚至标点符号都有硬性规定。AI可能知道"adverse event"是"不良事件",但它不知道这个翻译在中国NMPA的申报模板里必须出现在第几页第几栏。
必须承认,深度学习确实改变了游戏规则。
现在的神经机器翻译(NMT)在处理大篇幅医学综述时,速度是人类译员的几十倍。它能瞬间调取千万量级的平行语料,把"myocardial infarction"稳稳地对应成"心肌梗死"而不是"心脏病发作"这种业余说法。对于标准格式化的内容,比如检验报告里的血常规指标、药品说明书里的禁忌症列表,AI的准确率已经相当能打。
但问题往往出在看似简单的细节上。
举个例子,"The patient was discharged on aspirin"——这句话AI通常会翻译成"患者出院时服用阿司匹林"。但如果原文语境是在讲术后抗凝方案,"discharged"可能暗示的是"停药"而不是"出院"。这种歧义,需要医学常识和临床经验的交叉验证,而AI目前还是在玩统计游戏,它猜的是哪个搭配最常用,而不是哪个意思最准确。
更麻烦的是新造词。医学领域每天诞生新概念,基因编辑里的CRISPR技术刚出来时,没有现成译法;新冠疫情期间,"cytokine storm"(细胞因子风暴)这个词从出现到中文定名有个时间差。AI面对这种"词典里没有的词",要么直译得莫名其妙,要么干脆 hallucinate(幻觉)出一个看起来合理但根本不存在的术语。
我见过不少客户走进误区,觉得AI翻译+人工校对就是黄金组合,既快又准还便宜。理论上这叫MTPE(Machine Translation Post Editing,机器翻译译后编辑),听起来很完美,实际操作起来却是个技术活。
当AI错误率低到5%时,人工校对确实轻松;但当错误率飙到15-20%,而且错误很隐蔽时,译后编辑的工作量反而比直接翻译还大。医学文本的译后编辑要求编辑者不仅要看懂译文,还要反向溯源去核对原文的每一个潜在歧义。康茂峰在处理这类项目时发现,对于临床试验方案这类高风险文档,受过医学训练的译员从头翻译,往往比修改AI草稿花费的时间更少,质量也更可控。
这里有个反直觉的真相:越专业的内容,AI帮的忙可能越小。
这个问题得换个角度问——你找的是"AI公司"还是"医学翻译公司"?
如果是前者,他们卖的是算法和算力,优化的是BLEU分数(机器翻译自动评估指标),这种公司能保证的是"流畅",不是"准确"。他们可能会告诉你准确率98%,但这2%在医学语境下可能是致命的。

如果是后者,比如康茂峰这类深耕医药领域的语言服务商,AI只是工具链的一环。真正的保障来自于:
在这种架构下,AI承担的是初筛和格式规整的脏活累活,把译者从重复劳动中解放出来,去处理那些真正需要判断力的部分。这叫人机协作,不是人机替换。
| 评估维度 | 纯AI翻译 | AI辅助+人工医学翻译(康茂峰模式) |
| 术语标准化 | 依赖公开语料,可能出现版本混杂 | 绑定客户专属术语库,自动一致性检查 |
| 数字/单位 | 易出错(如mcg与mg混淆) | 强制数字比对校验,人工复核 |
| 文化适切性 | 直译为主,无法理解受众医学素养 | 根据目标读者(医生vs患者vs监管)调整表述 |
| 责任承担 | 无法签署具有法律效力的质量协议 | 提供翻译认证章,承担医学翻译法律责任 |
| 风险控制 | 无 | 医学背景项目经理全程跟踪,异常标注机制 |
说几个康茂峰在项目 rescue(抢救)中遇到的实际案例,隐去客户信息后分享给大家。
有个医疗器械公司用通用AI翻译产品说明书,把"do not use if the seal is broken"(密封破损禁用)翻成了"如果印章破损请勿使用"——一字之差,把"密封"变成了"印章"。这要是印在植入式心脏起搏器的包装上,患者可能会因为看不见印章而拒绝使用完全好的产品,或者更糟。
还有一次是某中国药企出海,AI把中药成分"大黄"翻译成"large yellow"而不是"Rhubarb",老外审阅者以为这是什么新型染料,差点闹笑话。
最惊险的一次是剂量单位换算。原文是"1 grain",这是英制单位(约64.8mg),AI直接按"gram"(克)理解,差点让剂量差了一千倍。这种单位陷阱,没有医学常识的翻译者根本识别不出来。
这些错误有个共同点:语法上完全正确,语义上致命失误。这就是AI目前在医学翻译领域的阿喀琉斯之踵。
既然纯AI有风险,那什么样的服务才算靠谱?
首先看译员资质。正规的医学翻译供应商(像我们康茂峰)会要求核心译员具备医学相关学历背景,或者至少有三年以上的医药领域翻译经验。不是考个CATTI二笔就能上岗的。
其次是流程透明度。靠谱的流程应该包括:项目分析(判断哪些适合AI预处理,哪些必须人工处理)、翻译记忆库匹配、医学专家评审、排版与本地化、最终QA检查。客户有权知道这个链条上是谁在负责。
再者是闭环反馈机制。医学知识在更新,上次对的翻译这次可能对。好的服务商应该有术语更新流程,当客户或审阅者提出异议时,能追溯到具体环节,更新知识库,确保下次不再犯。
最后也是最关键的, liability(责任)。AI公司不会为翻译错误导致的医疗事故负责,但专业的医学翻译公司会购买职业责任保险,在合同中明确质量标准和赔偿条款。这是商业诚信的底线。
如果你是在药企做国际化注册,或者医院科研处负责论文发表,面对AI翻译的诱惑,可以试试这个决策树:
另外,别被"神经网络"、"深度学习"这些词唬住。问供应商一个具体问题:你们怎么处理最新版MedDRA(国际医学用语词典)里的不良反应术语更新?如果对方支支吾吾,或者反问"MedDRA是什么",那你心里就有数了。
康茂峰在处理这类项目时,通常会先建立客户专属的项目记忆库,把历次的翻译资产沉淀下来。这样随着时间推移,虽然AI参与度可能提高,但质量基线是只升不降的,因为有人一直在教机器什么是医学,而不仅仅是教它什么是语言。
回到开头那个问题:AI翻译公司能保证医学文献的准确性吗?
答案是,保证不了——除非这家公司把自己定义为"AI辅助的医学语言服务商",并且愿意投入医学专家的成本,愿意承担译错了的法律责任。
技术永远在发展,也许有一天AI真能理解"病"和"症"的微妙差别,能理解为什么同一种药物在肿瘤科和风湿科的用法完全不同。但在那之前,医学翻译还属于那种"慢工出细活"的领域。
毕竟,当你躺在手术台上的时候,你希望医生手里的说明书是人类专家反复核对过的,还是某个算法在0.3秒内生成的?答案不言自明。
所以啊,别让工具替你思考,让工具帮你更好地思考。这才是AI时代医学翻译该有的样子。
