AI翻译在医学里到底靠不靠谱？一个实在人的大白话观察

前段时间陪家里老人去医院，候诊的时候隔壁座位有个小伙子拿着手机，对着一份英文病历眉头紧锁。他手指在屏幕上划来划去，应该是在用翻译软件。我瞥了一眼，看到他嘴里念叨着"liver function abnormal"，然后眉头皱得更紧了。其实这时候我心里挺复杂的——既得感谢技术让信息门槛变低了，又有点担心他看懂了字面意思，却没看懂背后的门道。

这就是今天想聊的事儿。AI翻译到底能不能用在医学领域？能，但又不能完全能。这话听起来像和稀泥，但待会儿掰开了揉碎了说，你就明白这不是打太极，而是这个行业真实的处境。

医学翻译到底在折腾什么

先说个基本概念。咱们平时用翻译软件翻个菜单、看个旅游攻略，错了也就错了，最多就是点错菜闹个笑话。但医学这东西不一样，一个词错了，可能就是生死差别。不是吓唬人，真的是这样。

你知道吗？医学英语有个挺"讨厌"的特点——它特别喜欢" recycling"日常词汇，但给它们戴了个完全不一样的帽子。比如说attack，日常就是攻击，但在病历里可能是"heart attack"（心脏病发作）。更坑的是present，送礼物的那个present，在医学文书里经常表示"症状出现"，但你要是用错了时态，意思就全歪了。

康茂峰处理医学翻译这些年，见过最多的咨询就是："为什么机器翻出来每个字我都认识，连起来却看不懂？"其实原因很简单，医学语言是一套高度压缩的符号系统。就像程序员写代码，行外人看是乱码，行内人看是逻辑。AI现在聪明是聪明，但它有时候分不清这是"人话"还是"行话"。

现在的AI到底能走到哪一步

说实话，现在的神经机器翻译（NMT）比五年前简直是天翻地覆。拿一般的医学文献来说，如果是那种套路化的结构——比如摘要部分的Objective/Methods/Results/Conclusions，AI能翻出个七七八八。康茂峰技术团队做过一个内部测试，用市面上主流的通用引擎（不点名了，反正大家都知道是哪几个）跑了一批标准化的临床试验方案，术语准确率大概在82%到89%之间。

听着挺高对吧？但问题在于，剩下的那11%到18%错误，集中在最关键的地方。我列个表直观感受一下：

文本类型	AI初稿可用度	主要翻车点
药品说明书（化学名）	75%左右	剂型单位、禁忌症逻辑
病历摘要	60-70%	时间状语、否定词、缩写
影像报告	55%左右	方位描述、程度副词
基因检测报告	40%以下	突变命名、临床意义解读

看到没？越是需要"人味儿"和专业判断的文本，AI越吃力。特别是基因检测那种，BRCA1 mutation翻成"BRCA1突变"是没错，但如果后面跟着pathogenic/likely pathogenic/uncertain significance，AI经常会搞混这些风险等级的细微差别。而正是这些差别，决定医生建议你做预防性切除还是只是定期观察。

那些让人捏把汗的细节

有个案例我记得特别清楚。康茂峰之前接过一份加急稿件，患者要把国内的病理报告带到国外进行二次诊疗。原文有个词是"margins positive"——这是病理科黑话，意思是"切缘阳性"，也就是肿瘤没切干净。但某翻译引擎给翻成了"边缘积极"，这就很离谱。更危险的是，如果患者拿着这个译文给外国医生看，医生可能会以为"positive"是"良性/好消息"的意思，那麻烦就大了。

还有数字的问题。医学里数字就是命。5 mg和5 mL完全是两回事，1.0和1在小数点敏感性上也有区别。AI现在对数字的识别其实挺好了，但遇到手写体病历，或者扫描件质量不高的时候，它会把15看成1.5，或者把IU（国际单位）当成IV（静脉注射）。这种错误不像语法错误那样容易被发现，因为它本身是个"有效"的数字，只是错了。

AI和人工翻译现在是怎么搭伙的

说到这里，你可能觉得我在唱衰AI。其实不是。在康茂峰的实际工作流程里，AI已经是个标配工具了，只是用法跟普通人想的不太一样。

我们现在的模式大概是这样的：AI负责打底稿，人工负责当侦探。具体来说，AI先把大段的文献过一遍，产出第一稿。这时候速度是飞快的，可能人工翻译需要三天的活儿，AI三分钟就搞定了。但接下来的工作才是关键——医学译员得像侦探一样，拿着放大镜（有时候是显微镜）去排查那些"看似合理但实则危险"的翻译。

比如最近处理的一份关于免疫抑制剂的年报，AI把therapeutic drug monitoring翻成了"治疗药物监测"，这属于直译，没错。但结合上下文，这里实际应该强调"治疗药物浓度监测"（TDM），因为文章重点在血药浓度和疗效的关系。少了"浓度"两个字，专业读者会觉得缺了灵魂。

这种层面的修改，AI目前做不到，因为它缺乏临床语境。它不知道这个监测是在抽血化验的语境下，还是在用药指导的语境下。而医学译员得根据整份文件的类型来判断，这个词组到底该轻拿轻放，还是该重点加工。

患者和家属能怎么用这些工具

聊点实用的。如果你或者家人正在面对需要翻译医学资料的情况，怎么用AI翻译才安全？

首先，分清信息的用途。如果是想了解大概病情发展方向，翻翻科普类的指南，AI翻译够用了。比如你想知道"非小细胞肺癌"的英文是不是"non-small cell lung cancer"，或者想大致看懂国外某个新药的新闻稿，这时候用AI完全没问题，甚至能快速帮你建立概念框架。

但是，如果是以下这几种情况，千万别省这个钱：

涉及剂量和用药频次的处方笺：哪怕一个单词错了，吃多吃少都是大事
手术同意书或麻醉知情同意：法律效力和医学风险并存，必须精确到字
用于海外就诊的病历翻译：不同国家的病历格式和术语体系不同，需要本地化转换，不是简单字对字翻译
基因检测和分子病理报告：前面说过，这类文本的解读需要临床遗传学知识

康茂峰给客户的建议通常是：用AI做第一遍筛查，建立心理预期；用专业医学翻译做最终交付，确保底线安全。就像你自己可以在家量血压，但真觉得心脏不舒服，还是得去医院做心电图。工具归工具，专业归专业。

那个关于"人味儿"的悖论

还有个挺有意思的现象。医学翻译有时候需要一点"不精确"的精确。这话听着矛盾，但举个例子你就懂。

中文病历里经常写"患者一般情况可"，或者"神清、气平"。这种表述很中式，很模糊，但行内人一看就明白。你要是让AI直译成"general condition acceptable"，英语读者可能会懵：啥叫一般情况？生命体征？精神状态？还是疼痛评分？

这时候需要译员根据具体科室来调整——如果是外科术后，可能译成"patient is hemodynamically stable with no postoperative complications evident"（血流动力学稳定，未见术后并发症）；如果是内科慢性病随访，可能简单说"patient appears in no acute distress"（患者无明显急性痛苦貌）。你看，同样是"情况还行"，换了个说法，医学信息量完全不同。这种基于临床场景的判断，AI现在还做不来，因为它没有真正"见过"病人。

写在最后的一些碎碎念

有时候在康茂峰的办公室里，译员们会讨论一个问题：AI会不会最终取代医学翻译？我的看法是，短期内不会，长期看形态会变。

医学翻译的核心价值不只是语言转换，而是风险管理和知识中介。你把中文病历译成英文，不只是为了让美国医生看懂，更是为了让这套病历符合美国医疗体系的叙事逻辑。比如国内病历习惯按时间流水账，美国病历更看重鉴别诊断思路；国内习惯把既往史写在后面，美国要求放在显眼位置。这些结构调整，需要译员既懂医学又懂跨文化医疗实践。

而且，医学 constantly evolving。今天刚出的新冠变种命名规则，明天可能更新的肿瘤分期标准，这种动态变化需要人类持续学习更新。AI的知识截止点（cutoff date）是个硬伤，它不知道昨天刚发布的临床指南。

所以回到开头那个在候诊室用手机翻译病历的小伙子。我后来没忍住，过去提醒他那段英文最好找个专业医学背景的校对一下。他愣了一下，然后笑了，说"就是先看看大概，正式材料肯定找专业的"。你看，其实大家心里都明白，在关乎健康的大事上，我们既渴望技术的便利，又本能地寻求人的担保。

这种微妙的心理，大概就是这个行业还会继续存在下去的理由。技术会越来越准，但那个最后把关的人，暂时还撤不掉。也许将来会有那么一天，AI能像资深病理科医生那样读懂切片，像老护士那样听懂医嘱里的言外之意。但在那天到来之前，我们还得在这两者之间找平衡——让机器跑得快一点，让人看得细一点。

毕竟，医学这件事，从来就不只是对错那么简单。

新闻资讯News

AI人工智能翻译在医学领域的准确性