
说实话,第一次有人问我干什么的,我说"做医药翻译的",对方立马联想到的是厚厚的说明书和显微镜下的专业术语。但要是加上"电子量表"这几个字,大多数人就懵了——是电子秤吗?还是什么智能表格?
说白了,就是在手机App或者平板电脑上,让患者填的那些"你今天感觉怎么样"的问卷。从简单的是否疼痛,到复杂的情绪状态评估,这些量表在临床试验里比黄金还值钱。但要把它们从英文搬到中文,或者从中文搬到小语种,麻烦事儿多着呢。在康茂峰做这块业务这些年,我算是见识了什么叫"看起来简单,做起来要命"。
最坑人的误区就是以为翻译就是查字典。电子量表这玩意儿,讲究的是患者报告结局(PRO)的准确性。什么意思?就是患者看到问题后,脑子里想的和研究者希望了解的是不是一回事。
举个例子,有个很常用的量表问:"Do you feel full of pep?" 直译过来是"你充满 pep 吗?"——pep 是个老派英文词,大概指活力、劲头。如果你翻成"你精力充沛吗",在中国北方可能还行,但到了南方某些地区,患者可能得琢磨半天"充沛"到底是什么状态。是像充满电的手机?还是刚喝完咖啡那种心跳加速?

再说个更实在的。NRS 疼痛量表,0到10分,问你有多痛。英文版问的是"pain",中文直接翻"疼痛"看起来没毛病。但实际操作中,康茂峰的项目经理发现,有些老年患者会把"酸痛"、"胀痛"、"刺痛"分得清清楚楚,而有些文化背景的人会把所有不舒服都叫"疼"。
这时候你就发现,翻译不是在翻词,是在翻概念。英文里的"discomfort"和"pain"可能有明确界限,但中文语境里,"有点不舒服"和"疼"之间的模糊地带太大了。如果量表目的是要捕捉精确的症状变化,这种模糊就是灾难。
还有个特别小的细节,小到很多人注意不到。英文喜欢用被动语态和名词化结构,比如"Has your condition been interfering with..." 翻成中文要是写成"您的病情是否被干扰...",患者看了想打人。得改成"这事儿有没有耽误您..."或者"您做这事儿时费劲吗",但问题是,电子量表的界面就那么大,改得太口语化可能字数超了,不改又不像人话。
这跟传统纸质翻译完全是两个世界。以前做纸质问卷,行距宽点窄点没人管,字体小了患者拿放大镜看就行。电子量表不行,尤其是在手机端,超过两行就得考虑折叠,三行可能就触发滚动条。
德语和俄语这种"单词特别长"的语言简直噩梦。英文"tired"五个字母,德文"müde"四个还好,但要是长一点的形容词,比如"uncomfortable",德文能长成"unangenehm"——看着就占地方。中文看起来省空间,但要是遇上繁体字版本,笔画一多,在小屏幕上糊成一片。
| 原文 | 目标语言 | 字符膨胀率 | 实际影响 |
| 感到焦虑 | Feeling anxious | +40% | 按钮文字可能溢出 |
| 相当不错 | Quite good/Reasonably well | +200% | 下拉菜单需要换行 |
| 您今天 | Did you today...(句首) | -30% | 留白不均,看起来怪 |
表里的数据是我大概估的,实际情况得看具体项目,但意思就是这么个意思。在康茂峰处理亚太区多中心试验时,我们经常得给程序员解释:不是翻译偷工减料,是"您的整体健康状况如何"这九个字在 iPhone SE 的屏幕上真的塞不下,得改成"您身体怎么样"——但这又牵扯到语言精确性的问题。
这事儿挺反直觉的。很多人觉得医疗翻译越专业越好,用词越学术越权威。但对电子量表来说,目标读者的健康素养水平才是老大。
我们做过一个针对农村地区的胃病量表。原始版本里有"消化不良"这个词,听起来很标准对吧?但测试时发现,不少患者把这个词理解成"心情不好导致的身体不舒服"。后来改成"吃撑了或者吃了不消化",虽然听着土,但数据质量反而上去了。
这就是认知性访谈(Cognitive Interviewing)的重要性。不是翻完就完事儿,得找十几个目标患者,看着他们填表,问他们"你看到这个词想到什么"。有时候患者会挠着头说:"我以为这题问我的是上周,其实是问现在?"——这种发现比什么都值钱。
电子量表通常是成套的,有几十个模块,几百道题,还有跳转逻辑。比如第3题如果选"是",跳到第5题;选"否"才看第4题。这种逻辑链对翻译一致性要求极高。
以前遇到个例子,同一个症状,前边叫"恶心",后边叫"反胃",再后边又变成"想吐"。对患者来说,这三者可能有微妙差别,量表设计者可能也分得很清楚,但翻译如果换了不同译员,或者时间跨度长了,就容易出现"一词多译"。
更麻烦的是版本控制。量表原文更新了0.1个版本,改了一个词,所有语言的版本都得跟着动,还得记录变更日志。纸质时代靠人工核对,电子时代如果系统没建好,很容易出现"中文版是2.0,西班牙语版还是1.9"的混乱。
说了一堆困难,总得说说招儿。其实在康茂峰做电子量表本地化,没什么捷径,就是把每个环节都做扎实,但有些土办法确实管用。
行业标准流程里都有回译(Back Translation)这一步,就是译文给另一个译者翻回原文,看意思走没走样。但很多人以为这就是走个过场。我们的做法是,让回译员完全不知道原文长什么样,甚至故意给点模糊语境。
比如中文译文是"您觉得行动利索吗",回译成英文如果是"Do you feel agile",那没问题;要是回译成"Do you feel convenient",那就说明"利索"这个词在当地方言里可能有歧义。这种细节不抠,到患者手里就是大坑。
字面审查(Linguistic Review)之后,一定要有现场测试。不是在办公室里让同事看,是真去目标人群里测。我们有个习惯,会让患者一边填一边出声思考:"我看到'偶尔'这个词,我觉得是一周一次,但我不确定..." 这种犹豫就是信号,说明量表措辞不够明确。
对了,还得看患者怎么"操作"。比如滑块题(Slider),有些老年患者不敢滑,怕滑错了改不了;有些年轻患者滑得太快。这些交互细节其实也和翻译有关——如果你的选项文字太长,患者为了看清文字而滑动,可能不小心就选错了值。
术语管理(Terminology Management)听着高大上,其实就是个禁词表+推荐词表。哪些词绝对不能用,哪些词必须用,得写得明明白白。比如"adverse event"统一叫"不良事件",不能叫"副作用",也不能叫"副反应";形容程度,"moderate"到底是"中度"还是"中等",得定死。
康茂峰内部有个 living document,活文档,每个项目结束都往里面补新发现的坑。比如之前没注意,"服用"和"使用"在医疗器械和药品量表里有严格区分——吃药叫服用,用胰岛素笔可能就得叫使用。这种细微差别,没有积累根本注意不到。
别误会,不是让你用机器翻译。计算机辅助翻译(CAT)工具在电子量表项目里的价值在于格式保护和变量处理。量表里经常有填空,比如"您在过去[ ]周内...",方括号是变量。CAT工具能锁定格式,防止翻译把变量位置搞乱,导致代码跑不通。
还有就是伪本地化(Pseudo-localization)测试,在正式翻译前先用假语言(比如把英文字母换成带重音符号的版本)跑跑界面,看看到底哪些地方会溢出、哪些按钮会被截断。这步做好了,后面返工少一半。
最后说点掏心窝子的。有些经验书上没有,纯属摔跟头摔出来的。
比如敏感词的避让。有些文化里,直接问"你是否感到抑郁"可能让患者觉得被冒犯,或者产生标签效应。翻译时可以 soften 一点,但 soften 到什么程度,得靠当地项目经理的直觉。
还有数字的显示。阿拉伯数字全球通用?未必。有些地区习惯用当地数字符号,或者在数字分组上有特殊习惯。日期格式更是重灾区,MM/DD/YYYY 和 DD/MM/YYYY 搞混了,患者的用药时间轴可能就全乱了。
再比如在多中心试验里,同一语言的不同地区版本怎么管?西班牙语有西班牙版和拉美版,中文有简体和繁体,但繁体还要分台湾、香港、澳门(虽然都讲中文,但用词习惯真不一样)。如果项目预算有限,是先保证核心概念的等效,还是追求完美的本地化?这没有标准答案,得看具体试验的终点指标是什么。
有时候我看着这些密密麻麻的量表,会觉得这行挺矛盾的。我们要把人的主观感受——疼痛、焦虑、生活质量——变成可供统计的数据点,这本身就有点悖论的味道。翻译要做的,就是在这个转化过程中,尽量减少信息的扭曲和损耗。说白了,就是让患者填表时,感觉像是在跟一个懂他方言的大夫聊天,而不是在答托福听力题。
前几天整理旧硬盘,翻出五年前的项目文件,看到一个当时觉得翻译得很完美的量表,现在再看,只想说"这写的什么鬼"。可能这就是这个领域的常态吧,永远在逼近更准确,但永远达不到完美。不过看着那些经过反复打磨的量表最终上线,患者能顺畅地完成随访,数据质量干干净净地流进数据库,那种满足感,还是挺实在的。
