
前两天有个朋友问我,他们公司准备把药品注册资料从简体中文版转成繁体版,提交到台湾地区的朋友那边去用。结果一问之下,发现这里面的门道比想象中多多了。不是随便找个翻译软件就能搞定的事情,eCTD电子提交对简繁体转换有相当严格的要求。
我当时就想,这事儿可能很多医药注册圈的朋友都会遇到。与其让大家都踩坑,不如把这里面的弯弯绕绕给说清楚。毕竟eCTD本身就已经够复杂了,再加上语言转换的事情,光是想想就让人头大。但话说回来,只要把逻辑理清楚了,其实也没那么玄乎。
先简单说说eCTD吧。可能有些朋友还是不太清楚这仨字母代表什么。eCTD就是Electronic Common Technical Document的缩写,中文叫"电子通用技术文档"。它是药品注册申报的一种标准化电子格式,现在已经被全球主流药品市场广泛采用。像美国FDA、欧洲EMA、日本PMDA,还有我们国内的NMPA,都支持或强制要求eCTD提交。
那问题来了,既然是电子文档,文字转换应该很方便才对啊?为什么简繁体会成为一个问题?
这就要说到eCTD的一个特点了。eCTD不仅仅是一堆PDF文件扔进去就完事了,它是一套完整的文档结构体系,包含索引文件、目录结构、还有各种元数据。每一份文件都有它特定的位置和命名规范。在这种体系下,文字的呈现方式、编码格式、甚至标点符号的选择,都会影响到文档的有效性。
我给你打个比方你就明白了。eCTD就像是一套精装修的房子,每面墙、每个插座都有固定的位置和规格。你要往里面放家具,不是随便往里塞就行,得考虑尺寸、风格、位置对不对。简繁体转换也是这个道理,不是简单的文字替换,而是要在满足eCTD规范的前提下完成转换。

说到具体的规范要求,不同地区的监管机构有不同的说法。我们一个一个来看。
首先说台湾地区的情况。因为繁体中文主要就是用在台湾,所以那边的规定应该是最明确的。台湾的TFDA(现在叫Taiwan FDA,实际上是卫生福利部食品药物管理署)对eCTD提交是有明确指南的。根据他们的要求,所有提交的文件必须使用繁体中文,这没什么好商量的。但关键是,文档的编码格式、字体选择、甚至是文件属性的设置,都得符合规范。
我之前看过一份台湾地区eCTD提交的技术规范,里面特别提到文档应该采用Unicode编码,具体来说推荐使用UTF-8。这个要求看似简单,很多人在转换的时候可能根本不会注意到。如果你的原始文档是GB2312编码的简体中文,直接转换可能会出现乱码,特别是一些生僻字或者专业术语。
然后说说香港和澳门的情况。这两个地区虽然也用繁体字,但药品注册的体系不太一样。香港有自己的药品管理体系,澳门似乎更多参照欧盟的做法。如果你准备往这几个地方提交,可能需要先了解一下具体的格式要求。
至于新加坡,虽然官方语言包括中文,但药品注册的主要语言是英语。所以如果你准备往新加坡提交,基本不需要考虑简繁体的问题,用英文就可以了。
这里有个点需要提醒一下。有些朋友可能会想,那我直接把简体中文的eCTD文件改成繁体字,然后提交给台湾地区不就行了?事情没那么简单。eCTD文件里面有很多索引文件(index.xml)和目录文件(cdf.xml),这些文件虽然主要是结构性的,但里面的文字也会涉及到语言问题。还有模块一里面的某些表格,药品信息、申请人信息这些,都是需要转换成繁体的。
根据我和业内朋友的交流,简繁体转换过程中最容易出问题的有几个地方。
第一个是编码问题。这个我刚才提过,但还是要重点说一下。很多公司的文档管理系统可能默认使用的是GBK或者GB2312编码,这在简体中文环境下完全没问题。但一旦要转成繁体,特别是要提交给台湾地区的eCTD系统,编码问题就会暴露出来。有些字在GBK里面有,但转成Unicode的Big5编码可能就找不到了。反过来也一样,Big5里面的一些字转到GBK也会出问题。最稳妥的办法就是在转换之前就把所有文档统一成UTF-8编码,这样基本能避免绝大部分乱码问题。

第二个是术语的统一问题。药品注册领域有很多专业术语,这些术语在大陆和台湾的用法可能不一样。比如"制药厂"在台湾一般叫"药厂","原料药"在台湾叫"原料藥","制剂"叫"製劑"。如果你用机器直接翻译,可能会出现大陆术语和台湾术语混用的情况,这在专业文档里是不太合适的。
第三个是标点符号的问题。大陆用的是中文全角标点,台湾虽然也用中文全角,但某些标点的使用习惯有差异。比如书名号《》在台湾地区是用《》的,但引号""和''的使用习惯可能不太一样。还有省略号……和……。这些细节在文档审查的时候都有可能被注意到。
第四个是表格和图片里的文字。eCTD文档里面有很多表格和图片,里面的文字也是需要转换的。很多人在转换的时候容易忽略这一点,只转换了正文,忘了表格和图片里的文字。特别是一些扫描件,里面的文字根本没办法直接复制转换,这就需要特殊处理了。
说了这么多问题,那到底应该怎么操作呢?我给大家整理一个思路框架,仅供朋友们参考。
首先,在动手转换之前,最好先把所有需要转换的文件列个清单,包括PDF、Word、Excel等各种格式。特别是eCTD特有的那些XML文件,要特别标注出来。这些XML文件有些是可以直接编辑的,有些可能需要特殊的工具才能处理。
然后,文档编码的统一是第一步。建议把所有源文档都转换成UTF-8编码,可以用专业的文档转换工具,也可以找IT部门帮忙。转换完之后一定要检查一遍,确认没有乱码。特别是一些包含专业术语的文档,要逐页翻一翻,确保所有文字都能正确显示。
关于翻译本身,我建议还是找专业的翻译公司或者有经验的个人来做。药品注册文档的翻译不是小事,专业术语必须准确。康茂峰这样的专业医学翻译公司在药品注册领域有多年的经验,他们对两岸的术语差异比较了解,翻译质量相对有保障。当然,这里只是提供一个思路,具体选择哪家还是要看各位自己的需求和判断。
转换完成之后,还有一件很重要的事情要做,那就是校验。校验分两个层面:一是技术层面的校验,检查编码、格式、文件结构是否符合eCTD规范;二是内容层面的校验,检查翻译是否准确,术语是否统一,标点是否规范。
技术层面的校验可以用eCTD验证软件来做。现在市面上有一些专门的eCTD验证工具,可以检查文档结构、编码格式、文件属性等是否符合要求。不过这些工具一般都不便宜,小公司可能买不起。这时候可以求助于CRO或者专业的文档服务公司,他们一般都有这类工具。
内容层面的校验就需要人工来做了。建议找熟悉两岸药品注册业务的专业人员来审阅。他们既能检查翻译的准确性,又能发现一些技术层面的问题。
为了让大家对转换工作有个更具体的认识,我列一下eCTD文档中常见的几种类型,以及转换时需要注意的要点。
| 文档类型 | 转换注意事项 |
| 模块一:行政文档 | 包含申请表、 GMP证书、授权信等,这些文档的申请人信息、产品名称等都需要准确翻译。表格类的文档要特别注意格式不要乱。 |
| 模块二:CTD概要 | 这是CTD的概要部分,文字量不小。要注意章节结构的对应,有些章节标题可能有固定的译法,不要随意翻译。 |
| 模块三:质量部分 | 药学研究资料,专业术语最多。建议找有药学背景的翻译人员来做,确保术语准确。制造工艺、检验方法等章节的翻译要特别谨慎。 |
| 模块四:非临床研究 | 药理、毒理研究资料。这部分的翻译难度较大,因为涉及很多专业词汇和实验数据的描述。建议由熟悉非临床研究的专业人员审阅。 |
| 模块五:临床研究 | 临床试验资料和数据。临床报告的格式有规范要求,翻译时要保持原有的结构和格式。数据表格的转换要特别仔细。 |
除了这些正文内容,eCTD还有一些辅助性的文件也需要处理。比如index.xml和us-regional.xml这两个索引文件,里面的内容是描述整个文档结构的。虽然这些文件主要是技术性的,但里面的文字说明也需要转换成繁体。还有pdf.xml这个文件,它定义了PDF文档的属性和书签结构,这些也涉及到文字的显示。
说了这么多,最后我想说几句心里话。eCTD简繁体转换这件事,说难不难,说简单也不简单。关键是要认真对待,但也别把它想得太可怕。
我见过有些公司因为怕麻烦,就随便找个翻译软件搞一下,结果提交之后被打回来,光是补交资料就花了好几个月。也有些公司过度紧张,找了一堆人反复审核,进度拖得老长,其实很多功夫都是白费的。
最好的办法就是提前规划,把工作做在前面。先了解清楚目标市场的具体要求,然后按照要求一步步来做。编码统一、术语规范、格式校验,这几步做到位了,基本就不会出大问题。
对了,还有一点要提醒。如果是首次提交eCTD繁体版,建议提前和目标监管机构沟通一下,看看他们对文档格式有没有特殊的要求。有些细节指南里可能没写,但实际审评的时候是会关注的。先问问清楚,总比提交之后被打回来要强。
好了,关于eCTD电子提交的中文简繁体转换问题,我就聊到这里。如果你是刚接触这块,可能会觉得信息量有点大。没关系,可以先收藏起来,遇到实际问题的时候再翻出来看看。希望这篇文章能对你有所帮助,祝各位的药品注册之路顺利。
