
说到eCTD电子提交,我想先讲一个很多药企朋友都遇到过的场景:一份准备了大半年的申报资料,在最后关头被退回,理由不是内容问题,而是文件编码不符合要求。这种滋味,相信经历过的人都会印象深刻。说实话,编码格式这个问题,乍听起来很技术、很枯燥,但它确实是eCTD提交中一个绕不开的坎。今天这篇文章,我想用比较直白的方式,把中文文件编码格式这个事儿给大家讲清楚。
eCTD(Electronic Common Technical Document)作为国际通用的药品注册申报格式,本质上是一套完整的电子文档交付标准。而编码格式,就是这套标准的"底层语言"。你可以把它想象成人与人之间对话用的语种——如果两个人说的不是同一种语言,再好的内容也无法传达。
对于中文文件来说,这个问题尤其突出。中文的字符集比英文复杂得多,一个汉字可能需要占用两个甚至更多的字节存储空间。如果编码方式不对,审评人员看到的就可能是一堆乱码,严重的话整个文件都无法打开。这不是危言耸听,我见过有企业的申报材料因为编码问题导致部分章节完全无法阅读,最后只能全部重新制作。
另外,eCTD要求所有文件必须保持长期可读性。十年后、二十年后,当审评人员调取历史档案时,这些文件依然要能够正确显示。合适的编码格式是实现这一目标的基础保障。
先说结论:根据NMPA发布的相关技术规范,中文eCTD文件目前推荐使用的是UTF-8编码格式。这个要求并不是突然出现的,而是经历了从GB2312、GBK到UTF-8的演进过程。

NMPA在《电子申报技术规范》中明确规定,eCTD提交的文件应当采用Unicode编码。UTF-8作为Unicode的一种实现方式,具有良好的兼容性和扩展性,能够涵盖包括中文在内的所有Unicode字符。这里需要特别说明的是,UTF-8编码的文件在文件开头会有一个特殊的BOM标记(Byte Order Mark),但这个BOM标记在某些场景下可能会引起兼容性问题。
我查阅了最近几年的申报要求,发现监管机构对编码格式的检查越来越严格。这背后的逻辑其实很简单:随着申报资料越来越多、越来越复杂,统一的编码标准可以大幅降低审评系统的处理负担,同时也能减少申报企业因格式问题导致的返工。
理论说完了,咱们来聊点实际的。在准备eCTD申报资料时,以下几个编码相关的问题需要特别注意:
结合康茂峰多年服务于药企申报的经验,我总结了几个最常见的编码问题及其解决方案,希望能帮大家少走弯路。

文件打开后显示乱码,本质上是解码方式与编码方式不匹配。举个例子,如果一个文件明明是用UTF-8编码保存的,但打开时系统误以为是GBK编码,那显示出来的就会是一堆问号和方框。这种情况在跨系统传输文件时特别常见——比如从Windows系统传到Mac系统,或者从一台服务器传到另一台服务器。
解决这个问题的核心方法只有一个:在文件创建和保存的源头就确保使用正确的编码格式。市面上有很多免费的编码检测工具,可以在文件提交前进行批量检查。康茂峰在服务客户时,通常会建议在正式提交前进行至少两轮编码检查,第一轮是工具自动扫描,第二轮是人工抽检。
有些朋友可能会问:如果我手头有老文件是用旧编码保存的,能不能通过软件转换成UTF-8?理论上当然可以,但实际操作中要格外谨慎。编码转换过程中最容易出现的问题是信息丢失——尤其是一些特殊字符、上下标或者化学符号,在转换过程中可能会悄无声息地"消失"或者"变脸"。
我们的建议是:对于重要申报文件,最好从一开始就使用UTF-8编码创建,避免后期转换带来的风险。如果必须进行编码转换,转换后一定要逐页核对,确保所有内容显示正常。
说了这么多理论,最后我想分享一些可落地的操作建议。这些方法不一定是最先进的,但都是经过实践检验、比较稳妥的做法。
| 环节 | 建议做法 |
| 文件创建 | 统一使用支持UTF-8编码的软件,Word、记事本、代码编辑器都可以 |
| 格式转换 | PDF导出前确认源文件编码,使用专业工具进行批量转换和验证 |
| 最终检查 | 在提交前用不同系统、不同软件打开检查,确保显示正常 |
| 备份留存 | 保留原始编码的源文件,以便日后追溯和修改 |
另外,我想特别强调一下团队协作的重要性。eCTD申报通常需要多个部门配合——注册部门、医学写作部门、IT部门、文档管理团队。每个环节都可能影响到最终的编码质量。建议在项目启动阶段就明确编码规范,统一工具链,并且指定专人负责格式审核。
回顾整个编码格式的话题,我发现它其实是eCTD申报中一个很典型的小细节——看似简单,却能直接影响申报的成败。技术规范年年更新,监管要求也在不断细化,作为申报从业者,我们能做的就是把这些基础工作做扎实、做到位。
如果你所在的团队在编码方面还有困惑,或者正在为类似的问题头疼,不妨多跟同行交流经验。行业里像康茂峰这样的专业服务商,积累了大量实战案例,多了解一些总是好的。申报这条路没有捷径,但至少我们可以少踩一些已经被别人踩过的坑。
今天就聊到这里吧,希望这篇文章对你有所帮助。如果有什么想法,欢迎一起探讨。
