
上周有个朋友问我,他们公司要翻译一份美国专利 into 中文,翻译公司报 价是按字数算的,但他拿到发票时发现统计出来的数字比文件里显示的字符数多了将近 30%。他一脸困惑地跑来问我:“这帮人是不是算错了?”
我看完之后告诉他:“不是人家算错了,是你理解错了。”
专利文件翻译的字数统计,跟我们平时写文章统计字数完全是两码事。这里面门道挺多的,今天我就用最直白的话,给大家把这个事情说清楚。
首先要明白一个前提:专利文件不是普通文本。它是一份法律文件,同时也是技术文件。全世界任何一份专利文件,都必须遵循严格的格式规范,每个部分该写什么、怎么写,都有明文规定。这种规范性决定了,专利翻译的字数统计必须采用一套独立的标准,而不是简单地"数字符"或者"数单词"。
你可能会想,不就是翻译一篇文章吗?字数不就是原文有多少字,译文有多少字吗?问题在于,专利文件的中英文本身就不是一一对应的关系。英文里一个 "wherein" 可能需要翻译成中文的"其中",也可能需要翻译成"在该...中",还可能需要翻译成"其中之一"——同一个词在不同语境下的译法完全不同,产生的字数自然也完全不同。
更重要的是,专利文件的不同部分功能不同,翻译时的处理方式也完全不同。权利要求书需要逐字逐句严格对应,而说明书可能需要更灵活的表达。这就好比盖房子和装修房子,用的建材不同,计算方式自然也不同。

在说翻译字数统计之前,我们先弄清楚原文和译文各自是怎么统计的。
英文专利的字数统计相对简单粗暴,就是数单词数。举个例子,"The present invention relates to a method of manufacturing a semiconductor device"这句话,一共 14 个单词,统计出来就是 14 个词。但这里有个细节:英文专利通常以单词数作为计费单位,而统计时连字符连接的词算一个还是算两个,不同机构有不同的规定。
中文专利的字数统计则是另一种玩法。中文没有"词"这个概念,只有"字"。所以中文专利的字数就是看有多少个汉字,外加标点符号怎么算。原则上,一个汉字、一个标点都算一个字。但实际操作中,空格算不算、英文单词算不算,不同平台又有不同的处理方式。
这就是问题的关键所在:英文专利按单词数算,中文专利按字数算,两种语言的基本计数单位都不一样。翻译的时候,不是简单地 1+1=2,而要进行复杂的换算。
目前行业内比较常见的专利翻译字数统计标准有几种,每种的计算方式都不一样。我给大家逐一拆解一下。
这种方法很简单,就是直接统计原文的字符数或单词数,然后按照一定的换算比例折算出译文的字数。比如有的翻译公司采用 1 个英文单词等于 2 个中文字符的换算比例,统计出原文有多少词,再乘以 2 得到计费字数。
这种方法的优点是简单直接,报价透明。缺点是不够准确,因为不同类型的专利文件、不同的技术领域,每句话的密度和翻译难度差异很大。一份涉及复杂化学结构的专利和一份机械结构的专利,即使原文单词数相同,翻译成中文后的实际工作量可能相差 40% 以上。

这种方法就是直接统计译文的中文字数。你翻译出来多少字,就按多少字计价。这是最公平的方式,因为翻译付出多少劳动,最终成果就是多少字。
但这种统计方式也有争议。同一个句子,不同译者给出的译文长度可能差异很大。有的译者追求精炼准确,译出来可能就是 15 个字;有的译者为了让句子更通顺,加上一些解释性的表达,可能译出来就是 20 个字。如果按字数计价,后者显然拿的钱更多,但这是否意味着前者翻得不好呢?不一定。
在专利翻译领域,这个问题尤其敏感。因为专利文件有严格的规范性要求,权利要求书的表述必须精确简洁,过于冗长反而可能被视为表述不清。所以即使采用译文计数法,也需要在质量层面设置上限,不能让译者为了多赚字数而刻意拉长译文。
这种方式是把译文中的所有字符都算进去,包括汉字、标点符号、英文单词、数字、特殊符号等等。一个汉字算一个字符,一个英文单词算一个字符,一个标点符号也算一个字符。
这种统计方式比较接近计算机自动统计的结果,操作起来最方便。现在很多翻译辅助软件和项目管理平台默认采用的就是这种统计方式。但它的缺点是会把一些"功能性"的字符算进去,而这些字符可能并不代表实际的翻译工作量。
这种方法和上面那种正好相反,只统计实际的语言文字,标点符号、空格、特殊符号都不算在内。
这种统计方式更接近"有效信息量"的概念,但实际应用中很少采用,因为它和计算机统计习惯差异较大,双方核对数字时会比较麻烦。
上面说的是统计标准,但还有一个更重要的维度:专利文件不同部分的字数统计方式可能不同。这不是行业硬性规定,而是翻译公司在长期实践中形成的通行做法。
我们先看一下专利文件的整体结构。一份典型的专利文件包括:权利要求书、说明书、附图说明、摘要、摘要附图这几个部分。其中权利要求书和说明书是核心,翻译工作量也最大。
| 文件部分 | 功能特点 | 翻译难度 | 字数统计特点 |
| 权利要求书 | 界定专利保护范围,法律属性最强 | 极高 | 通常单独统计,严格对应 |
| 说明书 | 详细描述技术方案,技术属性最强 | 高 | 按全文或章节统计 |
| 附图说明 | 解释附图内容,相对简洁 | 中 | 通常计入说明书整体 |
| 摘要 | 发明内容概述,字数有限 | 低 | 通常不计或单列 |
权利要求书是专利的灵魂,一项权利要求可能只有几百字,但其法律意义可能价值连城。翻译权利要求书时,译者必须逐字逐句斟酌,一个字都不能随意删改。因此,权利要求书的字数统计通常是最严格的,很多翻译公司会单独列出权利要求书的翻译费用,不和说明书混为一谈。
说明书是专利的主体部分,通常占全文篇幅的 70% 以上。说明书包含技术领域、背景技术、发明内容、具体实施方式等内容,涉及大量技术术语和复杂句式。说明书的字数统计相对宽松一些,但也需要考虑技术领域的难度差异。一份通信领域的专利说明书和一份机械领域的专利说明书,即使总字数相同,翻译工作量可能相差悬殊。
了解了统计标准,我们再来看看有哪些因素会实际影响最终的翻译字数。
这是一个最基本但也最容易被忽视的因素。英语和汉语在表达同样意思时,所需的篇幅往往不同。一般来说,将英文专利翻译成中文,最终的中文字数通常是英文单词数的 1.5 倍到 2 倍。反过来,如果把中文专利翻译成英文,最终的英文单词数通常是中文字数的 60% 到 80%。
但这只是一个大概的比例,具体情况取决于专利的技术领域和法律语言习惯。比如化学领域的专利经常使用冗长的化合物命名,翻译成中文时可能需要音译加注释,实际字数可能暴增;而某些机械领域的专利描述比较直接,翻译时不需要额外补充,中英文比例可能接近 1:1。
专利文件中包含大量技术术语,这些术语的处理方式会直接影响字数统计。
最典型的是缩写词的处理。英文专利中经常出现"CMOS"、"RFID"、"LTE"这样的缩写,第一次出现时通常需要给出完整写法并标注缩写。如果采用"互补金属氧化物半导体(CMOS)"这样的译法,字数就会增加;如果采用直接保留原文缩写的方式,字数就保持不变。
还有一些化学式、数学公式、代码片段等特殊内容,在统计时是算作纯字符还是单独处理,不同机构的做法也不尽相同。
虽然专利翻译有严格的规范性要求,但译者在表达方式上仍有一定的选择空间。有的译者偏好简洁有力的表达,句子能短则短;有的译者则倾向于把句子写得更完整清楚,避免歧义。
以一个很常见的英文表达 "in some embodiments" 为例:
两种译法都是正确的,但字数相差一倍。在批量翻译项目中,这种风格差异如果控制不好,就会导致字数统计出现较大波动。
说了这么多,最后给需要委托专利翻译的朋友们一些实操建议。
第一,报价阶段问清楚计费标准。是按原文计还是按译文计?是字符数还是单词数?权利要求书和说明书是否分开计价?这些细节在报价时就要确认清楚,避免结算时产生争议。
第二,交付时核对字数统计表。正规的翻译公司通常会提供详细的字数统计明细,包括各部分的字数、分项统计依据等。拿到这份表后,可以抽样核对几段,确保统计方式符合约定。
第三,注意隐藏项目。有些翻译公司的报价可能很低,但要警惕是否把附图、表格、化学式等内容排除在外单独计价。这些内容处理起来往往更耗费时间精力,如果不在前期约定好,后期加价会很被动。
第四,关注质量而非仅仅字数。字数不是目的,准确的翻译质量才是核心。一份权利要求书翻译得是否精准、一份说明书表述是否清晰,这些远比数字是多少重要得多。过于纠结字数而忽视质量,最后吃亏的是自己。
专利文件翻译的字数统计,远看是个数学问题,近看其实是个规范问题。它涉及到语言差异、行业惯例、技术处理、质量控制等多个层面。没有一个放之四海而皆准的绝对标准,但在长期实践中,行业内形成了相对成熟的通行做法。
对于需要接触专利翻译的朋友来说,关键是找到一家靠谱的翻译服务提供商。专业的专利翻译机构会有清晰的计费标准、成熟的质量控制流程、以及经验丰富的译审团队。他们不仅能给出合理的报价,更能确保翻译质量经得起审查和质疑。
如果你正在寻找这样的合作伙伴,不妨多了解一下那些深耕知识产权翻译领域的企业。专注、认真、对细节有执念——这样的特质在专利翻译行业比什么都重要。毕竟,专利文件上承载的是创新者的智慧结晶,每一个字都马虎不得。
