原创声明: 本文由 LIN QIAOZHI (林乔治) 原创,首发于微信公众号 (阅读原文)。未经授权,禁止转载。
Copyright © 2026 QIAOZHI LIN. All rights reserved.
Token 的中文翻译,让我钻进了 180 年的音译史
Token 这个词,全世界都在用。但全中国没有人知道该怎么叫它。
我试着用一百年前香港人翻译"三藩市"的方法,给 token 找了一个中文名字——普通话念得通,粤语对得上音。这篇文章记录了整个探索过程:从音韵学的拆解、到六轮候选字的淘汰、到最终在"三藩市"本身里找到了突破口。
如果你对语言、翻译、粤语文化或者 Web3 有任何一丁点兴趣,这篇应该不会让你失望。
一、起点:四种语言泡大的直觉
我在深圳出生长大。
这句话本身没什么特别,但如果你在深圳的家庭里长大,你的语言环境大概率是一锅乱炖:家里人讲粤语,有时候夹几句潮汕话,出门讲普通话,电视里放 TVB,父母做生意的客户一半在香港。
我家就是这样。父母从商,深港两地的客户打交道多了,粤语和英文是工作语言,潮汕话是跟老家亲戚的情感纽带,普通话是在深圳生活的通用底色。四种语言从小交替着进我的耳朵,我甚至说不清哪种是"母语"——大概都是。
这种环境养出了一个习惯:我对同一个事物在不同语言里的"手感"特别敏感。
同一句话,粤语讲出来是一种味道,普通话讲出来又是另一种。有些英文词翻成中文就"死了",有些中文表达切回英文就"扁了"。这种感觉很微妙,不是学语言学能学会的,是泡在多语环境里自然长出来的直觉。
去年我去了一趟三藩市,这种直觉被狠狠触发了一下。
在金门大桥下面,同行的北方朋友说"旧金山真美"。我脱口而出"三藩市嘛"。他愣了一下:“三藩市?“同一个城市,我们各叫各的,叫了二十多年都没对上号。
San Francisco——我从小就叫三藩市,因为家里讲粤语。Saam Faan Si,直接对音。港人叫了一百多年,从来没觉得有什么问题。后来我才知道大陆叫"旧金山”——一个意译(因为 19 世纪的淘金热 Gold Rush),而"三藩"才是音译。音译 vs 意译,两条路线走了一百多年,互不干涉。
雪梨也是。Sydney 用粤语读 Syut Lei,比"悉尼"贴近英文原音不知道多少倍——而且"雪梨"两个字还自带画面感,白雪配梨子,清新得很。
这套翻译思路的精髓就一句话:用粤语的耳朵去听英文的嘴巴。
站在三藩市的街头,我突然冒出一个念头:token 能不能也这么翻?不是意译成"代币"或"令牌”——这些各有各的局限。我想的是,纯对音,能不能找一个又好听、又有意头的中文名字?
这个好奇心一旦发动,就刹不住了。
二、「模元」很好,但少了一层直觉
回来之后没多久,看到一篇公众号文章,提出把 token 翻译成「模元」。
说实话,第一眼看觉得还不错。“模"对应模型 (model),“元"暗示基本单位,语义上把 token 在 AI 领域的角色交代清楚了。作为一个纯意译方案,逻辑自洽。
但反复念了几遍,总觉得差了点什么。
差在哪?差在直音——就是你听到 token 这个英文发音,脑子里能不能自然地滑到那个中文译名上去。
你看三藩市。San Francisco,粤语读 Saam Faan Si,普通话里"三藩市"也念得顺口。你听到英文 San,脑子自动蹦出"三”;听到 Fran,自动蹦出"藩”。这个从英文音到中文字的滑动是丝滑的,没有卡顿。
巴士也是。Bus,粤语 Baa Si,普通话"巴士"——你听到 Bus 就想到巴士,听到巴士就想到 Bus。两个方向都通。
的士、芝士、三文治、沙律、多士、布甸……全是这样。英文音和中文字之间有一条直觉通道,不需要经过"翻译"这个中间步骤,念出来十分舒服,毫无违和感。
最好的音译,是让人忘记它是翻译。
「模元」的问题在于:你听到 token,脑子里蹦不出"模元"。你看到"模元",也读不出 token 的影子。它是一个好的意译,但不是一个有直觉的译名。而且"模元"只覆盖了 AI 这一个场景——crypto 里的 token、API 里的 token,叫"模元"就不对味了。
我想找的,是那种像三藩市、巴士一样,听到英文就能滑到中文的译名。一个有"音感"的答案,而且在所有 token 出现的语境里都站得住。
所以决定自己也出一份力,从最基本的发音开始拆。
三、Token 的翻译困境:七个名字,没一个通用
翻之前,得先看看现在的翻译有多混乱。
2020 年,学者刘金婷在全国科学技术名词审定委员会主办的《中国科技术语》期刊上专门发过一篇论文,标题直接就叫《Token 在不同领域内的中文译名浅析》。她的核心结论是:token 至少有七种中文译名在各领域并行使用,互不兼容。
| 译名 | 使用领域 | 核心问题 |
|---|---|---|
| 代币 | 区块链/金融 | 香港证监会标准用词。但"代币"天然暗示货币属性——“API 代币过期了”?不通 |
| 令牌 | 计算机安全 | 大陆 IT 文档常见。但在香港人耳里,这像古装剧道具——“尚方宝剑"级别的违和 |
| 通证 | 区块链学术圈 | 元道、孟岩 2017 年提出的新造词,想统一所有语义。优雅,但太抽象,日常没人讲 |
| 词元 | NLP/AI | 近两年随大模型火起来的译法。但"词元"只适合语言处理,覆盖不了金融和安全 |
| 标码 | 信息科学 | 学术味太重 |
| 记号 | 心理学 | 语义模糊 |
| 权标 | 部分技术标准 | 几乎没人用 |
七种译名,每种只覆盖一个领域。你在 crypto 交易所说"令牌”,人家以为你在讲游戏;你在技术文档里写"代币",同事以为你在炒币。
而在香港和深圳?科技圈直接讲英文,不翻译。
“呢个 API 嘅 token expire 咗。"(这个 API 的 token 过期了。)
这句话我太熟悉了。在深圳做技术的朋友,日常沟通就是这种风格——粤语打底,技术词汇全用英文,偶尔切普通话。四种语言混着来,谁也不觉得有什么问题。
但这终究是个遗憾。180 年来,香港粤语吸收了 700 多个英语借词——的士 (taxi)、巴士 (bus)、芝士 (cheese)、三文治 (sandwich)、士多啤梨 (strawberry)、朱古力 (chocolate)、沙律 (salad)、多士 (toast)、忌廉 (cream)、布甸 (pudding)、曲奇 (cookie)、梳化 (sofa)、贴士 (tips)、波士 (boss)……这些词早已融入了日常中文,很多连普通话使用者也在用。唯独 token,至今没有一个像样的中文名字。
四、其他语言怎么处理 Token?
在开工之前,我先看了一圈别的语言怎么做。
日语:トークン(tōkun)。纯片假名音译,不携带任何语义。日语对所有外来词都这么干——用片假名标音完事,简单粗暴。
韩语:토큰(tokun)。纯谚文音译,逻辑跟日语一模一样。
两种语言的共同点:**音译了,但没有赋予它任何含义。**トークン 就是四个音符,토큰 也是两个音节,读出来你知道它在说 token,但字面上什么意思?不知道。就像一个空壳。
中文的独特优势恰好在这里:每个字都同时承载声音和意义。
日语和韩语没得选——片假名和谚文是表音文字,只能记录声音。但汉字不同。如果选字得当,一个音译可以同时完成两件事:听起来像 token,看起来有意思。
“可口可乐"就是最经典的案例——Coca-Cola 的音译,四个字同时传达了"好喝"和"快乐”。
而粤语,因为保留了比普通话更丰富的音系,在这件事上拥有天然优势。
五、为什么从粤语入手?六种韵尾 vs 两种韵尾
要理解港式音译的底气,得先搞清楚一个语言学事实:粤语保留了中古汉语的入声。
粤语有六种韵尾辅音:-p、-t、-k、-m、-n、-ng。普通话只剩两种:-n、-ng。入声在普通话里彻底消亡了。
这意味着什么?意味着粤语有更多的"音素零件"来拼装英文音节。就好像用六种颜料调色,肯定比只用两种更容易还原原画。
拿 Beckham 举例。英文发音 /ˈbek.əm/,那个 Beck 的尾音是 -k。粤语有入声字"碧”(bik),一个字就把 Beck 的音色和尾巴全收了——“碧咸”,两个字搞定。普通话没有 -k 韵尾,只能拆开来凑——“贝克汉姆”,四个字,还不如人家两个字精准。
同样的道理:
| 英文 | 粤语音译 | 普通话音译 |
|---|---|---|
| Hollywood | 荷里活 | 好莱坞 |
| Arsenal | 阿仙奴 | 阿森纳 |
| Chelsea | 车路士 | 切尔西 |
| Beckham | 碧咸 (2字) | 贝克汉姆 (4字) |
| Chocolate | 朱古力 | 巧克力 |
| Pudding | 布甸 | 布丁 |
| Stamp | 士担 | 邮票 (放弃音译) |
| Tips | 贴士 | 小费 (放弃音译) |
你用粤语读"荷里活"再用普通话读"好莱坞",然后听一遍英文 Hollywood——高下立判。
有意思的是,粤语音译的影响力并不局限于粤语区。曲奇 (cookie)、贴士 (tips)、芝士 (cheese)、巴士 (bus) 这些词,现在在大陆年轻人中也越来越常用——它们最初都是粤语音译,后来被普通话"借"走了。一个好的音译不会被方言围墙困住,它自己会"破圈"。
180 年来,香港粤语通过这套系统吸收了 700 多个英语借词,85% 是纯音译。这不是偶然,是语音系统的结构性优势。
六、拆解 Token 的声音
好,回到正题。Token,英文 IPA 标注是 /ˈtoʊ.kən/,两个音节。
第一个音节 /toʊ/:重读,双元音。英文词首的 t 是送气音,跟粤语的 t- 声母完美对应。元音 /oʊ/ 是个从 o 滑向 u 的双元音。
粤语里能接住这个音的有三条路:
- tok 系列(入声):托、拓、託——音色准,多了个 -k 尾巴,但港式音译本来就爱用入声字
- to 系列(开音节):拖——音简洁但字义偏日常,“拖地"的拖,格调不够
- tou 系列(双元音):韬——在音韵学上最接近英文的 /toʊ/,而且"韬光养晦"的韬,底蕴够深。但 19 画,日常写不动
第二个音节 /kən/:轻读,中央元音 schwa 加鼻音 -n。这里有个语音学细节——英文词中位置的 k 实际上是不送气的 [k],更接近粤语的 g- 声母。
所以 /kən/ 映射到粤语就是 gan1,候选字一排开:根、跟、斤、巾、筋……
七、选字的艺术:不只是对音,还要讲意头
港式翻译有个不成文的规矩:唔怕直译,但一定要讲意头。
“士多啤梨"翻译 strawberry,最后一个字为什么用"梨"不用"厘”?因为"梨”(lei4) 谐音"利"(lei6),好意头。反过来看"草莓"——“莓"跟"霉"同音,“倒霉"的霉。粤语文化里谁会用这个字?
再看曲奇——cookie 的粤语音译,kuk1 kei4。“曲"是曲调,“奇"是奇妙。两个字都好听好看好意头。这个译名后来直接被普通话借用了——今天大陆的烘焙店全写"曲奇饼干”,没人觉得有什么违和。
一百年前的翻译者就懂:音准只是入场券,选字才是真功夫。
所以我给候选字做了一个五维评分:发音精度(30%)、字义内涵(25%)、视觉美感(20%)、与 token 概念的关联度(15%)、日常可用性(10%)。
八、六轮淘汰:从"拖根"到"託瑾”
第一轮:拖根 (to1 gan1)
纯粹对音。音准没问题,但"拖"这个字——拖地、拖鞋、拖延——全是日常甚至负面联想。一个金融科技术语,不能跟拖把联系在一起。淘汰。
第二轮:拓根 (tok3 gan1)
“拓"比"拖"好多了——开拓、拓展、拓荒。有进取感。但"拓根"听起来像园艺术语(拓展根系),跟 token 的核心概念不沾边。差一口气。
第三轮:託根 (tok3 gan1)
“託"字一出来,感觉瞬间对了。託付、委託、嘱託——全是关于信任的词。Token 本质上就是一种信任凭证,“託根”= 信任的根基。语义精准,两个字都常用,繁简兼容。
这是第一次觉得"对了一半”。但反复念了几遍后,总觉得缺了什么。
第四轮:託瑾 (tok3 gan2)
“瑾"是美玉。屈原《楚辞》里"怀瑾握瑜"的瑾——怀抱美玉,握持宝珠。“託瑾”= 受托之玉,一枚珍贵的信物。
文化格调拉满了。但问题是:瑾字不常用(多见于人名),笔画偏多,而且玉的价值暗示太含蓄——普通人读到"瑾"不会第一时间联想到"值钱”。
第五轮:韬根 (tou1 gan1)
从纯音韵角度讲,这组最精确。tou1 的双元音 /tʰɐu/ 几乎是英文 /toʊ/ 的镜像。“韬"是韬略、韬光养晦,暗示深藏的技术架构。
但 19 画。日常书写不现实。而且"韬略"的意象跟普通用户对 token 的感知距离太远。
到这一步,我卡住了。
五组候选,都在信任、雅致、精确之间打转,但没有一个同时抓住 token 的另一个核心维度:价值。
Token 不只是一张通行证。在 crypto 世界里,它是有价格、可交易的数字资产。在更广义的语境里,它是一种可量化的价值单位。“託根"说了信任,但没说值钱。就好像翻译 dollar,只说了"这是一种凭证”,却忘了提"这是钱”。
九、转折:三藩市自己就是答案
我卡在这里的时候,突然意识到一件事——回头看看三藩市本身。
“三"的粤语读音是 saam1,韵尾是 -m。但 San Francisco 的 San,韵尾是 -n。
-m 和 -n,韵尾不一样。
换句话说,三藩市这个被使用了一百多年的经典港式音译,本身就包含了一个 -m/-n 的韵尾互换。港式翻译从来没有要求百分之百音准——它追求的是整体音感的贴合,不是逐个音素的精确复刻。
有时候答案不在你盯着看的方向,而在你以为已经研究透了的前提里。
这个发现打开了一扇门。如果 -m 和 -n 可以互换,那第二个音节的候选字就不局限于 gan1(根、跟、斤……)了。gam1 的字也可以考虑。
gam1 的字里面,有一个字,一出来就把所有问题解决了:
金。
十、「託金」:信任 + 价值,双重锁定
金 (gam1)。黄金的金,金融的金,金钱的金。
gam1 跟 gan1 的区别,只在韵尾辅音 -m 和 -n 之间。元音完全一样,声调完全一样,声母完全一样。有"三藩市"的百年先例在前,这个距离根本不算距离。
「託金」(tok3 gam1)。
- 託 = 委托、信任、托付 → token 作为凭证的属性
- 金 = 黄金、金钱、金融 → token 作为价值载体的属性
- 合义 = “受托之金” → 一枚承载了信任的金质凭证
这两个字的厉害之处在于,它在每一个 token 出现的场景里都成立:
Crypto 语境:“我持有 1000 个託金”——被区块链网络委托给你的数字黄金。天然合理。
API/安全语境:“这个 API 的託金过期了”——系统托付给你的一把金钥匙。比"令牌过期"不违和一百倍。
AI 语境:“GPT-4 每次对话消耗多少託金?"——每个託金都是一枚计价的金单位。比"词元"亲切。
日常金融:“证券型託金发行”——比"证券型代币发行"更有质感,暗示了信任基础。
七种互不兼容的译名,「託金」一个打通了全部。
而且"金"这个字在中文文化里无条件正面——金榜题名、真金不怕火、金口玉言、黄金万两。无论你说普通话还是粤语,用"金"字做音译,没有人会觉得有忌讳,只会觉得有意头。
再看字形:繁体「託金」端庄大气,简体「托金」简洁利落。两种写法都辨识度高,笔画适中。
对比一下最终方案和所有候选:
| 方案 | 信任感 | 价值感 | 音准 | 日常可用性 | 跨语境通用 |
|---|---|---|---|---|---|
| 拖根 | ★★ | ★ | ★★★★ | ★★★★ | ★★ |
| 拓根 | ★★★ | ★★ | ★★★★ | ★★★★ | ★★ |
| 託根 | ★★★★★ | ★★ | ★★★★ | ★★★★★ | ★★★ |
| 託瑾 | ★★★★ | ★★★★ | ★★★ | ★★★ | ★★★ |
| 韬根 | ★★★ | ★★ | ★★★★★ | ★★★ | ★★ |
| 託金 | ★★★★★ | ★★★★★ | ★★★★ | ★★★★★ | ★★★★★ |
这里要特别说明一点:「託金」首先是一个汉语译名,不是粤语方言专用词。
普通话读"tuō jīn”——托付的托,黄金的金。语义通顺,任何普通话使用者都能立刻理解:这是一枚承载信任的金质凭证。不需要懂粤语,不需要了解港式音译,这两个字自己就站得住。
而粤语读 tok3 gam1,恰好跟英文 token /ˈtoʊ.kən/ 高度吻合——这是一层额外的验证,不是前提条件。
好的翻译应该是这样的:在普通话里讲得通义,在粤语里对得上音。两套语音系统同时认可,一个都不勉强。
三藩市就是先例。它最初是港人的粤语音译,但今天全中国的人都认识"三藩市"这三个字,不需要会粤语也能用。曲奇、巴士、芝士也是同一条路——从粤语出发,最终成为整个中文世界的通用词。「託金」走的是同一条路。
十一、一个更大的问题
但其实我想说的不只是 token 这一个词。
180 年来,香港粤语吸收了 700 多个英语借词,85% 是纯音译。的士、巴士、芝士、三文治、士多啤梨……这些词已经完全融入了中文的日常,很多早已不局限于粤语区。
但到了互联网时代,港人面对新科技词汇的第一反应变成了——直接讲英文。Token、deploy、server、bug、cache……code-switch 多方便,何必费心翻译?
日语和韩语也走了这条路——トークン 和 토큰,都是纯粹的音壳,不携带任何语义。方便是方便,但总觉得少了点什么。
一种语言如果放弃了消化新词的能力,就像一个人放弃了长新肌肉的能力。你还活着,但你不再生长了。
三藩市的"三藩”、雪梨的"雪”、碧咸的"碧”——这些字不是从石头里蹦出来的,是一百多年前某个广东人,用他的耳朵听见了英文的音,用他的笔写下了一个漂亮的中文字。那个瞬间,两种语言之间架起了一座桥。
今天我们给 token 找一个中文名字,用的是同一套方法。粤语提供了音韵工具,但最终产出的是一个全体中文使用者都能接受的译名。
我小时候在家里听到的每一句粤语,每一次大人在电话里切换粤语和英文跟香港客户谈生意,都是这种语言消化能力的活标本。我妈跟客户说"帮我 check 下嗰个 order”,我爸跟汕头亲戚说"物件寄过来"——不同语言在不同场景里各司其职,但关键的新事物,总有人会给它一个中文名字。
中文是世界上少数能让翻译同时承载声音和意义的文字系统。这不是负担,是天赋。日语用片假名记下了声音却丢掉了意义,我们不必重蹈覆辙。
十二、思考演变全图
拖根 (to1 gan1) "音准但字面太日常,拖地的拖"
↓
拓根 (tok3 gan1) "开拓有进取感,但无价值暗示"
↓
託根 (tok3 gan1) "信任感到位!但只说了凭证,没说值钱"
↓
託瑾 (tok3 gan2) "美玉暗示价值,但太文学,不接地气"
↓
韬根 (tou1 gan1) "发音最精确,但 19 画写不动"
↓
⚡ 发现三藩市 saam/San 的 -m/-n 互换先例
↓
託金 (tok3 gam1) "信任 + 价值,双维度锁定" ← 最终方案
写在最后
「託金」不一定是唯一的答案。语言是活的,最终哪个译名能留下来,不取决于谁论证得更好,取决于谁被更多人用起来。
但至少,这是一次认真的尝试。
全国科学技术名词审定委员会至今没有给 token 确定一个跨领域的统一中文译名。七种译名各自为政,互不兼容。而我在这篇文章里做的事情,只是提供了一个被忽略了的维度:从方言音系中寻找音义兼收的灵感。
「託金」不是一个粤语方言词。普通话读 tuō jīn,语义清晰,人人看得懂;粤语读 tok3 gam1,发音贴合英文原音。它是一个标准的汉语译名,只是灵感恰好来自粤语的音韵传统。
作为一个在深圳长大、在粤语和普通话和英文之间来回切换了二十多年的人,我觉得这件事值得有人去做。一百年前的港人能用两个字"碧咸"搞定 Beckham,我们今天凭什么不能用两个字"託金"搞定 token?
託金。委托的信任,黄金的价值。一枚通行数字世界的金质信物。普通话念得通,粤语对得上音。
如果你觉得这个译名有道理,欢迎转发。也许有一天,“託金"会像"的士"“芝士"一样,成为中文世界里一个理所当然的词。
本文基于三个方向的独立研究综合而成:港式粤语音译 180 年历史、科技术语翻译现状调研、粤语音韵学候选字分析。完整研究材料另文发布。
参考文献:刘金婷,《Token 在不同领域内的中文译名浅析》,《中国科技术语》2020 年第 5 期。
原创声明: 本文由 LIN QIAOZHI (林乔治) 原创首发于微信公众号。点击阅读公众号原文
Copyright © 2026 QIAOZHI LIN. All rights reserved.
本文首发于 aieii.com