现在大语言模型所说的Token其实应该对应的是语言学中的Morpheme

墨者在此 2025-02-12 10:23:48

现在大语言模型所说的 Token 其实应该对应的是语言学中的 Morpheme

按语言学的解释，Morpheme 就是字的成分，Constitients of a word (图一)

比如，Glovalozation 就是由四个 Morpheme 构成的，分别是 glob, al, is, ation (图二)

但是为何大语言模型不说是 Morpheme ，而叫做 Token 呢？这就非常令人费解了，难道搞语言模型的人不懂语言学? 这就非常搞笑了？

那么这个对应中国的什么呢？

我认为应该是部首，比如赢，是由五个部首构成的，分别是亡，口，月，贝，凡

在1965年出版的一本 A Linguistic Theory of Translation，就同样提到了现代的语言学结构，rank level

有意思的是，它把高层级的结构与低层级的结构相似的 Rank shift 现象称为 Chinese Box，中国盒子，非常明显，这种结构其实就是俄罗斯套娃，或者也可以称为分形，但是为什么不用 Russian Dolls 而是 Chinese Box 呢？

我查了一下，Chinese Box 指的其实是唐代所盛行的装佛祖舍利子的佛龛 (图四)，它就是套盒，可能有七到九层

没想到吧？

此书中还提到了一种语调结构(图五)，这种结构我不会联想到英文的语调，但是却很容易想起中国古代的平仄

.

0 阅读：0

感谢大家的关注

作者最新文章

1

今天才知道，中国一国承担了超过 20% 的联合国会费建议联合国总部其实可以搬到中

2

一直有一个误区，即认为「天下」的概念是从周朝开始的，但是如果我们结合古三坟和尚书

3

阿根廷总统米莱学美国总统特朗普，也发行了自己的加密货币 Libra ，短短一个小

4

结合一些信息来看，中央汇金很可能会成为中国的财富主权基金管理机构昨天(2月14日

5

最近多次看到一则信息，伦敦黄金交易市场的黄金在一月份被大量的转移到了纽约转移的数

6

古人定义一个概念其实都是取象比类的，基本是一字一义，这就是象形文字的优势，如果存

7

最近应该是美军水逆，不然无法合理解释了不到两个月里，能把自己的 F18 击落，让

8

我们专题探讨一下哪吒的精神象征其实哪吒的精神比孙悟空还要高绝孙悟空，天书奇谭中的

9

怎么讲呢？现在很多人还是处于被人卖了还帮人数钱的水平不要以为弘扬你的文化就是认同

10

有网友提供信息，所谓新中国考古圈的开山祖师夏鼐，看起来很可能参与了古埃及文明的造

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

历史TOP

1

乾隆下江南也没吃这么好吧

2

孟子义这肚兜有点顶不住啊

3

朱棣靖难造反，在历史上绝对是个奇迹。带着北平那点家底，跟坐拥天下的朱允炆死磕四年

4

古代皇帝妻妾成群：1，康熙：62个妻妾2，乾隆：41个妻妾3，雍正：28个

5

1969年8月20日，苏联驻美大使通知美方，苏联将向中国投放原子弹，毛主席听后，

6

这是西安事变47天前，张学良陪蒋介石爬华山的照片。照片中可以看到张学良满腹忧虑

7

韩先楚其实是志愿军副司令中最不适合当副司令的人选。因为在抗美援朝的五次战役中，韩先楚大多都不在志愿军

8

第一条：改命，靠选妻[汗][汗][汗]

9

1964年，毛主席在自己的生日宴上，递给钱学森一支烟，而就当他要伸手接烟时，主席

10

1948年，国民党团长楼将亮的夫人陈愉，在武汉一家医院内被6人轮番侵犯。虽然说这

历史最新文章

1

1949年，蒋介石带着60万大军败逃台湾，其中大部分都是没成婚的年轻人，为了解决

2

1974年，90岁的杨森迎娶了17岁的张灵凤。洞房之夜，就在杨森要行房事时，张灵

3

1956年8月，一个解放军少尉副连长脱下军装，按18级干部标准转业到福建地方，在

4

1989年邓小平谈第一代领导集体，有毛主席、周总理、刘少奇、朱老总，陈云，然后还

5

我国目前有三大航母：1、辽宁舰：满载排水量6.75万吨（常规动力）2、山东舰：满

6

唐朝时期夜里，杨玉环被李隆基灌醉了，迷迷糊糊间就看见，李隆基如同饿狼一般，将她拦

7

上联：明月灯下诉相思，有人能对出下联吗？

8

1958年，毛主席下令炮击金门，不小心炸死两个美国顾问，美国得知后率大军压境，指

9

上联：年年老舍迎秋雨，求下联羌人对：岁岁东坡赏悲鸿。

10

古代皇帝妻妾成群：1，康熙：62个妻妾2，乾隆：41个妻妾3，雍正：28个