没什么用,但比较有意思的水平

很多东西说出来,英语母语使用者也不一定听得懂

比方说前两天有个同学翻译「福祸与共」,用的是「share the weal and woe」,原文来自莎士比亚的作品。像这种东西说出来,10个英语母语的里面有10个都听不懂。这就好比你夸一个姑娘好看,夸她「明眸善睐,靥辅承权」,10个中国人里有10个听到这话也就只能大概听懂一点,还得猜个意思。

所以说也没什么卵用,毕竟正常人不是这么说话的,而有人跟你这么说话,你也会觉得这个人很奇怪。

但是辞汇量大确实有意思,所谓进一寸有进一寸的欢喜。


一、啥样神人会有5万上下的辞汇量?

英语语言中,提到超大辞汇量,就不能不提莎士比亚。这位老哥不仅仅辞汇量大,还创造了很多新词,据说有3000。据统计,他在作品中使用了3万多辞汇

评论区有知友提到邱吉尔,我特意去查了查,没在权威出处中找到特别可靠的数字。但是,邱吉尔辞汇量极大,这是世人公认的,——诺贝尔文学奖不是白拿的。有一个说法是他在写作中应用了6万辞汇

所以,作为外语学习者,5万辞汇量是否是一个我们可以到达的目标呢?在此我不置评。

二、Native Speakers和Non-Native Speakers的辞汇量分别有多少?

Goulden等1990年发表于Applied Linguistics的论文How large can a receptive vocabulary be?,以及Zechmeister等1995年发表于Journal of Reading Behavior的论文Growth of functionally important lexicon,均有对Native speakers的辞汇量研究:

保守估计,受过良好教育的成年Native speaker,辞汇量应在20,000个word families上下。

二语研究界的泰斗Paul Nation在2006年发表于The Canadian Modern Language Review的论文How large a vocabulary is needed for reading and listening?提到:

英语非母语者,即使用英语接受了极高教育(比如在美国某名校读了个本科,甚至硕士或博士),被动辞汇量大多也只是在8,000-9,000个word families的区间

另外,英国老牌报刊《经济学人》介绍过一个测辞汇量的网站,——http://testyourvocab.com/,免费。测试过程也很简单,把你认为你认识的单词打勾就可以,5到10分钟就能测完。

这个网站是美国和巴西合作的一个独立科研项目,已运行多年,吸引了很多人来测试自己的辞汇量,从而收集了大量数据。2013年,他们宣布了几个统计数字:

  • 英语母语的成年人平均辞汇量有2~3.5万;
  • 英语母语的8岁儿童平均辞汇量1万;
  • 英语母语的4岁儿童平均辞汇量5000;

当然,这些统计数字的来源,是登录网站去参与了测试的人们,有可能并未完全客观的反映「全体」英语母语者的辞汇量情况。但是,这数据怎么也有挺大的参考价值。比如,2-3.5万这个数字和本文提到的学术界研究结果比较一致。

所以,8,000个word families的辞汇量,应该是一个比较现实的目标;如果你真的在英语辞汇方面非常ambitious,那我觉得,2万也还算是个不那么遥不可及的目标吧

三、如果你想测自己的辞汇量

除了前文提到的http://testyourvocab.com/,我新近发现了一个我觉得更准确的测辞汇量的网站:

https://my.vocabularysize.com/

这是Paul Nation所建。不同于前文所提的http://testyourvocab.com,Nation的这个网站会给出对应的汉语释义选项,五选一的单选题,我觉得这样测起来会更准确一些。如下:

扇贝测辞汇量,我不推荐。测出的结果虚高。我测过,比我用上述两个网站测的,多出来好几千。

四、我们到底需要多少辞汇量

这个问题,其实是个挺宏大的课题。仅Paul Nation一人,就围绕这个问题写过多篇论文。

他把他毕生研究浓缩成几个简单的数字,放在了网站上:

即:

  • Native speakers辞汇量多在2万上下;
  • 对于我们英语学习者来说,8000~9000辞汇足以应对日常阅读;
  • 6000~7000足以应对日常听力

不知老铁们看了这个数字后,是不是扎心了?6000辞汇量就能听懂?那为啥听力一直老大难呢?

第一,此6000非彼6000,这儿说的是word families。关于word families,后文有说明

第二,是否需要6000这么多,是有争议的。我更倾向于认为,日常听力不需要这么多。以后会写文说明。

第三,听力听不懂?不仅仅是辞汇量的问题。这个以后我也会写。

注意:关于word-families

本文反复提到word families(词族)。

word family和words,这两个概念有差异:

比如,nation, national, nationalize, nationally等属于同一个word family,所以算作一个word;

再如,courage, discourage, encourage等也属于同一个word family,也算作一个word。

所以你就知道了:

六级考试要求6000辞汇量,那个6000,是words,和这儿所谈的6000个words families,概念不同。

6000个words families,大概相当于1万words吧。


补充:

关于 「被动辞汇 vs. 主动辞汇」

当我们见到某个单词,我们说:「哎,这个单词我会哎!」

这个「会」字,可能有不同的意义。

比如,

当你听到有人说: 「This apple is so yummy!」,你能听明白对方在说「这个苹果很好吃」,这是一种「会」;

而如果你咔嚓咬一大口苹果,觉得哎呀这苹果可真好吃,接著你就能说出来「This apple is so yummy!」这句话,这是另外一种「会」。

前者,我们称作是我们的被动辞汇,后者是主动辞汇

即,能看懂、能听懂的是你的被动辞汇;会说、会写的是你的主动辞汇。

一般来讲,一个人的被动辞汇是明显多于主动辞汇的,但具体会多多少,目前尚无定论。Anyway, 一个被动辞汇量高达1万的人,主动辞汇量只有四五千,是完全可能的。

文中提到的两个网站所测试的,都是被动辞汇量。

知乎专栏:

Julie英语课?

zhuanlan.zhihu.com图标

微信公众号:Julie英语课(ID: Julie_En_Class)


应该是英语国家的中学教师水平吧。

俺大概也就 6000~7000 酱紫。

因为六级证书当垃圾扔了, 所以没法子证明自己的英语能力。

所以就用网上的自测题来自证, 比格比较低。

大伙请海涵。

插播题外话: 别再用书名号《》把英文/外文著作名、歌曲名给括起来好吗? 求您了!

麦文学:别再用书名号《》把英文/外文著作名、歌曲名给括起来好吗? 求您了!?

zhuanlan.zhihu.com图标

有个很好玩的 「无限猴子定理」:

让一只猴子在打字机上随机地按键,当按键时间达到无穷时,几乎必然能够打出任何给定的文字,比如莎士比亚的全套著作。在这里,几乎必然是一个有特定含义的数学术语,「猴子」也不是一只真正意义上的猴子,它被用来比喻成一个可以产生无限随机字母序列的抽象设备。这个理论说明把一个很大但有限的数看成无限的推论是错误的。猴子精确地通过键盘敲打出一部完整的作品比如说莎士比亚的哈姆雷特,在宇宙的生命周期中发生的概率也是极其低的,但并不是零。正如同玩彩票一样, 如果您把所有的彩票都买下来,肯定会中大奖。

如果您能默写出五万个单词,

那么手写一本字典也不是啥难题了。

俺骨子里其实是相当认同自己是文科生的, 而且俺的 FIRST NAME 是文学。

俺还有个朋友, 他说了个笑话。

某天新收了患者,进修生在写病历。进修生以前是学电脑的, 不知道咋混进了医疗队伍。

俺朋友随口问了一句,

「Digital examination 做了没有?」

进修生好奇地问道:

「我才看完麻省理工的尼古拉斯·尼葛洛庞帝写的 《数字化生存》(Being Digital)。

没想到写病历也数字化了。电脑还能做体格检查, 怎么做?」

俺朋友说:

「用手指。」

这有个简单的英语阅读理解在线测试,大家不妨自测一下。俺一直在找一个志同道合的知友来共同完成一件事情。这个阅读理解在线测试就是一个开始。

【未完待续】

【未完待续】


看怎么定义5万。

如果是以不带派生词的lemma来记,一般母语者是30000多,下限是20000,如果能掌握5万个lemma词条,那水平绝对在母语者中都是顶尖水平。

如果算上派生词,绝大多数母语者都有50000辞汇量,再算上不收入词典的专有名词,还要加起码一两万。从这个层面上考虑,50000辞汇量也就普普通通。

法国科学院院士迪昂,著名神经科学专家,他曾经专门做过试验考察母语者辞汇量。当他采访受试者时,大部分人都说只有几千辞汇量。然而当他甩本100000词的词典给这些人,发现受试者基本都认识一半以上的单词。不认识的词,一般点拨一下都能懂。

最后迪昂得出的结论是,母语者一般对自己的辞汇量的估计都比较谦虚。


我目前肯定是没有达到五万。但是单词量五万是个什么情况我是知道的。因为你只要随便找几本欧美国家出版的字典。你就大概知道辞汇量五万是个什么意思了。

首先英语的基本单词在2万左右。这个数字是假设不包括各种单词派生的。例如arrangement和arrange。你非说这个两个单词,我也没办法。但是如果按照这两个单词算一个的话,基本单词在2万左右。

之后变成2万到3万非常简单。那就把arrangement和arrange算成两个。

再往后,从4万到5万,其实就没有意义了。比方说,各种恐龙的名字,各种人体组织的名字,例如前额叶。只有纪录片里面才会出现。

从5万到7万,就需要靠各种人名。比方说,爱因斯坦算不算一个单词,西奥多罗斯福算不算。


推荐阅读:
相关文章