1.如何统计词汇量——词目
由于单词存在变形,如动词look的常见变形有looks、looke、looking,因此在统计的时候,本文只计算“词目”的数量,不同变形均算作同一个“词目”。因此前面提到过的look、looks、looke、looking只算一个词,这也是目前最常用的统计标准。
此外,一个“词目”添加了前缀或后缀也有可能变为“新词目”。判断方法为:如果该单词在字典中存在单独的词条、形成新的含义,则为“新词目”,否则就作为其他词的变形。如interest、interesting、intereste就构成了三个词目。例如:在字典中可以找到interesting的词条,但无法找到looks的词条,因此前者构成新词目,而后者仅为look的变形。
2.GRE考题词汇量的“纯统计”——9208
在明确了词汇量的定义之后,我们以目前网络上流通的全部1300余道题目为样本统计,发现所有题目中出现的总词汇量为“9208”。
但是,“9208”是基于以往的考试题目统计出来的,只能说这“9208”词汇可以应付以往的GRE考题,但并不一定足以应付未来的考题。过往经验告诉我们,每次GRE考试都会出现新词。因此应对GRE考试所需的词汇量应大于现有的统计结果。
通过研究现有的GRE题目与词汇对应关系,我们得出词汇量的增长趋势。结果如下:
在近900道GRE题目样本下,每10道题仍可带来约40个新增词汇。 因此仅凭现有的题目是不足以完全覆盖未来考试词汇的。
3.什么是词汇难度——词频
我们先来看一道GRE官网上的填空例题:
In parts of theArctic, the lan graes into the lanfast ice so that you can walk offthe coast an not know you are over the hien sea.
(A) permanently
(B) imperceptibly
(C) irregularly
(D) precariously
(E) relentlessly
(答案:B)
这道题目中出现的词汇量为29,请问:如果只是为了做对这一道题的话,一个考生需要有多大词汇量?答案显然不会是29,因此要回答考GRE需要多大词汇量这一问题,更合理的思路应是从GRE词汇的难度着手。有研究指出,阅读英语时理解其意思需要认识98%的单词,最低不能低于95%。我们也以此为标准,即假定普通考生想在GRE考试中大概理解文章意思的话至少应认识其中95%的单词,而追求高正确率的考生需要认识其中98%的单词。那么认识“relentlessly”至少需要多大的词汇量呢?
最能反映词汇难度的指标是词汇的“生僻程度”:越常见的单词越容易被掌握,越生僻的单词被掌握的可能性越小。我们以当代美语语料库(Corpus of Contemporary American English, COCA)发布的单词词频数据作为计算单词生僻程度的依据。数字越大表示单词越生僻,最大为63145。比如:单词look难度为76,abanon难度为2203,上面例题中E选项的relentlessly难度为10098。
我们通过统计GRE填空题目中每个单词的难度,可以得到如下结果: GRE填空题选项中最难的单词难度为63145,所有单词平均难度为“8963”。
对于GRE填空题而言, 考生“至少”需要认识80%的词汇 (即平均每五个选项认识四个),通过计算可得GRE填空选项词汇中难度排名为80百分位的词汇难度为“15541”;对于认识98%单词的话,对应的词汇难度为“40406”。
结论:做GRE填空题需要15541的词汇量。而GRE填空考霸需要40406的词汇量。
从上面的讨论中可看出,对于考生想要应付GRE考试至少需要的词汇量在15000左右;这意味着考试在掌握四六级6000余词汇的基础上还需要再掌握7000多词汇。