高考英语大数据:究竟出现了哪些单词?大数据告诉你卷面词汇量

我们都知道高中英语3500的词汇量,但高考试卷中究竟出现了多少词汇量?我们把考试试卷中出现的词汇量称之为卷面词汇量。
我们统计了高考英语2008年-2022年,共15年的数据。以广东高考英语为例:




我们按年份统计了历年卷面词汇量,并分析了单词长度,及词缀。

一、卷面词汇量如下图:

图中可以看出,卷面词汇量总体上呈缓慢上升趋势,说明卷面涉及的词汇量增加,阅读量增加。我们前面讲过,持续的阅读是学习英语的最佳方法。个人认为,应该继续提高阅读量,降低语法知识考核。
二、单词长度分布如下图,x轴数字代表单词长度:

从图中可以看出,最长的单词为19个字母。卷面单词长度集中分布在3-7之间,单词长度超过10的非常少。
我们分析得出:单词长度超过10的,去除地名等专有名词,全部是派生词或复合词。
例如,长度为11的单词:

后面我们会告诉大家,具体单词是:recontextualization,语境重构,出现在2017年的试卷中。
三、卷面词汇量。剔除单词长度为2的单词,删除人名、地名,以及中国汉语拼音构成的单词,累计卷面词汇量3628个。



需要完整版的请关注、点赞,本文涨粉超过1000,将免费发布。
四、卷面词频。



最后,在新的一年到来之际,恭祝各位新春快乐,兔年英语一飞冲天!
