欢迎光临散文网 会员登陆 & 注册

能力水平鉴定的数学模型

2022-09-07 11:04 作者:何好的小粉丝  | 我要投稿

比如我们有一张数学考卷,总共10个题,难度分别为1-10。

假如我的能力水平为7,大于7的题我都不会做,小于7的题目我都会做。

然后V代表对,X代表错,我的答题状况是VVVVVVVXXX,V代表对,X代表错,所以我的能力水平被鉴定为7。

-----------

实际考试中,我的能力水平为7,并不意味着大于7的题我都不会做,小于7的题目我都会做,有可能有10%的难度6的题我不会做,10%的难度为8的题我会做。我的做题对错是一个概率分布,按照难度,这个概率值递减。为了概率分布计算,我们假设题目的难度也不是离散的,是0-无穷的实数,难度可以无穷大,但是能力水平最高依然只能判定为10。

那么我的能力水平到底对应哪个数学变量呢?

-----------

为了好理解,我这里换一个例子。

用英语单词举例。我的能力水平就是我所掌握的单词总数。

但很显然能力水平也可以有其它的数学量,我们按照单词的实际出现频率百分比给所有单词排序。然后把我所掌握的单词的频率百分比加起来,然后得到一个百分比值,也可以作为能力水平指标。

但是,百分比值并没有单词总数有参考价值,这是因为99%和99.9%中间可能差了几千个单词。

能力水平鉴定结果需要符合人类的直觉认知,所以我们还是使用单词总数这个指标。

-----------

如何得到能力水平鉴定结果?

我们回到最前面最简化的模型上来。

前面说我的答题状况是VVVVVVVXXX。前面7个V的期望是4,中位数也是4。后面3个X的期望是9,中位数也是9。这里我们假定期望并不适合作为能力水平鉴定结果挂钩,所以后面不考虑期望的问题,只考虑中位数。我们能不能使用4得到7这个数字呢?

我们会做的题目难度的中位数已知,求我们的能力水平。

在这个数学模型下很简单,4+(4-1),中位数加上一半的区间宽度。

同理,也可以通过“不”会做的题目难度的中位数已知,求我们的能力水平。

(题外话:9-(9-1)-1。再减1 是因为其实我们的能力水平应该取7和8的中间值,但是这里取了7,假如我们的题目难度视作连续的,也就不存在再减1的问题。)

-----------

为了容易理解,回到英语单词的模型上来。

我们知道,所有单词书都不是严格卡着单词词频取词的。

比如一本单词书是3500词,意味着有些词在词频表中超越了3500,有些则正好相反。

我们也可以把自己看作一本单词书。

这里有三个变量,分别对应7,4,9。

一个是我所掌握的单词的个数,一个是我所掌握的单词的中位数,一个是我所未掌握单词的中位数。

7是需要穷举获得的,获得的成本很高,假如模型是连续的或者数学题目是无穷多的,穷举甚至不可能实现。

文章到这里,你应该就明白本文要做什么。

我们可以通过少量统计样本,近似获得4或9,我们要通过4或9得到7!

-----------

题外话:

单词书中的单词在词频表中的分布是离散的,也是有规律的。词频高的词我们掌握的可能性很高一点,低频低的词则正好相反。

我们画一个概率分布图,横轴为词频表上第几个单词,纵轴为我们掌握该单词的概率。

对于我们人来说,这个曲线应该是一个单调递减曲线,假设这个分布服从类似于指数分布的分布吧。

单词书有的是从a开始的初阶单词书,也类似于指数分布;有的是从abandon开始的中阶单词书,类似于对数正态分布;我还有一本高阶单词书是从adalone开始的,更接近于正态分布。

-----------

回归到479的问题。

从4到7的过程中,引入了一个值,4加半个区间宽度等于7,这个区间宽度是什么?

首先VVVVVVVXXX是一个阶跃函数,阶跃函数有一个值不为0的区间,从而有区间宽度。

刚才提到三个分布,指数分布,对数正态分布,正态分布,它们并不同于阶跃函数。

于是产生一个问题,对于指数分布,对数正态分布,正态分布,它们的7是个什么东西?

单词书中往往都会提一个东西,叫你背会我这个单词书,你的单词量能达到多少多少,这个值就是7。中高阶单词书默认你已经了解了一定的单词量,如果补上这些单词,我会假设它更像偏移了Y轴的指数分布。所以主要还是要考虑指数分布。

初中高阶单词书你也可以用数学类比看作,加减乘除,解方程组,抽象代数。

刚才写到一句话,“这里我们假定期望并不适合作为能力水平鉴定结果挂钩,所以后面不考虑期望的问题,只考虑中位数”,为什么?

指数分布的期望和中位数是不同的,中位数大概是0.693倍的期望值(0.693是ln2的近似)。期望值计算过程中极端样本值会对结果影响很大,中位数处于样本50%的位置,直觉上也更加合理。

这里强调一下,前面两次提到了“直觉”,所以能力水平鉴定是一个带有感性的数值,在一件感性的事情上过度追求小数点后几位的精确是没有意义的。

-----------

7是指数分布的中位数,那4是什么?9又是什么?

首先VVVVVVVXXX是一个阶跃函数,并非指数函数。其次刚才提到一句话“如果补上这些单词,我会假设它更像偏移了Y轴的指数分布”。什么叫“偏移了Y轴的指数分布”。意思是把它看成指数分布,你的横轴起点并不是难度1,而是你默认前面难度已经完全掌握了,你从这个难度开始看作指数分布。4是阶跃模型下的概念,在指数分布的概念下,4就是7。

-----------

留一个思考题:9是不是7呢?

-----------

上面这个题目翻译一下。

就是你在你不会的单词中随机抽取一个样本,然后按词频表顺序,获得一个中位数,这个中位数能不能代表你的单词量呢?

假设你选取一本初级单词书,从其中你在你不会的单词中随机抽取一个样本,这个样本的中位数会不会和你选取一本中级单词书、和你选取一本高级单词书的中位数相等呢?

能力水平鉴定的数学模型的评论 (共 条)

分享到微博请遵守国家法律