【最后十课】概率统计-扫盲式全面复习!2023高考冲刺!第6讲

个人向笔记
我宣布我超超超爱神奇小猪老师!!!

给个目录(Index)总结一下:
概率基础公式:简单事件概率用古典概型(数数的时候有时用排列组合,或者是直接暴力穷举)、复杂事件概率用分类分布加法乘法。
条件概率注意审清题意理解事件关系,还有全概率公式,贝叶斯公式。
概率与分布列还有他们的期望与方差,以及他们的二级结论。
分布列和常见分布:
三大分布:
二项分布:取n次,每次有相同概率,注意根据题意辨析。英文是伯努利表示为B。期望方差
超几何分布:较为简单,容易理解,但是要注意其与二项分布的题目,有时是分辨这两个差别,有时是把这两个合起来计算。期望方差
正态分布:表示为N,只要注意他的期望方差以及图像就好了。
还有概率最值的计算,一个是连续型数据,还有离散型数据。
统计基础知识扫盲:
数据的抽取:有分层随机抽样(按比例)跟随机抽样:有抓阉型,还有随机数法。
数据的分析:有频率直方图,利用它求平均数,中位数。
还有未给图的,叫你求平均数中位数众数方差。
线性回归分析:注意线性相关系数,线性回归方程,非线性回归方程。他们的公式以及要推的二级结论式子。
还有他们得出的式子的拟合程度的计算;有用残差的以及决定系数。
独立性检验直接根据公式算就完了。

古典概型

排列不可取,组合为正道。排一排零都可以,当分母,数相同。两原则不可忘,相邻就捆绑,非相邻就插空。古典概型分母分子一比即得答案。

质数已知,互质不知道,那么也可互质,就是没有一之外的公约数。
七个取两当分母,暴力穷举找分子。

注意题型小分类简单也有复杂的。


这就是较为复杂的题目分类与分布之间的综合。
像这种比赛获胜的就要特别注意了,4比1获胜说明比了五场,最后一场一定要甲赢。
太可恶了,这种题居然真的叫我要分四类。那就分四类呗,一算就完了。
条件概率


公式给我酷酷(平声)记得。

纯用公式计算法

啊哈,第二小题是我的知识盲区。
看出要是事件a跟事件b,然后再用条件概率公式给他表达出来。注意在求事件a的概率时,记得分类!



要注意题目两个字眼,一个是放回,还有一个结束条件:直到什么为止也就是说,最后一步应放什么颜色的球。
既有分类又有分布,这本来就是一种全概率。

如果你用古典概型算的话,你就算不尽,所以用概率相乘的方式。然后分位置第三个位置肯定是红球,然后第一跟第二个位置任选一个的放红球再进行进一步的分类。

这个就是上次一个大题分类说的数列概率题,这种就是马尔科夫赌徒模型。利用递推的方法来算。

概率与分布列


期望内平方减去期望外平方。公式好处可以避免一些复杂的平方运算。
期望内平方:先将对应的随机变量,通通平方再求它的期望。(没有期望对应的简记口诀哦)不要与方差的口诀混起来哦。

期望跟方差的口诀。

呜呜呜,这题要把我卡住了,我差点点就真的要去算了。
对期望来说,太难算就可以直接蒙,但是方差呢,可以巧妙运用到x+y=5,这个式子得到x跟y的关系式,利用刚刚的二级结论即可马上解出。说他考的难吧,他考的都是基本的知识点,说他考的简单吧,可是我都看不出来。😐
三大分布
二项分布超几何分布正态分布

二项分布的要点在于n次独立重复实验。



这一题乍看过去不简单,但是只要牢牢抓住二项分布的核心概念,就可以求了,只要画出一个图示,就可以很好的理解。
他虽然不能直接看过去就是二项分布,但是他的某一部分包含着二项分布。

呜呜呜,小猪老师讲的实在是太好了,他分类分类也太清楚了。
该类最值问题,一个是离散型,就是运用数列的方法。这种题目说是条件概率的计算,其实内核里还是二项式的计算。
另外一个就是连续型,连续型一般用求导。遇到这么大次数的方程,不用怕,直接提公因式就好。妈妈再也不用担心我到底用导数还是数列了(这两种题都见过,但是还没有太理解进去)

特别要注意的是,超几何分布的期望值与方差。方差的公式难背就算了

超几何分布与二项分布的混合考法

第二小题中将抽样样本中使用新药治愈该病毒感染的频率视作概率,这是使用二项分布,而不是超几何分布,因为这一批病人的人数实在是太庞大了,抽取三个人,他的概率不变。
(感谢小朱老师帮我回顾知识点,我都要忘了,不再提醒一下,我就要踩坑了)😘😘

关于图像的理解。均值就看u,注意方差,我们主观上认为图形变化越大的方差就越大,但是注意这个纵轴可不是x,这个是表示聚集程度。之前一哥推导是给我们这个函数,告诉我们方差越小,它的图形越凸。但是小猪老师这个好像更好理解,数据越聚集他的方差自然就小了嘛。

一般利用题目给出的三个数据,加上这个图像的对称性,就可以算它各部分的面积了。

互斥与对立可以直接用语文的阅读理解来得出,但是对于独立的话,要通过算。



啊,随机数法果然忘记掉了,要注意小朱老师所说的要点,从哪开始?例如这道题是从随机数第五列跟第六列开始,从7816数到15,15题为第一个数字。
第二,不在范围内的,或者是重复的要去除,例如这题数到63跟97都大于30也要去除,重复的一个15不要。

分层抽样

频率直方图求平均数:取每个方格里的中心数在像求期望那样求。
求中位数:找到一条x=a的线,那条线恰好能将这个频率直方图分成面积相等的两半。

注意百分数


因为极端值对平均数的影响远大于对中位数的影响,所以在图像中,平均时的那条线总会向较为极端的那一端靠近。


一,首先通过图像来判断它的线性相关系数的强弱。
学会线性相关系数的关系式,首先系数一般用小r来表示。
其次是公式的记忆,分子是每个数的和减去平均值乘以小n,分母是每个数的平方,减去n乘以平均数的平方的开根,再乘以同样操作的y
第三线性相关系数的取值范围,它的绝对值越接近一说明线性相关程度越强。如果说它的绝对值大于0.75的话,就可以直接判定它的线性相关系数较强。


但他们的线性相关系数为零的时候,只能说明他们之间的关系不为直线,但不排除他们为其他的曲线或者其他关系。



残差注意注意注意是真实值减去预测值。
决定系数是用r表示哦,决定系数越高,它的拟合效果越好。决定系数要计算个残差平方和。

哎呦,遇见非线性直线方程不用怕,你可以用换元就可以把它换成线性回归方程辣!

あはははははははははは
やっと見終わった
