欢迎光临散文网 会员登陆 & 注册

拉勾数据分析私教班学习笔记

2023-05-07 15:16 作者:抽抽一生恋  | 我要投稿

数理统计基础:

抽样估计基础 —— 随机事件

随机现象:重复性、明确性、随机性,需要大量的重复的随机实验。

样本空间(Ω):随机现象的一切可能的组合的集合。

随机事件:样本空间的一个子集,也就是在样本空间里满足一些前提的某些结果的集合。

随机事件的概率

是随机事件出现的可能性的度量。

事件A的概率是P(A),事件A与B同时发生的概率是P(AB)。

条件概率:在事件B已发生的条件下,事件A发生的概率P(A│B)=P(AB)/P(B)。

在条件概率中,随着条件的增加,事件A的条件概率也在增加。

相互独立事件:P(A)=P(A│B)即说明A关于B是独立的。

概念延伸:有回放抽样(独立),无回放抽样(非独立)。

 随机变量及其概率分布

随机变量(大写字母):表示随机现象结果的变量。

常见的做法是把刻画试验结果的数值直接定义成随机变量的取值,例如寿命、产量、次数等。

离散型随机变量、连续型随机变量

随机变量的概率分布:知道了随机变量所有值的可能性(分布),就找到了随机试验的规律性。

离散随机变量的分布:每一个取值的概率在0与1之间,所有取值的概率之和是1。

连续随机变量的分布:用概率密度函数来表示;可以从直方图做出概率密度曲线(纵轴会由频率变成概率)。

概率密度曲线与x轴所夹面积为1,求随机事件的概率变成求某个区间关于概率密度曲线的积分。

随机变量的数学特征

随机变量的数学期望:变量值按概率的加权平均,也就是所有变量值乘以对应的概率再全部相加。

表示为E(X)

随机变量的数学期望表征的是概率分布的中心位置。

方差Var(X)大,随机变量的取值分布宽;方差小,取值分布窄。

方差的平方根是标准差STD。

对于相互独立的随机变量,方差可相加,标准差不能相加。


拉勾数据分析私教班学习笔记的评论 (共 条)

分享到微博请遵守国家法律