拉勾数据分析私教班学习笔记
数理统计基础:
抽样估计基础 —— 随机事件
随机现象:重复性、明确性、随机性,需要大量的重复的随机实验。
样本空间(Ω):随机现象的一切可能的组合的集合。
随机事件:样本空间的一个子集,也就是在样本空间里满足一些前提的某些结果的集合。
随机事件的概率
是随机事件出现的可能性的度量。
事件A的概率是P(A),事件A与B同时发生的概率是P(AB)。
条件概率:在事件B已发生的条件下,事件A发生的概率P(A│B)=P(AB)/P(B)。
在条件概率中,随着条件的增加,事件A的条件概率也在增加。
相互独立事件:P(A)=P(A│B)即说明A关于B是独立的。
概念延伸:有回放抽样(独立),无回放抽样(非独立)。
随机变量及其概率分布
随机变量(大写字母):表示随机现象结果的变量。
常见的做法是把刻画试验结果的数值直接定义成随机变量的取值,例如寿命、产量、次数等。
离散型随机变量、连续型随机变量
随机变量的概率分布:知道了随机变量所有值的可能性(分布),就找到了随机试验的规律性。
离散随机变量的分布:每一个取值的概率在0与1之间,所有取值的概率之和是1。
连续随机变量的分布:用概率密度函数来表示;可以从直方图做出概率密度曲线(纵轴会由频率变成概率)。
概率密度曲线与x轴所夹面积为1,求随机事件的概率变成求某个区间关于概率密度曲线的积分。
随机变量的数学特征
随机变量的数学期望:变量值按概率的加权平均,也就是所有变量值乘以对应的概率再全部相加。
表示为E(X)
随机变量的数学期望表征的是概率分布的中心位置。
方差Var(X)大,随机变量的取值分布宽;方差小,取值分布窄。
方差的平方根是标准差STD。
对于相互独立的随机变量,方差可相加,标准差不能相加。