机器学习--高数概率论第一章
一、微积分
1 夹逼定理
2 导数
即是曲线的斜率,是曲线变化的快慢。
路程是原始函数
一阶导数------速度
二阶导数------加速度
题目:
1 的最小值
两边同时取对数然后求导,
令t'=0带入计算求出t。
之后做最小优化时要用,基本也是求最小值
2 泰勒公式
其实多项式求解要容易一些。
都是一样计算,可以理解成无限逼近。
3 基尼指数
4 方向导数
是x轴到L的转角
5 梯度
梯度的方向是函数在该方向变化最快的方向
即:解析式z=H(x,y)的山,()的梯度变化最快
梯度下降法:
考虑自己下山方向和梯度呈夹角,下降速度是多少?
6 凹函数(二阶导数大于0)
(碗状函数)
也有:
有最小值,便于优化。
应用:最大熵模型---互相损失
证明D(p||q)?
7概率论
事件和概率没有必然关系
概率为0不代表事件就不发生
1>累计分布:
2>古典概率
n个不同球放入N(N>n)个盒子,盒子不限,求事件A={每个盒子最多有1个球}
3>生日悖论
套用上诉公式
会发现人数越多,概率越大
4>古典概率
5>装箱问题
6>和组合数关系
n个物品分成k组,每组物品个数n1,n2,n3,n4...nk,(n1+...+nk=n),
优化:物品分组:第一组m个,第二组n-m个,
7>推荐系统
惊喜度、喜爱度
A和B两个商品和用户匹配度为0.8和0.2,系统将随机为A生成一个均匀分布在0-0.8之间。B在0-0.2之间,计算B最终分数大于A的概率。

8> 概率公式
1 条件概率
在B发生条件下A发生的概率
2 全概率公式
3 贝叶斯公式
用于反推
例程:
8支枪,5支校准,3支没校准,校准射中靶概率0.8,没校准的0.3,从8支任取一把射击中靶,这把是校准的概率。
典型反推用贝叶斯,已知结果求概率
两大学派:
频率学派:假定参数是某个未知定值,求这些参数如何取值,能达到目标函数极大、极小取值
贝叶斯派:假定参数可变,服从某个分布,求这些分布下某个目标函数极大、极小
大数据:属于频率学派
9 常见分布
1 0-1分布

2 二项分布(伯努利分布)
服从参数为n,概率为p的分布
比如抛硬币
分布律
3 泊松分布
应用:机器故障、产品缺陷、细菌分布、放射性物质单位时间发射粒子数、火车客户、次数。
4 均匀分布

5 指数分布

D()
无记忆性
6 正态分布
二元正态分布

7 分布函数总结:

8 sigmoid函数
