欢迎光临散文网 会员登陆 & 注册

python中的copula:Frank、Clayton和Gumbel copula模型估计与可视化|附代码数据

2023-01-05 00:11 作者:拓端tecdat  | 我要投稿

全文下载链接:http://tecdat.cn/?p=23646

最近我们被客户要求撰写关于copula的研究报告,包括一些图形和统计输出。

你可能会问,为什么是copulas?我们指的是数学上的概念。简单地说,copulas是具有均匀边缘分布的联合分布函数 。

最重要的是,它们允许你将依赖关系与边缘分布分开研究。有时你对边缘分布的信息比对数据集的联合函数的信息更多,而copulas允许你建立关于依赖关系的 "假设 "情景。copulas可以通过将一个联合分布拟合到均匀分布的边缘分布上而得到,这个边缘分布是通过对你感兴趣的变量的cdf进行量化转换而得到的。 

这篇文章是关于Python的(有numpy、scipy、scikit-learn、StatsModels和其他你能在Anaconda找到的好东西),但是R对于统计学来说是非常棒的。我重复一遍,R对统计学来说是非常棒的。如果你是认真从事统计工作的,不管你是否喜欢R,你至少应该看看它,看看有哪些包可以帮助你。很有可能,有人已经建立了你所需要的东西。 而且你可以从python中使用R(需要一些设置)。

说了这么多关于R的好处,我们还是要发一篇关于如何在python中使用一个特定的数学工具的文章。因为虽然R很牛,但python确实有令人难以置信的灵活性,可以用来处理其他事务。

这篇文章中即将出现的大部分内容都会用Jupyter Notebooks来构建。

软件

我很惊讶,scikit-learn或scipy中没有明确的copula包的实现。

2D数据的Frank、Clayton和Gumbel copula

测试

第一个样本(x)是从一个β分布中产生的,(y)是从一个对数正态中产生的。β分布的支持度是有限的,而对数正态的右侧支持度是无穷大的。对数的一个有趣的属性。两个边缘分布都被转换到了单位范围。

我们对样本x和y拟合了三个族(Frank, Clayton, Gumbel)的copulas,然后从拟合的copulas中提取了一些样本,并将采样输出与原始样本绘制在一起,以观察它们之间的比较。

    #等同于ppf,但直接从数据中构建     sortedvar=np.sort(var)         #绘制    for index,family in enumerate(['Frank', 'clayton', 'gumbel']):             #获得伪观测值            u,v = copula_f.generate_uv(howmany)         #画出伪观测值        axs[index][0].scatter(u,v,marker='o',alpha=0.7)            plt.show()#总样本与伪观测值的对比sz=300loc=0.0 #对大多数分布来说是需要的sc=0.5y=lognorm.rvs(sc,loc=loc, size=sz)

独立(不相关)数据

我们将从β分布中抽取(x)的样本,从对数正态中抽取(y)的样本。这些样本是伪独立的(我们知道,如果你用计算机来抽取样本,就不会有真正的独立,但好在是合理的独立)。

#不相关的数据:一个β值(x)和一个对数正态(y)。a0.45#2. #alphab=0.25#5. #beta#画出不相关的x和y plt.plot(t, beta.pdf(t,a,b), lw=5, alpha=0.6, label='x:beta')#绘制由不相关的x和y建立的共线性图title='来自不相关数据的共线性 x: beta, alpha {} beta {}, y: lognormal, mu {}, sigma dPlot(title,x,y,pseudoobs)


 


相依性(相关)数据

自变量将是一个对数正态(y),变量(x)取决于(y),关系如下。初始值为1(独立)。然后,对于每一个点i, 如果 

, 那么 

, 其中c是从1的分数列表中统一选择的,否则, 

.

#相关数据:一个对数正态(y)。#画出相关数据 np.linspace(0, lognorm.ppf(0.99, sc), sz) plt.plot(t, gkxx.pdf(t), lw=5, alpha=0.6,




拟合copula参数

没有内置的方法来计算archimedean copulas的参数,也没有椭圆elliptic copulas的方法。但是可以自己实现。选择将一些参数拟合到一个scipy分布上,然后在一些样本上使用该函数的CDF方法,或者用一个经验CDF工作。这两种方法在笔记本中都有实现。

点击标题查阅相关内容

R语言实现 COPULA 算法建模相依性案例分析

左右滑动查看更多

01

02

03

04

因此,你必须自己写代码来为archimedean获取参数,将变量转化为统一的边缘分布,并对copula进行实际操作。它是相当灵活的。

#用于拟合copula参数的方法 # === Frank参数拟合    """     对这个函数的优化将给出参数      """   #一阶debye函数的积分值    int_debye = lambda t: t/(npexp(t)-1.)     debye = lambda alphaquad(int_debye ,                                 alpha                               )[0]/alpha     diff = (1.-kTau)/4.0-(debye(-alpha)-1.)/alpha#================#clayton 参数方法def Clayton(kTau):     try:         return 2.*kTau/(1.-kTau)  #Gumbel参数方法def Gumbel(kTau):     try:         return 1./(1.-kTau)#================#copula生成    #得到协方差矩阵P    #x1=norm.ppf(x,loc=0,scale=1)    #y1=norm.ppf(y,loc=0,scale=1)    #return norm.cdf((x1,y1),loc=0,scale=P)#================#copula绘图    fig = pylab.figure()     ax = Axes3D(fig)         ax.text2D(0.050.95, label, transform=ax.transAxes)         ax.set_xlabel('X: {}'.format(xlabel))         ax.set_ylabel('Y: {}'.format(ylabel))     #sample是一个来自U,V的索引列表。这样,我们就不会绘制整个copula曲线。    if plot:            print "绘制copula {}的样本".format(copulaName)         returnable[copulaName]=copulapoints         if plot:             zeFigure=plot3d(U[样本],V[样本],copulapoints[样本], label=copulaName,

生成一些输入数据

在这个例子中,我们使用的是与之前相同的分布,探索copula 。如果你想把这段代码改编成你自己的真实数据。

t = np.linspace(0, lognorm.ppf(0.99, sc), sz)#从一些df中抽取一些样本X=beta.rvs(a,b,size=sz)Y=lognorm.rvs(sc,size=sz)#通过对样本中的数值应用CDF来实现边缘分布U=beta.cdf(X,a,b)V=lognorm.cdf(Y,sc)#画出它们直观地检查独立性plt.scatter(U,V,marker='o',alpha=0.7) plt.show()


可视化Copulas

没有直接的构造函数用于高斯或t_Copulas_,可以为椭圆_Copulas_(Elliptic Copulas)建立一个更通用的函数。

Samples=700#选择用于抽样的copula指数np.random.choice(range(len(U)),Samples) Plot(U,V)


<IPython.core.display.Javascript object>



Frechét-Höffding边界可视化

根据定理,我们将copula画在一起,得到了Frechét-Höffding边界。

#建立边界为copula的区域plot_trisurf(U[样本],V[样本],copula['min'][样本],           c='red'#上限plot_trisurf(U[样本],V[样本],copula['max'][样本],            c='green'#下限


点击文末 “阅读原文”

获取全文完整资料。

本文选自《python中的copula:Frank、Clayton和Gumbel copula模型估计与可视化》。

点击标题查阅往期内容

R语言和Python对copula模型Gaussian、t、Clayton 和Gumbel族可视化理论概念和文献计量使用情况
R语言ARMA GARCH COPULA模型拟合股票收益率时间序列和模拟可视化
ARMA-GARCH-COPULA模型和金融时间序列案例
时间序列分析:ARIMA GARCH模型分析股票价格数据
GJR-GARCH和GARCH波动率预测普尔指数时间序列和Mincer Zarnowitz回归、DM检验、JB检验
【视频】时间序列分析:ARIMA-ARCH / GARCH模型分析股票价格
时间序列GARCH模型分析股市波动率
PYTHON用GARCH、离散随机波动率模型DSV模拟估计股票收益时间序列与蒙特卡洛可视化
极值理论 EVT、POT超阈值、GARCH 模型分析股票指数VaR、条件CVaR:多元化投资组合预测风险测度分析
Garch波动率预测的区制转移交易策略
金融时间序列模型ARIMA 和GARCH 在股票市场预测应用
时间序列分析模型:ARIMA-ARCH / GARCH模型分析股票价格
R语言风险价值:ARIMA,GARCH,Delta-normal法滚动估计VaR(Value at Risk)和回测分析股票数据
R语言GARCH建模常用软件包比较、拟合标准普尔SP 500指数波动率时间序列和预测可视化
Python金融时间序列模型ARIMA 和GARCH 在股票市场预测应用
MATLAB用GARCH模型对股票市场收益率时间序列波动的拟合与预测R语言GARCH-DCC模型和DCC(MVT)建模估计
Python 用ARIMA、GARCH模型预测分析股票市场收益率时间序列
R语言中的时间序列分析模型:ARIMA-ARCH / GARCH模型分析股票价格
R语言ARIMA-GARCH波动率模型预测股票市场苹果公司日收益率时间序列
Python使用GARCH,EGARCH,GJR-GARCH模型和蒙特卡洛模拟进行股价预测
R语言时间序列GARCH模型分析股市波动率
R语言ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测
matlab实现MCMC的马尔可夫转换ARMA - GARCH模型估计
Python使用GARCH,EGARCH,GJR-GARCH模型和蒙特卡洛模拟进行股价预测
使用R语言对S&P500股票指数进行ARIMA + GARCH交易策略
R语言用多元ARMA,GARCH ,EWMA, ETS,随机波动率SV模型对金融时间序列数据建模
R语言股票市场指数:ARMA-GARCH模型和对数收益率数据探索性分析
R语言多元Copula GARCH 模型时间序列预测
R语言使用多元AR-GARCH模型衡量市场风险
R语言中的时间序列分析模型:ARIMA-ARCH / GARCH模型分析股票价格
R语言用Garch模型和回归模型对股票价格分析
GARCH(1,1),MA以及历史模拟法的VaR比较
matlab估计arma garch 条件均值和方差模型R语言POT超阈值模型和极值理论EVT分析


python中的copula:Frank、Clayton和Gumbel copula模型估计与可视化|附代码数据的评论 (共 条)

分享到微博请遵守国家法律