欢迎光临散文网 会员登陆 & 注册

如何用Python对数据进行相关性分析

2023-01-08 23:01 作者:梦醒南天  | 我要投稿

1. 简介

        数据相关性分析,有助于我们理解数据之间的关系。例如,我们在对股票涨跌进行预测时,就需要了解哪个参数和涨跌是关系密切的,以及哪些参数是无关紧要的。关系密切的参数,我们要时刻关注,而无关紧要的参数我们要及时剔除,以免干扰我们的正常分析。

        在本文中,我们将介绍使用 python 对数据进行相关性分析的方法,希望对大家有所帮助。欢迎在评论区讨论和交流。

        备注:这里默认大家都安装好 Python 以及相关的工具包了。python 版本号:3.9.5 (tags/v3.9.5:0a7dcbd, May  3 2021, 17:27:52)

2. 导入相关依赖包

3. 从 CSV 文件读取数据

在对数据进行相关性分析之前,我们得先准备好待分析的数据。我已经事先将数据放到 CVS 文件中了,这里我们只需要将其读取出来即可。大家根据自己的情况读取数据。

从下图代码的运行结果可以看到,我这批数据总共有 20 个参数(其中 1 个表示股票的实际涨跌,另外19个是用于分析预测涨跌的相关参数)和 6884 条数据样本。

4. 获取数据的相关系数

前面我们已经把数据从文件中读取出来了,这里直接调用 corr 函数计算他们之间的相关系数即可。

5. 对数据的相关系数进行可视化输出

前面我们获取到的相关系数,通过文本的形式打印输出,看着不是很直观。所以,这里我们可以通过图像的方式将其进行可视化输出,以方便我们观察和分析。

上图就是我们计算出来的,表示 19 个参数与股票涨跌之间的相互关系。结论就是:没啥关系,哈哈。革命尚未成功,同志还需努力。路漫漫其修远兮,吾将上下而求索。

6. 结语

以上就是使用 python 来对数据进行相关性分析的方法了,如果觉得还不错的话,可以点个赞哦,感谢各位的支持。

如何用Python对数据进行相关性分析的评论 (共 条)

分享到微博请遵守国家法律