欢迎光临散文网 会员登陆 & 注册

如何用Python进行数据分析?除了动物书外,这二十张表也能帮到你

2023-03-14 19:44 作者:程序员小万  | 我要投稿

前言:

在选择数据分析入门的经典书籍时,有这么几本书不能不说,在国内也有非常好的口碑。

他们分别是《用Python进行数据分析第一版》


《用Python进行数据分析第二版》


(至于我为什么要把两个版次的同一本书都提及,这里给大家提个醒,有些无良厂家喜欢把两本捆绑起来卖,但是所讲述的内容大差不差,属实没必要,大家买纸质书时要格外注意。)

耗子书的作者 Wes McKinney 就是 pandas 库的主要作者,但这本书的结构并不是围绕着 pandas 库而展开的——不然就直接去看 pandas 文档好了。

这本书的结构超越了某个库或者某个语言,最核心的部分是以数据分析的工作流展开的,从数据载入、数据清洗、数据规整到数据可视化、数据建模。这种结构对于不熟悉数据分析工作流的读者是非常有帮助的。

《Python数据科学手册》


《Python数据科学手册》这本书的结构非常扁平,就 5 章。第 1 章着重介绍了作者偏爱的 IPython 的各种用法,然后 NumPy, pandas, matplotlib 各一章,第 5 章是机器学习。整体是以知识逻辑去组织的。

配套资源

而在看完以上的书籍后,面对Python基础、导入数据、Jupyter Notebook、Numpy基础、Matplotlib绘图、Pandas基础和进阶、Scikit-Learn、Keras等具体操作的知识时,经常很容易忘记

在学习函数时,也总是会有很多函数学得很快,遗忘得也很快。但其实在学习中,我们并不需要很深层次的理解,只需要知道相关参数,加以调整就够了。

这里分享一份由DataCamp大佬整理的Python科学速查表,就可以帮你解决以上的问题。当你在练习的时候,能够让你迅速地找到对应的函数,很方便的掌握Python。

(中文版由“呆鸟的Python数据分析”翻译,感谢大佬)

一、python基础、数据的导入



二、数据科学计算

Numpy是Python数据科学计算的核心库,提供了高性能的多维数组对象及处理数组的工具。


Matplotlib是Python的二维绘图库


Pandas是基于Numpy创建的Python库


三、机器学习和深度学习方面

Scikit-learn通过统一的界面实现机器学习、预处理、交叉验证及可视化算法。


Keras是强大、易用的深度学习库,基于Theano和TensorFlow提供了高阶神经网络API,用于开发和评估深度学习模型。


根据文件的不同,我把它们分成了两个版本:

英文版


中文翻译版:


一共二十余份的内容再加一份Python的语法速查表,足以让你的学习生涯变得轻松几分。


以上的文档已经准备好了,领取方式如下:


如何用Python进行数据分析?除了动物书外,这二十张表也能帮到你的评论 (共 条)

分享到微博请遵守国家法律