欢迎光临散文网 会员登陆 & 注册

pandas数据处理与分析

2023-04-02 12:33 作者:破产的哔站用户  | 我要投稿

链接:https://pan.baidu.com/s/1Nw4SMnuL85nsaDSTqwU1ig?pwd=b8fq 

提取码:b8fq

编辑推荐

1.梳理pandas中常用的函数,将函数之间的逻辑关系总结为“基础知识+4类操作+4类数据”的模块结构
2.展示了数据处理的宏观体系,并针对数据分析中“怎么分析”“怎么处理”“怎么加速”3个核心问题给出解决方案。
3.结合大量代码讲解理论知识,并通过“练一练”和章末的“习题”等形式提供高质量的练习,帮助读者理解、强化和拓展所学知识。
4.不需要读者掌握数据科学或数据分析的先验知识,适合具有一定Python编程基础、想要使用pandas进行数据处理与分析的数据科学领域的从业者或研究人员阅读。

内容简介

本书以Python中的pandas库为主线,介绍各类数据处理与分析方法。
本书共包含13章,第一部分介绍NumPy和pandas的基本内容;第二部分介绍pandas库中的4类操作,包括索引、分组、变形和连接;第三部分介绍基于pandas库的4类数据,包括缺失数据、文本数据、分类数据和时间序列数据,并介绍这4类数据的处理方法;第四部分介绍数据观测、特征工程和性能优化的相关内容。本书以丰富的练习为特色,每章的最后一节为习题,同时每章包含许多即时性的练习(练一练)。读者可通过这些练习将对数据科学的宏观认识运用到实践中。

作者简介

耿远昊
威斯康星大学麦迪逊分校统计学硕士在读,Datawhale成员,“Joyful Pandas”开源项目作者。pandas贡献者,活跃于pandas开源社区,主要贡献涉及漏洞修复、功能实现与性能优化等方面,对pandas在数据处理与分析中的应用有丰富经验。

精彩书评

pandas是Python数据科学生态中一个核心的第三方库。使用pandas,我们能够快捷解决现实中各类与数据相关的问题。本书讲解了基于pandas的数据处理与分析技术,理论与实践相结合,是学习pandas很好的教程。
——张日权 华东师范大学经济与管理学部统计学院院长,教授、博士生导师

Python作为数字经济时代的编程语言之一,正成为广大有志于投身数据科学领域的青年学子学习的技术。“Joyful Pandas”是Datawhale社区的开源项目,也是pandas官方目前推荐的中文教程,本书在该教程的基础上进一步完善,强化理论与实践的结合,对Python初学者和进阶者均有裨益。
——陈海强 厦门大学王亚南经济研究院教授、博士生导师

数据分析能力正逐步成为数字化发展浪潮中学习者应具备的基本技能。本书分为“基础知识”“4类操作”“4类数据”和“进阶实战”四大部分,结合简洁易懂的代码示例,涵盖pandas的所有核心操作与特性,非常适合数据分析人员自学。
——黄鹂强 浙江大学数据科学系教授、博士生导师

这是一本非常有针对性的教程,内容丰富且结构完整,还提供了详细的示例,既可以作为进行系统学习的入门指南,也可以作为即查即用的参考手册。与传统的纯讲授式的教程不同,本书除了讲解代码,还附有许多有趣的问题与练习,启发式地引导读者自主探索编程的细节。相信本书会帮助读者从零上手并爱上编程。
——钟威 厦门大学王亚南经济研究院和经济学院统计学与数据科学系教授、博士生导师

“Joyful Pandas”教程涵盖了NumPy和pandas的基本操作、4类主要的数据操作方法(包括索引、分组、变形和连接)和4种主要的数据类型(包括缺失数据、文本数据、分类数据和时间序列数据)。每章的末尾会给出相应的习题。所有数据集和相关资料可以在GitHub的datawhalechina/joyful-pandas仓库中找到。
——pandas官方网站

目录

第 一部分 基础知识
第 1章 预备知识 2
1.1 Python基础 2
1.1.1 推导式 2
1.1.2 匿名函数 4
1.1.3 打包函数 5
1.2 NumPy基础 7
1.2.1 NumPy数组的构造 7
1.2.2 NumPy数组的变形 11
1.2.3 NumPy数组的切片 15
1.2.4 广播机制 17
1.2.5 常用函数 19
1.3 习题 24


pandas数据处理与分析的评论 (共 条)

分享到微博请遵守国家法律