人工智能入门必读的16本数据科学书籍

文末抽200元当当购书券!!!
数据科学(data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。AI的范围很大,数据科学的几乎所有知识点都包含在里边。
如今,对于大多数(不是全部)企业来说,数据科学应用已成为必然。因此,人才们也选择往这方面发展,也有很多其他相关专业的人想要提高数据科学的相关知识。
学姐在想要学习一个新的知识的时候首先就是会去找书,但是要挑选出数据科学领域最著名的书籍,非常耗时耗力。所以学姐就整理了16本数据科学领域的著名书籍给大家,不用大家再费时间去筛选了。
PS:下面文章中推荐的书籍中英文书名都有写出来,大家可以根据自己的需求去搜索,部分书的封面图学姐没有中文版所以放的是原版封面。
01 Practical Statistics for Data Scientists
作者:Peter Bruce, Andrew Bruce, Peter Gedeck
《面向数据科学家的实用统计学》

这本书是绝对初学者的理想读物,它涵盖了所有必要概念的基本概述,以深入到数据科学领域。
本书包含了学习探索性数据分析的概念,随机抽样,回归分析,分类技术,统计机器学习方法等知识。除了理论概念外,它还包括R和Python编程语言中的代码示例。这本书只是让你熟悉数据科学,而不是深入钻研。
除此之外,您还可以找到其他资源,这些资源将引导您理解数据科学中的一些更高级的主题。总之,对于数据科学初学者来说,这是一个很好的资源。
豆瓣评价

02 Introduction to Machine Learning with Python
作者:Andreas C. Muller, Sarah Guido
《Python机器学习入门》

对于想要开始数据科学学习的人来说,这本书是一个理想的选择。本书种的说明性的例子,清晰地解释了数据科学和机器学习的基本概念。这本书最好的地方在于,读者不需要任何数据科学、机器学习和Python的先验知识。
本书包含机器学习的基本概念和应用,模型评估的高级技术,数据的表示,管道的概念,提高你的数据科学和机器学习技能的建议,以及更多的东西。适合初学者哦!
豆瓣评价

03 Business Data Science
作者:Matt Taddy
《商业数据科学》

这本书的作者是亚马逊科学(Amazon Science)的博士马特·塔迪(Matt Taddy),这本书中他关注的是数据科学的商业视角。
本书涵盖了影响真实业务环境的主题,包含理论和适当的编码练习,帮助读者从它获得有用的见解。在业务领域应用我们的知识可能是具有挑战性的,因为模型在理论上会做出不同类型的假设,当它们应用于实践时,有时我们会看到比在纸上展示的结果更令人惊讶的结果。
有人说这本书太浅了,可是这本来就是给初学者入门学者看得浅显易懂的书呀!
04 Introduction to Probability
作者:Joseph K. Blitzstein, Jessica Hwang
《概率论导论》

《概率论》从著名的哈佛统计学讲座发展而来,为理解统计、随机性和不确定性提供了必要的语言和工具,这本书或许是学习概率的最佳书籍。
这本书适合初学者因为它从基本概念开始,并通过它的方式通过概率的核心概念,将帮助读者在数据科学领域建立坚实的基础。
这本书中有直观的解释,例子,图表和实践问题。本书的每一章都以R编程语言的相关代码示例结束。在新版本中,他们包括了在线补充,包括交互式可视化和动画。50年来,这本书一直是最受欢迎的书之一,这也是为什么它一定要放在你的书架上的另一个原因。
豆瓣评价

05 Data Science from Scratch
作者:Joel Grus
《数据科学入门》

读了这本书之后大家能够了解到有多少最基本的数据科学工具和算法是通过从头开始实现它们来工作的。
如果你有很强的数学天赋和一些必要的编程技能,这本书会帮助你快速的进入数据科学的核心。网上也有许多书籍,但是你想从零开始学习数据科学,并提高你在这个领域的知识,那么这本书是必读的。
这本书的主题是统计的基础知识,清理和操作数据,深入到机器学习算法的基础知识,机器学习算法的实现,探索自然语言处理,推荐系统,网络分析,以及更多。如果你数据科学学起来比较艰难,那么这本书很适合你。
豆瓣评价

06 Naked Statistics
作者:Charles Wheelan
《赤裸裸的统计学》

这本书写了很多关于统计概念如何在现实世界中应用的真实例子。语气诙谐,作者用不深入的理论但是又很有说服力的例子来帮助你理解一些复杂的统计概念。
这本书从统计学的基本概念开始,如正态分布,中心极限定理,然后继续到复杂的现实世界问题,相关的数据分析和机器学习。值得一提的是这本书会让你在理解统计概念时开怀大笑。
豆瓣评价

07 Python for Data Analysis
作者:Wes McKinney
《利用Python进行数据分析》

如果你有一些数据科学概念的基础知识,这本书是另一本很好的读物。本书涵盖了几乎所有的数据分析方法以及python编程语言的基础知识。
本书涵盖使用Ipython shell和jupyter notebook进行探索性数据分析、NumPy 的基本和高级功能、使用 Pandas 进行数据分析、如何获得干净的数据、使用 matplotlib 进行可视化、使用 Pandas 汇总数据、时间序列分析等等。
简而言之,我们可以说作者让您完全了解作为数据科学家的工作应该做什么。总体来说这本书内容全面,易于阅读。
豆瓣评价

08 Hands-on Machine Learning with Scikit-Learn and TensorFlow
作者:Aurélien Géron
《机器学习实战》

这本书可能是数据科学和机器学习领域里最好的书之一,书中又非常丰富的知识。不论是初学者还是已经工作多年的人都能从利用这本书对这个领域有更深入的了解。
这本书的理论都有强大的例子来支撑,本书的主要内容包括:神经网络,机器学习项目的scikit-learn,机器学习的训练模型,构建和训练神经网络的TensorFlow等等。
读完这本书后,你将能够更深入地学习深度学习并解决工作中学习中遇到的问题。
豆瓣评价

09 Head First Statistics
作者:Dawn Griffiths
《深入浅出统计学》

就像headfirst的其他书一样,这本书是对话的方式,所以不会读几页就感到无聊。这本书通过提供引人入胜和发人深省的材料,还有现实生活的例子,把典型的枯燥的案例变的生动。
这本书从描述性统计的主题开始——平均、中位数、模态、标准偏差、方差——然后转移到推论统计,如相关性、回归等。它还包括一个完整的解释正态分布,二项分布,泊松分布,几何概率分布。
这本书里面有大量的图片和图形,使内容便于理解。
豆瓣评价

10 Pattern Recognition and Machine Learning
作者:Christopher M. Bishop
《模式识别与机器学习》

如果你已经读过一些关于数据科学的书,并且熟悉许多机器学习算法,并且你想进一步提高你在这个领域的技能,那么这本书就是为你准备的。
这本书深入探讨了机器学习算法和数学。这本书包括熟悉线性和多元微积分,概率分布,和强大的编程语言基础。如果你已经熟悉机器学习和数据科学,这可能是最好的一本书。
豆瓣评价

11 Inflection Point
作者:Scott Stawski
《拐点》

本书副标题为 “How the Convergence of Cloud, Mobility, Apps and Data Will Shape the Future of Business(云、移动性、应用程序和数据的融合如何影响行业的未来)
如果你想了解数据科学在现实生活中的实际应用,那么这本书非常适合。本书从数据科学的技术角度出发,重点关注数据科学的业务角度。
如果你真的想更深入地进入数据科学领域并想知道所有这些东西是如何结合在一起的,这本书是必读的,因为它包含了作者的经验,展示了数据科学在现实生活中的实际运作方式。
12 The Art of Statistics:How to Learn from Data
作者:David Spiegelhalter
《统计的艺术:如何从数据中学习》

《统计的艺术:如何从数据中学习》由大卫·斯皮格尔哈尔特 (David Spiegelhalter) 撰写,被许多人称为“统计思维的权威指南”。
在这本书中,Spiegelhalter深入研究并展示了如何使用原始数据解决现实世界的问题,重点放在数学概念和联系上。这本书是数据科学之旅的一个极好的补充,这本书教我们如何像统计学家一样思考,并使用我们从数据中得到的答案来解决现实世界的问题。
豆瓣评价

外网免费电子版书籍
01 Think Bayes
作者:Allen B. Downey

贝叶斯是用计算方法介绍贝叶斯统计的。如果你已经回了Python编程,并对概率也有所了解,那就可以开始学习贝叶斯统计了。
通过这本书,可以学习到如何用Python代码而不是数学符号来解决统计问题,并使用离散概率分布而不是连续数学。
当你解决了数学问题,贝叶斯基础将变得更加透明,就可以用书中的技术去解决工作中的问题。
豆瓣评价

免费阅读链接:
https://greenteapress.com/wp/think-bayes/
02 Python for Data Science Handbook
作者:Jake VanderPlas
《Python 数据科学手册》

如果你熟悉数据科学概念的基础知识,这本书能将你的数据科学技能提升到一个新台阶。本书中对数据分析的Python库以及代码示例有详尽解释。总之看这本书你会学到很多关于python库的知识。
豆瓣评价

免费阅读链接:
https://github.com/jakevdp/PythonDataScienceHandbook
03 The Elements of Statistical Learning
作者:Trevor Hastie, Robert Tibshirani, and Jerome Friedman
《统计学习的要素》

Elements of Statistical Learning这本书涵盖了大量关于数据挖掘、推理和预测的高质量教育信息。
这本书由著名的斯坦福大学教授 Trevor Hastie、Robert Tibshirani 和 Jerome Friedman 撰写,讲述了数据科学在过去十年中如何成为包括医学、生物学、金融、营销等不同领域的需求。
虽然有点广泛,但能教大家许多技术,从监督学习到无监督学习,帮助大家理解数据科学处理实际用例。
豆瓣评价:

免费阅读链接:
https://web.stanford.edu/~hastie/ElemStatLearn/
04 An Introduction to Statistical Learning
作者:Gareth James, Daniela Witten, Trevor Hastie, and Robert Tibshirani
《统计学习导论》

统计学习导论对于没有强大数学背景的人来说是一个极好的选择。它展示了对R统计学习方法的介绍,对于数据科学家来说是非常宝贵的资源。
本书对于希望使用尖端技术解决复杂数据问题的统计和非统计从业人员提供全面且可访问的资源。你只需掌握线性回归就能充分利用这本书的知识。
豆瓣评价

免费阅读链接:
http://faculty.marshall.usc.edu/gareth-james/ISL/
👇👇👇学姐发福利了👇👇👇
惊喜1:关注公众号,回复“抽奖”即可参与

奖品如下

惊喜2:部分书籍的PDF版公众号回复“惊喜2”即可获取到!