欢迎光临散文网 会员登陆 & 注册

生信入门书籍推荐系列一

2022-11-26 10:44 作者:生信小院  | 我要投稿


最近也分享了一些教程给大家,分享了如何用已有的流程进行分析,相信这些流程可以帮大家在干实验分析上起到一定的帮助。然而,考虑到许多读者可能是湿实验出身,没有计算机方面的知识,仅分享教程可能并不能完全达到一个理想的效果,并且读者本身可能也对计算机较为感兴趣,想在这方面深入了解。因此,这一期作为书籍推荐,分别为《鸟哥的linux私房菜》、《python学习手册》、《R语言实战》、《机器学习实战》、《深度学习》、《Lewin 基因X》。如果读者都已经读过的话,那么可以自动过滤掉余下的内容,如果没有读过的话,读者也可以根据自己的需要进行了解,。所推荐的书籍都是自己曾经翻过的,不属于那种从网上照搬的,虽然不能说一定有用,但是至少可以帮大家避雷吧!

一 书籍推荐

对于一本书的了解而言,作者说第二,那么应该很少有人说第一吧。所以下面每本书的介绍都会包含两个部分,一个是作者在书籍中的导读介绍,另一个则是本人的阅读感受。当然,本人的阅读感受不代表所有人,也不代表希望读书的你在读完这本书能够相同的阅读感受,所以还是需要大家自行判定,按需了解吧。另外,考虑到很多读者太长不看的原则,每本书的优点我也有重点标注了,大家可以快速阅读

图1 鸟哥的linux私房菜

作者导读节选:Linux的基础知识在各大主流Linux安装版本中基本相同,如账号管理、硬盘文件格式、数据管理与核心编译等。本书深入浅出地介绍了Linux操作系统的基本原理与架构,适合当前所有主流Linux版本的学习。全书共分5大篇。第1篇主要介绍Linux操作系统的规划与安装;第2篇介绍Linux的基本文件权限与系统架构;第3篇介绍非常重要的Shell与Shellscripts的基本内容,这是所有以文字界面操控主机的基础;第4篇着重介绍Linux用户管理,包括账号管理、磁盘配额与用户的例行性工作流程介绍等;第5篇注重于Linux系统管理,如套件管理员RPM与Tarball、核心的重新编译、开关机与多重启动的设定技巧、系统登录文件的分析,以及X-Window的基本设定的网络参数设定细节。

推荐理由:对笔者而言,本书堪称linux的入门书籍吧。那是刚接触linux,笔者觉得特别新奇,觉得除了windows外竟然还有第二种操作系统(原谅当时笔者的才疏学浅,那时刚刚生物信息)。而且,这个系统全是黑窗,看起来很高级的样子,但是苦于没有linux的操作经验。然而,大部分的服务器都采用的linux操作系统,如果不会,则没有办法进行数据分析,因此笔者也花了挺久把这本书啃下来了。当然,现在看起来,这本书能够提供的知识对于生信小白而言,是非常友好的,可以快速入门Linux进行数据分析。然而,笔者也认为如果能在windows条件下完成数据分析则最好,比较黑窗操作很多时间还是不够太直观。也有人说ubtuntu等许多linux系统有操作界面啊,但是这些操作系统不兼容windows下的许多软件如office(重点)等,非常影响笔者的办公效率。所以,读者开发了两个小软件Multi-omics Hammer软件和Multi-omics Visual软件,可以将一些需要linux黑窗操作的任务以windows下java软件运行的方式解决,读者可以尝试一下(顺便给笔者的软件做一个推广)。

图2 R语言实战

作者导读节选:数据时代已经到来,但数据分析、数据挖掘人才却十分短缺。由于“大数据”对每个领域的决定性影响,相对于经验和直觉,在商业、经济及其他领域中基于数据和分析去发现问题并作出科学、客观的决策越来越重要。开源软件R是世界上最流行的数据分析、统计计算及制图语言,几乎能够完成任何数据处理任务,可安装并运行于所有主流平台,为我们提供了成千上万的专业模块和实用工具,是从大数据中获取有用信息的绝佳工具。本书从解决实际问题入手,尽量跳脱统计学的理论阐述来讨论R语言及其应用,讲解清晰透澈,极具实用性。作者不仅高度概括了R语言的强大功能、展示了各种实用的统计示例,而且对于难以用传统方法分析的凌乱、不完整和非正态的数据也给出了完备的处理方法。通读本书,你将全面掌握使用R语言进行数据分析、数据挖掘的技巧,并领略大量探索和展示数据的图形功能,从而更加高效地进行分析与沟通。想要成为倍受高科技企业追捧的、炙手可热的数据分析师吗?想要科学分析数据并正确决策吗?不妨从本书开始,挑战大数据,用R开始炫酷的数据统计与分析吧!

推荐理由:对笔者而言,本书是笔者接触的第二个编程语言(第一个为perl,大家应该都懂)。当时就很惊讶于R语言的生态环境。众多的统计学家提供了各种各样的分析和绘图供大家直接调用,包括但不限于edgeR、Deseq、wgcnag、ggplot等等。也正是因为这些包,使得R语言在生物信息中的作用越来越大,以至于不懂R,可能在许多生信流程中都会变得异常困难。因此,对于想要入门生物信息的读者而言,学习R或许会是一个非常不错的开头。

图3 python学习手册

作者导读节选:如果你想动手编写高效、高质量并且很容易与其他语言和工具集成的代码,本书将快速地帮助你利用Python提高效率。本书基于Python专家的流程培训课程编写,内容通俗易懂。本书包含很多注释的例子和插图,以帮助你开始使用Python2.7和3.3。每章都包含关于Python语言的重要组成部分的一节课。

推荐理由:对笔者而言,本书堪称python学习的入门书籍吧,当时应该也是零零散散花了一个月的时间去阅读吧。可能是因为笔者在学习python前曾自学过R、java和perl,所以本书并没有什么难度,只能是说作为其他语言编程习惯的一个更改吧,所以说当时读完基本就能快速上手了。

图4 机器学习

作者导读节选:机器学习是计算机科学与人工智能的重要分支领域. 本书作为该领域的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面。为了使尽可能多的读者通过本书对机器学习有所了解, 作者试图尽可能少地使用数学知识. 然而, 少量的概率、统计、代数、优化、逻辑知识似乎不可避免. 因此, 本书更适合大学三年级以上的理工科本科生和研究生, 以及具有类似背景的对机器学习感兴趣的人士. 为方便读者, 本书附录给出了一些相关数学基础知识简介.

推荐理由:机器学习应该是当下生物信息方面比较火的一个方向吧。先如今许多算法的设计都绕不开这个话题。对于想要彻底入门生信的读者而言,这本书应该还是能够起到非常重要的作用的。这本书有许多的数学公式,比较难以理解,建议没有数学背景的读者第一遍先从整体进行了解,忽略数学公式。随后等到自己的经验和数学功底渐渐起来之后再去理解书中的公式。

图5 深度学习

作者导读节选:《深度学习》由全球知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是深度学习领域奠基性的经典教材。全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是深度学习的预备知识;第2部分系统深入地讲解现今已成熟的深度学习方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是深度学习未来的研究重点。《深度学习》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充深度学习知识,以便在实际产品或平台中应用的软件工程师。

推荐理由:深度学习应该是当下生物信息方面比较火的一个方向吧。近些年,大家应该都被AlphaGo、AlphaFold和AlphaCode刷屏过吧。其实,这些技术的实现背后都有深度学习的影子。不过这些技术对于非科班出身的笔者而言,也过于艰涩难懂。然而,读者或许可以通过阅读其中的一些章节,对深度学习的现状有一个基本的了解。

图6 Lewin的基因X

作者导读节选:《Lewin 基因X(中文版)》对分子生物学和分子遗传学进行了精彩的论述,内容涵盖了基因的结构、序列、组织和表达。21位科学家编写和修正了其各自领域的相关内容,使得本书成为相关领域当今最新颖、全面的参考书。其中大部分修订和重新编排是基于Lewin的《基因精要》第二版,并在内容上额外增加了一些新的章节,结构也进行了一些调整,使得全书各个主题在排列上更加富有逻辑性。许多章节也重新命名,以便更好地体现它们包含的内容

推荐理由:生物信息,生物信息,光会计算机怎么能算生物信息呢。所以这里就推荐了一本生物学的书籍。相信很多人应该和笔者是一样的,无论是在学习当中还是在实验过程中(不错,笔者在整个求学生涯的大部分时间都是一个湿实验人员),常常处于一种似懂非懂的情形。虽然是生物学出身,但是对于很多信息的了解也都是支离破碎的,特别是读了研究生和博士之后,感觉知识体系愈加的破碎,因此想要寻找一本书可以将整个系统建立起来。幸运的是,这本书就来到了笔者眼前。笔者在读完这本书之后的确能够将之前学习到的许多知识点串联起来,构建完整的知识体系。

二 惯例小结

虽然,读文献做实验也能够获得许多知识,但是这些知识都非常的零散。而一本书实际上是将一个方向的知识进行整合以方便大众学习,这种方式可以快速将我们已有的零散知识进行整理,或许能够在较短时间内完成一个明显的提升(因人而异)。笔者在上面所提到的书籍都是在生信开发过程中给了笔者非常多的助益,即使在笔者自身也觉得其中许多知识并未完全的消化的情况下。不过,这不是也正说明这些书的价值吗?

本公众号开发的相关软件,Multi-omics Hammer软件和Multi-omics Visual软件欢迎大家使用。文末是本公众号在其他平台的账户,也欢迎大家关注并多提意见。

简书:WJ的生信小院

公众号:生信小院

博客园:生信小院

最后,也欢迎各位大佬能够在本平台上:1传播和讲解自己发表的论文;2:发表对某一科研领域的看法;3:想要达成的合作或者相应的招聘信息;4:展示自己以寻找博后工作或者博士就读的机会;5:博导提供博后工作或者博士攻读机会,都可以后台给笔者留言。希望本平台在进行生信知识分享的同时,能够成为生信分析者的交流平台,能够实现相应的利益互补和双赢(不一定能实现,但是梦想总得是有的吧)。

另外,怎么说呢,投币也可,不强求,但奢求。


生信入门书籍推荐系列一的评论 (共 条)

分享到微博请遵守国家法律