“这就是阅读。即将新软件安装到大脑里的过程。” 就我个人而言,我从视频和在线教程中所学到的始终没有从书本中学到的多。 了解机器学习和数据科学很容易。目前有许多开放课程,你可以马上就开始学习。但是,获得更深入的学习需要额外的努力。例如:你可能会很快了解随机森林如何运作,但了解其背后的逻辑需要额外的努力。 质疑的信心来自于阅读。有些人很容易接受现状。另一方面,一些好奇的人则会反思“为什么不能这样做呢?”就是在这种情况下,人们开始尝试用新的方式完成任务。几乎每个我在美国管理协会(AMA)遇到的数据科学家,都曾在公开的采访中强调过书籍在他们生活中充当了不可取代的作用。 以下是我在过去的一年中所发现的 R 语言和 Python 相关的机器学习、数据科学书籍。阅读是一个好习惯,希望通过阅读本文,你也可以养成阅读的好习惯。祝阅读愉快! 本书适合刚开始学习 R 语言的人。学习写函数和循环可以使你用 R 实现更多功能。一些人认为,R 包可以让他们避免写函数和循环,但那并不是长久之计。本书将介绍 R 编程环境的细节,同时附有有趣的项目,如加权骰子,扑克牌,老虎机等。本书语言浅显易懂。 本书涵盖数据可视化,数据处理,预测建模等数据科学各方面内容,而且并不晦涩难懂。同时内容广泛,细节详实。强调了算法的使用标准和每个示例在 R 中的实现。本书适合倾向从实际方面理解算法的人群。 本书为帮助人们克服在数据预处理和操作中遇到的各种问题。很多时候,面对熟悉的场景,我们知道要做些什么。但是,如何完成却成为了一个巨大的挑战。这本书就很好解决了这个问题。它并没有对概念进行理论解释,而重点介绍如何在 R 中使用它们。本书涵盖了广泛的主题,如概率,统计,时间序列分析,数据预处理等。 数据可视化使人能够使用形状和颜色来表达和分析他们的发现,而不仅仅使用表格。透彻的了解图表,明确何时使用哪个图表,以及如何定制图表是数据科学家的关键技能。本书不仅仅具有理论知识,而且强调如何在 R 中构建样本数据集。同时专注使用 ggplot2 包来进行可视化。 作者之一 Max Kuhn 本身就是 caret 包的开发者。本书是理论和实践知识的完美融合。它讨论了几个关键的机器学习主题,如过拟合,特征选择,线性和非线性模型,树型方法等。并且使用 caret 包演示了所有算法。Caret 是 CRAN 库中功能强大的机器学习包之一。 统计学习导论:基于 R 应用 Introduction to Statistical Learning 作者:Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani 译者:王星 本书是最详尽统计建模的书之一。此外,它包括对线性回归,逻辑回归,树木,SVM,无监督学习等主题的深入解释。由于是导论,所以解释浅显易懂,任何新手都可以轻松学习。而且还附有练习。推荐这本书给所有使用 R 语言进行机器学习新手。 本书是“统计学习导论”的下一部分。它包含更高级的主题,因此不建议跳过上一本书直接读这本。这本书适合掌握机器学习基础知识的人。它涉及收缩方法,不同的线性回归方法,分类,内核平滑,模型选择等。对于想深入了解机器学习的人来说,这是一本必读书。 书中作者解释概念浅显易懂,令人印象深刻。本书围绕机器学习,同时涵盖了很多实践方面的知识。通过案例研究,讨论了 Bagging,Boosting,SVM,神经网络,聚类等算法。这些案例将帮助你了解这些算法。另外还阐述了机器学习参数的知识。 本书适合所有想要通过掌握 R 语言进行机器学习人。它包括(几乎)所有算法及其在 R 语言中的执行。此外,本书介绍了一些用于机器学习的 R 包,包括最近推出的 H2o 包。本书还介绍了机器学习的最新发展,因此建议每个学习 R 语言的人阅读本书。但是,不能期望从本书中学习到高级机器学习概念,如堆叠。 下一页更精彩:18本数据科学家必读的R语言和Python相关书籍
|