机器学习和数据分析密不可分,除了网课,一些优质图书也肯定能帮到你的忙,今天推荐10本技术图书,都是非常实用且有帮助的,多读读多看看,肯定获益匪浅。 机器学习和数据分析是一对复杂且相互关联的概念。为了跟上潮流,你需要做足准备,花时间研究并且更新知识。即使日复一日地在这个行业工作,仍然有可能落后于当前的趋势。 为了不落人后,最好的方式是继续刷新自己的知识,同时保持上手的经验。在这行业中要取得成功,需要完美的项目经验和技能组合。尽管网上有大量的资源,我们仍要专门推荐一些好的实体书籍。 1 Machine Learning Yearning By 吴恩达 由现代数据,大数据和数据科学开发并生产出的机器学习系统已经不是什么秘密。虽然它们不一定是同义词,但却是互相关联的,因此如果你在数据行业工作,那么提高对机器学习的理解和认识是个好的选择。 在本书中你可以学到一些洞察能力,例如你应该多长时间收集一次训练数据集,如何使用端到端的深度学习,以及如何利用你正在创建的系统来共享数据和统计信息。 目前市面上绝大部分机器学习的书侧重于模型理论与证明推导,鲜有涉及工程产品实践,然而在工作中,这往往是重点与难点。这本书是Ng在机器学习工程实践中的经验总结,非常实用且独一无二的一本书,短小精悍但干货十足,强烈推荐给从事数据领域的团队与个人。 2 Hadoop:权威指南 by Tom White Apache Hadoop是用于处理和管理大量数据的主要框架。任何从事编程或数据科学工作的人都有必要熟悉这个平台。事实上,这是开发可扩展系统最有效的方法之一。 作为Hadoop顾问和Apache软件基金会成员,Tom White写的这本标准指南,包罗了作者的个人见解和一些有用的资源,并能引导你完成Hadoop的设置并且过一遍整体流程。 Apache Spark是你可能需要花时间学习的另一个重要平台。 《Hadoop权威指南》是Hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行Hadoop集群。 3 预测分析 By Eric Siegel 本书帮助专业人员更好地了解他们的受众,详细解释了如何获取多种形式的数据和信息,并将其转化为可实施的预测或见解的方法。你将学会如何识别他们购买的产品和服务,访问的地点,与他们产生共鸣的内容等等。 众所周知,数据科学家的工作是查看未经过滤的原始数据,并发现可用的趋势和模式。本书不仅可以帮助你做到这一点,而且还提出必要的预测算法来改进未来的操作和流程,可以算是预测分析的圣经。 4 用数据讲故事 By Kole Nussbaumer Knaflic 《用数据讲故事:商业专业人士的数据可视化指南》 是业内的重要读物,甚至对与商业不怎么相关的人士也极为重要。为什么呢? 本书通过大量案例研究介绍数据可视化的基础知识,以及如何利用数据创造出吸引人的、信息量大的、有说服力的故事,进而达到有效沟通的目的。具体内容包括:如何充分理解上下文,如何选择合适的图表,如何消除杂乱,如何聚焦受众的视线,如何像设计师一样思考,以及如何用数据讲故事。 5 大拐点 By Scott Stawski 本书对于了解当前数据分析和云计算行业的发展势头十分有帮助。特别值得注意的是,Stawski主要关注原始数据存储和挖掘系统、如何部署以及在现实世界中的使用情况。 它不仅是一个理论指南,还揭示了实际的工作系统,并且提到如何把相应模式套用到你的企业或公司。更重要的一点是,你可以从本书中清楚了解如何在组织内部署这些工具和平台。 6 统计学习导论 基于R应用 By Gareth James等人 本书概述了统计学习领域,提供了理解大数据和复杂数据必不可少的工具,这些数据来自近20年来生物学、金融学、市场营销学和天体物理学等领域。书中介绍了一些最重要的建模方法和预测技术,以及它们的相关应用。内容涉及线性回归、分类、再抽样方法、压缩方法、基于树的方法和聚类等,用彩图和实例来阐释相关方法。因为本教材的主要目标是方便自然科学、工业和其他领域的从业者使用统计学习技术,所以每章都有在R中实现所介绍的分析方法的指导内容。 本书只假定读者先修《线性回归》课程,并不要求读者具有矩阵代数知识。读者对象是那些希望利用前沿的统计学习技术来分析数据的人士,既包括统计学专业的师生,也包括非统计学专业的人员。 下一页更精彩:12本大数据高分必读书籍,收好为头脑充充电
|