/3

大数据教材

1、《Python编程基础》

本书以任务式为导向,全面地介绍了Python编程基础及其知识的应用,讲解了如何利用Python的知识解决部分实际问题。全书共7章,第1章介绍了学习Python的准备工作,包括Python的由来与发展、Python环境搭建、编辑器介绍与安装等,第2-5章和第7章主要介绍Python的基础语法、数据类型与结构、程序控制流、函数和文件基础等内容。第6章讲解Python面向对象编程。本书的每个章节都包含了实训与课后练习,通过练习和操作实践,帮助读者巩固所学的内容。

 

Python编程基础.jpg

2、《Python数据分析与应用》

本书以任务为导向,全面地介绍数据分析的流程和Python数据分析库的应用,详细讲解利用Python解决企业实际问题的方法。全书共9章,第1章介绍了数据分析的基本概念和流程;第2~6章介绍Python数据分析的常用库及其应用,涵盖NumPy数值计算、Matplotlib数据可视化、pandas统计分析、pandas数据预处理、scikit-learn构建模型,较为全面地阐述Python数据分析方法;第7~9章结合之前所学的数据分析技术,进行企业综合案例数据分析。本书每一章都包含了实训与课后习题,通过练习和操作实践,帮助读者巩固所学的内容。

 

Python数据分析与应用.jpg

3、《Hadoop大数据开发基础》

本书是对Hadoop大数据技术从入门到应用的简明系统教程,包括Hadoop基本原理与架构、集群安装配置、MadReduce编程、完整项目案例等精选内容。涉及的知识点简要精到,实践操作性强,使用本书能有效指导读者对Hadoop大数据技术的学习理解及开发应用。本书采用了以任务为导向的教学模式,按照解决实际任务的工作路线,逐步展开学习相关的理论知识点,推导生成可行的解决方案,最后实现任务。全书紧扣任务需求展开,不堆积知识点,有助于读者对大数据技术真正的理解与消化。

 

Hadoop大数据开发基础.jpg

4、《Spark大数据技术与应用》

本书是定位于Spark大数据技术从入门到应用的简明系统教程,主要包括Spark基本原理与架构、集群安装配置、Scala与Spark编程、Spark代表组件,完整项目案例等精选内容。涉及的知识点简要精到,实践操作性强,使用本书能有效指导读者对Spark大数据技术的学习理解及开发应用。

    本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开学习相关的理论知识点,推导生成可行的解决方案,最后落实在任务实现环节。全书大部分章节紧扣任务需求展开,不堆积知识点,着重于解决思路的启发与解决方案的实施。通过从任务需求到实现这一完整工作流程的体验,有助于读者对Spark大数据技术真正的理解与掌握。

Spark大数据技术与应用.jpg

5、《Pythn网络爬虫技术》

本书以任务为导向,较为全面地介绍了Python在静态网页、动态网页、深层网页、PC客户端、APP中爬取数据。全书共7章,第1章介绍了爬虫与反爬虫的基本概念,以及Python爬虫环境的配置;第2章介绍了爬虫过程中涉及到的网页前端基础;第3章介绍了静态网页爬取数据的过程;第4章介绍了动态网页爬取数据的过程;第5章介绍了模拟登录深层网页的方法;第6章介绍了爬取PC客户端、APP的数据的方法;第7章介绍了使用Scrapy爬虫框架爬取数据的过程。本书所有章节都包含了实训与课后习题,通过练习和操作实战,帮助读者巩固所学的内容。

Python网络爬虫技术.png

6、《大数据数学基础》基于Python和R语言

本书全面地讲解了在科学领域广泛运用的数据微积分、统计学、线性代数、数值计算、应用多元统计分析等数学基础知识。全书共6章:第1章介绍了大数据与数学、数学与R的关系;第2章介绍了微积分的基础,包括极限、导数、微分、不定积分与定积分及其应用;第3章介绍了线性代数的基础,包括行列式、矩阵的运算、特征分解、奇异值分解;第4章介绍了统计学的基础,包括数据分布特征、概率论、随机变量的数字特征、参数估计、假设检验;第5章介绍了数值计算的基础,包括插值方法、函数逼近与拟合、非线性方程(组)求根;第6章介绍了常用的多元统计分析方法,包括回归分析、聚类分析、判别分析、主成分分析、因子分析和典型相关分析。几乎所有例子都结合R语言进行求解分析。本书所有章节都有课后习题,以帮助读者巩固所学的内容。

大数据数学基础.jpg