本书以Python 3.9为编程环境,从Python编程基础到扩展库,再到数据分析,逐步展开Python数据分析与可视化教学。本书首先简要介绍数据分析与可视化的相关概念,并介绍Python基础知识;然后按照数据分析的主要步骤,重点介绍与数据获取、数据处理、数据分析、数据可视化以及机器学习建模过程相关的扩展库,包括NumPy、Pandas、BeautifulSoup、sklearn、Matplotlib、seaborn、pyecharts等;最后通过股票数据量化分析和销售业客户价值数据分析两个案例实战演示Python和相关扩展库的应用,将Python数据分析和可视化知识与实用案例结合。

本书适合作为高等院校本科生“数据分析”等课程的教材,也适合作为数据分析初学者的自学用书,还适合从事数据分析相关工作的工程师和爱好者阅读。


作者

夏敏捷 

中原工学院教师,主要研究项目及领域:计算机、可视化、游戏开发等。 个人荣誉:2019年度被评为校级师德标兵,2020年度被评为校级教学名师。 出版图书: 《Python项目案例开发从入门到实战》清华大学出版社,2019年, 年销量8000册。 《Python程序设计——从基础开发到数据分析(微课版)》清华大学出版社,2020年,年销量8000册。 《Python基础入门-微课视频版》清华大学出版社,2021年,年销量5000。

查看全部
目录

内容提要

前言

第1章 数据分析与可视化概述

1.1 数据与大数据

1.2 数据分析

1.3 数据可视化

1.4 数据分析流程

1.5 Python数据分析与可视化

1.6 Jupyter Notebook的安装和使用

1.7 Py Charm的安装和使用

习题

实验一 熟悉Python开发环境

第2章 Python编程基础

2.1 Python语言简介

2.2 Python语言基本语法

2.3 Python面向对象程序设计

2.4 Python图形用户界面设计

2.5 操作常用文件

2.6 Python的第三方库

习题

实验二 基于Tkinter的GUI程序开发

第3章 科学计算NumPy库

3.1 NumPy数组的使用

3.2 NumPy中的矩阵对象

3.3 NumPy中的数据统计分析

习题

实验三 NumPy数据分析应用

第4章 Pandas统计分析基础

4.1 Pandas

4.2 Pandas统计

4.3 Pandas排序和排名

4.4 Pandas筛选和过滤

4.5 Pandas数据透视表和交叉表

4.6 Pandas数据导入导出

4.7 Pandas日期处理

4.8 Pandas数据运算

4.9 Pandas数据分析应用案例——学生成绩统计分析

习题

实验四 Pandas数据分析应用

第5章 Python爬取网页数据

5.1 HTTP与网络爬虫相关知识

5.2 urllib库

5.3 BeautifulSoup库

5.4 requests库

5.5 动态网页爬虫

5.6 Selenium实现AJAX动态加载

5.7 爬虫应用案例——Python爬取新浪国内新闻

5.8 爬虫应用案例——Python爬取豆瓣电影TOP 250

习题

实验五 Python爬取网页信息

第6章 数据处理与数据分析

6.1 数据处理

6.2 Pandas数据清理

6.3 Pandas数据集成

6.4 Pandas数据变换与数据离散化

6.5 Pandas数据分析

习题

实验六 数据处理与数据分析

第7章 sklearn构造数据分析模型

7.1 机器学习基础

7.2 机器学习库sklearn的应用

习题

实验七 sklearn机器学习应用

第8章 数据可视化

8.1 Matplotlib绘图可视化

8.2 seaborn绘图可视化

8.3 pyecharts绘图可视化

8.4 Pandas数据分析应用案例——天气数据分析和展示

8.5 数据可视化应用案例——学生成绩分布条形图展示

习题

实验八 数据可视化

第9章 案例实战——股票数据量化分析

9.1 股票数据量化分析的背景与功能

9.2 程序设计的思路

9.3 程序设计的步骤

第10章 案例实战——销售业客户价值数据分析

10.1 销售业客户价值数据分析的意义

10.2 程序设计的思路

10.3 程序设计的步骤

参考文献

查看全部
书评
查看更多
请您登录后发表评论 登录 | 注册
我的评分:
提交
0/400