本书以Python 3.9为编程环境,从Python编程基础到扩展库,再到数据分析,逐步展开Python数据分析与可视化教学。本书首先简要介绍数据分析与可视化的相关概念,并介绍Python基础知识;然后按照数据分析的主要步骤,重点介绍与数据获取、数据处理、数据分析、数据可视化以及机器学习建模过程相关的扩展库,包括NumPy、Pandas、BeautifulSoup、sklearn、Matplotlib、seaborn、pyecharts等;最后通过股票数据量化分析和销售业客户价值数据分析两个案例实战演示Python和相关扩展库的应用,将Python数据分析和可视化知识与实用案例结合。
本书适合作为高等院校本科生“数据分析”等课程的教材,也适合作为数据分析初学者的自学用书,还适合从事数据分析相关工作的工程师和爱好者阅读。
内容提要
前言
第1章 数据分析与可视化概述
1.1 数据与大数据
1.2 数据分析
1.3 数据可视化
1.4 数据分析流程
1.5 Python数据分析与可视化
1.6 Jupyter Notebook的安装和使用
1.7 Py Charm的安装和使用
习题
实验一 熟悉Python开发环境
第2章 Python编程基础
2.1 Python语言简介
2.2 Python语言基本语法
2.3 Python面向对象程序设计
2.4 Python图形用户界面设计
2.5 操作常用文件
2.6 Python的第三方库
习题
实验二 基于Tkinter的GUI程序开发
第3章 科学计算NumPy库
3.1 NumPy数组的使用
3.2 NumPy中的矩阵对象
3.3 NumPy中的数据统计分析
习题
实验三 NumPy数据分析应用
第4章 Pandas统计分析基础
4.1 Pandas
4.2 Pandas统计
4.3 Pandas排序和排名
4.4 Pandas筛选和过滤
4.5 Pandas数据透视表和交叉表
4.6 Pandas数据导入导出
4.7 Pandas日期处理
4.8 Pandas数据运算
4.9 Pandas数据分析应用案例——学生成绩统计分析
习题
实验四 Pandas数据分析应用
第5章 Python爬取网页数据
5.1 HTTP与网络爬虫相关知识
5.2 urllib库
5.3 BeautifulSoup库
5.4 requests库
5.5 动态网页爬虫
5.6 Selenium实现AJAX动态加载
5.7 爬虫应用案例——Python爬取新浪国内新闻
5.8 爬虫应用案例——Python爬取豆瓣电影TOP 250
习题
实验五 Python爬取网页信息
第6章 数据处理与数据分析
6.1 数据处理
6.2 Pandas数据清理
6.3 Pandas数据集成
6.4 Pandas数据变换与数据离散化
6.5 Pandas数据分析
习题
实验六 数据处理与数据分析
第7章 sklearn构造数据分析模型
7.1 机器学习基础
7.2 机器学习库sklearn的应用
习题
实验七 sklearn机器学习应用
第8章 数据可视化
8.1 Matplotlib绘图可视化
8.2 seaborn绘图可视化
8.3 pyecharts绘图可视化
8.4 Pandas数据分析应用案例——天气数据分析和展示
8.5 数据可视化应用案例——学生成绩分布条形图展示
习题
实验八 数据可视化
第9章 案例实战——股票数据量化分析
9.1 股票数据量化分析的背景与功能
9.2 程序设计的思路
9.3 程序设计的步骤
第10章 案例实战——销售业客户价值数据分析
10.1 销售业客户价值数据分析的意义
10.2 程序设计的思路
10.3 程序设计的步骤
参考文献

