第1章 Python数据分析基础 ……………………………………………………… 1
1.1 认识数据分析 ………………………………………………………………… 1
1.2 数据分析的应用场景 ………………………………………………………… 2
1.3 数据分析常用统计学知识 …………………………………………………… 5
1.4 数据分析方法 ………………………………………………………………… 5
1.5 数据分析流程 ………………………………………………………………… 10
1.6 数据分析的工具 ……………………………………………………………… 12
1.7 Python的 Anaconda发行版的下载与配置 ……………………………… 12
1.8 Pycharm安装与 Anaconda相关联 ………………………………………… 18
1.9 JupyterNotebook的基本功能介绍 ………………………………………… 22
小 结 ………………………………………………………………………………… 28
第2章 NumPy数值计算基础……………………………………………………… 31
2.1 NumPy模块介绍 …………………………………………………………… 31
2.2 NumPy数组对象ndarray…………………………………………………… 34
2.3 NumPy矩阵与通用函数 …………………………………………………… 54
2.4 利用 NumPy进行统计分析 ………………………………………………… 61
小 结 ………………………………………………………………………………… 76
第3章 pandas数据分析基础 ……………………………………………………… 79
3.1 Series数据及常用操作 ……………………………………………………… 79
3.2 DataFrame数据及常用操作 ………………………………………………… 87
3.3 pandas的索引 ………………………………………………………………… 98
3.4 层级索引……………………………………………………………………… 104
3.5 pandas数据结构之间的运算 ……………………………………………… 111
3.6 pandas函数的应用 ………………………………………………………… 114
3.7 pandas可视化 ……………………………………………………………… 122
3.8 pandas可视化简单应用小示例———2018年幸福大数据 …… 127
小 结 ……………………………………………………………………………… 131
第4章 外部数据的读取与存储 ………………………………………………… 132
4.1 文本数据的读取与存储 …………………………………………………… 132
4.2 JSON和Excel数据的读取与存储………………………………………… 140
4.3 数据库的读取与存储 ……………………………………………………… 146
小 结 ……………………………………………………………………………… 151
第5章 数据清洗与整理 …………………………………………………………… 153
5.1 数据清洗……………………………………………………………………… 153
5.2 数据合并和重塑 …………………………………………………………… 170
5.3 标准化数据…………………………………………………………………… 178
5.4 字符串处理…………………………………………………………………… 182
5.5 综合示例-泰坦尼克号的生还者数据 …………………………………… 188
小 结 ……………………………………………………………………………… 196
第6章 数据分组与聚合 …………………………………………………………… 198
6.1 数据分组……………………………………………………………………… 198
6.2 聚合运算 (聚合、过滤和变换) ………………………………………… 202
6.3 数据透视表…………………………………………………………………… 215
6.4 综合实例……………………………………………………………………… 220
小 结 ……………………………………………………………………………… 227
第7章 数据可视化基础 …………………………………………………………… 229
7.1 Matplotlib模块介绍………………………………………………………… 229
7.2 利用散点图和折线图分析特征间的关系 ………………………………… 236
7.3 利用直方图、饼图和箱线图分析特征内部数据 …………………… 239
7.4 seaborn数据可视化 ………………………………………………………… 251
小 结 ……………………………………………………………………………… 265
第8章 利用机器学习sklearn构建模型与实现 ……………………………… 267
8.1 认识机器学习 ……………………………………………………………… 267
8.2 sklearn库的简介、安装 …………………………………………………… 269
8.3 使用sklearn转换器处理数据的方法 …………………………………… 270
8.4 构建并评价聚类模型 ……………………………………………………… 273
8.5 构建并评价分类模型 ……………………………………………………… 278
8.6 构建并评价回归模型 ……………………………………………………… 280
8.7 神经网络……………………………………………………………………… 282
8.8 支持向量机…………………………………………………………………… 286
8.9 综合示例……………………………………………………………………… 287
小 结 ……………………………………………………………………………… 300
第9章 客户价值分析 ……………………………………………………………… 301
9.1 K-means算法 ……………………………………………………………… 301
9.2 使用K-means算法进行客户分类 ………………………………………… 306
小 结 ……………………………………………………………………………… 311
第10章 在线产品数据分析 ……………………………………………………… 312
10.1 案例背景 …………………………………………………………………… 312
10.2 案例目标及实现思路 ……………………………………………………… 312
10.3 具体分析过程 ……………………………………………………………… 313
小 结 ……………………………………………………………………………… 328
第11章 文本情感分析 …………………………………………………………… 329
11.1 情感分析基本概述 ………………………………………………………… 329
11.2 情感分析的应用 …………………………………………………………… 331
11.3 文本情感分析方法 ………………………………………………………… 332
小 结 ……………………………………………………………………………… 351
参考答案 ………………………………………………………………………………… 352
参考文献 ………………………………………………………………………………… 356