第1章 Python数据分析基础 1
1.1 认识数据分析 1
1.2 数据分析的应用场景 2
1.3 数据分析常用统计学知识 5
1.4 数据分析方法 5
1.5 数据分析流程 10
1.6 数据分析的工具 12
1.7 Python的 Anaconda发行版的下载与配置 12
1.8 Pycharm安装与 Anaconda相关联 18
1.9 JupyterNotebook的基本功能介绍 22
小 结 28
第2章 NumPy数值计算基础 31
2.1 NumPy模块介绍 31
2.2 NumPy数组对象ndarray 34
2.3 NumPy矩阵与通用函数 54
2.4 利用 NumPy进行统计分析 61
小 结 76
第3章 pandas数据分析基础 79
3.1 Series数据及常用操作 79
3.2 DataFrame数据及常用操作 87
3.3 pandas的索引 98
3.4 层级索引 104
3.5 pandas数据结构之间的运算 111
3.6 pandas函数的应用 114
3.7 pandas可视化 122
3.8 pandas可视化简单应用小示例———2018年幸福大数据 127
小 结 131
第4章 外部数据的读取与存储 132
4.1 文本数据的读取与存储 132
4.2 JSON和Excel数据的读取与存储 140
4.3 数据库的读取与存储 146
小 结 151
第5章 数据清洗与整理 153
5.1 数据清洗 153
5.2 数据合并和重塑 170
5.3 标准化数据 178
5.4 字符串处理 182
5.5 综合示例-泰坦尼克号的生还者数据 188
小 结 196
第6章 数据分组与聚合 198
6.1 数据分组 198
6.2 聚合运算 (聚合、过滤和变换) 202
6.3 数据透视表 215
6.4 综合实例 220
小 结 227
第7章 数据可视化基础 229
7.1 Matplotlib模块介绍 229
7.2 利用散点图和折线图分析特征间的关系 236
7.3 利用直方图、饼图和箱线图分析特征内部数据 239
7.4 seaborn数据可视化 251
小 结 265
第8章 利用机器学习sklearn构建模型与实现 267
8.1 认识机器学习 267
8.2 sklearn库的简介、安装 269
8.3 使用sklearn转换器处理数据的方法 270
8.4 构建并评价聚类模型 273
8.5 构建并评价分类模型 278
8.6 构建并评价回归模型 280
8.7 神经网络 282
8.8 支持向量机 286
8.9 综合示例 287
小 结 300
第9章 客户价值分析 301
9.1 K-means算法 301
9.2 使用K-means算法进行客户分类 306
小 结 311
第10章 在线产品数据分析 312
10.1 案例背景 312
10.2 案例目标及实现思路 312
10.3 具体分析过程 313
小 结 328
第11章 文本情感分析 329
11.1 情感分析基本概述 329
11.2 情感分析的应用 331
11.3 文本情感分析方法 332
小 结 351
参考答案 352
参考文献 356