资源名称:数据科学导论 Python语言实现 完整pdf
第1章 新手上路1
1.1 数据科学与Python简介1
1.2 Python的安装2
1.2.1 Python 2还是Python 33
1.2.2 分步安装3
1.2.3 Python核心工具包一瞥4
1.2.4 工具包的安装7
1.2.5 工具包升级9
1.3 科学计算发行版9
1.3.1 Anaconda10
1.3.2 Enthought Canopy10
1.3.3 PythonXY10
1.3.4 WinPython10
1.4 IPython简介10
1.4.1 IPython Notebook12
1.4.2 本书使用的数据集和代码18
1.5 小结25
第2章 数据改写26
2.1 数据科学过程26
2.2 使用pandas进行数据加载与预处理27
2.2.1 数据快捷加载27
2.2.2 处理问题数据30
2.2.3 处理大数据集32
2.2.4 访问其他数据格式36
2.2.5 数据预处理37
2.2.6 数据选择39
2.3 使用分类数据和文本数据41
2.4 使用NumPy进行数据处理49
2.4.1 NumPy中的N维数组49
2.4.2 NumPy ndarray对象基础50
2.5 创建NumPy数组50
2.5.1 从列表到一维数组50
2.5.2 控制内存大小51
2.5.3 异构列表52
2.5.4 从列表到多维数组53
2.5.5 改变数组大小54
2.5.6 利用NumPy函数生成数组56
2.5.7 直接从文件中获得数组57
2.5.8 从pandas提取数据57
2.6 NumPy快速操作和计算58
2.6.1 矩阵运算60
2.6.2 NumPy数组切片和索引61
2.6.3 NumPy数组堆叠63
2.7 小结65
第3章 数据科学流程66
3.1 EDA简介66
3.2 特征创建70
3.3 维数约简72
3.3.1 协方差矩阵72
3.3.2 主成分分析73
3.3.3 一种用于大数据的PCA变型—Randomized PCA76
3.3.4 潜在因素分析77
3.3.5 线性判别分析77
3.3.6 潜在语义分析78
3.3.7 独立成分分析78
3.3.8 核主成分分析78
3.3.9 受限玻耳兹曼机80
3.4 异常检测和处理81
3.4.1 单变量异常检测82
3.4.2 EllipticEnvelope83
3.4.3 OneClassSVM87
3.5 评分函数90
3.5.1 多标号分类90
3.5.2 二值分类92
3.5.3 回归93
资源截图:
常见问题FAQ
- 免费下载或者VIP会员专享资源能否直接商用?
- 本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
- 提示下载完但解压或打开不了?
- 找不到素材资源介绍文章里的示例图片?
- 站壳网