收起左侧

[数据分析] 7月在线数据挖掘课程

121
回复
  [复制链接]

450

主题

635

回帖

4万

积分
发表于 2017-7-6 02:45:10 | 显示全部楼层 |阅读模式
6月数据挖掘课程7月在线
2016年

数据挖掘班大纲讨论稿(由浅入深、从基础入门到海量数据挖掘/处理,稳步推进)
1、数据挖掘基础入门:数据科学与数学基础知识
内容:数据挖掘基础,微积分、概率论、线性代数基础
实践:用numpy进行矩阵运算

2、数据处理/分析与可视化
内容:数据获取、数据格式、数据内容处理与分析、数据的可视化
实践:用python解析和清洗数据,pandas统计与分析数据,matplotlib和seaborn等做可视化

3、海量数据的分布式处理
内容:hadoop,Spark介绍,Map Reduce数据处理,hive与常见数据统计分析
实践:map reduce计数,文件关联与特征mapping,hiveql统计示例

4、数据上的关联规则
内容:数据关联分析,海量数据的关联分析方案,A-Priori与PCY算法
实践:小型商业服务中的在线认证企业资料挖掘,人群背景与身份关联挖掘

5、数据与聚类
内容:聚类与社区发现算法,深度剖析Kmeans等算法
实践:Spark MLlib下的K-Means算法与GraphX下的Label-Propagation算法实践

6、海量数据索引与近似最近邻
内容:海量数据检索问题,近似最近邻(ANN)常用算法:LSH、KD-Tree、Kmeans-Tree
实践:海量图像数据与最近图片检索

7、数据分类与排序
内容:有监督学习与分类,LR、SVM、深度神经网络与分类排序问题,样本高效训练
实践:kaggle分类问题、海量数据下电商的CTR预估问题

8、海量数据与推荐系统
内容:基于内容的推荐算法,协同过滤,隐因子模型
实践:基于用户/商品的协同过滤推荐,隐因子模型电影推荐

9、海量高维数据与维度约减
内容:数据降维与SVD,CUR分解
实践:SVD与PCA在推荐系统与数据压缩应用

10、海量网页搜索与PageRank
内容:海量数据构成的图关联分析,PageRank与网页搜索
实践:PageRank在图关联数据上的应用与排序

下载地址:00Echo00
游客,如果您要查看本帖隐藏内容请回复

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
IT教程吧走一走,高薪迟早有!

0

主题

14

回帖

398

积分

发表于 2017-7-10 20:34:57 | 显示全部楼层
谢谢分享

0

主题

0

回帖

198

积分

发表于 2017-9-1 21:23:11 | 显示全部楼层
看一看,瞅一瞅

9

主题

8

回帖

141

积分
发表于 2017-9-1 22:17:49 | 显示全部楼层
谢谢!学习了!

0

主题

3

回帖

2

积分

发表于 2017-10-2 22:20:10 | 显示全部楼层
不能下载,还天天让恢复,有意思呢

2

主题

209

回帖

4878

积分
发表于 2017-10-4 22:48:56 | 显示全部楼层
学习学习

1

主题

276

回帖

6347

积分
发表于 2017-10-11 22:46:54 | 显示全部楼层
66666666666666666

2

主题

11

回帖

164

积分
发表于 2017-11-22 22:38:52 | 显示全部楼层
ihsk

2

主题

111

回帖

199

积分
发表于 2017-11-27 15:17:19 | 显示全部楼层
感谢楼主分享

0

主题

0

回帖

64

积分

发表于 2017-12-7 20:55:57 | 显示全部楼层
是培训班的教程吗 ,我想要一个系统性的教程
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则