- 《统计自然语言处理基础》第二章(必读),作者:Christopher D. Manning; Hinrich Schütz
- 《深度学习》第一章至第四章(推荐)
公开的参考资料在lectures目录下,其他不能公开的资料在Google Team Drive里面。
课程参考《Python数据分析与挖掘实战》设计,相当于对原书内容的整理和补充,另外将代码调整为python3可以运行的版本。希望大家支持正版,购买原书!
- Day 1: 介绍数据分析、数据探索与数据挖掘,并重点让大家了解数据探索,以及动手实验和作业。
- Day 2: 介绍数据预处理的要点与方法,以及动手实验和作业。
- Day 3: 介绍预测性分析的方法和要点,以及动手实验和作业。
- Day 4: 介绍聚类分析的方法和要点,以及动手实验和作业。
- Day 5: 介绍关联规则挖掘的方法和要点,以及动手实验和作业。
- Day 6: 介绍时间序列分析的方法和要点,以及动手实验和作业。
- Day 7: 介绍生存分析的方法和要点,以及动手实验和作业。
- Day 8: 基于电商产品评论数据情感分析。
- Day 9: 针对销售目标的任务分配优化。
- 大作业:
- 通过汽车之家的评论数据分析主要车型在市场上的情况。
每位同学把作业写在每次课的目录(day$N/assignment)下,assignment目录已经被添加到.gitignore里面了,所以作业不会提交到git仓库。
ls day1/assignment
assignment.ipynb
重点笔记: day1/note.md
课后补充阅读:
- 《Anomaly Detection: A Survey》
课后补充阅读:
- 《Summarization - Compressing Data into an Informative Representation》
课后补充阅读:
- 《Feature Selection》