wmn7 / ML_Practice Public

Notifications You must be signed in to change notification settings
Fork 147
Star 231

ML Records in 1110 Lab of BUPT. Some detailed information can be referenced on: https://mathpretty.com/10388.html

231 stars 147 forks Branches Tags Activity

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 143 Commits
2019_03_17		2019_03_17
2019_03_24		2019_03_24
2019_04_14		2019_04_14
2019_04_21		2019_04_21
2019_04_29		2019_04_29
2019_05_27		2019_05_27
2019_06_03		2019_06_03
2019_06_10		2019_06_10
2019_06_17		2019_06_17
2019_06_24		2019_06_24
2019_07_01		2019_07_01
2019_07_08		2019_07_08
2019_07_15		2019_07_15
2019_08_12		2019_08_12
2019_08_26		2019_08_26
2019_09_09		2019_09_09
2019_11_18		2019_11_18
2019_12_16		2019_12_16
2020_04_06		2020_04_06
2020_06_29		2020_06_29
2020_08_03		2020_08_03
2020_09_07		2020_09_07
2021_07_12		2021_07_12
Attention-mechanisms-and-transformers		Attention-mechanisms-and-transformers
CURL		CURL
Reinforcement_Learning		Reinforcement_Learning
Vision_Transformer		Vision_Transformer
tools		tools
.gitattributes		.gitattributes
.gitignore		.gitignore
LICENSE		LICENSE
readme.md		readme.md
wordcloud.jpg		wordcloud.jpg
wordcloud_mask.jpg		wordcloud_mask.jpg

Repository files navigation

目录

简单说明:

这里会记录一些我平时所学的和平时所做的实验，尽量所有的都以 Jupyter Notebook 的形式上传，看起来更加方便。
我建议可以按照这篇文章机器学习文章总结来进行看。基本这里每一个代码我都有相应的文章进行介绍。
(我最初的想法是这里记录原始的, 或是精简过的 Jupyter Notebook, 详细的说明在文艺数学君上进行说明. 想看代码再来这个仓库进行查看)

Tools

Python生成词云
Python生成字符画
Python生成马赛克图片

2019_03_17

PyTorch 实现简单分类
PyTorch 实现CNN, Dogs vs. Cats
Pytorch 维度的理解
PyTorch 对交叉熵的理解(CrossEntropy)

2019_03_24

模型可视化-Netron
残差网络举例, 使用 Pytorch 训练-验证-测试Resnet50
论文介绍 : Decision-based boundary attack

2019_04_14

正则化技术的介绍
交叉检验技术的介绍(CV)

2019_04_21

Pytorch 在 MNIST 实现分类(简单演示)
Pytorch 在 MNIST 实现分类(动态增加层数,便于之后调试)

2019_04_29

PyTorch 实现逻辑回归
包含逻辑回归的 PPT 和代码实现和使用的数据

2019_05_27

CNN 的介绍
Convolution的一些可解释性
deep dream的实现

2019_06_03

Image Style Transform(图片的风格迁移)
CNN_MNIST 可视化

2019_06_10

Fizz Buzz in Pytorch
CLASSIFYING NAMES WITH A CHARACTER-LEVEL RNN
时间序列分析(使用RNN完成时间序列预测)

2019_06_17

Seq2Seq - translation (一个简单的 Seq2Seq 的模型，用来实现英文与法文的翻译。)
Seq2Seq with Attention (加上 Attention 的 Seq2Seq 模型。)

2019_06_24

Emotion RNN(使用RNN完成简单的情感分类)
Word Embedding(简单实现Skip-gram算法)

2019_07_08

关于更多模型解释的内容, 查看文章: 模型的可解释性简单说明(Interpreting machine learning models)
Saliency Maps 的简单实现
LIME 与 Pytorch 的结合使用
SHAP 与 Pytorch 的结合使用

2019_07_15

GAN 生成服从高斯分布的数据
GAN 生成手写数字

2019_08_12

Factor Analysis(因子分析)
Principal component analysis, PCA(主成分分析)

2019_08_26

分类器边界的可视化方式.
模型评测工具

2019_09_09

关于GAN的内容学习
- WGAN-GP

2019_11_18

关于AutoEncoder的内容学习
- AE
t-SNE可视化的例子

2019_12_16

推荐系统
- 基于矩阵分解的推荐系统, FunkSVD

2020_04_06

因为最近在使用Colaboratory, 但是直接传图片, 进行训练会很慢. 所以在这里考虑将图片处理好打包为npy文件上传.

这里包含两个文件, 分别是生成将图片生成npy文件, 以及使用生成的进行测试.

Npy文件生成 (如何将图片生成对应的npy文件和label的npy文件)
Npy文件训练 (这一部分使用Colaboratory进行测试)

Reinforcement Learning

这个文件夹开始介绍强化学习的相关内容. 目前这个文件夹还在持续更新.

第一课时部分

00_Reinforcement_Learning_Gym介绍 (关于工具gym的详细介绍)

第三课时部分

01_Example_of_PolicyEvaluation (一个介绍Policy Evaluation的文件, 也就是给定策略, 对策略进行评价)
02_Example_of_PolicyIterative.ipynb (从给定policy, 进行迭代)
03_Example_of_ValueIteration.ipynb (value iteration的例子)

第四课时部分

04_BlackJack_Playground.ipynb (21点的环境的介绍)
04_Monte-Carlo_normalMean.ipynb (使用MC方法来估计value function, 这里使用普通的求平均的方式)
04_Monte-Carlo_IncrementalMean.ipynb (使用MC方法来估计value function, 这里使用incremental mean)
04_Temporal-Difference_BlackJack.ipynb (使用TD方法来估计value function)
04_Eligibility_traces_BlackJack.ipynb (使用了Eligibility traces来进行更新)

第五课时部分

环境介绍
- 05_Windy_Gridworld_Playground.ipynb (环境Windy Gridworld Playground的介绍);
On Policy Learning介绍
- MC
  - 05_GLIE_BlackJack.ipynb (使用MC方法来优化策略, 使用GLIE算法, 给出最优策略, 用在BlackJack上面);
  - 05_GLIE_Windy_Gridworld.ipynb (使用MC方法, 解决Windy Gridworld上面);
- TD
  - 05_Sarsa_Windy_Gridworld.ipynb (使用最基础的Sarsa算法, 在windy gridworld中寻找最优路径);
  - 05_Sarsa_Lambda_Windy_Gridworld.ipynb (使用Sarsa($\lambda$)方法, 也就是使用eligibility traces);
Off Policy Learning介绍
- MC
  - 05_Importance_Sampling_Random_MC_Windy_Gridworld.ipynb (使用MC+OFF policy的方式, 但是没有收敛)
- TD
  - 05_Importance_Sampling_Random_TD_Windy_Gridworld.ipynb (使用importance sampling, 并且执行的policy为随机policy, 即每个action执行的概率相同)
  - 05_Importance_Sampling_TD_Q-Learning_Windy_Gridworld.ipynb (q-learning简化前的版本, 此时可以看到有行为策略, 和优化策略)
  - 05_Q-Learning_Windy_Gridworld.ipynb (q-learning介绍)
  - 05_Importance_Sampling_2-step-Q-Learning_Windy_Gridworld.ipynb (使用2-step, 此时要加importance sampling, 测试权重加在不同位置的效果)
  - 05_Importance_Sampling_3-step-Q-Learning_Windy_Gridworld.ipynb (使用3-step, 此时要加importance sampling, 测试权重加在不同位置的效果)

第六课时部分

06_Deep_Q_Learning_Pytorch_CliffWalking.ipynb (根据Pytorch官方教程改变, 使用Pytorch实现Deep Q Network, 在Cliff Walking上进行实验)

第七课时部分

07_Cliff_Environment_Playground.ipynb (环境Cliff Walking的环境介绍)
07_Actor_Critic_Baseline_(A2C)_Pytorch (使用Pytorch实现Actor Critic with Baseline, 也就是A2C的模型, 在Cliff Walking上进行实验)

Other

强化学习解决背包问题 (一个使用强化学习来解决背包优化问题的例子)

2020_06_29

因为之前一直在看RL的内容, 所以都放在了一个文件夹. 这里单独列出一些零散的知识.

importance sampling的介绍.

2020_08_03 (Pytorch入门基础文档)

这里为一些Pytorch的入门介绍.

正向传播,反向传播与非叶子节点梯度保存(hook用法介绍)
梯度下降法示例(一个一元线性回归的系数推导)
损失函数和优化器的介绍
Pytorch实现简单线性回归
数据加载器 (如何重写dataset类, 将其传入dataloader, 并进行batch操作)
数据预处理 (包含如何写transform, 合并到dataset中, 如何对特征数据进行归一化)
全连接网络的手写数字识别(MNIST), 一个完整的训练流程
卷积神经网络的CIFAR_10的识别 (使用Pytorch实现卷积网络, 并在CIFAR_10数据集上进行测试)
Pytorch中经典网络结构与迁移学习 (查看torchvision.models的使用方法, 并简单介绍迁移学习)

2020_09_07 (Matplotlib可视化)

在模型比较时, 常见的柱状图与表格绘制在一起(绘制表格与柱状图.ipynb)

About

ML Records in 1110 Lab of BUPT. Some detailed information can be referenced on: https://mathpretty.com/10388.html

pytorch bupt mechine-learing

Report repository

Releases

No releases published

Packages

No packages published

Contributors 2

Languages