简单说明:
- 这里会记录一些我平时所学的和平时所做的实验, 尽量所有的都以notebook的形式上传, 看起来更加方便.
- 我建议可以按照这篇文章机器学习文章总结来进行看. 基本这里每一个代码我都有相应的, 详细的文章进行介绍.
- (我最初的想法是这里记录原始的, 或是精简过的notebook, 详细的说明在文艺数学君上进行说明. 想看代码再来这个仓库进行查看)
- Python生成词云
- Python生成字符画
- Python生成马赛克图片
- PyTorch实现简单分类
- PyTorch实现CNN, Dogs vs. Cats
- Pytorch维度的理解
- PyTorch对交叉熵的理解(CrossEntropy)
- 模型可视化-Netron
- 残差网络举例, 使用Pytorch训练-验证-测试Resnet50
- 论文介绍 : Decision-based boundary attack
- 正则化技术的介绍
- 交叉检验技术的介绍(CV)
- Pytorch在MNIST实现分类(简单演示)
- Pytorch在MNIST实现分类(动态增加层数,便于之后调试)
- PyTorch实现逻辑回归
- 包含逻辑回归的PPT和代码实现和使用的数据
- CNN的介绍
- Convolution的一些可解释性
- deep dream的实现
- Image Style Transform(图片的风格迁移)
- CNN_MNIST可视化
- Fizz Buzz in Pytorch
- CLASSIFYING NAMES WITH A CHARACTER-LEVEL RNN
- 时间序列分析(使用RNN完成时间序列预测)
- Seq2Seq - translation(一个简单的Seq2Seq的模型,用来实现英文与法文的翻译。)
- Emotion RNN(使用RNN完成简单的情感分类)
- Word Embedding(简单实现Skip-gram算法)
- Attention的简单介绍
- 关于更多模型解释的内容, 查看文章: 模型的可解释性简单说明(Interpreting machine learning models)
- Saliency Maps的简单实现
- LIME与Pytorch的结合使用
- SHAP与Pytorch的结合使用
- GAN生成服从高斯分布的数据
- GAN生成手写数字
- Factor Analysis(因子分析)
- Principal component analysis, PCA(主成分分析)
- 分类器边界的可视化方式.
- 模型评测工具
- 关于GAN的内容学习
- WGAN-GP
- 关于AutoEncoder的内容学习
- AE
- t-SNE可视化的例子
- 推荐系统
- 基于矩阵分解的推荐系统, FunkSVD
因为最近在使用Colaboratory, 但是直接传图片, 进行训练会很慢. 所以在这里考虑将图片处理好打包为npy文件上传.
这里包含两个文件, 分别是生成将图片生成npy文件, 以及使用生成的进行测试.
- Npy文件生成 (如何将图片生成对应的npy文件和label的npy文件)
- Npy文件训练 (这一部分使用Colaboratory进行测试)
这个文件夹开始介绍强化学习的相关内容. 目前这个文件夹还在持续更新.
- 00_Reinforcement_Learning_Gym介绍 (关于工具gym的详细介绍)
- 01_Example_of_PolicyEvaluation (一个介绍Policy Evaluation的文件, 也就是给定策略, 对策略进行评价)
- 02_Example_of_PolicyIterative.ipynb (从给定policy, 进行迭代)
- 03_Example_of_ValueIteration.ipynb (value iteration的例子)
- 04_BlackJack_Playground.ipynb (21点的环境的介绍)
- 04_Monte-Carlo_normalMean.ipynb (使用MC方法来估计value function, 这里使用普通的求平均的方式)
- 04_Monte-Carlo_IncrementalMean.ipynb (使用MC方法来估计value function, 这里使用incremental mean)
- 04_Temporal-Difference_BlackJack.ipynb (使用TD方法来估计value function)
- 04_Eligibility_traces_BlackJack.ipynb (使用了Eligibility traces来进行更新)
- 环境介绍
- 05_Windy_Gridworld_Playground.ipynb (环境Windy Gridworld Playground的介绍);
- On Policy Learning介绍
- MC
- 05_GLIE_BlackJack.ipynb (使用MC方法来优化策略, 使用GLIE算法, 给出最优策略, 用在BlackJack上面);
- 05_GLIE_Windy_Gridworld.ipynb (使用MC方法, 解决Windy Gridworld上面);
- TD
- 05_Sarsa_Windy_Gridworld.ipynb (使用最基础的Sarsa算法, 在windy gridworld中寻找最优路径);
- 05_Sarsa_Lambda_Windy_Gridworld.ipynb (使用Sarsa(
$\lambda$ )方法, 也就是使用eligibility traces);
- MC
- Off Policy Learning介绍
- MC
- 05_Importance_Sampling_Random_MC_Windy_Gridworld.ipynb (使用MC+OFF policy的方式, 但是没有收敛)
- TD
- 05_Importance_Sampling_Random_TD_Windy_Gridworld.ipynb (使用importance sampling, 并且执行的policy为随机policy, 即每个action执行的概率相同)
- 05_Importance_Sampling_TD_Q-Learning_Windy_Gridworld.ipynb (q-learning简化前的版本, 此时可以看到有行为策略, 和优化策略)
- 05_Q-Learning_Windy_Gridworld.ipynb (q-learning介绍)
- 05_Importance_Sampling_2-step-Q-Learning_Windy_Gridworld.ipynb (使用2-step, 此时要加importance sampling, 测试权重加在不同位置的效果)
- 05_Importance_Sampling_3-step-Q-Learning_Windy_Gridworld.ipynb (使用3-step, 此时要加importance sampling, 测试权重加在不同位置的效果)
- MC
- 06_Deep_Q_Learning_Pytorch_CliffWalking.ipynb (根据Pytorch官方教程改变, 使用Pytorch实现Deep Q Network, 在Cliff Walking上进行实验)
- 07_Cliff_Environment_Playground.ipynb (环境Cliff Walking的环境介绍)
- 07_Actor_Critic_Baseline_(A2C)_Pytorch (使用Pytorch实现Actor Critic with Baseline, 也就是A2C的模型, 在Cliff Walking上进行实验)
- 强化学习解决背包问题 (一个使用强化学习来解决背包优化问题的例子)
因为之前一直在看RL的内容, 所以都放在了一个文件夹. 这里单独列出一些零散的知识.
- importance sampling的介绍.
这里为一些Pytorch的入门介绍.
- 正向传播,反向传播与非叶子节点梯度保存(hook用法介绍)
- 梯度下降法示例(一个一元线性回归的系数推导)
- 损失函数和优化器的介绍
- Pytorch实现简单线性回归
- 数据加载器 (如何重写dataset类, 将其传入dataloader, 并进行batch操作)
- 数据预处理 (包含如何写transform, 合并到dataset中, 如何对特征数据进行归一化)
- 全连接网络的手写数字识别(MNIST), 一个完整的训练流程
- 卷积神经网络的CIFAR_10的识别 (使用Pytorch实现卷积网络, 并在CIFAR_10数据集上进行测试)
- Pytorch中经典网络结构与迁移学习 (查看torchvision.models的使用方法, 并简单介绍迁移学习)
- 在模型比较时, 常见的柱状图与表格绘制在一起(绘制表格与柱状图.ipynb)