Skip to content

Illumaria/made-computer-vision

Repository files navigation

Computer Vision (MADE S02E02)

This repository contains materials for the Computer Vision course.

Tip #1:

Loading the entire repository can take a considerable amount of time. A single folder can be downloaded via DownGit.

Tip #2:

Sometimes GitHub failes to render a notebook. In that case use nbviewer — it works like a charm!

Tip #3:

In those cases when nbviewer fails to find a notebook whereas GitHub finds it just fine, try to add ?flush_cache=false at the end of the nbviewer link.

Lectures

Legend: — slides, — code, — video.

Week What Where When
1 Определение CV, история развития, основные задачи, представление изображений (оптика, кодирование), аугментация (яркость, контраст, гамма-коррекция, оттенок, насыщенность, зашумление, размытие, аффинные преобразования). 04.03.2021
2 Повторение: свёртка, свёрточный слой, pooling, BatchNormalization. Архитектуры: LeNet-5, ImageNet, AlexNet, VGG, Inception, ResNet, ResNeXt, SENet, EfficientNet, NFNet. Transfer learning. 11.03.2021
3 Детектирование объектов: постановка задачи, сложности, метрики качества; классические методы: HOG, Haar Cascades, SIFT; нейросетевые методы: RCNN, Fast RCNN, Faster RCNN, MTCNN. 18.03.2021
4 Детектирование объектов: методы Single Shot (SSD, YOLO, RetinaNet, EfficientDet), Focal Loss, Feature Pyramid Network. 25.03.2021
5 Сегментация объектов: постановка задачи, Semantic Segmentation, Instance Segmentation (Mask R-CNN), Panoptic Segmentation; архитектуры: FCN, SegNet, U-Net, FPN; функции потерь: BCELoss, Focal Loss, IoU, Jaccard Index и Jaccard Loss, Dice Loss; BatchNorm и проблемы с памятью. 01.04.2021
6 Пайплайн OCR, детектирование текста, распознавание, CRNN, CTC loss, метрики качества (CER, WER). 08.04.2021
7 Metric Learning: definition and types (Minkowski distance, Mahalanobis distance, cosine similarity); similarity-based (siamese networks, triplet loss), softmax-based (center loss, angular softmax: CosFace, ArcFace); AKNN, HNSW, FAISS; landmarks recognition. 15.04.2021
8 Object tracking: Kalman filters, SORT, DeepSORT, metrics (FAF, MT, ML, FP, FN, ID sw, Frag, MOTA, MOTP), datasets and benchmarks (MOT17, KITTI, UA-DETRAC, ImageNet-Vid, YTVIS, TAO). 22.04.2021
9 Генеративно-состязательные сети, часть 1: задачи, история развития, архитектуры, функции потерь, проблемы сходимости и их решения, Mode Collapse, Wasserstein GAN (Earth Mover's Distance, непрерывность по Липшицу). 29.04.2021
10 Глубокое нейронные сети для обработки видео: трекинг (FlowNet, Multi-Domain Net, GOTURN), распознавание действий на видео (2D CNN + RNN, 3D CNN), автоматическое описание видео, детектирование хайлайтов в видео (Video2GIF). 13.05.2021
11 Meta learning & Semi-supervised learning: Meta-learning (learning to learn); Few-shot learning (Omniglot dataset; Black-box, Metric-based, Optimization based); Semi-supervised learning (SimCLR). 20.05.2021
12 Генеративно-состязательные сети, часть 2: 1D-GANs, метрики (Inception score, Frechet Inception Distance), Progressive Growing of GANs, BigGAN (Hinge Loss Function, Self-attention), StyleGAN, StyleGAN2. 27.05.2021
13 Нейросети на мобильных устройствах: свёртка, MobileNet v1/v2 (1x1 Convs, Depthwise-Separable Convolution), квантизация нейронных сетей (статическая, динамическая, QAT), деплой нейронных сетей (PyTorch JIT, Torchscript, JIT compiler, ONNX и ONNX Runtime). 03.06.2021

About

Computer Vision course materials

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published