GitHub - LindsayXX/DD2412_project: course project for NeurIPS 2019 Reproducibility Challenge

Replication track in NeurIPS 2019 Reproducibility Challenge of Learning where to look: Semantic-Guided Multi-Attention Localization for Zero-Shot Learning

This project is not finished yet, more information will be updated soon!

1. Multi-Attention Subnet:

VGG19(?) backbone
input: Image
output: Features representation
K-means
input: Feature representation
output: 2 groups of feature representation
Global averge pooling + 2 Fully connected layers(ReLU) + Sigmoid
input: 2 groups of feature representation
(intermediate result: Channel descriptor p1, p2)
output: Channel-wise attention weight vector a1, a2
Weighted-sum
input: Feature representation, channel-wise attention weight
output: 2 Attention maps

2. Region Cropping Subnet:

f_CNet(2 fully connected layers)
input: Attention maps
output: [t_x, t_y, t_s]
Boxcar Mask (cropping operation x o V_i)
input: Attention maps, [t_x, t_y, t_s]
output: masked images (x_i^part)

3. Joint Feature Learning Subnet

VGG backbone + Global average pooling
input: original image/ masked image
output: visual feature vector $\theta$
Transformation:
input: visual feature vector
output: Semantic feature vector

4. Classification

different between seen and unseen classes

Reference:

Pedro Morgado and Nuno Vasconcelos. Semantically consistent regularization for zero-shot recognition. In CVPR, 2017.

Feng Wang, Xiang Xiang, Jian Cheng, and Alan Loddon Yuille. Normface: l 2 hypersphere embedding for face verification. In ACMMM. ACM, 2017.

Jianlong Fu, Heliang Zheng, and Tao Mei. Look closer to see better: Recurrent attention convolutional neural network for fine-grained image recognition. In CVPR, pages 4438–4446, 2017.

Heliang Zheng, Jianlong Fu, Tao Mei, and Jiebo Luo. Learning multi-attention convolutional neural network for fine-grained image recognition. In ICCV, 2017.

Name		Name	Last commit message	Last commit date
Latest commit History 122 Commits
basemodel		basemodel
final_model		final_model
result_analysis		result_analysis
src		src
ReadMe.md		ReadMe.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

1. Multi-Attention Subnet:

2. Region Cropping Subnet:

3. Joint Feature Learning Subnet

4. Classification

Reference:

About

Releases

Packages

Contributors 2

Languages

LindsayXX/DD2412_project

Folders and files

Latest commit

History

Repository files navigation

1. Multi-Attention Subnet:

2. Region Cropping Subnet:

3. Joint Feature Learning Subnet

4. Classification

Reference:

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages