Motorica Advanced Gesture Classification

Продвинутая задача классификации жестов

Kaggle competition

Проект реализован в последовательности ноутбуков и файлов:

1) 1_EDA_sprint_3.ipynb - EDA с анализом тренировочных и тестовых данных до начала работы с моделью, в т.ч. анализ показаний датчиков и жестов.

Используемые в ноутбуке функции приведены в файле functions.py, который должен находиться в той же папке, что и 1_EDA_sprint_3.ipynb.

Графики, построенные с применением библиотеки plotly, сохранены в папке figures для отображения на GitHub.

2) В файле 2_model_SRNN_LSTM.ipynb развит подход к решению задачи на базе baseline с применением двух моделей нейросети.

В первой части ноутбука данные загружаются из архива и преобразуются с помощью библиотеки mne для последующей подачи данных на обучение. Далее последовательно обучаются две модели:

SimpleRNN (первая модель на базе слоя SimpleRNN библиотеки Keras);
LSTM (вторая модель, в ее основе лежат несколько слоев LSTM библиотеки Keras и дополнительный Dense-слой).

Важно отметить, что тренировочные и тестовые данные имеют разделение на 3 ряда данных и по каждому набору происходит параллельное обучение группы моделей, имеющих одинаковую структуру и набор параметров.

Основная задача работы первой модели - определить фактический момент изменения жеста (появление "ступеньки") по данным X_train для последующего обучения более сложной модели. Использование упрощенной модели SimpleRNN совместно с использованием loss="mean_squared_error" и функцией активации 'sigmoid' (activation='sigmoid') в выходном слое при сборке модели позволяет сделать предсказание "ступеньки" при решении задачи классификации жестов по данным датчиков (X_train). Модель учитывает классы из y_train, а время выполнения движения определяется из предикта по X_train как момент изменения класса (жеста).

Необходимость первого этапа обусловлена спецификой подготовки данных для обучения, когда человек ("пилот") с зафиксированным на запястье набором датчиков повторяет жесты следуя командам манипулятора. Таким образом, изначально y_train представляет собой момент подачи манипулятором команды на изменение жеста, а данные X_train - фактическое выполнение жеста - запаздывают на некоторое время относительно исходного y_train.

Для того, чтобы компенсировать ошибки предсказания первой модели, обучение SimpleRNN по каждому "пилоту" проводится несколько раз с разными параметрами validation_split и затем результаты предсказания каждой модели усредняются по каждому пилоту.

Обучение второй модели производится на оригинальных данных X_train и корректированных данных y_train_ch (предсказание обученной модели SimpleRNN на X_train). Далее обученная модель LSTM используется для предсказания тестовых данных.

При работе с моделями для управления обучением (выбор лучшей модели, изменение learning_rate, остановка обучения при выходе на плато) используется набор функций callbacks библиотеки Keras.

В целях обеспечения повторимости результатов и подбора гиперпараметров в начале ноутбука и при каждом сбросе сессии (tf.keras.backend.clear_session(): Resets all state generated by Keras) устанавливается исходное значение seed_value.

В ноутбуке оставлены закомментированные ячейки с пометками и пояснениями для сохранения возможности запуска в Google Colab.

3) В ноутбуке 3_embeddings.ipynb реализовано предсказание тестовых данных на модели, обученной для каждого пилота. Модели выложены в папке lstm_model.

4) Файл 4_boxplots_clear_gests_sens_gest.ipynb с построением боксплотов "Статистика изменения характерных уровней датчиков в течение снятия показаний в разрезе жестов для выбранного пилота. Очищенные данные" и папка boxplots с боксплотами, построенными для всех пилотов. В том числе boxplots_sens_gest_pylot2_with_beaten.png, построенный по данным 2-го пилота, еще не очищенным от битых участков. Обсуждение наблюдений - в общем файле с разведочным анализом данных 1_EDA_sprint_3.ipynb.

5) 5_rnn_baseline.ipynb - ноутбук, предоставленный организаторами соревнования в качестве baseline.

6) Папка data содержит архив с исходными данными:

X_train_1.npy, X_train_2.npy, X_train_3.npy: файлы с тренировочными данными ("фичи", показания датчиков по каждому "пилоту");
y_train_1.npy, y_train_2.npy, y_train_3.npy: файлы с тренировочными "таргетами" (от манипулятора);
X_test_dataset_1.pkl, X_test_dataset_2.pkl, X_test_dataset_3.pkl: файлы тестовых данных ("фичи", показания датчиков по каждому "пилоту") для предсказания и сабмита;
sample_submission.csv: файл примера загрузки предсказанных данных на Kaggle.

7) Файлы с агрегированными предиктами обученных моделей SRNN+LSTM на тестовых данных, показавшие максимальный score на Leaderboard при сабмите

y_test_submit_rnn_LSTM(0.69641).csv,

y_test_submit_rnn_LSTM(0.68976).csv,

y_test_submit_rnn_LSTM(0.6781).csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Motorica Advanced Gesture Classification

Продвинутая задача классификации жестов

Kaggle competition

About

Releases

Packages

Contributors 4

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 160 Commits
boxplots		boxplots
data		data
figures		figures
lstm_model		lstm_model
my_dir/helloworld		my_dir/helloworld
.gitignore		.gitignore
1_EDA_sprint_3.ipynb		1_EDA_sprint_3.ipynb
2_model_SRNN_LSTM.ipynb		2_model_SRNN_LSTM.ipynb
3_embeddings.ipynb		3_embeddings.ipynb
4_boxplots_clear_gests_sens_gest.ipynb		4_boxplots_clear_gests_sens_gest.ipynb
5_rnn_baseline.ipynb		5_rnn_baseline.ipynb
README.md		README.md
functions.py		functions.py
y_test_submit_rnn_LSTM(0.6781).csv		y_test_submit_rnn_LSTM(0.6781).csv
y_test_submit_rnn_LSTM(0.68976).csv		y_test_submit_rnn_LSTM(0.68976).csv
y_test_submit_rnn_LSTM(0.69641).csv		y_test_submit_rnn_LSTM(0.69641).csv

Alex1iv/Motorica_3

Folders and files

Latest commit

History

Repository files navigation

Motorica Advanced Gesture Classification

Продвинутая задача классификации жестов

Kaggle competition

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 4

Languages

Packages