Motorica Advanced Gesture Classification

Продвинутая задача классификации жестов

Kaggle competition

Проект реализован в последовательности ноутбуков и файлов:

1) 1_EDA_sprint_3.ipynb - EDA с анализом тренировочных и тестовых данных до начала работы с моделью, в т.ч. анализ показаний датчиков и жестов.

Используемые в ноутбуке функции приведены в файле functions.py, который должен находиться в той же папке, что и 1_EDA_sprint_3.ipynb.

Графики, построенные с применением библиотеки plotly, сохранены в папке figures для отображения на GitHub.

2) В файле 2_model_SRNN_LSTM.ipynb развит подход к решению задачи на базе baseline с применением двух моделей нейросети.

В первой части ноутбука данные загружаются из архива и преобразуются с помощью библиотеки mne для последующей подачи данных на обучение. Далее последовательно обучаются две модели:

SimpleRNN (первая модель на базе слоя SimpleRNN библиотеки Keras);
LSTM (вторая модель, в ее основе лежат несколько слоев LSTM библиотеки Keras и дополнительный Dense-слой).

Важно отметить, что тренировочные и тестовые данные имеют разделение на 3 ряда данных и по каждому набору происходит параллельное обучение группы моделей, имеющих одинаковую структуру и набор параметров.

Основная задача работы первой модели - определить фактический момент изменения жеста (появление "ступеньки") по данным X_train для последующего обучения более сложной модели. Использование упрощенной модели SimpleRNN совместно с использованием loss="mean_squared_error" и функцией активации 'sigmoid' (activation='sigmoid') в выходном слое при сборке модели позволяет сделать предсказание "ступеньки" при решении задачи классификации жестов по данным датчиков (X_train). Модель учитывает классы из y_train, а время выполнения движения определяется из предикта по X_train как момент изменения класса (жеста).

Необходимость первого этапа обусловлена спецификой подготовки данных для обучения, когда человек ("пилот") с зафиксированным на запястье набором датчиков повторяет жесты следуя командам манипулятора. Таким образом, изначально y_train представляет собой момент подачи манипулятором команды на изменение жеста, а данные X_train - фактическое выполнение жеста - запаздывают на некоторое время относительно исходного y_train.

Для того, чтобы компенсировать ошибки предсказания первой модели, обучение SimpleRNN по каждому "пилоту" проводится несколько раз с разными параметрами validation_split и затем результаты предсказания каждой модели усредняются по каждому пилоту.

Обучение второй модели производится на оригинальных данных X_train и корректированных данных y_train_ch (предсказание обученной модели SimpleRNN на X_train). Далее обученная модель LSTM используется для предсказания тестовых данных.

При работе с моделями для управления обучением (выбор лучшей модели, изменение learning_rate, остановка обучения при выходе на плато) используется набор функций callbacks библиотеки Keras.

В целях обеспечения повторимости результатов и подбора гиперпараметров в начале ноутбука и при каждом сбросе сессии (tf.keras.backend.clear_session(): Resets all state generated by Keras) устанавливается исходное значение seed_value.

В ноутбуке оставлены закомментированные ячейки с пометками и пояснениями для сохранения возможности запуска в Google Colab.

3) В ноутбуке 3_embeddings.ipynb реализовано предсказание тестовых данных на модели, обученной для каждого пилота. Модели выложены в папке lstm_model.

4) Файл 4_boxplots_clear_gests_sens_gest.ipynb с построением боксплотов "Статистика изменения характерных уровней датчиков в течение снятия показаний в разрезе жестов для выбранного пилота. Очищенные данные" и папка boxplots с боксплотами, построенными для всех пилотов. В том числе boxplots_sens_gest_pylot2_with_beaten.png, построенный по данным 2-го пилота, еще не очищенным от битых участков. Обсуждение наблюдений - в общем файле с разведочным анализом данных 1_EDA_sprint_3.ipynb.

5) 5_rnn_baseline.ipynb - ноутбук, предоставленный организаторами соревнования в качестве baseline.

6) Папка data содержит архив с исходными данными:

X_train_1.npy, X_train_2.npy, X_train_3.npy: файлы с тренировочными данными ("фичи", показания датчиков по каждому "пилоту");
y_train_1.npy, y_train_2.npy, y_train_3.npy: файлы с тренировочными "таргетами" (от манипулятора);
X_test_dataset_1.pkl, X_test_dataset_2.pkl, X_test_dataset_3.pkl: файлы тестовых данных ("фичи", показания датчиков по каждому "пилоту") для предсказания и сабмита;
sample_submission.csv: файл примера загрузки предсказанных данных на Kaggle.

7) Файлы с агрегированными предиктами обученных моделей SRNN+LSTM на тестовых данных, показавшие максимальный score на Leaderboard при сабмите

y_test_submit_rnn_LSTM(0.69641).csv,

y_test_submit_rnn_LSTM(0.68976).csv,

y_test_submit_rnn_LSTM(0.6781).csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Motorica Advanced Gesture Classification

Продвинутая задача классификации жестов

Kaggle competition

Files

README.md

Latest commit

History

README.md

File metadata and controls

Motorica Advanced Gesture Classification

Продвинутая задача классификации жестов

Kaggle competition