Нейронный машинный перевод ( англ. Neural Machine Translation , NMT) — это подход к машинному переводу , в котором используется большая искусственная нейронная сеть . Он отличается от методов машинного перевода, основанных на статистике фраз , которые используют отдельно разработанные подкомпоненты [1] .
Сервисы перевода компаний Google , Яндекс , Microsoft и PROMT [2] уже используют нейронный перевод. Google использует нейронный машинный перевод Google (GNMT) вместо ранее используемых статистических методов. [3] Майкрософт использует похожую технологию для перевода речи (в том числе в Майкрософт Переводчике и Skype Переводчике ). [4] Гарвардской группой по обработке естественного языка была выпущена OpenNMT, система нейронного машинного перевода с открытым исходным кодом [5] . Яндекс.Переводчик имеет гибридную модель: свой вариант перевода предлагает и статистическая модель, и нейросеть. После этого технология CatBoost , в основе которой лежит машинное обучение , будет выбирать лучший из полученных результатов [6] .
Модели NMT используют глубинное обучение и обучение признаков . Для их работы требуется лишь малая часть памяти по сравнению с традиционными системами статистического машинного перевода (SMT). Кроме того, в отличие от традиционных систем перевода, все части модели нейронного перевода обучаются совместно (от начала до конца), чтобы максимизировать эффективность перевода [7] [8] [9] .
Двунаправленная рекуррентная нейронная сеть (RNN), также известная как кодировщик , используется нейронной сетью для кодирования исходного предложения для второй рекуррентной сети, также известной как декодировщик , которая используется для предсказания слов в конечном языке [10] .