Нейронный машинный перевод Google (GNMT) — это система нейронного машинного перевода (NMT), разработанная компанией Google и представленная в ноябре 2016 года, которая использует искусственную нейронную сеть для повышения беглости и точности перевода в Google Переводчике . [1] [2] [3]
GNMT улучшает качество перевода, применяя метод машинного перевода на основе примеров (EBMT), в котором система “обучается на миллионах примеров”. [2] Предлагаемая архитектура системного обучения GNMT была впервые опробована на более, чем ста языках, поддерживаемых Google Переводчиком. [2] Благодаря большой сквозной структуре , система со временем учится создавать более качественные и естественные переводы. [1] GNMT способна переводить предложения целиком, а не по частям. [1] Сеть GNMT может выполнять интерлингвальный машинный перевод , кодируя семантику предложения вместо того, чтобы запоминать переводы отдельных фраз. [2] [4]
Проект Google Brain был создан в 2011 году в “секретной исследовательской лаборатории Google X” [5] Джеффом Дином , сотрудником Google, Грегом Коррадо, исследователем из Google, и Эндрю Ыном , профессором компьютерных наук Стэнфордского университета . [6] [7] [8] Работа Ына легла в основу одного из самых больших технологических прорывов в Google и Стэнфорде. [5]
В сентябре 2016 года исследовательская группа Google объявила о разработке системы перевода GNMT, и к ноябрю Google Переводчик начал использовать нейронный машинный перевод (NMT) вместо прежних статистических методов (SMT) [1] [9] [10] [11] , которые использовались с октября 2007 года внутри собственной закрытой SMT системы. [12] [13]
Система NMT внутри Google Переводчика использует большую искусственную нейронную сеть, пригодную для глубинного обучения . [1] [2] [3] Изучая миллионы примеров, GNMT улучшает качество перевода, используя более широкий контекст для вывода наиболее подходящего перевода. Затем результат перестраивается и адаптируется для соответствия грамматике человеческого языка. GNMT не создала свой внутренний универсальный язык, а скорее стремилась найти общее между многими языками, что должно быть интересно больше для психологов и лингвистов, чем для специалистов в области информатики. [14] Новый движок перевода был включен в обе стороны для девяти языков: английского, французского, немецкого, испанского, португальского, китайского, японского, корейского и турецкого в 2016 году. [15] В марте 2017 года были добавлены ещё три языка: русский, хинди и вьетнамский. [16] В том же месяце с помощью сообщества Google Переводчика была добавлена поддержка иврита и арабского языка. [17] Далее в конце апреля 2017 года была добавлена поддержка девяти индийских языков, а именно: хинди, бенгали, маратхи, гуджарати, пенджаби, тамильский, телугу, малаялам и каннада. [18]