Нейронные сети на службе у главных онлайн переводчиков

Последнее использование Google машинного перевода может облегчить общение людей с теми, кто говорит на другом языке, путем перевода речи непосредственно в текст на понятном им языке.

Интересная статья про новый метод и возможно будующий стандарт в этой отрасли, найдена мной здесь:
newscientist.com/article/2126738-google-uses-neural-networks-to-translate-without-transcribing/

Обычно машинный перевод речи работает, сначала преобразуя его в текст, а затем переводя его в текст на другом языке. Но любая ошибка в распознавании речи приведет к ошибке в транскрипции и ошибке в переводе.

Исследователи из Google Brain, научно-исследовательского отдела технологического гиганта, обратились к нейронным сетям, чтобы вырезать средний шаг. Пропуская транскрипцию, подход может потенциально обеспечить более точные и быстрые переводы.

Команда обучила свою систему на сотнях часов испанского аудио с соответствующим английским текстом. В каждом случае он использовал несколько уровней нейронных сетей — компьютерных систем, свободно моделирующих человеческий мозг, — чтобы соответствовать разделам разговорного испанского языка с письменным переводом. Для этого он проанализировал форму сигнала испанского аудио, чтобы узнать, какие части, казалось, соответствуют тем кускам написанного на английском языке. Когда это было предложено перевести, каждый нейронный слой использовал это знание, чтобы манипулировать звуковым сигналом, пока его не превратили в соответствующий раздел письменного английского.

«Он учится находить шаблоны соответствия между осциллограммами на исходном языке и письменном тексте», — говорит Дмитрий Богданов из Монреальского университета в Канаде, который не был связан с этой работой.

После периода обучения система Google произвела более качественный перевод на испанский язык испанской речи, чем тот, который транскрибировал речь в письменном испанском языке первым. Он был оценен с использованием показателя BLEU, который предназначен для оценки машинных переводов, основанных на том, насколько они близки к профессиональному человеку-переводчику.

Эта система может быть особенно полезна для перевода речи на языках, на которых говорит очень мало людей, говорит Шарон Голдуотер из Эдинбургского университета в Великобритании.

Например, международные группы по оказанию помощи в случае стихийных бедствий могут использовать ее для быстрого создания системы перевода для общения с людьми, которым они пытаются помочь. Когда в 2010 году произошло землетрясение на Гаити, говорит Голдуотер, для гаитянского не было программного обеспечения для перевода.

Команда Голдуотера использует подобный метод для перевода речи из Арапахо, язык, на котором говорят только 1000 или около того людей из одноименного племени индейцев, и айну, язык, на котором говорят несколько человек в Японии.

Система также может быть использована для перевода языков, которые редко записываются, поскольку для успешных переводов не требуется письменная версия исходного языка.

Пока это не проверено на гораздо большем наборе данных, трудно сказать, как новый подход действительно поведет себя в сравнении с более традиционными системами перевода, говорит Голдуотер. Но думает, что это может стать стандартом для будущего машинного перевода.

Некоторые службы уже используют машинный перевод, чтобы люди, говорящие на разных языках, общались в режиме реального времени. Skype ввела в 2014 году прямую трансляцию текста в речь и теперь поддерживает девять языков, включая мандаринский и арабский, а также наиболее распространенные европейские языки. Но, как и другие существующие методы перевода, Skype транскрибирует речь в текст перед переводом этого текста на другой язык.

И служба перевода текстов Google Translate уже использует нейронные сети на самых популярных языковых парах, что позволяет анализировать целые предложения сразу, чтобы найти лучший письменный перевод. Интересно, что в этой системе используется «интерлингва» — общее представление предложений, имеющих одинаковое значение на разных языках — для перевода с одного языка на другой, что означает, что она может переводить между языковыми парами, которые она явно не изучила . Исследователи Google Brain предполагают, что новый подход к описанию текста может также создать систему, которая может переводить несколько языков.

Однако в то время как машинный перевод продолжает улучшаться, трудно сказать, как нейронные сети приходят к хорошим решениям, говорит Багдано. «Очень сложно понять, что происходит внутри, выборка данных слишком велика и порой найти точные логические связи невозможно».

Оцените статью
Добавить комментарий