Microsoft показала систему с новым уровнем перевода речи в реальном времени

Корпорация Microsoft продемонстрировала недавно технологию, способную почти мгновенно переводить произносимую человеком английскую речь на китайский язык. Она сохраняет интонацию, ритм речи, так что перевод звучит будто его произносит сам говорящий. Microsoft говорит, что ряд сделанных в её лабораториях прорывов существенно уменьшил число ошибок системы мгновенного перевода. Сообщается, что система работает по аналогии с функционированием мозга человека, что повышает точность перевода. Детали были сообщены во время презентации в Китае.

Microsoft отказалась от использовавшейся ранее системы перевода, сравнивающей образцы речи, в пользу статистических моделей, которые лучше фиксируют голосовые данные различных людей. Компания также привлекла исследователей Университета Торонто, которые улучшили перевод ещё сильнее с помощью нейронных сетей, которые учатся распознавать звуки примерно так же, как мозг человека. Применив эту технологию, доля ошибок была снижена на 15%, что программный гигант считает сильным изменением.

Улучшенная система распознавания речи вначале переводит английский голос в английский текст. Затем система преобразовывает его в текст на китайском, пытаясь сохранить смысловую нагрузку. Наконец, китайские символы проходят через систему синтеза речи, которая старается сохранить оттенки голоса говорящего. Конечно, ошибки весьма вероятны, и перевод может насмешить носителей другого языка, но всё же новая система перевода способна ещё сильнее сократить дистанцию между людьми.


Константин Ходаковский, 3DNews





Последние новости

Подгружаем последние новости