Google Переводчик научат транскрибировать живую речь в текст
Google планирует добавить в приложение Переводчика для Android функцию транскрибации речи в текст.
Новая функция позволит пользователям записывать аудио на одном языке, а видеть текст – на другом, и всё это в режиме реального времени.
На данный момент эта функция находится на стадии прототипа, но вчера Google уже продемонстрировал демо-версию технологии в своём офисе в Сан-Франциско.
На момент запуска функция, работающая на основе ИИ, будет требовать подключения к интернету. Согласно Google, осуществление перевода в таком режиме является более сложным процессом, чем перевод написанного текста или ввод отдельных предложений для получения текста на другом языке.
С аудиофайлами эта функция пока работать не будет. Пользователям нужно будет записывать живую речь с помощью микрофона на смартфоне.
В процессе «прослушивания» речи Google Переводчик будет выделять отдельные приложения, а затем добавлять знаки пунктуации и исправлять слова, исходя из контекста предложения. При этом он также будет определять и учитывать региональные акценты и диалекты.
На начальном этапе пользователи будут получать приблизительный текст – точность не будет равна 100%. Но со временем, по мере обучения ИИ-моделей, точность будет расти.
Что касается сроков запуска, то на данный момент они ещё не установлены. Пока известно лишь то, что эта функция станет доступна «в будущем».