Microsoft совершил прорыв в области распознавания речи
Специалисты Microsoft
«Мы достигли равенства с человеком. Это революционный результат», — заявил главный научный сотрудник по речевым технологиям Microsoft Сюэ Дун Хуан (Xuedong Huang).
На фото – сотрудники исследовательской группы Speech & Dialog, работавшие над созданием новой технологии.Новая система демонстрирует беспрецедентную точность распознавания речи. По данным Microsoft, процент неправильно распознанных слов у неё составляет 5,9%. Примерно такой же результат был получен среди профессиональных транскрибаторов – специалистов, которые занимаются переводом аудио- и видеозаписей в текст.
Система использует нейронные языковые модели, которые группируют похожие слова и делают возможным правильное обобщение. Microsoft планирует использовать эту технологию в Cortana.
Достигнутые результаты впечатляют. Однако компании ещё есть над чем работать. Пока технология используется в условиях ограниченного круга речевых ситуаций и голосов. В реальной жизни они намного разнообразнее. Что касается Cortana, искусственному интеллекту нужно научиться не только распознавать слова, но и понимать из значение и действовать сообразно с этим пониманием.
Напомним, что в начале этого месяца Microsoft объявил о создании нового подразделения Microsoft AI and Research Group. В его рамках компания объединила инженеров и научных сотрудников, которые занимаются разработками в области искусственного интеллекта (ИИ). Группа насчитывает более 5 тысяч человек.