Microsoft откроет исходный код оптимизированной модели BERT

Команда Microsoft Research AI объявила, что планирует открыть исходный код оптимизированной версии модели Google BERT, созданной для работы с движком ONNX Runtime.

В настоящее время использование ONNX Runtime позволяет сократить задержки в работе BERT при реализации языкового представления для поисковой системы Bing.

Теперь разработчики смогут внедрять BERT, используя ONNX Runtime и графический процессор Nvidia V100 с задержкой всего лишь 1,7 миллисекунды, что ранее было доступно только для крупных технологических компаний.

Оптимизированная модель Google BERT, созданная Microsoft, является результатом сотрудничества между командами Azure AI и Microsoft Research AI.

Подробнее об открытом обмене нейронными сетями (ONNX) можно прочитать здесь.

Напомним, что Google объявил о запуске BERT Update, который помогает поисковой системе лучше понимать запросы на естественном языке, в октябре минувшего года. При этом Bing начал использовать подобные BERT модели ещё в апреле 2019 года.

searchengines.ru