Многоязычный веб-словарь нуждается в людях

У исследователей искусственного интеллекта есть мечта: нажал на кнопку — и получил перевод с любого языка на любой.

Системы автоматизированного перевода уже имеются. Но если вы издатель, который собрался познакомить со своим журналом читателей другой страны, или лектор, выступающий перед иностранцами, переводчик из плоти и крови по-прежнему незаменим.


Поддержите проект — купите часы суахили всего за $25,98!
Антрополог и лексикограф Мартин Бенджамин предложил радикальный способ изменить эту ситуацию. Современные алгоритмы машинного перевода в значительной степени полагаются на статистический метод: компьютеры научились переводить путём поиска соответствий в текстах, переведённых людьми. Г-н Бенджамин считает, что пора снова обратиться за помощью к коллегам по человечеству.

На этой неделе он открыл веб-сервис Kamusi — многоязычный словарь, который при должном финансировании (у вас не завалялось лишнего миллиона?) мог бы объять все мировые языки. Дело в том, что, в отличие от других онлайновых словарей, Kamusi основан не столько на словах, сколько на понятиях. Скажем, слово «весна» связано не только с темой «времена года», но и с понятием времени года, предшествующего лету. А слово «прыжок» — с понятием резкого движения вверх и (или) вперёд. Кстати, в английском языке тому и другому соответствует одна словоформа — spring.

Такая структура способна решить одну из самых больших проблем машинного перевода. Введите в гуглопереводчик английскую фразу «She walked along with a spring in her step» и попробуйте перевести на русский. В качестве эквивалента слова «spring» машина выберет «весну», и получится белиберда. На русском это будет выглядеть так: «Она шла вместе с весной в её шаге», хотя чуть правильней будет следующее: «Она шла бодрым шагом». Неспособность компьютеров справиться с омонимами (словами с одинаковой лексемой, но разными семемами) — одна из причин, по которой машинный перевод порой выглядит очень смешно.

Поэтому Kamusi просит пользователя указать, с какой именно темой связано слово. В демоверсию включено 100 слов на 15 языках. Русского нет, зато есть хорошо знакомые читателям «КЛ» суахили и японский.

Алгоритмический подход выбран «Гуглом», «Яндексом», «Промтом» и другими не напрасно: это дёшево, быстро и абы как. Г-ну Бенджамину требуются двуязычные соратники, которые будут составлять словари, а это дорого и медленно.

Kamusi полагается на добровольцев и грант Национального фонда гуманитарных наук США. Создатель полагает, что в первую очередь сотрудничать с ним захотят представители языковых меньшинств, ведь они смогут сопоставить свои слова с лексикой более популярных языков, которые уже есть в словаре. Кроме того, г-н Бенджамин ставит на компании, которые занимаются бизнесом в Африке, то есть на континенте, который плохо обслуживается словарями: мол, они согласятся заплатить за то, чтобы местные языки были лучше представлены на Kamusi.

Как бы то ни было, решения задачи это не облегчит. По расчётам г-на Бенджамина, добавление нового понятия обойдётся приблизительно в $5. 10 тыс. понятий на 100 языках — это $5 млн...

Подготовлено по материалам NewScientist.






Интересные новости
В Індії пропонують $1 мільйон за розшифровку писемності стародавньої цивілізаціїВ Індії пропонують $1 мільйон за розшифровку писемності стародавньої цивілізації
В Німеччині реставратори натрапили на скарб монет у церкві, де проповідував Мартін ЛютерВ Німеччині реставратори натрапили на скарб монет у церкві, де проповідував Мартін Лютер
Блок рекламы


Похожие новости

В США одобрили испытания на людях интерфейса мозг-компьютер компании Synchron
Имплантат для стимуляции мозга протестировали на людях
В Израиле разработали вакцину против коронавируса и готовы начать испытания на людях
Ученые Имперского колледжа Лондона начинают тестирование потенциальной вакцины от COVID-19 на людях
В Великобритании начинается испытание потенциальной вакцины от коронавируса на людях
Робота-микрохирурга испытали на живых людях
Маск хочет испытать беспроводной интерфейс «компьютер-мозг» на людях в следующем году
Геномное редактирование на живых людях начало показывать результаты
Через 4 года гаджеты будут знать о людях больше, чем члены семьи
Американские ученые будут проводить исследования загрязненного воздуха на людях-добровольцах
Последние новости

Подгружаем последние новости