В OCR-системе Google Docs появилась поддержка русского языка

Спустя восемь месяцев после включения в состав Google Docs механизма оптического распознавания текста из PDF-файлов или изображений форматов JPG, GIF, PNG, разработчики онлайнового офисного пакета сообщили о расширении списка поддерживаемых OCR-системой языков. Теперь алгоритмы последней обеспечивают распознавание текстов на 34 языках, включая русский.

Элементы управления OCR-модулем расположены на странице загрузки файлов в Google Docs. Достаточно выставить галочку напротив опции "Преобразовывать текст из PDF-файлов или изображений в формат документов Google", и система автоматически извлечет из отсканированных документов и цифровых фотографий текстовые данные для их последующей правки в текстовом редакторе.

Максимальный размер изображений перечисленных выше форматов и PDF-файлов составляет 2 Мбайта. В PDF-документах при поиске текста для распознавания просматриваются только первые десять страниц. С прочими ограничениями и особенностями OCR-системы можно ознакомиться на этой странице прилагаемой к Google Docs документации.

В компании отмечают, что OCR-система Google Docs была разработана в сотрудничестве с командой проекта Google Books. По словам специалистов, распознавание лучше всего работает с изображениями в высоком разрешении, при этом алгоритмы системы не всегда хорошо справляются с сохранением стилевого оформления документов. Для того чтобы у пользователя была возможность быстро исправить ошибки распознавания, в обработанный документ включается оригинал изображения.


Андрей Крупин, 3DNews

Коды для вставки в блог\форум




Интересные новости
Canon взломан: сервера лежат, информация украдена, хакеры требуют денегCanon взломан: сервера лежат, информация украдена, хакеры требуют денег
Биржа Bitfinex заплатит $400 миллионов за поимку взломавших ее хакеровБиржа Bitfinex заплатит $400 миллионов за поимку взломавших ее хакеров
Состояние Марка Цукерберга впервые превысило $100 миллиардовСостояние Марка Цукерберга впервые превысило $100 миллиардов
В Новой Каховке мошенники под видом интернет-ломбарда обманули граждан на 0,5 млн гривеньВ Новой Каховке мошенники под видом интернет-ломбарда обманули граждан на 0,5 млн гривень
Facebook запустил обновленный чат-плагин для бизнесаFacebook запустил обновленный чат-плагин для бизнеса
Блок рекламы


Похожие новости

Пользователи Google+ получат по $12 компенсаций за утечку личных данныхПользователи Google+ получат по $12 компенсаций за утечку личных данных
Сила монополии: Google удалит всю лицензионную датскую музыку с YouTubeСила монополии: Google удалит всю лицензионную датскую музыку с YouTube
Отчёт Alphabet: доходы Google упали впервые в истории, но YouTube это не коснулосьОтчёт Alphabet: доходы Google упали впервые в истории, но YouTube это не коснулось
Сотрудники Google будут работать удаленно до июля 2021 годаСотрудники Google будут работать удаленно до июля 2021 года
Стив Возняк подал в суд на YouTube и Google. От его имени раздают биткоиныСтив Возняк подал в суд на YouTube и Google. От его имени раздают биткоины
Google уличили в предвзятом ранжировании результатов поиска. СноваGoogle уличили в предвзятом ранжировании результатов поиска. Снова
Google впервые будет платить СМИ за новостиGoogle впервые будет платить СМИ за новости
Google выплатит по $1000 всем сотрудникам, работающим из домаGoogle выплатит по $1000 всем сотрудникам, работающим из дома
Умер основатель крупнейшего белорусского портала Юрий ЗиссерУмер основатель крупнейшего белорусского портала Юрий Зиссер
Сотрудники Google, Facebook и других гигантов будут работать из дому до конца годаСотрудники Google, Facebook и других гигантов будут работать из дому до конца года
Последние новости

Подгружаем последние новости