В OCR-системе Google Docs появилась поддержка русского языка

Спустя восемь месяцев после включения в состав Google Docs механизма оптического распознавания текста из PDF-файлов или изображений форматов JPG, GIF, PNG, разработчики онлайнового офисного пакета сообщили о расширении списка поддерживаемых OCR-системой языков. Теперь алгоритмы последней обеспечивают распознавание текстов на 34 языках, включая русский.

Элементы управления OCR-модулем расположены на странице загрузки файлов в Google Docs. Достаточно выставить галочку напротив опции "Преобразовывать текст из PDF-файлов или изображений в формат документов Google", и система автоматически извлечет из отсканированных документов и цифровых фотографий текстовые данные для их последующей правки в текстовом редакторе.

Максимальный размер изображений перечисленных выше форматов и PDF-файлов составляет 2 Мбайта. В PDF-документах при поиске текста для распознавания просматриваются только первые десять страниц. С прочими ограничениями и особенностями OCR-системы можно ознакомиться на этой странице прилагаемой к Google Docs документации.

В компании отмечают, что OCR-система Google Docs была разработана в сотрудничестве с командой проекта Google Books. По словам специалистов, распознавание лучше всего работает с изображениями в высоком разрешении, при этом алгоритмы системы не всегда хорошо справляются с сохранением стилевого оформления документов. Для того чтобы у пользователя была возможность быстро исправить ошибки распознавания, в обработанный документ включается оригинал изображения.


Андрей Крупин, 3DNews

Коды для вставки в блог\форум




Интересные новости
Основатели Google Сергей Брин и Ларри Пейдж решили выйти из руководства AlphabetОснователи Google Сергей Брин и Ларри Пейдж решили выйти из руководства Alphabet
В ЕС начали расследовать, как Google cобирает данныеВ ЕС начали расследовать, как Google cобирает данные
В Google News сбоит функция подачи заявки на добавление сайтаВ Google News сбоит функция подачи заявки на добавление сайта
В Киберпонедельник онлайн-продажи в США достигли $9,2 млрдВ Киберпонедельник онлайн-продажи в США достигли $9,2 млрд
Песенный портал Genius подал иск против Google и LyricFind на $50 млнПесенный портал Genius подал иск против Google и LyricFind на $50 млн
Блок рекламы


Похожие новости

Google позволит отслеживать посылки прямо в результатах поискаGoogle позволит отслеживать посылки прямо в результатах поиска
Google опубликовал простое и понятное видео о том, как работает поискGoogle опубликовал простое и понятное видео о том, как работает поиск
В Google Картинках больше нельзя задать свой диапазон дат для поискаВ Google Картинках больше нельзя задать свой диапазон дат для поиска
Песенный портал Genius подал иск против Google и LyricFind на $50 млнПесенный портал Genius подал иск против Google и LyricFind на $50 млн
Основатели Google Сергей Брин и Ларри Пейдж решили выйти из руководства AlphabetОснователи Google Сергей Брин и Ларри Пейдж решили выйти из руководства Alphabet
В Google News сбоит функция подачи заявки на добавление сайтаВ Google News сбоит функция подачи заявки на добавление сайта
Facebook позволит копировать фотографии из соцсети в Google PhotosFacebook позволит копировать фотографии из соцсети в Google Photos
Google об абсолютных и относительных URL для внутренних ссылокGoogle об абсолютных и относительных URL для внутренних ссылок
Google рекомендует при синдикации контента использовать rel=canonicalGoogle рекомендует при синдикации контента использовать rel=canonical
В ЕС начали расследовать, как Google cобирает данныеВ ЕС начали расследовать, как Google cобирает данные
Последние новости

Подгружаем последние новости