Новостей.COM ⇒
⇓
2007-10-29
RCO выпустила новый пакет программ для компьютерного анализа текста RCO Fact Extractor SDK
Компания “ЭР СИ О” выпустила новый пакет программ RCO Fact Extractor SDK, представляющий собой комплексный инструментарий для разработки информационно-поисковых и аналитических систем, требующих лингвистического анализа текста на русском языке.
Ядро пакета представляет библиотека RCO FX Ru, которая осуществляет полный синтактико-семантический разбор русского текста. Библиотека выделяет различные классы сущностей, упомянутых в тексте (персоны, организации, география, предметы, действия, атрибуты и др.), и строит сеть отношений, связывающих эти сущности, а также предоставляет всю грамматическую информацию о составляющих текста. Средства библиотеки также обеспечивают семантическую интерпретацию результатов разбора текста - поиск описаний ситуаций, удовлетворяющих заданным семантическим шаблонам.
В состав лингвистического обеспечения пакета, помимо общих словарей и правил русского языка, входят правила выделения специальных объектов (дат, адресов, документов, телефонов, денежных сумм, марок автомобилей и пр.), шаблоны для распознавания различных классов событий и фактов (сделок, биографических фактов, конфликтов, экономических показателей и пр.), характеристик объекта (позитива, негатива и др.), высказываний прямой и косвенной речи.
Дополнительно в состав пакета RCO Fact Extractor SDK входят исходные коды приложений на С++, иллюстрирующие использование библиотеки RCO FX Ru для решения типовых задач, встающих перед разработчиками прикладных информационных систем.
Как отмечают в компании, при создании нового продукта преследовалась цель объединения в нем всех ранее выпущенных и используемых клиентами RCO модулей анализа текста, с добавлением новых функций. В результате новый RCO Fact Extractor включил в себя все возможности, реализованные ранее в библиотеках RCO Pattern Extractor, RCO Syntactic Engine, RCO Semantic Network, RCO Entity Extractor, предоставив единообразный программный интерфейс ко всем результатам анализа текста.
RCO Fact Extractor SDK работает на платформах Windows и Unix. Выпускается в редакциях Standard, Standard Plus, Professional и Exclusive. Лицензируется по количеству процессоров.
Ядро пакета представляет библиотека RCO FX Ru, которая осуществляет полный синтактико-семантический разбор русского текста. Библиотека выделяет различные классы сущностей, упомянутых в тексте (персоны, организации, география, предметы, действия, атрибуты и др.), и строит сеть отношений, связывающих эти сущности, а также предоставляет всю грамматическую информацию о составляющих текста. Средства библиотеки также обеспечивают семантическую интерпретацию результатов разбора текста - поиск описаний ситуаций, удовлетворяющих заданным семантическим шаблонам.
В состав лингвистического обеспечения пакета, помимо общих словарей и правил русского языка, входят правила выделения специальных объектов (дат, адресов, документов, телефонов, денежных сумм, марок автомобилей и пр.), шаблоны для распознавания различных классов событий и фактов (сделок, биографических фактов, конфликтов, экономических показателей и пр.), характеристик объекта (позитива, негатива и др.), высказываний прямой и косвенной речи.
Дополнительно в состав пакета RCO Fact Extractor SDK входят исходные коды приложений на С++, иллюстрирующие использование библиотеки RCO FX Ru для решения типовых задач, встающих перед разработчиками прикладных информационных систем.
Как отмечают в компании, при создании нового продукта преследовалась цель объединения в нем всех ранее выпущенных и используемых клиентами RCO модулей анализа текста, с добавлением новых функций. В результате новый RCO Fact Extractor включил в себя все возможности, реализованные ранее в библиотеках RCO Pattern Extractor, RCO Syntactic Engine, RCO Semantic Network, RCO Entity Extractor, предоставив единообразный программный интерфейс ко всем результатам анализа текста.
RCO Fact Extractor SDK работает на платформах Windows и Unix. Выпускается в редакциях Standard, Standard Plus, Professional и Exclusive. Лицензируется по количеству процессоров.