Исследование и разработка методов и алгоритмов формирования портрета предметной области на основе онтологий

Исследование и разработка методов и алгоритмов формирования портрета предметной области на основе онтологий. 
Руководитель - Рыков В.В.


Проект направлен на решение фундаментальной научной проблемы семантического моделирования, в рамках которой разрабатывается методика автоматизированного выявления иерархических, синонимических и ассоциативных связей из интернет-текстов и построение лингво-статистических портретов различных предметных областей, в частности, по автономным необитаемым подводным аппаратам (АНПА). Исследование основано на гипотезе о том что более общие термины имеют больше ассоциативных связей, а также о привлечении ассоциативных связей для определения значения, полный смысл которого выявляется с помощью контекстных окружений, что дает возможность автоматизации процесса разграничения значений и извлечения знаний из текстов. Решение проблемы строится на основе комплексного подхода, сочетающего методы статистики, корпусной лингвистики и дистрибутивной семантики, и реализуется в технологии, которая предполагает разработку лингво-статистических механизмов формирования ассоциативного портрета предметной области (АППО), представляющего собой словарь значимых терминов предметной области, элементы которого связаны ассоциативными и иерархическими связями. АППО создается автоматически на базе статистического анализа больших объемов текстов из Интернет. Иерархические связи, входящие в АППО, образуют полииерархию и классификатор, облегчающие поиск и навигацию в предметной области АНПА (ПО АНПА). Подобная методика позволяет решать широкий класс задач, как в области когнитивной семантики, так и информационно-поисковых, так как АППО может в большинстве случаев, связанных с контекстным поиском, заменить или дополнить тезаурус/онтологию предметной области, составление которого вручную представляет собой весьма трудоемкую задачу. Дополнительно проект затрагивает следующие задачи: мониторинга новых объектов, фактов и идей в ПО АНПА, автоматическая классификация новых объектов по классификатору АППО, в частности, вид/тип аппарата АНПА, его характеристики, компания призводитель, ее руководство, сотрудники, конкуренты, партнеры и т.д., как часто упоминается объект в различные периоды времени, тональность сообщений, источник информации, установление границ предметной области; развитие интеллектуальных Интернет-технологий; автоматизированное формирование интерактивных предметно-ориентированных энциклопедий; визуализация результатов интерактивного сетевого поиска (визуальные карты предметной области).
Comments