Читать онлайн «Онтологии и тезаурусы. Модели, инструменты, приложения»

Автор Владимир Иванов

ОНТОЛОГИИ И ТЕЗАУРУСЫ Учебное пособие Соловьев В. Д. , Добров Б. В. , Иванов В. В. , Лукашевич Н. В. Казань, Москва 2006 1 АННОТАЦИЯ Предлагаемый курс направлен на формирование базовых знаний об онтологиях и тезаурусах и практических навыков по проектированию и применению онтологий при разработке компонентов интеллектуального программного обеспечения. Курс знакомит студентов с основными понятиями области представления знаний, примерами лучшего опыта в разработке систем основанных на онтологиях и тезаурусах, описывает задачи, решаемые с их помощью, а также набор инструментальных средств проектирования и представления онтологий и информационно-поисковых тезаурусов. Центральное место в курсе отводится тематике информационного поиска. Подробно рассматриваются как традиционные методы поиска: по ключевым словам, основанные на техниках двоичного поиска, ранжированного поиска и вероятностных моделях, так и подходы к улучшению качества поиска с помощью тезаурусов и онтологий. В части лекций, посвященных проектированию онтологий, наравне с описанием классических и современных методологий внимание уделяется разбору примеров реальных проектов. Данное пособие предназначено для пояснения основных положений материалов лекций (в виде слайдов презентаций), которые являются основной частью курса. Курс разработан в Российском научно-образовательном центре по лингвистике им. И. А. Бодуэна де Куртенэ в рамках программы создания серии инновационных курсов. В настоящее время курс читается на факультете ВМиК Казанского государственного университета. Разные фрагменты курса апробировались ранее в курсах, читавшихся в Казанском государственном университете: • В. Д. Соловьевым на ф-те ВМК осенью 2005 г. “Обработка естественного языка on-line”; • В. Д.
Соловьевым на ф-те ВМК осенью 2004 г. “Информационный поиск, категоризация текстов, автоматическое резюмирование” и в Московском государственном университете: • Н. В. Лукашевич на филологическом факультете весной 2003 г. "Автоматическая обработка больших текстовых коллекций"; 2 • Н. В. Лукашевич на филологическом факультете осенью 2003 г. "Лингвистические онтологии для автоматической обработки текстов"; • Б. В. Добровым на факультете ВМиК осенью 2004 г. "Интеллектуальные информационные технологии (знания и машинное обучение в информационном поиске)"; • Н. В. Лукашевич на факультете ВМиК весной 2005 г. "Онтологии и автоматическая обработка текстов". Данный курс также основан на материале лекций, прочитанных Н. В. Лукашевич на Казанских школах по компьютерной лингвистике в 2001- 2004 гг. Предлагаемый курс был назван победителем: • открытого конкурса учебных курсов в области разработки программного обеспечения, организованного компанией Microsoft и факультетом вычислительной математики и кибернетики МГУ им. М. В. Ломоносова в 2006 году; • конкурса учебных курсов по информационному поиску «Класс 2006», организованного компанией Яндекс.