ОНТОЛОГИИ И ТЕЗАУРУСЫ
Учебное пособие
Соловьев В. Д. , Добров Б. В. , Иванов В. В. , Лукашевич Н. В. Казань, Москва
2006
1
АННОТАЦИЯ
Предлагаемый курс направлен на формирование базовых знаний об
онтологиях и тезаурусах и практических навыков по проектированию и
применению онтологий при разработке компонентов интеллектуального
программного обеспечения. Курс знакомит студентов с основными
понятиями области представления знаний, примерами лучшего опыта в
разработке систем основанных на онтологиях и тезаурусах, описывает задачи,
решаемые с их помощью, а также набор инструментальных средств
проектирования и представления онтологий и информационно-поисковых
тезаурусов. Центральное место в курсе отводится тематике информационного
поиска. Подробно рассматриваются как традиционные методы поиска: по
ключевым словам, основанные на техниках двоичного поиска,
ранжированного поиска и вероятностных моделях, так и подходы к
улучшению качества поиска с помощью тезаурусов и онтологий. В части
лекций, посвященных проектированию онтологий, наравне с описанием
классических и современных методологий внимание уделяется разбору
примеров реальных проектов. Данное пособие предназначено для пояснения основных положений
материалов лекций (в виде слайдов презентаций), которые являются основной
частью курса. Курс разработан в Российском научно-образовательном центре по
лингвистике им. И. А. Бодуэна де Куртенэ в рамках программы создания серии
инновационных курсов. В настоящее время курс читается на факультете ВМиК Казанского
государственного университета. Разные фрагменты курса апробировались ранее в курсах, читавшихся в
Казанском государственном университете:
• В. Д. Соловьевым на ф-те ВМК осенью 2005 г. “Обработка
естественного языка on-line”;
• В. Д.
Соловьевым на ф-те ВМК осенью 2004 г. “Информационный
поиск, категоризация текстов, автоматическое резюмирование”
и в Московском государственном университете:
• Н. В. Лукашевич на филологическом факультете весной 2003 г.
"Автоматическая обработка больших текстовых коллекций";
2
• Н. В. Лукашевич на филологическом факультете осенью 2003 г.
"Лингвистические онтологии для автоматической обработки текстов";
• Б. В. Добровым на факультете ВМиК осенью 2004 г.
"Интеллектуальные информационные технологии (знания и машинное
обучение в информационном поиске)";
• Н. В. Лукашевич на факультете ВМиК весной 2005 г. "Онтологии и
автоматическая обработка текстов". Данный курс также основан на материале лекций, прочитанных
Н. В. Лукашевич на Казанских школах по компьютерной лингвистике в 2001-
2004 гг. Предлагаемый курс был назван победителем:
• открытого конкурса учебных курсов в области разработки
программного обеспечения, организованного компанией Microsoft и
факультетом вычислительной математики и кибернетики
МГУ им. М. В. Ломоносова в 2006 году;
• конкурса учебных курсов по информационному поиску «Класс 2006»,
организованного компанией Яндекс.