Читать онлайн «Информационно-поисковые системы»

Автор В. П. Захаров

Санкт-Петербургский государственный университет
Филологический факультет
Кафедра математической лингвистики






В. П. Захаров




ИнформационнО-ПОИСКОВЫЕ системы


Учебно-методическое пособие








Санкт-Петербург
2005
ББК 73:81. 1
З-38
Рецензенты:
докт. техн. наук В. Ш. Рубашкин (С. -Петерб. гос. ун-т)
канд. пед. наук О. А. Арбатская (С. -Петерб. гос. ун-т культ. и иск-в)

Печатается по постановлению Редакционно-издательского совета С. -Петербургского государственного университета


Захаров В. П.
З-38 Информационно-поисковые системы: Учебно-метод. пособие.  — СПб. , 2005.  — 48 с.

Предлагаемое пособие содержит описание основ документального информационного поиска, программу учебной дисциплины «Теория информационного поиска», которая изучается студентами 3-го курса отделения структурной и прикладной лингвистики Санкт-Петербургского государственного университета, и набор лабораторных (практических) работ по этой дисциплине.
Отдельные лабораторные работы используются для обучения студентов других курсов и по другим дисциплинам. Пособие базируется на исследовательской и преподавательской деятельности автора.
Для студентов и аспирантов, специализирующихся в области прикладной лингвистики, информационных систем и автоматизированных систем обработки текста.
ББК 73:81. 1







( В. П. Захаров, 2005
( Санкт-Петербургский государственный университет, 2005

1. Введение в теорию и практику информационного поиска
1. 1. Основные понятия информационного поиска
Информационно-поисковая система (ИПС) — это упорядоченная совокупность документов (массивов документов) и информационных технологий, предназначенных для хранения и поиска информации — текстов (документов) или данных (фактов). Информационно-поиско-выми системами являются любые определенным образом организованные хранилища информации. Причем информационно-поисковые системы могут быть и неавтоматизированными. Главное — это целевая функция: хранение и поиск информации.
В зависимости от объекта хранения и типа запроса различают два вида информационного поиска: документальный и фактографический — и, соответственно, два типа ИПС — документальные и фактографические. Последние также называют информационно-справочными ИПС.
Документальными называются ИПС, в которых реализуется поиск по тематическим запросам в массиве документов или текстов с последующим предоставлением пользователю подмножества этих документов или их копий. Понятие документа может меняться от системы к системе. В общем случае это некий информационный объект, зафиксированный (обычно посредством некоторой знаковой системы) на каком-то материальном носителе (бумага, фото- и кинопленка, магнитная память и т. п. ) и предназначенный для передачи в пространстве и времени в системе социальных коммуникаций.
Фактографические ИПС реализуют хранение, поиск и выдачу непосредственно фактических данных (научных, технических, экономических характеристик и свойств объектов, процессов, явлений, адресов, наименований, количественных данных и т. п. ).
Главное, сущностное, различие между документальным и фактографическим поиском заключается в подходе к семантике документов.