Библиотечка
журнала
УДК 025. 4
Басенин Б. А. , Афонин С. А. , Козицын А. С. Автоматизированная система
тематического анализа
информации
Рассматриваются некоторые аспекты практической реализации формальных моделей,
архитектурных и технологических решений, которые могут использоваться в
специализированных поисковых информационных системах для интеллектуальной обработки
текстовых данных. Приводится описание разработанного на их основе прототипа
автоматизированной системы для тематического анализа информации, которая является второй
версией разработанной ранее автоматизированной системы информационного обеспечения. Рассматриваемая в работе система предназначена для поиска информации и
тематической фильтрации входящего информационного потока и ориентирована, в первую очередь,
на использование в сети Интернет, либо в крупной корпоративной информационной
системе. Ключевые слова: коллекции документов, автоматическая обработка, значимость,
информация, поисковые системы, индексация текстов. Vasenin V. A. , Afonin S. A. , Koatsyn A. S. Automated System for Thematic
Information Analysis
In this paper some practical aspects of a large-scale intellectual information processing system
development are considered. The description of such system developed by the authors is presented. Keyword: collections of documents, automatic processing, significance, information, search engine,
text indexing. Введение 2
1. Архитектурно-технологический каркас 4
2. Сбор информации 13
3. Обработка и загрузка информации '. 16
4. Алгоритмы обучения системы 19
5. Поиск и мониторинг. . 23
6. Перспективные направления развития 26
Заключение 30
Список литературы 30
Главный редактор
НОРЕНКОВ И. П. Зам. гл. редактора
ФИЛИМОНОВ Н. Б. Редакционная
коллегия:
АВДОШИН С. М. АНТОНОВ Б. И. БАТИЩЕВ Д. И. БАРСКИЙ А. Б. БОЖКО А. Н. ВАСЕНИН В. А. ГАЛУШКИН А. И. ГЛОРИОЗОВ Е. Л. ГОРБАТОВ В. А. ДОМРАЧЕВ В. Г.
ЗАГИДУЛЛИН Р. Ш. ЗАРУБИН В. С. ИВАННИКОВ А. Д. ИСАЕНКО Р. О. КОЛИН К. К. КУЛАГИН В. П. КУРЕЙЧИК В. М. ЛЬВОВИЧ Я. Е. МАЛЬЦЕВ П. П. МЕДВЕДЕВ Н. В. МИХАЙЛОВ Б. М. НАРИНЬЯНИ А. С. НЕЧАЕВ В. В. ПАВЛОВ В. В. ПУЗАНКОВ Д. В. РЯБОВ Г. Г. СОКОЛОВ Б. В. СТЕМПКОВСКИЙ А. Л. ЧЕРМОШЕНЦЕВ С. Ф. УСКОВ В. Л. ШИЛОВ В. В. Ю. ГРИГОРИН-РЯБОВАЕ. В. ЛЫСЕНКО А. В. ЧУГУНОВАА. В. © Издательство "Новые технологии", "Информационные технологии", Приложение, 2009
Введение
Быстрое развитие средств хранения, обработки
и передачи данных в течение последней четверти
века повлекло за собой еще более быстрое
увеличение объемов разноплановой информации,
представленной в метасети Интернет. От способов ее
извлечения, систематизации и оперативного
анализа сегодня зависит успех деятельности не только
в науке, технике и образовании, но и в области
материального производства, в
социально-экономической и политической сферах. Эффективность деятельности многих
хозяйствующих субъектов в настоящее время определяется
своевременностью, полнотой и качеством шлучде-
мой ими информации, а также возможностями по
ее обработке под свои потребности.