Ю. И. Журавлев, В. В. Рязанов, О. В. Сенько
РАСПОЗНАВАНИЕ
Математические методы. Программная система. Практические применения.
ИЗДАТЕЛЬСТВО ФАЗИС
МОСКВА 2005
Введение
В различных областях человеческой деятельности (экономике, финансах, медицине, бизнесе, геологии, химии, и др. ) повседневно возникает необходимость решения задач анализа, прогноза и диагностики, выявления скрытых зависимостей и поддержки принятия оптимальных решений. Вследствие бурного роста объема информации, развития технологий ее сбора, хранения и организации в базах и хранилищах данных (в том числе интернет-технологий), точные методы анализа информации и моделирования исследуемых объектов зачастую отстают от потребностей реальной жизни.
Здесь требуются универсальные и надежные подходы, пригодные для обработки информации из различных областей, в том числе для решения проблем, которые могут возникнуть в ближайшем будущем. В качестве подобного базиса могут быть использованы технологии и подходы математической теории распознавания и классификации /19, 25, 26/.
Действительно, данные подходы в качестве исходной информации используют лишь наборы описаний-наблюдений объектов, предметов, ситуаций или процессов (выборки прецедентов), при этом каждое отдельное наблюдение-прецедент записывается в виде вектора значений отдельных его свойств-признаков. Выборки признаковых описаний являются простейшими стандартизованными представлениями первичных исходных данных, которые возникают в различных предметных областях в процессе сбора однотипной информации, и которые могут быть использованы для решения следующих задач:
распознавание (классификация, диагностика) ситуаций, явлений, объектов или процессов с обоснованием решений;
прогнозирование ситуаций, явлений, процессов или состояний по выборкам динамических данных;
кластерный анализ и исследование структуры данных;
выявление существенных признаков и нахождение простейших описаний;
нахождение эмпирических закономерностей различного вида;
построение аналитических описаний множеств (классов) объектов;
нахождение нестандартных или критических случаев;
формирование эталонных описаний образов.
Первые работы в области теории распознавания и классификации по прецедентам появились в 30-х годах прошлого столетия и были связаны с байесовской теорией принятия решений (работы Неймана, Пирсона /74/), применением разделяющих функций к задаче классификации (Фишер /63/), решением вопросов проверки гипотез (Вальд /85/). В 50-х годах появились первые нейросетевые модели распознавания (перцептрон Розенблата /48/), связанные с успехами в моделировании головного мозга. К концу 60-х годов уже были разработаны и детально исследованы различные подходы для решения задач распознавания в рамках статистических, перцептронных моделей, и моделей с разделяющими функциями. Итоги данных и последующих исследований были представлены в ряде монографий /1, 2, 8, 11, 25, 30, 31, 33, 41, 45, 48, 55, 57, 58, 64, 73, 75/. Большой вклад в развитие теории распознавания и классификации внесли советские и, в последующем, российские ученые: Айзерман, Браверман, Розоноэр (метод потенциальных функций /2/), Вапник, Червоненкис (статистическая теория распознавания, метод «обобщенный портрет» /11/), Мазуров (метод комитетов /42, 43, 45/), Ивахненко (метод группового учета аргументов /33/), Загоруйко (алгоритмы таксономии и анализа знаний /30, 31/), Лбов (логические методы распознавания и поиска зависимостей /41/).