Главная > Интеллектуальные системы > Введение в статистическую теорию распознавания образов
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Глава 1. ВВЕДЕНИЕ

В данной книге рассмотрены основные математические методы, применяемые для описания статистических процессов принятия решений в задаче распознавания образов. Интуитивно ясно, что до некоторой степени процесс принятия решений человеком имеет отношение к распознаванию образов; например, в шахматной игре следующий ход делается в зависимости от ситуации (образа), сложившейся в данный момент времени на шахматной доске; решение о том, покупать или продавать акции на бирже, также принимается в результате анализа сложного информационного образа. Поэтому целью создания теории распознавания образов являлось выявление сложных механизмов процессов принятия решений, а также автоматизация этих процессов с помощью средств вычислительной техники.

Однако ввиду сложности проблемы распознавания образов основные исследования в этой области были сосредоточены на более реальных задачах, таких как распознавание букв латинского алфавита и классификация кривых. Задачей настоящей книги является рассмотрение математических моделей такого рода практических задач и изложение основных математических методов их решения. Несмотря на то что в литературе предложено много подходов для описания и более сложных процессов принятия решений, анализ этих подходов лежит вне круга вопросов, затронутых в данной книге.

§ 1.1. Формулировка задачи распознавания образов

Многие важные приложения теории распознавания образов относятся к задачам классификации кривых и геометрических фигур. Рассмотрим, например, задачу диагностики неисправности машины (которая может находиться как в исправном, так и в неисправном состояниях) по шуму, издаваемому в процессе ее работы и регистрируемому микрофоном. Форма кривой напряжения, измеренного на выходе микрофона, является

характеристикой того, исправна машина или неисправна, и задача диагностики сводится к классификации кривых, полученных от исправных и неисправных машин. (С другой стороны, распознавание печатных букв английского алфавита соответствует задаче классификации геометрических фигур.)

Для того чтобы осуществить рассматриваемый тип классификации, вначале необходимо «закодировать» объект, т. е. измерить некоторые наблюдаемые его характеристики. Наиболее простой путь состоит в том, чтобы в качестве таких характеристик выбрать значения ординат кривой выходного напряжения микрофона, измеренные в различные моменты времени (рис. 1.1, а), а в случае распознавания букв — степень заштрихованности клеток как показано на рис. 1.1, б.

Рис. 1.1. (см. скан) Кодирование объектов, а) Кривая, б) буква.

Такие измерений образуют вектор X.

Заметим, что даже при нормальных условиях работы машины наблюдаемые кривые отличаются друг от друга. Поэтому является случайной величиной и будет обозначаться полужирной буквой Таким же образом X называется случайным вектором,

если его компоненты являются случайными величинами, и обозначается X.

Подобные же соображения распространяются и на буквы: наблюдение имеет разные значения для различных написаний одной и той же буквы А, и поэтому также является случайной величиной, случайным вектором.

Таким образом, каждая кривая или буква выражается вектором в -мерном пространстве, а множество кривых или букв образуют распределение вектора X в -мерном пространстве. На рис. 1.2 изображен простой двумерный пример двух распределений, соответствующих исправному и неисправному состоянию машины. Если из прошлого опыта эти два распределения вектора X известны, то можно установить между ними границу которая делит двумерное пространство на две области. Таким образом, при рассмотрении новой кривой в зависимости от знака функции можно решить, соответствует ли эта кривая исправному или неисправному состоянию машины.

Функцию называют дискриминантной функцией, а техническое устройство, определяющее знак -блоком распознавания образов или классификатором. На рис. 1.3 изображена блок-схема классификатора в -мерном пространстве.

Рис. 1.2. Распределение вектора X для исправного и неисправного состояний машины.

Рис. 1.3. Блок-схема классификатора.

Для того чтобы спроектировать классификатор, нужно изучить характеристики распределения вектора X для каждого класса и определить соответствующую дискриминантную функцию.

Ранее был рассмотрен весьма простой способ выполнения измерений. Так как каждое из подобных измерений дает очень

мало информации об объекте, то на практике обычно требуется большое число измерений которое может доходить до нескольких сотен или тысяч. Такая высокая размерность затрудняет решение многих задач распознавания образов. С другой стороны, классификация, производимая человеком, обычно основывается на небольшом числе признаков, как например, максимальная величина, основная частота и т. д. Каждое из этих измерений несет значительную информацию для целей классификации и выбирается в соответствии с физическим смыслом задачи.

Очевидно, что с уменьшением числа входных величин классификатора его проектирование упрощается. Для того чтобы добиться этого, следует наметить некоторые пути для выбора или извлечения существенных информативных признаков из всей совокупности наблюдаемых. Эту задачу называют задачей выбора информативных признаков, и она составляет другой важный раздел теории распознавания образов. Выбор признаков можно рассматривать как отображение исходного -мерного пространства в пространство меньшей размерности. При этом необходимо сохранить свойство разделимости распределений, соответствующих разным классам. Следовательно, отображение должно быть выполнено без существенной потери этого свойства.

Таким образом, как показано на рис. 1.4, задача распознавания образов состоит из двух частей: выбор информативных признаков и проектирование классификатора.

Рис. 1.4. Блок-схема системы распознавания образов.

На практике между этими частями нет четкой границы. Действительно, классификатор можно представить как устройство для выбора признаков, которое отображает признаков в один (дискриминантная функция). Однако в данной книге удобно разделить задачу распознавания на две части и изучать их независимо друг от друга.

<< Предыдущий параграф Следующий параграф >>
Оглавление