Главная > Интеллектуальные системы > Искусственный интеллект (Э. Хант)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

6.4.3. Замечание относительно надежности

Процедуры последовательной классификации образов иногда подвергаются критике за их уязвимость относительно ошибок при предъявлении выборки. Поскольку формируется при анализе случайной выборки может оказаться, что на некотором этапе распознавания образов „неверное измерение, т. е. измерение, подходящее для предсказания имен классов в рамках расссматриваемой

выборки, а не всего множества объектов, будет включено в строящуюся процедуру классификации. На этапе классификации уже нет возможности исправить эту ошибку. Графически это интерпретируется так: после того как объект попал на неправильную ветвь, на правильную ветвь вернуться нельзя

Обойти эту трудность предполагалось (Хант, 1967) так: во время распознавания образов надо вычислять статистические оценки, указывающие доверительность, с которой можно экстраполировать классификационное отношение, наблюдаемое в некоторой выборке из рассматриваемого множества. Для оценки предполагалось использовать меру близости хи-квадрат.

Чтобы приспособить эту меру для распознавания образов, введем следующие обозначения:

Мы хотим оценить степень случайности связи между именем класса и значением измерения, определяемым таблицами, аналогичными приведенным в предыдущем разделе, в предположении, что значения измерений и имена классов в рассматриваемом множестве независимы. Предположим, что в нашем случае это выполняется. Ожидаемое число объектов в выборке размера которые будут удовлетворять условиям (имя класса равно

Критерий хи-квадрат с числом степеней свободы имеет вид

где

Большое значение указывает на то, что наблюдаемое в выборке отношение вряд ли справедливо для всех объектов, если только не было связи между измерением а и принадлежностью классу. Подробнее это обычно объясняется в учебниках по статистике, где также содержатся таблицы, позволяющие найти вероятность появления различных значений при выполнении нулевой гипотезы. В тех случаях, когда необходима заданная надежность, можно

посоветовать установить некоторый максимальный уровень вероятности (что эквивалентно минимальному значению и требовать, чтобы во время распознавания образов тестовые узлы добавлялись лишь тогда, когда это значение превышается.

<< Предыдущий параграф Следующий параграф >>
Оглавление