Главная > Интеллектуальные системы > Адаптация сложных систем
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

6.4.3. Оценка вероятности образования оптимальной структуры перцептрона в процессе адаптации

В тех случаях, когда классы предъявляемых объектов пересекаются, принципиально невозможно построить в процессе обучения такое решающее правило, которое обеспечивало бы безошибочное распознавание объектов на экзамене. Но при этом может быть найдено некоторое оптимальное решающее правило, которое обеспечивает минимальную вероятность ошибки распознавания.

Вероятность построения такого оптимального решающего правила в элементарном перцептроне можно увеличить двумя способами: 1) увеличением общего числа А-элементов; 2) адаптацией структуры перцептрона в процессе обучения, т. е. введением поиска оптимальной матрицы Такая адаптация структуры позволяет избежать дополнительного увеличения числа А-элементов за счет увеличения числа шагов поиска структуры.

Вероятность образования оптимального решающего правила, минимизирующего ошибку классификации, исследовалась для двух пересекающихся классов объектов, построенных следующим образом. Эталонный объект каждого класса представлялся -мерным вектором, координаты которого

а координаты объектов каждого класса отличались от соответствующей координаты эталонного объекта этого класса с вероятностью т. е.

где — номер объекта; вероятности заданы. В работах [58, 61] показано, что для минимизации ошибки распознавания необходимо максимизировать вероятность образования оптимальной структуры перцептрона. В соответствии с этим минимальное число А-элементов перцептрона, образующее оптимальную структуру, может быть подсчитано как

Здесь — число признаков эталона класса В ( — класса С), значения которых равны 1 и которые не совпадают с соответствующими координатами эталона класса С (класса В) где k — расстояние по Хэммингу между эталонными объектами); — число входов для возбуждающих (тормозящих) связей А-элемента а символ означает округление в большую сторону до ближайшего целого. В этом случае за оптимальную структуру принимается такая структура соединений А-элементов с сетчаткой, в которой все рецепторов соединяются соответствующими связями с А-элементами и А-элементы возбуждаются только объектами класса В. При фиксированных единичных весах А-элементов в перцептроне с А-элементами оптимальное решающее правило может быть построено без дополнительного обучения только за счет образования такой оптимальной структуры.

Вероятность образования такой структуры при однократной случайной реализации связей А-элементов с сетчаткой определяется выражением [58]

При неограниченном увеличении количества А-элементов вероятность будет стремиться к единице. Когда число А-элементов равно минимальному (6.4.19) и неограниченно увеличивается число шагов случайного поиска структуры, то вероятность ее отыскания также стремится к единице. Поэтому достичь заданной вероятности ошибки распознавания можно за счет увеличения

числа шагов адаптации без дополнительных затрат, вызванных увеличением количества А-элементов. При исходном числе А-элементов, равном соотношение между числом шагов поиска и количеством А-элементов, которые необходимы для достижения одинаковой вероятности образования оптимальной структуры, будет определяться как а Это означает, что при исходном минимальном числе А-элементов в среднем следует сделать не более шагов адаптации методом случайного поиска структуры, для того чтобы получить ту же вероятность образования оптимальной структуры, что и при количестве А-элементов, равном т. В случае, если исходное число А-элементов взято несколько большим минимального, необходимое число шагов случайного поиска уменьшается:

что позволяет повысить эффективность адаптации. Но при этом уже необходимо дополнительное обучение перцептрона, заключающееся в сведении к нулю весов тех А-элементов, которые возбуждаются объектами обоих классов и не участвуют в образовании оптимальной структуры.

В реальных системах с ограниченным числом А-элементов вероятность образования такой оптимальной структуры довольно мала, а число шагов адаптации для ее оптимизации также ограниченно. Поэтому оказывается целесообразным поставить задачу минимизации ошибки распознавания как задачу максимизации вероятности образования такой структуры, которая реализует наличие хотя бы двух А-элементов, каждый из которых реагирует только на объекты своего класса [61]. В процессе обучения веса этих А-элементов сформируются с противоположными знаками, а веса А-элементов, реагирующих как на объекты одного, так и другого класса, будут, сведены к нулю. В этом случае для образования оптимальной структуры достаточно, чтобы возбуждающие или тормозящие связи А-элементов просто попадали в интервал, соответствующий величине или на сетчатке, независимо от того, как эти связи распределяются внутри интервала (т. е. здесь достаточно, чтобы хотя бы один из рецепторов интервала или был соединен соответствующими связями с А-элементами [61]).

Допустим, что в процессе обучения перцептрона веса А-элементов, реагирующих только на объекты класса В или только класса С, принимают значения или -1 соответственно, а веса А-элементов, реагирующих на объекты обоих классов,

принимают значения 0. Тогда значения координат вектора V весов А-элементов будут определяться следующим образом:

где — вероятность того, что А-элемент возбуждается только объектами класса В (класса С) [61].

В этом случае вероятность построения оптимальной классификации будет определяться вероятностью образования такого вектора весов V, у которого будут хотя бы две координаты, из которых одна имеет значение -1, а другая Эта вероятность может быть представлена в следующем виде:

где — общее число А-элементов перцептрона; — количество А-элементов, имеющих положительный (отрицательный) вес.

Вероятность стремится к единице как при неограниченном увеличении так и при фиксированном и неограниченном увеличении числа шагов поиска структуры связей между сетчаткой и А-элементами. Соотношение между числом шагов поиска и количеством А-элементов в этом случае определяется выражением [61]:

которое показывает, сколько в среднем следует сделать шагов случайного поиска структуры при заданном числе А-элементов, чтобы получить ту же вероятность построения оптимальной классификации, что и при увеличении числа А-элементов на единицу.

<< Предыдущий параграф Следующий параграф >>
Оглавление