Главная > Интеллектуальные системы > Введение в статистическую теорию распознавания образов
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

7.2.1. Задача нахождения корня уравнения регрессии.

Наиболее простой вид метод стохастической аппроксимации принимает в задаче нахождения корня уравнения регрессии. Соответствующую процедуру называют также методом Роббинса — Монро.

Пусть — две случайпые величины, коррелирующие одна с другой, как показано на рис. 7.3. Задача заключается в нахождении корня уравнения регрессии, т. е. такого значения , при котором

Если бы можно было собрать все объекты с фиксированным и оделить то корень уравнения можно было бы найти каким-либо методом поиска нулей детерминированной функции, например методом Ньютона. Однако, если в каждый момент времени мы можем наблюдать только один объект с некоторым значением и пытаемся использовать это наблюдение для коррекции , то сильная зашумленность наблюдений может привести к изменению в неправильном направлении, особенно вблизи корня.

В методе Роббинса — Монро новая последовательная оценка , вычисляемая по текущей оценке и новому наблюдению определяется следующим образом:

где предполагается, без ограничения общности, что приближается к корню уравнения (7.32) со стороны больших значений функции, т. е. для для как показано на рис. 7.3. В этом случае — последовательность положительных чисел, удовлетворяющих следующим условиям:

Как эти условия используются при доказательстве сходимости, будет видно в дальнейшем. Однако физический смысл этих условий достаточно очевиден. Смысл условия (7.34) аналогичен смыслу члена в рассмотренном ранее примере: это условие обеспечивает сходимость процесса. С другой стороны, условие (7.35) гарантирует, что имеется достаточная возможность коррекции, т. е. что процесс не остановится раньше, чем мы дойдем до корня. Условие (7.36) гарантирует, что дисперсия накопленного шума будет конечной, так чтобы можно было скорректировать влияние шума.

Если последовательность удовлетворяет условиям (7.34) — (7.36), оценка сходится к корню 0 в среднем квадратичном и с вероятностью 1, т. е.

Гармоническая последовательность (7.31) является примером

последовательности, удовлетворяющей условиям (7.34) — (7.36) Более общий (хотя и не единственно возможный) вид такой последовательности — это

Прежде чем перейти к вопросу о сходимости метода Роббинса — Монро, рассмотрим систему с обратной связью, реализующую описанный выше процесс. Эта система показана на рис. 7.4, где — шум.

Рис. 7.4. Эквивалентная схема с обратной связью.

Коэффициент усиления в цепи обратной связи не фиксирован, а уменьшается со временем. Из теории цепей с обратной связью известно, что уменьшение гарантирует устойчивость системы, но может также привести к увеличению времени регулирования.

<< Предыдущий параграф Следующий параграф >>
Оглавление