Главная > Интеллектуальные системы > Адаптация сложных систем
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

4.2.6. Экспериментальное сопоставление различных моделей обучения

Существует много моделей обучения. Для сравнения различных моделей был поставлен эксперимент по заучиванию иностранных слов [187]. Эксперимент состоял в следующем.

Испытуемым давались для заучивания сразу 40 слов на языке, которого они не знали и никогда раньше не изучали. Слова были подобраны приблизительно одинаковые по трудности запоминания. Время на заучивание ограничивалось. На другой день после заучивания проводился экзамен. Результаты экзамена фиксировались в виде последовательности нулей и единиц (4.2.28). Незапомненные слова доучивались, и на другой день снова проводился экзамен по всем словам. Такая процедура повторялась до тех пор, пока испытуемый не заучивал все 40 слов.

В результате была построена средняя по всем испытуемым кривая обучения:

где — моменты заучивания и контроля; средняя доля незапомненных слов по всем испытуемым в испытании; — количество испытуемых

— доля незапомненных слов в испытании для испытуемого; — результат проверки знания слова испытуемым в момент Доверительные интервалы для строились стандартным способом (доверительная вероятность Экспериментальная кривая обучения изображена на рис. 4.2.10.

Опишем теперь модели обучения, построим для каждой теоретическую кривую обучения и определим, какая из моделей лучше всего описывает процесс запоминания слов.

Модель Буша—Мостеллера [39]. Буш и Мостеллер для

Рис. 4.2.10. Осредненная экспериментальная кривая обучения.

описания процесса обучения вводят оператор изменения вероятности правильного ответа в виде

где . Параметры характеризуют скорость обучения. Легко проверить, что являются неподвижными точками. Если то при этом т. е. если вероятность правильного ответа станет равной то в последующих испытаниях она больше изменяться не будет.

Рассмотрим теперь два важных частных случая этой модели. Случай Тогда из выражения (4.2.42) получаем

Предполагается, что для любого . Таким образом, данная модель зависит только от двух параметров — и Здесь учитывает запоминание, а — забывание ученика. Эти параметры оцениваются по опытным данным: оценивается с помощью метода максимума правдоподобия [39]:

где — число слов, забытых до испытания; — число слов из запомненных в испытании; для оценки используется следующее соотношение [39] для среднего числа неправильных ответов (это интеграл от функции

По данным описанного выше эксперимента были получены оценки и построена теоретическая кривая обучения, обозначенная темными треугольничками на рис. 4.2.11 (кривая 1).

Случай Это так называемая модель Миллера—Мак-Гилла:

Рис. 4.2.11. Теоретические кривые обучения по разным моделям. Цифры на кривых соответствуют номерам моделей в тексте.

В этом случае вероятность запоминания никогда не уменьшается, а при удачном экзамене — увеличивается.

Данная модель имеет неизвестными параметрами Оценку параметра легко получить с помощью метода максимума правдоподобия [39]:

где

— число неправильных ответов по слову, следующих подряд с начала обучения.

Оценку параметра получают из соотношения

Из опытных данных бьши получены оценки параметров и построена теоретическая кривая обучения (рис. 4.2.11, светлые кружочки).

Последующие модели отличаются тем, что в них изменение вероятности ошибки не зависит от реакции ученика, т. е.

Модель Халла [40]. Эта модель основана на предположении, что вероятности незнания в любом случае связаны следующим простым соотношением:

где параметр у характеризует степень уменьшения вероятности незнания в результате заучивания слова в испытании. Сравнив формулу (4.2.50) с (4.2.42), заметим, что эта модель является частным случаем модели Буша—Мостеллера. Неизвестным в модели Халла является один параметр у, который оценивается следующим соотношением [40]:

где Отсюда получаем значение Теоретическая кривая обучения для этой модели обозначена параллелограммами на рис. 4.2.11 (кривая 4).

Модель Терстоуна [40]. Терстоун предложил следующую нерекуррентную модель обучения:

где — по-прежнему вероятность незнания в испытании. Эта модель определяется одним параметром у. который может быть получен из соотношения [40]

Из эксперимента была получена оценка Теоретическая кривая обучения по этой модели обозначена на рис. 4.2.11 светлыми квадратиками (кривая 5).

Модель Рестла [40]. Эта модель определяет вероятность неправильного ответа следующим образом:

где у — неизвестный параметр, оценку которого получаем [40] из соотношения

Полученное в эксперименте значение этой оценки Теоретическая кривая обучения для этой модели обозначена на рис. 4.2.11 темными кружочками (кривая 6).

Модель Кричевского [40]. Кричевский выдвинул гипотезу, что после начального периода обучения возникает «внезапная» обученность. Это следует из так называемой теории «скачков». Применительно к процессу запоминания слов эта теория состоит в следующем. Предположим, что в начале опыта ученик не знает слово (будем говорить, что он находится в состоянии Затем он заучивает слово и в некотором испытании дает правильный перевод, т. е. переходит в состояние После этого он дает только правильные ответы, т. е. не выходит из состояния Тогда вероятность правильного ответа имеет вид

Далее вводится переходная вероятность:

определяющая вероятность перехода в состояние испытании при условии, что в испытании ученик находится в состоянии Для построения теоретической кривой обучения, соответствующей этой модели, используется математическое ожидание величины доли незапомненных слов в испытании для ученика. Из аксиом данной модели следует:

где — оператор осреднения по

Таким образом, для построения теоретической кривой обучения необходимо знать параметры Для оценки этих параметров находят математическое ожидание числа ошибок Т [40]:

и математическое ожидание величины — номера испытания, в котором была сделана последняя ошибка:

Приравнивая математические ожидания и наблюдаемые средние значения, получаем следующие оценки для параметров модели: Теоретическая кривая обучения для этой модели обозначена на рис. 4.2.11 темными квадратиками (кривая 7).

И, наконец, описанная в подразделе 4.2.4 модель по экспери ментальным данным имела Ее теоретиче ская кривая обозначена светлыми треугольничками на рис. 4.2.11 (кривая 3).

С целью сравнения рассмотренных моделей для каждой из них вычислялась невязка с экспериментальной кривой, изображенной на рис. 4.2.10:

где — номер модели,

— экспериментальная кривая обучения; — теоретическая кривая обучения, полученная с помощью модели. Приводим результаты вычислений.

На рис. 4.2.11 сплошной линией изображена экспериментальная кривая; каждая из теоретических кривых имеет номер, соответствующий номеру модели в таблице.

Из приведенных результатов и рис. 4.2.11 видно, что лучше всего описывает исходные данные модель Халла, далее следует предложенная модель обучения иностранному языку. Основное различие моделей состоит в том, что согласно первой из них вероятности незнания в испытании для всех слов одинаковы, а согласно предложенной модели — различны. Очевидно, в этом состоит недостаток модели Халла, так как не все слова запоминаются

одинаково. Положительный эффект применения модели Халла в рассмотренном выше эксперименте, по-видимому, тем и объясняется, что вероятности незнания слов, предложенных для запоминания, были в среднем примерно равны.

Таким образом, эксперимент показал, что предложенная модель обучения иностранному языку (см. подраздел 4.2.4) пригодна для обучения запоминанию иностранных слов.

<< Предыдущий параграф Следующий параграф >>
Оглавление