Главная > Интеллектуальные системы > Базы знаний интеллектуальных систем
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.1.3. Использование метафор для выявления «скрытых» структур знаний

Несмотря на кажущуюся близость задач, инженерия знаний и психосемантика существенно отличаются как в теоретических основаниях, на которых они базируются, так и в практических методиках. Но главное отличие заключается в том, что инженерия знаний направлена на выявление — в конечном итоге — модели рассуждений [Поспелов, 1989], динамической или операциональной составляющей ментального пространства (или функциональной структуры поля знаний в то время как психосемантика, пытаясь представить ментальное пространство в виде евклидова пространства, позволяет делать видимой статическую структуру взаимного «расположения» объектов в памяти, в виде проекций скоплений объектов (концептуальная структура

Помимо этого следует отметить ряд недостатков методов исихосемантики с точки зрения практической инженерии знаний.

1. Поскольку в основе психосемантического эксперимента лежит процедура измерения субъективных расстояний между предъявляемыми стимулами, то и результаты обработки такого эксперимента, как правило, используют геометрическую интерпретацию — евклидово пространство небольшого числа измерений (чаще всего — двумерное). Такое сильное упрощение модели памяти может привести к неадекватным базам знаний.

2. Естественность иерархии как глобальной модели понятийных структур сознания служит методологической базой ОСП. Кроме того, и в естественном языке понятия явно тяготеют к различным уровням обобщения. Однако в большинстве прикладных пакетов не предусмотрено разбиение семантического пространства на уровни, отражающие различные степени общности понятий, включенных в экспериментальный план. В результате получаемые кластеры понятий, пространственно изолированные в геометрической модели шкалирования, носят таксономически неоднородный характер и трудно поддаются интерпретации.

3. Единственные отношения, выявляемые процедурами психосемантики, — это «далеко — близко» по некоторой шкале. Для проектирования и построения баз знаний выявление отношений является на порядок более сложной задачей, чем выявление понятий. Поэтому семантические пространства, полученные в результате шкалирования и кластеризации, должны быть подвергнуты дальнейшей обработке на предмет определения отношений, особенно функциональных и каузальных.

Нельзя ожидать, что эти противоречия могут быть разрешены быстро и безболезненно, в силу того, что математический аппарат, положенный в основу всех пакетов прикладных программ по психосемантике, имеет определенные границы применимости. Однако одним из возможных путей сближения без нарушения чистоты процедуры видится расширение пространства конкретных объектов-стимулов предметной области за счет добавления некоторых абстрактных объектов из мира метафор, которые заставят эксперта-испытуемого выйти за рамки объективности в мир субъективных представлений, которые зачастую в большей степени влияют на его рассуждения и модель принятия решений, чем традиционные правильные взгляды.

Ниже описан подход, разработанный совместно с Воиновым А. В. [Voinov, Gavrilova, 1993; Воинов, Гаврилова, 1994] и позволяющий вывести эксперта за границы традиционной установки и тем самым выявить субъективные, часто скрываемые или скрытые структуры его профессионального опыта.

Большинство результатов, полученных в когнитивной психологии, подтверждают, что у человека (в том числе и у эксперта) формальные знания о мире (в частности, о той предметной области, где он является экспертом) и его личный поведенческий опыт не могут существовать изолированно, они образуют целостную, стабильную структуру. В западной литературе за этой структурой закрепилось

название «модель (или картина) мира». Принципиальным свойством модели мира является то, что ее структура не дана человеку — ее носителю — в интроспекции, она работает на существенно латентном, неосознаваемом уровне, зачастую вообще ничем не отмеченном (в символической форме) на поверхности вербального сознания.

Изучение модели мира человека является задачей когнитивной психологии, психосемантики и прочих родственных дисциплин. Что же касается эксперта как объекта пристального внимания инженерии знаний, то здесь одна из проблем, в решении которых может помочь психосемантика, связана с необходимостью (и неизбежностью) отделения опыта эксперта от его объективных знаний в процессе формализации и структурирования последних для экспертных систем.

Строго говоря, невозможно указать ту грань, за которой знания (которые можно формализовать и извлечь) переходят в опыт (то есть в то, что остается уникальной, неотчуждаемой собственностью эксперта). Более корректно, по-видимому, говорить о неком континууме, детальность градации которого может зависеть от конкретной задачи.

Например, можно выделить следующие три уровня:

1. Знания, предназначенные для изложения или доказательства (аргументации), например, на междисциплинарном уровне или для популярной лекции (вербальные).

2. Знания, которые применяются в реальной практике, — знания еще вербализуемые, но уже нерефлектируемые.

3. Собственно опыт, то есть знания, лежащие на наиболее глубоком, неосознаваемом уровне, отвечающие за те решения эксперта, которые внешне (в том числе и для него самого) выглядят как мгновенное озарение или «инсайт», интуитивный творческий акт (интуитивные).

Классическая методика психосемантического эксперимента также не позволяет выделить из его результатов интуитивный уровень. Это видно из самой тестовой процедуры. Просят ли испытуемого оценить сходство-различие стимулов напрямую или же предлагается оценить их соответствие некоторым «конструктам» — в любом случае испытуемый вольно или невольно настраивается на необходимость доказательности своего ответа в терминах объективных свойств стимулов. Большинство методов извлечения знаний ориентировано на верхние — вербальные или вербализируемые — уровни знания. Необходим косвенный метод, ориентированный на выявление скрытых предпочтений практического опыта или операциональных составляющих опыта. Таким методом может служить метафорический подход. Метафорический подход, впервые описанный с чисто лингвистических позиций [Black, 1962; Ricoeur, 1975], а также с позиций практической психологии [Гордон, 1987], был видоизменен для нужд инженерии знаний. Например, в экспериментах по объективному сравнению языков программирования между собой были также использованы два метафорических «мира» — мир животных и мир транспорта.

В рамках этого подхода удалось экспериментально доказать следующие тезисы:

• метафора работает как фильтр, выделяющий, посредством подбора адекватного объекта сравнения, определенные свойства основного объекта (то есть того, о котором собственно и идет речь). Эти выделяемые свойства имеют существенно операциональный характер, проявляющийся на уровне полиморфизма методов, так как метафора по самой своей сути исключает возможность сравнения объектов по их внутренним, объективным свойствам;

• метафора имеет целью скорее не сообщить что-либо о данном объекте (то есть ответить на вопрос «что это?»), а призвать к определенному отношению к нему, указать на некую парадигму, говорящую о том, как следует вести себя по отношению к данному объекту;

• субъективному сдвигу в отношении к основному объекту (например, к языку программирования) сопутствует также и сдвиг в восприятии объекта сравнения (например, к конкретному животному) в силу вышеуказанной специфики фильтруемых метафорой свойств. Поэтому объект сравнения выступает в метафоре не по своему прямому назначению, то есть это не просто «лев» как представитель фауны, а воплощение силы, ловкости и могущества;

• в том случае, когда метафора сопоставляет не единичные объекты, а некоторые их множества, в которых объекты связаны осмысленными отношениями, пространство объектов сравнения должно быть изоморфно пространству основных объектов по системе указанных отношений.

На эти тезисы опирается предлагаемая модификация классической методики сопоставления объектов, применяемой, например, в оценочной решетке Келли [Kelly, 1955]. При проведении эксперимента была использована система MEDIS [Алексеева, Воинов и др., 1989; Воинов, Гаврилова, 1994]. Эта система позволяет планировать, проводить и обрабатывать данные произвольного психосемантического эксперимента. Помимо классической парадигмы многомерного шкалирования, система MEDIS включает в себя некоторые возможности теста репертуарных решеток. В частности, она позволяет работать со стимулами двух сортов — так называемыми элементами и конструктами (с единственным исключением: конструкты в системе MEDIS — в отличие от классического теста репертуарных решеток — монополярны). Естественно, выбор базового инструментария существенно повлиял на описываемую экспериментальную реализацию методики.

В качестве предметной области был выбран мир языков программирования. В пространство базовых понятий (выступавших в методике в качестве элементов) было включено несколько более или менее популярных языков программирования, принадлежащих к следующим классам:

• языки искусственного интеллекта;

• традиционные процедурные языки

• так называемые «макроязыки», обычно реализуемые в оболочках операционных систем, текстовых редакторах и т. д.

В качестве метафорических пространств выбраны мир животных и мир транспорта. Объекты этих миров выступали в методике в качестве (монополярных) конструктов. На первом этапе эксперимента каждый из респондентов

выполнял классическое попарное субъективное шкалирование элементов. На вопрос, «Есть ли что-либо общее между данными языками программирования», респонденту предлагалось ответить одной из следующих альтернатив.

Данные этого этапа (отдельно для каждого из респондентов) подвергались обработке методами многомерного шкалирования (см. выше) и представлены на рис. 5.4.

Результатом такой обработки является некоторое евклидово пространство небольшого числа измерений, в котором исходные оценки различий представлены геометрическими расстояниями между точками. Чем лучше эти расстояния соответствуют исходным различиям, тем более адекватным считается результат обработки в целом. При этом буквальное совпадение расстояний и числовых кодов ответов, естественно, не является обязательным (хотя оно и возможно в некоторых модельных экспериментах). Более важным оказывается ранговое соответствие расстояний исходным оценкам. А именно, в идеальном случае все расстояния между точками, соответствующие (например) ответам «ДА!» в исходных данных, должны быть меньше (хотя бы и на доли процента масштаба шкалы) всех расстояний, соответствующих ответам «Да», и т. д.

В реальном эксперименте идеальное соответствие невозможно в принципе, так как целью обработки является сжатие, сокращение размерности данных, что ограничивает число координатных осей результирующего пространства. Тем не менее алгоритм шкалирования пытается — насколько это возможно — минимизировать ранговое несоответствие модели исходным данным.

Геометрическую модель шкалирования можно интерпретировать по-разному:

• во-первых, можно выяснить смысл координатных осей результирующего пространства. Эти оси по сути своей аналогичны факторам в факторном анализе, что позволяет использовать соответствующую парадигму интерпретации, детально разработанную в экспериментальной психологии. В данном случае можно считать, что выявленные факторы играют роль базовых категорий, или базовых (латентных) конструктов, с помощью которых респондент (как правило, неосознанно) упорядочивает свою картину мира (точнее, ее проекцию на данную предметную область);

• во-вторых, можно проанализировать компактные группировки стимулов в этом пространстве, отождествив Их с некоторыми существенными (хотя и скрытыми от интроспекции) таксономическими единицами, реально присутствующими в модели мира эксперта. Существенно, что делается попытка интерпретировать кластеры, полученные по модели шкалирования, а не по исходным числовым кодам различий. Это вытекает из предположения, что

информация, не воспроизводимая главными (наиболее нагруженными) факторами, является «шумом», сопутствующим любому (а особенно психологическому) эксперименту.

Рисунок 5.4 отражает традиционную классификацию языков программирования и легко поддается вербальной интерпретации. Например, на рисунке горизонтальная ось соответствует делению языков программирования на «языки искусственного интеллекта» (левый полюс шкалы) и «традиционные языки программирования» (правый полюс). Вертикальная ось отражает классификацию языков программирования в зависимости от уровня — языки высокого уровня (нижний полюс) и языки низкого уровня или системные языки (верхний полюс).

Рис. 5.4. Классификация языков программирования

Основная экспериментальная процедура — попарное сравнение некоторых объектов и выражение степени их сходства (несходства) на числовой оси или выделение пар близких объектов из предъявленной триады — сама по себе накладывает большое количество ограничений на выявляемую структуру, в частности:

1. Из-за выбора стимульного материала (выбор объектов остается за инженером по знаниям).

2. Из-за несовершенства шкалы измерений.

3. В связи с рядом допущений математического аппарата. Но главное, что полученная структура знаний чаще всего носит академический характер, то есть отражает объективно существующие, но легко объяснимые, как бы лежащие на поверхности закономерности.

Это связано с психологической установкой самого эксперимента, во время которого эксперта как бы проверяют, экзаменуют и он, естественно, стремится давать правильные ответы.

На следующем этапе эксперимента респонденту предлагалось сопоставить каждый из языков программирования с каждым из метафорических персонажей. Как и на первом этапе, пары предъявлялись в равномерно-случайном порядке

(аналогичном расписанию кругового турнира в спортивных играх). Инструкция для сопоставления выглядела следующим образом:

Попробуйте оценить выразительную силу данной метафоры: «ЛИСП — это слон» или «C++ — это яхта».

Результирующая таблица числовых кодов оценок (идентичная оценочной решетке Келли) была также обработана методами многомерного шкалирования программы МЕДИС. Результаты представлены на рис. 5.5 и 5.6.

Рис. 5.5. Метафорическая классификация языков программирования (мир животных)

Рис. 5.6. Метафорическая классификация языков программирования (мир транспорта)

При интерпретации удалось выявить такие латентные понятия и структуры, как «степень изощренности языка» (шкала X рис. 5.5), «сила» (шкала Y рис. 5.5), «универсальность» (шкала Y рис. 5.6), «скорость» (шкала X рис. 5.6) и др.

Кроме этого, полученные рисунки позволили выявить скрытые предпочтения эксперта и существенные характеристики объектов, выступавших в виде стимулов — «силу» языка С («слон»); скорость C++ («яхта»); «старомодность» Фортрана («телега») и пр.

В применении к реальному процессу извлечения знаний это обстоятельство становится принципиальным, так как позволяет на самом деле отделить те знания, благодаря которым эксперт является таковым (уровень В), от общезначимых, банальных (для экспертов в данной предметной области) знаний (уровень А), которые возможно и не стоят того, чтобы ради них создавать собственно экспертную систему.

Однако можно ожидать, что во многих (если не в большинстве) случаях выявленные латентные структуры могут полностью перевернуть представления инженера по знаниям о предметной области и позволить ему существенно углубить базу знаний. Введение мира метафор — это некая игра, а игра раскрепощает сознание эксперта и, как все игровые методики извлечения знаний (п. 4.2), является хорошим катализатором трудоемких серий интервью с экспертом, без которых сегодня невозможна разработка промышленных интеллектуальных систем.

<< Предыдущий параграф Следующий параграф >>
Оглавление