Главная > Интеллектуальные системы > Искусственный интеллект (Э. Хант)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

15.2. Психологическая модель

15.2.0. Общая часть

Что понимается под возможностью написания программ, основанных на психологической модели? Несомненно, не то, что программы будут основаны на туманной идее о природе языка, поскольку такие программы написать просто невозможно. Нельзя написать программы, основанные на моделях (или являющиеся ими) лингвистического поведения человека, поскольку о том, как человек понимает, известно очень мало. Правильнее было бы сказать, что программа ЭВМ, реализующая понимание, имеет психологическую направленность, если (а) в ней не предпринимается попыток разделить синтаксический и семантический этапы и (б) применяемые алгоритмы основаны на интуитивных представлениях о том, как человек мог бы понимать речь, а не на выводах из абстрактной математической системы. Такая психология связана более с работами Вильяма Джеймса и немецких самоаналитиков, чем с современной экспериментальной психологией. Здесь не требуется никакого обоснования, поскольку это вполне согласуется с целью создания программ для ЭВМ, способных участвовать в беседе на естественном языке. Идеи лежат там, где вы их находите. Если полезную программу можно создать, нарушив несколько математических правил или воплотив в нее психологическую модель, неверно отражающую поведение, то это вполне устроит работающего с вычислительной машиной. Математик-лингвист и психолог не имели бы такой свободы.

Приняв такой прагматический подход, мы, наверное, не удивимся тому, что „психологическая" теория машинного понимания языка не так четко разработана, как математическая. Путаница и противоречия в этом подходе почти неизбежны. На большинство современных исследований в данной области повлияли идеи о том, что знание можно представлять в виде семантической сети (Куилли-ан, 1968; Мак-Калла и Сэмпсон, 1972; Румельхарт, Линдсей и Норман, 1971) и что грамматический анализ должен управляться как семантикой, так и синтаксическими особенностями (Шенк, 1972, Виноград, 1972). Слишком рано говорить о том, по какому пути пойдут исследования, и мы не очень удивимся, если станет известно о какой-то новой идее, которая поглотит все старые. С другой стороны, в нашем обсуждении содержатся некоторые догадки о том, как развивается эта область. В частности, мы не упомянули о многих ранних работах и о некоторых современных проектах просто потому, что чувствуем, что они ведут в тупик. Может быть, мы не правы. Читателю, интересующемуся продолжением этой темы, рекомендуем более подробный обзор Симмонса (1970).

15.2.1. Концептуальный грамматический анализ

Основная идея психологического подхода к грамматическому анализу заключается в том, что структурный анализ предложения на естественном языке должен управляться прежде всего предположительным значением предложения. Синтаксические „намеки" могут помочь в установлении значения, но не управляют этим процессом. Отчасти, это аналогично проблеме „что было вначале: курица или яйцо?", ибо почти невозможно найти значение до тех пор, пока не станет что-нибудь известно о структуре. Решение, следовательно, состоит в формировании программы, которая приписывает части цепочки пробное структурное описание, определяет, возможна ли содержательная интерпретация, и, если да, использует этот результат для управления поиском синтаксической структуры остальной части предложения.

Поскольку очень важно понять основную идею этого процесса и гораздо менее важно разобраться в его деталях для какой-то частной программы, попытаемся в качестве иллюстрации привести пример, не связанный с программированием. Предположим, что вы пытаетесь построить модель самолета при следующих несколько необычных условиях. У вас есть маленький стол, а на нем место для частично собранной модели и свободное пространство, куда можно класть части, с которыми вы пока не работаете. Помощник, или „подносчик", выбирает части и передает их вам с той скоростью и в том порядке, которыми вы не управляете. Чтобы усложнить этот процесс, допустим, что свободная площадь на столе не настолько велика, чтобы на ней поместились две части из ящика. Поэтому ваша сборка модели должна быть достаточно быстрой, чтобы при получении каждой следующей детали вы могли либо поместить ее на свое место в модели, либо найти для нее пространство на столе. Здесь есть прямая аналогия с языком. При понимании речи говорящий посылает слово слушающему со скоростью, определяемой говорящим. Слушающий не должен отставать от говорящего в сборке модели, о которой говорящий старается рассказать.

Как и понимание речи, такой путь построения модели ни в коем случае не является невозможным. Рассмотрим несколько возможных способов выполнения этого задания. Одна стратегия для конструктора модели — ждать, пока говорящий даст ему „ключевую часть" (т. е. фюзеляж), пригодную для использования ее в качестве каркаса, вокруг которого располагались бы другие части. Вероятно, большинство людей пошли бы по этому пути. Трудность задачи зависит от числа ее характеристик, которые мы еще не определили. Очень помогла бы нам информация о контексте: тот простой факт, что вы знаете, что получили части самолета, а не лодки, был бы очень полезен при распознавании того, как расположить детали. Когда модель начнет принимать какую-то форму, в нашем распоряжении

окажется еще больше контекстной информации. Порядок, в котором подносчик дает вам эти части, очень важен. Было бы идеально, если бы вы получали деталь, зная, где будет ее место в окончательной модели. В менее выгодных условиях вам давали бы детали, которые в момент получения могли бы занимать одно из нескольких положений, и вам бы приходилось догадываться. Если догадка была неверна, вы должны были бы (частично) разобрать модель, когда новая информация обнаружила бы это. Остается надеяться, что масштабы разборки удалось бы свести к минимуму.

Теперь рассмотрим, как влияют на ситуацию некоторые ограничения. Без сомнения, главная проблема — это догадаться, как должна выглядеть завершенная модель. При данном контексте („самолеты вообще", „самолеты 1-й мировой войны" и т. д.) у вас должен быть общий план допустимых структур. Например, вы были бы весьма озадачены, если бы не имели понятия о вертолетах. По мере познавания все большего числа деталей ваши идеи о допустимых структурах становились бы все точнее и точнее. В действительности в какой-то момент вы могли бы идентифицировать все основные детали модели, хотя еще не видели всех деталей. Вернемся к аналогии с речью: в большинстве случаев нам не нужно слышать все сказанное, чтобы понять, о чем идет речь. Помогли бы некоторые ограничения на скорость и очередность, в которой говорящий может передавать вам части этой модели. Предположим, например, что от помощника требовалось начать с носа самолета и спускаться по фюзеляжу к хвосту, но ему разрешено выбирать, спуститься к хвосту вначале, а затем вернуться к крыльям или же спускаться по одной стороне, выйти на крыло, затем спуститься внутрь и вниз и, наконец, подняться по другой стороне. Сборщик модели мог бы очень быстро собрать части между выбранными точками, но должен был бы останавливаться, чтобы определить, по какому пути пойдет подносчик из каждой такой точки. Наконец, чем больше ваше рабочее пространство, тем легче исправлять ошибки.

При понимании речи слушатель во многом похож на сборщика моделей. Понимание аналогично определению того, как должна выглядеть завершенная модель, и не похоже на восстановление выборов говорящего относительно того, что передать в данное время. Попытаемся выразить это в лингвистических терминах: при понимании речи мы стараемся распознать мысли, вызвавшие произнесенное предложение. Структурный анализ предложения не имеет отношения к этой цели. Синтаксис аналогичен правилам, которых должен придерживаться говорящий, решая, какую часть передать сборщику модели. Знание синтаксиса в одних случаях помогает узнавать взаимосвязь между элементами, а в других это не нужно и иногда может не быть надежным ключом.

Шенк (1971, 1973), развив эти интуитивные идеи, создал концептуальную систему грамматического анализа. Его работа была

ориентирована на реализацию в ЭВМ „понимающей" системы (программа SPINOZA), основанной на концептуальном анализе, хотя, как он указывал, иметь программу — это вторичное по отношению к идеям, на которых она основана. В его программах фразы определяются как основные факторы и действия в дискуссии („концепты“).

Рис. 15.7. Этапы процесса понимания примера (34).

Словарь используется для определения отношений, которые могут возникать между концептами. Понимание предложения

будет происходить следующим образом:

(1) Идентифицируется артикль the, и он запоминается для дальнейшего анализа. Словарь указывает, что появится существительное (возможно, с определением).

(2) Прилагательное big также помещается во временную область памяти, пока нет существительного, которое можно определить. Можно изобразить эту неполную структуру предложения в виде графа (рис. 15.7, а), на котором показаны два определения, ожидающие идентифицируемый объект.

(3) Man распознается как возможный объект. Как видно из рис. 15.7, а, он здесь ожидается и может сюда подойти. В результате сборки одной из подкомпонент начинает вырисовываться неполная структура. Это показано на рис. 15.7, б, на котором отражен

момент, когда определился один из возможных активных элементов. Шенк рассматривает понимание как построение описания активного элемента, завершающего действие; в некотором смысле это основной элемент мышления.

(4) По словарю took — это действие take, модифицированное прошедшим временем (past). Идентификация глагола также дает много информации о допустимых формах образа, который мы пытаемся создать. В этом случае с take ассоциируется граф, указывающий, что фактор Z переводит объект из позиции X в F (рис. 15.8). Задача построения образа теперь сводится к попытке идентифицировать компоненты рис. 15.8 в конструкции рис. 15.7.

(5) Остальные слова используются для заполнения рис. 15.8.

Рис. 15.8. Схема образа, ассоциированного с take.

Заметим, что при этом программа (или словарь) должна иметь доступ к специальному правилу, гласящему, что если компонента Y (для глагола take) в предложении не определена, то она является активным элементом, и что если компонента X не идентифицирована, то фразу „текущее положение объекта" следует заменить. Существование специальных правил, подобных этому, будет производить беспорядок в изящном математическом описании языка. Тем не менее они необходимы для понимания. Кроме того, предложение нельзя понимать изолированно. Так, (34) содержит ряд членов общего вида. Для построения конкретного образа надо знать, о каком высоком мужчине идет речь, о какой книге, где она. На эти вопросы можно ответить, только справившись в оперативной памяти о членах, появлявшихся в предыдущих предложениях.

Некоторую сложность представляет предложение

которое синтаксически похоже на

поскольку в (35) слово like должно интерпретироваться как удовольствие от определенной деятельности (чтения), связанной с рядом объектов, а Мэри нравится за множество неопределенных вещей, относящихся только к ней. Правильная структура для (35) показана на рис. 15.9, а, а для (36) — на рис. 15.9, б. Из этого примера видно, что, как и синтаксический анализ, концептуальный анализ также зависит от контекста. Можно представить себе ситуацию, когда предложение (36) имело или не имело бы структуру, подобную (35), если бы мы больше знали о Мэри. Вопрос о том, которую структуру принять, нельзя решить, пока программа понимания не сможет провести тонкий анализ предполагаемого значения слова в контексте, где оно встретилось.

Рис. 15.9. Две концептуальные структуры для предложений, синтаксически похожих: а — для (35) и б — для (36).

Правила концептуального анализа связаны с отношениями между объектами и действиями, а не с порядком появления в цепочке ссылок на объект. Для построения концептуальной схемы беседы о самолетах на английском и японском языках следует применять одинаковые правила, хотя правила установления соответствий для лингвистических объектов могут быть разными. В этом отличие от построения глубинной структуры в трансформационной грамматике, так как там не требуется, чтобы во всех языках применялась одна и та же грамматика. Если бы мы располагали полной системой концептуального грамматического анализа, то имели бы грамматику для универсального „внутреннего языка мышления". Заметим, что эта грамматика определяла бы, что считать правильно построенным выражением „в уме", а не устанавливала бы правила вывода новых структур. Задача написания программ для понимания определенного языка свелась бы к задаче нахождения процедуры, способной описать структуру на внутреннем языке, если известна

внешняя цепочка. Как и в примере с самолетом, может оказаться, что для этого не обязательно проводить полный анализ структуры внешнего языка.

<< Предыдущий параграф Следующий параграф >>
Оглавление