Главная > Интеллектуальные системы > Искусственный интеллект (Э. Хант)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

15.1.1. Трансформационные грамматики

Многие лингвисты понимают, что для формализации языков, по сложности приближающихся к естественным, необходимо расширить класс грамматик. Об одном таком расширенном классе — классе трансформационных грамматик — уже говорилось вкратце в гл. 2, где указывалось, что для распознавания цепочек из трансформационного языка могут понадобиться все возможности машины Тьюрига. Даже с точки зрения теории это означает, что анализ языка может оказаться очень сложным. Дело действительно обстоит именно так. Чтобы понять почему, рассмотрим некоторые из требований к обработке информации для понимания речи человека.

Что происходит на этапе построения предложения? Во-первых, необходимо решить, что ты хочешь сказать. Мысль говорящего называют синтаксически представленной цепочкой из языка глубинной структуры, который понимается как разновидность внутреннего языка мышления. Математические лингвисты мало интересуются тем, как порождаемое представление глубинной структуры утверждения связано с воплощаемой им идеей. Мы в конечном счете поставим под вопрос это отсутствие интереса, поскольку мы утверждаем, что именно этим следует заниматься при использовании естественного языка вычислительной машиной. Однако в настоящее время мы просто предположим, что внутренний язык, на котором выражается глубинная структура, является языком непосредственно составляющих. Высказывание порождается глубинной структурой путем применения серии правил преобразования, в результате которых возникает предложение разговорного языка, и его структура называется поверхностной. Предложение на внешнем языке следует анализировать, отображая цепочку назад из поверхностной структуры в глубинную, а затем раскрывая связи между элементами глубинной структуры.

Приведем два примера и проиллюстрируем на них возможные сложности этого подхода. Первый связан с вопросами. Предположим, что некто хочет задать вопрос

С помощью вполне очевидных обозначений представим глубинную структуру этого вопроса на рис. 15.2. Из рисунка видно,

что предложение состоит из знака вопроса группы существительного и группы глагола Группа существительного состоит из единственного элемента (существительного N) Sherlock Holmes, а группа глагола — из глагола (V) expose, вспомогательного глагола и группы существительного (NP) the evildoer. В английском языке есть правило преобразования, устанавливающее, что в предложениях со знаками вопроса вспомогательный глагол может переставляться перед группой существительного, соответствующей подлежащему, которая порождает окончательное предложение.

Рис. 15.2. Глубинная НС-структура для примера (12).

Если бы нам было нужно построить диаграмму НС-структуры прямо из (12), она оказалась бы уже не деревом, поскольку соседние символы в терминальной цепочке в (12) не всегда выводятся из соседних нетерминальных символов дерева разбора. Для порождения предложения это не составляет проблему, но может вызвать существенные трудности в понимании предложения, когда глубинная структура разыскивается, а не задается с самого начала.

Более сложный пример:

Корректная интерпретация предложения (13) состоит в том, что некоторый неизвестный человек убежден, что кто-то, также неизвестный, похитил леди Агату. Соответствующая глубинная

структура приведена на рис. 15.3. Первая группа существительного в поверхностной структуре Lady Agatha фактически служит дополнением в группе глагола придаточного предложения. Само придаточное предложение служит дополнением в группе глагола главного предложения. Подлежащие и в главном, и в придаточном предложениях не определены (НЕКТО), но ясно, что это разные некто. Заметим, что наше предложение, несмотря на все эти проблемы, понимается моментально. Но почему?

Рис. 15.3. Глубинная структура для примера (13).

Не трудно построить трансформационную грамматику, содержащую правила порождения поверхностных структур из глубинных. Трудно совершить обратное: восстановить глубинную структуру из поверхностной. В случае НС-грамматики можно определить нетерминалы, которые могли бы породить каждую терминальную составляющую в поверхностной цепочке. Это дает цепочку, содержащую некоторые нетерминалы. Затем соседние символы объединяются в другие возможные нетерминальные символы. На каждом этапе объединение символов в одной части цепочки не зависит от анализа других частей. Это позволяет постепенно анализировать цепочку слева направо, не возвращаясь назад для пробных разборов. Эта простая схема чтения цепочки слева направо для языка, порожденного трансформационной грамматикой, не годится. Чтобы убедиться в этом, проведем грамматический анализ и найдем место Lady Agatha в связи с нужным

глаголом в (13). Сравним это с соответствующим анализом для

Для анализа подцепочки Lady Agatha is в (14) надо указать, что группа существительного (NP) Lady Agatha должна быть подлежащим при . В (13) та же самая группа была дополнением при глаголе в придаточном предложении. И в том, и в другом примере надлежащую роль первой группы существительного в поверхностной цепочке нельзя определить, пока не выяснены свойства слов, следующих за Поскольку анализ исходной группы существительного зависит от анализа составляющей поверхностной цепочки, не соседней с ней, то в алгоритме анализа должны быть возможности либо временно задерживать анализ до получения дополнительной информации, либо осуществлять пробный анализ, который при поступлении новой информации можно скорректировать.

Невозможность анализировать естественные языки алгоритмом просмотра слева направо создает трудности для программиста, однако можно разработать более сложные алгоритмы просмотра. Существуют и другие проблемы, затрагивающие более глубокие принципиальные трудности. Оказывается, что естественные языки порождаются по очень сложным трансформационным правилам. Во многих случаях выбор нужного правила зависит от информации о природе обсуждаемых объектов, а не от синтаксической информации о частях речи, которым принадлежат конкретные нетерминальные символы. Проблема не в том, что некоторые предложения естественного языка неоднозначны, а скорее в том, что для человека, для которого этот язык родной, нет этой неопределенности, хотя грамматический анализ утверждает, что она должна быть. Возьмем предложение

Ясно, что шпион является похитителем. С другой стороны, в предложении

слово „сыщик" обычно понимается как подлежащее, относящееся к основному глаголу. Наш выбор между двумя глубинными структурами основан на наших представлениях о сыщиках и шпионах, а не об английской грамматике.

Специалист в математической лингвистике считает грамматику моделью языка, если она определяет машину, способную породить все цепочки данного языка и никакие другие. По этому критерию НС-грамматики не могут объяснить естественные языки, а

трансформационные грамматики могут. Для специалиста в вычислительных науках, однако, главное не порождение языка, а его анализ. Какие алгоритмы грамматического анализа можно создать для восстановления глубинной структуры трансформационной грамматики по ее поверхностной структуре? Сейчас мы перейдем к этому вопросу.

<< Предыдущий параграф Следующий параграф >>
Оглавление