Главная > Оптика > Оптические вычисления
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

10.3. Функциональные возможности символьных вычислений

В предыдущем разделе изложены основополагающие принципы символьных вычислений, даны необходимые вводные сведения, рассмотрены способы представления данных и возможные стратегии поиска. В данном разделе обсуждение указанных проблем получает дальнейшее развитие и рассматриваются четыре главных вопроса, составляющие суть символьных вычислений: распознавание речи, техническое зрение, распознавание естественного языка, экспертные системы. Эти прикладные задачи могут принимать различные формы, каждая из которых включает сбор знаний, проведение рассуждений и поиск данных. Общим аспектом является использование знаний о системе или рассматриваемой области для улучшения понимания машинной входной информации.

10.3.1. Обзор работ по символьным вычислениям

Как и для любой новой области, вокруг проблемы ИИ возникают серьезные споры о том, что составляет суть ИИ и какой должна быть таксономия составляющих ИИ дисциплин. Усложняет ситуацию, однако, отсутствие достаточного уровня понимания общей природы задач программирования и оптимальных вычислительных структур. Тем не менее уже на данном этапе удалось добиться значительных успехов за счет применения к

широкому кругу проблем методик работы со знаниями, описанных в предыдущем разделе. В результате этого исследования символьных вычислений в настоящее время в основном сконцентрированы в четырех областях, образующих основу для создания семейства машин, обладающих способностями понимать информацию, а именно: распознавать и понимать речь, иметь техническое зрение или понимать изображение, понимать естественный язык, включать элементы экспертных систем, уметь проводить рассуждения.

Чтобы сделать машины способными идентифицировать устную речь и реагировать на нее, можно применить усовершенствованную методику распознавания образов для обработки входного сигнала и идентификации слов. Этот аспект исследований речевых систем называется распознаванием речи. Речь обычно вводится в систему распознавания речи с помощью микрофона [4]. Распознавание может осуществляться несколькими путями, но в любом из них обычно применяется выполняемая в цифровом виде процедура сравнения входной фразы или предложения с элементами, хранящимися в памяти компьютера. С другой стороны, понимание речи основывается на обработке знаний, и его относят к речи высокого уровня. Цель всех этих исследований речи, очевидно, состоит в создании высокоточной системы распознавания, полностью не зависящей от говорящего и работающей с большим словарным запасом.

Техническое зрение, более широко известное в компьютерной технике как понимание зрительных образов, относится к способности машины или компьютера понимать сцены, поступающие по визуальному входному каналу. Назначение таких систем [5] состоит в понимании образов и изображений с такой же степенью точности, как и в системах человеческого зрения. Распознавание может осуществляться большим числом способов, но в большинстве случаев используется сравнение наблюдаемой сцены с объектами, представленными в базе знаний системы. Ситуация близка к задаче создания систем понимания речи, за тем исключением, что информация заключена во входных образах, а не в форме волновых сигналов, и, кроме того, сами объекты являются трехмерными. Так как большинство входных визуализирующих устройств, например полупроводниковые телевизионные камеры, создают двумерные матрицы изображений, то для достижения определенного уровня восприятия чисто трехмерной информации, содержащейся во входной сцене, требуется прикладывать большие усилия. По аналогии со случаем обработки речи, функции обработки изображений, такие как предобработка, восстановление изображений или градиентные вычисления, называются зрением низкого уровня. Любые виды обработки, требующие взаимодействия с базой знаний, относят к зрению высокого уровня.

Понимание естественного языка основывается на способности машины определять значения фраз английского языка (или какого-то другого), вводимых в нее через периферийные устройства, обычно терминала (рис. 10.10). Следовательно, чтобы быть эффективной, система понимания естественного языка должна включать в себя знание таких разделов теории лингвистики, как анализ предложения на основе правил синтаксиса языка, синтаксический анализ и присвоение значений словам или фразам (семантики) [6]. Таким образом обработка естественного языка является процедурой, требующей очень большого числа операций со знаниями, и основанной на знании грамматики и контекста, используемых для получения значений входных предложений и фраз. Знание этих и других лингвистических свойств должно быть включено в базу знаний системы, и проблема, как и в других дисциплинах ИИ, заключается в подборе а реализации одной из многих возможных стратегий интерпретации входных сигналов (например, предложений на английском языке).

Экспертные системы являются дисциплиной, входящей в число практических приложений систем ИИ, и постепенно начинают конкурировать с возможностями людей-экспертов в специализированных областях знаний, получивших название проблемных областей. Такие системы используются для интерпретации спектральных данных (система DENDRAL) [7], разработки схем расположения элементов миникомпьютеров в зависимости от видов компонент (система R1) [8], диагностики

Рис. 10.10. Система понимания естественного языка (с согласия фирмы BBN).

терапевтических заболеваний (система MYCIN) [9]. Эти компьютерные системы «достигли» высокого уровня рабочих характеристик при решении таких задач, которые требуют от человека многих лет работы, специального обучения и большого опыта [10]. В данном случае экспертиза определяется как «набор способностей, доступных высококвалифицированным спе-циалистам-экспертам, включая наличие обширных знаний в соответствующей области эвристических правил, упрощающих и улучшающих подходы к решению задач, включая метазнания и метавосприятия, а также специальные навыки, позволяющие экономно выполнять работу» [10]. (Метазнания — знания о знаниях). Эти системы недавно были очень успешно использованы для решения задач и заданий, требующих больших объемов знаний и мощных эвристических подходов, которые обычно для своего выполнения требовали от специалистов-экспертов от 8 до 40 часов работы [10]. Используя возможности машин, работающих на языке Лисп, в сочетании со специализированными программными средствами, экспертные системы поиска информации в достаточной степени высвобождают труд экспертов, чтобы использовать его в более сложных, более нужных и разнообразных задачах.

Порядок описания функциональных возможностей, обсуждаемых в данном разделе, определяется несколькими причинами. Исторически первое успешное применение разработок в области ИИ концентрировалось на создании интерфейсов для устного или визуального сопряжения компьютера с человеком и для компьютерных игр. (Для детального обзора ранних исследований ИИ читателю следует обратиться к [6], т. 1.) Это повлекло за собой появление так называемой обработки низкого уровня, включающей в основном обработку сигналов и изображений; при этом методикам, основанным на использовании знаний, естественно отводят роль обработки высокого уровня. На основании истории развития этих дисциплин, исследования систем обработки речи и технического зрения с полным правом считают более трудными задачами, чем обработку естественного языка или создание экспертных систем. В качестве иллюстрации сказанного отметим, что многие из концепций, необходимых для обработки естественного языка, получили свое развитие в теории лингвистики и исследованиях речи высокого порядка. В свою очередь возникновение возможностей давать разъяснения в экспертных системах происходило на основе исследований систем обработки естественного языка.

Следует заметить, что происходит естественная эволюция возможностей символьных систем, которые изначально сводятся к интерфейсным устройствам человек-машина, а затем перерастают в возможность проведения рассуждений при минимальном участии человека. Данное обстоятельство позволяет

существенно упростить изложение материала, поскольку в дальнейшем будет показана большая степень общности между всеми этими дисциплинами. Во многих случаях это является результатом переноса основных идей из одной области в другую. Использование архитектуры, включающей память общего доступа, обсуждаемой в разд. 10.3.2, является именно таким случаем. Hearsay, впервые разработанная для системы понимания речи [4], была успешно применена в системах обработки естественного языка и экспертных системах.

Ниже более детально обсуждается каждая из этих способностей символьных вычислений, при этом особое внимание уделено сути лежащих в основе этого методик. После этого для каждой из областей применения символьных систем будут описаны основные трудности и недостатки существующих систем. Каждый из подразделов завершается кратким обзором интеллектуальных возможностей существующих и проектируемых машин, а также анализом проблем и критических параметров вычислительных систем.

<< Предыдущий параграф Следующий параграф >>
Оглавление