Главная > Интеллектуальные системы > Искусственный интеллект (Э. Хант)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

3.1.3. Варианты описаний объектов

Третьим параметром, определяющим возможные задачи распознавания образов, являются способы описаний самих объектов. В большинстве задач классификации объект можно считать набором результатов измерений. Какова природа этих измерений и что значит их природа для процедур классификации и распознавания? Эти вопросы совсем не тривиальны. Например, в большинстве изучаемых случаев (особенно в статистике) считается, что измерения определяют евклидово пространство описаний, и каждый объект представляется точкой в этом пространстве. Это позволяет комбинировать измерения, чтобы определить для каждого класса местоположение „типичной" точки в пространстве описаний. Такая процедура хорошо работает для задач измерения и группирования физических объектов. Например, кажется разумным выработать понятие „здоровой полноты", основанное на росте и весе, и использовать его для разделения студентов на потенциальных атлетов и прочих. Разумность такого классифицирующего понятия, однако, целиком зависит от свойств, которые мы приписываем различным измерениям пространства описаний. В данном случае идею „близости по мере (расстоянию) в евклидовом пространстве" можно интерпретировать как „подобие в росте и весе", что разумно. В других случаях нет разумной интерпретации расстояния. Например, так было бы в случае, если бы основными измерениями были определяющие признаки,

выражаемые такими величинами, как пол, место рождения и раса. Иными словами, описание объекта — это список признаков, а не набор измерений. В любом случае объект можно представить в виде вектора описания; правда, имеющие смысл математические операции с такими векторами будут совершенно другими.

Структурные описания дают другой интересный способ описания объектов. Грубо говоря, структурное описание выделяет взаимоотношения между компонентами объекта, а не характеристики объекта, получаемые в серии измерений. Наиболее ясный пример структурных описаний — лингвистические объекты. При обсуждении формальных языков (гл. 2) было показано, что предложение можно эффективно описать правилами непосредственно составляющих, которые выражают отношения между элементами предложения. Без сомнения, ненужной была бы мера, задаваемая на предложениях, если бы она определялась числом появлений в них различных элементов. Какая польза была бы от утверждения, что английское предложение содержит три существительных и два глагола? Было обнаружено, что те же рассуждения можно применить и к различным областям, весьма далеким от традиционной лингвистики. Одно из наиболее интересных приложений структурного описания — использование его в анализе изображений (Миллер и Шоу, 1968). Например, мы не видим иного, кроме структурного, способа описания определяющих характеристик множества симметричных двумерных рисунков. К сожалению, относительно мало известно о соответствующих методах распознавания образов.

Процесс описания важен и сам по себе. Должна быть „максимально примитивная" сенсорная система для преобразования во внутренний код физических воздействий, поступающих на классифицирующее устройство. Общепринято называть это процессом преобразования. Животным в качестве преобразователей служат глаза, уши и другие органы чувств, а вычислительные машины используют устройства, чувствующие отверстия в перфокартах или реагирующие на изменения электрического напряжения. Назовем внутренний код, получаемый при преобразовании, кодом уровня 0. Любые два физически различных объекта, производящие одинаковое кодирование уровня 0, для устройства распознавания образов будут неразличимы. При вычислениях различия уровня 0 выглядят тривиальными.

„Очевидно", нельзя написать программу для ЭВМ, способную различать красные и синие перфокарты. Эта информация потеряна.

Преобразование уровня 0 дает цепочку двоичных цифр, в которой каждая цифра представляет наиболее примитивное свойство вычислительной системы. С этими цепочками непосредственно работать неудобно, поэтому их обычно перекодируют в блоки, возможно, облегчающие процесс распознавания образов. Будем называть это кодированием уровня 1. Оно включает в себя разбиение входной последовательности на подблоки. Хорошо известный пример — буквенно-цифровой код, в котором 960 бит в перфокарты группируются в 80 буквенно-цифровых символов. Это вызывает дальнейшую потерю информации, поскольку не все двоичные конфигурации можно выразить с помощью буквенно-цифрового кода. Подобным же образом, только в значительно большем объеме, происходит потеря информации в биологических системах. Например, Хант и Макоус (1969) оценили уменьшение количества информации при чтении про себя с бит в секунду на входе до 35 бит в секунду на выходе.

Результат кодирования уровня 1 состоит в получении данных, удобных для работы алгоритма распознавания образов. В биологических системах это достигается в основном путем отбрасывания ненужных данных, но почти столь же эффективной может оказаться простая перекодировка данных. Это проиллюстрировано на рис. 3.3, на котором «правильное» перекодирование превращает очень сложную задачу распознавания образов в очень легкую. В верхней таблице рисунка приведены два класса двоичных векторов, обозначенные X и О. Правило для классификации векторов найти в принципе можно, но для большинства людей оно не очевидно. В средней таблице представлены восьмеричные эквиваленты двоичных векторов. Правило классификации найти все еще тяжело. В нижней таблице двоичные векторы опять преобразованы, на этот раз в шестнадцатеричные векторы, и ответ очевиден.

Нет ничего специального в переходе от уровня 0 к уровню 1; можно было бы легко перейти от уровня 1 к уровню 2, от уровня 2 к уровню 3 и т. д. Число переходов для устройства распознавания образов, которое ими не управляет, не имеет значения. Таким образом, если программа для ЭВМ предназначена для классификации слов и перед вводом данных в программу всегда производится преобразование разряды — символы, то не важно, будет программа оперировать с разрядами или с символами. Намного существеннее различие между программами выделения признаков, которые могут изменяться самой программой распознавания образов во время поиска решения, и теми, которые остаются неизменными. Например, рассмотренную задачу (рис. 3.3) можно было бы решить с помощью сложного алгоритма, работающего с двоичными или восьмеричными образами, или с помощью простого алгоритма, который испытывал

Рис. 3.3. (см. скан) Результат кодирования при распознавании образов.

бы различные коды до тех пор, пока не нашел шестнадцатеричный, легко решающий задачу. Вообще мы должны различать программы распознавания образов с фиксированным кодированием данных и программы, в которых есть возможность менять вид кодирования.

<< Предыдущий параграф Следующий параграф >>
Оглавление