Главная > Интеллектуальные системы > Искусственный интеллект (Э. Хант)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

13.1.1. Основные понятия машинного анализа сцен

Общие принципы машинного анализа сцен легко понять, и мы их здесь приведем. При этом опущено много технических деталей; для более подробного рассмотрения следует обратиться к книге Дуды и Харта (1973).

Наиболее примитивно сцену можно представить в виде матрицы, каждый элемент которой описывает значение яркости в некоторой точке изображения. Края в этом изображении можно обнаружить, отмечая множества связанных точек (т. е. линий), для которых имеет место разкий скачок в значении яркости. Поскольку используемые данные могут содержать шум, часто бывает полезным заменить полученные указанным способом „приблизительно прямые" линии прямыми. Такие операции осуществляются в отдельных областях изображения. Такого рода предварительная обработка осуществляется фактически в каждом проекте по зрению. Этот шаг будет называться выделением краев.

После выделения краев изображение представляется в машине списком прямых вместе с соответствующими узлами. В свою очередь узлы определяются проходящими через них прямыми и своими координатами. Для простых штриховых рисунков (например, для треков элементарных частиц в пузырьковых камерах) не требуется дальнейшего усовершенствования представления. В более сложных ситуациях необходимы понятия более высокого порядка, поскольку представляемые фигуры могут не определяться при помощи прямых. Чтобы показать это, рассмотрим две Т-фигуры на рис. 13.4. Для каждой из них в табл. 13.1 перечислены соответствующие прямые и узлы. Хотя человек сразу же распознает, что обе эти фигуры являются одной и той же буквой, ясно, что, если пользоваться только приведенной таблицей, потребуется сложный алгоритм для установления соответствия между двумя списками прямых. Есть подозрение, что люди осуществляют правильное распознавание в этом случае, продолжая до соединения прямые 7 и 3 области I „блочного Т“ (рис. 13.4, б) и затем замечая, что отношение между прямыми в

„линейном Т“ соответствует отношению фрагментов I и II в „блочном Т“.

Рис. 13.4. Две Т-фигуры, линейная и блочная. Прямым, для удобства пользоваться табл. 13.1, приписаны числа и буквы. Пунктирная прямая не представлена в табл. 13.1. Ее объяснение содержится в тексте.

Опустим вопрос о том, как принималось решение о продолжении прямых, и заметим, что в этом примере введено новое понятие области. Формально область образуется замкнутой циклически упорядоченной

Таблица 13.1. (см. скан) Список прямых и узлов для рис. 13.4

совокупностью линий. Неформально области соответствуют видимым частям поверхностей объектов в наблюдаемой сцене. Чтобы убедиться в этом, представим наблюдателя, рассматривающего два расположенных на столе детских кубика (рис. 13.5). Для осуществления вывода о сцене наблюдатель должен приписать каждую область соответствующей поверхности объекта и затем определить положение объектов сцены в трехмерном пространстве.

Прямые, узлы и области являются свойствами двумерных изображений; объединяясь, они образуют наблюдаемые предметы. Сцены состоят из объектов, основные элементы которых представляют собой поверхности, края и углы. Для простоты ограничимся объектами с плоскими поверхностями, если только не указано противное. В анализе сцен для восстановления трехмерной сцены из двумерного изображения используются определенные отношения между элементами изображения и сцены. Основным моментом в процессе восстановления является определение влияния формы объектов и их ориентации по отношению к наблюдателю на воспринимаемое изображение. Гузман (1968) первым предложил систематические методы использования этой информации. Его методы затем были обобщены другими, включая Клюса (1971) и Хаффмена (1971), построивших каталоги типов фрагментов изображений, которые можно получить из различных конфигураций узлов и отношений „впереди - позади“.

Край можно классифицировать как вогнутый или выпуклый в зависимости от того, связывает он две поверхности, выступающие в направлении наблюдателя или в обратном направлении. Это иллюстрируется рис. 13.6, на котором схематически показаны два наблюдателя, разглядывающие сцену, представляющую собой кубик, поставленный на другой кубик. Наблюдатель I видит выпуклый край в точке 1 и вогнутый в точке 2.

Рассмотрим теперь изображение этой же сцены, воспринимаемое наблюдателем II (рис. 13.7). Предполагая, что она состоит из параллелепипедов, можно считать, что узел А образован углом, связывающим три грани, одна из которых не видна. Далее, наличие такого узла означает, что две видимые грани имеют общий выпуклый край по отношению к наблюдателю II, а два края между невидимой поверхностью и каждой из видимых могут быть как выпуклые, так и вогнутые (рис. 13.8, а). Далее, если такая интерпретация узла А верна, то должен существовать угол, который образует другой узел (рис. 13.8, б), расположенный справа и лежащий на прямой 3. (На самом деле эта точка не обязательно должна быть на прямой 3, поскольку последняя может быть прервана изображением объекта, лежащего на линии зрения (рис. 13.5).)

Рассмотрим теперь узел В (рис. 13.7). Такая точка, вероятно, не может соответствовать углу в сцене, состоящей из параллелепипедов. Поэтому ее можно интерпретировать как свидетельство того,

(кликните для просмотра скана)

(кликните для просмотра скана)

что в этой сцене существует вертикальная грань, закрывающая далекий край грани А (рис. 13.8, а). Эта интерпретация допускает узел (типа показанного на рис. 13.9) где-то на продолжении прямой

2 (рис. 13.8, а). Предполагаемый узел может быть невидимым, если имеется закрывающая его вертикальная грань, как это и случилось в рассматриваемом примере.

Следующий момент, который необходимо учесть, заключается в том, что определенные группировки рассматриваемой сцены предопределяют наличие определенных узлов в изображении. Несколько интерпретаций могут включать тот же самый узел, однако будет только одна интерпретация сцены, которая удовлетворяет всем узлам, если только изображение действительно однозначно. Программа может идентифицировать небольшое число узлов, строить гипотезу о рассматриваемой сцене и проверять эту гипотезу путем поиска в изображении узлов, содержащихся в интерпретации. Такой метод называется анализом при помощи синтеза, и он не только осуществим в машинном зрении, но также тесно связан с принципами, которые были предложены для описания человеческого зрительного восприятия (Нейссер, 1967). Основная слабость анализа при помощи синтеза заключается в том, что он предполагает наличие знания о виде объектов, которые могут встретиться в сцене. Прежде чем обсуждать, насколько ограничительно это допущение, рассмотрим подробный пример работы программы, использующей метод анализа при помощи синтеза.

<< Предыдущий параграф Следующий параграф >>
Оглавление