Главная > Интеллектуальные системы > Зрение роботов
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

18.4. Сегментация

В описываемой здесь конкретной системе используется метод стереофотометрии для получения информации о форме поверхности объектов в поле зрения (рис. 18.3). Вычисленные таким образом игольчатые диаграммы, представляющие ориентацию поверхности, затем сопоставляются с запомненными ранее прототипами объектов.

Прежде чем использовать разработанные ранее методы для обработки гауссовых образов, мы должны отделить область изображения, соответствующую одному объекту. Одной из наиболее трудных проблем машинного видения, как мы установили, является сегментация изображения на области, соответствующие различным объектам. Только после этого можно воспользоваться методами распознавания объекта и определения его положения. Для обеспечения надежной сегментации

(кликните для просмотра скана)

можно объединить несколько методов. Прежде всего с помощью стереофотометрической системы некоторые точки маркируются как особые. Большинство входов в таблицу просмотра в действительности оказываются пустыми (рис. 18.4). Пустые входы определяют «незаконную» комбинацию яркостей, которая не может возникнуть в отсутствие затенения или отсветов от соседних объектов. Так как ориентация поверхности обладает двумя степенями свободы, корректные комбинации яркостей лежат на двумерной поверхности в трехмерном пространстве, определяемом тремя параметрами яркости. На практике эта поверхность расширяется до некоторого слоя конечной толщины в дискретной таблице просмотра благодаря шуму измерений, квантованию и небольшим вариациям отражательной способности поверхности.

Объекты отбрасывают тени друг на друга, в результате чего некоторые точки затененного объекта имеют яркость, отличающуюся от той, которую бы они имели при отсутствии затенения. Надо уметь определять эту ситуацию, чтобы избежать неточной оценки ориентации поверхности. Грубо определить затенение можно при использовании порогов для каждого из трех параметров яркости, Заметим, между прочим, что объекты, лежащие сверху навала, т. е. наиболее интересные для нас, как правило, не затенены.

Другой проблемой являются рефлексы, т. е. отсветы от соседних объектов. Когда объекты с высоким альбедо находятся вблизи друг друга, свет, отраженный от одного объекта, может значительно увеличить освещенность другого. И здесь мы тоже имеем дело с комбинациями яркостей, которые не возникали бы при освещении объекта только одним источником. Надо уметь также определять и взаимную освещенность, чтобы избегать неправильной оценки ориентации поверхности. К счастью, точки, в которых возникает эта проблема, в основном появляются вблизи ребер объектов и тех границ, где объекты перекрывают друг друга.

Далее заметим, что обычно возникает разрыв непрерывности в ориентации поверхности в тех местах, где один объект перекрывает другой. Рассмотрим те места, в которых ориентация поверхности меняется быстро. Этот метод хорошо работает в том случае, когда объекты гладкие, однако может вызвать ложную сегментацию для объектов с острыми ребрами. И наконец, рассмотрим те места, в которых нормаль к поверхности составляет почти прямой угол с направлением наблюдения. Это возникает, как правило, вблизи краев, где один объект закрывает другой. К сожалению, у объектов с острыми ребрами могут быть ограничивающие ребра, для которых направление наблюдения не касается поверхности. Однако в этом случае разрыв непрерывности в ориентации поверхности мог бы помочь маркировать ребро.

Рассмотренные выше случаи сегментации можно использовать для разделения объектов. На этой фазе в качестве частей объекта можно

Рис. 18.5. Информация на игольчатой диаграмме, используемая для помощи в сегментации изображения на области, которые соответствуют отдельным поверхностям. а — игольчатая диаграмма контейнера с тороидальными объектами, на основе которой строится бинарное изображение; б - бинарное изображение, используемое для сегментации. Обе части рисунка показаны с грубым разрешением, поэтому шолки на диаграмме достаточно велики, чтобы их было видно.

рассматривать только те участки изображения, нормали которых лежат в пределах 45° к направлению наблюдения. В связи с таким жестким ограничением площадь участков, относимых к объекту, может значительно сократиться. Это можно исправить в дальнейшем применением операции распространения, заимствованной из методов обработки двоичных изображений. В некоторых случаях из-за такою подхода область изображения, соответствующая объекту, который сильно наклонен в направлении наблюдения, может быть разорвана. В описываемом здесь применении это не является серьезной проблемой, поскольку сильно наклоненные объекты в любом случае трудно брать. Лучше сосредоточиться на других объектах.

На рис. 18.5, а представлена игольчатая диаграмма сцены, состоящей из навала тороидальных объектов, а на рис. — двоичное изображение, используемое для сегментации. Двоичное изображение получено из игольчатой диаграммы описанным выше методом.

<< Предыдущий параграф Следующий параграф >>
Оглавление