Главная > Интеллектуальные системы > Зрение роботов
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

8.7. Комментарии к литературе

Марр сильно повлиял на изложенную выше точку зрения по проблеме предварительной обработки изображений. Его идеи можно найти

в книге [75]. Другие работы, в которых подходы к выделению краев обсуждаются с близких позиций, - это книги Гримсона [48] и Хилдрет [59].

Выделение краев было одной из наиболее бурно развивающихся областей в машинном зрении. В классической работе Робертса [394] показано, как выделять края на фотографиях многогранников, оцифрованных с помощью барабанного графопостроителя с преобразователем. Благодаря высокому качеству входного сигнала и придуманной им хитроумной схеме постпроцессорной обработки, Робертсу удалось получить удовлетворительные результаты на основе оператора, который имел чрезвычайно малый носитель. Это могло направить других по неправильному пути поиска операторов с малыми носителями. Бин-форд [146] осознал, что в случае зашумленного изображения для получения достаточно резкой линии края необходимо рассматривать большие области. Эта идея была принята не сразу, но когда это случилось, стали искать «оптимальный» оператор выделения края с большим носителем.

Не все методы выделения и локализации краев основываются на изложенном в настоящей главе подходе, использующем понятие свертки. Дуда и Харт [28] рассматривают преобразование Хоха, т. е. отображение искомой линии в параметрическое пространство. О недостатках преобразования Хоха говорится в работе [165]. Результаты, полученные с помощью простых схем выделения краев, оставляют желать лучшего. Это приводит к мысли о необходимости привлечения дополнительных знаний. Так, в работах [216, 217] введены предположения о том, как статистически распределены характеристики изображения, а в работе [427] направление обработки на те участки, где обнаружение границ наиболее вероятно, достигалось благодаря использованию априорных знаний о сцене. Хюккель [266, 267] разработал схему восполнения типа наименьших квадратов, основанную на разложении заданной в области функции яркости на ортогональные функции. Одно из достоинств его подхода состоит в том, что носитель при этом должен быть довольно большим. В работе [362] представлен более простой вариант метода Хюккеля. Позднее Хэрэлик [231] предложил использовать кусочно-линейную аппроксимацию поверхности, образуемой функцией яркости.

За применением оператора первой производной должен следовать поиск экстремальных значений результата. Необходимо также уметь также подавлять выбросы в окрестности локального максимума. Частично из-за этого более популярными стали операторы вторых производных, поскольку при их использовании край проходит там, где выход равен нулю. Далее линейные операторы первых производных зависят от направления. Поэтому второе преимущество операторов вторых производных обусловлено тем, что им можно придать форму, при которой они обладают круговой симметрией. Для выделения краев были

предложены операторы Лапласа и различные дискретные аппроксимации. Так, Хорном в работе [246] показано, что лапласиан является линейным оператором наименьшего порядка, который сохраняет информацию, требуемую для восстановления изображения. Позже он использовал лапласиан для вычисления освещенности [247]. В работе [347] получена оптимальная оценка лапласиана для носителя большой площади.

Оператор Гаусса широко использовался для выполнения сглаживающих операций по нескольким причинам. Одна из них связана с тем, что это — единственный оператор с круговой симметрией, являющийся произведением двух одномерных операторов. Это было установлено Хорном [246]. Другой причиной служило хорошо известное свойство, что для него минимально произведение размеров в пространственной и частотной областях. Пример его применения (а точнее, разности между двумя пространственно разнесенными операторами Гаусса) в задаче выделения краев можно найти в работах [322, 323]. Некоторые свойства операторов с круговой симметрией рассмотрены в работе [154]. При обсуждении проблемы освещенности Блейком [149] использовано понятие независящих от выбора системы координат векторов.

Первоначально в качестве оператора выделения края Марр предложил оператор, зависящий от направлений [326]. Позже он утверждал, что оптимальным является оператор с круговой симметрией. Контуры, вдоль которых на обработанном изображении происходит смена знака, называются линиями нулевого уровня. Новая теория выделения краев, основанная на обнаружении линий нулевого уровня на изображении, являющемся результатом применения оператора четного (по производным) порядка, изложена в работе Марра и Хилдрет [329], а также в работе Хилдрет [238]. Они взяли оператор Лапласа и так скомбинировали его со сглаживающим фильтром, построенным на основе функции Гаусса, что в итоге получился оператор выделения края с круговой симметрией. В идеале линии нулевого уровня отфильтрованного изображения представляют собой замкнутые контуры. Этот новый изящный метод обнаружения краев явился естественным откликом на потребность сочетания методов сегментации областей и выделения контуров. К сожалению, значительная доля периметра линии нулевого уровня состоит из участков, не имеющих отношения к важным деталям изображения.

В работе [412], возможно впервые, предложена обработка изображения одновременно на различных уровнях разрешения. Последующие результаты приведены в работе [413]. Марр и Хилдрет [238, 239, 329] разработали модуль предварительной обработки изображения с использованием линий нулевого уровня на выходе оператора, который представляет собой оператор Лапласа, примененный к четырем функциям Гаусса различной ширины. Это направление продолжает оставаться активной областью исследований, что подтверждает недавно

вышедшая статья [234]. Уиткин [473, 474] обнаружил ряд интересных свойств диаграмм, прослеживающих линии нулевого уровня при непрерывном изменении масштаба. До сих пор они в основном использовались в одномерных задачах. В работе [488] показано, что фильтр на основе функции Гаусса является единственным фильтром, который не вносит в выходной сигнал ложных линий нулевого уровня.

Еще недавно уделялось больше внимания вопросам точности и чувствительности к шуму вышеупомянутых операторов усиления края, что отражено, например, в работе [143]. В упражнениях к данной главе указывается, что в этом отношении операторы по направлению могут обладать преимуществами. Хэрэлик [232] рассмотрел возможность использования второй производной по направлению градиента яркости. Этот нелинейный оператор ранее уже употреблялся для маркировки краев [92], но столь подробно не изучался.

Кэнни [170] разработал одномерный оператор, обеспечивающий оптимальное соответствие между локализацией и выделением. Оператор минимизирует сумму двух критериев, а именно: вероятности пропустить край или обнаружить край там, где его на самом деле нет, и расстояние между выделенным и истинным краями. Первый критерий одновременно приводит к уменьшению вероятности повторного обнаружения одного и того же края. Кэнни ограничил поиск решения множеством линейных пространственно-инвариантных операторов. Он подтвердил вывод о существовании компромисса между отношением сигнал — шум и локализацией и показал, что оптимальный оператор можно представить в виде суммы четырех комплексных экспонент. Результат содержит произвольный скалярный множитель, что позволяет получать операторы с носителями различных размеров.

Поскольку край обладает значительным пространственным протяжением, его можно локализовать с точностью, существенно превышающей ширину отдельного элемента изображения. Получение разрешения, превышающего размер одного пиксела, представляло интерес как в машинном, так и биологическом зрении, о чем можно судить, например, по работам [198, 201, 444]. Точность выделения краев также можно повысить путем их прослеживания на последовательности изображений, полученных в разные моменты времени, о чем и идет речь в работе [236].

Иные аспекты проблемы выделения краев рассмотрены в работах [205, 223, 282, 362 - 364, 370, 371, 391, 476]. Среди обзоров по методам выделения краев и дальнейшим путям их усовершенствования нельзя не упомянуть работы [158, 184, 231].

Совсем другой подход к проблеме выделения краев основан на стохастических моделях изображения. Примером может служить работа [180] по адаптивному обнаружению границ. Более ранние исследования по этой теме опубликованы в работах [227, 485]. К проблеме выделения краев относится также задача обнаружения линий. В работе

[445] описывается система для векторизации, т. е. получения символического описания по штриховым рисункам.

8.8. Упражнения

(см. скан)

(см. скан)

(см. скан)

(см. скан)

(см. скан)

(см. скан)

(см. скан)

(см. скан)

(см. скан)

<< Предыдущий параграф Следующий параграф >>
Оглавление