Главная > Интеллектуальные системы > Зрение роботов
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.2. Построение гистограммы

Представьте себе идеальный случай, когда объект и фон обладают равномерной яркостью. В этом случае порог выбрать очень легко, если только значения яркости объекта и фона различны. Можно взять любую величину, заключенную между этими значениями, например их среднее арифметическое.

В действительности элементы изображения (пикселы), соответствующие объекту, не будут иметь точно один и тот же уровень яркости (рис. 5.2). Это обусловлено рядом факторов, в частности наличием шума. Определение уровня яркости включает измерение относительно небольшого числа электронов, освобождаемых падающими фотонами, что приводит к некоторым флуктуациям в измеряемых токах. Большой шум вносит усилитель тока. Этот шум проявляется в размывании функции распределения вероятности; точнее: плотность распределения вероятности, которую бы мы получили при отсутствии шума, свертывается с плотностью распределения аддитивного шума. Кроме того, датчики в различных точках обычно реагируют по-разному, а объекты не обладают в точности постоянной отражательной способностью или равномерным освещением. В силу этих и других причин мы должны ожидать наличия разброса в уровнях яркости как для объекта, так и для фона.

Если нам повезет, то этот разброс окажется настолько малым, что все равно - будет существовать пороговое значение, разделяющее две группы уровней. Его можно найти, если построить гистограмму уровней.

Рис. 5.2. Гистограмма полутонов, иногда оказывающаяся полезной для определения порога, который позволяет разбить изображение на области. Здесь — число элементов изображения, имеющих уровень яркости Е.

На гистограмме можно увидеть два всплеска, грубо соответствующих объекту и фону, и впадину между ними (рис. 5.2). В идеале между всплесками будет полный провал, но если даже две группы уровней несколько перекрываются, за пороговое значение можно принять минимальный уровень, соответствующий минимуму гистограммы. Это позволит произвести бинаризацию изображения лишь с незначительным числом ошибок.

Если «сигнал» (разность между уровнями яркости объекта и фона) ненамного превосходит «шум» (разброс в распределении уровней яркости), то подобным образом успеха, конечно, добиться нельзя. В этом случае может помочь усреднение значений соседних элементов. Это снизит шум пропорционально квадратному корню из числа усредненных элементов. На уровень сигнала такая процедура не повлияет, но пространственное разрешение ухудшится.

До сих пор мы предполагали, что каждое значение гистограммы отвечает одному уровню яркости. Можно построить более грубую гистограмму, объединяя соседние уровни. При построении гистограммы всегда возникает трудная дилемма: какова должна быть ширина интервалов? Каждому интервалу соответствует число элементов изображения, уровень яркости которых лежит между его нижней и верхней границами. Если интервалы слишком широки, разрешающая способность в определении уровней низкая (в предельном случае имеется один интервал и нулевая разрешающая способность). Если же интервалы слишком узки, то в каждый из них попадет очень мало значений и гистограмма окажется сильно изрезанной (в пределе почти все интервалы, кроме некоторых, не содержат ни одного измерения). В этом последнем случае трудно локализовать положение минимума. Естественно, что подобный эффект выражен слабее, когда объект занимает значительную площадь. Гистограмму часто приходится сглаживать, объединяя соседние интервалы, но это ухудшает разрешающую способность.

Имеет место и другая трудность, связанная с элементами изображения, расположенными на границе объекта (рис. 5.3). Такие элементы будут иметь промежуточные значения уровней, что приведет к смазыванию и слиянию краев двух всплесков. Степень проявления эффекта зависит от доли элементов изображения, попадающих на границы. В свою очередь эта доля обратно пропорциональна квадратному корню из отношения площади объекта к площади одного элемента изображения. Таким образом, проблема не столь остра при высокой разрешающей способности изображения объекта. И наоборот, она усугубляется при применении метода усреднения, предложенного выше для увеличения отношения сигнал — шум.

Другая проблема возникает, когда площадь части изображения, занимаемой объектом, много больше или много меньше площади фона. При этом меньший всплеск на гистограмме может оказаться

Рис. 5.3. Элементы изображения, пересекающие границу между двумя областями. Они будут иметь промежуточные уровни яркости относительно уровней яркости этих областей.

подавленным краем основного всплеска. Минимального значения, соответствующего порогу, может не оказаться. Необходимо также помнить, что гистограмма будет «зашумленной» из-за того, что число имеющихся отсчетов конечно. Поэтому, если даже распределение яркости, лежащее в основе изображения, представляет собой гладкую функцию с ярко выраженными максимумами, нельзя ожидать того же самого по отношению к гистограмме уровней.

Если известна доля площади, занимаемой объектом, то возможна простая модификация нашего метода. Прежде всего построим интегральную гистограмму суммированием значений дифференциальной гистограммы. Как упоминалось выше, интегральная гистограмма для каждого значения яркости дает число элементов изображения с тем же или меньшим значением яркости. Положим пороговое значение таким, чтобы число элементов изображения, имеющих пороговую или меньшую яркость, составляло заданную долю от всего числа элементов. Заметьте, что теперь уже мы не можем воспользоваться вычисленным значением площади бинарного изображения, поскольку мы ее задали при определении порога!

Некоторые из наиболее четких бинарных изображений получают вообще не из обычных оптических снимков. Так, мы можем измерить расстояние от некоторой заданной плоскости до точек на поверхности объекта. Бинарное изображение получается пороговым разделением этой «карты дальностей». Таким путем можно определить силуэт объекта, лежащего на столе или ленте конвейера.

Сам принцип измерения расстояния может быть оптическим (рис. 5.4). На рисунке два источника с цилиндрическими линзами испускают полоски света, которые пересекаются по прямой, лежащей на поверхности конвейерной ленты. Камера над лентой сориентирована так, что эта прямая воспринимается рядом последовательно расположенных фотодатчиков (фотолинейкой). Если объект отсутствует, то все фотодатчики освещаются одинаково ярко. Если часть объекта загораживает падающий свет, то соответствующая область фотолинейки оказывается затененной. Движение конвейера приводит к тому, что объект проходит под фотолинейкой, порождая второе измерение изображения. Ширина полоски света и характеристики оптических приборов подобраны так, что неизбежные малые вертикальные смещения ленты конвейера не приводят к существенной потере света, воспринимаемого датчиками. Ввиду этого устройство способно определять, находится ли высота объекта в пределах данного интервала.

Чтобы уменьшить число «призраков», возникающих благодаря затенению ленты конвейера частью объекта, еще не достигшей прямой, на которую сфокусирована фотолинейка, добавлены еще два источника света (однако проблему представляют глубокие отверстия, которые не будут обнаруживаться устройством).

Рис. 5.4. (см. скан) Возможность получения бинарною изображения путем порогового разделения карты дальностей, которая в свою очередь строится с помощью своего рода структурной подсветки.

На этом рисунке, например, поверхность освещается полоской света. Фотолинейка расположена вертикально над прямой, по которой полоса пересекает поверхность ленты конвейера. Когда на ней находится объект, то он загораживает свет и тот не достигает поверхности. Фотолинейка воспримет свет только в том случае, когда он достигнет поверхности. Чтобы получить полное изображение, необходимо пропустить весь объект через светочувствительную область воспринимающего устройства.

<< Предыдущий параграф Следующий параграф >>
Оглавление