МИРЭА / Методичка_2010 / Методичка_2010

Бинаризация полутоновых изображений

В обработке изображений часто используется процедура «пороговой бинаризации» – разбиение изображения на две области, одна из которых содержит все пиксели со значением ниже некоторого порога, а другая содержит все пиксели со значением выше этого порога.

Алгоритмы адаптивной бинаризации изображений базируются на использовании локальной или глобальной гистограммы изображения [20]. Подход, основанный на использовании гистограммы яркостей пикселей, является одним из самых известных и, безусловно, наиболее простым.

Оптимальная пороговая сегментация основана на приближении гистограммы изображения к некоторой кривой, используя весовые суммы двух или более вероятностей интенсивности с нормальным распределением. Тогда порог – это набор ближайших уровней яркости, соответствующих минимуму вероятности между максимумами двух или более нормальных распределений.

@Рис. 3.1.1. Уровни яркости гистограммы аппроксимируются двумя нормальными распределениями. (а) Функции распределения объекта и фона. (б) Соответствующие гистограммы и оптимальный порог

Для определения оптимального порога бинаризации предложено большое количество различных подходов. Наиболее удачным из них представляется подход Otsu [230], который предполагает не только определение оптимального порога бинаризации, но и вычисление некоторого критерия бимодальности, то есть оценку того, действительно ли исследуемая гистограмма содержит именно две моды (два выраженных пика). Идея данного подхода заключается в следующем.

Пусть изображение представляет собой двумерный массив IM размера XY, причем его элементы (пиксели) принимают значения на отрезке [0..255]. Тогда гистограмма этого изображения представляет собой одномерный массив Hist[0..255], в каждой ячейке которого Hist[i] содержится число пикселей изображения, имеющих значение, равное i. Рассмотрим теперь «подгистограмму» Hist[k...l], 0k, l255. Для любой такой подгистограммы (окна) [k,l] можно вычислить оценку математического ожидания яркости пикселей MO(k,l) и оценку дисперсии DISP(k,l). Пусть дан порог t: 0t255.

Тогда для данного порога t можно вычислить «критерий разделимости»SC вида

SC(t) = 1 – (DISP(0,t) + DISP(t+1,255)) / DISP(0,255) (3.1.1)

Критерий SC(t) всегда принимает значение на отрезке [0,1], причем значение его тем больше, чем лучше разделимость яркостного распределения на два класса относительно порога t. Алгоритм Отсу предполагает вычисление SC(t) для всех t[0..255], после чего оптимальный порог Отсу определяется как

T = argmax SC(t), t[0..255] (3.1.2).

Этот алгоритм имеет ясный статистический смысл и, как показывает практика, является эффективным и устойчивым способом определения адаптивного порога для бинаризации бимодальных изображений.

Содержание