Главная

Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






Задача 1. Оценка общей информативности изображения


Исходные предпосылки

Совместная информация, содержащаяся в изображении трех каналов, есть

Н(R,B,G) = H(R)+H(B)+H(G) –T(R,B,G), где

H(R),(H(B),H(G)) – энтропия (разнообразие) в канале R – красный (B – голубой, G – зеленый).

T(R,B,G) – сопряженность между каналами.

H(R) = -Sp(ri)log(p(ri)),

где ri – i- значение яркости красного канала,

H(R,G,B)= -Sp(ri,gi,bi)log(p(ri,gi,bi)) –

информация, содержащаяся в трех каналах друг о друге, или мера сопряженности [Кульбак, 1956].

Если каналы полностью не зависят друг от друга, то сумма их частных энтропий равна совместной энтропии, если же они как-то сопряжены друг с другом, то совместная энтропия меньше этой суммы. Прямое определение сопряженности трех каналов практически невозможно даже для очень больших объемов данных, так как требует очень большого числа степеней свободы. Измерения в каждом канале обычно имеют 256 градаций яркости, и, соответственно, для оценки совместной сопряженности требуется примерно 2563 измерений. Задачу можно решить, если разложить трехмерное изображение по независимым ортогональным составляющим – компонентам. Затем для каждой независимой компоненты определить энтропию и суммировать эти энтропии с учетом веса компоненты. Покажем последовательно решение этой задачи.

 

На рис. 5 показано изображение, разложенное на три канала, а на рис. 6 – распределение яркостей по частотам в красном канале. Следует отметить, что используемое осеннее изображение (рис.4 а) представлено в Интернете в сжатом виде. В результате распределение яркостей не охватывает всей амплитуды возможных значений. Этот дефект весьма удобен для демонстрации подхода, обеспечивающего соизмеримость оценок по изображениям различного качества.

Для ортогонального преобразования многоканальных изображений обычно используют метод главных компонент. В первом приближении его действие можно определить следующим образом: допустим, что изображения в трех каналах полностью подобны друг другу. Тогда корреляция между ними будет равна 1, и значения яркости во всех трех каналах можно рассматривать как зависящие от одного фактора. В противоположной ситуации, когда каналы полностью независимы, каждый из них описывается собственным независимым фактором.

 

 

Если же реально яркости в каналах в какой-то степени коррелируют друг с другом, то ситуация промежуточная, и эти каналы можно отобразить как функции от трех независимых факторов. Задача расчета независимых ортогональных факторов решается на основе матричной алгебры.

Приведем статистические параметры для трех каналов и их факторное отображение.

Таблица 1

Корреляционная матрица между каналами

(Landsat 7, 1999.10)

  R G B
R 1,00 0,86 0,77
G 0,86 1,00 0,70
B 0,77 0,70 1,00

 

Как следует из таблицы, подобие изображений в трех каналах значительно, но не абсолютно. Значения яркостей красного канала описываются значениями зеленого и голубого на 79%, зеленый канал описывается двумя другими на 74% и голубой на – 60%.

Таким образом, хотя каналы и связаны друг с другом, но каждый из них содержит как совместную с другими, так и собственную информацию о подстилающей поверхности.

Разложение по ортогональному базису осуществляется таким образом, что первый фактор описывает наиболее общую часть варьирования, объединяющую все переменные, второй фактор – меньшую часть, а третий – оставшуюся. В табл. 2 приведены собственные значения факторов или, иначе говоря, их дисперсии. При этом полная дисперсия равна числу переменных (в данном случае трем).

Таблица 2

Собственные значения главных компонент для трех

Каналов Landsat -7 (1999.10)

STATISTICA ФАКТОРНЫЙ АНАЛИЗ Собственные значения Выделение: Главные компоненты
Значение Собственные значения % общей дисперсии Кумулят. соб. знач. Кумулят. %
1 2 3 2,555880 0,311887 0,132234 85,19599 10,396224 0,40779 2,555880 2,867766 3,000000 85,1960 95,5922 100,0000
           

Если распределения нормальны, то энтропия для непрерывного распределения равна:

Hi = 0,5log2 (2pesi),

где si – дисперсия i-фактора.

Таким образом, при допущении нормальности распределения значений факторов общая энтропия изображения в силу независимости факторов равна сумме их энтропий:

H = H1+H2+H3 = 0,5(3log2 (2pe)+log2s1+ log2s2+ log2s3).

 

Таблица 3
Факторные нагрузки – коэффициенты корреляции переменных с факторами для трех каналов Landsat – 7 (1999.10).

  Фактор 1 Фактор 2 Фактор 3
R (красный) 0,952035 -0,119955 -0,281496
G (зеленый) 0,925829 -0,308871 0,217804
B (голубой) 0,890140 0,449551 0,074533
Дисперсия 2,555880 0,311887 0,132234
Дисперсия %% 85,1960 10,3962 4,4078

 

Из табл. 3 следует, что 85% всего разнообразия описывается первым фактором, и с этим фактором в наибольшей степени положительно коррелируют все каналы. Второй фактор в наибольшей степени отражает собственную информацию, содержащуюся в голубом канале, и с отрицательной корреляцией – существенную часть варьирования яркости в зеленом канале. Третий фактор в какой-то степени отображает независимую информацию, содержащуюся в красном и зеленом каналах.

На рис. 7 представлено разложение трех каналов по ортогональному базису трех факторов. Эти изображения полностью независимы друг от друга. Первый фактор отображает почти всю информацию, содержащуюся в трех каналах, и читается как обычная панхроматическая фотография. Второй фактор с высокой надежностью выделяет, по крайней мере, крупные населенные пункты, как совершенно особые территории. Это определяется высоким уровнем их «голубизны», по-видимому, в результате загрязнения атмосферы при малой яркости в зеленой части спектра. Третий фактор, как наиболее яркий, выделяет наиболее «зеленые» и вместе с тем наименее «красные» территории, а как темные – наоборот. Можно полагать, что темному цвету соответствуют ландшафты с высокой яркостью в красном канале, то есть наиболее «сухие» и наиболее «теплые» почвы, а светлому, напротив, – относительно влажные. Скорее всего, темному тону соответствуют песчаные флювиогляциальные отложения, а светлому, напротив, – богатые суглинистые почвы.

Построив распределения по каждому фактору для 256 градаций, можно определить содержащуюся в них энтропию по дискретной схеме: Hi = – Spjlog2pj ,

где pj – вероятность (частота) яркости, j = 0,1,2…255.

Общая энтропия в этом случае оценивается как:

H = H1+H2+H3 +(log2s1+log2s2+logs3) -3log3,

где аргументы с дисперсией корректируют вклад каждого фактора в общее разнообразие.

На рис. 6 приведены распределения в красном канале для осеннего и зимнего снимков. Характер распределений показывает, что качество осеннего изображения низкое и распределение, в отличие от зимнего снимка, не непрерывное. В табл. 4 приведена матрица корреляции, а в табл. 5 – факторные нагрузки и дисперсии для зимнего снимка.

Таблица 4



Последнее изменение этой страницы: 2016-06-10

headinsider.info. Все права принадлежат авторам данных материалов.