Otsu methodu

Bilgisayarla görme ve görüntü işlemede, otomatik görüntü eşikleme yapmak için Nobuyuki Otsu (大津展之 Ōtsu Nobuyuki) tarafından oluşturulan Otsu methodu kullanılmaktadır.^[1] En basit haliyle, algoritma pikselleri ön plan ve arka plan olmak üzere iki sınıfa ayıran tek bir yoğunluk eşiği döndürmektedir. Bu eşik, sınıf içi yoğunluk varyansını en aza indirerek veya eşdeğer olarak, sınıflar arası varyansı maksimize ederek belirlenmektedir.^[2] Otsu'nun yöntemi, Fisher's Discriminant Analysis'in tek boyutlu ayrık bir analoğudur. Jenks optimizasyon yöntemiyle ilgilidir ve yoğunluk histogramında gerçekleştirilen global olarak en uygun k-ortalamalara eşdeğerdir.^[3] Çok seviyeli eşiklemenin genişletilmesi orijinal belgede açıklanmıştır ve o zamandan beri hesaplama açısından verimli uygulamalar önerilmiştir.^[2]^[4]^[5]

Otsu methodu

Algoritma, iki sınıfın ağırlıklı bir toplamı olarak tanımlanan sınıf içi varyansı en aza indiren eşiği kapsamlı bir şekilde arar.

σ_{w}^{2} (t) = ω_{0} (t) σ_{0}^{2} (t) + ω_{1} (t) σ_{1}^{2} (t)

$ω_{0}$ ve $ω_{1}$ ağırlıkları, $t$ eşiği ile ayrılan iki sınıfın olasılıklarıdır. $σ_{0}^{2}$ ve $σ_{1}^{2}$ bu iki sınıfın varyanslarıdır.

$ω_{0, 1} (t)$ sınıf olasılığı, histogramın $L$ kutularından aşağıdaki gibi hesaplanır:

\begin{matrix} ω_{0} (t) & = \sum_{i = 0}^{t - 1} p (i) \\ ω_{1} (t) & = \sum_{i = t}^{L - 1} p (i) \end{matrix}

2 sınıf için, sınıf içi varyansı en aza indirmek, sınıflar arası varyansı en üst düzeye çıkarmakla eşdeğerdir.^[2]

\begin{matrix} σ_{b}^{2} (t) & = σ^{2} - σ_{w}^{2} (t) = ω_{0} (μ_{0} - μ_{T})^{2} + ω_{1} (μ_{1} - μ_{T})^{2} \\ = ω_{0} (t) ω_{1} (t) {[μ_{0} (t) - μ_{1} (t)]}^{2} \end{matrix}

Bu, $ω$ sınıf olasılıkları cinsinden ifade edilir. Sınıf $μ$ anlamına gelir. Burada sınıf $μ_{0} (t)$ , $μ_{1} (t)$ ve $μ_{T}$ anlamına gelir.

\begin{matrix} μ_{0} (t) & = \frac{\sum_{i = 0}^{t - 1} i p (i)}{ω_{0} (t)} \\ μ_{1} (t) & = \frac{\sum_{i = t}^{L - 1} i p (i)}{ω_{1} (t)} \\ μ_{T} & = \sum_{i = 0}^{L - 1} i p (i) \end{matrix}

Aşağıdaki ilişkiyi bunlarla açıklayabiliriz:

\begin{matrix} ω_{0} μ_{0} + ω_{1} μ_{1} & = μ_{T} \\ ω_{0} + ω_{1} & = 1 \end{matrix}

Sınıf olasılıkları ve sınıf ortalamaları yinelemeli olarak hesaplanabilir. Bu fikir etkili bir algoritma sağlamaktadır.

Algoritma

Her yoğunluk seviyesinin histogramı ve olasılıkları hesaplanır.
İlk $ω_{i} (0)$ ve $μ_{i} (0)$ ayarlanır.
Adım adım t=1,… tüm olası eşikler maksimum yoğunluk için hesaplanır.
1. $ω_{i}$ ve $μ_{i}$ güncellenir.
2. $σ_{b}^{2} (t)$ hesaplanır.
İstenen eşik maksimum $σ_{b}^{2} (t)$ değerine karşılık gelir.

MATLAB veya Octave uygulaması

histogramSayacı farklı gri düzeylerinde (8 bitlik görüntüler için tipik) bir gri tonlamalı görüntünün 256 elemanlı bir histogramıdır.

function seviye = otsu(histogramSayacı)
total = sum(histogramSayacı); % görüntüdeki toplam piksel sayısı
%% OTSU otomatik eşiklemesi
top = 256;
toplamB = 0;
wB = 0;
maksimum = 0.0;
toplam1 = dot(0:top-1, histogramSayacı);
for ii = 1:top
    wF = total - wB;
    if wB > 0 && wF > 0
        mF = (toplam1 - toplamB) / wF;
        val = wB * wF * ((toplamB / wB) - mF) * ((toplamB / wB) - mF);
        if ( val >= maksimum )
            seviye = ii;
            maksimum = val;
        end
    end
    wB = wB + histogramSayacı(ii);
    toplamB = toplamB + (ii-1) * histogramSayacı(ii);
end
end

Matlab, sırasıyla Otsu methodu ve Multi Otsu methoduyla uygulanan Görüntü İşleme Araç Kutusu'nda graythresh() ve multithresh() yerleşik fonksiyonlarına sahiptir.

Sınırlamalar

Otsu methodunda, histogramın iki modlu dağılıma sahip olduğu ve iki tepe arasında derin ve keskin bir vadiye sahip olduğu varsayılabilirse, nispeten iyi bir performans sergilemektedir. Ancak nesne alanı, arka plan alanıyla karşılaştırıldığında nesne alanı küçükse, histogram artık iki modluluk göstermez.^[6] Ve nesnenin varyansları ve arka plan yoğunlukları, ortalama farkla karşılaştırıldığında büyükse veya görüntü, ek gürültü tarafından ciddi şekilde bozulursa, gri seviye histogramının keskin vadisi bozulmaktadır. Ardından, Otsu'nun yöntemiyle belirlenen olası yanlış eşik, segmentasyon hatasıyla sonuçlanmaktadır. (Burada nesne boyutunu, nesne alanının tüm görüntü alanına oranı ve ortalama farkı, nesnenin ve arka planın ortalama yoğunluklarının farkı olarak tanımlıyoruz)

Ampirik sonuçlar, nesne segmentasyonu için kullanılan global eşikleme tekniklerinin performansının (Otsu algoritması dahil) küçük nesne boyutu, ön plan ve arka plan pikselleri arasındaki küçük ortalama fark, nesneye ait olan ve nesneye ait olan piksellerin büyük varyansları ile sınırlı olduğunu göstermektedir.^[7]

İyileştirmeler

Otsu methodunun sınırlamalarını ele almak için çeşitli uzantılar geliştirilmiştir. Bir popüler uzantı, gürültülü görüntülerde nesne bölütleme görevi için daha iyi performans gösteren iki boyutlu Otsu methodudur. Burada, segmentasyon sonuçlarını iyileştirmek için belirli bir pikselin yoğunluk değeri, yakın komşuluğunun ortalama yoğunluğu ile karşılaştırılmaktadır.^[8]

Her pikselde, komşuların ortalama gri seviye değeri hesaplanır. Verilen pikselin gri seviyesi $L$ kadar ayrık değerlere bölünür ve ortalama gri seviyesi de aynı $L$ değerlerine bölünür. Ardından bir çift oluşturulur: $(i, j)$ her pikselin gri seviyesi ve komşuların ortalaması. Her çift, $L \times L$ olası 2 boyutlu kutulardan birine aittir . Her bir $(i, j)$ çiftinin toplam sayısı $f_{i j}$ fonksiyonu olarak verilir. $N$ görüntüsündeki toplam piksel sayısına bölünür, 2 boyutlu bir histogramda birleşik olasılık kütle fonksiyonunu tanımlar:

P_{i j} = \frac{f_{i j}}{N}, \sum_{i = 0}^{L - 1} \sum_{j = 0}^{L - 1} P_{i j} = 1

2 boyutlu Otsu methodu, 2 boyutlu histograma dayalı olarak aşağıdaki gibi geliştirilmiştir.

İki sınıfın olasılıkları şu şekilde gösterilebilir:

\begin{matrix} ω_{0} & = \sum_{i = 0}^{s - 1} \sum_{j = 0}^{t - 1} P_{i j} \\ ω_{1} & = \sum_{i = s}^{L - 1} \sum_{j = t}^{L - 1} P_{i j} \end{matrix}

İki sınıfın yoğunluk ortalama değer vektörleri ve toplam ortalama vektör aşağıdaki gibi ifade edilebilir:

\begin{matrix} μ_{0} & = [μ_{0 i}, μ_{0 j}]^{T} = {[\sum_{i = 0}^{s - 1} \sum_{j = 0}^{t - 1} i \frac{P_{i j}}{ω_{0}}, \sum_{i = 0}^{s - 1} \sum_{j = 0}^{t - 1} j \frac{P_{i j}}{ω_{0}}]}^{T} \\ μ_{1} & = [μ_{1 i}, μ_{1 j}]^{T} = {[\sum_{i = s}^{L - 1} \sum_{j = t}^{L - 1} i \frac{P_{i j}}{ω_{1}}, \sum_{i = s}^{L - 1} \sum_{j = t}^{L - 1} j \frac{P_{i j}}{ω_{1}}]}^{T} \\ μ_{T} & = [μ_{T i}, μ_{T j}]^{T} = {[\sum_{i = 0}^{L - 1} \sum_{j = 0}^{L - 1} i P_{i j}, \sum_{i = 0}^{L - 1} \sum_{j = 0}^{L - 1} j P_{i j}]}^{T} \end{matrix}

Çoğu durumda köşegen dışı olasılık ihmal edilebilir, bu nedenle doğrulaması kolaydır:

ω_{0} + ω_{1} ≅ 1

ω_{0} μ_{0} + ω_{1} μ_{1} ≅ μ_{T}

Sınıflar arası ayrık matris şu şekilde tanımlanır:

S_{b} = \sum_{k = 0}^{1} ω_{k} [(μ_{k} - μ_{T}) (μ_{k} - μ_{T})^{T}]

Ayrık matrisin izi şu şekilde ifade edilebilir:

\begin{matrix} tr (S_{b}) \\ = & ω_{0} [(μ_{0 i} - μ_{T i})^{2} + (μ_{0 j} - μ_{T j})^{2}] + ω_{1} [(μ_{1 i} - μ_{T i})^{2} + (μ_{1 j} - μ_{T j})^{2}] \\ = & \frac{(μ_{T i} ω_{0} - μ_{i})^{2} + (μ_{T j} ω_{0} - μ_{j})^{2}}{ω_{0} (1 - ω_{0})} \end{matrix}

μ_{i} = \sum_{i = 0}^{s - 1} \sum_{j = 0}^{t - 1} i P_{i j}

μ_{j} = \sum_{i = 0}^{s - 1} \sum_{j = 0}^{t - 1} j P_{i j}

Tek boyutlu Otsu methoduna benzer şekilde, optimal eşik $(s, t)$ , $tr (S_{b})$ maksimize edilerek elde edilir.

Algoritma

$s$ ve $t$ tek boyutlu Otsu methoduna benzer şekilde yinelemeli olarak elde edilmektedir. $s$ ve $t$ değerleri, maksimum $tr (S_{b})$ elde edilene kadar değiştirilir.

max,s,t = 0;
for ss: 0 to L-1 do
    for tt: 0 to L-1 do
        evaluate tr(S_b);
        if tr(S_b) > max
            max = tr(S,b);
            s = ss;
            t = tt;
        end if
    end for
end for
return s,t;

$tr (S_{b})$ fonksiyonunu değerlendirmek ve zaman performansını iyileştirmek için hızlı bir özyinelemeli dinamik programlama algoritması kullanılabilir.^[9] Bununla birlikte, dinamik programlama yaklaşımıyla bile, 2d Otsu methodu hala büyük zaman karmaşıklığına sahiptir. Bu nedenle, hesaplama maliyetini azaltmak için birçok araştırma yapılmıştır.^[10]

$P_{i j}$ , $i * P_{i j}$ ve $j * P_{i j}$ üzerinde toplamalar yapılarak 3 tablo oluşturulur. Çalışma zamanı karmaşıklığı maksimum (O(N_pixels), O(N_bins*N_bins)) olur. Eşik açısından yalnızca kaba çözünürlük gerekiyorsa, N_bins azaltılabilir.

Matlab uygulaması

Fonksiyon giriş ve çıkışları:

hists; gri tonlamalı değer ve komşu ortalama gri tonlamalı değer çiftinin $256 \times 256$ 2D histogramıdır.

total; verilen görüntüdeki çiftlerin sayısıdır. 2D histogramın her bir yöndeki kutularının sayısı ile belirlenir.

threshold; elde edilen eşik değeridir.

function threshold = otsu_2D(hists, total)
maximum = 0.0;
threshold = 0;
helperVec = 0:255;
mu_t0 = sum(sum(repmat(helperVec',1,256).*hists));
mu_t1 = sum(sum(repmat(helperVec,256,1).*hists));
p_0 = zeros(256);
mu_i = p_0;
mu_j = p_0;
for ii = 1:256
    for jj = 1:256
        if jj == 1
            if ii == 1
                p_0(1,1) = hists(1,1);
            else
                p_0(ii,1) = p_0(ii-1,1) + hists(ii,1);
                mu_i(ii,1) = mu_i(ii-1,1)+(ii-1)*hists(ii,1);
                mu_j(ii,1) = mu_j(ii-1,1);
            end
        else
            p_0(ii,jj) = p_0(ii,jj-1)+p_0(ii-1,jj)-p_0(ii-1,jj-1)+hists(ii,jj);
            mu_i(ii,jj) = mu_i(ii,jj-1)+mu_i(ii-1,jj)-mu_i(ii-1,jj-1)+(ii-1)*hists(ii,jj);
            mu_j(ii,jj) = mu_j(ii,jj-1)+mu_j(ii-1,jj)-mu_j(ii-1,jj-1)+(jj-1)*hists(ii,jj);
        end

        if (p_0(ii,jj) == 0)
            continue;
        end
        if (p_0(ii,jj) == total)
            break;
        end
        tr = ((mu_i(ii,jj)-p_0(ii,jj)*mu_t0)^2 + (mu_j(ii,jj)-p_0(ii,jj)*mu_t1)^2)/(p_0(ii,jj)*(1-p_0(ii,jj)));

        if ( tr >= maximum )
            threshold = ii;
            maximum = tr;
        end
    end
end
end

Kaynakça

Şablon:Kaynakça

Dış bağlantılar

[Mehmet-1] Şablon:Akademik dergi kaynağı

[Otsu-2] 2,0 ^2,1 ^2,2 Şablon:Akademik dergi kaynağı

[3] Şablon:Akademik dergi kaynağı

[4] Şablon:Akademik dergi kaynağı

[5] Şablon:Akademik dergi kaynağı

[kittler1985threshold-6] Şablon:Akademik dergi kaynağı

[lee1990comparative-7] Şablon:Akademik dergi kaynağı

[jianzhuang1991automatic-8] Şablon:Akademik dergi kaynağı

[zhang2008image-9] Şablon:Akademik dergi kaynağı

[zhu2009fast-10] Şablon:Akademik dergi kaynağı

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

Otsu methodu

İçindekiler

Otsu methodu

Algoritma

MATLAB veya Octave uygulaması

Sınırlamalar

İyileştirmeler

Algoritma

Matlab uygulaması

Kaynakça

Dış bağlantılar

Gezinti menüsü