Otsu methodu

testwiki sitesinden
Gezinti kısmına atla Arama kısmına atla

Şablon:Öksüz

Otsu methodu kullanılarak eşiklenen örnek bir görüntü
Orijinal görüntü

Bilgisayarla görme ve görüntü işlemede, otomatik görüntü eşikleme yapmak için Nobuyuki Otsu (大津展之 Ōtsu Nobuyuki) tarafından oluşturulan Otsu methodu kullanılmaktadır.[1] En basit haliyle, algoritma pikselleri ön plan ve arka plan olmak üzere iki sınıfa ayıran tek bir yoğunluk eşiği döndürmektedir. Bu eşik, sınıf içi yoğunluk varyansını en aza indirerek veya eşdeğer olarak, sınıflar arası varyansı maksimize ederek belirlenmektedir.[2] Otsu'nun yöntemi, Fisher's Discriminant Analysis'in tek boyutlu ayrık bir analoğudur. Jenks optimizasyon yöntemiyle ilgilidir ve yoğunluk histogramında gerçekleştirilen global olarak en uygun k-ortalamalara eşdeğerdir.[3] Çok seviyeli eşiklemenin genişletilmesi orijinal belgede açıklanmıştır ve o zamandan beri hesaplama açısından verimli uygulamalar önerilmiştir.[2][4][5]

Otsu methodu

Otsu methodunun görselleştirilmesi

Algoritma, iki sınıfın ağırlıklı bir toplamı olarak tanımlanan sınıf içi varyansı en aza indiren eşiği kapsamlı bir şekilde arar.

σw2(t)=ω0(t)σ02(t)+ω1(t)σ12(t)

ω0 ve ω1 ağırlıkları, t eşiği ile ayrılan iki sınıfın olasılıklarıdır. σ02 ve σ12 bu iki sınıfın varyanslarıdır.

ω0,1(t) sınıf olasılığı, histogramın L kutularından aşağıdaki gibi hesaplanır:

ω0(t)=i=0t1p(i)ω1(t)=i=tL1p(i)

2 sınıf için, sınıf içi varyansı en aza indirmek, sınıflar arası varyansı en üst düzeye çıkarmakla eşdeğerdir.[2]

σb2(t)=σ2σw2(t)=ω0(μ0μT)2+ω1(μ1μT)2=ω0(t)ω1(t)[μ0(t)μ1(t)]2

Bu, ω sınıf olasılıkları cinsinden ifade edilir. Sınıf μ anlamına gelir. Burada sınıf μ0(t), μ1(t) ve μT anlamına gelir.

μ0(t)=i=0t1ip(i)ω0(t)μ1(t)=i=tL1ip(i)ω1(t)μT=i=0L1ip(i)

Aşağıdaki ilişkiyi bunlarla açıklayabiliriz:

ω0μ0+ω1μ1=μTω0+ω1=1

Sınıf olasılıkları ve sınıf ortalamaları yinelemeli olarak hesaplanabilir. Bu fikir etkili bir algoritma sağlamaktadır.

Algoritma

  1. Her yoğunluk seviyesinin histogramı ve olasılıkları hesaplanır.
  2. İlk ωi(0) ve μi(0) ayarlanır.
  3. Adım adım t=1, tüm olası eşikler maksimum yoğunluk için hesaplanır.
    1. ωi ve μi güncellenir.
    2. σb2(t) hesaplanır.
  4. İstenen eşik maksimum σb2(t) değerine karşılık gelir.

MATLAB veya Octave uygulaması

histogramSayacı farklı gri düzeylerinde (8 bitlik görüntüler için tipik) bir gri tonlamalı görüntünün 256 elemanlı bir histogramıdır.

function seviye = otsu(histogramSayacı)
total = sum(histogramSayacı); % görüntüdeki toplam piksel sayısı
%% OTSU otomatik eşiklemesi
top = 256;
toplamB = 0;
wB = 0;
maksimum = 0.0;
toplam1 = dot(0:top-1, histogramSayacı);
for ii = 1:top
    wF = total - wB;
    if wB > 0 && wF > 0
        mF = (toplam1 - toplamB) / wF;
        val = wB * wF * ((toplamB / wB) - mF) * ((toplamB / wB) - mF);
        if ( val >= maksimum )
            seviye = ii;
            maksimum = val;
        end
    end
    wB = wB + histogramSayacı(ii);
    toplamB = toplamB + (ii-1) * histogramSayacı(ii);
end
end

Matlab, sırasıyla Otsu methodu ve Multi Otsu methoduyla uygulanan Görüntü İşleme Araç Kutusu'nda graythresh() ve multithresh() yerleşik fonksiyonlarına sahiptir.

Sınırlamalar

Otsu methodunda, histogramın iki modlu dağılıma sahip olduğu ve iki tepe arasında derin ve keskin bir vadiye sahip olduğu varsayılabilirse, nispeten iyi bir performans sergilemektedir. Ancak nesne alanı, arka plan alanıyla karşılaştırıldığında nesne alanı küçükse, histogram artık iki modluluk göstermez.[6] Ve nesnenin varyansları ve arka plan yoğunlukları, ortalama farkla karşılaştırıldığında büyükse veya görüntü, ek gürültü tarafından ciddi şekilde bozulursa, gri seviye histogramının keskin vadisi bozulmaktadır. Ardından, Otsu'nun yöntemiyle belirlenen olası yanlış eşik, segmentasyon hatasıyla sonuçlanmaktadır. (Burada nesne boyutunu, nesne alanının tüm görüntü alanına oranı ve ortalama farkı, nesnenin ve arka planın ortalama yoğunluklarının farkı olarak tanımlıyoruz)

Ampirik sonuçlar, nesne segmentasyonu için kullanılan global eşikleme tekniklerinin performansının (Otsu algoritması dahil) küçük nesne boyutu, ön plan ve arka plan pikselleri arasındaki küçük ortalama fark, nesneye ait olan ve nesneye ait olan piksellerin büyük varyansları ile sınırlı olduğunu göstermektedir.[7]

İyileştirmeler

Otsu methodunun sınırlamalarını ele almak için çeşitli uzantılar geliştirilmiştir. Bir popüler uzantı, gürültülü görüntülerde nesne bölütleme görevi için daha iyi performans gösteren iki boyutlu Otsu methodudur. Burada, segmentasyon sonuçlarını iyileştirmek için belirli bir pikselin yoğunluk değeri, yakın komşuluğunun ortalama yoğunluğu ile karşılaştırılmaktadır.[8]

Her pikselde, komşuların ortalama gri seviye değeri hesaplanır. Verilen pikselin gri seviyesi L kadar ayrık değerlere bölünür ve ortalama gri seviyesi de aynı L değerlerine bölünür. Ardından bir çift oluşturulur: (i,j) her pikselin gri seviyesi ve komşuların ortalaması. Her çift, L×L olası 2 boyutlu kutulardan birine aittir . Her bir (i,j) çiftinin toplam sayısı fij fonksiyonu olarak verilir. N görüntüsündeki toplam piksel sayısına bölünür, 2 boyutlu bir histogramda birleşik olasılık kütle fonksiyonunu tanımlar:

Pij=fijN,i=0L1j=0L1Pij=1

2 boyutlu Otsu methodu, 2 boyutlu histograma dayalı olarak aşağıdaki gibi geliştirilmiştir.

İki sınıfın olasılıkları şu şekilde gösterilebilir:

ω0=i=0s1j=0t1Pijω1=i=sL1j=tL1Pij

İki sınıfın yoğunluk ortalama değer vektörleri ve toplam ortalama vektör aşağıdaki gibi ifade edilebilir:

μ0=[μ0i,μ0j]T=[i=0s1j=0t1iPijω0,i=0s1j=0t1jPijω0]Tμ1=[μ1i,μ1j]T=[i=sL1j=tL1iPijω1,i=sL1j=tL1jPijω1]TμT=[μTi,μTj]T=[i=0L1j=0L1iPij,i=0L1j=0L1jPij]T

Çoğu durumda köşegen dışı olasılık ihmal edilebilir, bu nedenle doğrulaması kolaydır:

ω0+ω11
ω0μ0+ω1μ1μT

Sınıflar arası ayrık matris şu şekilde tanımlanır:

Sb=k=01ωk[(μkμT)(μkμT)T]

Ayrık matrisin izi şu şekilde ifade edilebilir:

tr(Sb)=ω0[(μ0iμTi)2+(μ0jμTj)2]+ω1[(μ1iμTi)2+(μ1jμTj)2]=(μTiω0μi)2+(μTjω0μj)2ω0(1ω0)
μi=i=0s1j=0t1iPij
μj=i=0s1j=0t1jPij

Tek boyutlu Otsu methoduna benzer şekilde, optimal eşik (s,t), tr(Sb)maksimize edilerek elde edilir.

Algoritma

s ve t tek boyutlu Otsu methoduna benzer şekilde yinelemeli olarak elde edilmektedir. s ve t değerleri, maksimum tr(Sb) elde edilene kadar değiştirilir.

max,s,t = 0;
for ss: 0 to L-1 do
    for tt: 0 to L-1 do
        evaluate tr(S_b);
        if tr(S_b) > max
            max = tr(S,b);
            s = ss;
            t = tt;
        end if
    end for
end for
return s,t;

tr(Sb) fonksiyonunu değerlendirmek ve zaman performansını iyileştirmek için hızlı bir özyinelemeli dinamik programlama algoritması kullanılabilir.[9] Bununla birlikte, dinamik programlama yaklaşımıyla bile, 2d Otsu methodu hala büyük zaman karmaşıklığına sahiptir. Bu nedenle, hesaplama maliyetini azaltmak için birçok araştırma yapılmıştır.[10]

Pij, i*Pij ve j*Pij üzerinde toplamalar yapılarak 3 tablo oluşturulur. Çalışma zamanı karmaşıklığı maksimum (O(N_pixels), O(N_bins*N_bins)) olur. Eşik açısından yalnızca kaba çözünürlük gerekiyorsa, N_bins azaltılabilir.

Matlab uygulaması

Fonksiyon giriş ve çıkışları:

hists; gri tonlamalı değer ve komşu ortalama gri tonlamalı değer çiftinin 256×256 2D histogramıdır.

total; verilen görüntüdeki çiftlerin sayısıdır. 2D histogramın her bir yöndeki kutularının sayısı ile belirlenir.

threshold; elde edilen eşik değeridir.

function threshold = otsu_2D(hists, total)
maximum = 0.0;
threshold = 0;
helperVec = 0:255;
mu_t0 = sum(sum(repmat(helperVec',1,256).*hists));
mu_t1 = sum(sum(repmat(helperVec,256,1).*hists));
p_0 = zeros(256);
mu_i = p_0;
mu_j = p_0;
for ii = 1:256
    for jj = 1:256
        if jj == 1
            if ii == 1
                p_0(1,1) = hists(1,1);
            else
                p_0(ii,1) = p_0(ii-1,1) + hists(ii,1);
                mu_i(ii,1) = mu_i(ii-1,1)+(ii-1)*hists(ii,1);
                mu_j(ii,1) = mu_j(ii-1,1);
            end
        else
            p_0(ii,jj) = p_0(ii,jj-1)+p_0(ii-1,jj)-p_0(ii-1,jj-1)+hists(ii,jj);
            mu_i(ii,jj) = mu_i(ii,jj-1)+mu_i(ii-1,jj)-mu_i(ii-1,jj-1)+(ii-1)*hists(ii,jj);
            mu_j(ii,jj) = mu_j(ii,jj-1)+mu_j(ii-1,jj)-mu_j(ii-1,jj-1)+(jj-1)*hists(ii,jj);
        end

        if (p_0(ii,jj) == 0)
            continue;
        end
        if (p_0(ii,jj) == total)
            break;
        end
        tr = ((mu_i(ii,jj)-p_0(ii,jj)*mu_t0)^2 + (mu_j(ii,jj)-p_0(ii,jj)*mu_t1)^2)/(p_0(ii,jj)*(1-p_0(ii,jj)));

        if ( tr >= maximum )
            threshold = ii;
            maximum = tr;
        end
    end
end
end

Kaynakça

Şablon:Kaynakça

Dış bağlantılar