Çokdeğişirli normal dağılım

testwiki sitesinden
12.39, 1 Haziran 2024 tarihinde imported>24 Byte tarafından oluşturulmuş 799 numaralı sürüm (growthexperiments-addlink-summary-summary:3|0|0)
(fark) ← Önceki sürüm | Güncel sürüm (fark) | Sonraki sürüm → (fark)
Gezinti kısmına atla Arama kısmına atla

Şablon:Olasılık dağılımı Olasılık kuramı ve istatistik bilim kollarında, çokdeğişirli normal dağılım veya çokdeğişirli Gauss-tipi dağılım, tek değişirli bir dağılım olan normal dağılımın (veya Gauss-tipi dağılımın) çoklu değişirli hallere genelleştirilmesidir.

Genel hal

Yığmalı dağılım fonksiyonu

Genel bir tanımla, F(X) olarak ifade edilen yığmalı dağılım fonksiyonu, bir rassal vektörun, x vektörüne eşit veya bu vektör değerlerden daha az olduğu zaman karşıtı olarak bulunan bütün olasılıkların toplamını ifade eden bir fonksiyondur. Çokdeğişirli normal dağılım için bir cebirsel kapalı eşitlik şeklinde bir F ifadesi bulunmamaktadır. Ancak bu fonksiyonun sayısal değerlerini tahmin etmek için birkaç algoritma bulunmaktadır. Bu algoritma kullanışına bir örnek için verilen referanslarda MVNDST adlı algoritmaya bakınız. ([1] veya [2]).

Bir karşıt örneğin

İki rassal değişken olan X ve Y tek tek normal dağılım gösterseler bile bu iki rassal değişkenin bileşik olarak (X, Y) bir çoklunormal dağılım göstereceği anlamına gelmez. Buna basit bir örnekte eğer |X| > 1 ise Y=X olması ve eğer |X| < 1 ise Y = -X olmasıdır. Bu gerçek ikiden fazla sayıda rassal değişken içinde doğrudur.

Buna benzer bir karşıt örneğin için normal olarak dağılımlı olup ve korrelasyon olmaması bağımsızlık ifade etmez maddesine bakınız.

Normal dağılım gösterme ve bağımsızlık

Eğer X ve Y rassal değişkenleri tek tek normal dağılım gösterirlerse ve birbirlerinden istatistiksel olarak Bağımsızlarsa, o halde bu iki rassal değişken bileşiği (yani rassal vektörü) ikideğişirli normal dağılım gösterir veya diğer bir ifade ile ortaklaşa normal dağılımlılardır. Ancak ortaklaşa normal dağılım gösteren her iki rassal değişkenin birbirinden bağımsız olduğu gerçek değildir.

İki değişirli hal

İki boyutlu singuler olmayan halde, ikideğişirli normal dağılım için (ortalamalar (0,0)da ise) olasılık yoğunluk fonksiyonu şöyle tanımlanır:

f(x,y)=12πσxσy1ρ2exp(12(1ρ2)(x2σx2+y2σy22ρxy(σxσy)))

Burada ρ terimi X ve Y arasındaki korelasyonu gösterir ve şu ifade kovaryans matrisi olur:

Σ=[σx2ρσxσyρσxσyσy2].

Afin dönüşümü

Geometrik açıklama

Bir singuler olmayan çokdeğişirli normal dağılım için aynı yoğunluk gösteren kontur eğrileri elipsoitlerdir; yani ortalamada merkezleşmiş çok-boyutlu-kürelerin doğrusal dönüşümleridir.[3] Bu elipsoitlerin esas eksenlerinin yönleri kovaryans matrisinin özvektörleri (eigenvector) olarak verilmiştir. Esas eksenlerin orantılı uzunluklarının karesi bunlara karşıt olan özdeğerler (eigenvalues) olurlar. Bu halde şu ifade ortaya çıkar:

X N(μ,Σ)X μ+UΛ1/2N(0,I)X μ+UN(0,Λ).

Bunun yanında, U bir rotasyon matrisi olarak seçilebilir; çünkü bu eksenin tersini alınca N(0,Λ) hiç etkilenmemektedir; buna karşıt olarak bir matris sütûnunun tersi alınırsa unun determinantının işaretleri değişir. N(μ,Σ) ile özetlenen dağılım böylelikle N(0,I) ifadesinin Λ1/2 ile ölçeğinin değiştirilmesi, u ile rotasyon yapılması ve μ ile çevrilmesi ile ortaya çıkar.

Bunun aksine bakılırsa, μ ve tam ranklı U matrisi ve pozitif çapraz girdiler olan Λi değerleri için yapılan herhangi bir seçim, bir singuler olmayan çokdeğişirli normal dağılım ortaya çıkartır. Eğer herhangi bir Λi sıfıra eşitse ve u kare matris ise, bunun sonucunda ortaya çıkan UΛUT kovaryans matrisi bir singuler matris olur. Geometrik olarak bunun açıklaması her kontur elipsoitin sonsuz olarak inceleşmesi ve n-boyutlu bir uzayda 0 bir hacim kapsamasıdır, çünkü en aşağı bir tane esas eksenin uzunluğu sıfır olmaktadır.

Korelasyonlar ve bağımsızlık

Genel olarak, rassal değişkenler birbirleriyle çok yüksek derecede bağımlı olabilirler ama hiç korelasyon göstermeyebilirler. Ama, eğer bir rassal vektör çokdeğişirli normal dağılım gösterirse o halde aralarında hiç korelasyon göstermeyen iki veya daha fazla sayıda vektör parçası istatistiksel olarak birbirinden bağımsızdır. Bundan da şu sonuc çıkartılabilir: eğer vektörün herhangi iki veya daha fazla parçası ikişer ikişer bağımsızlık gösteriyorsa, bu parçalar birbirinden bağımsızdırlar.

Fakat ayrı ayrı olarak ve marjinal olarak, iki rassal değişken normal dağılım gösterirlerse ve aralarında hiç korelasyon bulunmazsa, o halde bu iki değişkenler birbirinden bağımsızdır. Normal dağılım gösteren iki rassal değişken, ortaklaşa normal dağılım göstermeyebilirler; yani bir parçası oldukları vektör bir çokdeğişkenli normal dağılım göstermeyebilir. İki korelasyon göstermeyen ama normal dağılım gösteren fakat bağımsız olmayan rassal değişken için örneğin normal dağılım gösterip hiç korelasyon göstermemek bağımsız olmak demek değildir maddesine bakınız.

Daha yüksek momentler

Genel olarak X için kinci derecede momentler şöyle tanımlanmaktadır:

μ1,,N(X) =def μr1,,rN(X) =def E[j=1NXjrj]

Burada r1+r2++rN=k.

Merkezsel kinci derecede momentler şöyle verilir:

(a)Eger k tek ise μ1,,N(Xμ)=0 olur. (b)Eger k cift ise ve k=2λ, o halde

μ1,,2λ(Xμ)=(σijσklσXZ)

Burada toplam {1,,2λ} setinin λ (sıralanmamış) çiftler üzerine tahsis edilmelerinin hepsi birlikte alınmasıdır. Bu işlem sonucunda toplam içinde (2λ1)!/(2λ1(λ1)!) sayıda terim bulunur, Her bir terim λ tane kovaryansın çarpımıdır.


Özellikle, 4-üncü derecedeki momentler şöyle verilirler:

E[Xi4]=3(σii)2
E[Xi3Xj]=3σiiσij
E[Xi2Xj2]=σiiσjj+2(σij)2
E[Xi2XjXk]=σiiσjk+2σijσik
E[XiXjXkXn]=σijσkn+σikσjn+σinσjk.

Dört değişken halindeki dördüncü derece moment içinde üç tane terim bulunur.

Altıncı-derecede moment içinde (3 × 5 =) 15 terim; sekizinci derecede momentler arasında (3 × 5 × 7) = 105 terim bulunur. Altıncı-derecedeki moment için ifade şöyle genişletilebilir:

E[X1X2X3X4X5X6]=E[X1X2]E[X3X4]E[X5X6]+E[X1X2]E[X3X5]E[X4X6]+E[X1X2]E[X3X6]E[X4X5]+E[X1X3]E[X2X4]E[X5X6]+E[X1X3]E[X2X5]E[X4X6]+E[X1X3]E[X2X6]E[X4X5]+E[X1X4]E[X2X3]E[X5X6]+E[X1X4]E[X2X5]E[X3X6]+E[X1X4]E[X2X6]E[X3X5]+E[X1X5]E[X2X3]E[X4X6]+E[X1X5]E[X2X4]E[X3X6]+E[X1X5]E[X2X6]E[X3X4]+E[X1X6]E[X2X3]E[X4X5]+E[X1X6]E[X2X4]E[X3X5]+E[X1X6]E[X2X5]E[X3X4].

Koşullu dağılımlar

Eğer μ ve Σ şu şekilde kısımlara ayrılırlarsa:

μ=[μ1μ2] Büyüklüğü şu olur; [q×1(Nq)×1]
Σ=[Σ11Σ12Σ21Σ22] Büyüklüğü şu olur: [q×qq×(Nq)(Nq)×q(Nq)×(Nq)]

Bu halde x2=a ifadesiyle koşullu olan x1 şöyle özetlenen çokdeğişirli normal dağılım gösterir:

(X1|X2=a)N(μ¯,Σ)

Burada

μ¯=μ1+Σ12Σ221(aμ2)

olur ve covaryans matrisi şöyle verilir:

Σ=Σ11Σ12Σ221Σ21.

Bu matris Σ içinde Σ22 ifadesinin Schur tamamlayıcısı olur.

Bundan dikkati çekmesi gereken şu sonuçlar çıkartılır: x2 değerinin a olduğunu bilmek varyansı değiştirir. Daha şaşırtıcı olarak, ortalama değeri Σ12Σ221(aμ2) ile kayma gösterir. Eğer a bilinmese idi, x1 nin göstereceği dağılım Nq(μ1,Σ11) olurdu.

Σ12Σ221 matrisi regresyon katsayıları olarak da bilinirler.

Fisher'in enformasyon matrisi

Bir normal dağılım için Fisher'in enformasyon matrisi bir ozel sekil alir. XN(μ(θ),Σ(θ)) için Fisher'in enformasyon matrisinin (m,n) elemanı su olur:

m,n=μθmΣ1μθn+12tr(Σ1ΣθmΣ1Σθn)

Burada

  • μθm=[μ1θmμ2θmμNθm]
  • μθm=(μθm)=[μ1θmμ2θmμNθm]
  • Σθm=[Σ1,1θmΣ1,2θmΣ1,NθmΣ2,1θmΣ2,2θmΣ2,NθmΣN,1θmΣN,2θmΣN,Nθm]
  • tr trace fonksiyonu olur.

Kullback-Leibler ayrılımı

N0N(μ0,Σ0) den N1N(μ1,Σ1) dağılımına Kullback-Leibler ayrılımı şöyle verilir:

DKL(N0N1)=12(loge(detΣ1detΣ0)+tr(Σ11Σ0)+(μ1μ0)Σ11(μ1μ0)N).


Parametrelerin kestrimi

Cokdegisirli normal dağılımın kovaryansinin maksimum olabilirlik kestiriminin elde edilmesi şaşırtıcı şekilde düzenli ve zekice yapılmıştır. Kovaryans matrislerin kestirimi maddesine bakın. Bir N-boyutlu cokludegisirli normal dağılımın olasılık yoğunluk fonksiyonu şöyle verilir:

f(x)=(2π)N/2det(Σ)1/2exp(12(xμ)TΣ1(xμ))

ve kovaryans matrisinin maksimum olabilirlik kestirimi söyle yazılır:

Σ^=1ni=1n(XiX)(XiX)T

Bu basit olarak bir n büyüklüğünde bir örneklem için örneklem kovaryans matrisidir. Bu bir yanli kestirim olup beklenen değeri

E[Σ^]=n1nΣ.

Oliur. Bir yansız örneklem kovaryansi kestirmi sudur:

Σ^=1n1i=1n(XiX)(XiX)T.

Entropi

Çokdeğişirli normal dağılım için diferansiyel entropi ifadesi şöyle verilir:[4]h(f)=f(x)lnf(x)dx

=12(N+Nln(2π)+ln|Σ|)
=12ln{(2πe)N|Σ|}

Burada |Σ| covaryans matrisi olan Σnın determani olur:

Çokdeğişirli normallik sınamaları

Çokdeğişirli normallik sınamaları bir verilmiş veri seti için bir teorik çokdeğişirli normal dağılıma benzerlik olup olmadığını sınamak için hazırlanmıştır. Bu sınamalarda sıfır hipotez veri setinin çokdeğişirli normal dağılıma benzerlik gösterdiğidir. Eğer sınama ile bulunan p-değeri yeter derece küçük ise (yani genellikle 0,05 veya 0,01den daha küçük ise), sıfır hipotez reddedilir ve verinin çokludeğişirli normal dağılım göstermediği kabul edilir. Bu çokludeğişirli normallik sınamaları arasında popüler olan Cox-Small sınamasıdır:[5] Smith ve Jain'in Friedman-Rafsky testini adaptasyonu için şu referansa bakın: [6]

Dağılımdan değerlerin bulunması

μ ortalama vektörü ve (simetrik ve pozitif kesin olması gereken) kovaryans matrisi Σ olan bir N-boyutlu çokdeğişirli normal dağılımdan bir rastgele vektör X çekmek için çok kullanılan bir yöntem şöyle uygulanır:

  1. Σ için (matris kare kökü olan) Çoleski dekompozisyonu hesap edilir. Yani AAT=Σ koşuluna uyan tek bir alt üçgensel matris olan A bulunur.
  2. Örneğin Box-Müller dönüşümü ile üretilip elde edilebilen N tane birebirine bağımsiz normal dağılım gösteren değişebilir parçalarından oluşan bir vektör Z=(z1,,zN)T bulunur.
  3. X, μ+AZ ifadesine eşit olarak bulunur.

Kaynakça

Şablon:Kaynakça

Şablon:Olasılık Dağılımları