Ki-kare dağılımı

testwiki sitesinden
Gezinti kısmına atla Arama kısmına atla

Şablon:Olasılık dağılımı

Olasılık kuramı ve istatistik bilim dallarında ki-kare dağılım (x2 dağılımı) özellikle çıkarımsal istatistik analizde çok geniş bir pratik kullanım alanı bulmuştur.

Bu dağılım, gamma dağılımından elde edilir.

x, λ ve n parametreleri ile gamma dağılımına sahip olsun:

f(x)=1λnΓ(n)xn1exλ,x>0 olur.

Burada λ=2 ve n=ν/2 alınırsa, elde edilen yeni dağılıma, ν serbestlik derecesiyle ki-kare dağılımı denir ve Xν2 ile gösterilir.

x, ν serbestlik derecesiyle ki-kare dağılımına sahip ise:

ki-kare 1 n(0.1)'e eşittir f(x)=12ν2Γ(ν2)xν21ex/2,x>0 olur.

Teorem 1

xN(0,1) ise x2X12 olur.

Teorem 2

x1,x2,,xn rassal değişkenler N(0,1) dağılımına sahip olsun.

y=i=1nxi2 ise yXn2 olur.

Teorem 3

σ2 varyansı bilinen, N(μ,σ2) dağılımına sahip rastgele örneklem x1,x2,,xn ve s2 örneklem varyansı olmak üzere:
(n1)s2σ2Xn12 olur.

Karakteristikleri

Olasılık yoğunluk fonksiyonu

Ki-kare dağılım için olasılık yoğunluk fonksiyonu şu olur:

f(x;k)={12k/2Γ(k/2)x(k/2)1ex/2eğer x>0,0eğer x0,

Burada Γ bir Gamma fonksiyonu bulunduğunu gösterir ve bu yarım-tamsayılar için özel değerler gösterir.

Yığmalı dağılım fonksiyonu

Ki-kare dağılımının yığmalı dağılım fonksiyonu şudur:

F(x;k)=γ(k/2,x/2)Γ(k/2)=P(k/2,x/2)

burada γ(k,z) aşağı kısmı tamamlanmamış Gamma fonksiyonu ve P(k,z) ise tanzim edilmiş Gamma fonksiyonu olur.

Ki-karenin için verilen tablolar (biri aşağıda verilmiştir) yığmalı dağılim fonksiyonundan elde edilmektedir. Bu tablolar birçok değişik kaynaklardan bulunabilir. Örneğin bu fonksiyon için tablolar spreadsheet ve istatistik program paketlerinde bulunmaktadır.

Karakteristik fonksiyonu

Ki-kare dağılımının karakteristik fonksiyonu şöyle yazılır:

χ(t;k)=(12it)k/2.

Özellikleri

  • Ki-kare dağılımı cikarimsal istatistik analizde epeyce kullanış alanı bulmuştur. Parametrik istatistik olarak varyans değeri güvenlik aralığı ve hipotez testi, parametrik olamayan uygunluk iyiliği testi, olumsallık tablosu üzerinde bağımsızlık testi ve ki-kareye bağlı ortaklılık katsayıları, uzaklık ölçüleri vb.
  • Varyanslar analizinde F-dagiliminin iki ki-kare dağılımının oranından ortaya çıkması dolayışıyla önemli rol oynamaktadır.

Normal yaklaşım

Eğer Xχk2 ise, limitte k sonsuzluğa yaklaştıkça X normal dağılıma yaklaşır. Ancak bu eğilim (çarpıklık 8/k ve basıklık fazlalığı 12/k olduğundan dolayı) yavaş gelişmektedir. Ki-kare dağılımının iki değişik dönüşüm fonksiyonu normalliğe çok daha hızla yaklaşma göstermektedir:

Fisher ispat etmiştir ki 2X ifadesi, yaklaşık olarak ortalaması 2k1 olan ve varyans değeri 1 olan bir normal dağılım gösterir.

Aynı normal yaklaşım sonucuna moment karşılaştırması yapılarak da erişilebilir. Bunu görmek için ki-dağılım gösteren rassal değişken z=Xin ortalaması ve varyansı izlensin. Bunlar sırasıyla şöyle verilir:

μz=2Γ(k/2+1/2)Γ(k/2)

ve

σz2=kμz2

Burada Γ() bir Gamma fonksiyonudur. μz ifadeli gamma fonksiyonunun özel oranı (particular ratio) şu seri halinde açılabilir:[1]

Γ(N+1/2)Γ(N)=N(118N+1128N2+51024N32132768N4+).

N1 olduğu halde bu oran için şöyle yaklaşım bulunur: Γ(N+1/2)Γ(N)N(118N)N(114N)0.5=N1/4.

Sonra basitleşen moment karşılaştırılması sonuçları şu yaklaşık z dağılımı verirler;

z𝒩(k1/2,12),

Bundan da şu ifade hemen çıkartılabilir\:

2X𝒩(2k1,1).

Wilson ve Hilferty [1931] göstermiştir ki X/k3 ifadesi, ortalaması 12/(9k) ve varyansı 2/(9k) olan bir normal dağılıma yaklaşıktır.

k serbestlik derecesi olan bir ki-kare dağılımı gösteren bir rassal değişken için beklenen değer k olur. Aynı dağılımın medyan değeri yaklaşık olarak şu ifade ile verilir:

k23+427k8729k2.

Eğer serbestlik derecesi 2 ise üstel dağılım ile aynı dağılımdır.

Enformasyon entropisi

Enformasyon entropisi ifadesi şöyle verilir:

H=f(x;k)ln(f(x;k))dx=k2+ln(2Γ(k2))+(1k2)ψ(k/2).

Burada ψ(x) bir Digamma fonksiyonudur.

İlişkili dağılımlar

  • Normal dağılım gösteren ve birbirinden bağımsız olan XiN(0,1) değişkenleri için Y=m=1kXm2 ise, Yχk2 bir ki-kare dağılımı gösterir.
  • Eğer XiN(μi,1) dağılımlarının sıfır olmayan ortalamaları varsa, o halde Y=m=1kXm2 bir merkezsel olmayan ki-kare dağılımndan çıkartılmıştır.
  • XGamma(ν2,2) olduğundan dolayı, ki-kare dağılımı Xχν2 bir gamma dağılımının özel halidir.
  • Eğer verilmiş serbestlik dereceleri ile X1χν12 ve X2χν22 birbirinden bağımsız iken Y=X1/ν1X2/ν2 ise, YF(ν1,ν2) bir F-dağılımı gösterir.
  • Y=m=1NXm ifadesi için Xmχ2(νm) değişkenleri bağımsız ve ν¯=m=1Nνm ise, o halde Yχ2(ν¯) ifadesi bir ki-kare dağılımı gösterir.
  • Eğer X ki-kare dağılımı gösterirse, o halde X ifadesi de ki-kare dağılımı gösterir.
  • Özellikle, eğer Xχ22 (yani 2 serbestlik derecesi gösteren ki-kare ise), o halde X ifadesi Rayleigh dağılımı gösterir.
  • Eğer X1,,Xn bağımsiz ama aynı dağılımlı, yani hepsi N(μ,σ2) normal dağılım gösteren, rassal değişkenlerse, o halde
i=1n(XiX¯)2σ2χn12

olur; burada X¯=1ni=1nXi dir.

  • Eğer XCarpikLogistik(12), ise, o halde log(1+eX)χ22 olur.
Çeşitli ki ve ki-kare dağılımları
İsim İstatistik
Ki-kare dağılımı i=1k(Xiμi)2σi2
Merkezsel olmayan ki-kare dağılımı i=1k(Xiσi)2
Ki dağılımı i=1k(Xiμiσi)2
Merkezsel olmayan ki dağılımı i=1k(Xiσi)2

Ki kare kritik değerler tablosu

g serbestlik derecesi için yukarı kuyruk alanının (olasılığın) α olmasına karşıt olan ki2 kritik değeri

+-----+-----------------------------------------------------------------------+
| \  α|                                                                       |
|  \  | 0.995  0.91   0.925  0.95   0.90   0.10   0.05   0.025  0.01   0.005  |
|g  \ |                                                                       |
+-----+-----------------------------------------------------------------------+
|  1  |  0.00   0.00   0.00   0.00   0.02   2.71   3.84   5.02   6.63   7.88  |
|  2  |  0.01   0.02   0.05   0.10   0.21   4.61   5.99   7.38   9.21  10.60  |
|  3  |  0.07   0.11   0.22   0.35   0.58   6.25   7.81   9.35  11.34  12.84  |
|  4  |  0.21   0.30   0.48   0.71   1.06   7.78   9.49  11.14  13.28  14.86  |
|  5  |  0.41   0.55   0.83   1.15   1.61   9.24  11.07  12.83  15.09  16.75  |
|  6  |  0.68   0.87   1.24   1.64   2.20  10.64  12.59  14.45  16.81  18.55  |
|  7  |  0.99   1.24   1.69   2.17   2.83  12.02  14.07  16.01  18.48  20.28  |
|  8  |  1.34   1.65   2.18   2.73   3.49  13.36  15.51  17.53  20.09  21.95  |
|  9  |  1.73   2.09   2.70   3.33   4.17  14.68  16.92  19.02  21.67  23.59  |
| 10  |  2.16   2.56   3.25   3.94   4.87  15.99  18.31  20.48  23.21  25.19  |
| 11  |  2.60   3.05   3.82   4.57   5.58  17.28  19.68  21.92  24.72  26.76  |
| 12  |  3.07   3.57   4.40   5.23   6.30  18.55  21.03  23.34  26.22  28.30  |
| 13  |  3.57   4.11   5.01   5.89   7.04  19.81  22.36  24.74  27.69  29.82  |
| 14  |  4.07   4.66   5.63   6.57   7.79  21.06  23.68  26.12  29.14  31.32  |
| 15  |  4.60   5.23   6.26   7.26   8.55  22.31  25.00  27.49  30.58  32.80  |
| 16  |  5.14   5.81   6.91   7.96   9.31  23.54  26.30  28.85  32.00  34.27  |
| 17  |  5.70   6.41   7.56   8.67  10.09  24.77  27.59  30.19  33.41  35.72  |
| 18  |  6.26   7.01   8.23   9.39  10.86  25.99  28.87  31.53  34.81  37.16  |
| 19  |  6.84   7.63   8.91  10.12  11.65  27.20  30.14  32.85  36.19  38.58  |
| 20  |  7.43   8.26   9.59  10.85  12.44  28.41  31.41  34.17  37.57  40.00  |
| 21  |  8.03   8.90  10.28  11.59  13.24  29.62  32.67  35.48  38.93  41.40  |
| 22  |  8.64   9.54  10.98  12.34  14.04  30.81  33.92  36.78  40.29  42.80  |
| 23  |  9.26  10.20  11.69  13.09  14.85  32.01  35.17  38.08  41.64  44.18  |
| 24  |  9.89  10.86  12.40  13.85  15.66  33.20  36.42  39.36  42.98  45.56  |
| 25  | 10.52  11.52  13.12  14.61  16.47  34.38  37.65  40.65  44.31  46.93  |
| 26  | 11.16  12.20  13.84  15.38  17.29  35.56  38.89  41.92  45.64  48.29  |
| 27  | 11.81  12.88  14.57  16.15  18.11  36.74  40.11  43.19  46.96  49.64  |
| 28  | 12.46  13.56  15.31  16.93  18.94  37.92  41.34  44.46  48.28  50.99  |
| 29  | 13.12  14.26  16.05  17.71  19.77  39.09  42.56  45.72  49.59  52.34  |
| 30  | 13.79  14.95  16.79  18.49  20.60  40.26  43.77  46.98  50.89  53.67  |
+-----+-----------------------------------------------------------------------+

Kaynak: Kritik değerler İtalyanca Wikipedia için R (software) serbest programının qchisq(,1:30) fonksiyonu kullanılarak bulunmuştur.

Serbestlik derecesi g>30 olursa kritik değerleri bulmak için şu ifadeyi kullanmak yeterli olacaktır.

χ²α,g = 1/2 ( zα + √(2g-1) )²

Burada zα Standart Normal N(0,1) için kritik değerdir (örneğin z0,95 = 1,645 olur.)

Ayrıca bakınız

Kaynakça

Şablon:Kaynakça

Dış bağlantılar

Yale University Stats 101 kodlu ders için ornekler hipotez sinamasi ve parametre tahminleri konularini kapsar.

Şablon:Olasılık Dağılımları


Şablon:Otorite kontrolü