Welch'in t-testi

testwiki sitesinden
16.30, 17 Haziran 2024 tarihinde imported>SpdyBot tarafından oluşturulmuş 2062 numaralı sürüm (Kaynakça: Bot: kaynak ve şablon dz. (hata bildir))
(fark) ← Önceki sürüm | Güncel sürüm (fark) | Sonraki sürüm → (fark)
Gezinti kısmına atla Arama kısmına atla

İstatistikte, Welch'in t-testi veya eşit olmayan varyanslar t-testi, iki popülasyonun eşit ortalamalara sahip olduğu hipotezini test etmek için kullanılan iki örneklemli bir konum testidir. Welch'in t-testi, Student'ın t-testinin uyarlanmasıdır,[1] Yani, Student'ın t testi yardımıyla türetilmiştir ve iki numunenin eşitsiz varyanslara ve eşit olmayan örneklem boyutlarına sahip olması durumunda daha güvenilirdir.[2] Bu testlere, genellikle, karşılaştırılan iki numunenin altında yatan istatistiksel birimler çakışmaz olduğunda tipik olarak uygulandığı için "eşleştirilmemiş" veya "bağımsız örnekler" "t" testleri olarak adlandırılır.Welch'in t-testinin Student'ın t-testinden[2] daha az popüler olduğu ve okuyuculara daha az tanıdığı göz önüne alındığında, kısaca "Welch'in eşitsiz varyans t-testi" veya "eşitsiz varyans t -testi" daha bilgilendirici bir addır.

Varsayımlar

Student'ın t-testi, iki popülasyonun normal dağılımlara ve eşit varyansa sahip olduğunu varsayar. Welch'in t- testi, eşit olmayan varyanslar için tasarlanmıştır, ancak normalite varsayımı korunmaktadır.[1] Welch'in t-testi, Behrens-Fisher problemi için yaklaşık bir çözümdür.

Aspin ve Welch gibi bazı yazarlar, Welch istatistiklerinde serbestlik derecelerini (df) elde etmek için yöntemler sundular. Keselman ve ark., formüllerin hiçbiri kesinlikle doğru df sağlamaz ve bu nedenle yaklaşık df (ADF) olarak adlandırılırlar. Yaygın olarak kullanılan formül Welch tarafından önerilmiştir. Bu varyans tahmini ile ilişkili serbestlik dereceleri, Welch-Satterthwaite denklemi kullanılarak örnek verilerden yaklaşıklandırılır.[3]

Hesaplamalar

Welch'in t- testi istatistiği t'ni aşağıdaki formüle göre tanımlar:

t=X1X2s12N1+s22N2

X1, s12 and N1 sırasıyla birinci örnek ortalaması, örnek varyansı ve örnek büyüklüğüdür.Student'ın t-testinden farklı olarak, payda birleştirilmiş varyans tahmine dayalı değildir. Bu varyans tahminiyle ilişkili serbestlik dereceleri ν, Welch-Satterthwaite denklemi kullanılarak yaklaştırılır:

ν(s12N1+s22N2)2s14N12ν1+s24N22ν2

Burada ν1=N11, ilk varyans tahmini ile ilişkili serbestlik derecelerini, ν2=N21,ikinci varyans tahminiyle ilişkili serbestlik derecelerini ifade etmektedir.

Welch'in t- testi de sıralanan veriler için hesaplanabilir ve daha sonra Welch'in U- testi olarak adlandırılabilir.[4]

İstatistiksel test

T ve ν hesaplandıktan sonra bu istatistikler, iki popülasyon ortalamasının eşit olduğu (iki uçlu test kullanılarak) boş hipotezi test etmek için t-dağılımı ile veya popülasyon ortalamalarının birinin Diğerinden büyük veya eşit (tek kuyruklu test kullanarak)olduğu alternatif hipotezler için kullanılabilir.

Avantaj ve sınırlamalar

Welch'in t-testi Student'ın t-testinden daha sağlamdır ve eşitsiz varyansların ve eşit olmayan örneklem boyutlarının nominaline yakın tip I hata oranlarını korur.Ayrıca, popülasyon farklılıkları eşit olduğunda ve numune boyutları dengelense bile, Welch'in t-testinin gücü Student'ın t-testinin gücüne yakındır.[2] Welch'in t-testi, tek yönlü varyans analizinden daha sağlam olan 2'den fazla numuneye genellenebilir.[5]

Eşit farklılıkları ön teste tabi tutmak ve daha sonra Student's t-testi veya Welch'in t-testi arasında seçim yapmak tavsiye edilmez. Daha ziyade, Welch'in t-testi, yukarıda belirtildiği gibi doğrudan ve Student'ın t-testine herhangi bir önemli dezavantaj olmadan uygulanabilir. Yer belirleme testinden önce kullanılan eşitliğin eşitliği için yapılan ön testler istatistikçiler tarafından artık yaygın olarak önerilmez; ancak bazı ek kitaplar ve yazılım paketlerinde de geçerlidir. Simülasyonlar, iki aşamalı prosedürün, önem seviyesini korumakta başarısız olduğunu ve genellikle durumun daha da kötüsü ön testlerin sıklıkla testin boyutunu olumsuz etkilediğini ve varyansların eşit olmadığı durumlarda Welch t-testinin Student t-testinden üstün olduğunu göstermiştir. Mevcut simülasyonlar, örneklem boyutları daha küçük olduğunda, varyanslar arasındaki farkın aşırı olmadığından daha hafif olduğu ve anlamlılık seviyesinin daha katı olduğu zaman hata oranlarındaki değişimlerin daha fazla olduğunu ortaya koymaktadır. Dahası, Welch t-testinin geçerliliği, yalnızca bir ön testin gerekli olduğunu belirttiği durumlarda kullanıldığında bozulur. Numune boyutları eşitsiz olduğunda koşulsuz olarak ayrı bir varyans testi kullanılarak optimum koruma sağlanır.[6] Welch'in t-testi çarpık dağılımlar ve büyük örnek boyutları için daha güvenilirdir.[7] Sıralanan dağılımlar ve daha küçük örnekler için güvenilirlik azalır ve burada Welch'in sıralanmış veriler üzerinde t testi yapılabilir.[4]

Örnekler

Aşağıdaki üç örnek Welch'in t-testi ve Student'ın t-testini karşılaştırmaktadır. Örnekler, R programlama dili kullanılarak rastgele normal dağılımlardan alınmıştır.

Üç örnek için de nüfus ortalamaları μ1=20 and μ2=22 dir.

İlk örnek eşit varyans (σ12=σ22=4) ve eşit örnek büyüklükleri (N1=N2=15) içindir. iki rassal numuneyi A1 ve A2 olarak belirtelim:

A1={27.5,21.0,19.0,23.6,17.0,17.9,16.9,20.1,21.9,22.6,23.1,19.6,19.0,21.7,21.4}
A2={27.1,22.0,20.8,23.4,23.4,23.5,25.8,22.0,24.8,20.2,21.9,22.1,22.9,20.5,24.4}

İkinci örnek eşit olmayan varyanslar(σ12=16, σ22=1) ve eşit olmayan örnek büyüklükleri içindir (N1=10, N2=20). Küçük örnek daha büyük varyansa sahiptir:

A1={17.2,20.9,22.6,18.1,21.7,21.4,23.5,24.2,14.7,21.8}A2={21.5,22.8,21.0,23.0,21.6,23.6,22.5,20.7,23.4,21.8,20.7,21.7,21.5,22.5,23.6,21.5,22.5,23.5,21.5,21.8}

Üçüncü örnek eşit olmayan varyanslar (σ12=1, σ22=16) ve eşit olmayan örnek boyutları içindir (N1=10, N2=20). Büyük örneklemin daha büyük varyansı vardır:

A1={19.8,20.4,19.6,17.8,18.5,18.9,18.3,18.9,19.5,22.0}A2={28.2,26.6,20.1,23.3,25.2,22.1,17.7,27.6,20.6,13.7,23.2,17.5,20.6,18.0,23.9,21.6,24.3,20.4,24.0,13.2}

Referans p-değerleri, eşit popülasyon araçlarının boş hipotez için (μ1μ2=0) t istatistiklerinin dağılımlarını simüle ederek elde edildi. Sonuçlar, aşağıdaki tabloda çift-kuyruklu p-değerleri ile özetlenmiştir:

Sample A1 Sample A2 Student's t-test Welch's t-test
Example N1 X1 s12 N2 X2 s22 Şablon:Tmath Şablon:Tmath Şablon:Tmath Psim Şablon:Tmath Şablon:Tmath Şablon:Tmath Psim
1 15 20.8 7.9 15 23.0 3.8 −2.46 28 0.021 0.021 −2.46 25.0 0.021 0.017
2 10 20.6 9.0 20 22.1 0.9 −2.10 28 0.045 0.150 −1.57 9.9 0.149 0.144
3 10 19.4 1.4 20 21.6 17.1 −1.64 28 0.110 0.036 −2.22 24.5 0.036 0.042

Welch'in t - testi ve Student'ın t - testi, eşit varyans ve eşit örnek büyüklüğüne sahip iki örnek için pratik olarak aynı sonuçları verdi (Örnek 1). Eşit olmayan varyanslar için, Student'in t- testi, küçük örneklemin daha büyük bir varyansa (Örnek 2) ve daha büyük bir örneğin daha büyük bir varyansa sahip olduğu (örnek 3) yüksek bir p-değeri verdi. Eşit olmayan varyanslar için, Welch'in t- testi, simüle edilen p-değerlerine yakın p-değerleri verdi.

Yazılım Uygulamaları

Language/Program Function Notes
LibreOffice TTEST(Data1; Data2; Mode; Type) See [1]Şablon:Webarşiv
MATLAB ttest2(data1, data2, 'Vartype', 'unequal') See [2] Şablon:Webarşiv
Microsoft Excel pre 2010 TTEST(array1, array2, tails, type) See [3]
Microsoft Excel 2010 and later T.TEST(array1, array2, tails, type) See [4]Şablon:Webarşiv
Python scipy.stats.ttest_ind(a, b, axis=0, equal_var=False) See [5]Şablon:Webarşiv
R t.test(data1, data2, alternative="two.sided", var.equal=FALSE) See [6] Şablon:Webarşiv
Julia UnequalVarianceTTest(data1, data2) See [7] Şablon:Webarşiv
Stata ttest varname1 == varname2, welch See 8 Şablon:Webarşiv

Ayrıca bakınız

Kaynakça

Şablon:Kaynakça