T-TEST ve ANOVA Arasındaki Fark

T-TEST ve ANOVA Karşılaştırması

Ortalamayı elde etmek için istatistiksel verilerin toplanması ve hesaplanması genellikle uzun ve sıkıcı bir süreçtir. T testi ve tek yönlü varyans analizi (ANOVA) bu amaç için kullanılan en yaygın iki testtir.

T testi, sıfır hipotezi destekleniyorsa test istatistiğinin bir Student t dağılımını takip ettiği istatistiksel bir hipotez testidir. Bu test, test istatistiği normal bir dağılımı takip ettiğinde ve test istatistiğindeki bir ölçeklendirme teriminin değeri biliniyorsa uygulanır. Ölçeklendirme terimi bilinmiyorsa, yerine mevcut verilere dayanan bir tahmin gelir. Test istatistiği bir öğrencinin t-dağılımını takip edecektir..

William Sealy Gosset 1908'de t istatistiğini tanıttı. Gosset, İrlanda'nın Dublin kentindeki Guinness bira fabrikası için bir kimyagerdi. Guinness bira fabrikası, şirketin yerleşik endüstriyel süreçlerine biyokimya ve istatistik uygulamaları sağlayabileceklerden birini seçerek Oxford ve Cambridge'den en iyi mezunları işe alma politikasına sahipti. William Sealy Gosset böyle bir mezuntu. Bu süreçte, William Sealy Gosset, başlangıçta şişmanın kalitesini (bira imalathanesinin ürettiği koyu bira) izlemek için bir yol olarak tasarlanan t-testini maliyet etkin bir şekilde tasarladı. Gosset testi 1908 dolaylarında Biometrika'da 'Öğrenci' kalem adı altında yayınladı. Şirket, 'ticari sırlarının' bir parçası olarak istatistikleri kullanma konusundaki politikalarını korumak istediğinden, kalem adının nedeni Guinness'in ısrarıydı..

T testi istatistikleri genellikle T = Z / s biçimini takip eder; burada Z ve s, verilerin fonksiyonlarıdır. Z değişkeni alternatif hipoteze duyarlı olacak şekilde tasarlanmıştır; alternatif olarak, hipotez doğru olduğunda Z değişkeninin büyüklüğü daha büyüktür. Bu arada 's', T dağılımının belirlenmesini sağlayan bir ölçeklendirme parametresidir. Bir t-testinin altında yatan varsayımlar, a) Z'nin sıfır hipotezi altında standart bir normal dağılım izlemesi; b) ps2, sıfır hipotezi altında p serbestlik dereceleri ile Ï ‡ 2 dağılımını takip eder (burada p pozitif bir sabittir); ve c) Z değeri ve s değeri bağımsızdır. Belirli bir t-test tipinde, bu koşullar araştırılan popülasyonun sonuçları ve verilerin örnekleniş biçimidir..

Öte yandan, varyans analizi (ANOVA) istatistiksel modellerin bir koleksiyonudur. ANOVA prensipleri araştırmacılar ve istatistikçiler tarafından uzun süre kullanılmış olsa da, 1918 yılına kadar Sir Ronald Fisher'ın 'Mendel Mirasının Varlığı ile İlişkisi Arasındaki İlişki' başlıklı bir makalede varyans analizini resmileştirmek için bir teklifte bulunmadı. . O günden bu yana ANOVA, kapsamı ve uygulaması ile genişletildi. ANOVA aslında bir yanlış adlandırmadır, çünkü varyansların farklılıklarından ziyade grupların araçları arasındaki farklardan türetilmiştir. Belirli bir değişkendeki gözlenen varyansın, farklı varyasyon kaynaklarına atfedilebilen bileşenlere ayrıldığı ilgili prosedürleri içerir..

Esasen, bir ANOVA, birkaç grubun ortalamalarının eşit olup olmadığını belirlemek için istatistiksel bir test sağlar ve sonuç olarak, t testini ikiden fazla gruba genelleştirir. Bir ANOVA, tip I hata yapma şansı daha az olduğu için iki örnekli bir t testinden daha faydalı olabilir. Örneğin, birden fazla iki örnekli t-testine sahip olmak, bir hatayı işleme alma olasılığının, ortalamanın elde edilmesi için aynı değişkenlerin ANOVA'sından daha büyük bir şansı olacaktır. Model aynıdır ve test istatistiği F oranıdır. Daha basit bir ifadeyle, t-testleri sadece özel bir ANOVA örneğidir: ANOVA yapmak birden fazla t-testi ile aynı sonuca sahip olacaktır. Üç sınıf ANOVA modeli vardır: a) Verilerin normal araçlardan geldiğini varsayan ve sadece araçlarında farklılık gösteren sabit etkili modeller; b) Verilerin, hiyerarşi tarafından kısıtlanan farklı popülasyonların bir hiyerarşisini tanımladığını varsayan rastgele efekt modelleri; ve c) Hem sabit hem de rastgele etkilerin olduğu durumlar olan karma efektli modeller.

Özet:

  1.  İki ortalamanın veya aracın aynı mı yoksa farklı mı olduğunu belirlerken t testi kullanılır. Üç veya daha fazla ortalama veya ortalama karşılaştırılırken ANOVA tercih edilir.
  2.  Bir t-testinin, daha fazla araç kullanıldığı için bir hata yapma olasılığı daha yüksektir, bu nedenle iki veya daha fazla aracı karşılaştırırken ANOVA kullanılır.