Standart Sapma ile Standart Hata Arasındaki Fark

Giriş

Standart Dkanıtlama (SD) ve Standard Error (SE) görünüşte benzer terminolojiler; ancak, kavramsal olarak o kadar çeşitlidirler ki İstatistik literatüründe neredeyse birbirlerinin yerine kullanılırlar. Her iki terimden önce, simetrik bir değer tanımladıklarını veya bir değer aralığını temsil ettiklerini gösteren artı-eksi sembolü (+/-) gelir. Değişmez bir şekilde, her iki terim de bir dizi ölçüm değerinin ortalamasıyla (ortalama) görünür.

İlginç bir şekilde, bir SE'nin standartlarla, hatalarla veya bilimsel verilerin iletişimiyle hiçbir ilgisi yoktur..

SD ve SE'nin kökenine ve açıklamasına ayrıntılı bir bakış, profesyonel istatistikçilerin ve imleçle kullananların neden hata yaptığını ortaya çıkaracaktır..

Standart Sapma (SD)

SD bir tanımlayıcı dağılımın yayılmasını açıklayan istatistik. Bir metrik olarak, veriler normal olarak dağıtıldığında yararlıdır. Ancak, verilerin çok eğri veya bimodal olması daha az yararlıdır çünkü dağıtımın şeklini çok iyi tanımlamaz. Tipik olarak, numunenin özelliklerini bildirirken SD kullanırız, çünkü tanımlamak verinin ortalamaya göre ne kadar değiştiği. Verilerin yayılmasını açıklayan diğer faydalı istatistikler, çeyrekler arası aralık, 25. ve 75. persentiller ve verilerin aralığıdır..

Şekil 1. SD, verilerin yayılmasının bir ölçüsüdür. Veriler normal olarak dağıtılmış bir dağılımdan bir örnek olduğunda, verilerin üçte ikisinin ortalamanın 1 standart sapması içinde kalmasını bekler.

Varyans bir tanımlayıcı istatistiği de içerir ve standart sapmanın karesi olarak tanımlanır. Sonuçları açıklarken genellikle rapor edilmez, ancak daha matematiksel olarak izlenebilir bir formüldür (yani kare sapmaların toplamı) ve istatistiklerin hesaplanmasında rol oynar.

Örneğin, iki istatistiğimiz varsa P & S bilinen varyanslarla var(P) & var(S), sonra toplamın varyansı P + Q varyansların toplamına eşittir: var(P) +var(S). İstatistikçilerin neden varyanslardan bahsetmek istedikleri artık belli.

Ancak standart sapmalar, özellikle veriler normal olarak dağıtıldığında, yayılma için önemli bir anlam taşır: +/ - 1 SD numunenin 2 / 3'ünü ve aralık ortalamasını yakalaması beklenebilir +- 2 SD numunenin% 95'ini yakalaması beklenebilir.

SD, bir soruya verilen bireysel cevapların ortalamadan ne kadar farklılık gösterdiğini veya “saptığını” gösterir. SD, araştırmacıya yanıtların ne kadar yayıldığını anlatıyor - ortalamanın etrafında mı yoğunlaşıyorlar yoksa uzaklara mı dağılıyorlar? Katılımcıların tümü ürününüzün ölçeğinizin ortasında mı derecelendirildi yoksa bazıları onayladı mı ve bazıları onaylamadı mı??

Katılımcılardan bir ürünü bir dizi özellikte 5 puanlık bir ölçekte derecelendirmelerinin istendiği bir deneyi düşünün. On katılımcıdan oluşan bir grubun (aşağıda "A" - "J" olarak etiketlenmiş) "paranın iyi değeri" için ortalama değeri 0,4 SD ile 3,2 ve "ürün güvenilirliği" için ortalama 2,1 SD ile 3,4'tür..

İlk bakışta (sadece araçlara bakıldığında), güvenilirliğin değerden daha yüksek olduğu görülüyor. Ancak, güvenilirlik için daha yüksek SD (yanıtların aşağıdaki dağıtımda gösterildiği gibi), yanıtların çok polarize olduğunu, katılımcıların çoğunun güvenilirlik sorunu olmadığını (niteliği "5" olarak derecelendirdiğini), ancak daha küçük ama önemli bir katılımcı segmentinin güvenilirlik sorunu yaşadı ve “1” niteliğini derecelendirdi. Yalnız ortalamaya bakmak, hikayenin sadece bir kısmını anlatır, ancak daha sık olmamakla birlikte, araştırmacıların odaklandığı şey budur. Yanıtların dağılımının göz önünde bulundurulması önemlidir ve SD, bunun değerli bir tanımlayıcı ölçüsünü sunar.

Davalı Fiyat / fayda oranı Ürün Güvenilirliği
bir 3 1
B 3 1
C 3 1
D 3 1
E 4 5
F 4 5
G, 3 5
'H 3 5
ben 3 5
J 3 5
Anlamına gelmek 3.2 3.4
Std. dev. 0.4 2.1

İlk Anket: Bir ürünü 5 puanlık bir ölçekte derecelendiren katılımcılar

5 puanlık bir derecelendirme ölçeğine verilen yanıtların çok farklı iki dağılımı aynı ortalamayı verebilir. İki farklı derecelendirme için yanıt değerlerini gösteren aşağıdaki örneği düşünün.

İlk örnekte (Derecelendirme “A”), SD sıfırdır, çünkü TÜM yanıtlar tam olarak ortalama değerdir. Bireysel yanıtlar ortalamadan hiç sapmadı.

“B” Derecesinde, grup ortalaması ilk dağılımla aynı (3.0) olmasına rağmen, Standart Sapma daha yüksektir. 1,15 Standart Sapması, ortalama yanıtların * tek tek yanıtlarının ortalamadan 1 puan biraz üzerinde olduğunu göstermektedir..

Davalı Derecelendirme “A” Derecelendirme “B”
bir 3 1
B 3 2
C 3 2
D 3 3
E 3 3
F 3 3
G, 3 3
'H 3 4
ben 3 4
J 3 5
Anlamına gelmek 3.0 3.0
Std. dev. 0.00 1.15

İkinci Anket: Bir ürünü 5 puanlık bir ölçekte derecelendiren katılımcılar

SD'ye bakmanın bir başka yolu da dağılımı bir cevap histogramı olarak çizmektir. Düşük bir SD'ye sahip bir dağıtım, uzun ve dar bir şekil olarak görüntülenirken, büyük bir SD daha geniş bir şekilde gösterilir.

SD genellikle “doğru veya yanlış” veya “daha ​​iyi veya daha kötü” göstermez - daha düşük bir SD'nin daha fazla arzu edilmemesi gerekmez. Sadece tanımlayıcı bir istatistik olarak kullanılır. Ortalamaya göre dağılımı açıklar.

TSD ile ilgili teknik sorumluluk reddi

SD'yi “ortalama sapma” olarak düşünmek, kavramsal olarak anlamını anlamanın mükemmel bir yoludur. Ancak, aslında bir ortalama olarak hesaplanmaz (eğer öyleyse, buna “ortalama sapma” derdik). Bunun yerine, “standartlaştırılmıştır”, karelerin toplamını kullanarak değeri hesaplamak için biraz karmaşık bir yöntemdir..

Pratik amaçlar için, hesaplama önemli değildir. Çoğu çizelge programı, e-tablo veya diğer veri yönetimi araçları SD'yi sizin için hesaplar. Daha da önemlisi istatistiklerin neler ilettiğini anlamaktır.

Standart hata

Standart bir hata anlaşılan popülasyonlar arasında örnek ortalamalar (ortalamalar) karşılaştırılırken kullanılan istatistik. Bir ölçüsüdür hassas örnek ortalaması. Örnek ortalama, temel dağılımı olan verilerden elde edilen bir istatistiktir. Tek bir deney gerçekleştirdiğimiz ve yalnızca tek bir değere sahip olduğumuz için bunu verilerle aynı şekilde görselleştiremeyiz. İstatistik teorisi bize örnek ortalamanın (büyük bir “yeterli” örnek için ve birkaç düzenlilik koşulu altında) yaklaşık olarak normal olarak dağıldığını söyler. Bu normal dağılımın standart sapması, standart hata dediğimiz şeydir.

şekil 2. Alt rapordaki dağılımverinin dağılımını sağlarken, en üstteki dağılım örnek ortalamanın teorik dağılımıdır. 20'lik SD, verilerin yayılmasının bir ölçüsüdür, oysa 5'li olan SE, numune ortalaması etrafında bir belirsizlik ölçüsüdür.

Tedavi A'ya karşı Tedavi B'ye ait iki örnekli bir deneyden elde edilen sonuçları karşılaştırmak istediğimizde, ortalamaları ne kadar kesin olarak ölçtüğümüzü tahmin etmemiz gerekir..

Aslında, iki araç arasındaki farkı tam olarak ölçtüğümüzle ilgileniyoruz. Bu ölçüme farkın standart hatası diyoruz. Örnek araçlardaki farkın standart hatasının araçların standart hatalarının bir fonksiyonu olduğunu öğrenmek şaşırtıcı olmayabilir:

Artık ortalamanın (SE) standart hatasının ve dağılımın (SD) standart sapmasının iki farklı hayvan olduğunu anladığınıza göre, ilk başta nasıl karıştırıldıklarını merak ediyor olabilirsiniz. Kavramsal olarak farklılık gösterse de, matematiksel olarak basit bir ilişkileri vardır:

,burada n veri noktası sayısıdır.

Standart hatanın iki bileşene bağlı olduğuna dikkat edin: numunenin standart sapması ve numunenin boyutu n. Bu sezgisel bir anlam ifade eder: numunenin standart sapması ne kadar büyük olursa, gerçek ortalama tahminimiz hakkında o kadar az hassas olabiliriz.

Ayrıca, örneklem büyüklüğü ne kadar büyük olursa, popülasyon hakkında ne kadar çok bilgiye sahibiz ve gerçek ortalamayı o kadar kesin olarak tahmin edebiliriz.

SE, ortalamanın güvenilirliğinin bir göstergesidir. Küçük bir SE, örnek ortalamanın gerçek popülasyon ortalamasının daha doğru bir yansıması olduğunu gösterir. Daha büyük bir örnek boyutu normalde daha küçük bir SE ile sonuçlanır (SD doğrudan örnek boyutundan etkilenmez).

Anket araştırmalarının çoğu popülasyondan bir örnek almayı içerir. Daha sonra bu örnekten elde edilen sonuçlardan popülasyon hakkında çıkarımlarda bulunuruz. İkinci bir numune alınmışsa, sonuçlar muhtemelen ilk numuneyle tam olarak eşleşmeyecektir. Bir derecelendirme özelliğinin ortalama değeri bir örnek için 3,2 ise, aynı boyuttaki ikinci bir örnek için 3,4 olabilir. Nüfusumuzdan sonsuz sayıda (eşit büyüklükte) örnek çekersek, gözlemlenen araçları bir dağıtım olarak gösterebilirdik. Daha sonra tüm örnek araçlarımızın ortalamasını hesaplayabiliriz. Bu ortalama gerçek nüfus ortalamasına eşit olacaktır. Örnek araçların dağılımının SD'sini de hesaplayabiliriz. Bu numune aracı dağılımının SD'si, her bir ayrı numune ortalamasının SE'sidir..

Bu nedenle, en önemli gözlemimize sahibiz: SE nüfus ortalamasının SD'si.

Örneklem Anlamına gelmek
1 inci 3.2
2 3.4
3 üncü 3.3
4 3.2
5 3.1
... . ... .
... . ... .
... . ... .
... . ... .
... . ... .
Anlamına gelmek 3.3
Std. dev. 0.13

SD ve SE arasındaki ilişkiyi gösteren tablo

Şimdi, bu dağılımın SD'sinin, bir örnek ortalamanın gerçek popülasyon ortalamasından ne kadar uzakta olduğunu anlamamıza yardımcı olması durumunda, bunu, herhangi bir örnek ortalamanın gerçek ortalama ile ne kadar doğru olduğunu anlamak için kullanabiliriz. SE'nin özü budur.

Gerçekte, popülasyonumuzdan sadece tek bir örnek aldık, ancak bu sonucu gözlemlenen örnek ortalamasının güvenilirliğini tahmin etmek için kullanabiliriz.

Aslında, SE bize gözlemlenen örnek ortalamamızın artı veya eksi kabaca 2 (aslında 1.96) olduğu anlamına gelir..

Aşağıdaki tablo, araştırmamız için kullanılan ilk (ve sadece) örnekteki yanıtların dağılımını göstermektedir. 0.13 olan SE, nispeten küçüktür, ortalamanın genel popülasyonumuzun gerçek ortalamasına nispeten yakın olduğuna dair bir işaret verir. Ortalamamız için hata payı (% 95 güvende), (kabaca) bu değerin (+/- 0.26) iki katıdır ve bize gerçek ortalamanın büyük olasılıkla 2.94 ile 3.46 arasında olduğunu söyler.

Davalı Değerlendirme
bir 3
B 3
C 3
D 3
E 4
F 4
G, 3
'H 3
ben 3
J 3
Anlamına gelmek 3.2
Std. yanılmak 0.13

özet

Birçok araştırmacı, veri analizinde yaygın olarak yer alsalar da, Standart Sapma ile Standart Hata arasındaki farkı anlayamamaktadır. Standart Sapma ve Standart Hata için gerçek hesaplamalar çok benzer görünse de, bunlar birbirinden çok farklı ama birbirini tamamlayıcı iki önlemi temsil etmektedir. SD bize dağılımımızın şeklini, bireysel veri değerlerinin ortalama değerden ne kadar yakın olduğunu anlatıyor. SE bize örnek ortalamamızın toplam nüfusun gerçek ortalamasına ne kadar yakın olduğunu söyler. Birlikte, tek başına bize söyleyebileceğinden daha eksiksiz bir resim sağlamaya yardımcı olurlar.