Standart Sapma ve Ortalama
Betimsel ve çıkarımsal istatistiklerde, merkezi eğilim, dağılım ve çarpıklığına karşılık gelen bir veri kümesini tanımlamak için çeşitli endeksler kullanılır. İstatistiksel çıkarımda, bunlar popülasyon parametre değerlerini tahmin ettikleri için yaygın olarak tahmin ediciler olarak bilinir.
Merkezi eğilim, değerlerin dağılımının merkezini ifade eder ve bulur. Ortalama, mod ve medyan, bir veri kümesinin merkezi eğilimini tanımlamak için en yaygın kullanılan endekslerdir. Dağılım, verilerin dağıtımın merkezinden yayılma miktarıdır. Menzil ve standart sapma en yaygın kullanılan dağılım ölçütleridir. Veri dağılımının çarpıklığını tanımlamak için Pearson çarpıklık katsayıları kullanılır. Burada çarpıklık, veri kümesinin merkez hakkında simetrik olup olmadığını ve ne kadar çarpık olduğunu ifade eder..
Ne demek?
Ortalama en sık kullanılan merkezi eğilim endeksidir. Bir veri kümesi verildiğinde ortalama, tüm veri değerlerinin toplamı alınarak ve daha sonra veri sayısına bölünerek hesaplanır. Örneğin, 10 kişinin (kilogram cinsinden) ağırlıkları 70, 62, 65, 72, 80, 70, 63, 72, 77 ve 79 olarak ölçülür. Sonra on kişinin (kilogram cinsinden) ortalama ağırlığı aşağıdaki gibi hesaplanır. Ağırlıkların toplamı 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710'dur. Ortalama = (toplam) / (veri sayısı) = 710/10 = 71 (kilogram cinsinden).
Bu özel örnekte olduğu gibi, bir veri kümesinin ortalama değeri kümenin bir veri noktası olmayabilir, ancak belirli bir veri kümesi için benzersiz olacaktır. Ortalama, orijinal verilerle aynı birimlere sahip olacaktır. Bu nedenle, verilerle aynı eksende işaretlenebilir ve karşılaştırmalarda kullanılabilir. Ayrıca, bir veri kümesinin ortalaması için işaret kısıtlaması yoktur. Veri kümesinin toplamı negatif, sıfır veya pozitif olabileceğinden negatif, sıfır veya pozitif olabilir.
Standart sapma nedir?
Standart sapma en sık kullanılan dağılım indeksidir. Standart sapmayı hesaplamak için, ilk önce veri değerlerinin ortalamadan sapmaları hesaplanır. Sapmaların kök karesi ortalaması standart sapma olarak adlandırılır.
Önceki örnekte, ortalamadan ilgili sapmalar (70-71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80- 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 ve (79-71) = 8. Toplamı sapma kareleri (-1) 2+ (-9)2+ (-6)2+ 12+92+ (1)2+ (-8)2+ 12+ 62 + 82 = 366. Standart sapma √ (366/10) = 6.05'tir (kilogram cinsinden). Bundan, veri kümesinin büyük ölçüde eğilmemesi koşuluyla verinin büyük çoğunluğunun 71 ± 6.05 aralığında olduğu sonucuna varılabilir ve gerçekten de bu özel örnekte.
Standart sapma orijinal verilerle aynı birimlere sahip olduğundan, bize verilerin merkezden ne kadar sapmış olduğunun bir ölçüsünü verir; standart sapma arttıkça dağılım da artar. Ayrıca, standart sapma, veri kümesindeki verilerin niteliğine bakılmaksızın negatif olmayan bir değer olacaktır.
Standart sapma ve ortalama arasındaki fark nedir? • Standart sapma merkezden dağılımın bir ölçüsüdür, ortalama ise veri kümesinin merkezinin konumunu ölçer. • Standart sapma her zaman negatif olmayan bir değerdir, ancak ortalama herhangi bir gerçek değeri alabilir.
|