çok basit: varyans ve standart sapma
bir sınıf düşünelim. bu sınıfta toplamda 10 öğrenci var. bu öğrencilerin hepsi istatistik finale girdi. final ortalamamız 50. peki, bu ne demek? sınav zor muydu? yoksa çok mu kolaydı?
örneğin, öğrencilerin hepsi 50 mi aldı? yoksa 5 öğrenci 100, 5 öğrenci 0 mı aldı? ya da 60–40 veya 55–45? aklınıza gelebilecek her türlü sayıyla bir not alınmış olabilir. Ortalama tek başına bize genel dağılım üzerinde hiçbir şey anlatamıyor.
bu sebepten ötürü önce öğrencilerimizin notlarına bir bakalım.
bu senaryo için girişte verdiğimden örnekten farklı bir liste verdim. buradaki sınavın ortalaması 55. şimdi, ortalamayı bildiğimize göre bir de ortalamadan farklarına bakalım.
ortalamadan farklarını da topladığımızda kimisi pozitif kimisi negatif olduğu için yine elimizde ayırt edici bir veri yok.
bir sayı negatif veya pozitif de olsa o sayının karesi her zaman pozitiftir. o zaman farkların karesini alırsak, elimizdeki değerleri topladığımızda bu değerleri kaybetmemiş oluruz.
şimdi elimizde bir değer var. bütün ortalamadan farkların karesini topluyoruz. elde ettiğimiz sayı 8250. 10 öğrenci olduğunu bildiğimize göre, sınıfın ortalama değişkenliği birim başına 825'tir. ancak bu bize ne ifade ediyor? ne anlatıyor? yani ortalama 50 değil de aslında 50+825 ise 875 midir? aslında varyans karelerinin nasıl değiştiğini ifade etmektedir. ancak biz, 825 değerini ortalamaların karesini alarak hesaplamıştık. 825, ortalamadan farkların karesi için anlamlı, ancak ortalamadan farklar için değil. bu sebepten ötürü karekökü alıyoruz ve elimize 28.72 geçiyor.
yani, not setimiz için
varyans 825,
standart sapma ise 28.72 çıkıyor.
peki, bu bize ne ifade ediyor? nasıl yorumlamamız gerekiyor? sınıf ortalaması 50 olmasına rağmen notlar, aşağı yukarı olacak şekilde dağılmış durumda.
senaryo 1: eğer ortalama 80, standart sapma 7 olsaydı, ortalamanın yüksek ve alınan notların birbirine çok yakın olduğunu söyleyebilirdik.
senaryo 2: eğer ortalama 40, standart sapma 36 ise düşük alanlar olduğu gibi yüksek alanlar da olduğunu söyleyebiliriz.
senaryo 1 için, sınavın görece olarak kolay ve herkesin yüksek not aldığını söyleyebiliriz.
senaryo 2 için, sınavın görece olarak daha zor olduğunu ancak yüksek not alanların da olduğunu söyleyebiliriz.
standart sapma, negatif çıkmaz. standart sapma bize, değerlerin ortalama etrafından nasıl dağıldığını ifade eder. standart sapma düştükçe değerler ortalamanın etrafına kümelenir. standart sapma arttıkça değerler, aralığa dağılmaktadır.
çok basit, değil mi?