Çarpıklık Ve Basıklık Nedir Istatistik ?

humhum

Global Mod
Global Mod
Çarpıklık ve Basıklık Nedir? İstatistiksel Kavramlar

İstatistiksel analizlerde, veri setlerinin şekil ve dağılımını anlamak, verilerin merkezî eğilimleri ve yayılımları hakkında bilgi sağlar. İki önemli kavram bu tür analizlerde öne çıkar: çarpıklık ve basıklık. Bu makalede, çarpıklık ve basıklık kavramlarını detaylı bir şekilde ele alacağız, aralarındaki farkları açıklayacağız ve istatistiksel uygulamalarını inceleyeceğiz.

Çarpıklık (Skewness) Nedir?

Çarpıklık, bir veri setinin dağılımının simetrik olup olmadığını gösteren bir ölçüdür. Veri dağılımının simetrik olup olmadığını belirlemek için kullanılır. Matematiksel olarak, çarpıklık, veri dağılımının ortalama etrafında nasıl dağıldığını ifade eder. Pozitif çarpıklık, dağılımın sağa doğru eğildiğini ve sol tarafta daha sıkı bir kümelemeyi, negatif çarpıklık ise sol tarafa doğru eğildiğini ve sağ tarafta daha geniş bir yayılımı gösterir.

Çarpıklık hesaplaması genellikle aşağıdaki formülle yapılır:

\[ \text{Çarpıklık} = \frac{n}{(n-1)(n-2)} \sum_{i=1}^{n} \left(\frac{x_i - \bar{x}}{s}\right)^3 \]

Burada, \( n \) veri sayısını, \( x_i \) her bir veri noktasını, \( \bar{x} \) ortalamayı ve \( s \) standart sapmayı temsil eder. Pozitif bir çarpıklık değeri, verinin sağa uzun kuyruklu olduğunu gösterirken, negatif bir çarpıklık değeri sol tarafa uzun bir kuyruk olduğunu gösterir.

Basıklık (Kurtosis) Nedir?

Basıklık, veri dağılımının "kurt" olduğunu veya ne kadar sivri olduğunu ölçen bir istatistiksel ölçüdür. Basıklık, dağılımın merkez etrafındaki yoğunluğu ifade eder ve iki tür basıklık vardır: pozitif ve negatif basıklık. Pozitif basıklık, verilerin merkez etrafında daha yoğun olduğunu ve uç değerlerin sıkça görüldüğünü gösterirken, negatif basıklık, verilerin merkez etrafında daha az yoğun olduğunu ve uç değerlerin daha nadir olduğunu belirtir.

Basıklık genellikle şu formülle hesaplanır:

\[ \text{Basıklık} = \frac{n(n+1)}{(n-1)(n-2)(n-3)} \sum_{i=1}^{n} \left(\frac{x_i - \bar{x}}{s}\right)^4 - 3 \]

Burada, \( n \) veri sayısını, \( x_i \) her bir veri noktasını, \( \bar{x} \) ortalamayı ve \( s \) standart sapmayı temsil eder. Basıklık değeri genellikle 3 olarak normallikte kabul edilir; bu, verinin normal dağılıma sahip olduğunu gösterir. Basıklık değeri 3’ün üstünde olan dağılımlar, "şişkin" veya "kurtik" olarak adlandırılırken, 3’ün altında olanlar ise "düzleştirilmiş" veya "platikurtik" olarak değerlendirilir.

Çarpıklık ve Basıklık Arasındaki Farklar

Çarpıklık ve basıklık, her ikisi de veri dağılımının şekli hakkında bilgi sağlar, ancak farklı yönlerden incelerler. Çarpıklık, dağılımın simetrikliğini ve eğilimini ölçerken, basıklık dağılımın sivriliğini ve merkez etrafındaki yoğunluğu değerlendirir.

Çarpıklık, verinin ne kadar sağa veya sola eğildiğini gösterir. Bu, dağılımın genel simetrisi hakkında bilgi verir. Örneğin, pozitif çarpıklığa sahip bir veri seti, genellikle büyük değerlerin daha az sık bulunduğu, ancak küçük değerlerin daha sık bulunduğu bir durumu gösterir. Negatif çarpıklık ise bunun tersidir.

Basıklık ise verinin dağılımının merkezinde ne kadar yoğun olduğunu gösterir. Pozitif basıklık, verilerin merkez etrafında sıkıştığını ve uç değerlerin daha fazla olduğunu, negatif basıklık ise merkez etrafında daha yaygın olduğunu ve uç değerlerin nadir olduğunu ifade eder.

Çarpıklık ve Basıklık Nasıl Yorumlanır?

Veri analizi yaparken çarpıklık ve basıklık değerlerini yorumlamak, verinin doğası hakkında derinlemesine bilgi sağlar. Çarpıklık, genellikle veri dağılımının normalden sapmasını ve potansiyel olarak outlier (uç değer) etkilerini gösterir. Yüksek pozitif çarpıklık, veride büyük uç değerlerin bulunabileceğini işaret ederken, negatif çarpıklık büyük düşük değerlerin varlığına işaret edebilir.

Basıklık ise veri dağılımının genel şekli hakkında bilgi verir. Normal bir dağılım genellikle sıfır basıklık değerine sahiptir. Pozitif basıklık, verinin merkezinde yüksek bir yoğunluk ve daha belirgin uç değerler olduğunu gösterir. Negatif basıklık ise daha düz bir dağılım ve uç değerlerin nadir olduğunu belirtir.

Çarpıklık ve Basıklık Hesaplamalarında Dikkat Edilmesi Gerekenler

Çarpıklık ve basıklık hesaplamalarında dikkat edilmesi gereken bazı önemli noktalar vardır. İlk olarak, veri setinin büyüklüğü çarpıklık ve basıklık hesaplamalarının doğruluğunu etkileyebilir. Küçük veri setlerinde, hesaplamalar daha değişken olabilir ve sonuçlar daha az güvenilir olabilir.

İkinci olarak, çarpıklık ve basıklık ölçümleri genellikle verinin normal dağılımdan ne kadar sapma gösterdiğini değerlendirir. Ancak, bazı veri setleri bu ölçümler için istatistiksel olarak anlamlı olmayabilir ve bu nedenle ek analizler yapılması gerekebilir.

Son olarak, çarpıklık ve basıklık hesaplamaları tek başına veri seti hakkında tam bir anlayış sağlamaz. Bu ölçümler, genellikle histogramlar, box plotlar ve diğer görselleştirme araçlarıyla birlikte kullanıldığında daha anlamlı bilgiler sunar.

Sonuç

Çarpıklık ve basıklık, veri analizi ve istatistiksel modelleme süreçlerinde kritik rol oynayan iki temel kavramdır. Çarpıklık, veri dağılımının simetrikliğini ve eğilimini değerlendirirken, basıklık dağılımın merkez etrafındaki yoğunluğu ve uç değerlerin sıklığını ölçer. Bu iki kavramın anlaşılması, veri analistlerinin veri setlerinin doğasını daha iyi kavrayarak daha doğru ve anlamlı analizler yapmalarını sağlar. İstatistiksel modelleme ve veri analizi sürecinde çarpıklık ve basıklık değerlerini yorumlamak, veri setinin özelliklerini anlamak ve potansiyel sorunları tespit etmek için önemli bir adımdır.