MVNtr: çok değişkenli normallik için bir web uygulaması

Bir yöntem seçin

Bu yöntem aşağıdaki adımlardan oluşmaktadır: 1. Robust Mahalanobis uzaklıkları hesaplanır (MD(xi)), 2. Ki-kare dağılımının %97.5'inci yüzdelik değeri hesaplanır, 3. i. gözlem için MD(xi) > Q ise bu gözlem aykırı değer olarak kabul edilir.

Bu yöntem aşağıdaki adımlardan oluşmaktadır: 1. Robust Mahalanobis uzaklıkları hesaplanır (MD(xi)), 2. Ki-kare dağılımının %97.5'inci düzeltilmiş yüzdelik (AQ) değeri hesaplanır, 3. i. gözlem için MD(xi) > AQ ise bu gözlem aykırı değer olarak kabul edilir.

Detaylı bilgi için Filzmoser ve ark. incelenebilir.

Ayrıca bknz. mvoutlier R paketi

Veri girişi

Örnek veri yükle:

n: gözlem sayısı

p: değişken sayısı

Bir dosya yükleyin:

Dosyanızı virgül, tab, noktalı virgül veya boşluk ayraçlarını kullanarak yükleyebilirsiniz.

Dikkat: İlk satır değişken isimlerini içermelidir.

Verinizi aşağıya yapıştırın veya giriniz:


Verinizi virgül, tab veya noktalı virgül ayraçlarını kullanarak yapıştırabilir veya elle girebilirsiniz.

Dikkat: İlk satır değişken isimlerini içermelidir.

Bir test seçin
Değerler: g1p: Mardia'ın çok değişkenli çarpıklık istatistiği chi.skew: çarpıklık istatistiğinin ki-kare değeri p.value.skew: çarpıklık istatistiğine ilişkin p-değeri g2p: Mardia'ın çok değişkenli basıklık katsayısı z.kurtosis: basıklık istatistiğine ilişkin z değeri p.value.kurt: asıklık istatistiğine ilişkin p-değeri chi.small.skew: küçük örneklem çarpıklık istatistiğinin ki-kare değeri p.value.small: küçük örneklem çarpıklık istatistiğine ilişkin p-değeri
Değerler: HZ: the value of Henze-Zirkler statistic at significance level 0.05 p-value: significance value for the HZ test
Values: H: Royston'un H istatistiği p-değeri: eşdeğer serbestlik derecesine göre hesaplanan yaklaşık p-değeri
MVN grafiği seçiniz

MVN web uygulamasının güncel versiyonuna buradan ulaşabilirsiniz.

Çok değişkenli normalliğin sağlanması, ayırma (diskriminant) analizi, MANOVA, temel bileşenler analizi vb. bir çok parametrik istatistiksel yöntem için gereklidir.

Burada, çok değişkenli normalliğin kontrolü için bir internet uygulama aracı sunulmuştur. Bu uygulama, bir R paketi olan MVN paketini kullanmaktadır ve yaygın olarak kullanılan Mardia, Henze-Zirkler ve Royston`un çok değişkenli normallik testlerini içerir [1]. MVN paketi ile ilgili detaylı bilgiye paketin kullanım kılavuzundan ulaşılabilir [2]. Aşağıda, çok değişkenli normallik testleri ile ilgili kısaca bilgi verilmiştir.

Mardia'nın çok değişkenli normallik testi

Mardia’nın testi, çok değişkenli dağılımlar için geliştirilen basıklık ve çarpıklık katsayılarına dayanmaktadır [3]. Bu uygulama, Mardaia’nın çok değişkenli basıklık ve çarpıklık katsayılarını ve bu katsayıların istatistksel anlamlılıklarını hesaplar. Ayrıca, küçük örneklemler için (n < 20) basıklık katsayısının düzeltilmiş bir versiyonu da hesaplanır. Çok değişkenli çarpıklık katsayısı ki-kare dağılırken, çok değişkenli basıklık katsayısı normal dağılıma uymaktadır [4-7].

Henze-Zirkler'in çok değişkenli normallik testi

Henze-Zirkler test istatistiği, kuramsal ve gözlenen dağılımlar arasındaki uzaklığı ölçen ve negatif olmayan bir fonksiyona dayalıdır. Veri çok değişkenli normal dağılıyor ise test istatistiği log-normal dağılıma uyar. Bu test için, ilk olarak ortalama, varyans ve düzgünlük (smoothness) parametreleri hesaplanır. Daha sonra ortalama ve varyansın logaritmik dönüşümleri kullanılıarak test istatistiğine ve p-değerine ulaşılır [7–12].

Royston’un çok değişkenli normallik testi

Royston’un testi, çok değişkenli normalliği incelemek üzere Shapiro-Wilk/Shapiro-Francia test istatistiklerini kullanır. Bu test dağılımın basıklığı 3’den büyük ise Shapiro-Francia istatistiğini, diğer durumlarda ise Shapiro-Wilk istatistiğini kullanır. [11,13–19].

Bu uygulamada örnek olarak Iris verisi kullanılmıştır. [20-21]

Kaynaklar

[1] Korkmaz S and Goksuluk D (2014). MVN package. R package version 3.4.

[2] Korkmaz S and Goksuluk D (2014). MVN: Multivariate Normality Tests.

[3] Mardia, KV (1970). Measures of multivariate skewness and kurtosis with applications. Biometrika 57 (3): 519-530.

[4] Mardia, KV (1974). Applications of some measures of multivariate skewness and kurtosis for testing normality and robustness studies. Sankhy A, 36:115-128.

[5] Trujillo-Ortiz, A and Hernandez-Walls R (2003). Mskekur: Mardia’s multivariate skewness and kurtosis coefficients and its hypotheses testing. A MATLAB file. Sankhy A, 36:115-128.

[6] Stevens J (1992). Applied Multivariate Statistics for Social Sciences. 2nd. ed. New-Jersey:Lawrance Erlbaum Associates Publishers. pp. 247-248.

[7] Alpar CR (2013). Uygulamalı Çok Değişkenli İstatistiksel Yöntemler. 4th. ed. Ankara:Detay Yayıncılık. pp. 103-139.

[8] Trujillo-Ortiz A, Hernandez-Walls R, Barba-Rojo K and Cupul-Magana L (2007). HZmvntest:Henze-Zirkler’s Multivariate Normality Test. A MATLAB file.

[9] Henze N and Zirkler B (1990). A Class of Invariant Consistent Tests for Multivariate Normality Commun. Statist. Theor. Meth., 19(10): 3595-3618.

[10] Henze N and Wagner T (1997). A New Approach to the BHEP tests for multivariate normality. Journal of Multivariate Analysis, 62:1-23.

[11] Johnson RA and Wichern DW (1992). Applied Multivariate Statistical Analysis. 6th. ed. New-Jersey:Prentice Hall.

[12] Mecklin CJ and Mundfrom DJ (2003). On Using Asymptotic Critical Values in Testing for Multivariate Normality. InterStat 1.

[13] Mecklin CJ and Mundfrom DJ (2005). A Monte Carlo comparison of the Type I and Type II error rates of tests of multivariate normality. Journal of Statistical Computation and Simulation, 75:93-107.

[14] Royston JP (1982). An Extension of Shapiro and Wilks W Test for Normality to Large Samples. Applied Statistics, 31(2):115-124.

[15] Royston JP (1983). Some Techniques for Assessing Multivariate Normality Based on the Shapiro-Wilk W. Applied Statistics, 32(2).

[16] Royston JP (1992). Approximating the Shapiro-Wilk W-Test for non-normality. Statistics and Computing, 2:117-119.121-133.

[17] Royston JP (1995). Remark AS R94: A remark on Algorithm AS 181: The W test for normality. Applied Statistics, 44:547-551.

[18] Shapiro S and Wilk M (1965). An analysis of variance test for normality. Biometrika, 52:591-611.

[19] Trujillo-Ortiz A, Hernandez-Walls R, Barba-Rojo K and Cupul-Magana L (2007). Roystest:Royston’s Multivariate Normality Test. A MATLAB file.

[20] Fisher RA (1936). The use of multiple measurements in taxonomic problems Annals of Eugenics 7 (2): 179-188.

[21] Anderson E (1936). The species problem in Iris Annals of the Missouri Botanical Garden 23 (3): 457-509.

Web uygulamasının kullanımı

Bu uygulamayı kullanmak için,

(i) Veri yükleme paneli kullanılarak veri yüklenir. Eğer veride grup değişkeni var ise, bu değişkenin hangi sütunda (ilk veya son) olduğu kullanıcı tarafından belirlenir ve böylece analizler her bir alt grup için yapılır,

(ii) Aykırı değer kontrolü paneli kullanılarak olası aykırı değerler tespit edilir,

(iii) Testler paneli yardımı ile çok değişkenli normallik testleri ve grafikleri seçilir.

Lütfen perspektif ve izdüşüm grafiklerinin yalnızca iki değişkenli normal dağılımlar için çizilebileceğine dikkat ediniz.

Kullanıcılar Aykırı değer kontrolü paneli aracılığı ile aykırı değerleri (txt), aykırı değerlerin çıkarıldığı yeni veri setini (txt), ki-kare QQ grafiklerini (pdf), Testler paneli aracılığıyla ise test sonuçlarını (txt) ve grafikleri (pdf veya png) bilgisayarlarına indirebilirler.

Yazarlar

Selçuk Korkmaz

Hacettepe Üniversitesi, Tıp Fakültesi Biyoistatistik Anabilim Dalı

selcuk.korkmaz@hacettepe.edu.tr

Dinçer Göksülük

Hacettepe Üniversitesi, Tıp Fakültesi Biyoistatistik Anabilim Dalı

dincer.goksuluk@hacettepe.edu.tr

Gokmen Zararsiz

Hacettepe Üniversitesi, Tıp Fakültesi Biyoistatistik Anabilim Dalı

gokmen.zararsiz@hacettepe.edu.tr

İzzet Parug Duru

Marmara Üniversitesi, Fen-Edebiyat Fakültesi, Fizik Bölümü

izzet.duru@gedik.edu.tr

Vahap Eldem

İstanbul Üniversitesi, Fen Fakültesi, Biyoloji Bölümü

vahap.eldem@istanbul.edu.tr


Lütfen uygulama hatalarını ve önerilerinizi bildiriniz.

Yenilikler

Version 1.4 (20 Ocak 2015)

(1) MVN makalesi "The R Journal" dergisinde yayınlanmıştır. Detaylı referans bilgilerine Referans sekmesinden ulaşabilirsiniz.


Version 1.3 (20 Kasım 2014)

MVN web uygulamasının güncel versiyonuna buradan ulaşabilirsiniz


Versiyon 1.2 (8 Haziran 2014)

(1) Alt grup analizleri eklendi.


Versiyon 1.1 (13 Mayıs 2014)

(1) Mahalanobis uzaklıkları, düzeltilmiş mahalanobis uzaklıkları ve PCOut yöntemlerini içeren üç farklı aykırı değer kontrolü eklendi.

(2) Aykırı değerlerden arındırılmış yeni veri setinin bilgisayara indirilebilmesi özelliği eklendi.


Versiyon 1.0 (10 Mart 2014)

(1) MVN paketinin web uygulaması yayınlandı.